KR20140093981A

KR20140093981A - 아세틸-코엔자임 a로부터 유래되는 이소프레노이드의 제조 방법

Info

Publication number: KR20140093981A
Application number: KR1020147015594A
Authority: KR
Inventors: 티모시 스티븐스 가드너; 크리스티 미쉘 호킨스; 애덤 레온 미도우즈; 애니 에닝 썽; 요셉 쎄게이
Original assignee: 아미리스 인코퍼레이티드
Priority date: 2011-11-09
Filing date: 2012-11-09
Publication date: 2014-07-29
Also published as: AU2012335091A1; DK2776571T3; CN104039974B; US8859261B2; WO2013071172A1; US20140154765A1; CA2853679A1; MX2014005543A; US8415136B1; PT2776571T; EP2776571A1; EP2776571B1; KR102021914B1; SG11201402083XA; MX346459B; ES2628847T3; JP2014532444A; US20150093797A1; ZA201402989B; AU2012335091B2

Abstract

본 발명은 숙주 세포에서 아세틸-CoA-유래 이소프레노이드를 이종적으로 제조하기 위한 조성물과 방법을 제공한다. 일부 구현예들에서, 숙주 세포는 아세트알데하이드 데하이드로게나제, 아세틸화 (ADA, E.C. 1.2.1.10)를 코딩하는 이종의 뉴클레오티드 서열과 NADH-가용성 HMG-CoA 리덕타제를 포함하는 MEV 경로를 포함하도록 유전자 변형된다. 일부 구현예들에서, 숙주 세포는 ADA를 코딩하는 이종의 뉴클레오티드 서열과 아세토아세틸-CoA 신타제를 포함하는 MEV 경로를 포함하도록 유전자 변형된다. 일부 구현예들에서, 유전자 변형된 숙주 세포는 포스포케톨라제 및 포스포트랜스아세틸라제를 코딩하는 하나 이상의 이종의 뉴클레오티드 서열을 더 포함한다. 일부 구현예들에서, 유전자 변형된 숙주 세포는 천연적인 PDH-바이패스의 기능적 파괴를 더 포함한다. 본원에 기술된 조성물과 방법은 아세틸-CoA-유래 이소프레노이드를 이종적으로 생산하기 위한 에너지 효율적이며 레독스 균형적인 경로를 제공한다.

Description

아세틸-코엔자임 A로부터 유래되는 이소프레노이드의 제조 방법 {PRODUCTION OF ACETYL-COENZYME A DERIVED ISOPRENOIDS}

본 출원은 2011년 11월 9일자 미국 가출원 번호 61/557,893호에 대해 우선권을 주장하며, 이 문헌의 전체 내용이 원용에 의해 본 발명에 포함된다.

본 발명은 조작된 숙주 세포에서 아세틸-CoA 유래 이소프레노이드를 제조하기 위한 조성물 및 방법에 관한 것이다.

아세틸 코엔자임 A (아세틸-CoA)는 폴리케티드, 지방산, 이소프레노이드, 페놀계, 알칼로이드, 비타민 및 아미노산 등의 필수적인 생물학적 화합물의 합성시, 중요한 중간산물이다. 특히 아세틸-CoA로부터 유래된 대사산물들은 공업적으로 유용한 화합물을 비롯하여 일차 및 이차 대사산물이다. 예를 들어, 이소프레노이드는 제약학적 제품에, 그리고 생물 연료로서, 식품 첨가제로서, 그리고 그외 특수 화학제로서 사용된다. 이소프레노이드 산물은, 비규칙적인 이소프레노이드와 폴리테르펜도 보고된 바 있지만, 전형적으로는 5 탄소의 이소펜테닐 다이포스페이트 (IPP) 단위가 반복되어 구성된다. 이소프레노이드는, 천연적으로, 이의 전구체 IPP와 이의 이성질체인 다이메틸알릴 피로포스페이트 (DMAPP)의 연속적인 축합을 통해 합성된다. 이들 전구체에 대해서는 2가지 경로가 알려져 있다. 원핵 생물은, 몇 종을 제외하고는, 전형적으로, 데옥시자일룰로스-5-포스페이트 (DXP) 경로를 사용하여 피루베이트와 글리세르알데하이드 3-포스페이트 (G3P)를 IPP와 DMAPP로 변환한다. 진핵 생물의 경우, 식물을 제외하고는, 일반적으로, 메발로네이트-의존성 (MEV) 경로를 이용하여 아세틸-CoA를 IPP로 변환하며, IPP는 DMAPP로 이성질체화된다.

단세포성 진균인 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)와 이와 비슷한 유기체들은 2가지 내인성 경로를 이용하여 아세틸-CoA를 합성한다. 한가지 경로는 미토콘드리아 매트릭스에서 이루어지는데, PDH 복합체가 당분해 반응을 통해 글루코스로부터 발생된 피루베이트의 산화적 데카르복시화를 촉매함으로써, 아세틸-CoA가 합성된다. PDH 복합체는 60개의 폴리펩타이드 체인, 즉 리포아미드 리덕타제-트랜스아세틸라제 체인 24개, 다이하이드롤리필 데하이드로게나제 체인 12개 및 피루베이트 탈카르복실라제 체인 12개로 이루어져 있다. 이 거대 복합체는 피루베이트를 아세틸-CoA로 변환하면서 부산물로서 NADH를 생성한다. 발생된 아세틸-CoA는 이후 에너지 생산을 위해 시트르산 사이클을 통해 CO₂와 H₂O로 완전히 산화되거나, 또는 미토콘드리아에서 수행되는 생합성 반응에 이용될 수 있다.

미코콘드리아에서 만들어지는 아세틸-CoA는 미토콘드리아 막을 통해 세포질로 이동할 수 없다. 그래서, 주요 일차 및 이차 대사산물을 생합성하는데 필요한 세포질 아세틸-CoA를 만들어내기 위해, 사카로마이세스 세레비지애는 "PDH-바이패스"라고 하는 세포질에 위치한 독립적인 기전을 이용한다. 이 다단계 경로는 다음과 같은 반응을 촉매한다: (1) 피루베이트 데카르복실라제 (PDC, EC 4.1.1.1)에 의한 피루베이트의 아세트알데하이드로의 데카르복시화; (2) NADP⁺ 한개를 NADPH 한개로 환원하는 아세트알데하이드 데하이드로게나제 (ACDH, EC 1.2.1.5 및 EC 1.2.1.4)에 의한 아세트알데하이드의 아세테이트로의 변환; 및 (3) 2 ATP를 2 ADP로 가수분해하는 것과 에너지가 동일한, 1 ATP를 1 AMP로 가수분해하는, 아세틸-CoA 신테타제 (ACS, EC 6.2.1.1)에 의한 아세테이트와 CoA로부터 아세틸-CoA의 합성.

자연은 아세틸-CoA로부터 유래되는 다수의 생분자를 추출함에 있어 수율이 낮은 소스만 제공하기 때문에, 유전자 변형된 미생물을 이용한 발효학적 제조 방법에 이들의 제조 방법으로서 유망한 대안책이다. 그러나, 아세틸-CoA 중간산물을 생산하기 위해 천연적인 아세틸-CoA 경로를 이용하는 방법에는 몇가지 한계가 있다. 예를 들어, 천연적인 MEV 경로를 통해 이소프레노이드를 생산하기 위해서는, 도 1에 도시된 바와 같이, 생산되는 메발로네이트 각 분자 당 아세틸-CoA 분자 3개와 NADPH 2개의 산화가 요구된다. PDH-바이패스는 생성되는 아세틸-CoA 당 NADPH 1개를 생성하지만, 이 과정에서 ATP는 2 당량이 소비된다. 그래서, NADPH 생성은 천연적인 MEV 경로의 조인자 요구성 측면에서는 유익하지만, 생성되는 메발로네이트 당 ATP 6개가 소모되고, 예컨대, 생성물의 수율을 희생하면서까지 더 많은 탄소원들을 TCA 사이클 및 산화적 인산화를 통한 ATP 합성에 사용하여야 하므로, 에너지 측면에서 비효율적인 반응이다.

즉, 아세틸-CoA로부터 유래되는 화합물들을 효율적으로 제조하는 생산 숙주를 설계함에 있어, 문제점들 중 하나는 ATP 요구량을 최소화하면서도 생합성 경로의 요건과 조인자를 총족시키도록 아세틸-CoA 생산을 최적화하는 것이다. 본원에 제시된 조성물과 방법은 이러한 과제를 해결하며, 아울러 관련 이점을 제공한다.

본원에 기술된 조성물 및 방법은, 에너지 효율적이고 조인자 측면에서 균형적인, 아세틸-CoA 유래 이소프레노이드의 제조를 제공한다. 아세틸-CoA를 세포질에서 생산하기 위한 PDH-바이패스의 대안으로서, 이종의 아실화 아세트알데하이드 데하이드로게나제 (다른 예로, "아세틸알데하이드 데하이드로게나제, 아세틸화," "아세틸알데하이드 데하이드로게나제, 아실화," 또는 "ADA" (EC 1.2.1.10))를 이용함으로써, 제조되는 아세틸-CoA 분자 당 ATP 2 당량을 절약한다. ADA는 ATP를 소비하지 않고도 아세트알데하이드를 아세틸-CoA로 직접 변환하는데, 이 과정에서 1개의 NAD⁺가 1개의 NADH로 환원된다.

PDH-바이패스를 ADA로 대체함으로써 달성되는 ATP 절약은 생성물의 수율을 보다 높이는 방향으로 사용될 수 있지만, 천연적인 메발로네이트 경로와 ADA를 조합하여 사용하는 방법에는 잠재적인 문제점들이 존재한다. 첫번째로, 천연 PDH-바이패스의 불활성화는 NADPH 소스 하나를 없애게 되며, ADA에 의해 촉매되는 반응을 통해 NADH가 제조된다. 즉, 추가적인 경로의 변형 없이 PDH-바이패스를 ADA로 치환하면, NADPH를 소비하는 이소프레노이드 합성에 레독스 불균형이 발생하게 된다.

두번째로, ADA는 다음과 같은 가역적인 반응을 촉매한다:

아세트알데하이드 + NAD⁺ + 코엔자임 A ⇔ 아세틸-CoA + NADH + H⁺

아세틸-CoA를 형성하는 천연적인 PDH-바이패스 반응은, ATP를 AMP로 가수분해하는 반응과 커플링되어 있어, 열역학적으로 우호적이다. 반면에, ADA 반응은 ATP와 커플링되어 있지 않으며, 아세틸-CoA를 형성함에 있어 천연적인 PDH-바이패스 반응 보다 평형에 훨씬 더 근접해 있다. 따라서, ADA에 의해 촉매되는 반응은 아세트알데하이드를 아세틸-CoA로 변환하는데 보다 낮은 열역학적 구동력을 가지므로, 추가적으로 경로를 변형하지 않으면 ADA에 의한 이론적인 에너지 획득은 실현되지 않을 수 있다.

본원에 기술된 조성물 및 방법은 이런 문제들을 해결한다. 일부 구현예들에서, PDH-바이패스를 ADA로 치환함으로써 발생되는 레독스 불균형을 해결하기 위해, 유전자 변형된 숙주 세포는 이소프레노이드 경로에서 ADA에 의해 생성되는 NADH를 소비하는데 NADH-가용성 효소 (NADH-가용성 효소)를 추가로 활용한다. 따라서, ADA-매개에 의한 아세트알데하이드의 아세틸-CoA로의 변환으로 생성되는 NADH 풀은 이소프레노이드 합성에 직접 활용될 수 있다. 일부 구현예들에서, NADH-가용성 효소는 이소프레노이드 경로에서 비-천연적인 효소이다. 예를 들어, NADH-가용성 효소는 이소프레노이드 경로의 천연적인 NADPH-가용성 효소를 대체할 수 있다. 특정 구현예에서, NADH-가용성 효소는 HMG-CoA를 메발로네이트로 변환하는 NADH-가용성 3-하이드록시-3-메틸글루타릴-CoA 리덕타제 (HMG-CoA 리덕타제)이다.

일부 구현예들에서, ADA 반응에서 낮은 열역학적 구동력을 해결하기 위해, 유전자 변형된 숙주 세포는 메발로네이트 경로에서 제1 단계로서 아세틸-CoA 바로 다음 차례에 열역학적으로 유리한 반응을 추가로 이용하여, ADA 반응에 풀 온 (pull on)을 제공한다. 일부 구현예들에서, 아세틸-CoA로부터 아세토아세틸-CoA의 형성은 아세토아세틸-CoA 신타제 (AACS; 다른 예로, 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제로 지칭됨)에 의해 촉매된다. AACS에 의해 촉매되는 반응은, 아세틸-CoA 카르복실라제에 의한 말로닐-CoA 생성으로부터 발생되는 ATP 1 분자의 가수분해로 인해 (도 5), 천연 메발로네이트 경로의 아세틸-CoA 티올라제에 의해 촉매되는 반응 보다 열역학적으로 더 유리하다. 즉, AACS는 ADA 반응을 정방향으로 구동하기 위한 보다 강력한 견인력을 아세틸-CoA에 제공한다.

이러한 변형과 조합하여 이종의 ADA를 이용하는 이점은 MEV 경로를 포함하는 숙주 세포에서의 세스퀴테르펜 파르네센의 이론적인 수율 개선으로 설명된다. 천연적인 메발로네이트 경로를 통한 이소프레노이드 제조는 도 1과 도 2에 예시된다. 도 3에 나타낸 바와 같이, 세포질 아세틸-CoA가 천연적인 효모 대사 네트워크에서 이루어지는 화학 반응만을 이용하여 글루코스로부터 합성되는 경우, 메발로네이트 경로를 통한 글루코스의 파르네센으로의 변환시 잠재적인 최대 화학량론적 수율은 23.6 wt%이며, 파르네센 1 분자를 합성하는데 글루코스 분자 4.77개가 요구된다. 파르네센 분자 1개 당 ATP 27개가 필요한데, 이 중 18개는 PDH-바이패스를 통해 아세트알데하이드로부터 세포질 아세틸-CoA를 합성하는데 소모된다. 그러나, 도 4에 예시된 바와 같이, ADA와 NADH-가용성 HMG-CoA 리덕타제에 의해 촉매되는 반응을 메발로네이트를 제조하는 대사 네트워크에 도입하면, 최대 이론적인 화학량론적 수율은 25.2 wt%로 개선된다. 특히, ADA는 ATP 투입 없이도 아세트알데하이드를 아세틸-CoA로 변환하는데; 이는 파르네센을 합성하는데 필요한 ATP 당량을 9개로 낮추므로써, 합성되는 파르네센 분자 1개 당 ATP 18 당량을 절약한다 (2 ATP 당량 / 아세틸-CoA x 9 아세틸-CoA / 1 파르네센). 아세틸-CoA 제조 중에 이루어지는 이러한 ATP 소비 절약은 파르네센을 제조하기 위해 TCA 사이클을 구동하기 위한 세포의 산소 요구성을 소거시킨다. 글루코스를 파르네센으로 변환하기 위한 산소 요구량을 글루코스 당 소비되는 O₂ 분자를 7.8개에서 6개로 감소시킴으로써, 발효기에 산소를 공급하는데 따른 주된 제조 단가를 일정한 규모로 떨어뜨린다. 아울러, 레독스 불균형은 ADA에 의해 생성된 NADH를 소비하는 NADH-가용성 HMG-CoA 리덕타제의 공동-도입에 의해 완화된다.

도 4에 나타낸 바와 같이, ADA 및 NADH-가용성 HMG-CoA 리덕타제 둘다를 포함하는 균주에는 ATP가 화학량론적 과잉으로 발생되며, 세포는 이를 유지와 생육에 이용할 수 있다. 다른 예로, 이러한 과잉의 ATP 중 일부는, 아세토아세틸-CoA 신타제 (AACS)를 도입함으로써, 아세토아세틸-CoA 제조의 카이네틱스를 개선시키는 방향으로 활용할 수 있다. 도 5에 예시된 바와 같이, AACS는 말로닐-CoA 및 아세틸-CoA로부터 아세토아세?-CoA를 합성하는 효소이다. 말로닐-CoA를 합성하는데에는 변환된 아세틸-CoA 1 분자 당 ATP 1개의 에너지 투입이 요구된다 (아세틸-CoA 카르복실라제에 의해 촉매되며, 아세틸-CoA로부터 아세토아세틸-CoA를 합성하기 위한 열역학적 구동력이 개선됨). 중요한 점은, 도 6에 예시된 바와 같이, 이것은 이 균주 설계에서 이용가능한 과잉의 ATP가 여전히 존재하기 때문에, 그 경로의 당 또는 산소 요구량이 파르네센의 최대 화학량론적 수율에 영향을 미치지 않는다는 것이다.

도 7에 나타낸 바와 같이, 부가적인 효과는 포스포케톨라제 (PK)와 포스포트랜스아세틸라제 (PTA) 효소의 도입을 통해 달성될 수 있다. PK 및 PTA는 프럭토스-6-포스페이트 (F6P) 또는 자일룰로스-5-포스페이트 (X5P)를 아세틸-CoA로 변환하는 반응을 촉매한다. 이들 이용가능한 대사 경로를 이용하여, 가장 바람직하게는, 반응 네트워크는 최대 이론적인 수율에서 현저하게 증가된 중량 (mass) 수율 29.8 wt% 또는 그 이상에 도달할 수 있다. 이 해법은 탄소를 저 당분해 (lower glycolysis) (G3P → 피루베이트)로부터 전환 (divert)시키는 단계를 포함하며, 이로써 ATP 및 NADH는 적게 생성되지만, 이 둘다 ADA 및 NADH-가용성 HMG-CoA 리덕타제 변형을 포함하는 네트워크에 이미 과량으로 존재한다. 저 당분해를 통한 흐름 (flux)을 줄이는 한가지 이점은, 피루베이트에서 아세트알데하이드로의 변환시 CO₂가 적게 발생되며, 따라서, 최종 산물에 더 많은 탄소가 포획됨으로써, 네트워크의 최대 이론적인 수율을 높일 수 있다는 것이다. 두번째 이점은, NADH가 적게 생성되므로, 이를 재산화하는데 산소가 훨씬 적게 필요하다는 것이다. 특히, 가장 바람직한 산소 요구량은 소비되는 글루코스 1 분자 당 O₂ 분자 1.84개에 불과하다. 글리세롤 생산이 야생형 수준으로 돌아가는 경우, 도 13에 예시된 바와 같이, ADA 백그라운드에 PK 및 PTA를 부가함으로써 발생되는 레독스 충격은 마이크로스케일의 낮은 수율에서도 명백하다.

따라서, 본 발명은 아세틸-CoA-유래 이소프레노이드를 제조하기 위한 유전자 변형된 숙주 세포 및 이의 이용 방법을 제공한다. 일 측면에서, 본 발명은, (a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종 핵산; 및 (b) 아실화 아세틸알데하이드 데하이드로게나제를 코딩하는 이종의 핵산을 포함하는, 이소프레노이드를 제조할 수 있는 유전자 변형된 숙주 세포를 제공한다.

일부 구현예들에서, MEV 경로의 하나 이상의 효소는 아세틸-CoA를 말로닐-CoA와 축합하여 아세토아세틸-CoA를 만드는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제 (즉, 아세토아세틸-CoA 신타제 (AACS))를 포함한다.

일부 구현예들에서, MEV 경로의 하나 이상의 효소는 HMG-CoA를 메발로네이트로 변환하는 NADH-가용성 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 NADH를 사용하는 HMG-CoA 리덕타제를 포함한다.

일부 구현예들에서, 유전자 변형된 숙주 세포는 포스포케톨라제를 코딩하는 이종의 핵산을 추가로 포함한다. 일부 구현예들에서, 유전자 변형된 숙주 세포는 포스포트랜스아세틸라제를 코딩하는 이종의 핵산을 추가로 포함한다.

일부 구현예들에서, ADA의 아미노산 서열은 서열번호 2와 80% 이상 동일하다. 일부 구현예들에서, 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제의 아미노산 서열은 서열번호 16과 80% 이상 동일하다. 일부 구현예들에서, NADH-가용성 HMG-CoA 리덕타제의 아미노산 서열은 서열번호 20과 80% 이상 동일하다. 일부 구현예들에서, 포스포케톨라제의 아미노산 서열은 서열번호 12와 80% 이상 동일하다. 일부 구현예들에서, 포스포트랜스아세틸라제의 아미노산 서열은 서열번호 14와 80% 이상 동일하다.

일부 구현예들에서, 유전자 변형된 숙주 세포는 천연적인 피루베이트 데하이드로게나제 (PDH)-바이패스의 하나 이상의 효소에 대한 기능적 파괴 (functional disruption)를 추가로 포함한다. 일부 구현예들에서, PDH-바이패스의 하나 이상의 효소는 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로부터 선택된다. 일부 구현예들에서, ACS1이 기능적으로 파괴된다. 일부 구현예들에서, ACS2가 기능적으로 파괴된다. 일부 구현예들에서, ALD6가 기능적으로 파괴된다. 일부 구현예들에서, ACS1 및 ACS2가 기능적으로 파괴된다. 일부 구현예들에서, ACS1, ACS2 및 ALD6가 기능적으로 파괴된다.

일부 구현예들에서, 유전자 변형된 숙주 세포는 알코올 데하이드로게나제 (ADH) 활성을 가진 하나 이상의 효소에 대한 기능적 파괴를 더 포함한다. 일부 구현예들에서, ADH 활성을 가진 하나 이상의 효소는 알코올 데하이드로게나제 1 (ADH1), 알코올 데하이드로게나제 3 (ADH3), 알코올 데하이드로게나제 4 (ADH4) 및 알코올 데하이드로게나제 5 (ADH5)로부터 선택된다.

일부 구현예들에서, MEV 경로의 하나 이상의 효소는 아세틸-CoA 분자 2개를 축합하여 아세토아세틸-CoA를 합성하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 아세토아세틸-CoA를 아세틸-CoA와 축합하여 HMG-CoA를 합성하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 HMG-CoA를 메발로네이트로 변환하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 메발로네이트를 메발로네이트 5-포스페이트로 인산화하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 메발로네이트 5-포스페이트를 메발로네이트 5-피로포스페이트로 변환하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 메발로네이트 5-피로포스페이트를 이소펜테닐 피로포스페이트로 변환하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 HMG-CoA 신타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 및 메발로네이트 피로포스페이트 데카르복실라제로부터 선택된다.

일부 구현예들에서, 숙주 세포는 MEV 경로의 효소 전체를 코딩하는 복수의 이종의 핵산을 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종의 핵산은 단일한 전사 조절인자의 통제를 받는다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종의 핵산은 복수의 이종의 전사 조절인자들의 통제를 받는다.

일부 구현예들에서, 유전자 변형된 숙주 세포는 이소펜테닐 피로포스페이트 (IPP)를 다이메틸알릴 피로포스페이트 (DMAPP)로 변환할 수 있는 효소를 코딩하는 이종의 핵산을 추가로 포함한다. 일부 구현예들에서, 유전자 변형된 숙주 세포는 IPP 및/또는 DMAPP 분자를 축합하여 폴리프레닐 화합물을 합성할 수 있는 효소를 코딩하는 이종의 핵산을 추가로 포함한다. 일부 구현예들에서, 유전자 변형된 숙주 세포는 IPP 또는 폴리프레닐을 변형하여 이소프레노이드 화합물을 합성할 수 있는 효소를 코딩하는 이종의 핵산을 추가로 포함한다. 일부 구현예들에서, IPP 또는 폴리프레닐을 변형하여 이소프레노이드 화합물을 합성할 수 있는 효소는 카렌 신타제, 게라니올 신타제, 리날롤 신타제, 리모넨 신타제, 미르센 신타제, 옥시멘 신타제, α-피넨 신타제, β-피넨 신타제, γ-테르피넨 신타제, 테르피놀렌 신타제, 아모르파디엔 신타제, α-파르네센 신타제, β-파르네센 신타제, 파르네솔 신타제, 네롤리돌 신타제, 패출리올 (patchouliol) 신타제, 노트카톤 (nootkatone) 신타제, 및 아비에타디엔 신타제로 이루어진 군으로부터 선택된다. 일부 구현예들에서, 이소프레노이드는 헤미테르펜, 모노테르펜, 다이테르펜, 트리테르펜, 테트라테르펜, 세스퀴테르펜 및 폴리테르펜으로 이루어진 군으로부터 선택된다. 일부 구현예들에서, 이소프레노이드는 C₅-C₂₀ 이소프레노이드이다. 일부 구현예들에서, 이소프레노이드 아비에타디엔, 아모르파디엔, 카렌, α-파르네센, β-파르네센, 파르네솔, 게라니올, 게라닐게라니올, 이소프렌, 리날롤, 리모넨, 미르센, 네롤리돌, 옥시멘, 패출롤, β-피넨, 사비넨, γ-테르피넨, 테르피놀렌 및 발렌센으로 이루어진 군으로부터 선택된다.

일부 구현예들에서, 유전자 변형된 숙주 세포는 효모 세포이다. 일부 구현예들에서, 효모는 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)이다.

다른 측면에서, 본 발명은, (a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종 핵산; (b) 아세틸알데하이드 데하이드로게나제, 아세틸화 (ADA)를 코딩하는 이종의 핵산; (c) 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로 이루어진 군으로부터 선택되는 천연적인 PDH-바이패스의 하나 이상의 효소의 기능적 파괴; (d) 포스포케톨라제 (PK)를 코딩하는 이종의 핵산; 및 (e) 포스포트랜스아세틸라제 (PTA)를 코딩하는 이종의 핵산을 포함하는, 이소프레노이드를 제조할 수 있는 유전자 변형된 숙주 세포를 제공한다.

다른 측면에서, 본 발명은, (a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종 핵산으로서, 상기 한가지 이상의 효소는 NADH-가용성 HMG-CoA 리덕타제를 포함함; (b) 아세틸알데하이드 데하이드로게나제, 아세틸화 (ADA)를 코딩하는 이종의 핵산; 및 (c) 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로 이루어진 군으로부터 선택되는 천연적인 PDH-바이패스의 하나 이상의 효소에 대한 기능적 파괴를 포함하는, 이소프레노이드를 제조할 수 있는 유전자 변형된 숙주 세포를 제공한다.

다른 측면에서, 본 발명은, (a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종 핵산으로서, 상기 한가지 이상의 효소는 NADH-가용성 HMG-CoA 리덕타제를 포함함; (b) 아세틸알데하이드 데하이드로게나제, 아세틸화 (ADA)를 코딩하는 이종의 핵산; (c) 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로 이루어진 군으로부터 선택되는 천연적인 PDH-바이패스의 하나 이상의 효소의 기능적 파괴; (d) 포스포케톨라제 (PK)를 코딩하는 이종의 핵산; 및 (e) 포스포트랜스아세틸라제 (PTA)를 코딩하는 이종의 핵산을 포함하는, 이소프레노이드를 제조할 수 있는 유전자 변형된 숙주 세포를 제공한다.

다른 측면에서, 본 발명은, (a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종 핵산으로서, 여기서 하나 이상의 효소는 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제를 포함함; (b) 아세틸알데하이드 데하이드로게나제, 아세틸화 (ADA)를 코딩하는 이종의 핵산; 및 (c) 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로 이루어진 군으로부터 선택되는 천연적인 PDH-바이패스의 하나 이상의 효소에 대한 기능적 파괴를 포함하는, 이소프레노이드를 제조할 수 있는 유전자 변형된 숙주 세포를 제공한다.

다른 측면에서, 본 발명은, (a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 복수의 효소를 코딩하는 하나 이상의 이종의 핵산으로서, 여기서 복수의 효소는 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제와 NADH-가용성의 HMG-CoA 리덕타제를 포함함; (b) 아세틸알데하이드 데하이드로게나제, 아세틸화 (ADA)를 코딩하는 이종의 핵산; (c) 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로 이루어진 군으로부터 선택되는 천연적인 PDH-바이패스의 하나 이상의 효소의 기능적 파괴; (d) 포스포케톨라제 (PK)를 코딩하는 이종의 핵산; 및 (e) 포스포트랜스아세틸라제 (PTA)를 코딩하는 이종의 핵산을 포함하는, 이소프레노이드를 제조할 수 있는 유전자 변형된 숙주 세포를 제공한다.

다른 측면에서, 본 발명은, (a) 이소프레노이드 화합물을 합성하는데 적합한 조건에서 탄소원이 구비된 배지에서 본원에 기술된 유전자 변형된 효모 세포 개체군을 배양하는 단계; 및 (b) 상기 배지로부터 상기 이소프레노이드 화합물을 회수하는 단계를 포함하는, 이소프레노이드 제조 방법을 제공한다.

도 1은 이소펜테닐 다이포스페이트 ("IPP")를 제조하기 위한 메발로네이트 ("MEV") 경로를 개략적으로 도시한 것이다.
도 2는 IPP 및 다이메틸알릴 피로포스페이트 ("DMAPP")를 게라닐 피로포스페이트 ("GPP"), 파르네실 피로포스페이트 ("FPP") 및 게라닐게라닐 피로포스페이트 ("GGPP")로 변환하는 과정을 개략적으로 도시한 것이다.
도 3은 세포질 아세틸-CoA를 "야생형" PDH-바이패스를 통해 합성하는, 메발로네이트 경로를 통한, 글루코스의 파르네센으로의 변환에 있어 탄소 및 대사 요구량의 최적 흐름에 대한 개략적인 도시와 수율을 나타낸 것이다.
도 4는 세포질 아세틸-CoA가 ADA를 통해 합성되며 메발로네이트 경로가 NADPH-가용성 HMGr 대신 NADH-가용성 HMGr을 포함하는, 메발로네이트 경로를 통한 글루코스의 파르네센으로의 변환에 있어, 탄소 및 대사 요구량의 최적의 흐름과 수율을 개략적으로 도시한 것이다.
도 5는 아세토아세틸-CoA (AcAcCoA)가 아세토아세틸-CoA 신타제 (AACS)에 의해 말로닐-CoA와 아세틸-CoA (AcCoA)로부터 합성되는, 아세틸-CoA로부터 파르네센의 합성을 개략적으로 도신한 것이다. 말로닐-CoA 합성에는 변환되는 아세틸-CoA 1 분자 당 ATP 1개의 에너지 투입이 요구된다 (아세틸-CoA 카르복실라제 (ACC1)에 의해 촉매됨).
도 6은 세포질 아세틸-CoA가 ADA를 통해 합성되며 메발로네이트 경로가 NADPH-가용성 HMGr 대신 NADH-가용성 HMGr을 포함하며 아세토아세틸-CoA가 아세토아세틸-CoA 신타제에 의해 말로닐-CoA와 아세틸-CoA로부터 합성되는, 메발로네이트 경로를 통한 글루코스의 파르네센으로의 변환에 있어, 탄소 및 대사 요구량의 최적의 흐름과 수율을 개략적으로 도시한 것이다.
도 7은 세포질 아세틸-CoA가 ADA를 통해 합성되며 메발로네이트 경로가 NADPH-가용성 HMGr 대신 NADH-가용성 HMGr을 포함하며 포스포케톨라제 (PK)와 포스포트랜스아세틸라제 (PTA)가 프럭토스-6-포스페이트 (F6P)의 아세틸-CoA로의 변환하는 반응을 촉매하는, 메발로네이트 경로를 통한 글루코스의 파르네센으로의 변환에 있어, 탄소 및 대사 요구량의 최적의 흐름과 수율을 개략적으로 도시한 것이다.
도 8은 사카로마이세스 세레비지애 (Sacchormyces cerevisiae) (Sc. tHMG-CoA 리덕타제), 슈도모나스 메발로니 (Pseudomonas mevalonii) (Pm.), 델프티아 액시도보란스 (Delftia acidovorans) (Da.) 및 실리시박터 포메로이 (Silicibacter pomeroyi) (Sp.) 유래 하이드록시메틸글루타릴-CoA 리덕타제의 NADPH-특이적인 또는 NADH-특이적인 활성을 제시한다 (nmol/mg/min로 측정함).
도 9는 야생형 ADH1, 및 ADH1 낫 아웃 (adh1Δ) 백그라운드 각각에서 NADPH-가용성 HMG-CoA 리덕타제 (Sc. tHMG-CoA 리덕타제) 또는 NADH-가용성 HMG-CoA 리덕타제 (Pm. - 슈도모나스 메발로니 (Pseudomonas mevalonii); Da. -- 델프티아 액시도보란스 (Delftia acidovorans); Sp. -- 실리시박터 포메로이 (Silicibacter pomeroyi))를 포함하는 이종의 MevT 경로를 구비한, 사카로마이세스 세레비지애 (S. cerevisiae)(Sc.)의 24시간 및 48시간 이후의 세포 밀도 (OD₆₀₀로 측정함)를 나타낸 것이다.
도 10은 야생형 ADH1, 및 ADH1 낫 아웃 백그라운드 각각에서, NADPH-가용성 HMG-CoA 리덕타제 (Sc. tHMG-CoA 리덕타제) 또는 NADH-가용성 HMG-CoA 리덕타제 (Pm. -슈도모나스 메발로니 (Pseudomonas mevalonii); Da. -- 델프티아 액시도보란스 (Delftia acidovorans); Sp. -- 실리시박터 포메로이 (Silicibacter pomeroyi))를 포함하는 이종의 MevT 경로를 구비한, 사카로마이세스 세레비지애 (S. cerevisiae)(Sc.)의 24시간 및 48시간 후 글리세롤 생산 (g/L로 측정함)을 나타낸 것이다.
도 11은 야생형 ADH1 및 ADH1 낫 아웃 (adh1Δ) 백그라운드 둘다에서, NADPH-가용성 HMG-CoA 리덕타제 (Sc. tHMG-CoA 리덕타제) 또는 NADH-가용성 HMG-CoA 리덕타제 (Pm. -슈도모나스 메발로니 (Pseudomonas mevalonii); Da. -- 델프티아 액시도보란스 (Delftia acidovorans); Sp. -- 실리시박터 포메로이 (Silicibacter pomeroyi))를 포함하는 사카로마이세스 세레비지애 (S. cerevisiae)(Sc.)의 24시간 및 48시간 후 메발로네이트 생산 (g/L로 측정함)을 나타낸 것이다.
도 12는 (A) acs1Δ acs2 Δ ald6Δ가 커플링된 이종적으로 발현되는 ADA (Dz.eutE), 및 NADPH-가용성 HMG-CoA 리덕타제 또는 NADH-가용성 HMG-CoA 리덕타제 중 어느 하나를 포함하는 MEV 경로; (B) 무손상 (야생형) PDH-바이패스, 및 NADPH-가용성 HMG-CoA 리덕타제 또는 NADH-가용성 HMG-CoA 리덕타제 중 어느 하나를 포함하는 MEV 경로를 포함하는, 사카로마이세스 세레비지애 (S. cerevisiae) 균주의 파르네센 생산과 세포 밀도를 나타낸 것이다. "Empty"로 표시된 막대는 배지만 (세포 무존재) 존재하는 웰이다.
도 13은 (A) 야생형 균주 (Y968); ADA (Dz.eutE)를 이종적으로 발현하는 균주 (Y12869); 및 (B) ADA (Dz.eutE), 포스포케톨라제 (PK)와 포스포트랜스아세틸라제 (PTA)를 이종적으로 발현하는 균주 (Y12745)에 의한, 글리세롤 생산 (상단 패널) 및 글루코스 소비 (하단 패널)를 도시한 것이다.
도 14는 무손상 (야생형) PDH-바이패스 또는 acs1Δ acs2 Δ ald6Δ가 커플링된 이종적으로 발현된 ADA (Dz.eutE) 중 어느 하나; 및 ERG10 (아세틸-CoA 티올라제) 또는 nphT7 (아세토아세틸-CoA 신타제) 중 어느 하나를 포함하는 MEV 경로를 포함하는, 사카로마이세스 세레비지애 (S. cerevisiae) 균주에 의한 메발로네이트 생산을 도시한 것이다.

5.

5.1 용어

본원에서, 용어 "이종의"는, 통상 천연적으로 발견되지 않는 것을 지칭한다. 용어 "이종의 뉴클레오티드 서열"은 자연에서 소정의 세포에서 정상적으로 발견되지 않는 뉴클레오티드 서열을 지칭한다. 이와 같이, 이종의 뉴클레오티드 서열은, (a) 이의 숙주 세포에 외래적 (즉, 세포에 "외인성")이거나; (b) 숙주 세포에서 천연적으로 발견되지만 (즉, "내인성"), 세포에서 비천연적인 양으로 존재 (즉, 숙주 세포에서 천연적으로 확인되는 양 보다 많거나 적음)하거나; 또는 (c) 숙주 세포에서 본래 확인되지만 이의 본래의 위치에서 벗어난 위치에 있을 수 있다. 용어 "이종의 효소"는 자연에서 소정의 세포에서 정상적으로는 확인되지 않는 효소를 지칭한다. 이 용어는, (a) 소정의 세포에 외인성이고 (즉, 숙주 세포에 본래 존재하지 않거나 또는 해당 문맥에서 숙주 세포에서 본래 존재하지 않는 뉴클레오티드 서열에 의해 코딩됨); 및 (b) 숙주 세포에서 본래 발견되지만 (예, 효소가 세포에 내인성인 뉴클레오티드 서열에 의해 코딩됨), 숙주 세포에서 비정상적인 양 (예, 본래 확인되는 양 보다 많거나 적게)으로 제조되는 효소를 포괄한다.

한편, 본원에서, 분자, 특히 효소 및 핵산에 대한 "천연적인" 또는 "내인성"이라는 언급의 용어는, 천연 미생물에서 분자의 발현 수준 보다 낮거나, 동일하거나 또는 높을 수 있는 발현 수준과는 무관하게, 자연에서 기원하거나 발견되는 유기체에서 발현되는 분자를 지칭한다. 천연 효소 또는 폴리뉴클레오티드의 발현은 재조합 미생물에서 변형될 수 있는 것으로 이해된다.

본원에서, 타겟 유전자, 예컨대 PDH-바이패스의 하나 이상의 유전자의, 예컨대 "기능적으로 파괴한다" 또는 "기능적 파괴"는, 타겟 유전자가, 타겟 유전자에 의해 코딩된 단백질의 활성을 숙주 세포에서 낮추는 방식으로 변형되는 것을 의미한다. 마찬가지로, 타겟 단백질, 예를 들어 PDH-바이패스의 하나 이상의 효소를, 예컨대, "기능적으로 파괴한다" 또는 "기능적 파괴"는, 타겟 단백질이 단백질의 활성을 숙주 세포에서 낮추는 방식으로 변형되는 것을 의미한다. 일부 구현예들에서, 타겟 유전자에 의해 코딩되는 타겟 단백질의 활성이 숙주 세포에서 소거된다. 다른 구현예들에서, 타겟 유전자에 의해 코딩되는 타겟 단백질의 활성이 숙주 세포에서 감소된다. 타겟 유전자의 기능적 파괴는, 유전자 발현이 없어지거나 감소되도록, 또는 유전자 산물의 활성이 사라지거나 감소되도록, 유전자 전체 또는 일부를 결손시킴으로써 달성될 수 있다. 또한, 타겟 유전자의 기능적 파괴는, 발현이 소거 또는 감소되도록 유전자의 조절 인자, 예컨대, 유전자의 프로모터를 돌연변이시키거나, 또는 유전자 산물의 활성이 없어지거나 또는 감소되도록 유전자의 코딩 서열을 돌연변이시킴으로써, 달성될 수 있다. 일부 구현예들에서, 타겟 유전자의 기능적 파괴로 타겟 유전자의 오픈 리딩 프레임 전체가 제거된다.

본원에서, 용어 "부모 세포"는, 변형된 숙주 세포에서 조작되는 한가지 이상의 특정 유전자에 대한 변형, 예컨대, ADA의 이종 발현, NADH-가용성 HMG-CoA 리덕타제의 이종 발현, AACS의 이종 발현, 포스포케톨라제의 이종 발현, 포스포트랜스아세틸라제의 이종 발현 및 메발로네이트 경로의 하나 이상의 효소의 이종 발현으로 이루어진 군으로부터 선택되는 한가지 이상의 변형을 포함하지 않는다는 것을 제외하고는, 본원에 언급된 유전자 변형된 숙주 세포와 동일한 유전자 백그라운드를 가지는 세포를 지칭한다.

본원에서, 용어 "생산"은 일반적으로 본원에 제시된 유전자 변형된 숙주 세포에 의해 제조되는 일정량의 이소프레노이드를 지칭한다. 일부 구현예들에서, 생산은 숙주 세포의 이소프레노이드의 수율로서 표시된다. 다른 구현예들에서, 생산은 이소프레노이드 생산에 대한 숙주 세포의 생산성으로 표시된다.

본원에서, 용어 "생산성"은, 숙주 세포를 경시적으로 (시간 당) (부피) 배양한 발효 배지 양 당 제조되는 이소프레노이드 (중량) 양으로 표시되는, 숙주 세포에 의한 이소프레노이드의 생산을 지칭한다.

본원에서, 용어 "수율"은 숙주 세포에 의해 소비되는 탄소원의 양 당 생산되는 이소프레노이드의 양을 중량으로 표시한, 숙주 세포에 의한 이소프레노이드의 생산을 지칭한다.

5.2 아세틸-CoA로부터 이소프레노이드를 제조하는 유전자 변형된 미생물

5.2.1 숙주 세포

본원에 제공되는 숙주 세포에 유용한 조성물과 방법은 고세균 (archae), 원핵생물 또는 진핵생물 세포를 포함한다.

적합한 원핵생물 숙주로는, 비제한적인 예로, 다양한 그람-양성, 그람-음성 또는 그람-가변성 박테리아 모두를 포함한다. 예로는, 비제한적으로, 다음의 속에 속하는 세포를 포함한다: 아그로박테리움 (Agrobacterium), 알리사이클로바실러스 (Alicyclobacillus), 아나바에나 (Anabaena), 아나시스티스 (Anacystis), 아르트로박터 (Arthrobacter), 아조박터 (Azobacter), 바실러스 (Bacillus), 브레비박테리움 (Brevibacterium), 크로마티움 (Chromatium), 클로스트리듐 (Clostridium), 코리네박테리움 (Corynebacterium), 엔테로박터 (Enterobacter), 에르위니아 (Erwinia), 에스케리키아 (Escherichia), 락토바실러스 (Lactobacillus), 락토코커스 (Lactococcus), 메소리조븀 (Mesorhizobium), 메틸로박테리움 (Methylobacterium), 마이크로박테리움 (Microbacterium), 포르미듐 (Phormidium), 슈도모나스 (Pseudomonas), 로도박터 (Rhodobacter), 로도슈도모나스 (Rhodopseudomonas), 로도스피릴룸 (Rhodospirillum), 로도코커스 (Rhodococcus), 살모넬라 (Salmonella), 세네데스문 (Scenedesmun), 세라티아 (Serratia), 시겔라 (Shigella), 스타플로코커스 (Staphlococcus), 스트렙토마이세스 (Strepromyces), 신네코쿠스 (Synnecoccus) 및 자이모모나스 (Zymomonas). 원핵생물 균주의 예로는, 비제한적으로, 바실러스 섭틸리스 (Bacillus subtilis), 바실러스 아밀로리퀘팍시네스 (Bacillus amyloliquefacines), 브레비박테리움 암모니아게네스 (Brevibacterium ammoniagenes), 브레비박테리움 임마리오필럼 (Brevibacterium immariophilum), 클로스트리듐 베이예린키이 (Clostridium beigerinckii), 엔테로박터 사카자키 (Enterobacter sakazakii), 에스케리키아 콜라이 (Escherichia coli), 락토코커스 락티스 (Lactococcus lactis), 메소리조쥼 로티 (Mesorhizobium loti), 슈도모나스 에어루지노사 (Pseudomonas aeruginosa), 슈도모나스 메발로니 (Pseudomonas mevalonii), 슈도모나스 푸디카 (Pseudomonas pudica), 로도박터 캡슐라투스 (Rhodobacter capsulatus), 로도박터 스페어로이데스 (Rhodobacter sphaeroides), 로도스피릴룸 루브럼 (Rhodospirillum rubrum), 살모넬라 엔테리카 (Salmonella enterica), 살모넬라 티피 (Salmonella typhi), 살모넬라 티피무리움 (Salmonella typhimurium), 시겔라 다이센테리아 (Shigella dysenteriae), 시겔라 플렉스네리 (Shigella flexneri), 시겔라 소네이 (Shigella sonnei) 및 스타필로코커스 아우레우스 (Staphylococcus aureus)를 포함한다. 특정 구현예에서, 숙주 세포는 에스케리키아 콜라이 (Escherichia coli) 세포이다.

적합한 고세균 숙주로는, 비제한적인 예로, 다음과 같은 속에 속하는 세포를 포함한다: 에어로피룸 (Aeropyrum), 아르케글로부스 (Archaeglobus), 할로박테리움 (Halobacterium), 메타노코커스 (Methanococcus), 메타노박테리움 (Methanobacterium), 피로코커스 (Pyrococcus), 설폴로부스 (Sulfolobus), 및 써모플라스마 (Thermoplasma). 고세균 균주의 예로는, 비제한적으로, 아르케오글로부스 풀기두스 (Archaeoglobus fulgidus), 할로박테리움 (Halobacterium) sp., 메타노코커스 야나스키 (Methanococcus jannaschii), 메타노박테리움 써모오토트로피쿰 (thermoautotrophicum), 써모플라스마 액시도필룸 (Thermoplasma acidophilum), 써모플라스마 볼카늄 (Thermoplasma volcanium), 피로코커스 호리코시 (Pyrococcus horikoshii), 피로코커스 아비시 (Pyrococcus abyssi) 및 에어로피룸 퍼닉스 (Aeropyrum pernix)를 포함한다.

적합한 진핵생물의 숙주로는, 비제한적인 예로, 진균 세포, 해조류 세포, 곤충 세포 및 식물 세포를 포함한다. 일구 구현예에서, 본 발명의 방법에 사용가능한 효모는 미생물 기탁 기관 (예, IFO, ATCC 등)에 기탁되었으며, 다음과 같은 속에 속하는 효모를 포함한다: 특히, 액시쿨로코니듐 (Aciculoconidium), 암브로시오지마 (Ambrosiozyma), 아르트로아스쿠스 (Arthroascus), 아릭시오지마 (Arxiozyma), 아쉬비아 (Ashbya), 바브제비아 (Babjevia), 벤싱토니아 (Bensingtonia), 보트리오아스쿠스 (Botryoascus), 보트리오지마 (Botryozyma), 브레타노마이세스 (Brettanomyces), 불레라 (Bullera), 불레로마이세스 (Bulleromyces), 칸디다 (Candida), 시테로마이세스 (Citeromyces), 클라비스포라 (Clavispora), 크립토코커스 (Cryptococcus), 시스토필로바시듐 (Cystofilobasidium), 데바리오마이세스 (Debaryomyces), 데카라 (Dekkara), 디포다스콥시스 (Dipodascopsis), 디포다스쿠스 (Dipodascus), 에니엘라 (Eeniella), 엔도마이콥셀라 (Endomycopsella), 에레마스쿠스 (Eremascus), 에레모테시움 (Eremothecium), 에리트로바시듐 (Erythrobasidium), 펠로마이세스 (Fellomyces), 필로바시듐 (Filobasidium), 갈락토마이세스 (Galactomyces), 제오트리쿰 (Geotrichum), 귈리리에르몬델라 (Guilliermondella), 한세니아스포라 (Hanseniaspora), 한세눌라 (Hansenula), 하세가와이 (Hasegawaea), 폴터마니아 (Holtermannia), 호르모아스쿠스 (Hormoascus), 하이포피키아 (Hyphopichia), 이사첸티아 (Issatchenkia), 클로엑케라 (Kloeckera), 클로엑케라스포라 (Kloeckeraspora), 클루이베로마이세스 (Kluyveromyces), 콘도아 (Kondoa), 쿠라이시아 (Kuraishia), 쿠르츠마모마이세스 (Kurtzmanomyces), 루코스포리듐 (Leucosporidium), 리포마이세스 (Lipomyces), 로데로마이세스 (Lodderomyces), 말라세지아 (Malassezia), 메츠니코위아 (Metschnikowia), 므라키아 (Mrakia), 믹소지마 (Myxozyma), 나드소니아 (Nadsonia), 나카자와이 (Nakazawaea), 네마토스포라 (Nematospora), 오가타에 (Ogataea), 오스포리디움 (Oosporidium), 파키솔렌 (Pachysolen), 파키티코스포라 (Phachytichospora), 파피아 (Phaffia), 피키아 (Pichia), 로도스포리듐 (Rhodosporidium), 로도토룰라 (Rhodotorula), 사카로마이세스 (Saccharomyces), 사카로마이코데스 (Saccharomycodes), 사카로마이콥시스 (Saccharomycopsis), 사이토엘라 (Saitoella), 사카구키아 (Sakaguchia), 사투라노스포라 (Saturnospora), 스키조블라스토스포리온 (Schizoblastosporion), 스키조사카로마이세스 (Schizosaccharomyces), 슈반니오마이세스 (Schwanniomyces), 스포리디오볼루스 (Sporidiobolus), 스포로볼로마이세스 (Sporobolomyces), 스포로파키더미아 (Sporopachydermia), 스테파노아스쿠스 (Stephanoascus), 스테리그마토마이세스 (Sterigmatomyces), 스테리그마토스포리듐 (Sterigmatosporidium), 심비오타프리나 (Symbiotaphrina), 심포디오마이세스 (Sympodiomyces), 심포디오마이콥시스 (Sympodiomycopsis), 토룰라스포라 (Torulaspora), 트리코스포리엘라 (Trichosporiella), 트리코스포론 (Trichosporon), 트리고놉시스 (Trigonopsis), 츠키야에아 (Tsuchiyaea), 우데니오마이세스 (Udeniomyces), 발토마이세스 (Waltomyces), 윅커하미아 (Wickerhamia), 윅커하미엘라 (Wickerhamiella), 빌리옵시스 (Williopsis), 야마다지마 (Yamadazyma), 야로위니아 (Yarrowia), 자이고아스쿠스 (Zygoascus), 자이고사카로마이세스 (Zygosaccharomyces), 자이고빌리옵시스 (Zygowilliopsis), 및 자이고지마 (Zygozyma).

일부 구현예에서, 숙주 미생물은 사카로마이세스 세레비지애 (Saccharomyces cerevisiae), 피키아 패스토리스 (Pichia pastoris), 스키조사카로마이세스 폼베 (Schizosaccharomyces pombe), 데케라 브룩셀렌시스 (Dekkera bruxellensis), 클루이베로마이세스 락티스 (Kluyveromyces lactis) (기존에는 사카로마이세스 락티스 (Saccharomyces lactis)로 지칭됨), 클루이베로마이세스 마르시아누스 (Kluveromyces marxianus), 아르술라 아데니니보란스 (Arxula adeninivorans), 또는 한세눌라 폴리모르파 (Hansenula polymorpha) (피키아 앙구스타 (Pichia angusta)라고도 함)이다. 일부 구현예에서, 숙주 미생물은 칸디다 (Candida) 속의 균주, 예컨대 칸디다 리폴리티카 (Candida lipolytica), 칸디다 길리어몬디이 (Candida guilliermondii), 칸디다 크루세이 (Candida krusei), 칸디다 슈도트로피칼리스 (Candida pseudotropicalis) 또는 칸디다 유틸리스 (Candida utilis)이다.

특정 구현예에서, 숙주 미생물은 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)이다. 일부 구현예들에서, 숙주는 빵 효모, CBS 7959, CBS 7960, CBS 7961, CBS 7962, CBS 7963, CBS 7964, IZ-1904, TA, BG-1, CR-1, SA-1, M-26, Y-904, PE-2, PE-5, VR-1, BR-1, BR-2, ME-2, VR-2, MA-3, MA-4, CAT-1, CB-1, NR-1, BT-1 및 AL-1으로 이루어진 군으로부터 선택되는 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 균주이다. 일부 구현예들에서, 숙주 미생물은 PE-2, CAT-1, VR-1, BG-1, CR-1 및 SA-1으로 이루어진 군으로부터 선택되는 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 균주이다. 특정 구현예에서, 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 균주는 PE-2이다. 다른 특정 구현예에서, 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 균주는 CAT-1이다. 다른 특정 구현예에서, 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 균주는 BG-1이다.

일부 구현예들에서, 숙주 미생물은 산업 발효에 적합한 미생물이다. 특정 구현예에서, 미생물은, 산업 발효 환경에서 공인된 스트레스 조건인, 용매 고농도, 고온, 확장된 기질 이용성, 영양 제한, 당 및 염으로 인한 삼투 스트레스, 산도, 설파이트 및 박테리아 오염 또는 이들의 조합 하에 존속하도록 조건화된다.

5.2.2 아세틸-CoA를 제조하기 위한 이종의 ADA

일 측면에서, 본 발명은, 아실화 아세트알데하이드 데하이드로게나제 (이명. "아세틸알데하이드 데하이드로게나제, 아세틸화," "아세틸알데하이드 데하이드로게나제, 아실화," 또는 ADA (EC 1.2.1.10))를 코딩하는 하나 이상의 이종의 뉴클레오티드 서열을 포함하는, 아세틸-CoA 유래 이소프레노이드를 제조할 수 있는 유전자 변형된 숙주 세포를 제공한다.

본원에 제공되는 조성물 및 방법에 사용가능한 이 방법을 촉매할 수 있는 단백질은 다음과 같은 4가지 유형의 단백질을 포함한다:

(1) 아세틸-CoA의 아세트알데하이드로의 가역적인 변환과, 후속적인 아세트알데하이드의 에탄올로의 가역적인 변환을 촉매하는, 2가지 기능의 단백질. 이 유형의 단백질의 예는 E. coli의 AdhE 단백질 (Gen Bank No: NP_415757)이다. AdhE는 유전자 융합체의 진화 산물인 것으로 보인다. AdhE 단백질의 NH₂-말단 영역은 알데하이드:NAD⁺ 옥시도리덕타제에 대해 상동성이 높은 반면, COOH-말단 영역은 Fe²⁺-의존성 에탄올:NAD⁺ 옥시도리덕타제 패밀리에 상동적이다 (Membrillo-Hernandez et al., (2000) J. Biol. Chem. 275: 33869-33875). E. coli AdhE는 금속-촉매성 산화를 수행하며, 따라서, 산소에 민감하다 (Tamarit et al. (1998) J. Biol. Chem. 273:3027-32).

(2) 엄격 또는 선택적인 혐기성 미생물에서 아세틸-CoA의 아세트알데하이드로의 가역적인 변환을 촉매하지만, 알코올 데하이드로게나제 활성은 가지지 않는, 단백질. 이 유형의 단백질에 대한 예는 클로스트리듐 클루이베리 (Clostridium kluyveri)에서 보고된 바 있다 (Smith et al. (1980) Arch. Biochem. Biophys. 203: 663-675). ADA는 클로스트리듐 클루이베리 (Clostridium kluyveri) DSM 555의 게놈 (등재번호: EDK33116)에 주석으로 달려 있다. 상보적인 단백질 AcdH는 락토바실러스 플라타룸 (Lactobacillus plantarum)의 게놈에서 확인된다 (등재 번호: NP_784141). 이 유형의 단백질에 대한 다른 예는 클로스트리듐 베이예린키이 (Clostridium beijerinckii) NRRL B593의 ald 유전자 산물이다 (Toth et al. (1999) Appl. Environ. Microbiol. 65: 4973-4980, 등재 번호: AAD31841).

(3) 에탄올아민 이화 작용에 참여하는 단백질. 에탄올아민은 다수의 장내세균들이 탄소원 및 질소원으로 이용할 수 있다 (Stojiljkovic et al. (1995) J. Bacteriol. 177: 1357-1366). 에탄올아민은 먼저 에탄올아민 암모니아 리아제에 의해 암모니아와 아세트알데하이드로 변환된 다음, 아세트알데하이드는 ADA에 의해 아세틸-CoA로 변환된다. 이 유형의 ADA의 예가 살모넬라 티피무리움 (Salmonella typhimurium)의 EutE 단백질이다 (Stojiljkovic et al. (1995) J. Bacteriol. 177: 1357-1366, 등재 번호: AAL21357; U18560.1도 참조함). 또한, E. coli는 에탄올아민을 이용할 수 있으며 (Scarlett et al. (1976) J. Gen. Microbiol. 95:173-176), 살모넬라 티피무리움 (S. typhimurium)의 EutE 단백질과 상동적인 EutE 단백질을 가지고 있다 (등재 번호: AAG57564; U897722.1).

(4) 4-하이드록시-2-케토발레레이트 이화작용에 관여하는 2가지 기능의 알돌라제-데하이드로게나제 복합체의 일부인 단백질. 상기한 2가지 기능의 효소는, 다수 박테리아 종들에서 페놀, 톨레이트, 나프탈렌, 바이페닐 및 그외 방향족 화합물의 분해의 중간산물인, 카테콜의 메타-절단 경로의 마지막 2 단계를 촉매한다 (Powlowski and Shingler (1994) Biodegradation 5, 219-236). 4-하이드록시-2-케토발레레이트는 4-하이드록시-2-케토발레레이트 알돌라제에 의해 먼저 피루베이트와 아세트알데하이드로 변환된 다음, ADA에 의해 아세트알데하이드는 아세틸-CoA로 변환된다. 이 유형의 ADA의 예가 슈도모나스 (Pseudomonas) sp CF600의 DmpF 단백질 (등재 번호: CAA43226)이다 (Shingler et al. (1992) J. Bacteriol. 174:71 1-24). E. coli는 슈도모나스 (Pseudomonas) sp. CF600의 DmpF 단백질에 상동적인 MphF 단백질을 가지고 있다 (Ferrandez et al. (1997) J. Bacteriol. 179: 2573-2581, 등재 번호: NP_414885).

일부 구현예들에서, 본원에 기술된 조성물 및 방법에 사용가능한 ADA (또는 이러한 활성을 코딩하는 핵산 서열)는, 국제 출원 공개번호 WO 2009/013159에 기술된 바와 같이, 에스케리키아 콜라이 (Escherichia coli) adhE, 엔타모에바 히스톨리티카 (Entamoeba histolytica) adh2, 스타필로코커스 아우레우스 (Staphylococcus aureus) adhE, 피로마이세스 (Piromyces) sp.E2 adhE, 클로스트리듐 클루이베리 (Clostridium kluyveri) (EDK33116), 락토바실러스 플라타룸 (Lactobacillus plantarum) acdH 및 슈도모나스 푸티타 (Pseudomonas putida) (YP 001268189)로 이루어진 군으로부터 선택되며, 이들은 그 전체가 원용에 의해 본 명세서에 포함된다. 일부 구현예들에서, ADA는 클로스트리디움 보툴리눔 (Clostridium botulinum) eutE (FR745875.1), 데설포탈리에 피크로필라 ( Desulphotalea psychrophila) eutE (CR522870.1), 액시네토박터 (Acinetobacter) sp. HBS-2 eutE (ABQ44511.2), 칼디트릭스 아비시 (Caldithrix abyssi) eutE (ZP_09549576) 및 할로루브룸 라쿠스프로푼디 (Halorubrum lacusprofundi) ATCC 49239 (YP_002565337.1)로 이루어진 군으로부터 선택된다.

특정 구현예에서, 본원에 제공되는 조성물 및 방법에 사용가능한 ADA는 딕케야 지아 (Dickeya zeae)의 eutE이다. 딕케야 지아 (Dickeya zeae)의 대표적인 eutE 뉴클레오티드 서열은 등재 번호 NC_012912.1:1110476..1111855와 본원에 제시된 서열번호 1을 포함한다. 딕케야 지아 (Dickeya zeae)의 대표적인 eutE 단백질 서열은 등재 번호 YP_003003316 및 본원에 제공된 서열번호 2를 포함한다.

또한, 본원에 제공된 조성물 및 방법에 유용한 ADA는 본원에 기술된 임의의 ADA의 "유도체"로 지칭될 수 있는 분자를 포함한다. 이러한 "유도체"는 다음과 같은 특징을 가진다: (1) 본원에 기술된 임의의 ADA와 상당한 상동성을 고유함, (2) 아세트알데하이드의 아세틸-CoA로의 변환을 촉매할 수 있음. ADA의 유도체는, 이 유도체의 아미노산 서열이 본원에 기술된 임의의 ADA와 80% 이상, 85% 이상, 더 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상 동일하다면, ADA와 "실질적인 상동성"을 공유하는 것으로 지칭된다.

5.2.2.1 기능성 ADA를 동정하는 방법

다른 측면에서, 본 발명은 생체내 성능이 강화된 ADA를 스크리닝하는 방법을 제공한다. 이러한 스크리닝 방법에서, 생체내 성능이 강화된 ADA는 조작된 숙주 세포를 세포 사멸로부터 구제하는 능력으로 동정한다. 조작된 숙주 세포는 세포질 아세틸-CoA 유래 이차 대사산물, 예컨대, 이소프레노이드를 제조하는 이종 경로를 포함한다. 일부 구현예들에서, 조작된 숙주 세포는 기능적으로 파괴된 PDH-바이패스 경로와 활성이 약한 ADA를 추가로 포함하며, 여기서 기능적으로 파괴된 PDH-바이패스 경로와 활성이 약한 ADA의 조합 작용은, (1) 세포질 아세틸-CoA 유래 이차 대사산물; 및 (2) 세포 생존, 건강 및/또는 생육에 필요한 세포질 아세틸-CoA 유래 일차 대사산물의 생산 요구성을 충족시킬 만큼 충분히 세포질 아세틸-CoA를 제조하지 못한다. 생존, 건강 및/또는 생육을 위해, 따라서, 숙주 세포는 세포질 아세틸-CoA를 증가된 풀로 제조할 수 있는 활성형 ADA를 필요로 한다.

일부 구현예들에서, 생체내 성능이 강화된 ADA의 스크리닝 방법은,

(a) 세포질 아세틸-CoA 유래 이차 대사산물을 증가된 수준으로 제조하도록 기능적으로 파괴된 PDH-바이패스 경로를 가진 숙주 세포에서 대조군 ADA를 발현시키는 단계로서, 상기 세포질 아세틸-CoA 유래 이차 대사산물이 증가된 수준으로 제조되면 상기 세포질 아세틸-CoA 유래 이차 대사산물이 증가된 수준으로 제조하지 않는 부모 세포에 비해, 상기 숙주 세포의 생존성 (viability)이 감소되는 것인 단계; 및

(b) 상기 대조군 ADA 대신 테스트 ADA를 상기 숙주 세포에서 발현시키는 단계로서, 이로써 상기 대조군 ADA를 발현하는 상기 숙주 세포에 비해 상기 ADA를 발현하는 상기 숙주 세포의 생존성 증가가, 상기 대조군 ADA에 비해 증가된 생체내 성능을 가지는 것으로서 상기 테스트 ADA를 식별하는 단계를 포함한다.

일부 구현예들에서, 숙주 세포에서 세포질 아세틸-CoA 유래 이차 대사산물의 수준은 유도 가능하다. 유도는 유도제 (예, 갈락토스) 또는 특이 배양 조건 (예, 배양 온도)에 반응하여 이루어질 수 있다. 유도제가 존재하지 않는 조건에서 배양하면, 숙주 세포의 ADA 활성은 숙주 세포가 생존하는데 필요한 세포질 아세틸-CoA을 생산하는데 충분하다. 그러나, 유도제의 존재 하에 배양하면, 숙주 세포의 ADA 활성은 숙주 세포가 생존하는데 필요한 세포질 아세틸-CoA와 증가된 수준의 세포질 아세틸-CoA로부터 유래된 이차 대사산물을 둘다 생산하기에는 충분하지 않다. 후자의 경우, 숙주 세포는 세포질 아세틸-CoA를 증가된 풀로서 생산할 수 있는 더 강한 활성을 가진 ADA가 생존을 위해 필요로 한다. 숙주 세포에서 세포질 아세틸-CoA 유래 이차 대사산물의 생산은 부모 세포에서의 세포질 아세틸-CoA 유래 이차 대사산물의 생산에 대해 약 10% 내지 적어도 약 1,000배, 또는 그 보다 높을 수 있다.

부모 세포와 비교하여, 대조군 ADA를 발현하는 숙주 세포의 생존성 감소는 세포 증식 감소 내지 치사 수준일 수 있다. 즉, 일부 구현예에서, 대조군 ADA를 발현하는 숙주 세포는 부모 세포에 비해 액체 배지 또는 아가 플레이트에서 후손 세포를 수적으로 감소된 수로 생산한다. 다른 구현예들에서, 대조군 ADA를 발현하는 숙주 세포는 부모 세포에 비해 액체 배지 또는 아가 플레이트에서 후손 세포를 생산하지 않는다. 즉, 대조군 ADA 대신 테스트 ADA를 발현하는 숙주 세포의 생존성 증가는, 대조군 ADA를 발현하는 숙주 세포에 의해 생산되는 후손 세포의 수 또는 콜로니 크기와 비교하여, 더 많은 수의 후손 세포로 액체 배지에서, 또는 보다 큰 콜로니 크기로 아가 플레이트에서 명백할 수 있다.

숙주 세포에서 세포질 아세틸-CoA 유래 이차 대사산물 또는 이의 전구체의 생산에 관여하는 효소의 발현 및/또는 활성의 변형을 통해, 숙주 세포에서 세포질 아세틸-CoA로부터 유래되는 증가된 수준의 이차 대사산물의 생산에 영향을 가할 수 있다. 일부 이러한 구현예들에서, MEV 또는 DXP 경로의 효소의 발현 및/또는 활성을 변형시킨다. 일부 이러한 구현예들에서, HMG-CoA 리덕타제 및/또는 메발로네이트 키나제의 발현 및/또는 활성을 변형시킨다.

대조군 ADA 및 테스트 ADA는 천연성 ADA 또는 비-천연성 ADA일 수 있다. 일부 구현예들에서, 테스트 ADA는, 대조군 ADA와 하나 이상의 아미노산의 치환, 결손 및/또는 부가 차이가 있는, 대조군 ADA의 변이체이다. 일부 구현예들에서, 테스트 ADA는 대조군 ADA와 동일한 아미노산을 포함하지만, 이들 아미노산을 코딩하는 코돈들이 테스트 ADA와 대조군 ADA 간에 상이하다. 일부 이러한 구현예들에서, 코돈은 숙주 세포에서의 사용 (usage)을 최적화한다. 일부 구현예들에서, 대조군 ADA ?/또는 테스트 ADA는 피루베이트 데카르복실라제에 융합된다. 일부 구현예들에서, 테스트 ADA의 발현은 강력한 프로모터의 조절성 통제를 받는다. 일부 구현예들에서, 테스트 ADA의 발현은 중간 세기의 프로모터의 조절성 통제를 받는다. 일부 구현예들에서, 테스트 ADA의 발현은 약한 프로모터의 조절성 통제를 받는다.

테스트 ADA의 존재 하에 숙주 세포의 생존성 증가는 대조군 보다 활성이 강한 테스트 ADA 또는 대조군 ADA와 활성이 비슷하거나 낮지만 보다 많이 발현되는 테스트 ADA에 의해 달성될 수 있다. 활성이 증가된 테스트 ADA의 동정은 숙주 세포에서 비슷한 수준으로 대조군 ADA와 테스트 ADA를 발현시킴으로써 달성할 수 있다. 이는, 예를 들어, 동일한 조절 인자들의 통제를 받도록 숙주 세포에서 대조군 ADA와 테스트 ADA를 코딩하는 뉴클레오티드 서열을 위치시킴으로써, 달성할 수 있다. 상기한 방법이, 예를 들어, 원하는 발현 수준을 제공하는 조절 인자 (예, 프로모터)를 동정하기 위해 사용되는, 다른 구현예들에서, 테스트 ADA는 뉴클레오티드 또는 아미노산 서열 상으로는 대조군 ADA와 차이가 없지만 발현 수준에는 차이가 있다. 이러한 구현예들에서, 대조군 ADA와 테스트 ADA를 발현하기 위해 다른 조절 인자들을 사용할 수 있으며, 숙주 세포의 생존성 비교를 통해 테스트 ADA의 활성에 대한 정보는 제공하지 않지만, 테스트 ADA의 발현을 구동하는 조절 인자들의 세기에 대한 정보는 제공할 수 있다.

개선된 ADA 변이체라기 보다는 증식 촉진 돌연변이를 포함하는 빠른 증식성 위 양성 숙주 세포가 숙주 세포 배양물이 되는 경쟁적인 배양 상황을 방지하기 위해, 스크리닝 방법에 대한 일 구현예는 아가-플레이트를 이용한 선별 시스템을 포함한다. 이러한 구현예에서, 숙주 세포를 아가 플레이트 상에 도말하고, 생체내 성능이 향상된 테스트 ADA 변이체를 포함하는 숙주 세포를 콜로니 증식에 의해 동정한다.

본원에 기술된 스크리닝 방법의 실질적인 이점은 단순성과 높은 효율의 구현력이다. ADA 변이체는 단순히 세포 생존성으로 동정하므로, 다른 비용이 많이 들고 시간이 소요되는 스크리닝 방법들이 실제 필요없다. 즉, 일 구현예에서, 본 방법은 생체내 성능이 개선된 ADA 변이체들에 대해 ADA 변이체 콜렉션 (예, 돌연변이 ADA 라이브러리)을 스크리닝하는데 사용된다. 이러한 구현예에서, 숙주 세포는 단일한 테스트 ADA를 발현하진 않지만, 숙주 세포의 콜렉션은 테스트 ADA의 콜렉션을 발현한다. 숙주 세포를 이 후 아가 플레이트에서 배양할 수 있으며, 생체내 성능이 개선된 ADA 변이체를 발현하는 숙주 세포를 콜로닝 배양을 토대로 동정할 수 있다. 일부 구현예들에서, ADA 변이체 콜렉션은 ADA 변이체를 2 - 5, 5 - 10, 10 - 50, 50 - 100, 100 - 500, 500 - 1,000, 1,000 - 10,000, 10,000 - 100,000, 100,000 - 1,000,000개로, 그리고 더 많은 수로 포함한다.

본원에 기술된 스크리닝 방법의 다른 주요 이점인, 반복적인 양상으로 보다 우수한 ADA 변이체를 선별하는 이의 지속적인 역량으로서, 여기서, 반복을 통해 동정된 테스트 ADA는 이후의 반복에서는 대조군 ADA로서 사용된다. 이러한 구현예는, 그러나, 각 반복에서, 숙주 세포에서 세포질 아세틸-CoA 유래 이차 대사산물의 생산을 체크하고, 숙주 세포가 새로운 대조군 ADA (즉, 이전의 반복에서의 테스트 ADA임)를 발현하는 경우, (예컨대, 효소의 발현 수준을 높이거나 낮춤으로써, 효소를 부가 또는 제거함으로써, 유전자의 카피 수를 높이거나 낮춤으로써, 효소의 발현을 조절하는 프로모터를 치환함으로써, 또는 유전자 돌연변이에 의해 효소를 변형시킴으로써), 생존성 감소를 유발하는 수준으로 잠재적으로 증가시킨다. 다른 예로, 또는 아울러, 각 반복에서, 감소된 대조군 ADA 활성을 제공하기 위해 (예, 발현을 낮추거나, 더 약한 프로모터를 사용하거나, 또는 대조군 ADA 전사체 또는 폴리펩타이드의 안정성을 낮춤으로써) 대조군 ADA의 발현을 감소시킬 수 있다. 다음번 반복에서, 이전 반복의 테스트 ADA와 비교하여 생체내 성능이 증가된 테스트 ADA를 동정할 수 있다.

본원에 기술된 스크리닝 방법의 다른 주된 이점은 시험관내 보다는 생체내에서 개선된 ADA의 선별이 이루어진다는 것이다. 그 결과, ADA 변이체의 생체내 성능을 강화하는 복수의 효소 특성들에 대한 개선을 수득할 수 있다.

본원에 기술된 스크리닝 방법을 이용하여 개발된 효소는, 비제한적인 예로, 형광 스크린 및/또는 기체 크로마토그래피에 의한 세포질 아세틸-CoA 유래 이차 대사산물의 직접 정량화 등의, 다른 선택적인 스크리닝 방법으로 수행할 수 있다. 보다 구체적으로, 이는 파르네센 등의 세스퀴테르펜 생산을 측정하기 위한 나일 레드-기반의 고효율의 형광 분석, 및 피르네센 등의 세스퀴테르펜의 역가를 측정하기 위한 기체 크로마토그래피 (GC)를 이용한 직접 정량화를 포함한다. 또한, 개선된 효소는 유도성 돌연변이 등의 유전자 조작 방법으로 추가로 개선시킬 수 있다. 이로써, 최종 효소 성능을 강화하는 효소의 여러 특성들을 순차적으로 개선시킴으로써, 가장 효과적인 효소 변이체를 동정한다.

5.2.3 PDH-바이패스의 기능적 파괴

아세틸-CoA는 PDH 복합체에 의해 촉매되는 피루베이트의 산화적 데카르복시화에 의해 미토콘드리아에서 형성될 수 있다. 그러나, 사카로마이세스 세레비지애 (S. cerevisiae)가 미토콘드리아 밖으로 아세틸-CoA를 이동시키지 못하기 때문에, PDH 바이패스는 세포질 구획에 아세틸-CoA를 제공하는데 필수적인 역할을 하며, 피루베이트를 아세틸-CoA로 변환하는 PDH 반응에 대한 대안 경로를 제공한다. PDH 바이패스에는, 효소 피루베이트 데카르복실라제 (PDC; EC 4.1.1.1), 아세트알데하이드 데하이드로게나제 (ACDH; EC 1.2.1.5 및 EC 1.2.1.4), 및 아세틸-CoA 신테타제 (ACS; EC 6.2.1.1)가 참여한다. 피루베이트 데카르복실라제는 피루베이트의 아세트알데하이드와 이산화탄소로의 데카르복시화를 촉매한다. 아세트알데하이드 데하이드로게나제는 아세트알데하이드를 아세트산으로 산화한다. 사카로마이세스 세레비지애 (S. cerevisiae)에서, 알데하이드 데하이드로게나제 패밀리는 5종의 멤버를 포함한다. ALD2 (YMR170c), ALD3 (YMR169c) 및 ALD6 (YPL061w)는 세포질 이소형이며, ALD4 (YOR374w) 및 ALD5 (YER073w)는 미토콘드리아 효소를 코딩한다. 주요 세포질 아세트알데하이드 데하이드로게나제 이소형은 ALD6에 의해 코딩된다. 아세테이트로부터 아세틸-CoA의 형성은 ACS에 의해 촉매되며, ATP의 가수분해를 수반한다. 2종의 구조 유전자 ACS1과 ACS2에 의해 ACS가 코딩된다.

일부 구현예들에서, 유전자 변형된 숙주 세포는 PDH-바이패스 경로의 하나 이상의 유전자에 대한 기능적 파괴를 포함한다. 일부 구현예들에서, 숙주 세포의 PDH-바이패스의 하나 이상의 유전자에 대한 파괴로, 다음과 같은 한가지 이상의 반응을 촉매하는 능력이 손상된 유전자 변형된 미생물 세포가 만들어진다: (1) 피루베이트 데카르복실라제에 의한 피루베이트의 아세트알데하이드로의 데카르복시화; (2) 아세트알데하이드 데하이드로게나제에 의한 아세트알데하이드의 아세테이트로의 변환; 및 (3) 아세틸-CoA 신테타제에 의한 아세테이트 및 CoA로부터 아세틸-CoA의 합성.

일부 구현예들에서, 부모 세포와 비교하여, 숙주 세포는 PDH-바이패스 경로의 하나 이상의 유전자에 대한 기능적 파괴를 포함하며, 여기서, 감소된-기능적 또는 비-기능적 PDH-바이패스 경로의 활성은 단독으로 또는 약한 ADA와의 조합시, 숙주 세포의 증식, 생존성 및/또는 건강을 뒷받침하는데 충분하지 않다.

일부 구현예들에서, PDH-바이패스의 하나 이상의 내인성 단백질의 활성 또는 발현은 약 50% 이상까지 감소된다. 다른 구현예에서, PDH-바이패스의 하나 이상의 내인성 단백질의 활성 또는 발현은, PDH-바이패스의 하나 이상의 내인성 단백질의 활성 또는 발현에 대한 감소 또는 결손을 포함하지 않는 재조합 미생물에 비해, 약 60% 이상까지, 약 65% 이상까지, 약 70% 이상까지, 약 75% 이상까지, 약 80% 이상까지, 약 85% 이상까지, 약 90% 이상까지, 약 95% 이상까지, 또는 약 99% 이상까지 감소된다.

당해 기술 분야의 당업자가 숙지하는 바와 같이, PDH-바이패스의 단백질 등의 단백질의 활성을 감소 또는 파괴하는데 유용한 수 종의 기전들, 비제한적인 예로, 조절된 프로모터의 사용, 약한 구성적인 프로모터의 사용, 이배체 효모에서 단백질을 코딩하는 유전자 2 카피 중 한개 파괴, 이배체 효모에서 유전자 카피 모두의 파괴, 안티센스 핵산의 발현, siRNA의 발현, 내인성 프로모터의 네거티브 조절인자의 과다 발현, 내인성 또는 이종 유전자의 활성 변형, 비활성이 낮은 이종 유전자의 사용 등 또는 이들의 조합들이 존재한다.

일부 구현예들에서, 유전자 변형된 숙주 세포는 PDH-바이패스의 단백질을 코딩하는 하나 이상의 유전자에 대한 돌연변이를 포함하며, 상기 유전자에 의해 코딩되는 폴리펩타이드는 활성이 저하된다. 다른 구현예에서, 유전자 변형된 숙주 세포는 PDH-바이패스의 단백질을 코딩하는 유전자의 일부 파괴를 포함하며, 상기 유전자에 의해 코딩되는 폴리펩타이드는 활성이 저하된다. 다른 구현예에서, 유전자 변형된 숙주 세포는 PDH-바이패스 단백질을 코딩하는 유전자의 전체 결손을 포함하며, 상기 유전자에 의해 코딩되는 폴리펩타이드는 활성이 저하된다. 또 다른 구현예로, 유전자 변형된 숙주 세포는 PDH-바이패스의 단백질을 코딩하는 유전자와 관련된 조절 영역의 변형을 포함하며, 상기 유전자에 의해 코딩되는 폴리펩타이드는 발현이 저하된다. 또 다른 구현예로, 유전자 변형된 숙주 세포는, PDH-바이패스의 단백질을 코딩하는 유전자의 전사 감소를 야기하는, 전사 조절인자의 변형을 포함한다. 또 다른 구현예로, 유전자 변형된 숙주 세포는, PDH-바이패스의 단백질을 코딩하는 모든 유전자들에 대한 돌연변이를 포함하며, 이로써, 상기 유전자에 의해 코딩되는 폴리펩타이드(들)의 활성이 감소된다. 일 구현예에서, PDH-바이패스의 단백질의 활성 또는 발현이 약 50% 이상 감소된다. 다른 구현예에서, PDH-바이패스의 단백질의 활성 또는 발현이, PDH-바이패스의 단백질의 활성 또는 발현 감소를 포함하지 않는 재조합 미생물과 비교하여, 약 60% 이상, 약 65% 이상, 약 70% 이상, 약 75% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 약 95% 이상, 또는 약 99% 이상 감소된다.

일부 구현예들에서, PDH-바이패스의 하나 이상의 유전자 파괴는, 미생물 세포에 구조체를 도입하였을 때 PDH-바이패스의 유전자를 특이적으로 파괴함으로써 파괴된 유전자에 비-기능성을 부여할 수 있는, "파괴 구조체"를 이용함으로써 달성된다. 일부 구현예들에서, 타겟 유전자의 파괴는 기능성 단백질의 발현을 방지한다. 일부 구현예들에서, 타겟 유전자의 파괴로 파괴된 유전자로부터 비-기능성의 단백질이 발현된다. 일부 구현예들에서, PDH-바이패스의 유전자 파괴는, 타겟 유전자 좌내 "파괴 유전자"를 상동적인 재조합에 의해 도입함으로써 달성된다. 이러한 구현예들에서, 상기 파괴 구조체는 타겟 유전자 좌 (상동 서열)의 한쌍의 뉴클레오티드 서열과 상동적인 한쌍의 뉴클레오티드 서열이 측면에 위치한 파괴 서열을 포함한다. 타겟 유전자의 타겟 부위가 파괴 구조체로 치환되면, 파괴 서열은 기능성 단백질의 발현을 방지하거나, 또는 타겟 유전자로부터 비-기능성 단백질이 발현되게 한다.

PDH-바이패스의 유전자를 파괴할 수 있는 파괴 구조체는 당해 기술 분야에 잘 알려져 있는 표준 분자생물 기법을 이용하여 구축할 수 있다. 예로, ambrook et al., 2001, Molecular Cloning -- A Laboratory Manual, 3^rd edition, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY, 및 Ausubel et al., eds., Current Edition, Current Protocols in Molecular Biology, Greene Publishing Associates and Wiley Interscience, NY을 참조한다. 본 발명의 방법의 실시에서 다변화될 수 있는 파괴 구조체에 대한 파라미터로는, 비제한적인 예로, 상동적인 서열의 길이; 상동적인 서열의 뉴클레오티드 서열; 파괴 서열의 길이; 파괴 서열의 뉴클레오티드 서열; 및 타겟 유전자의 뉴클레오티드 서열을 포함한다. 일부 구현예들에서, 각 상동적인 서열의 길이에 대한 유효 범위는 50 - 5,000 bp (base pair)을 포함한다. 특정 구현예에서, 각 상동적인 서열의 길이는 약 500 bp이다. 유전자 타겟팅에 필요한 상동체 길이에 대한 내용으로 Hasty et al., Mol Cell Biol 11:5586-91 (1991)을 참조한다. 일부 구현예들에서, 상동적인 서열은 타겟 서열의 코딩 서열을 포함한다. 다른 구현예들에서, 상동적인 서열은 타겟 유전자의 상류 또는 하류 서열을 포함한다. 일부 구현예들에서, 하나의 상동적인 서열은 타겟 유전자의 코딩 서열의 5'에 위치한 뉴클레오티드 서열에 상동적이며, 다른 상동적인 서열은 타겟 유전자의 코딩 서열의 3'에 위치한 뉴클레오티드 서열에 상동적이다. 일부 구현예들에서, 파괴 서열은 파괴 서열을 포함하는 미생물을 선별할 수 있는 선별 마커를 코딩하는 뉴클레오티드 서열을 포함한다. 즉, 이러한 구현예들에서, 파괴 구조체는 듀얼 기능, 즉, 타겟 유전자를 기능적으로 파괴하는 기능과 타겟 유전자가 기능적으로 파괴된 세포를 동정하기 위한 선별 마커를 제공하는 기능을 제공한다. 일부 구현예들에서, 종결 코돈 (termination codon)은, 타겟 유전자에 코딩된 야생형 단백질의 활성을 약간 가지는 융합 단백질을 만들 수 있는, 번역 리드-스로우 (translational read-through)를 예방하기 위해, 선별 마커를 코딩하는 뉴클레오티드 서열과 인-프레임으로, 그리고 하류에 위치된다. 일부 구현예들에서, 파괴 서열의 길이는 1 bp이다. 1 bp의 삽입은, 코딩 서열에 1 bp의 삽입이 기능성 단백질의 발현을 예방할 수 있는 프레임 쉬프트 돌연변이를 만들 수 있기 때문에, 타겟 유전자를 파괴하는데 충분할 수 있다. 일부 구현예들에서, 파괴 서열의 서열은 상동적인 서열들 사이에 위치한 타겟 유전자의 뉴클레오티드 서열과 1 bp 차이를 가진다. 타겟 유전자내 뉴클레오티드 서열을 파괴 서열로 치환하면, 도입되는 1 bp 치환으로 단백질의 주요부에 하나의 아미노산 치환과 비-기능성 단백질의 발현이 이루어질 수 있다. 그러나, 매우 짧은 파괴 서열을 이용하여 수행되는 파괴는 자연적인 돌연변이를 통해 야생형 서열로 복구되기 쉬워, 숙주 균주에서 PDH-바이패스가 기능적으로 복원됨을, 인지하여야 한다. 즉, 특정 구현예에서, 파괴 서열은 1 - 수개 bp 보다 길다. 다른 극단적인 예로, 과도하게 긴 길이의 파괴 서열은 보통 길이의 파괴 서열에 비해 임의의 이점을 부여하기 어려울 것이며, 형질감염 또는 타겟팅 효과가 사라질 수도 있다. 이 문맥에서, 과도하게 긴 길이는 타겟 유전자에서 선정된 상동적인 서열들 간의 거리 보다 수배 더 길다. 즉, 특정 구현예들에서, 파괴 서열의 길이는 2 - 2,000 bp일 수 있다. 다른 구현예들에서, 파괴 서열의 길이는, 파괴 구조체내 상동적인 서열들에 부합되는 타겟 유전자 좌의 영역들 사이의 간격과 대략 동일한 길이이다.

일부 구현예들에서, 파괴 구조체는 선형 DNA 분자이다. 다른 구현예들에서, 파괴 구조체는 원형 DNA 분자이다. 일부 구현예들에서, 원형의 파괴 구조체는 전술한 바와 같이 파괴 서열에 의해 분리되어 있는 한쌍의 상동적인 서열을 포함한다. 일부 구현예들에서, 원형의 파괴 구조체는 하나의 상동적인 서열을 포함한다. 이러한 원형의 파괴 구조체는, 타겟 유전자 좌로의 도입시, 선형화될 것이며, 각 말단에 상동적인 서열 부분이 위치되고, 파괴 구조체의 나머지 세그먼트들은 어떠한 타겟 유전자 뉴클레오티드 서열을 치환하지 않고도 타겟 유전자에 삽입되어 이를 파괴한다. 특정 구현예에서, 원형의 파괴 구조체의 단일한 상동적인 서열은 타겟 유전자의 코딩 서열내에 위치한 서열과 상동적이다.

파괴 구조체는 비제한적인 예로 당해 기술 분야의 당업자들에게 공지된 임의 방법으로 미생물 세포에 도입할 수 있다. 이러한 방법으로는, 비제한적으로, 세포에 의한 용액으로부터의 분자의 직접 흡수, 또는 예를 들어 리포좀 또는 이뮤노리포좀을 이용한 리포펙션을 통한 촉매화된 흡수; 입자 매개 형질감염 등을 포함한다. 예로, 미국 특허 5,272,065; Goeddel et al., eds, 1990, Methods in Enzymology, vol. 185, Academic Press, Inc., CA; Krieger, 1990, Gene Transfer and Expression -- A Laboratory Manual, Stockton Press, NY; Sambrook et al., 1989, Molecular Cloning -- A Laboratory Manual, Cold Spring Harbor Laboratory, NY; 및 Ausubel et al., eds., Current Edition, Current Protocols in Molecular Biology, Greene Publishing Associates and Wiley Interscience, NY를 참조한다. 효소 세포를 형질전환하는 구체적인 방법들은 당해 기술 분야에 잘 공지되어 있다. Hinnen et al., Proc. Natl. Acad. Sci. USA 75:1292-3 (1978); Cregg et al., Mol. Cell. Biol. 5:3376-3385 (1985)를 참조한다. 기법의 예로는, 비제한적으로, 스페로플라스팅 (spheroplasting), 전기충격 (electroporation), PEG 1000 매개 형질전환 및 리튬 아세테이트 또는 리튬 클로라이드 매개의 형질전환을 포함한다.

5.2.3.1 ALD4 및 ALD6

일부 구현예들에서, 알데하이드 데하이드로게나제 (ACDH) 활성을 코딩하는 하나 이상의 유전자가 숙주 세포에서 기능적으로 파괴된다. 일부 구현예들에서, 알데하이드 데하이드로게나제는 ALD2, ALD3, ALD4, ALD5, ALD6 및 상동체로 이루어진 군으로부터 선택되는 유전자, 및 이들의 변이체에 의해 코딩된다.

일부 구현예들에서, 유전자 변형된 숙주 세포는 ALD4의 기능적 파괴를 포함한다. 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)의 대표적인 ALD4 뉴클레오티드 서열은 등재번호 NM_001183794 및 본원에 제시된 서열번호 7을 포함한다. 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)의 대표적인 Ald4 단백질 서열은 등재번호 NP_015019.1 및 본원에 제시된 서열번호 8을 포함한다.

일부 구현예들에서, 유전자 변형된 숙주 세포는 세포질 알데하이드 데하이드로게나제 (ALD6)의 기능적 파괴를 포함한다. Ald6p는 천연적인 PDH-바이패스에서 아세트알데하이드를 아세테이트로 변환하는 기능을 한다. 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)의 대표적인 ALD6 뉴클레오티드 서열은 등재번호 SCU56604 및 본원에 제시된 서열번호 9를 포함한다. 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)의 대표적인 Ald6 단백질 서열은 등재번호 AAB01219 및 본원에 제시된 서열번호 10을 포함한다.

당해 기술 분야에서 이해되는 바와 같이, 사카로마이세스 세레비지애 (S. cerevisiae) 이외의 효소에서 알데하이드 데하이드로게나제에 대한 천연 상동체는 본원에 기술된 방법을 이용하여 유사하게 불활화할 수 있다.

당해 기술 분야의 당업자가 이해하는 바와 같이, 2 이상의 알데하이드 데하이드로게나제의 활성 또는 발현이 감소 또는 없어질 수 있다. 일 특정 구현예에서, ALD4 및 ALD6, 또는 이의 상동체 또는 변이체의 활성 또는 발현이 감소 또는 소실된다. 다른 특정 구현예에서, ALD5 및 ALD6, 또는 이의 상동체 또는 변이체의 활성 또는 발현이 감소 또는 소실된다. 또 다른 특정 구현예에서, ALD4, ALD5 및 ALD6, 또는 이의 상동체 또는 변이체의 활성 또는 발현이 감소 또는 소실된다.

또 다른 특정 구현예에서, 세포질에 위치한 알데하이드 데하이드로게나제, ALD2, ALD3 및 ALD6, 또는 이들의 상동체 또는 변치에의 활성 또는 발현이, 감소 또는 소실된다. 또 다른 특정 구현예에서, 미토콘드리아에 위치한 알데하이드 데하이드로게나제, ALD4 및 ALD5, 또는 이들의 상동체 또는 변치에의 활성 또는 발현이, 감소 또는 소실된다.

5.2.3.2 ACS1 및 ACS2

일부 구현예들에서, 아세틸-CoA 신타제 (ACS) 활성을 코딩하는 하나 이상의 유전자가 숙주 세포에서 기능적으로 파괴된다. 일부 구현예들에서, 아세틸-CoA 신타제는 ACS1, ACS2 및 상동체로 이루어진 군으로부터 선택되는 유전자, 및 이들의 변이체에 의해 코딩된다.

일부 구현예들에서, 아세틸-CoA 신타제 (ACS) 활성을 코딩하는 하나 이상의 유전자가 숙주 세포에서 기능적으로 파괴된다. ACS1과 ACS2는, 둘다, 아세테이트를 아세틸-CoA로 변환할 수 있는, 아세틸-CoA 신타제이다. ACS1은 호흡 조건 (respiratory condition)에서만 발현되는 반면, ACS2는 구성적으로 발현된다. ACS3가 낫 아웃되면, 균주는 호흡 조건 (예, 에탄올, 글리세롤, 또는 아세테이트 매질)에서 증식할 수 있지만, 발효가능한 탄소원 (예, 슈크로스, 글루코스)에서는 사멸한다.

일부 구현예들에서, 유전자 변형된 숙주 세포는 ACS1의 기능적인 파괴를 포함한다. 사카로마이세스 세레비지애 (S. cerevisiae)의 ACS1 유전자 서열은 기존에 공지되었다. 예로, Nagasu et al., Gene 37 (1-3):247-253 (1985)을 참조한다. 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)의 대표적인 ACS1 뉴클레오티드 서열은 등재번호 X66425와 본원에 제시된 서열번호 3을 포함한다. 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)의 대표적인 Acs1 단백질 서열은 등재번호 AAC04979와 본원에 제시된 서열번호 4를 포함한다.

일부 구현예들에서, 유전자 변형된 숙주 세포는 ACS2의 기능적인 파괴를 포함한다. 사카로마이세스 세레비지애 (S. cerevisiae)의 ACS2 유전자 서열은 기존에 공지된 바 있다. 예로, Van den Berg et al., Eur. J. Biochem. 231(3):704-713 (1995)을 참조한다. 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)의 대표적인 ACS2 뉴클레오티드 서열은 등재번호 S79456과 본원에 제시된 서열번호 5를 포함한다. 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)의 대표적인 Acs2 단백질 서열은 등재번호 CAA97725와 본원에 제시된 서열번호 6을 포함한다.

당해 기술 분야에서 이해되는 바와 같이, 사카로마이세스 세레비지애 (S. cerevisiae) 이외의 효소에서 아세틸-CoA 신타제에 대한 천연 상동체는 본원에 기술된 방법을 이용하여 유사하게 불활화할 수 있다.

일부 구현예들에서, 숙주 세포는 호흡 조건에서 (즉, 숙주 세포를 예컨대 에탄올, 글리세롤 또는 아세테이트의 존재 하에 배양하였을 때) 아세테이트를 아세틸-CoA로 변환할 수 있는, 세포질 아세틸-coA 신타제 활성을 포함한다. 일부 이러한 구현예에서, 숙주 세포는 ACS1 활성을 포함하는 효모 세포이다. 다른 구현예들에서, 숙주 세포는, 부모 세포와 비교하여, 호흡 조건에서 내인성 아세틸-CoA 신타제 활성을 포함하지 않거나, 감소된다. 이러한 일부 구현예들에서, 숙주 세포는, 부모 세포와 비교하여, ACS1 활성이 없거나 감소된, 효소 세포이다.

일부 구현예들에서, 숙주 세포는 무-호흡 조건에서 (즉, 숙주 세포를 발효가능한 탄소원 (예, 슈크로스, 글루코스)의 존재 하에 배양하였을 때) 아세테이트를 아세틸-CoA로 변환할 수 있는, 세포질 아세틸-coA 신타제 활성을 포함한다. 일부 이러한 구현예들에서, 숙주 세포는 ACS2 활성을 포함하는 효모 세포이다. 다른 구현예들에서, 숙주 세포는, 부모 세포와 비교하여, 무-호흡 조건에서는 내인성 아세틸-CoA 신타제 활성이 없거나 감소된다. 일부 이러한 구현예들에서, 숙주 세포는, 부모 세포와 비교하여, ACS2 활성이 없거나 감소된, 효모 세포이다.

5.2.4 포스포케톨라제 (PK) 및 포스포트랜프아세틸라제 (PTA)

효모에서, 아세틸-CoA는 당분해 반응, 트리카르복시산 (TCA) 사이클, 산화적 인산화 및 피루베이트 대사를 통해 글루코스로부터 생합성된다. 그러나, 이러한 생합성 경로에서, 피루베이트 카르복실라제에 의한 피루베이트 대사 과정, 피루베이트 데하이드로게나제 및 이소사이트레이트 데하이드로게나제에 의한 TCA 사이클에서 CO₂가 소모된다. 산업 발효 현장에서, 저 당분해를 통한 흐름을 줄이는 한가지 이점은, 피루베이트를 아세트알데하이드로 변환하는 중에 CO₂가 적게 생산되며, 따라서 최대 이론 수율이 증가된다는 것이다. 2번째 이점은 NADH가 적게 생산되어, 이를 재산화하는데 필요한 산소가 현저하게 적게 필요하다는 것이다. 탄소 원자의 감소는 이론적으로는 TCA 사이클을 바이패스함으로써 피할 수 있다. 이는, 포스포케톨라제 (PK) (효소 클래스 EC 4.1.2.9, EC 4.1.2.22)를 포스포아세틸트랜스퍼라제 (PTA) (EC 2.3.1.8)와 조합 사용함으로써 달성할 수 있다.

PK와 PTA는 프럭토스-6-포스페이트 (F6P) 또는 자일룰로스-5-포스페이트 (X5P)를 아세틸-CoA로 변환하는 반응을 촉매한다 (도 7). PK는 펜토스 포스페이트 중간산물인 자일룰로스 5-포스페이트로부터, 또는 당분해 중간산물인 D-프럭토스 6-포스페이트 (F6P)로부터 나오며; PK는 X5P를 글리세르알데하이드 3-포스페이트 (G3P)와 아세틸 포스페이트로, 또는 F6P를 에리트로스 4-포스페이트 (E4P)로 분할한다. 그런 후, PTA는 아세틸 포스페이트를 아세틸-CoA로 변환한다. G3P는 저 당분해 과정에 재투입될 수 있으며, E4P는 펜토스 포스페이트 경로 또는 당분해 반응에 트랜스알돌라제 및 트랜스케톨라제의 비-산화적인 펜토스 포스페이트 경로를 통한 사이클링에 의해 재진입할 수 있다.

일부 구현예들에서, 본원에 제공되는 유전자 변형된 숙주 세포는 포스포케톨라제를 코딩하는 이종의 뉴클레오티드 서열을 포함한다. 일부 구현예들에서, 포스포케톨라제는 루코노스톡 메센테로이데스 (Leuconostoc mesenteroides)로부터 유래된다 (Lee et al., Biotechnol Lett. 27(12);853-858 (2005). 루코노스톡 메센테로이데스 (Leuconostoc mesenteroides)의 대표적인 포스포케톨라제 뉴클레오티드 서열로는 등재번호 AY804190와 본원에 제시된 서열번호 11을 포함한다. 루코노스톡 메센테로이데스 (Leuconostoc mesenteroides)의 대표적인 포스포케톨라제 단백질 서열은 등재번호 YP_819405, AAV66077.1 및 본원에 제시된 서열번호 12를 포함한다. 다른 사용가능한 포스포케톨라제로는, 비제한적으로, 비피도박테리움 덴티움 (Bifidobacterium dentium) ATCC 27678 (ABIX02000002.1:2350400..2352877; EDT46356.1); 비피도박테리움 애니말리스 (Bifidobacterium animalis) (NC_017834.1:1127580..1130057; YP_006280131.1); 및 비피도박테리움 슈돌롱검 (Bifidobacterium pseudolongum) (AY518216.1:988..3465; AAR98788.1)로부터 유래된 것을 포함한다.

또한, 본원에 제시된 조성물 방법에 사용가능한 포스포케톨라제로는, 본원에 기술된 임의의 포스포케톨라제의 유도체로 지칭되는 분자를 포함한다. 이러한 "유도체"는 다음과 같은 특징을 가진다: (1) 이는 본원에 기술된 임의의 포스포케톨라제과 상당한 상동성을 공유함; 및 (2) X5P를 글리세르알데하이드 3-포스페이트 (G3P)와 아세틸 포스페이트로 변환하거나; 또는 F6P를 에리트로스 4-포스페이트 (E4P)로 변환하는 과정을 촉매할 수 있음. 포스포케톨라제의 유도체는, 유도체의 아미노산 서열이 포스포케톨라제의 서열과 80% 이상, 더 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상 동일하다면, 포스포케톨라제와 "상당한 상동성"을 공유한다고 언급한다.

일부 구현예들에서, 본원에 제시된 유전자 변형된 숙주 세포는 포스포트랜스아세틸라제를 코딩하는 이종의 뉴클레오티드 서열을 포함한다. 일부 구현예들에서, 포스포트랜스아세틸라제는 클로스트리듐 클루이베리 (Clostridium kluyveri)로부터 유래된다. 클로스트리듐 클루이베리 (Clostridium kluyveri)의 대표적인 포스포트랜스아세틸라제 뉴클레오티드 서열은 등재번호 NC_009706.1:1428554..1429555, 및 본원에 제시된 서열번호 13을 포함한다. 클로스트리듐 클루이베리 (Clostridium kluyveri)의 대표적인 포스포트랜스아세틸라제 단백질 서열은 등재번호 YP_001394780과 본원에 제시된 서열번호 14를 포함한다. 그외 사용가능한 포스포트랜스아세틸라제는, 비제한적으로, 락토바실러스 루테리 (Lactobacillus reuteri) (NC_010609.1:460303..461277; YP_001841389.10); 바실러스 섭틸리스 (Bacillus subtilis) (NC_014479.1:3671865..3672836; YP_003868063.1); 및 메타노사르시나 서모필라 (Methanosarcina thermophila) (L23147.1:207..1208; AAA72041.1)로부터 유래된 것을 포함한다.

또한, 본원에 제공되는 조성물과 방법에 사용가능한 포스포트랜스아세틸라제는, 본원에 기술된 임의의 포스포트랜스아세틸라제의 유도체로 지칭되는 분자를 포함한다. 이러한 "유도체"는 다음과 같은 특징을 가진다: (1) 이는 본원에 기술된 임의의 포스포트랜스아세틸라제와 상당한 상동성을 공유함; 및 (2) 아세틸 포스페이트의 아세틸-CoA로의 변환을 촉매할 수 있음. 포스포트랜스아세틸라제의 유도체는, 유도체의 아미노산 서열이 포스포트랜스아세틸라제의 서열과 80% 이상, 더 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상 동일하다면, 포스포트랜스아세틸라제와 "상당한 상동성"을 공유한다고 언급된다.

5.2.5 MEV 경로

일부 구현예들에서, 숙주 세포는 MEV 경로의 하나 이상의 이종의 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는, 아세틸-CoA를 말로닐-CoA와 축합하여 아세토아세틸-CoA를 형성하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 아세틸-CoA 2분자를 축합하여 아세토아세틸-CoA를 형성하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 아세토아세틸-CoA를 아세틸-CoA와 축합하여 HMG-CoA를 형성하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 HMG-CoA를 메발로네이트로 변환하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 메발로네이트를 메발로네이트 5-포스페이트로 인산화하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 메발로네이트 5-포스페이트를 메발로네이트 5-피로포스페이트로 변환하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 메발로네이트 5-피로포스페이트를 이소펜테닐 피로포스페이트로 변환하는 효소를 포함한다.

일부 구현예들에서, MEV 경로의 하나 이상의 효소는 아세틸-CoA 티올라제, 아세토아세틸-CoA 신타제, HMG-CoA 신타제, HMG-CoA 리덕타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 및 메발로네이트 피로포스페이트 데카르복실라제로 이루어진 군으로부터 선택된다. 일부 구현예들에서, 아세토아세틸-CoA의 형성을 촉매할 수 있는 MEV 경로 효소와 관련하여, 유전자 변형된 숙주 세포는, 아세틸-CoA 2 분자를 축합하여 아세토아세틸-CoA를 형성하는 효소, 예컨대 아세틸-CoA 티올라제; 또는 아세틸-CoA를 말로닐-CoA와 축합하여 아세토아세틸-CoA를 형성하는 효소, 예컨대 아세토아세틸-CoA 신타제 중 어느 하나를 포함한다. 일부 구현예들에서, 유전자 변형된 숙주 세포는 아세틸-CoA 2 분자를 축합하여 아세토아세틸-CoA를 형성하는 효소, 예로, 아세틸-CoA 티올라제; 및 아세틸-CoA를 말로닐-CoA와 축합하여 아세토아세틸-CoA를 형성하는 효소, 예컨대 아세토아세틸-CoA 신타제를 둘다 포함한다.

일부 구현예들에서, 숙주 세포는 MEV 경로의 1개 보다 많은 수의 효소를 코딩하는 하나 이상의 이종의 뉴클레오티드를 포함한다. 일부 구현예들에서, 숙주 세포는 MEV 경로의 2종의 효소를 코딩하는 하나 이상의 이종의 뉴클레오티드 서열을 포함한다. 일부 구현예들에서, 숙주 세포는 HMG-CoA를 메발로네이트로 변환할 수 있는 효소 및 메발로네이트를 메발로네이트 5-포스페이트로 변환할 수 있는 효소를 코딩하는 하나 이상의 이종의 뉴클레오티드 서열을 포함한다. 일부 구현예들에서, 숙주 세포는 MEV 경로의 3종의 효소를 코딩하는 하나 이상의 이종의 뉴클레오티드 서열을 포함한다. 일부 구현예들에서, 숙주 세포는 MEV 경로의 4종의 효소를 코딩하는 하나 이상의 이종의 뉴클레오티드 서열을 포함한다. 일부 구현예들에서, 숙주 세포는 MEV 경로의 5종의 효소를 코딩하는 하나 이상의 이종의 뉴클레오티드 서열을 포함한다. 일부 구현예들에서, 숙주 세포는 MEV 경로의 6종의 효소를 코딩하는 하나 이상의 이종의 뉴클레오티드 서열을 포함한다. 일부 구현예들에서, 숙주 세포는 MEV 경로의 7종의 효소를 코딩하는 하나 이상의 이종의 뉴클레오티드 서열을 포함한다. 일부 구현예들에서, 숙주 세포는 MEV 경로의 모든 효소를 코딩하는 복수의 이종의 뉴클레오티드 서열을 포함한다.

일부 구현예들에서, 유전자 변형된 숙주 세포는 이소펜테닐 피로포스페이트 (IPP)를 다이메틸알릴 피로포스페이트 (DMAPP)로 변환할 수 있는 효소를 코딩하는 이종의 핵산을 더 포함한다. 일부 구현예에서, 유전자 변형된 숙주 세포는 IPP 및/또는 DMAPP 분자를 축합하여 폴리프레닐 화합물을 형성할 수 있는 효소를 코딩하는 이종의 핵산을 더 포함한다. 일부 구현예들에서, 유전자 변형된 숙주 세포는 IPP 또는 폴리프레닐을 변형시켜 이소프레노이드 화합물을 형성할 수 있는 효소를 코딩하는 이종의 핵산을 추가로 포함한다.

5.2.5.1 아세틸-CoA의 아세토아세틸-CoA로의 변환

일부 구현예들에서, 유전자 변형된 숙주 세포는 아세틸-코엔자임 A 2분자를 축합하여 아세토아세틸-CoA를 형성하는 효소, 예컨대 아세틸-CoA 티올라제를 코딩하는 이종의 뉴클레오티드 서열을 포함한다. 이러한 효소를 코딩하는 뉴클레오티드 서열의 예시적인 예로는, 비제한적으로, (NC_000913 REGION: 2324131.2325315; 에스케리키아 콜라이 (Escherichia coli)), (D49362; 파라코커스 데니트리피칸스 (Paracoccus denitrificans)), 및 (L20428; 사카로마이세스 세레비지애 (Saccharomyces cerevisiae))를 포함한다.

아세틸-CoA 티올라제는 아세틸-CoA 2 분자의 아세토아세틸-CoA로의 가역적인 축합을 촉매하지만, 이 반응은 열역학적으로는 비우호적이며; 아세토아세틸-CoA 티올라이시스(thiolysis)가 아세토아세틸-CoA 합성 보다 우호적이다. 아세토아세틸-CoA 신타제 (AACS) (이명, 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제; EC 2.3.1.194)는 아세틸-CoA를 말로닐-CoA와 축합하여 아세토아세틸-CoA를 형성한다. 아세틸-CoA 티올라제와는 반대로, AACS-촉매화된 아세토아세틸-CoA 합성은, 조합된 말로닐-CoA의 데카르복시화로 인해, 기본적으로 에너지-우호적인 반응이다. 아울러, AACS는 또한 아세토아세틸-CoA에 대해서는 티올라이시스 활성을 나타내지 않으므로, 반응은 비가역적이다.

이종의 ADA와 아세틸-CoA 티올라제를 포함하는 숙주 세포에서, 아세토아세틸-CoA 티올라이시스에 우호적인 아세틸-CoA 티올라제에 의해 촉매되는 가역적인 반응으로, 대규모 아세틸-CoA 풀이 만들어질 수 있다. 가역적인 ADA 활성 측면에서, 이러한 아세틸-CoA 풀은 아세틸-CoA를 아세트알데하이드로 변환하는 가역적인 반응쪽으로 ADA를 향하게 할 수 있으며, 이로써 ADA에 의해 제공되는 아세틸-CoA가 생산되는 방향으로 가게 하는 이점이 없어질 수 있다. 즉, 일부 구현예에서, 아세틸-CoA를 ADA의 정방향 반응으로 가게 하는 강력한 견인력을 제공하기 위해, 본원에 제공된 유전자 변형된 숙주 세포의 MEV 경로는 아세토아세틸-CoA 신타제를 이용하여 아세틸-CoA와 말로닐-CoA로부터 아세토아세틸-CoA를 형성한다.

일부 구현예들에서, AACS는 스트렙토마이세스 sp. strain CL190로부터 유래된다 (Okamura et al., Proc Natl Acad Sci USA 107(25):11265-70 (2010). 스트렙토마이세스 sp. strain CL190의 대표적인 AACS 뉴클레오티드 서열은 등재번호 AB540131.1과 본원에 제시된 서열번호 15를 포함한다. 스트렙토마이세스 sp. strain CL190의 대표적인 AACS 단백질 서열은 등재번호 D7URV0, BAJ10048과 본원에 제시된 서열번호 16을 포함한다. 본원에 제공되는 조성물 및 방법에 이용가능한 다른 아세토아세틸-CoA 신타제로는, 비제한적으로, 스트렙토마이세스 sp. (AB183750; KO-3988 BAD86806); 스트렙토마이세스 아눌라쿠스 (S. anulatus) strain 9663 (FN178498; CAX48662); 스트렙토마이세스 sp. KO-3988 (AB212624; BAE78983); 액티노플란스 (Actinoplanes) sp. A40644 (AB113568; BAD07381); 스트렙토마이세스 sp. C (NZ_ACEW010000640; ZP_05511702); 노카르디옵시스 다손빌레이 (Nocardiopsis dassonvillei) DSM 43111 (NZ_ABUI01000023; ZP_04335288); 마이코박테리움 얼세란스 (Mycobacterium ulcerans) Agy99 (NC_008611; YP_907152); 마이코박테리움 마리눔 (Mycobacterium marinum) M (NC_010612; YP_001851502); 스트렙토마이세스 sp. Mg1 (NZ_DS570501; ZP_05002626); 스트렙토마이세스 sp. AA4 (NZ_ACEV01000037; ZP_05478992); 스트렙토마이세스 로세오스포루스 (S. roseosporus) NRRL 15998 (NZ_ABYB01000295; ZP_04696763); 스트렙토마이세스 sp. ACTE (NZ_ADFD01000030; ZP_06275834); 스크렙토마이세스 비리도크로모게네스 (S. viridochromogenes) DSM 40736 (NZ_ACEZ01000031; ZP_05529691); 프랜키아 (Frankia) sp. CcI3 (NC_007777; YP_480101); 노카르디아 브라실렌시스 (Nocardia brasiliensis) (NC_018681; YP_006812440.1); 및 오스트윅키아 첼로네 (Austwickia chelonae) (NZ_BAGZ01000005; ZP_10950493.1)를 포함한다. 추가적인 적정 아세토아세틸-CoA 신타제로는 미국 특허 공개공보 2010/0285549와 2011/0281315에 기술되어 있으며, 그 내용은 그 전체가 원용에 의해 본 명세서에 포함된다.

또한, 본원에 제공되는 조성물 및 방법에 사용가능한 아세토아세틸-CoA 신타제는, 본원에 기술된 임의의 아세토아세틸-CoA 신타제의 유도체로 지칭되는 분자를 포함한다. 이러한 "유도체"는 다음과 같은 특징을 가진다: (1) 이는 본원에 기술된 임의의 아세토아세틸-CoA 신타제와 상당한 상동성을 공유함; 및 (2) 아세틸-CoA와 말로닐-CoA를 축합하여 아세토아세틸-CoA로 변환하는 비가역적인 축합을 촉매할 수 있음. 아세토아세틸-CoA 신타제의 유도체는, 유도체의 아미노산 서열이 아세토아세틸-CoA 신타제의 서열과 80% 이상, 더 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상 동일하다면, 아세토아세틸-CoA 신타제와 "상당한 상동성"을 공유한다고 언급된다.

5.2.5.2 아세토아세틸-CoA의 HMG-CoA로의 변환

일부 구현예들에서, 숙주 세포는, 아세토아세틸-CoA를 다른 아세틸-CoA 분자와 축합하여 3-하이드록시-3-메틸글루타릴-CoA (HMG-CoA)를 형성할 수 있는 효소, 예컨대 HMG-CoA 신타제를 코딩하는 이종의 뉴클레오티드 서열을 포함한다. 이러한 효소를 코딩하는 뉴클레오티드 서열의 예시적인 예로는, 비제한적으로, (NC_001145. complement 19061.20536; 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)), (X96617; 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)), (X83882; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (AB037907; 키타사토스포라 그리세올라 (Kitasatospora griseola)), (BT007302; 호모 사피엔스 (Homo sapiens)), 및 (NC_002758, Locus tag SAV2546, GeneID 1122571; 스타필로코커스 아우레우스 (Staphylococcus aureus))를 포함한다.

5.2.5.3 HMG-CoA의 메발로네이트로의 변환

일부 구현예들에서, 숙주 세포는 HMG-CoA를 메발로네이트로 변환할 수 있는 효소, 예컨대 HMG-CoA 리덕타제를 코딩하는 이종의 뉴클레오티드 서열을 포함한다. 일부 구현예들에서, HMG-CoA 리덕타제는 NADH-가용성 하이드록시메틸글루타릴-CoA 리덕타제-CoA 리덕타제이다. HMG-CoA 리덕타제 (EC 1.1.1.34; EC 1.1.1.88)는 (S)-HMG-CoA의 (R)-메발로네이트로의 환원적인 탈아실화를 촉매하며, 클래스 I과 클래스 II HMGr 2종의 클래스로 분류될 수 있다. 클래스 I은 진핵생물과 대부분의 고세균의 효소를 포함하며, 클래스 II는 일부 원핵생물과 고세균의 HMG-CoA 리덕타제를 포함한다. 서열 다양성 외에도, 2종류의 효소는 또한 이들의 조인자 특이성에 차이가 있다. NADPH만을 이용하는 클래스 I 효소와는 달리, 클래스 II HMG-CoA 리덕타제는 NADPH와 NADH를 구별하는 능력에 차이가 있다. 예로, Hedl et al., Journal of Bacteriology 186 (7): 1927-1932 (2004)를 참조한다. 클래스 II HMG-CoA 리덕타제를 선별하기 위한 조인자 특이성은 아래에 나타낸다.

표 1. 클래스 II HMG-CoA 리덕타제를 선별하기 위한 조인자 특이성

소스	코엔자임 특이성	K _m ^NADPH (μM)	K _m ^NADH (μM)
*슈도모나스 메발로니 (P. mevalonii)*	NADH		80
*아르케오글로부스 풀기두스 (A. fulgidus)*	NAD(P)H	500	160
*스타필로코커스 아우레우스 (S. aureus)*	NAD(P)H	70	100
*엔테로코커스 패칼리스 (* *E. faecalis)*	NADPH	30

본원에 제시된 조성물 및 방법에서 사용가능한 HMG-CoA 리덕타제는 조인자로서 NADH를 이용할 수 있는 HMG-CoA 리덕타제, 예컨대 슈도모나스 메발로니 (P. mevalonii), 아르케오글로부스 풀기두스 (A. fulgidus) 또는 스타필로코커스 아우레우스 (S. aureus) 유래의 HMG-CoA 리덕타제를 포함한다. 특정 구현예에서, HMG-CoA 리덕타제는 조인자로서 NADH만을 이용하며, 예컨대, 슈도모나스 메발로니 (P. mevalonii), 실리시박터 포메로이 (S. pomeroyi) 또는 델프티아 액시도보란스 (D. acidovorans) 유래의 HMG-CoA 리덕타제이다.

일부 구현예들에서, NADH-가용성 HMG-CoA 리덕타제는 슈도모나스 메발로니 (Pseudomonas mevalonii)로부터 유래된다. HMG-CoA 리덕타제 (E.C. 1.1.1.88)를 코딩하는 슈도모나스 메발로니 (Pseudomonas mevalonii)의 야생형 mvaA 유전자 서열은 이전에 개시된 바 있다. Beach 및 Rodwell, J. Bacteriol. 171:2994-3001 (1989)을 참조한다. 슈도모나스 메발로니 (Pseudomonas mevalonii)의 대표적인 mvaA 뉴클레오티드 서열은 등재번호 M24015, 및 본원에 제시된 서열번호 17을 포함한다. 슈도모나스 메발로니 (Pseudomonas mevalonii)의 대표적인 HMG-CoA 리덕타제 단백질 서열은 등재번호 AAA25837, P13702, MVAA_PSEMV 및 본원에 제시된 서열번호 18을 포함한다.

일부 구현예들에서, NADH-가용성 HMG-CoA 리덕타제는 실리시박터 포메로이 (Silicibacter pomeroyi)로부터 유래된다. 실리시박터 포메로이 (Silicibacter pomeroyi)의 대표적인 HMG-CoA 리덕타제 뉴클레오티드 서열은 등재번호 NC_006569.1, 및 본원에 제시된 서열번호 19를 포함한다. 실리시박터 포메로이 (Silicibacter pomeroyi)의 대표적인 HMG-CoA 리덕타제 단백질 서열은 등재번호 YP_164994 및 본원에 제시된 서열번호 20을 포함한다.

일부 구현예들에서, NADH-가용성 HMG-CoA 리덕타제는 델프티아 액시도보란스 (Delftia acidovorans)로부터 유래된다. 델프티아 액시도보란스 (Delftia acidovorans)의 대표적인 HMG-CoA 리덕타제 뉴클레오티드 서열은 NC_010002 REGION: complement(319980..321269), 및 본원에 제시된 서열번호 21을 포함한다. 델프티아 액시도보란스 (Delftia acidovorans)의 대표적인 HMG-CoA 리덕타제 단백질 서열은 등재번호 YP_001561318 및 본원에 제시된 서열번호 22를 포함한다.

일부 구현예들에서, NADH-가용성 HMG-CoA 리덕타제는 솔라눔 투베로숨 (Solanum tuberosum)으로부터 유래된다 (Crane et al., J. Plant Physiol. 159:1301-1307 (2002)).

또한, 본원에 제공되는 조성물 및 방법에 사용가능한 NADH-가용성 HMG-CoA 리덕타제는, 본원에 언급된 임의의 NADH-가용성 HMG-CoA 리덕타제, 예컨대 슈도모나스 메발로니 (P. mevalonii), 실리시박터 포메로이(S. pomeroyi) 및 델프티아 액시도보란스 (D. acidovorans)로부터 유래된 NADH-가용성 HMG-CoA 리덕타제에 대한 "유도체"로 지칭되는 분자를 포함함다. 이러한 "유도체"는 다음과 같은 특징을 가진다: (1) 이는 본원에 기술된 임의의 NADH-가용성 HMG-CoA 리덕타제와 상당한 상동성을 공유함; 및 (2) 조인자로서 선호적으로 NADH를 이용하면서 (S)-HMG-CoA의 (R)-메발로네이트로의 환원적인 탈아실화를 촉매할 수 있음. NADH-가용성 HMG-CoA 리덕타제의 유도체는, 유도체의 아미노산 서열이 NADH-가용성 HMG-CoA 리덕타제의 서열과 80% 이상, 더 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상 동일하다면, NADH-가용성 HMG-CoA 리덕타제와 "상당한 상동성"을 공유한다고 지칭된다.

본원에서, "NADH-가용성"이라는 표현은, 예를 들어, NADPH 보다 NADH에 대해 높은 비활성 (specific activity)을 나타냄으로써, NADH-가용성 HMG-CoA 리덕타제가 조인자로서 NADPH에 비해 NADH에 대해 선택적이라는 것을 의미한다. 일부 구현예들에서, 조인자로서 NADH에 대한 선택성은 k _cat ^(NADH)/ k _cat ^(NADPH) 비로 표시된다. 일부 구현예들에서, NADH-가용성 HMG-CoA 리덕타제는 k _cat ^(NADH)/ k _cat ^(NADPH) 비가 적어도 5, 10, 15, 20, 25 또는 > 25이다. 일부 구현예들에서, NADH-가용성 HMG-CoA 리덕타제는 NADH만을 이용한다. 예를 들어, NADH만을 사용하는 NADH-가용성 HMG-CoA 리덕타제는 시험관내에서 유일한 조인자로서 제공되는 NADH를 이용하여 일부 활성을 나타내며 (예, 실시예 1 및 아래 섹션 6.1.1.3), NADPH가 유일한 조인자로서 제공되는 경우 검출가능한 활성을 나타내지 않는다. Kim et al., Protein Science 9:1226-1234 (2000); 및 Wilding et al., J. Bacteriol. 182(18):5147-52 (2000)에 개시된 방법을 비롯하여, 당해 기술 분야에 공지된 조인자 특이성을 확인하기 위한 임의의 방법을 이용하여, 조인자로서 NADH에 대해 선호성을 가지는 HMG-CoA 리덕타제를 동정할 수 있으며, 이들의 내용은 그 전체가 원용에 의해 본 명세서에 포함된다.

일부 구현예들에서, NADH-가용성 HMG-CoA 리덕타제는, 예를 들어 조인자-결합 포켓에 부위 특이적인 돌연변이를 유발하여, NAPDH에 비해 NADH에 선택적이도록 조작된다. NADH-선택성을 조작하는 방법은 Watanabe et al., Microbiology 153:3044-3054 (2007)에 기술되어 있으며, HMG-CoA 리덕타제의 조인자 특이성을 확인하는 방법은 Kim et al., Protein Sci. 9:1226-1234 (2000)에 기술되어 있으며, 그 내용은 전체가 원용에 의해 본 명세서에 포함된다.

일부 구현예들에서, NADH-가용성 HMG-CoA 리덕타제는, 메발로네이트 분해 경로를 천연적으로 포함하는 숙주 종, 예컨대, 이의 단독 탄소원으로서 메발로네이트를 이화하는 숙주 종으로부터 유래된다. 이들 구현예들에서, 천연 숙주 세포에서 내재화된 (R)-메발로네이트의 (S)-HMG-CoA로의 산화적인 아실화를 정상적으로 촉매하는, NADH-가용성 HMG-CoA 리덕타제를 이용하여, 역 반응 (reverse reaction), 즉, 메발로네이트 생합성 경로를 포함하는 유전자 변형된 숙주 세포에서 (S)-HMG-CoA의 (R)-메발로네이트로의 환원적인 탈아실화를 촉매한다. 단독 탄소원으로서 메발로네이트에서 증식할 수 있는 원핵생물은 Anderson et al., J. Bacteriol, 171(12):6468-6472 (1989); Beach et al., J. Bacteriol. 171:2994-3001 (1989); Bensch et al., J. Biol. Chem. 245:3755-3762; Fimongnari et al., Biochemistry 4:2086-2090 (1965); Siddiqi et al., Biochem. Biophys. Res. Commun. 8:110-113 (1962); Siddiqi et al., J. Bacteriol. 93:207-214 (1967); 및 Takatsuji et al., Biochem. Biophys. Res. Commun.110:187-193 (1983)에 기술되어 있으며, 그 전체 내용이 원용에 의해 본 명세서에 포함된다.

본원에 제시된 조성물 및 방법에 대한 일부 구현예들에서, 숙주 세포는 NADH-가용성 HMGr과 NADPH-가용성 HMG-CoA 리덕타제 둘다를 포함한다. NADPH-가용성 HMG-CoA 리덕타제를 코딩하는 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로: (NM_206548; 드로소필라 멜라노가스터 (Drosophila melanogaster)), (NC_002758, Locus tag SAV2545, GeneID 1122570; 스타필로코커스 아우레우스 (Staphylococcus aureus)), (AB015627; 스트렙토마이세스 sp. KO 3988), (AX128213, 절단된 HMG-CoA 리덕타제를 코딩하는 서열 제공; 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)), 및 (NC_001145: complement (115734.118898; 사카로마이세스 세레비지애 (Saccharomyces cerevisiae))를 포함한다.

5.2.5.4 메발로네이트의 메발로네이트-5-포스페이트로의 변환

일부 구현예들에서, 숙주 세포는 메발로네이트를 메발로네이트 5-포스페이트로 변환할 수 있는 효소, 예컨대 메발로네이트 키나제를 코딩하는 이종의 뉴클레오티드 서열을 포함한다. 이러한 효소를 코딩하는 뉴클레오티드 서열의 예시적인 예로는, 비제한적으로: (L77688; 아라비옵시스 탈리아나 (Arabidopsis thaliana)) 및 (X55875; 사카로마이세스 세레비지애 (Saccharomyces cerevisiae))를 포함한다.

5.2.5.5 메발로네이트-5-포스페이트의 메발로네이트-5-피로포스페이트로의 변환

일부 구현예들에서, 숙주 세포는 메발로네이트 5-포스페이트를 메발로네이트 5-피로포스페이트로 변환할 수 있는 효소, 예컨대 포스포메발로네이트 키나제를 코딩하는 이종의 뉴클레오티드 서열을 포함한다. 이러한 효소를 코딩하는 뉴클레오티드 서열의 예시적인 예로는, 비제한적으로: (AF429385; 헤베아 브라실렌시스 (Hevea brasiliensis)), (NM_006556; 호모 사피엔스 (Homo sapiens)), 및 (NC_001145. complement 712315.713670; 사카로마이세스 세레비지애 (Saccharomyces cerevisiae))를 포함한다.

5.2.5.6 메발로네이트-5-피로포스페이트의 IPP로의 변환

일부 구현예들에서, 숙주 세포는 메발로네이트 5-피로포스페이트로를 이소펜테닐 다이포스페이트 (IPP)로 변환할 수 있는 효소, 예컨대 메발로네이트 피로포스페이트 데카르복실라제를 코딩하는 이종의 뉴클레오티드 서열을 포함한다. 이러한 효소를 코딩하는 뉴클레오티드 서열의 예시적인 예로는, 비제한적으로, (X97557; 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)), (AF290095; 엔테로코커스 패슘 (Enterococcus faecium)), 및 (U49260; 호모 사피엔스 (Homo sapiens))를 포함한다.

5.2.5.7 IPP의 DMAPP로의 변환

일부 구현예들에서, 숙주 세포는 further comprises MEV 경로를 통해 만들어진 IPP를 다이메틸알릴 피로포스페이트 (DMAPP)로 변환할 수 있는 효소, 예컨대 IPP 이소머라제를 코딩하는 이종의 뉴클레오티드 서열을 추가로 포함한다. 이러한 효소를 코딩하는 뉴클레오티드 서열의 예시적인 예로는, 비제한적으로, (NC_000913, 3031087.3031635; 에스케리키아 콜라이 (Escherichia coli)), 및 (AF082326; 헤마토코커스 프루바이얼리스 (Haematococcus pluvialis)를 포함한다.

5.2.5.8 폴리프레닐 신타제

일부 구현예들에서, 숙주 세포는 IPP 및/또는 DMAPP 분자를 축합하여 탄소를 5개 보다 많이 포함하는 폴리프레닐 화합물을 형성할 수 있는 폴리프레닐 신타제를 코딩하는 이종의 뉴클레오티드 서열을 추가로 포함한다.

일부 구현예들에서, 숙주 세포는 IPP 한 분자와 DMAPP 1 분자를 축합하여 게라닐 피로포스페이트 ("GPP") 1 분자를 형성할 수 있는 효소, 예로 GPP 신타제를 코딩하는 이종의 뉴클레오티드 서열을 포함한다. 이러한 효소를 코딩하는 뉴클레오티드 서열의 예시적인 예로는, 비제한적으로, (AF513111; 아비에스 그란디스 (Abies grandis)), (AF513112; 아비에스 그란디스 (Abies grandis)), (AF513113; 아비에스 그란디스 (Abies grandis)), (AY534686; 안티리눔 마주스 (Antirrhinum majus)), (AY534687; 안티리눔 마주스 (Antirrhinum majus)), (Y17376; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (AE016877, Locus AP11092; 바실러스 세레우스 (Bacillus cereus); ATCC 14579), (AJ243739; 시트러스 시넨시스 (Citrus sinensis)), (AY534745; 클라르키아 브루어리 (Clarkia breweri)), (AY953508; 입스 피니 (Ips pini)), (DQ286930; 라이코퍼시콘 에스쿨렌툼 (Lycopersicon esculentum)), (AF182828; 멘타 x 피페리타 (Mentha x piperita)), (AF182827; 멘타 x 피페리타 (Mentha x piperita)), (MPI249453; 멘타 x 피페리타 (Mentha x piperita)), (PZE431697, Locus CAD24425; 파라코커스 제아산티니팍시엔스 (Paracoccus zeaxanthinifaciens)), (AY866498; 피크로리자 쿠로아 (Picrorhiza kurrooa)), (AY351862; 비티스 비니페라 (Vitis vinifera)), 및 (AF203881, Locus AAF12843; 자이모모나스 모빌리스 (Zymomonas mobilis))를 포함한다.

일부 구현예들에서, 숙주 세포는 IPP 2 분자를 DMAPP 1 분자와 축합하거나, 또는 IPP 분자에 GPP 분자를 부가하여, 파르네실 피로포스페이트 ("FPP") 분자를 형성할 수 있는 효소, 예로, FPP 신타제를 코딩하는 이종의 뉴클레오티드 서열을 포함한다. 이러한 효소를 코딩하는 뉴클레오티드 서열의 예시적인 예로는, 비제한적으로, (ATU80605; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (ATHFPS2R; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (AAU36376; 아르테미시아 아누아 (Artemisia annua)), (AF461050; Bos taurus), (D00694; 에스케리키아 콜라이 (Escherichia coli) K-12), (AE009951, Locus AAL95523; 푸조박테리움 뉴클레아툼 (Fusobacterium nucleatum) subsp. nucleatum ATCC 25586), (GFFPPSGEN; 지베렐라 푸이쿠로이 (Gibberella fujikuroi)), (CP000009, Locus AAW60034; 글루코노박터 옥시단스 (Gluconobacter oxydans) 621H), (AF019892; 헬리안투스 안누스 (Helianthus annuus)), (HUMFAPS; 호모 사피엔스 (Homo sapiens)), (KLPFPSQCR; 클루이베로마이세스 락티스 (Kluyveromyces lactis)), (LAU15777; 루피누스 알부스 (Lupinus albus)), (LAU20771; 루피누스 알부스 (Lupinus albus)), (AF309508; 무스 무스쿨러스 (Mus musculus)), (NCFPPSGEN; 뉴로스포라 크라사 (Neurospora crassa)), (PAFPS1; 파르테늄 아르겐타툼 (Parthenium argentatum)), (PAFPS2; 파르테늄 아르겐타툼 (Parthenium argentatum)), (RATFAPS; 라투스 노르베기쿠스 (Rattus norvegicus)), (YSCFPP; 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)), (D89104; 스키조사카로마이세스 폼베 (스키조사카로마이세스 폼베 (Schizosaccharomyces pombe))), (CP000003, Locus AAT87386; 스트렙토코커스 피오게네스 (Streptococcus pyogenes)), (CP000017, Locus AAZ51849; 스트렙토코커스 피오게네스 (Streptococcus pyogenes)), (NC_008022, Locus YP_598856; 스트렙토코커스 피오게네스 (Streptococcus pyogenes) MGAS10270), (NC_008023, Locus YP_600845; 스트렙토코커스 피오게네스 (Streptococcus pyogenes) MGAS2096), (NC_008024, Locus YP_602832; 스트렙토코커스 피오게네스 (Streptococcus pyogenes) MGAS10750), (MZEFPS; 지 메이스 (Zea mays)), (AE000657, Locus AAC06913; 아퀴펙스 에어올리쿠스 (Aquifex aeolicus) VF5), (NM_202836; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (D84432, Locus BAA12575; 바실러스 섭틸리스 (Bacillus subtilis)), (U12678, Locus AAC28894; 브래디리조븀 자포니쿰 (Bradyrhizobium japonicum) USDA 110), (BACFDPS; 지오바실러스 스테아로서모필러스 (Geobacillus stearothermophilus)), (NC_002940, Locus NP_873754; 헤모필러스 두크레이 (Haemophilus ducreyi) 35000HP), (L42023, Locus AAC23087; 헤모필러스 인플루엔자 (Haemophilus influenza)e Rd KW20), (J05262; 호모 사피엔스 (Homo sapiens)), (YP_395294; 락토바실러스 사케이 (Lactobacillus sakei) subsp. sakei 23K), (NC_005823, Locus YP_000273; 펩토스피라 인테로간스 (Leptospira interrogans) serovar Copenhageni str. Fiocruz L1-130), (AB003187; 마이크로코커스 루테우스 (Micrococcus luteus)), (NC_002946, Locus YP_208768; 네이세리아 고노로이에 (Neisseria gonorrhoeae) FA 1090), (U00090, Locus AAB91752; 리조븀 (Rhizobium) sp. NGR234), (J05091; 사카로마이세스 세레비지애 (Saccharomyces cerevisae), (CP000031, Locus AAV93568; 실리시박터 포메로이 (Silicibacter pomeroyi)) DSS-3), (AE008481, Locus AAK99890; 스트렙토코커스 뉴모니아 (Streptococcus pneumonia)e R6), 및 (NC_004556, Locus NP 779706; 크실렐라 파스티도사 (Xylella fastidiosa) Temecula1)를 포함한다.

일부 구현예들에서, 숙주 세포는 IPP를 DMAPP와, 또는 IPP를 FPP와 조합하여 게라닐게라닐 피로포스페이트 ("GGPP")를 형성할 수 있는 효소를 코딩하는 이종의 뉴클레오티드 서열을 추가로 포함한다. 이러한 효소를 코딩하는 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, (ATHGERPYRS; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (BT005328; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (NM_119845; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (NZ_AAJM01000380, Locus ZP_00743052; 바실러스 투린지엔시스 (Bacillus thuringiensis) serovar israelensis, ATCC 35646 sq1563), (CRGGPPS; 카타란투스 로세우스 (Catharanthus roseus)), (NZ_AABF02000074, Locus ZP_00144509; 푸조박테리움 뉴클레아툼 (Fusobacterium nucleatum) subsp. vincentii, ATCC 49256), (GFGGPPSGN; 지베렐라 푸이쿠로이 (Gibberella fujikuroi)), (AY371321; 징코 빌로바 (Ginkgo biloba)), (AB055496; 헤베아 브라실렌시스 (Hevea brasiliensis)), (AB017971; 호모 사피엔스 (Homo sapiens)), (MCI276129; 무코르 시르시넬로이데스 f. 루시타니쿠스 (Mucor circinelloides f. lusitanicus)), (AB016044; 무스 무스쿨러스 (Mus musculus)), (AABX01000298, Locus NCU01427; 뉴로스포라 크라사 (Neurospora crassa)), (NCU20940; 뉴로스포라 크라사 (Neurospora crassa)), (NZ_AAKL01000008, Locus ZP_00943566; 랄스토니아 솔라나세아룸 (Ralstonia solanacearum) UW551), (AB118238; 라투스 노르베기쿠스 (Rattus norvegicus)), (SCU31632; 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)), (AB016095; 시네코코쿠스 엘롱가테스 (Synechococcus elongates)), (SAGGPS; 시나피스 알바 (Sinapis alba)), (SSOGDS;설폴로부스 액시도칼다리우스 (Sulfolobus acidocaldarius)), (NC_007759, Locus YP_461832; Syntrophus aciditrophicus SB), (NC_006840, Locus YP_204095; 비브리오 피세리 (Vibrio fischeri) ES114), (NM_112315; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (ERWCRTE; 판토에아 어글로머란스 (Pantoea agglomerans)), (D90087, Locus BAA14124; 판토에아 아나나티스 (Pantoea ananatis)), (X52291, Locus CAA36538; 로도박터 캡슐라투스 (Rhodobacter capsulatus)), (AF195122, Locus AAF24294; 로도박터 스페어로이데스 (Rhodobacter sphaeroides)), 및 (NC_004350, Locus NP_721015; 스트렙토코커스 무탄스 (Streptococcus mutans) UA159)를 포함한다.

5.2.5.9 테르펜 신타제

일부 구현예들에서, 숙주 세포는 폴리프레닐을 변형시켜, 헤미테르펜, 모노테르펜, 세스퀴테르펜, 다이테르펜, 트리테르펜, 테트라테르펜, 폴리테르펜, 스테로이드 화합물, 카로테노이드 또는 변형된 이소프레노이드 화합물을 형성할 수 있는 효소를 코딩하는 이종의 뉴클레오티드 서열을 추가로 포함한다.

일부 구현예들에서, 이종의 뉴클레오티드는 카렌 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, (AF461460, REGION 43.1926; 피세아 아비에스 (Picea abies)) 및 (AF527416, REGION: 78.1871; 살비아 스테노필라 (Salvia stenophylla))를 포함한다.

일부 구현예들에서, 이종의 뉴클레오티드는 게라니올 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, (AJ457070; 신나모뭄 테누이필럼 (Cinnamomum tenuipilum)), (AY362553; 오시뭄 바실리쿰 (Ocimum basilicum)), (DQ234300; 펠릴라 프루테센스 (Perilla frutescens) strain 1864), (DQ234299; 페릴라 시트리오도라 (Perilla citriodora) strain 1861), (DQ234298; 페릴라 시트리오도라 (Perilla citriodora) strain 4935), 및 (DQ088667; 페릴라 시트리오도라 (Perilla citriodora))를 포함한다.

일부 구현예들에서, 이종의 뉴클레오티드는 리날롤 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, (AF497485; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (AC002294, Locus AAB71482; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (AY059757; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (NM_104793; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (AF154124; 아르테미시아 아누아 (Artemisia annua)), (AF067603; 클라르키아 브루어리 (Clarkia breweri)), (AF067602; 클라르키아 콘시나 (Clarkia concinna)), (AF067601; 클라르키아 브루어리 (Clarkia breweri)), (U58314; 클라르키아 브루어리 (Clarkia breweri)), (AY840091; 라이코퍼시콘 에스쿨렌툼 (Lycopersicon esculentum)), (DQ263741; 라반둘라 안구스티폴리아 (Lavandula angustifolia)), (AY083653; 멘타 사이트레이트 (Mentha citrate)), (AY693647; 오시뭄 바실리쿰 (Ocimum basilicum)), (XM_463918; 오리자 사티바 (Oryza sativa)), (AP004078, Locus BAD07605; 오리자 사티바 (Oryza sativa)), (XM_463918, Locus XP_463918; 오리자 사티바 (Oryza sativa)), (AY917193; 페릴라 시트리오도라 (Perilla citriodora)), (AF271259; 펠릴라 프루테센스 (Perilla frutescens)), (AY473623; 피세아 아비에스 (Picea abies)), (DQ195274; 피세아 시첸시스 (Picea sitchensis)), 및 (AF444798; 펠릴라 프루테센스 (Perilla frutescens) var. crispa cultivar No. 79)를 포함한다.

일부 구현예들에서, 이종의 뉴클레오티드는 리모넨 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, (+)-리모넨 신타제 (AF514287, REGION: 47.1867; 시트러스 리몬 (Citrus limon) 및 AY055214 (REGION: 48.1889; 아가스타케 루고사 (Agastache rugosa)) 및 (-)-리모넨 신타제 (DQ195275, REGION: 1.1905; 피세아 시첸시스 (Picea sitchensis)), (AF006193, REGION: 73.1986; 아비에스 그란디스 (Abies grandis)), 및 (MHC4SLSP, REGION: 29.1828; 멘타 스피카타 (Mentha spicata))를 포함한다.

일부 구현예들에서, 이종의 뉴클레오티드는 미르센 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, (U87908; 아비에스 그란디스 (Abies grandis)), (AY195609; 안티리눔 마주스 (Antirrhinum majus)), (AY195608; 안티리눔 마주스 (Antirrhinum majus)), (NM_127982; 아라비옵시스 탈리아나 (Arabidopsis thaliana) TPS10), (NM_113485; 아라비옵시스 탈리아나 (Arabidopsis thaliana) ATTPS-CIN), (NM_113483; 아라비옵시스 탈리아나 (Arabidopsis thaliana) ATTPS-CIN), (AF271259; 펠릴라 프루테센스 (Perilla frutescens)), (AY473626; 피세아 아비에스 (Picea abies)), (AF369919; 피세아 아비에스 (Picea abies)), 및 (AJ304839; 퀘르쿠스 일렉스 (Quercus ilex))를 포함한다.

일부 구현예들에서, 이종의 뉴클레오티드는 옥시멘 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, (AY195607; 안티리눔 마주스 (Antirrhinum majus)), (AY195609; 안티리눔 마주스 (Antirrhinum majus)), (AY195608; 안티리눔 마주스 (Antirrhinum majus)), (AK221024; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (NM_113485; 아라비옵시스 탈리아나 (Arabidopsis thaliana) ATTPS-CIN), (NM_113483; 아라비옵시스 탈리아나 (Arabidopsis thaliana) ATTPS-CIN), (NM_117775; 아라비옵시스 탈리아나 (Arabidopsis thaliana) ATTPS03), (NM_001036574; 아라비옵시스 탈리아나 (Arabidopsis thaliana) ATTPS03), (NM_127982; 아라비옵시스 탈리아나 (Arabidopsis thaliana) TPS10), (AB110642; 시트러스 운시우 (Citrus unshiu) CitMTSL4) 및 (AY575970; Lotus corniculatus var. japonicus)를 포함한다.

일부 구현예들에서, 이종의 뉴클레오티드는 알파-피넨 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, (+) 알파-피넨 신타제 (AF543530, REGION: 1.1887; 피누스 타에다 (Pinus taeda)), (-)알파-피넨 신타제 (AF543527, REGION: 32.1921; 피누스 타에다 (Pinus taeda)), 및 (+)/(-)알파-피넨 신타제 (AGU87909, REGION: 6111892; 아비에스 그란디스 (Abies grandis))를 포함한다.

일부 구현예들에서, 이종의 뉴클레오티드는 베타-피넨 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, (-) 베타-피넨 신타제 (AF276072, REGION: 1.1749; 아르테미시아 아누아 (Artemisia annua)) 및 (AF514288, REGION: 26.1834; 시트러스 리몬 (Citrus limon))을 포함한다.

일부 구현예들에서, 이종의 뉴클레오티드는 사비넨 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, AF051901 (REGION: 26.1798, 살비아 오피시날리스 (Salvia officinalis) 유래)를 포함한다.

일부 구현예들에서, 이종의 뉴클레오티드는 감마-테르피넨 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는: (AF514286, REGION: 30.1832, 시트러스 리몬 (Citrus limon)) 및 (AB110640, REGION 1.1803, 시트러스 운시우 (Citrus unshiu))를 포함한다.

일부 구현예들에서, 이종의 뉴클레오티드는 테르피놀렌 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, (AY693650, 오스시뭄 바실리툼 (Oscimum basilicum)) 및 (AY906866, REGION: 10.1887, 슈도츠가 멘지에시 (Pseudotsuga menziesii))를 포함한다.

일부 구현예들에서, 이종의 뉴클레오티드는 아모르파디엔 신타제를 코딩한다. 적정 뉴클레오티드 서열에 대한 예시적인 예는, 미국 특허 공개공보 2004/0005678의 서열번호 37이다.

일부 구현예들에서, 이종의 뉴클레오티드는 알파-파르네센 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, DQ309034, 피루스 코무니스 (Pyrus communis) cultivar d'Anjou (배; 유전자명 AFS1) 및 AY182241, 말루스 도메스티카 (Malus domestica) (사과; 유전자 AFS1)를 포함한다. Pechouus et al., Planta 219(1):84-94 (2004).

일부 구현예들에서, 이종의 뉴클레오티드는 베타-파르네센 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, 멘타 x 피페리타 (Mentha x piperita)의 등재번호 AF024615 (peppermint; gene Tspa11), 및 아르테미시아 아누아 (Artemisia annua)의 AY835398을 포함한다. Picaud et al., Phytochemistry 66(9): 961-967 (2005).

일부 구현예들에서, 이종의 뉴클레오티드는 파르네솔 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, 지 메이스 (Zea mays)의 등재번호 AF529266와 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)의 YDR481C (유전자 Pho8)를 포함한다. Song, L., Applied Biochemistry and Biotechnology 128:149-158 (2006).

일부 구현예들에서, 이종의 뉴클레오티드는 네롤리돌 신타제제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, 지 메이스 (Zea mays)의 AF529266 (옥수수; 유전자 tps1)을 포함한다.

일부 구현예들에서, 이종의 뉴클레오티드는 패출리올 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, AY508730 (REGION: 포고스테몬 카블린 (Pogostemon cablin)의 1.1659)을 포함한다.

일부 구현예들에서, 이종의 뉴클레오티드는 노트카톤 (nootkatone) 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, AF441124 (REGION: 1.1647, 시트러스 시넨시스 (Citrus sinensis)) 및 AY917195 (REGION: 1.1653, 펠릴라 프루테센스 (Perilla frutescens))를 포함한다.

일부 구현예들에서, 이종의 뉴클레오티드는 아비에타딘 (abietadiene) 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, (U50768; 아비에스 그란디스 (Abies grandis)) 및 (AY473621; 피세아 아비에스 (Picea abies))을 포함한다.

일부 구현예들에서, 숙주 세포는 C₅ 이소프레노이드를 생산한다. 이 화합물은 하나의 이소프렌 유닛으로부터 파생되며, 또한 헤미테르펜으로도 불리운다. 헤미테르펜에 대한 예시적인 예가 이소프렌이다. 다른 구현예들에서, 이소프레노이드는 C₁₀ 이소프레노이드이다. 이 화합물은 이소프렌 2개의 유닛으로부터 파생되며, 모노테르펜으로도 지칭된다. 모노테르펜에 대한 예시적인 예로는 리모넨, 시트라넬롤, 게라니올, 멘톨, 페릴릴 알코올, 리날롤, 튜온 (thujone) 및 미르센이 있다. 다른 구현예들에서, 이소프레노이드는 C₁₅ 이소프레노이드이다. 이 화합물은 이소프렌 3개의 유닛으로부터 파생되며, 세스퀴테르펜으로도 지칭된다. 세스퀴테르펜에 대한 예시적인 예로는 페리플라논 (periplanone) B, 징콜라이드 (gingkolide) B, 아모르파디엔, 아르테미시닌 (artemisinin), 아르테미신산 (artemisinic acid), 발렌센 (valencene), 노트카톤 (nootkatone), 에피-세드롤 (epi-cedrol), 에피-아리스톨로켄 (epi-aristolochene), 파르네솔 (farnesol), 고시폴 (gossypol), 사노닌 (sanonin), 페리플라논, 포르스콜린 (forskolin), 및 패촐롤 (패촐리 알코올이라고도 함)이 있다. 다른 구현예들에서, 이소프레노이드는 C₂₀ 이소프레노이드이다. 이 화합물은 이소프렌 4개의 유닛으로부터 파생되며, 또한 다이테르펜으로도 지칭된다. 다이테르펜에 대한 예시적인 예로는 카르벤 (casbene), 엘루테로빈 (eleutherobin), 파클리탁셀, 프로스트라틴 (prostratin), 슈도프테로신 (pseudopterosin) 및 탁사디엔 (taxadiene)이 있다. 또 다른 예로, 이소프레노이드는 C₂₀₊ 이소프레노이드이다. 이 화합물은 4개 보다 많은 수의 이소프렌 유닛들로부터 파생되며, 트리테르펜 (이소프렌 6개의 유닛으로부터 파생된 C₃₀ 이소프레노이드 화합물), 예컨대 아르브루시드 (arbruside) E, 브루세안틴 (bruceantin), 테스토스테론, 프로게스테론, 코르티손, 디지톡신 (digitoxin) 및 스쿠알렌; 테트라테르펜 (이소프레노이드 8개로부터 파생된 C₄₀ 이소프레노이드 화합물), 예컨대 베타-카로텐; 및 폴리테르펜 (8개 보다 많은 수의 이소프렌 유닛으로부터 파생된 C₄₀₊ 이소프레노이드 화합물), 예컨대 폴리이소프렌을 포함한다. 일부 구현예들에서, 이소프레노이드는 아비에타디엔, 아모르파디엔, 카렌, 알파-파르네센, 베타-파르네센, 파르네솔, 게라니올, 게라닐게라니올, 이소프렌, 리날롤, 리모넨, 미르센, 네롤리돌, 옥시멘, 패출롤, 베타-피넨, 사비넨, 감마-테르피넨, 페르피놀렌 및 발렌센으로 이루어진 군으로부터 선택된다. 이소프레노이드 화합물은, 또한, 비제한적으로, 카로테노이드 (예, 라이코펜, 알파- 및 베타-카로텐, 알파- 및 베타-크립토잔틴, 빅신 (bixin), 제아잔틴 (zeaxanthin), 아스타잔틴 (astaxanthin) 및 루테인), 스테로이드 화합물, 및 다른 화학 기로 변형된 이소프레노이드로 구성된 화합물들, 예컨대 혼성 테르펜-알카로이드 및 코엔자임 Q-10을 포함한다.

5.3 유전자 변형된 세포의 제조 방법

또한, 본 발명은, 전술한 한가지 이상의 변형, 예컨대 ADA, NADH-가용성 HMG-CoA 리덕타제, AACS, PK, PTA 및 그외 메발로네이트 경로 효소로부터 선택되는 하나 이상의 효소를 코딩하는 하나 이상의 이종의 핵산을 포함하도록 유전자 조작된 숙주 세포의 제조 방법을 제공한다. 숙주 세포에서 이종의 효소의 발현은, 숙주 세포에, 숙주 세포에서의 발현을 허용하는 조절 인자의 통제를 받도록 상기 효소를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 도입함으로써, 달성될 수 있다. 일부 구현예들에서, 핵산은 염색체외 플라스미드이다. 다른 구현예들에서, 핵산은 숙주 세포의 염색체로 뉴클레오티드 서열을 삽입할 수 있는 염색체 삽입 벡터이다.

이들 단백질을 코딩하는 핵산은, 비제한적인 예로, 당해 기술 분야의 당업자에게 공지된 임의의 방법을 이용하여 숙주 세포로 도입할 수 있다 (예를 들어, Hinnen et al. (1978) Proc. Natl. Acad. Sci. USA 75:1292-3; Cregg et al. (1985) Mol. Cell. Biol. 5:3376-3385; Goeddel et al. eds, 1990, Methods in Enzymology, vol. 185, Academic Press, Inc. , CA; Krieger, 1990, Gene Transfer and Expression -- A Laboratory Manual, Stockton Press, NY; Sambrook et al. , 1989, Molecular Cloning -- A Laboratory Manual, Cold Spring Harbor Laboratory, NY; Ausubel et al. , eds. , Current Edition, Current Protocols in Molecular Biology, Greene Publishing Associates and Wiley Interscience, NY을 참조함). 기법의 예로는, 비제한적으로, 스페로플라스팅, 전기충격, PEG 1000 매개 형질전환 및 리튬 아세테이트 또는 리튬 클로라이드 매개의 형질전환을 포함한다.

숙주 세포내 효소의 카피 수는, 이 효소를 코딩하는 유전자의 전사를 수정함으로써 변형시킬 수 있다. 이는, 예를 들어, 이 효소를 코딩하는 뉴클레오티드 서열의 카피 수를 변형시킴으로써 (예로, 뉴클레오티드 서열을 포함하는 고카피수 또는 저카피수 발현 벡터를 이용하거나, 또는 숙주 세포의 게놈에 뉴클레오티드 서열의 부가 카피를 도입하거나 숙주 세포의 게놈에서 뉴클레오티드 서열을 결손 또는 파괴함으로써), 또는 오페론의 폴리시스트론 mRNA에서 코딩 서열의 순서를 바꾸거나 또는 오페론을 자신의 조절 인자를 가진 각각의 개개 유전자로 분할함으로써, 또는 뉴클레오티드 서열엘 작동가능하게 연결된 프로모터나 오퍼레이터의 세기를 높임으로써, 달성할 수 있다. 다른 예로, 또는 아울러, 숙주 세포에서 효소의 카피 수는, 이 효소를 코딩하는 mRNA의 번역 수준을 수정함으로써 변형시킬 수 있다. 이는, 예를 들어, mRNA의 안정성을 변형시키거나, 리보솜 결합부의 서열을 변형시키거나, 리보솜 결합부와 효소 코딩 서열의 개시 코돈 사이의 거리나 서열을 변형시킴으로써, 효소 코딩 영역의 개시 코돈의 5' 측의 "상류" 또는 인접하게 위치한 시스트론 사이 영역을 변형시킴으로써, mRNA 전사체의 3'-말단을 헤어핀 또는 특수 서열을 이용하거나 안정화하거나, 효소의 코돈 용법을 변형시키거나, 효소의 생합성에 사용되는 희귀 코돈 tRNA의 발현을 변형시키거나, 및/또는 효소의 안정성을 예를 들어 이의 코딩 서열의 돌연변이를 통해 높이므로써, 달성할 수 있다.

숙주 세포에서 효소의 활성은, 비제한적인 예로, 숙주 세포에서 증가된 또는 감소된 가용성을 나타내는 변형된 형태의 효소를 발현하거나, 효소의 활성을 저해하는 도메인이 결핍된 변형된 형태의 효소를 발현하거나, 기질에 대한 Kcat가 높거나 낮은, 또는 Km이 낮거나 높은 변형된 형태의 효소를 발현하거나, 또는 경로에서 다른 분자에 의한 피드백 또는 피드-포워드 조절에 의해 영향을 많이 또는 적게 받는 변형된 형태의 효소를 발현하는 등의, 다수 방식으로 변형시킬 수 있다.

일부 구현예들에서, 숙주 세포를 유전자 변형하기 위해 사용되는 핵산은 형질전환된 숙주 세포의 선별과 외래 DMA를 유지하도록 숙주 세포에 선택압을 부여하는데 유용한 하나 이상의 선별 마커를 포함한다.

일부 구현예들에서, 선별 마커는 항생제 내성 마커이다. 항생제 내성 마커에 대한 예시적인 예로는, 비제한적으로, BLA, NAT1, PAT, AUR1-C, PDR4, SMR1, CAT, 마우스 dhfr, HPH, DSDA, KAN ^R , 및 SH BLE 유전자 산물을 포함한다. E. coli 유래 BLA 유전자 산물은 베타-락탐 항생제 (예, 스펙트럼이 좁은 세팔로스포린, 세파마이신 및 카르바페넴 (에르타페넴), 세파만돌 및 세포페라존)과, 테모실린을 제외한 모든 항-그람-음성 박테리아 페니실린에 대해 내성을 부여하며; 스트렙토마이세스 노우르세이 (S. noursei) 유래의 NAT1 유전자 산물은 노르세오트리신 (nourseothricin)에 대해 내성을 부여하며; 스크렙토마이세스 비리도크로모게네스 (S. viridochromogenes) Tu94 유래 PAT 유전자 산물은 비알로포스 (bialophos)에 대해 내성을 부여하며; 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 유래 AUR1-C 유전자 산물은 아우에로바시딘 A (Auerobasidin A) (AbA)에 대해 내성을 부여하며; PDR4 유전자산물은 세룰레닌 (cerulenin)에 대해 내성을 부여하며; SMR1 유전자 산물은 설포메투론 메틸에 대해 내성을 부여하며; Tn9 트랜스포손 유래 CAT 유전자 산물은 클로람페니콜에 대해 내성을 부여하며; 마우스 dhfr 유전자 산물은 메토트렉세이트에 대해 내성을 부여하며; 클렙시엘라 뉴모니아 (Klebsiella pneumonia)의 HPH 유전자 산물은 히그로마이신 B에 대해 내성을 부여하며; E. coli 유래 DSDA 유전자 산물은 단일 질소원으로서 D-세린이 첨가된 플레이트에서 세포 생육을 허용하며; Tn903 트랜스포존의 KAN ^R 유전자는 G418에 대해 내성을 부여하며; 스트렙토알로테이쿠스 힌더스타누스 (Streptoalloteichus hindustanus) 유래 SH BLE 유전자 산물은 제오신 (Zeocin) (블레오마이신)에 대해 내성을 부여한다. 일부 구현예들에서, 항생제 내성 마터는 본원에 기술된 유전자 변형된 숙주 세포를 분리한 후에 제거된다.

일부 구현예들에서, 선별 마커는 유전자 변형된 미생물에서 영양요구성 (예, 영양분 영양요구성)을 구제한다. 이러한 구현예에서, 부모 미생물은, 아미노산 또는 뉴클레오티드 생합성 경로에서 기능하지만 부모 세포에게 비-기능성을 부여하였을 때 한가지 이상의 영양분의 보충없이 배지에서 생육할 수 없게 하는, 하나 이상의 유전자 산물에 대한 기능적 파괴를 포함한다. 이러한 유전자 산물로는, 비제한적으로, 효모에서의 HIS3, LEU2, LYS1, LYS2, MET15, TRP1, ADE2 및 URA3 유전자 산물을 포함한다. 이후, 영양요구성 표현형은 파괴된 유전자 산물의 기능적 카피를 코딩하는 발현 벡터 또는 염색체 삽입 구조체를 부모 세포에 형질전환함으로써, 복구할 수 있으며, 제조되는 유전자 변형된 숙주 세포는 부모 세포의 영양 요구성 표현형의 소실을 기초로 선별할 수 있다. URA3, TRP1 및 LYS2 유전자의 선별 마커로서의 이용은 파지티브 및 네거티브 선별이 모두 가능하기 때문에 현저한 이점을 가진다. 파지티브 선별은 URA3, TRP1 및 LYS2 돌연변이의 영양요구성 보완에 의해 수행되는 반면, 네거티브 선별은 특정 저해제, 즉, 프로토트로픽 균주의 생육은 방지하지만 각각 URA3, TRP1 및 LYS2 돌연변이의 생육을 허용하는, 5-플루오로-오로트산 (FOA), 5-플루오로안트라닐산 및 아미노아디프산 (aAA)을 이용한다. 다른 구현예들에서, 선별 마커는 공지 선별 방법으로 동정할 수 있는 그외 비-치사적 결핍 또는 표현형을 복원한다.

본원은 본원의 방법, 조성물 및 유기체에 이용가능한 특정 유전자와 단백질을 기술하지만; 이러한 유전자에 대한 완전한 동정이 필수적이지 않는 것으로 이해될 것이다. 예를 들어, 폴리펩타이드 또는 효소를 코딩하는 서열을 포함하는 특정 유전자 또는 폴리뉴클레오티드에 변형을 가하여, 활성을 스크리닝할 수 있다. 전형적으로, 이러한 변경은 보존적인 돌연변이와 침묵 돌연변이를 포함한다. 이러한 변형된 또는 돌연변이된 폴리뉴클레오티드 및 폴리펩타이드는 당해 기술 분야에 공지된 방법을 이용하여 기능성 효소의 발현을 스크리닝할 수 있다.

유전자 코드의 선천적인 축중 (degeneracy)으로 인해, 기능적으로 동일하거나 등가의 폴리펩타이드를 실질적으로 코딩하는 다른 폴리뉴클레오티드도 사용하여, 이러한 효소를 코딩하는 폴리뉴클레오티드를 클로닝하고 발현할 수 있다.

당해 기술 분야의 당업자에게 이해되는 바와 같이, 특정 숙주에서 이의 발현을 강화하도록 코딩 서열을 변형시키는 것이 유익할 수 있다. 유전자 코드는 가능한 코돈 64종으로 많지만, 대부분의 유기체는 전형적으로 이들 코돈의 서브세트를 이용한다. 종들에서 가장 흔히 사용되는 코돈을 최적 코돈이라고 하며, 이용하지 않는 코돈은 희귀 또는 저-가용성 코돈으로 분류된다. 코돈은 "코돈 최적화" 또는 "종에서 코돈 편향 조절"로 종종 치징되는 프로세스에서, 숙주의 선호적인 코돈 사용을 반영하여 치환할 수 있다.

특정 원핵생물 또는 진핵생물 숙주에 선호되는 코돈을 포함하는 최적화된 코딩 서열 (Murray et al., 1989, Nucl Acids Res. 17: 477-508)을, 예를 들어, 비-최적화된 서열로부터 만들어지는 전사체와 비교하여, 긴 반감기 등의 바람직한 특성을 가진 재조합 RNA 전사체를 생산하거나 또는 번역 속도를 높이도록, 준비할 수 있다. 또한, 번역 정지 코돈은 숙주 선호성을 반영하도록 변형될 수 있다. 예를 들어, 사카로마이세스 세레비지애 (S. cerevisiae)와 포유류의 전형적인 정지 코돈은 각각 UAA와 UGA이다. 단자엽 식물의 전형적인 정지 코돈은 UGA이고, 곤충과 E. coli는 통상 정지 코돈으로 UAA를 이용한다 (Dalphin et al., 1996, Nucl Acids Res. 24: 216-8).

당해 기술 분야의 당업자는, 유전자 코드의 축중 특성으로 인해, 뉴클레오티드 서열에 차이가 있는 다양한 DNA 분자들을 사용하여 본원의 소정의 효소를 코딩할 수 있다는 것을 알 것이다. 전술한 생합성 효소를 코딩하는 천연 DNA 서열은 단지 본원의 일 구현예를 예시하기 위해 참조하며, 본원은 본원의 방법에서 사용되는 효소의 폴리펩타이드 및 단백질의 아미노산 서열을 코딩하는 임의의 서열의 DNA 분자를 포함한다. 비슷한 방식으로. 폴리펩타이드는 전형적으로 바람직한 활성의 소실 또는 유의한 소실 없이, 아미노산 서열에 하나 이상의 아미노산의 치환, 결손 및 삽입을 허용할 수 있다. 본원은, 변형된 또는 변이체 폴리펩타이드가 참조 폴리펩타이드의 효소적 이화 활성 또는 동화 활성을 가지는 한, 본원에 기술된 특정 단백질과 다른 아미노산 서열을 가진 상기한 폴리펩타이드를 포함한다. 아울런, 본원에 나타낸 DNA 서열에 의해 코딩되는 아미노산 서열은 단지 본원의 구현예들을 예시한다.

아울러, 본원에 제시된 조성물 및 방법에서 사용가능한 효소의 상동체도 본원에 포함된다. 일부 구현예들에서, 2종의 단백질 (또는 단백질의 영역)은, 아미노산 서열이 적어도 약 30%, 40%, 50% 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 가지는 경우에, 실질적으로 상동하다. 2종의 아미노산 서열 또는 2종의 핵산 서열의 동일성 %를 확인하기 위해, 서열들을 최상으로 비교할 목적으로 정렬한다 (예, 최적 정렬을 위해 제1 및 제2 아미노산 또는 핵산 서열 중 하나 또는 양쪽에 갭을 도입할 수 있으며, 비-상동적인 서열은 비교를 위해 무시할 수 있음). 일 구현예에서, 비교 목적으로 정렬한 기준 서열의 길이는 기준 서열의 길이의 적어도 30%, 전형적으로 적어도 40%, 보다 전형적으로 50%, 보다 더 전형적으로 적어도 60%, 보다 더 전형적으로 적어도 70%, 80%, 90%, 100%이다. 그 후 대응되는 아미노산 위치 또는 뉴클레오티드 위치에서 아미노산 잔기와 뉴클레오티드를 비교한다. 제1 서열의 한 위치에 제2 서열의 대응되는 위치와 동일한 아미노산 잔기 또는 뉴클레오티드가 있는 경우, 이 분자는 그 위치에서 동일하다 (본원에서, 아미노산 또는 핵산 "동일성 (identity)"은 아미노산 또는 핵산 "상동성"과 등가이다). 2개의 서열 간의 동일성 %는, 2종의 서열을 최적으로 정렬하기 위해 동입되어야 하는 갭 수와 각 갭의 길이를 고려하여, 서열들이 공유하는 동일한 위치의 갯수에 대한 함수이다.

"상동성"이 단백질 또는 펩타이드를 언급하는데 사용된다면, 동일하지 않은 잔기 위치들은 흔히 보존적인 아미노산 치환 차이가 있는 것으로 인지된다. "보존적인 아미노산 치환"은, 아미노산 잔기가 비슷한 화학적 특성 (예, 전하 또는 소수성)을 가진 측쇄 (R 기)를 가진 다른 아미노산 잔기로 치환된 것이다. 일반적으로, 보존적인 아미노산 치환은 단백질의 기능적인 특성을 실질적으로 바꾸지 않을 것이다. 2개 이상의 아미노산 서열이 보존적인 치환에 의해 서로 차이가 있을 경우, 서열의 동일성 % 또는 상동성 정도는 치환의 보존적인 특성을 보정하는 것 이상으로 조정될 수 있다. 이러한 조정을 가하는 수단은 당해 기술 분야의 당업자들에게 잘 알려져 있다 (예컨대, Pearson W. R., 1994, Methods in Mol Biol 25: 365-89).

다음과 같은 6가지 그룹들 각각은 서로에 대한 보존적인 치환인 아미노산을 포함한다: 1) 세린 (S), 트레오닌 (T); 2) 아스파르트산 (D), 글루탐산 (E); 3) 아스파라긴 (N), 글루타민 (Q); 4) 아르기닌 (R), 라이신 (K); 5) 이소루신 (I), 루신 (L), 알라닌 (A), 발린 (V), 및 6) 페닐알라닌 (F), 티로신 (Y), 트립토판 (W).

또한 서열 동일성 %로 언급되는 폴리펩타이드의 서열 상동성은, 전형적으로 서열 분석 소프트웨어를 이용하여 측정한다. 여러가지 유기체로부터 유래된 다수의 서열을 포함하는 데이타베이스에 대해 분자를 비교하는데 사용되는 전형적인 알고리즘은 컴퓨터 프로그램 BLAST이다. 여러가지 다수 유기체로부터 유래된 서열이 포함된 데이타베이스를 검색하는 경우, 아미노산 서열을 비교하는 것이 전형적이다.

아울러, 외래 효소를 코딩하는 임의 유전자 (또는 본원에 언급된 임의의 기타 (또는 이의 발현을 통제 또는 조절하는 임의의 조절 인자)는, 당해 기술 분야의 당업자에게 공지된, 방향성 진화 또는 합리적인 돌연변이 유발 등의 유전자/단백질 조작 기법에 의해 최적화할 수 있다. 이러한 행위는 당해 기술 분야의 당업자가 효모에서 효소의 발현 및 활성을 최적화할 수 있게 한다.

아울러, 이들 효소를 코딩하는 유전자는 다른 진균 및 세균 종들에서 동정할 수 있으며, 이 경로를 조절하도록 발현시킬 수 있다. 비제한적인 예로, 사카로마이세스 세레비지애 (S. cerevisiae) 및 사카로마이세스 우바룸 (S. uvarum) 등의 사카로마이세스 (Saccharomyces) spp., 클루이베로마이세스 써모톨러란스 (K. thermotolerans), 클루이베로마이세스 락티스 (K. lactis) 및 클루이베로마이세스 막시아누스 (K. marxianus) 등의 클루이베로마이세스 (Kluyveromyces) spp, 피키아 (Pichia) spp., 한세눌라 폴리모르파 (H. polymorpha) 등의 한세눌라 (Hansenula) spp., 칸디다 (Candida) spp., 트리코스포론 (Trichosporon) spp., 야마다지마 스티피티스 (Y. spp. stipitis) 등의 야마다지마 (Yamadazyma) spp., 토룰라스포라 프레토리엔시스 (Torulaspora pretoriensis), 이사첸키아 오리엔탈리스 (Issatchenkia orientalis), 스키조사카로마이세스 폼베 (S. pombe) 등의 스키조사카로마이세스 (Schizosaccharomyces) spp., 크립토코커스 (Cryptococcus) spp., 아스퍼질러스 (Aspergillus) spp., 뉴로스포라 (Neurospora) spp., 또는 우스틸라고 (Ustilago) spp. 등의, 다양한 유기체들이 이들 효소의 소스로서 사용될 수 있다. 혐기성 진균 유래 유전자의 소스로는, 비제한적으로, 피로마이세스 (Piromyces) spp., 오르피노마이세스 (Orpinomyces) spp., 또는 네오칼리마스틱스 (Neocallimastix) spp.를 포함한다. 사용가능한 원핵생물 효소의 소스로는, 비제한적으로, 에스케리키아 콜라이 (Escherichia coli), 자이모모나스 모빌리스 (Zymomonas mobilis), 스타필로코커스 아우레우스 (Staphylococcus aureus), 바실러스 (Bacillus) spp., 클로스트리듐 (Clostridium) spp., 코리네박테리움 (Corynebacterium) spp., 슈도모나스 (Pseudomonas) spp., 락토코커스 (Lactococcus) spp., 엔테로박터 (Enterobacter) spp., 및 살모넬라 (Salmonella) spp.를 포함한다.

당해 기술 분야에 공지된 기법들은 추가적인 상동성 유전자와 상동성 효소를 동정하는데 적합할 수 있다. 일반적으로, 유전자 상동체 및/또는 효소 상동체들을 기능적 분석을 통해 동정할 수 있으며, 기능적 유사성을 가질 것이다. 당해 기술 분야의 당업자에게 공지된 기법들은 유전자 유사체와 효소 유사체를 동정하는데 적합할 수 있다. 예를 들어, ADA 유전자, 단백질 또는 효소의 상동체 또는 유사체를 동정하기 위해, 비제한적으로, ADA 유전자/효소의 공개 서열을 토대로 한 프라이머를 이용한 PCR에 의해 또는 ADA 유전자들에서 보존적인 영역을 증폭하도록 설계된 축중 프라이머를 이용한 축중 PCR에 의해 유전자를 클로닝하는 등의, 기법들을 포함할 수 있다. 아울러, 당해 기술 분야의 당업자는 기능성 상동성 또는 유사성을 가진 유전자, 단백질 또는 효소의 상동체 또는 유사체를 동정하기 위해 기법들을 이용할 수 있다. 기법으로는 (예, 본원에 기술된 바와 같이, 또는 Kiritani, K., Branched-Chain Amino Acids Methods Enzymology, 1970에 기술된 바와 같이) 활성에 대한 시험관내 효소 분석을 통해 효소의 촉매 활성을 세포 또는 세포 배양물에서 검사한 다음, 정제를 통해 상기 활성을 가진 효소를 분리하고, 에드만 분해, 가능성 있는 핵산 서열에 대한 PCR 프라이머 설계, PCR을 통한 상기 DNA 서열의 증폭 및 상기 핵산 서열의 클로닝 등의 기법을 통해 효소의 단백질 서열을 결정하는 것을 포함한다. 상동적이거나 유사한 유전자 및/또는 상동적이거나 유사한 효소, 유전자 유사체 및/또는 효소 또는 단백질의 유사체를 동정하기 위해, 또한, 기법은 BRENDA, KEGG 또는 MetaCYC 등의 데이타베이스를 이용하여 후보 유전자나 효소에 대한 데이타를 비교하는 것을 포함한다. 후보 유전자 또는 효소는 본원의 교시 내용에 따라 전술한 데이타베이스에서 동정할 수 있다.

5.4 이소프레노이드의 생산 방법

다른 측면에서, 본 발명은, (a) 본원에 기술된 임의의 유전자 변형된 숙주 세포 개체군을 이소프레노이드 화합물을 제조하는데 적합한 조건 하에서 탄소원이 부가된 배지에서 배양하는 단계; 및 (b) 상기 배지로부터 상기 이소프레노이드 화합물을 회수하는 단계를 포함하는, 이소프레노이드의 생산 방법을 제공한다.

일부 구현예들에서, 유전자 변형된 숙주 세포는 ADA의 이종의 발현, NADH-가용성 HMG-CoA 리덕타제의 이종의 발현, AACS의 이종의 발현, 포스포케톨라제의 이종의 발현, 포스포트랜스아세틸라제의 이종의 발현, 및 한가지 이상의 메발로네이트 경로 효소의 이종의 발현으로 이루어진 군으로부터 선택되는 하나 이상의 변형을 포함하며; 유전자 변형된 숙주 세포는 상기 하나 이상의 변형을 포함하지 않는 부모 세포 또는 유전자 변형된 숙주 세포의 상기 하나 이상의 변형의 서브세트만을 포함하지만 유전적으로 동일한 부모 세포에 비해, 증가된 양으로 이소프레노이드 화합물을 생산한다. 일부 구현예들에서, 증가량은, 예를 들어 수율, 생산, 생산성을, 세포 배양물 L 당 g, 건조 세포 중량 g 당 mg, 세포 배양물 기준 (basis) 단위 체적 당, 건조 세포 중량 기준 단위 당, 세포 배양물 단위 부피/시간 기준 또는 건조 세포 중량 단위/단위 시간 기준으로 측정시, 적어도 1%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100% 또는 >100% 높다.

일부 구현예들에서, 숙주 세포는 발효 배지 L 당 약 10 g 이상의 증가된 수준으로 이소프레노이드를 생산한다. 일부 이러한 구현예에서, 이소프레노이드는 세포 배양물 L 당 약 10 - 약 50 g, > 약 15 g, > 약 20 g, > 약 25 g 또는 > 약 30 g으로 생산된다.

일부 구현예들에서, 숙주 세포는 건조 세포 중량 g 당 약 50 mg 이상의 증가된 수준으로 이소프레노이드를 생산한다. 일부 이러한 구현예에서, 이소프레노이드는 건조 세포 중량 g 당 약 50 - 약 1500 mg, > 약 100 mg, > 약 150 mg, > 약 200 mg, > 약 250 mg, > 약 500 mg, > 약 750 mg, 또는 > 약 1000 mg으로 생산된다.

일부 구현예들에서, 숙주 세포는, 세포 배양물 기준 단위 부피 당, 부모 세포에서 생산되는 이소프레노이드 수준의, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배이거나 또는 그 보다 많은, 증가된 수준으로 이소프레노이드를 생산한다.

일부 구현예들에서, 숙주 세포는, 건조 세포 중량 기준 단위 당, 부모 세포에서 생산되는 이소프레노이드 수준의, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2. 5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배 또는 적어도 약 1,000배이거나 또는 그 보다 많은, 증가된 수준으로 이소프레노이드를 생산한다.

일부 구현예들에서, 숙주 세포는, 세포 배양물 단위 부피/단위 시간 기준 당, 부모 세포에서 생산되는 이소프레노이드 수준의, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2. 5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배 또는 적어도 약 1,000배이거나 또는 그 보다 많은, 증가된 수준으로 이소프레노이드를 생산한다.

일부 구현예들에서, 숙주 세포는, 건조 세포 중량 단위/단위 시간 기준 당, 부모 세포에서 생산되는 이소프레노이드 수준의, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배 또는 적어도 약 1,000배이거나 또는 그 보다 많은, 증가된 수준으로 이소프레노이드를 생산한다.

대부분의 구현예들에서, 숙주 세포에 의한 증가된 수준으로의 이소프레노이드 생산은 유도성 화합물에 의해 유도가능하다. 이러한 숙주 세포는 상기 유도성 화합물의 부재시에 쉽게 조작할 수 있다. 유도성 화합물을 그런 후 첨가하여 숙주 세포에서 증가된 수준으로 이소프레노이드를 생산하도록 유도한다. 다른 구현예들에서, 숙주 세포에 의한 증가된 수준으로의 이소프레노이드 생산은 예를 들어 배양 온도, 배지 조성 등의 배양 조건에 변화를 줌으로써 유도가능하다.

5.4.1 배양 배지 및 조건

미생물 배양물을 유지 및 증식시키기 위한 재료와 방법들은 미생물학 또는 발효 과학 분야의 당업자들에게 잘 알려져 있다 (예를 들어, Bailey et al., Biochemical Engineering Fundamentals, second edition, McGraw Hill, New York, 1986). 숙주 세포의 특이적인 요구성, 발효 및 공정에 따라, 적절한 배양 배지, pH, 온도 및 호기, 미세호기 또는 혐기성 조건 등의 요건에 대해 고려가 이루어져야 한다.

본원에 제공되는 이소프레노이드 생산 방법은, 비제한적인 예로, 세포 배양 플레이트, 플라스크 또는 발효기 등의 적정 용기에서, 적정 배양 배지 (예, 판토테네이트 보충물이 첨가되거나 첨가되지 않은 배지)에서 수행될 수 있다. 또한, 본 방법은 미생물 생산의 산업적인 생산을 뒷받침하기 위해 당해 기술 분야에 공지된 임의의 발효 규모로 수행할 수 있다. 교반형 탱크 발효기, 에어리프트 발효기, 버블 발효기 또는 이들의 임의 조합 등의 임의의 적정 발효기가 사용될 수 있다. 숙주 세포로서 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)를 사용하는 특정 구현예에서, 균주는 Kosaric, et al, in Ullmann's Encyclopedia of Industrial Chemistry, Sixth Edition, Volume 12, pages 398-473, Wiley-VCH Verlag GmbH & Co. KDaA, Weinheim, Germany에 상세하게 기술된 발효기에서 배양할 수 있다.

일부 구현예들에서, 배양 배지는 이소프레노이드를 생산할 수 있는 유전자 변형된 미생물을 존속시킬 수 있는, 즉 증식과 생존을 유지시킬 수 있는, 모든 배양 배지이다. 일부 구현예들에서, 배양 배지는 동화할 수 있는 탄소원, 질소원 및 인원을 포함하는 수성 배지이다. 또한, 이러한 배지는 적정 염, 미네랄, 금속 및 기타 영양분을 포함할 수 있다. 일부 구현예들에서, 탄소원과 세포 필수 영양분들 각각은 발효 배지에 증가시키면서 또는 계속적으로 첨가하며, 각각의 필요 영양분은, 예를 들어, 탄소원을 바이오메스로 변환하는 세포의 대사 기능 또는 호흡 작용을 기초로 사전 결정된 세포 생육 곡선에 따라, 기본적으로 증식하는 세포에 의한 효율적인 동화에 필요한 최소 수준으로 유지된다.

미생물을 배양하기 위한 적정 조건과 적정 배지는 당해 기술 분야에 잘 공지되어 있다. 일부 구현예들에서, 적정 배지에는, 예를 들어, 유도제 (예, 유전자 산물을 코딩하는 하나 이상의 뉴클레오티드 서열이 유도 프로모터의 통제를 받는 경우), 억제제 (예, 유전자 산물을 코딩하는 하나 이상의 뉴클레오티드 서열이 억제 프로모터의 통제를 받는 경우), 또는 선별 물질 (예, 유전자 변형을 포함하는 미생물을 선별하기 위한 항생제) 등의 한가지 이상의 추가적인 물질이 보충된다.

일부 구현예들에서, 탄소원은 단당류 (단순 당), 이당류, 다당류, 비-발효성 탄소원 또는 이들의 하나 이상의 조합이다. 적합한 단당류에 대한 비제한적인 예로는 글루코스, 갈락토스, 만노스, 프럭토스, 리보스 및 이들의 조합을 포함한다. 적합한 이당류에 대한 비제한적인 예로는 슈크로스, 락토스, 말토스, 트레할로스, 셀로바이오스 (cellobiose) 및 이들의 조합을 포함한다. 적합한 다당류에 대한 비제한적인 예로는 스타치, 글리코겐, 셀룰로스, 키틴, 및 이들의 조합을 포함한다. 적합한 비-발효성 탄소원에 대한 비제한적인 예로는 아세테이트와 글리세롤을 포함한다.

배양 배지에서 글루코스와 같은 탄소원의 농도는 세포의 증식을 촉진시키지만, 사용되는 미생물의 증식을 억제할 만큼 높지 않아야 한다. 전형적으로, 배양은, 원하는 증식 및 바이오메스 수준을 달성하기 위한 수준이지만 미미한 수준 (검출 한계가 약 < 0.1g/l임)으로 첨가하면서 글루코스와 같은 탄소원과 함께 진행된다. 다른 구현예들에서, 글루코스와 같은 탄소원의 배양 배지에서의 농도는 > 약 1 g/L, 바람직하게는 > 약 2 g/L, 더 바람직하게는 > 약 5 g/L이다. 또한, 글루코스와 같은 탄소원의 배양 배지에서의 농도는 전형적으로 < 약 100 g/L, 바람직하게는 < 약 50 g/L, 더 바람직하게는 < 약 20 g/L이다. 배지 성분 농도에 대한 언급은 처음 및/또는 진행 중인 성분의 농도 둘다를 지칭할 수 있는 것임에 유념하여야 한다. 어떤 경우에는, 배양 중에 탄소원이 고갈되도록 배양 배지를 두는 것이 바람직할 수도 있다.

적합한 배양 배지에 사용할 수 있는 동화가능한 질소원으로는, 비제한적으로, 단순 질소원, 유기 질소원 및 복합 질소원을 포함한다. 이러한 질소원으로는 동물, 식물 및/또는 미생물 기원의 무수 암모니아, 암모늄 염 및 기질을 포함한다. 적합한 질소원으로는, 비제한적으로, 단백질 가수분해물, 미생물 바이오메스 가수분해물, 펩톤, 효모 추출물, 암모늄 설페이트, 우레아 및 아미노산을 포함한다. 전형적으로, 배양 배지내 질소원의 농도는 > 약 0.1 g/L, 바람직하게는 > 약 0.25 g/L, 더 바람직하게는 > 약 1.0 g/L이다. 그러나, 특정 농도를 초과하여, 배양 배지에 질소원을 첨가하는 것은 미생물의 배양에 유익하지 않다. 그 결과, 배양 배지내 질소원의 농도는 < 약 20 g/L, 바람직하게는 < 약 10 g/L, 더 바람직하게는 < 약 5 g/L이다. 또한, 일부 경우들에서는, 배양 중에 배양 배지에서 질소원이 고갈되게 하는 것이 바람직할 수 있다.

유효 배양 배지는 무기염, 비타민, 미량 금속 및 증식 촉진제 등의 다른 화합물도 포함할 수 있다. 또한, 이러한 다른 화합물들은 유효 배지에 탄소원, 질소원 또는 미네랄원으로서 존재하거나, 또는 배지에 특이적으로 첨가될 수 있다.

또한, 배양 배지는 적정 인원을 포함할 수 있다. 이러한 인원으로는 무기 인원과 유기 인원을 둘다 포함한다. 바람직한 인원으로는, 비제한적으로, 모노 또는 다이베이직 소듐 및 포타슘 포스페이트 등의 포스페이트 염, 암모늄 포스페이트 및 이의 혼합물을 포함한다. 전형적으로, 배양 배지에서 인 농도는 > 약 1.0 g/L, 바람직하게는 > 약 2.0 g/L, 더 바람직하게는 > 약 5.0 g/L이다. 그러나, 특정 농도를 초과하여, 배양 배지에 인을 첨가하는 것은 미생물의 배양에 유익하지 않다. 즉, 배양 배지내 인 농도는 전형적으로 < 약 20 g/L, 바람직하게는 < 약 15 g/L, 더 바람직하게는 < 약 10 g/L이다.

또한, 배양 배지는 적정 마그네슘 소스를, 비슷한 양의 마그네슘에 기여하는 농도로 다른 마그네슘 소스들도 사용될 수 있지만, 바람직하게는 마그네슘 설페이트 헵타하이드레이트 등의 생리적으로 허용가능한 염 형태로, 포함할 수 있다. 전형적으로, 배양 배지에서 마그네슘의 농도는 > 약 0.5 g/L, 바람직하게는 > 약 1.0 g/L, 더 바람직하게는 > 약 2.0 g/L이다. 그러나, 특정 농도를 초과하여, 배양 배지에 마그네슘을 첨가하는 것은 미생물의 배양에 유익하지 않다. 즉, 배양 배지내 마그네슘의 농도는 전형적으로 < 약 10 g/L, 바람직하게는 < 약 5 g/L, 더 바람직하게는 < 약 3 g/L이다. 또한, 어떤 경우에는, 배양 중에 배양 배지에서 마그네슘 소스를 고갈되게 하는 것이 바람직할 수 있다.

일부 구현예들에서, 배양 배지는 트리소듐 사이트레이트의 이수화물 (dihydrate) 등의 생물학적으로 허용가능한 킬레이트를 또한 포함할 수 있다. 이 경우, 배양 배지내 킬레이트의 농도는 > 약 0.2 g/L, 바람직하게는 > 약 0.5 g/L, 더 바람직하게는 > 약 1 g/L이다. 그러나, 특정 농도를 초과하여, 배양 배지에 킬레이트제를 첨가하는 것은 미생물의 배양에 유익하지 않다. 즉, 배양 배지내 킬레이트제의 농도는 전형적으로 < 약 10 g/L, 바람직하게는 < 약 5 g/L, 더 바람직하게는 < 약 2 g/L이다.

또한, 배양 배지는 배양 배지의 바람직한 pH를 유지하기 위해 생물학적으로 허용가능한 산 또는 염기를 처음에 포함할 수 있다. 생물학적으로 허용가능한 산으로는, 비제한적으로, 염산, 황산, 질산, 인산 및 이의 혼합물을 포함한다. 생물학적으로 허용가능한 염기로는, 비제한적으로, 암모늄 하이드록사이드, 소듐 하이드록사이드, 포타슘 하이드록사이드 및 이의 혼합물을 포함한다. 일부 구현예들에서, 사용되는 염기는 암모늄 하이드록사이드이다.

또한, 배양 배지는, 비제한적인 예로, 칼슘 클로라이드 등의 생물학적으로 허용가능한 칼슘염을 포함할 수 있다. 전형적으로, 칼슘 클로라이드, 이수화물 등의 칼슘원의 배양 배지에 농도는 약 5 mg/L - 약 2000 mg/L, 바람직하게는 약 20 mg/L - 약 1000 mg/L, 더 바람직하게는 약 50 mg/L - 약 500 mg/L의 범위이다.

또한, 배양 배지는 소듐 클로라이드를 포함한다. 전형적으로, 배양 배지에서 소듐 클로라이드의 농도는 약 0.1 g/L - 약 5 g/L, 바람직하게는 약 1 g/L - 약 4 g/L, 더 바람직하게는 약 2 g/L - 약 4 g/L의 범위이다.

일부 구현예들에서, 배양 배지는 또한 미량 금속을 포함할 수 있다. 이러한 미량 금속은, 편의상, 배양 배지의 나머지 부분과 별도로 준비할 수 있는, 스톡 용액으로서 배양 배지에 첨가할 수 있다. 전형적으로, 배양 배지에 첨가되는 이러한 미량 금속 용액의 양은 > 약 1 ml/L, 바람직하게는 > 약 5 mL/L, 더 바람직하게는 > 약 10 mL/L이다. 그러나, 특정 농도를 초과하여, 배양 배지에 미량 금속을 첨가하는 것은 미생물의 배양에 유익하지 않다. 즉, 배양 배지에 첨가되는 미량 금속 용액은 전형적으로 < 약 100 mL/L, 바람직하게는 < 약 50 mL/L, 더 바람직하게는 < 약 30 mL/L이다. 아울러, 스톡 용액에 미량 금속을 첨가하기 위해, 개개 성분들을, 미량 금속 용액의 상기 범위로 표시된 성분들의 양에 독립적으로 해당되는 범위로 각각 개별적으로 첨가할 수 있다는 것에 유념하여야 한다.

배양 배지는 판토테네이트, 바이오틴, 칼슘, 판토테네이트, 이노시톨, 피리독신-HCl 및 티아민-HCl 등의 다른 비타민을 포함할 수 있다. 이 비타민을, 편의상, 배양 배지의 나머지 부분과 별도로 준비할 수 있는, 스톡 용액으로서 배양 배지에 첨가할 수 있다. 그러나, 특정 농도를 초과하여, 배양 배지에 비타민을 첨가하는 것은 미생물의 배양에 유익하지 않다.

본원에 기술된 발효 방법은, 비제한적으로, 배치식, 피드-배치식, 세포 리사이클, 연속 및 반-연속식을 포함하는, 통상적인 배양 방식으로 수행할 수 있다. 일부 구현예들에서, 발효는 피드-배치 모드로 수행한다. 이러한 예에서, 배지 성분들의 일부는 배양 중에, 예컨대 판토테네이트는 발효의 생산 단계 중에 고갈된다. 일부 구현예들에서, 증식 및/또는 이소프레노이드 생산이 첨가가 필요한 시점 이전에 일정 기간 동안 유지되도록, 배양물에, 예를 들어, 생산 단계의 시작시에 상기한 성분을 상대적으로 고 농도로 첨가할 수 있다. 이들 성분들의 바람직한 범위는 수준이 배양에 의해 고갈됨에 따라 첨가함으로써 배양 중에 유지시킨다. 배양 배지내 성분들의 수준은, 예를 들어, 배양 배지를 주기적으로 샘플링하여 농도를 분석함으로써, 모니터링할 수 있다. 다른 예로, 표준 배양 공정이 전개되면, 배양 중 특정 시점에 공지된 수준에 해당되는 시간 조절된 간격으로 첨가를 행할 수 있다. 당해 기술 분야의 당업자에게 공지되는 바와 같이, 배지의 세포 밀도가 증가됨에 따라 배양 중에 영양분의 소비 속도는 빨라진다. 아울러, 외래 미생물이 배양 배지에 도입되는 것을 방지하기 위해, 당해 기술 분야에 공지된 바와 같이, 무균 첨가 방법을 이용하여 첨가한다. 아울러, 소포제 (anti-foaming agent)도 소량 배양 중에 첨가할 수 있다.

배양 배지의 온도는 유전자 변형된 세포의 배양 및/또는 이소프레노이드의 생산에 적합한 모든 온도일 수 있다. 예를 들어, 배양 배지에 접종물을 접종하기 전에, 배양 배지를 약 20℃ - 약 45℃, 바람직하게는 약 25℃ - 약 40℃, 더 바람직하게는 약 28℃ - 약 32℃의 범위내 온도로 만들어 유지할 수 있다.

배양 배지의 pH는 배양 배지에 산 또는 염기를 첨가함으로써 조절할 수 있다. pH를 조절하기 위해 암모니아를 사용하는 경우, 배양 배지에 질소원으로서 이것이 편리하게 사용된다. 바람직하게는, pH는 약 3.0 - 약 8.0, 더 바람직하게는 약 3.5 - 약 7.0, 가장 바람직하게는 약 4.0 - 약 6.5로 유지된다.

일부 구현예들에서, 배양 배지의 글루코스 농도 등의 탄소원 농도는 배양 중에 모니터링한다. 배양 배지의 글루코스 농도는, 예를 들어, 상층액, 예컨대 배양 배지의 무세포성 성분에서 글루코스 농도를 모니터링하는데 사용할 수 있는, 글루코스 옥시다제 효소 테스트 또는 고압 액체 크로마토그래피를 이용하는 등의, 공지 기법을 이용하여 모니터링할 수 있다. 이전에 언급된 바와 같이, 탄소원의 농도는 세포 배양 저해가 이루어지는 수준 보다 낮게 유지되어야 한다. 이 농도는 유기체에 따라 달라질 수 있지만, 탄소원으로서 글루코스의 경우, 세포 배양 저해는, > 약 60 g/L의 글루코스 농도에서 이루어지며, 실험을 통해 쉽게 측정할 수 있다. 즉, 탄소원으로서 글루코스를 사용하는 경우, 글루코스가 바람직하게는 발효기에 공급되며 검출 한계 이하로 유지된다. 다른 예로, 배양 배지내 글루코스 농도는 약 1 g/L - 약 100 g/L, 더 바람직하게는 약 2 g/L - 약 50 g/L, 더 더 바람직하게는 약 5 g/L - 약 20 g/L의 범위로 유지된다. 탄소원의 농도는 예를 들어 실질적으로 순수한 글루코스 용액을 첨가함으로써 바람직한 수준으로 유지시킬 수 있지만, 오리지날 배양 배지의 분액을 첨가함으로써 배양 배지의 탄소원 농도를 유지하는 것이 허용되며, 바람직할 수 있다. 오리지날 배양 배지의 분액 사용은, 배지내 다른 영양분의 농도 (예, 질소원 및 인원)를 동시에 유지시킬 수 있기 때문에, 바람직할 수 있다. 이와 같이, 미량 금속 농도도 미량 금속 용액의 분액을 첨가함으로써 배양 배지에서 유지시킬 수 있다.

5.4.2 이소프레노이드 회수

숙주 세포에서 이소프레노이드가 생산되면, 이는 당해 기술 분야에 공지된 방법으로 임의의 적정 분리 및 정제를 이용하여 후속적인 사용을 위해 회수 또는 분리할 수 있다. 일부 구현예들에서, 원심분리에 의해 발효물로부터 이소프레노이드를 포함하는 유기상을 분리한다. 다른 구현예들에서, 이소프레노이드를 포함하는 유기상을 발효물로부터 자연적으로 분리한다. 다른 구현예들에서, 이소프레노이드를 포함하는 유기상은 발효 반응물에 탈유화제 (deemulsifier) 및/또는 핵제 (nucleating agent)를 첨가함으로써, 발효물로부터 분리한다. 탈유화제에 대한 예시적인 예로는 응결제 및 응집제를 포함한다. 핵제에 대한 예시적인 예로는 이소프레노이드 자체와 도데칸, 이소프로필 미리스트레이트 및 메틸 올리에이트 등의 유기 용매로 구성된 액적을 포함한다.

이들 세포에서 생산되는 이소프레노이드는 배양 상층물에 존재하거나 및/또는 숙주 세포와 조합하여 존재할 수 있다. 이소프레노이드가 숙주 세포와 조합하여 존재하는 구현예에서, 이소프레노이드의 회수는 세포를 투과화하거나 세포 용혈시키는 방법을 포함한다. 다른 예로, 또는 동시에, 배양 배지내 이소프레노이드는, 비제한적인 예로, 크로마토그래피, 추출, 용매 추출, 막 분리, 전기투석, 역 삼투, 증류, 화학 유도체화 및 결정화 등의, 회수 공정을 이용하여 회수할 수 있다.

일부 구현예들에서, 이소프레노이드는 유기 상에 존재할 수 있는 다른 산물들로부터 분리한다. 일부 구현예들에서, 분리는 흡착, 증류, 가스-액체 추출 (스트립핑), 액체-액체 추출 (용매 추출), 한외여과 및 표준 크로마토그래피 기법을 이용하여 달성한다.

6. 실시예

6.1 실시예 1:

NADH-특이적인 HMG-CoA 리덕타제의 동정 및 특정화

본 실시예는 NADH 조인자 특이성을 가지는 것으로 이전에 공지되지 않은 HMG-CoA 리덕타제의 동정과 특정화에 대해 기술한다.

6.1.1 재료 및 방법

6.1.1.1 균주 조작

야생형 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 균주 (CEN.PK2, Mat a, ura3 ^- , TRP1⁺, leu2 ^- , MAL2-8C, SUC2)를 메발로네이트 (MevT) 경로를 발현하기 위한 숙주 세포로 사용하였다 (이로써, 아세틸-CoA 티올라제 (ERG10)는 아세틸-CoA를 아세토아세틸-CoA로 변환함; HMG-CoA 신타제 (ERG13)는 아세토아세틸-CoA를 HMG-CoA로 변환함; HMG-CoA 리덕타제는 HMG-CoA를 메발로네이트로 변환함 (도 1)).

본 균주를, 스타필로코커스 아우레우스 (Staphylococcus aureus) (ZP_06815052), 헤르페토시폰 아우란티아쿠스 (Herpetosiphon aurantiacus) (YP_001546303), 슈도모나스 메발로니 (Pseudomonas mevalonii) (P13702), 델프티아 액시도보란스 (Delftia acidovorans) (YP_001561318), 멘타노세이타 써모필라 (Menthanosaeta thermofila) (YP_843364) 또는 살리시박터 포메오이리 (Silicibacter pomeoyri) (YP_164994)로부터 유래된 이종의 클래스 II HMG-CoA 리덕타제; 또는 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) HMG-CoA 리덕타제 (tHMG-CoA 리덕타제) (EEU05004)의 N-말단이 절단된 버전 중 어느 하나를 코딩하는 플라스미드로 형질전환하였다. 클래스 II HMG-CoA 리덕타제는 효모에서의 발현을 위해 코돈 최적화되었으며, C-말단 FLAG-HIS 테그를 가미하여 화학적으로 합성하였으며, 단 슈도모나스 메발로니 (P. mevalonii) HMG-CoA 리덕타제는 다음과 같은 부가적인 변형을 가미하여 합성하였다.

NotI 사이트 - GAL1 프로모터 - NdeI 사이트 - [슈도모나스 메발로니 (P. mevalonii) HMG-CoA 리덕타제] - EcoRI 사이트 - FLAG 테그 - HIS 테그 - 정지 코돈 - PGK1 종결인자 - NotI 사이트

이 DNA를 pBluescript SK+ 벡터 (Stratagene)의 NotI 사이트에 클로닝하였다. 야생형 CENPK2 균주의 게놈 DNA 추출물을 주형으로 이용하고, 올리고뉴클레오티드인 YT_164_30_Gal7F (5' 말단에 SacI과 NotI 제한 효소 부위가 포함됨)와 YT_164_30_Gal7R (3'-말단에 NdeI 제한 효소 부위가 포함됨)를 이용하여, 효모 Gal7 프로모터를 PCR로 증폭하였다 (표 2). PCR 산물을 pCR II-TOPO 벡터 (Invitrogen)에 클로닝하였다. 양 플라스미드를 SacI과 NotI으로 자르고, 절단된 Sc.GAL7 프로모터를 이용하여 슈도모나스 메발로니 (P. mevalonii) HMG-CoA 리덕타제 유전자의 상류 Gal1 프로모터와 치환하였다. 제조되는 플라스미드와 pAM70 (서열번호 23), 즉 URA3 마커를 가진 효모 에피좀 벡터 pRS426 둘다를 NotI으로 절단하였다. 그런 후, pAM70의 NotI 절단부에 NotI 단편을 연결함으로써, 플라스미드 pAM01147 (서열번호 24)을 구축하였다. 이 플라스미드는, 플라스미드를 NdeI과 EcoRI으로 자른 후, 5'-말단과 3'-말단에 각각 NdeI 및 EcoRI 사이트를 가지는 절단한 대상 HMG-CoA 리덕타제 코딩 서열과 연결함으로써, 슈도모나스 메발로니 (P. mevalonii) HMG-CoA 리덕타제 코딩 서열을 임의의 대상 HMG-CoA 리덕타제 코딩 서열 (효모 tHMG-CoA 리덕타제가 포함됨)로 치환하기 위한 베이스 플라스미드로 사용하였다. 플라스미드 DNA 증폭은 에스케리키아 콜라이 (Escherichia coli) 균주 DH5알파에서 수행하였다. 그 후, 균주 Y1389에 여러가지 HMG-CoA 리덕타제의 코딩 서열을 보유한 플라스미드를 형질전환하고, 형질전환체를 2% 글루코스가 포함된 우라실 무첨가 CSM 배지 플레이트에서 선별하였다. 사카로마이세스 세레비지애 (S. cerevisiae)로의 모든 DNA 매개 형질전환은, Gietz RW and Woods RA, Guide to Yeast Genetics and Molecular and Cell Biology, Part B. San Diego, CA: Academic Press Inc. pp. 87-96 (2002)에 기술된 바와 같은, 표준 리튬 아세테이트 공정을 이용하여 수행하였다.

Sc. 아세토아세틸-CoA 티올라제 (ERG10) 및 Sc.HMG-CoA 신타제 (ERG13)의 게놈내 삽입은, 하기 나타낸 삽입 구조체 (서열번호 25)를 이용하여 숙주 균주의 Gal80 유전자 좌를 타겟팅하였다.

삽입 구조체의 각 성분을 주형으로 Y002 게놈 DNA 100 ng을 이용하여 PCR 증폭하였다. -1000에서 -1 위치의 상류 GAL80 유전자 좌의 PCR 증폭을 올리고뉴클레오티드 YT_164_36_001 및 YT_164_36_003 (표 2)을 이용하여 수행하였다. 효모 ERG10 및 ERG13 유전자의 PCR 증폭은, ERG13의 경우 올리고뉴클레오티드들 YT_164_36_002 및 YT_164_36_005와, ERG10의 경우 YT_164_36_006 및 YT_164_36_009 쌍을 이용하여 수행하였다. 올리고뉴클레오티드들 YT_164_36_004 및 YT_164_36_007을 사용하여 GAL1/10 프로모터를 증폭하였으며, 프라이머 YT_164_36_008 및 YT_164_36_011은 이를 이용하여 LEU2 유전자를 증폭하였다. (정지 코돈 이후의) 23에서 1000에 위치한 하류 GAL80 유전자 좌는 올리고뉴클레오티드들 YT_164_36_010 및 YT_164_36_012를 이용하여 PCR 증폭하였다. 각 DNA 조각 100 fmol을 하나의 시험관에 넣고, 프라이머 YT_164_36_001과 YT_164_36_012를 이용한 스티칭 PCR 반응에 의해 조립하였다. 예상된 분자량을 가지는 PCR 산물들을 겔에서 정제하였다.

표 2. 균주 조작에 사용된 프라이머들

프라이머 명	서열번호	프라이머 서열
YT_164_36_001	서열번호 26	GCCTGTCTACAGGATAAAGACGGG
YT_164_36_002	서열번호 27	TCCCGTTCTTTCCACTCCCGTCTATATATATATCATTGTTATTA
YT_164_36_003	서열번호 28	TAATAACAATGATATATATATAGACGGGAGTGGAAAGAACGGGA
YT_164_36_004	서열번호 29	CCAACAAAGTTTAGTTGAGAGTTTCATTTATATTGAATTTTCAAAAATTCTTAC
YT_164_36_005	서열번호 30	GTAAGAATTTTTGAAAATTCAATATAAATGAAACTCTCAACTAAACTTTGTTGG
YT_164_36_006	서열번호 31	GTCAAGGAGAAAAAACTATAATGTCTCAGAACGTTTACATTGTATCGACTGCCAGAACCC
YT_164_36_007	서열번호 32	GGGTTCTGGCAGTCGATACAATGTAAACGTTCTGAGACATTATAGTTTTTTCTCCTTGAC
YT_164_36_008	서열번호 33	GTGTGCCTTTTGACTTACTTTTACGTTGAGCCATTAGTATCA
YT_164_36_009	서열번호 34	TGATACTAATGGCTCAACGTAAAAGTAAGTCAAAAGGCACAC
YT_164_36_010	서열번호 35	GATATTTCTTGAATCAGGCGCCTTAGACCCCCCAGTGCAGCGAACGTTATAAAAAC
YT_164_36_011	서열번호 36	GTTTTTATAACGTTCGCTGCACTGGGGGGTCTAAGGCGCCTGATTCAAGAAATATC
YT_164_36_012	서열번호 37	AAATATGACCCCCAATATGAGAAATTAAGGC
YT_164_30_Gal3F	서열번호 38	GAGCTCGCGGCCGC GTACATACCTCTCTCCGTATCCTCGTAATCATTTTCTTGT
YT_164_30_Gal3R	서열번호 39	CATATGACTATGTGT TGCCCTACCTTTTTACTTTTATTTTCTCTTT
YT_164_30_Gal7F	서열번호 40	GAGCTCGCGGCCGC GTGTCACAGCGAATTTCCTCACATGTAGGGACCGAATTGT
YT_164_30_Gal7R	서열번호 41	CATATGTTTTGAGGGAATATTCAACTGTTTTTTTTTATCATGTTGA
RYSE 0	서열번호 42	GACGGCACGGCCACGCGTTTAAACCGCC
RYSE 19	서열번호 43	CCCGCCAGGCGCTGGGGTTTAAACACC

(전술한) 여러가지 HMG-CoA 리덕타제로 형질전환된 Y1389 유도체에, 아래 표 3에 열거된 균주를 구축하기 위해, ERG 10/ERG13 삽입 구조체를 형질전환하였다. 형질전환체들을 우라실과 루신이 무첨가된 2% 글루코스를 함유하는 CSM 배지 플레이트에서 선별하였다. 모든 유전자 파괴 및 치환은 표현형 분석과 콜러니 PCR로 검증하였다.

표 3: 균주 설명

균주 #	설명	adh1 낫 아웃한 이후의 균주 #
Y1431	사카로마이세스 세레비지애 (Saccharomyces cerevisiae) tHMG-CoA 리덕타제를 구비한 MevT	Y1804
Y1432	스타필로코커스 아우레우스 (S. aureus) HMG-CoA 리덕타제를 구비한 MevT
Y1433	슈도모나스 메발로니 (P. mevalonii) HMG-CoA 리덕타제를 구비한 MevT	Y1805
Y1435	델프티아 액시도보란스 (D. acidovorans) HMG-CoA 리덕타제를 구비한 MevT	Y1806
Y1436	멘타노세이타 써모필라 (M. thermofila) HMG-CoA 리덕타제를 구비한 MevT
Y1486	헤르페토시폰 아우란티아쿠스 (H. aurantiacus) HMG-CoA 리덕타제를 구비한 MevT
Y1487	실리시박터 포메로이(S. pomeroyi) HMG-CoA 리덕타제를 구비한 MevT	Y1807

균주 Y1431, Y1433, Y1435 및 Y1487의 경우, ADH1 유전자는 하기 나타낸 파괴 구조체를 이용하여 낫아웃하였다 (서열번호 44):

파괴 구조체는 미국 특허 8,221,982에 기술된 폴리뉴클레오티드 조립 방법에 의해 제작하였다. 삽입 구조체의 ADH1 5' 상동성 영역은 ADH1 코딩 서열의 -563에서 -77 위치와 상동적이며, ADH1 3' 상동성 영역은 (ADH1 유전자의 정지 코돈 하류) 87에서 538 위치와 상동적이다. 프라이머 RYSE 0 및 RYSE 19를 사용하여 산물을 증폭시켰다. 균주 Y1431, Y1433, Y1435 및 Y1487 (표 2)은 산물로 형질전환하였고, 형질전환체를 2% 글루코스 및 G418 (제네티신 (Geneticin))이 첨가된 YPD 배지 플레이트에서 선별하였다. ADH1 유전자의 파괴는 표현형 분석과 콜로니 PCR로 검증하였다.

6.1.1.2 세포 배양

해당 효모 균주의 콜로니 하나를 2% 슈크로스가 첨가된 효모 질소 베이스 (YNB) 3 ml에서 밤새 스타터 배양으로서 배양하였다. 다음날, 250 ml 일회용 PETG 멸균 플라스크 (Nalgene)에서 40 ml YNB-4% 슈크로스 생산용 배양 배지에서 배양한 스타터 배양물을 최초 OD₆₀₀ 0.05로 희석하여, 생산용 플라스크를 준비하였다. 이 플라스크는 아래 나타낸 기간 동안 250 RPM으로 교반하면서 30℃에서 인큐베이션하였다.

6.1.1.3 세포 무함유성 추출물을 이용한 HMG-CoA 리덕타제의 활성 분석

효모 세포를 HMG-CoA 리덕타제 활성 분석 (도 8)을 위해 48시간, 또는 메발로네이트 분석 (표 4)을 위해 72시간 배양하고, 15 mL 팔콘 시험관에서 팔콘 시험관용의 적절한 캐리지가 장착된 스윙 버켓 로터 JS-5.3를 이용하여 10분간 4000 x g로 원심분리하여 회수하였다. 세포 펠렛을 1 ml에 재현탁하고, 차가운 세포용혈 완충액 (100 mM Tris pH 7.0 + Mini, EDTA 프리 프로테아제 저해제 정제 (Roche) 추가됨, 1 mM DTT 및 1 mM EDTA)으로 1번 헹구었다. 그런 후, 세포를 O 고리 캡이 장착된 2 mL 플라스틱 스크류 캡의 마이크로퓨즈 시험관 (Fisher Brand 520-GRD)으로 옮기고, 파괴 비드 (Disruption beads, 0.5Mm, Fisher)와 비드 비터를 6 M/S으로 1분간 사용하여, 세포를 용혈시켰다. 이 시험관을 즉시 빙수조에 적어도 5분간 두었다. 시헌관을 20분간 최소 8000 x g로 원심분리하였다. 상층액을 새로운 차가운 시험관으로 옮겼다. 단백질에 대한 고전적인 브래드포드 분석을 이용하여 단백질 농도를 측정하였다 (Bradford MM A rapid and sensitive method for quantitation of microgram quantities of protein utilizing the principle of protein-dye binding. Anal. Biochem 72, 248-254 (1976)).

HMG-CoA 리덕타제 분석을 위해, 반응 완충액 (100 mM 포스페이트 완충제 pH 7.0, 100 mM KCl, 1 mM DTT + 1 mM EDTA)을 먼저 30℃에서 96웰 플레이트에서 예비-인큐베이션하였다. 최종 농도 150 μM으로 NADH 또는 NADPH, 최종 농도 400 μM으로 HMG-CoA 및 최종 농도 5 mM으로 DTT를 각 웰에 최종 부피 190 ㎕로 첨가하였다. 분석은, 먼저, 직선형 활성 범위로 희석한 세포 무함유 추출물을 10 ㎕ 첨가함으로써 개시하였다. 반응물은 Molecular Devices Spectramax M5 플레이트 리더를 이용하여 340 nm에서 NADPH 또는 NADH 흡광도 감소를 측정함으로써, 모니터링하였다. 340 nm에서의 단백질 농도에 따른 흡광 곡선의 기울기를 이용하여 각 세포-무함유 추출물에서의 HMGr 비활성을 계산하였다.

6.1.1.4 유기 산 및 알코올 측정

유기 산 및 알코올 분석용 샘플은, 발효 배지 1 ml을 취한 후, 이를 1.5 ml 에펜도르프 관에 넣어 준비하였다. 샘플을 테이블 에펜도르프 원심분리기를 이용하여 13,000 RPM으로 1분간 회전시켰다. 그런 후, 상층액을 15 mM 황산에 희석 (1:1 v/v)하였다. 혼합물을 볼텍싱하고, 13,000 RPM으로 1분간 원심분리하였다. 투명해진 상층액을 HPLC 분석을 위해 바이얼로 옮겼다.

HPLC 분석은, HPLC Thermofisher를 이용하고, Column Waters IC-Pak 7.8 mm x 300 mm, 7 mm, 50 Å(Waters)과 굴절지수 (RI) 검출 (Thermofisher)을 이용한 크기 배제 크로마토그래피에 의해, 글리세롤 및 메발로네이트 함량에 대해 수행하였다. 용출은 유속 0.6 mL/min의 15mM 황산 수용액을 이동상으로 이용하여 등전점에 의해 수행하였다.

6.1.2 결과

6.1.2.1 클래스 II HMG-CoA 리덕제의 조인자 특이성 결정

도 8에 나타낸 바와 같이, 델프티아 액시도보란스 (D. acidovorans) 및 실리시박터 포메로이(S. pomeroyi) 유래의 HMG-CoA 리덕타제는 NADH에 대해 높은 특이성과 시험관내 높은 비활성을 나타낸다. 이들 HMG-CoA 리덕타제는 NADPH의 존재 하에서는 비활성을 실제 나타내지 않았지만, NADH의 존재 하에서는 비활성이 400 nmol/mg/min에 달하였다. 마찬가지로, 슈도모나스 메발로니 (P. mevalonii) 유래 HMG-CoA 리덕타제는 조인자로서 NADH에 대해 선택성을 나타내었으며, 이는 이전에 공개된 보고서와 일치한다. 예로, Hedl et al., J. Bacteriol 186(7):1927-1932 (2004)를 참조한다. 반면에, 사카로마이세스 세레비지아 (S. cerevisiae), 스타필로코커스 아우레우스 (S. aureus) 및 헤르페토시폰 아우란티아쿠스 (H. aurantiacus) 유래의 HMG-CoA 리덕타제들은 NADH의 존재 시에 측정가능한 활성을 나타내지 않았으며, 멘타노세이타 써모필라 (M. thermofila)의 HMG-CoA 리덕타제는 NADPH 및 NADH가 둘다 존재하는 조건에서 겨우 검출가능한 수준의 활성을 나타내었다. 이러한 결과들은, 슈도모나스 메발로니 (P. mevalonii) 유래의 HMG-CoA 리덕타제와 마찬가지로, 델프티아 액시도보란스 (D. acidovorans) 및 실리시박터 포메로이(S. pomeroyi)로부터 유래된 HMG-CoA 리덕타제들이 NADH-선택적인 HMG-CoA 리덕타제이라는 것을 의미한다.

아울러, 표 4는, NADH-가용성 HMG-CoA 리덕타제 (슈도모나스 메발로니 (P. mevalonii), 델프티아 액시도보란스 (D. acidovorans) 및 실리시박터 포메로이 (S. pomeroyi)로부터 각각 유래됨)를 포함하는 MevT 경로를 가진 균주가, NADPH-가용성 HMG-CoA 리덕타제 (사카로마이세스 세레비지아 (S. cerevisiae), 스타필로코커스 아우레우스 (S. aureus) 및 헤르페토시폰 아우란티아쿠스 (H. aurantiacus)로부터 각각 유래됨)를 포함하는 MevT 경로를 가진 균주에 비해 메발로네이트를 실질적으로 적게 생산함을 보여주다. 이는, 생체내에서, NADH-가용성 HMG-CoA 리덕타제가 메발로네이트와 하류 이소프레노이드 생산 쪽으로 진행하게 하는 촉매적인 역량을 모두 활용하기 위해서는, NADH의 추가적인 소스가 필요하다는 것을 시사한다.

표 4. NADPH-가용성 HMG-CoA 리덕타제 대 NADH-가용성 HMG-CoA 리덕타제로부터 메발로네이트의 생산

HMG-CoA 리덕타제의 소스	메발로네이트 생산 (g/L)	조인자 특이성
사카로마이세스 세레비지아 (S. cerevisiae)	1.11	NADPH
스타필로코커스 아우레우스 (S. aureus)	1.74	NADPH
헤르페토시폰 아우란티아쿠스 (H. aurantiacus)	1.84	NADPH

슈도모나스 메발로니 (P. mevalonii)	0.41	NADH
델프티아 액시도보란스 (D. acidovorans)	0.42	NADH
실리시박터 포메로이 (S. pomeroyi)	0.57	NADH

6.1.2.2 세포내 NADH 증가는 NADH-가용성 HMG-CoA 리덕타제의 활성을 향상시킨다.

도 9-11에 나타낸 바와 같이, 메발로네이트 생산은, 대사적 교란이 도입되었을 때, NADH의 세포내 농도를 증가시키는, NADH-가용성 HMG-CoA 리덕타제를 포함하는 MevT 경로를 구비한 세포에서, 실질적으로 향상된다. ADH1은 NADH-의존적인 방식으로 아세트알데하이드를 에탄올로 환원한다. adh1Δ 백그라운드에서, 숙주 세포는 증식 감소 (도 9)와 글리세롤 생산 증가 (도 10)를 겪으며, 이는 세포내 NADH의 축적을 초래할 수 있는 레독스 불균형을 의미한다. 그러나, NADPH-가용성 HMG-CoA 리덕타제 (사카로마이세스 세레비지애 (S. cerevisiae)(Sc.) tHMG-CoA 리덕타제)를 포함하는 MevT 경로를 구비한 세포가 adh1Δ 백그라운드에서 메발로네이트 생산 감소를 나타내는 반면, NADH-가용성 HMG-CoA 리덕타제 (슈도모나스 메발로니 (P. mevalonii), 델프티아 액시도보란스 (D. acidovorans) 및 실리시박터 포메로이(S. pomeroyi) 각각으로부터 유래된)를 포함하는 MevT 경로를 구비한 세포는, 레독스 스트레스 신호도 나타냄에도 불구하고, 메발로네이트 생산에 실질적인 향상을 나타낸다 (도 11). 이들 데이타는, NADH-가용성 HMG-CoA 리덕타제가 증가된 세포내 NADH 풀을 활용하여 메발로네이트 생산을 부스팅할 수 있다는 것을, 시사해준다. 또한, 이들 결과는, 세포내 NADH 풀 증가가 이루어지지 않은 경우, NADH-가용성 HMG-CoA 리덕타제가 조인자에 의해 제한됨을 시사한다.

특히, 이전의 공개된 보고서에서는, 슈도모나스 메발로니 (P. mevalonii)의 HMG-CoA 리덕타제가 메발로네이트 분해에 활용되는 것으로 개시된 바 있다. Anderson et al.,J. Bacteriol., (171(12):6468-6472 (1989)를 참조한다. 슈도모나스 메발로니 (P. mevalonii)는 유일한 탄소원으로서 메발로네이트에 대해 유효할 수 있는 것으로 동정된 소수의 원핵생물이다. 그러나, 본원에 제시된 결과는 메발로네이트의 생합성 경로에 사용하기 위한 슈도모나스 메발로니 (P. mevalonii) HMG-CoA 리덕타제의 예측하지 못한 유용성을 보여준다.

6.2 실시예 2: 아세틸-CoA에 대한 대안 경로 및 대안적인 MEV 경로 효소를 이용한 이소프레노이드 생산 및 레독스 밸런싱 개선

본 실시예는, MEV 경로부터 메발로네이트 및 하류 이소프레노이드 생산을, 세포질 아세틸-CoA 생산하는 대안적인 경로를 이용함으로써, 예컨대 야생형 PDH-바이패스 대신, 아세트알데하이드 데하이드로게나제, 아세틸화 (ADA, E.C. 1.2.1.10)의 이종 발현을 통해, 및 대안적인 MEV 경로 효소들과의 다양한 조합으로, 개선시킬 수 있음을 보여준다. 이들 결과는, NADPH-생산하는 PDH-바이패스 효소를 NADH-생산하는 ADA로 치환함으로써 도입되는 레독스 불균형은, ADA 발현을, MEV 경로의 NADH-가용성 HMG-CoA 리덕타제 및/또는 포스포케톨라제 및 포스포트랜스아세틸라제의 이종의 발현과 조합함으로써, 일부 완화시킬 수 있으며, 이는 또한, 세포질 아세틸-CoA를 생산하는 추가적인 대안 경로를 제공할 수 있음을 보여준다. 이들 결과는, 또한, MEV 경로에 아세틸-CoA 기질을 제공하는 ADA의 촉매적 능력이, 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제에 의해 제공되는 것과 같은, 아세틸-CoA의 아세토아세틸-CoA로의 열역학적으로 우호적인 하류 변환을 제공함으로써, 실질적으로 향상된다는 것을, 추가적으로 입증해준다.

6.2.1 재료 및 방법

6.2.1.1 균주 조작

표 5에 열거된 균주들을 구축하여, (1) ADA를 NADH-가용성 HMG-CoA 리덕타제 대 NADPH-가용성 HMG-CoA 리덕타제와 쌍을 이루었을 때, 세포 증식과 이종적인 이소프레노이드의 생산에 대한 효과; (2) ADA의 발현에 의해 형성되는 레독스 불균형에 대한 포스포케톨라제 및 포스포트랜스아세틸라제의 발현이 미치는 효과; 및 (3) ADA를 발현하는 균주들에서 메발로네이트 수준에 대한 아세토아세틸-CoA 신타제의 발현이 미치는 효과를 확인하였다.

표 5.

균주 명	설명
Y968	야생형 CEN.PK2
Y12869	acs1^acs2^ald6^; 2x Dz.eutE
Y12746	acs1^acs2^ald6^; 2x Dz.eutE; 3x Lm.PK; 1x Ck.PTA
Y12869.ms63908	구조체 ms63908을 구비한 Y12869
Y12869.ms63909	구조체 ms63909를 구비한Y12869
Y968.ms63908	구조체 ms63908을 구비한 Y968
Y968.ms63909	구조체 ms63909를 구비한 Y968
Y12869.ms63907.ms64472	구조체 ms64472를 구비한 Y12869.ms63907
Y12869.ms63909.ms64472	구조체 ms64472를 구비한 Y12869.ms63909
Y968.ms63907.ms64472	구조체 ms64472를 구비한 Y968.ms63907
Y968.ms63909.ms64472	구조체 ms64472를 구비한 Y968.ms63909

6.2.1.1.1 Y968

Y968은 야생형 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) CEN.PK2, Matalpha이다. Y12869, Y12746 및 이의 파생 유도체 전체에 대한 출발 균주는 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 균주 (CEN.PK2, Mat alpha, ura3-52, trp1-289, leu2-3,122, his3^1), Y003이다. Gietz RW and Woods RA, Guide to Yeast Genetics and Molecular and Cell Biology. Part B. San Diego, CA: Academic Press Inc. pp. 87-96 (2002)에 기술된 바와 같은 표준 리튬 아세테이트 공정을 이용하여, 사카로마이세스 세레비지애 (S. cerevisiae)에 대해 임의의 DNA-매개 형질전환을 수행하였으며, 모든 경우들에서, 구조체의 삽입은 게놈 DNA를 PCR 증폭시켜 검증하였다.

6.2.1.1.2 Y12869

Y003에 3번의 연속적인 삽입을 통해 Y12869를 구축하였다. 먼저, ACS2 유전자 좌의 상류와 하류 뉴클레오티드 서열로 구성된 서열이 측면에 위치한, 천연 사카로마이세스 세레비지애 (S. cerevisiae)LEU2 유전자로 구성된, 삽입 구조체 (i2235; 서열번호 45)를 도입함으로써, 유전자 ACS2를 제거하였다. 사카로마이세스 세레비지애 (S. cerevisiae) 숙주 세포로 도입되면, 이 구조체는 게놈의 ACS2 유전자 좌로 상동적인 재조합에 의해 삽입되어, ACS2 코딩 서열이 이의 삽입 서열로 치환됨으로써, ACS2가 기능적으로 파괴된다. 형질전환체를 유일한 탄소원으로서 2% EtOH가 포함된 CSM-leu 플레이트에 도말하여, PCR 증폭에 의해 검증하였다. 제조되는 균주는 Y4940이었다.

다음으로, ALD6를 제거하고, 딕케야 지아 (Dickeya zeae) eutE를 Y4940에 하기 도시된 삽입 구조체 (i74804; 서열번호 46)를 이용하여 도입하였다.

이 삽입 구조체는 선별 마커 (TRP1)와 딕케야 지아 (Dickeya zeae) 유래 유전자 eutE (NCBI 참조 서열: YP_003003316.1)를 코딩하는 2 카피의 효모-코돈-최적화된 서열을, TDH3 프로모터 (천연적인 사카로마이세스 세레비지애 (S. cerevisiae) TDH3 코딩 영역의 상류 840 bp)와 TEF2 종결인자 (천연적인 사카로마이세스 세레비지애 (S. cerevisiae) TEF2 코딩 영역의 하류 508 bp)의 통제 하에 포함한다. 이들 컴포넌트들은 측면에 ALD6 유전자 좌의 상류 및 하류 뉴클레오티드들이 위치한다. 숙주 세포로 도입되면, 이 구조체는 숙주 세포의 게놈으로 상동적인 재조합에 의해 삽입되어, ALD6 코딩 서열이 이의 삽입 서열로 치환됨으로써, ALD64가 기능적으로 파괴된다. 이 구조체는 미국 특허 8,221,982에 기술된 방법을 이용하여 조립하였다. 구조체를 Y4940에 형질전환하고, 형질전환체를 2% 글루코스가 첨가된 CSM-TRP 플레이트에서 선별하여, PCR 증폭에 의해 검증하였다. 제조되는 균주는 12602이었다.

다음으로, 자신의 프로모터와 종결인자의 통제 하에 위치한 천연적인 사카로마이세스 세레비지애 (S. cerevisiae) HIS3 유전자와 이의 측면에 위치한 ACS1의 상류 및 하류 뉴클레오티드 서열로 구성된 삽입 구조체 (i76220; 서열번호 47)를 도입함으로써, Y12602에서 ACS1을 제거하였다. 형질전환체를 단독 탄소원으로서 2% 글루코스가 첨가된 CSM-his 플레이트에 도말하고, PCR 증폭에 의해 검증하였다. 제조되는 균주는 Y12747이었다.

다음으로, Y12747에 천연 URA3 서열에서 증폭시킨 PCR 산물을 형질전환하였다. 이 서열은 ura3-52 돌연변이를 복원시킨다. Rose and Winston, Mol Gen Genet 193:557-560 (1984)을 참조한다. 형질전환체를 단독 탄소원으로서 2% 글루코스가 첨가된 CSM-ura 플레이트에 도말하고, PCR 증폭에 의해 검증하였다. 제조되는 균주는 Y12869이었다.

6.2.1.1.3 Y12746

Y4940에 3번의 연속적인 삽입을 통해 Y12746을 구축하였다. 먼저, Y4940에 아래에 도시된 삽입 구조체 (i73830; 서열번호 48)를 형질전환하였다.

이 삽입 구조체는, 선별 마커 (URA3); TDH3 프로모터 (TDH3 코딩 서열의 상류 870 bp) 및 TDH3 종결인자 (TDH3 코딩 서열의 하류 259 bp)의 통제 하에 위치한, 루코노스톡 메센테로이데스 (Leuconostoc mesenteroides) (NCBI 참조 서열 YP_819405.1) 유래 효모-코돈 최적화된 포스포케톨라제 버전; TDH3 프로모터 (TDH3 코딩 서열의 상류 870 bp) 및 PGK1 종결인자 (PGK1 코딩 서열의 하류 259 bp)의 통제 하에 위치한, 효모 코돈-최적화된 버전의, 클로스트리듐 클루이베리 (Clostridium kluyveri) 포스포트랜스아세틸라제 (NCBI 참조 서열: YP_001394780.1); 측면에 위치한, 사카로마이세스 세레비지애 (S. cerevisiae) BUD9 유전자 좌의 상류 및 하류 뉴클레오티드 서열로 구성된 상동적인 서열을 포함한다. 숙주 세포로 도입되면, 이 구조체는 숙주 세포의 게놈으로 상동적인 재조합에 의해 삽입되어, BUD9 코딩 서열이 이의 삽입 서열로 치환됨으로써, BUD9은 기능적으로 파괴된다. 이 구조체는 미국 특허 8,221,982에 기술된 방법을 이용하여 조립하였다. 형질전환체는 2% 글루코스가 첨가된 CSM-URA 플레이트에서 선별하였다.

제조되는 균주에, 하기 도시된 삽입 구조체 (i74810; 서열번호 49)를 형질전환하였다.

이 구조체는 선별 마커 (TRP1); TDH3 프로모터 (TDH3 코딩 서열의 상류 870 bp) 및 TDH3 종결인자 (TDH3 코딩 서열의 하류 259 bp)의 통제 하에 위치한 2 카피의 루코노스톡 메센테로이데스 (Leuconostoc mesenteroides) 유래 포스포케톨라제; 이들의 양 측면에 위치한, ALD6 유전자 좌의 상류 및 하류 뉴클레오티드 서열로 구성된 상동적인 서열을 포함한다. 숙주 세포로 도입되면, 이 구조체는 숙주 세포의 게놈으로 상동적인 재조합에 의해 삽입되어, ALD6 코딩 서열이 이의 삽입 서열로 치환됨으로써, ALD6가 기능적으로 파괴된다. 이 구조체는 미국 특허 8,221,982에 기술된 방법을 이용하여 조립하였다. 형질전환체를 2% 글루코스가 첨가된 CSM-URA 플레이트에서 선별하여, PCR 증폭에 의해 검증하였다.

마지막으로, 제조되는 균주에 하기 도시된 구조체 (i76221; 서열번호 50)를 형질전환하였다.

이 구조체는, 선별 마커 (HIS3); 및 TDH3 프로모터 (천연적인 사카로마이세스 세레비지애 (S. cerevisiae) TDH3 코딩 영역의 상류 840 bp) 및 TEF2 종결인자 (천연적인 사카로마이세스 세레비지애 (S. cerevisiae) TEF2 코딩 영역의 하류 508 bp)의 통제 하에 위치한, 딕케야 지아 (Dic-keya zeae) 유래 유전자 eutE를 코딩하는 효모-코돈-최적화된 서열 (NCBI 참조 서열: YP_003003316.1) 2 카피를 포함한다. 이들 컴포넌트들은 측면에 ACS1 유전자 좌의 상류 및 하류 뉴클레오티드들이 위치한다. 숙주 세포로 도입되면, 이 구조체는 숙주 세포의 게놈으로 상동적인 재조합에 의해 삽입되어, ACS1 코딩 서열이 이의 삽입 서열로 치환됨으로써, ACS1이 기능적으로 파괴된다. 이 구조체는 미국 특허 8,221,982에 기술된 방법을 이용하여 조립하였다. 형질전환체를 2% 글루코스가 첨가된 CSM-HIS 플레이트에서 선별하여, PCR 증폭에 의해 검증하였다. 제조되는 균주는 Y12746이었다.

6.2.1.1.4 ms63907, ms63908, ms63909 및 ms64472 삽입 구조체

ms63907 삽입 구조체 (i84022; 서열번호 51)를 아래에 나타낸다.

이 구조체는, 선택 마커(URA3); 자신의 프로모터 하에 위치한 천연적인 효모 GAL4 전사 인자 1 카피; 메발로네이트 경로의 천연 효모 효소 2종 (아세토아세틸-CoA 티올라제를 코딩하는 ERG10, HMG-CoA 신타제를 코딩하는 ERG13), 및 실리시박터 포메로이 (Silicibacter pomeroyi)) HMG-CoA 리덕타제의 효모 코돈-최적화된 버전 2 카피, 모두 갈락토스 유도성 프로모터 (사카로마이세스 세레비지애 (S. cerevisiae) 유전자 GAL1 및 GAL10의 프로모터) 하에 위치됨, 뿐만 아니라, 측면에 위치한, 사카로마이세스 세레비지애 (S. cerevisiae) HO 엔도뉴클레아제 유전자 좌의 상류 및 하류 뉴클레오티드로 구성된 상동적인 서열을 코딩하는, 뉴클레오티드 서열을 포함한다. 숙주 세포로 도입되면, ms63907 구조체는 숙주 세포의 게놈으로 상동적인 삽입에 의해 삽입되어, HO 코딩 서열이 이의 삽입 서열로 치환됨으로써, HO가 기능적으로 파괴된다. 이 구조체는 미국 특허 8,221,982에 기술된 방법을 이용하여 조립하였다. 형질전환체를 2% 글루코스가 첨가된 CSM-URA 플레이트에서 선별하여, PCR 증폭에 의해 검증하였다.

ms63908 삽입 구조체 (i84024; 서열번호 52)는, 2가지만 제외하고는, ms63907과 동일하다: 첫째, ERG10이, AHP1 종결인자 (사카로마이세스 세레비지애 (S. cerevisiae)의 AHP1 코딩 서열의 하류 125 bp)가 융합된, 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제 (accession no. AB540131.1)를 코딩하는, 스트렙토마이세스 sp.의 nphT7 유전자의 효모 코돈-최적화된 버전으로 치환되며; 두번째로, 실리시박터 포메로이(S. pomeroyi) HMG-CoA 리덕타제를 코딩하는 서열이 천연적인 사카로마이세스 세레비지애 (S. cerevisiae) HMG-CoA 리덕타제를 코딩하는 절단된 HMG1 코딩 서열인, tHMGr로 치환됨.

ms63909 삽입 구조체 (i84026; 서열번호 53)는, 한가지만 제외하고는, ms63907과 동일하다: 실리시박터 포메로이(S. pomeroyi) HMG-CoA 리덕타제를 코딩하는 서열이 천연적인 사카로마이세스 세레비지애 (S. cerevisiae) HMG-CoA 리덕타제를 코딩하는 절단된 HMG1 코딩 서열인, tHMGr로 치환됨.

ms64472 삽입 구조체 (i85207; 서열번호 54)를 하기에 도시한다.

이 구조체는, 선별 마커 (URA3); 에르고스테롤 경로의 5종의 천연 효모 효소들 (메발로네이트 키나제를 코딩하는 ERG12, 포스포메발로네이트 키나제를 코딩하는 ERG8, 메발로네이트 피로포스페이트 데카르복실라제를 코딩하는 ERG19, 다이메틸알릴 다이포스페이트 이소머라제를 코딩하는 IDI1, 및 파르네실 피로포스페이트 신테타제를 코딩하는 ERG20), 뿐만 아니라, 진화된, 효모 코돈-최적화된 버전의 아르테미시아 아누아 (Artemisia annua) 파르네센 신타제, 이들 모두 갈락토스-유도성 프로모터의 통제 하에 위치함 (사카로마이세스 세레비지애 (S. cerevisiae) 유전자 GAL1, GAL10 및 GAL7의 프로모터들)를 코딩하는 뉴클레오티드 서열을 포함한다. 이들 서열들에는, GAL80의 상류 및 하류 뉴클레오티드 서열로 구성된 상동적인 서열들이 측면에 위치한다. 숙주 세포로 도입되면, ms64472 구조체는 숙주 세포의 게놈으로 상동적인 삽입에 의해 삽입되어, GAL80 코딩 서열이 이의 삽입 서열로 치환됨으로써, GAL80이 기능적으로 파괴된다. 이 구조체는 미국 특허 8,221,982에 기술된 방법을 이용하여 조립하였다. 형질전환체를 2% 글루코스가 첨가된 CSM-URA 플레이트에서 선별하여, PCR 증폭에 의해 검증하였다.

6.2.1.2 메발로네이트의 정량화

콜로니 하나를 96웰 플레이트의 웰에 50 mM 숙시네이트 pH 5.0 및 20 g/L 슈크로스가 첨가된 시드 배지 (15 g/L 암모늄 설페이트, 8 g/L 포타슘 포스페이트, 6.1 g/L 마그네슘 설페이트, 150 mg/L EDTA, 57.5 mg/L 아연 설페이트, 4.8 mg/L 코발트 클로라이드, 3.24 mg/L 망간 클로라이드, 5 mg/L 구리 설페이트, 29.4 mg/L 칼슘 클로라이드, 27.8 mg/L 철 설페이트, 4.8 mg/L 소듐 몰리브데이트, 0.6 mg/L 바이오틴, 12 mg/L 칼슘 판토테네이트, 12 mg/L 니코틴산, 30 mg/L 이노시톨, 12 mg/L 티아민 하이드로클로라이드, 12 mg/L 피리독신 하이드로클로라이드, 0.24 mg/L 파라-아미노벤조산)에 접종하여, 3일간 30℃에서 배양하였다. 그런 후, 배양물 14.4 ㎕를 50 mM 숙시네이트 pH 5.0 및 40 g/L 갈락토스가 첨가된 시드 배지에서 서브배양하고, 2일간 30℃에서 배양하였다.

분비되는 메발로네이트를 정량하기 위해, 전 세포 배지를 먼저 5분간 14,000 RPM으로 스핀 다운하였다. 그런 후, 투명하게 된 배지 10 ㎕에, 분석 완충제 (1 mM CoA, 2 mM NAD, 정제 및 동결건조한 슈도모나스 메발로니 (Pseudomonas mevalonii) HMG-CoA 리덕타제, 0.2 mg/ml, 정제 및 동결건조한 슈도모나스 메발로니 (Pseudomonas mevalonii) HMG-CoA 리아제, 0.1 mg/ml, 95 mM TrisCl pH8.5, 20 mM MgCl2 및 5 mM DTT) 190 ㎕와 함께 인큐베이션하였다. 30℃에서 30분간 샘플에서 인큐베이션한 다음, Beckman M5 플레이트 리더에서 340 nm에서 흡광도를 분석하였다. 메발로네이트 농도는, 정제한 메발로네이트로 작성한 표준 그래프에 플로팅함으로써 정량하였다.

6.2.1.3 파르네센 정량

배양물을 전술한 바와 같이 먼저 배양하였다. 파르네센을 정량하기 위해, 2-부톡시에탄올 600 ㎕를, 각 200 ㎕ 씩 3번, 전 세포 배지 150 ㎕에, 각 첨가 사이에 96웰 플레이트 교반기에서 1000 rpm으로 90초간 교반하면서, 첨가하였다. 그런 후, 샘플을 40분간 인큐베이션하였다. 2-부톡시에탄올 추출물 8 ㎕를 이소프로필 알코올 200 ㎕와 96웰 UV 플레이트 (Costar 3635)에서 혼합한 다음 흡광도 222을 플레이트 리더에서 판독하였다.

6.2.1.4 광학 밀도 정량

96웰 분석 플레이트에서, 배양물 8 ㎕를 희석제 (20% PEG 200, 20% 에탄올, 2% Triton X-114)와 혼합하여, 실온에서 30분간 인큐베이션하였다. 이 분석 플레이트를 볼텍싱한 후, Beckman M5 플레이트 리더에서 OD₆₀₀을 측정하였다.

6.2.1.5 배치 발효

콜로니 하나를 50 mM 숙시네이트 pH 5.0 및 20 g/L 슈크로스가 첨가된 시드 배지 5 ml에서 배양하여, Y967, Y12869 및 Y12746의 접종 배양물을 배양하였다. 배양 3일 후, 사전배양물을 50 mM 숙시네이트 pH 5.0 및 40 g/L 슈크로스가 첨가된 시드 배지 25 ml에서 첫 광학 밀도 (OD) 0.1로 서브배양하였다. 10시간 후, 배양물을 다시, 50 mM 숙시네이트 pH 5.0 및 40 g/L 슈크로스가 첨가된 시드 배지 50 ml에 OD 0.05로 서브배양하였다. 배양물을 30℃에서 배양하였다. OD가 약 3이 되면, 3개의 플라스크를 절반으로 나누고, 스핀 다운한 후, 배지를 버렸다. 배양물을 40 g/L 글루코스 (숙시네이트 무첨가)가 첨가된 시드 배지 1.5 L에 재현탁하고, 발효기로 옮겼다. 발효 실험은 2 L Biostat B plus vessel (Sartorius, Germany)에서 수행하였다. 교반을 1200 rpm으로 조절하고, 발효기에 공기를 0.5 L/min으로 계속 주입하였다. 14.4 M NH₄OH로 pH를 5.0으로 유지하였고, 온도를 30℃로 유지하였다. 거의 1.5시간 마다 샘플을 취하여 OD, 건조 세포 중량, 유기 산 및 당을 측정하였다.

6.2.2 결과

6.2.2.1 ADA 균주는 NADPH-가용성 HMGr 보다는 NADH-가용성 HMGr와 쌍을 이루었을 때 이소프레노이드를 더 많이 생산한다.

도 12A는, PDH-바이패스 (acs1Δ acs2 Δ ald6Δ)의 결손 및 이종적으로 발현되는 ADA (Dz.eutE)를 포함하는, 균주 Y12869가, NADPH-가용성 HMGr을 포함하는 MEV 경로 (구조체 ms63909) 보다는 NADH-가용성 HMGr을 포함하는 MEV 경로 (구조체 ms63907)를 발현할 때, 파르네센을 더 많이 생산함을 보여준다. 반면에, 도 12B는, 무손상 PDH-바이패스를 포함하는 균주 Y968은 NADPH-가용성 HMGr와 쌍을 이루었을 때 파르네센을 더 많이 생산함을 보여준다. 이들 결과는, MEV 경로로부터 이소프레노이드를 생산하기 위한 ADA의 활용은, MEV 경로가 NADH-가용성 HMGr을 포함할 때 개선됨을 보여준다.

6.2.2.2 ADA의 발현은 레독스 불균형을 야기하지만, PK와 PTA가 당분해와 흐름을 공유할 때 완화된다

천연 효모는 당분해를 통해 소모되는 글루코스 1개 당 NADH 2개를 생산한다. 에탄올로 발효하였을 때, NADH 2개가 NAD+로 다시 산화된다. 그러나, 글루코스 분획은 에탄올로 발효되기 보다는 바이오메스로 변환되어, 과량의 NADH가 만들어진다. 이 과량의 NADH는, 다이하이드록시아세톤 포스페이트의 글리세롤 3-포스페이트로의 환원을 통해, NAD+로 다시 산화되며, 글리세롤 3-포스페이트는 글리세롤로 가수분해된다. 천연적인 PDH-바이패스 대신 아실화 아세트알데하이드 데하이드로게나제를 이용하는 균주는, NADPH 대신, NADH를 생산하므로, 추가의 과잉의 NADH가 생성된다. 바이오메스로 변환되는 각 글루코스의 경우, 천연적인 PDH-바이패스 대신 ADA를 이용하는 균주는 실제 NADH를 2배 많이 생산하는데, 이는 과량의 NADH를 다시 산화하기 위해서는 2배 정도로 많은 글리세롤을 생산하여야 한다는 것을 의미한다. 도 13A에 나타낸 바와 같이, Y12869 (야생형 PDH-바이패스 대신 ADA를 이용하는 균주)는 (무손상 PDH-바이패스를 포함하는) Y968의 2배 많은 글리세롤을 생산하지만, 배치 글루코스 발효에서 글루코스를 유사한 수준으로 소비한다. 이러한 결과들은, Y12869에서 ADA 반응의 화학량론으로 예측되는 바와 같이 레독스 불균형이 발생됨을 입증해준다.

ADA 균주에 포스포케톨라제 및 포스포트랜스아세틸라제를 부가하면, 글루코스로부터 AcCoA를 합성하는 대안적인 비-당분해성 경로가 제공되어, 당분해를 통한 NADH 생산이 감소되고 레독스 균형이 향상된다. 도 13B에 나타낸 바와 같이, Y12745 (ADA 외에도, 포스포케톨라제 및 포스포트랜스아세틸라제를 보유한 균주)는 Y12869의 절반으로 글리세롤을 생산하지만, 배치 글루코스 발효시 글루코스는 비슷한 수준으로 소비한다.

6.2.2.3 ADA 균주에서 ATP 절약은 열역학적인 구동력을 희생하게 되지만 아세틸-CoA에 대한 강력한 견인력에 의해 완화된다.

아세틸-CoA를 형성하기 위한 천연적인 PDH-바이패스 반응은, ATP의 AMP로의 가수분해와 커플링되기 때문에, 열역학적으로 우호적이다. 반면 아실화 아세트알데하이드 데하이드로게나제 반응은 ATP와 커플링되어 있지 않으며, 아세틸-CoA 합성에 있어 천연적인 PDH-바이패스 반응 보다 훨씬 평형에 가깝다. 메발로네이트를 생산하기 위해 천연적인 사카로마이세스 세레비지애 (S. cerevisiae) 경로 유전자를 이용하는 경우, ADA를 이용하는 균주는, ADA 및 Ald6의 시험관내에서의 비슷한 카이네틱 특성에도 불구하고, 야생형 PDH-바이패스를 이용하는 균주 보다 메발로네이트를 훨씬 적게 생산한다. 도 14 (첫번째 및 2번째 컬럼)에 나타낸 바와 같이, 시험관내에서 측정한 충분한 카이네틱 역량에도 불구하고, ADA 균주 (Y12869.ms63909)에서의 메발로네이트 생산은 야생형의 등가 균주 (Y968.ms63909)의 ~30%에 불과하다. 이 결과는, ADA에 의한 아세트알데하이드의 아세틸-CoA로의 변환을 뒷받침하는 열역학적인 구동력의 결핍을 반영한다.

Erg10 아세틸-CoA 티올라제는, 열역학적으로 비우호적인 반응인 아세틸-CoA 2개로부터 아세토아세틸-CoA를 형성하는 반응을 촉매한다. nphT7에 코딩된 아세토아세틸-CoA 신타제 (즉, 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제)는, 말로닐-CoA의 데카르복시화로 인해 열역학적으로 우호적인 반응인, 아세틸-CoA와 말로닐-CoA로부터 아세토아세틸-CoA를 합성하는 과정을 촉매한다. AcCoA 생산의 바로 하류에 이러한 열역학적으로 우호적인 반응을 투입하면, ADA의 정방향 활성을 증가시키는 열역학적인 구동력이 부여된다. 도 14 (3번째 및 4번째 컬럼)에 나타낸 바와 같이, nphT7을 ERG10 대신 과다 발현하면, Y968.ms63908와 Y12869.ms63908은 메발로네이트를 비슷한 수준으로 만들어낸다. 아울러, 이들 균주는 MEV 경로의 첫번째 단계에서 ERG10을 이용하는 등가의 균주 (Y968.ms63909 및 Y12869.63909) 보다 메발로네이트를 실질적으로 더 많이 생산한다.

본 명세서에 인용된 모든 간행물, 특허 및 특허 출원은, 각 개별 간행물 또는 특허 출원이 구체적이고 개별적으로 원용에 의해 본 명세서에 포함되는 바와 같이, 원용에 의해 본 명세서에 포함된다. 전술한 본 발명은 예시적인 방식으로, 명확한 이해를 위한 예로 기술되어 있지만, 당해 기술 분야의 당업자라면 본 발명의 교시 내용에 비추어, 첨부된 청구항의 사상 및 범위로부터 이탈되지 않으면서 특정한 변형과 수정을 가할 수 있음을 쉽게 알 것이다.

SEQUENCE LISTING <110> AMYRIS, INC. GARDNER, Timothy Stevens HAWKINS, Kristy Michelle MEADOWS, Adam Leon TSONG, Annie Ening TSEGAYE, Yoseph <120> PRODUCTION OF ACETYL-COENZYME A DERIVED ISOPRENOIDS <130> 107345.00374 <150> US 61/557,893 <151> 2011-11-09 <160> 54 <170> PatentIn version 3.5 <210> 1 <211> 1380 <212> DNA <213> Dickeya zeae <220> <221> misc_feature <222> (1)..(1380) <223> Dickeya zeae eutE gene sequence <400> 1 atggagcatt cagttatcga accgacagtg cccatgccgc tgccagccat gtttgacgcg 60 ccatctggaa tcttttctag cctggacgat gcagtccagg cggcaaccct ggcacaacaa 120 cagttgtcgt ctgtggagtt acgccagcaa gttattaaag caattagagt tgcaggcgaa 180 cgctatgcac aggttctggc ggaaatggcg gtggctgaaa caggtatggg tcgggtagtg 240 gataaataca ttaaaaatgt ttcacaggct cgccatacac ccggcattga atgtctgagc 300 gcggaagttc tgacaggcga caatggcctg acactgattg aaaatgcccc ttggggagtg 360 gtggcttccg tgacgccaag cacgaaccca gccgccacag tcatcaataa tgcaatttcc 420 atgattgcgg cagggaattc agtcgttttt gcaccgcacc catccgccaa aaatgtgtcc 480 ttacgcacaa tatcgcttct taacaaagca attgtggcga caggtgggcc agaaaatctg 540 ctggtatccg tcgcaaatcc caacatcgaa acagctcaac gcctgttccg ttatccaggt 600 attggattac tcgtcgtaac aggtggtgag gcggtggtgg aagcggcgcg caaacacact 660 gataaacgtt taattgccgc aggcgccgga aaccccccag tagtcgttga cgaaacagcg 720 gatataccga aagccgctcg cgcaatagta aagggcgctt cgtttgacaa caatattatt 780 tgtgccgacg agaaagtatt aatcgtggtt gatcgcgtag ccgacgcctt attagccgaa 840 atgcaacgca acaatgctgt tttactgacg cctgaacaga cagaacgact tctgcccgct 900 ttgctgagcg atatagatga gcaggggaag ggacgcgtga accgcgatta tgtggggagg 960 gatgccgcta aactagcggc ggccattggt ttagaagtgt cagaacacac aagattatta 1020 cttgctgaaa cagatgctga tcatcctttt gcagtaaccg aattaatgat gcccgtattg 1080 cctgttatcc gtgtaaaaaa cgttgatgac gccattgccc tcgctgtaaa acttgagagt 1140 ggttgtcgtc acactgcagc aatgcattcg acaaacatta ggaacctgaa tcggatggca 1200 aatgctataa atacatcaat ttttgttaaa aatggtccgt gtatcgctgg gctgggcctg 1260 ggtggcgagg gctggacgtc gatgactata tctacaccca caggggaagg agttacctca 1320 gcacgcacct tcgtacgttt acgtagatgt gtattggttg acatgttcag aatcgcgtaa 1380 <210> 2 <211> 459 <212> PRT <213> Dickeya zeae <220> <221> misc_feature <222> (1)..(459) <223> Dickeya zeae eutE protein sequence <400> 2 Met Glu His Ser Val Ile Glu Pro Thr Val Pro Met Pro Leu Pro Ala 1 5 10 15 Met Phe Asp Ala Pro Ser Gly Ile Phe Ser Ser Leu Asp Asp Ala Val 20 25 30 Gln Ala Ala Thr Leu Ala Gln Gln Gln Leu Ser Ser Val Glu Leu Arg 35 40 45 Gln Gln Val Ile Lys Ala Ile Arg Val Ala Gly Glu Arg Tyr Ala Gln 50 55 60 Val Leu Ala Glu Met Ala Val Ala Glu Thr Gly Met Gly Arg Val Val 65 70 75 80 Asp Lys Tyr Ile Lys Asn Val Ser Gln Ala Arg His Thr Pro Gly Ile 85 90 95 Glu Cys Leu Ser Ala Glu Val Leu Thr Gly Asp Asn Gly Leu Thr Leu 100 105 110 Ile Glu Asn Ala Pro Trp Gly Val Val Ala Ser Val Thr Pro Ser Thr 115 120 125 Asn Pro Ala Ala Thr Val Ile Asn Asn Ala Ile Ser Met Ile Ala Ala 130 135 140 Gly Asn Ser Val Val Phe Ala Pro His Pro Ser Ala Lys Asn Val Ser 145 150 155 160 Leu Arg Thr Ile Ser Leu Leu Asn Lys Ala Ile Val Ala Thr Gly Gly 165 170 175 Pro Glu Asn Leu Leu Val Ser Val Ala Asn Pro Asn Ile Glu Thr Ala 180 185 190 Gln Arg Leu Phe Arg Tyr Pro Gly Ile Gly Leu Leu Val Val Thr Gly 195 200 205 Gly Glu Ala Val Val Glu Ala Ala Arg Lys His Thr Asp Lys Arg Leu 210 215 220 Ile Ala Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala 225 230 235 240 Asp Ile Pro Lys Ala Ala Arg Ala Ile Val Lys Gly Ala Ser Phe Asp 245 250 255 Asn Asn Ile Ile Cys Ala Asp Glu Lys Val Leu Ile Val Val Asp Arg 260 265 270 Val Ala Asp Ala Leu Leu Ala Glu Met Gln Arg Asn Asn Ala Val Leu 275 280 285 Leu Thr Pro Glu Gln Thr Glu Arg Leu Leu Pro Ala Leu Leu Ser Asp 290 295 300 Ile Asp Glu Gln Gly Lys Gly Arg Val Asn Arg Asp Tyr Val Gly Arg 305 310 315 320 Asp Ala Ala Lys Leu Ala Ala Ala Ile Gly Leu Glu Val Ser Glu His 325 330 335 Thr Arg Leu Leu Leu Ala Glu Thr Asp Ala Asp His Pro Phe Ala Val 340 345 350 Thr Glu Leu Met Met Pro Val Leu Pro Val Ile Arg Val Lys Asn Val 355 360 365 Asp Asp Ala Ile Ala Leu Ala Val Lys Leu Glu Ser Gly Cys Arg His 370 375 380 Thr Ala Ala Met His Ser Thr Asn Ile Arg Asn Leu Asn Arg Met Ala 385 390 395 400 Asn Ala Ile Asn Thr Ser Ile Phe Val Lys Asn Gly Pro Cys Ile Ala 405 410 415 Gly Leu Gly Leu Gly Gly Glu Gly Trp Thr Ser Met Thr Ile Ser Thr 420 425 430 Pro Thr Gly Glu Gly Val Thr Ser Ala Arg Thr Phe Val Arg Leu Arg 435 440 445 Arg Cys Val Leu Val Asp Met Phe Arg Ile Ala 450 455 <210> 3 <211> 2728 <212> DNA <213> Saccharomyces cerevisiae <220> <221> misc_feature <222> (1)..(2728) <223> Saccharomyces cerevisiae ACS1 nucleotide sequence <400> 3 acctcccgcg acctccaaaa tcgaactacc ttcacaatgt cgccctctgc cgtacaatca 60 tcaaaactag aagaacagtc aagtgaaatt gacaagttga aagcaaaaat gtcccagtct 120 gcctccactg cgcagcagaa gaaggaacat gagtatgaac atttgacctc ggtcaagatc 180 gtgccacaac ggcccatctc agatagactg cagcccgcaa ttgctaccca ctattctcca 240 cacttggacg ggttgcagga ctatcagcgc ttgcacaagg agtctattga agaccctgct 300 aagttcttcg gttctaaagc tacccaattt ttaaactggt ctaagccatt cgataaggtg 360 ttcatcccag actctaaaac gggtaggccc tccttccaga acaatgcatg gttcctcaac 420 ggccaattaa acgcctgtta caactgtgtt gacagacatg ccttgaagac ccctaacaag 480 aaagccatta ttttcgaagg tgacgagcct ggccaaggct attccattac ctacaaggaa 540 ctacttgaag aagtttgtca agtggcacaa gtgctgactt actctatggg cgttcgcaag 600 ggcgatactg ttgccgtgta catgcctatg gtcccagaag caatcataac cttgttggcc 660 atttcccgta tcggcgccat tcactccgta gtctttgccg ggttttcttc caactccttg 720 agagatcgta tcaacgatgg ggactctaaa gttgtcatca ctacagatga atccaacaga 780 ggtggtaaag tcattgagac taaaagaatt gttgatgacg cgctaagaga gaccccaggc 840 gtgagacacg tcttggttta tagaaagacc aacaatccat ctgttgcttt ccatgccccc 900 agagatttag attgggcaac agaaaagaag aaatacaaga cctactatcc atgcacaccc 960 gttgattctg aggatccatt attcttgttg tatacgtctg gttctactgg tgcccccaag 1020 ggtgttcaac attctaccgc aggttacttg ctgggagctt tgttgaccat gcgctacact 1080 tttgacactc accaagaaga cgttttcttc acagctggag acattggctg gattacaggc 1140 cacacttatg tggtttatgg tcccttacta tatggttgtg ccactttggt ctttgaaggg 1200 actcctgcgt acccaaatta ctcccgttat tgggatatta ttgatgaaca caaagtcacc 1260 caattttatg ttgccccaac tgctttgcgt ttgttgaaaa gagctggtga ttcctacatc 1320 gaaaatcatt ccttaaaatc tttgcgttgc ttgggttcgg tcggtgaacc aattgctgct 1380 gaagtttggg agtggtactc tgaaaaaata ggtaaaaatg aaatccccat tgtagacacc 1440 tactggcaaa cagaatctgg ttcgcatctg gtcaccccgc tggctggtgg tgtcacacca 1500 atgaaaccgg gttctgcctc attccccttc ttcggtattg atgcagttgt tcttgaccct 1560 aacactggtg aagaacttaa taccagccac gcagagggtg tccttgccgt caaagctgca 1620 tggccatcat ttgcaagaac tatttggaaa aatcatgata ggtatctaga cacttatttg 1680 aacccttacc ctggctacta tttcactggt gatggtgctg caaaggataa ggatggttat 1740 atctggattt tgggtcgtgt agacgatgtg gtgaacgtct ctggtcaccg tctgtctacc 1800 gctgaaattg aggctgctat tatcgaagat ccaattgtgg ccgagtgtgc tgttgtcgga 1860 ttcaacgatg acttgactgg tcaagcagtt gctgcatttg tggtgttgaa aaacaaatct 1920 aattggtcca ccgcaacaga tgatgaatta caagatatca agaagcattt ggtctttact 1980 gttagaaaag acatcgggcc atttgccgca ccaaaattga tcattttagt ggatgacttg 2040 cccaagacaa gatctggcaa aattatgaga cgtattttaa gaaaaatcct agcaggagaa 2100 agtgaccaac taggcgacgt ttctacattg tcaaaccctg gcattgttag acatctaatt 2160 gattcggtca agttgtaatg atgatttctt tcctttttat attgacgact tttttttttt 2220 cgtgtgtttt tgttctctta taaccgagct gcttacttat tattatttca ccttctcttt 2280 ttatttatac ttataattat ttattcttta catactgtta caagaaactc ttttctacat 2340 taattgcata aagtgtcaat cagcacatcc tctatatcgc tatcaacaac aaatttgaca 2400 aacctgccta tatcttcagg aacaactgcc gcatcgctac caccactact tgtgaagtcc 2460 ctggagttta atatgcactg aaatttacct agccgtttta cacaagacca taatccatcc 2520 atgctatcgc agtatatgat tttgtgttcg tttttcgtct tgcgaaaggc atcctcaatg 2580 gcttgtttca ttgatccatc agtgtggctc gtaggtacca gcaaaaccac ttcatcagcg 2640 gcgtactcct cccactttat gggcagtcct tgtatcgact tgctcattat aatacatttg 2700 ctctatcccc gcgtgcttgg ccggccgt 2728 <210> 4 <211> 713 <212> PRT <213> Saccharomyces cerevisiae <220> <221> misc_feature <222> (1)..(713) <223> Saccharomyces cerevisiae ACS1 protein sequence <400> 4 Met Ser Pro Ser Ala Val Gln Ser Ser Lys Leu Glu Glu Gln Ser Ser 1 5 10 15 Glu Ile Asp Lys Leu Lys Ala Lys Met Ser Gln Ser Ala Ser Thr Ala 20 25 30 Gln Gln Lys Lys Glu His Glu Tyr Glu His Leu Thr Ser Val Lys Ile 35 40 45 Val Pro Gln Arg Pro Ile Ser Asp Arg Leu Gln Pro Ala Ile Ala Thr 50 55 60 His Tyr Ser Pro His Leu Asp Gly Leu Gln Asp Tyr Gln Arg Leu His 65 70 75 80 Lys Glu Ser Ile Glu Asp Pro Ala Lys Phe Phe Gly Ser Lys Ala Thr 85 90 95 Gln Phe Leu Asn Trp Ser Lys Pro Phe Asp Lys Val Phe Ile Pro Asp 100 105 110 Ser Lys Thr Gly Arg Pro Ser Phe Gln Asn Asn Ala Trp Phe Leu Asn 115 120 125 Gly Gln Leu Asn Ala Cys Tyr Asn Cys Val Asp Arg His Ala Leu Lys 130 135 140 Thr Pro Asn Lys Lys Ala Ile Ile Phe Glu Gly Asp Glu Pro Gly Gln 145 150 155 160 Gly Tyr Ser Ile Thr Tyr Lys Glu Leu Leu Glu Glu Val Cys Gln Val 165 170 175 Ala Gln Val Leu Thr Tyr Ser Met Gly Val Arg Lys Gly Asp Thr Val 180 185 190 Ala Val Tyr Met Pro Met Val Pro Glu Ala Ile Ile Thr Leu Leu Ala 195 200 205 Ile Ser Arg Ile Gly Ala Ile His Ser Val Val Phe Ala Gly Phe Ser 210 215 220 Ser Asn Ser Leu Arg Asp Arg Ile Asn Asp Gly Asp Ser Lys Val Val 225 230 235 240 Ile Thr Thr Asp Glu Ser Asn Arg Gly Gly Lys Val Ile Glu Thr Lys 245 250 255 Arg Ile Val Asp Asp Ala Leu Arg Glu Thr Pro Gly Val Arg His Val 260 265 270 Leu Val Tyr Arg Lys Thr Asn Asn Pro Ser Val Ala Phe His Ala Pro 275 280 285 Arg Asp Leu Asp Trp Ala Thr Glu Lys Lys Lys Tyr Lys Thr Tyr Tyr 290 295 300 Pro Cys Thr Pro Val Asp Ser Glu Asp Pro Leu Phe Leu Leu Tyr Thr 305 310 315 320 Ser Gly Ser Thr Gly Ala Pro Lys Gly Val Gln His Ser Thr Ala Gly 325 330 335 Tyr Leu Leu Gly Ala Leu Leu Thr Met Arg Tyr Thr Phe Asp Thr His 340 345 350 Gln Glu Asp Val Phe Phe Thr Ala Gly Asp Ile Gly Trp Ile Thr Gly 355 360 365 His Thr Tyr Val Val Tyr Gly Pro Leu Leu Tyr Gly Cys Ala Thr Leu 370 375 380 Val Phe Glu Gly Thr Pro Ala Tyr Pro Asn Tyr Ser Arg Tyr Trp Asp 385 390 395 400 Ile Ile Asp Glu His Lys Val Thr Gln Phe Tyr Val Ala Pro Thr Ala 405 410 415 Leu Arg Leu Leu Lys Arg Ala Gly Asp Ser Tyr Ile Glu Asn His Ser 420 425 430 Leu Lys Ser Leu Arg Cys Leu Gly Ser Val Gly Glu Pro Ile Ala Ala 435 440 445 Glu Val Trp Glu Trp Tyr Ser Glu Lys Ile Gly Lys Asn Glu Ile Pro 450 455 460 Ile Val Asp Thr Tyr Trp Gln Thr Glu Ser Gly Ser His Leu Val Thr 465 470 475 480 Pro Leu Ala Gly Gly Val Thr Pro Met Lys Pro Gly Ser Ala Ser Phe 485 490 495 Pro Phe Phe Gly Ile Asp Ala Val Val Leu Asp Pro Asn Thr Gly Glu 500 505 510 Glu Leu Asn Thr Ser His Ala Glu Gly Val Leu Ala Val Lys Ala Ala 515 520 525 Trp Pro Ser Phe Ala Arg Thr Ile Trp Lys Asn His Asp Arg Tyr Leu 530 535 540 Asp Thr Tyr Leu Asn Pro Tyr Pro Gly Tyr Tyr Phe Thr Gly Asp Gly 545 550 555 560 Ala Ala Lys Asp Lys Asp Gly Tyr Ile Trp Ile Leu Gly Arg Val Asp 565 570 575 Asp Val Val Asn Val Ser Gly His Arg Leu Ser Thr Ala Glu Ile Glu 580 585 590 Ala Ala Ile Ile Glu Asp Pro Ile Val Ala Glu Cys Ala Val Val Gly 595 600 605 Phe Asn Asp Asp Leu Thr Gly Gln Ala Val Ala Ala Phe Val Val Leu 610 615 620 Lys Asn Lys Ser Asn Trp Ser Thr Ala Thr Asp Asp Glu Leu Gln Asp 625 630 635 640 Ile Lys Lys His Leu Val Phe Thr Val Arg Lys Asp Ile Gly Pro Phe 645 650 655 Ala Ala Pro Lys Leu Ile Ile Leu Val Asp Asp Leu Pro Lys Thr Arg 660 665 670 Ser Gly Lys Ile Met Arg Arg Ile Leu Arg Lys Ile Leu Ala Gly Glu 675 680 685 Ser Asp Gln Leu Gly Asp Val Ser Thr Leu Ser Asn Pro Gly Ile Val 690 695 700 Arg His Leu Ile Asp Ser Val Lys Leu 705 710 <210> 5 <211> 2287 <212> DNA <213> Saccharomyces cerevisiae <220> <221> misc_feature <222> (1)..(2287) <223> Saccharomyces cerevisiae ACS2 nucleotide sequence <400> 5 acctcccgcg acctccaaaa tcgaactacc ttcacaatga caatcaagga acataaagta 60 gtttatgaag ctcacaacgt aaaggctctt aaggctcctc aacattttta caacagccaa 120 cccggcaagg gttacgttac tgatatgcaa cattatcaag aaatgtatca acaatctatc 180 aatgagccag aaaaattctt tgataagatg gctaaggaat acttgcattg ggatgctcca 240 tacaccaaag ttcaatctgg ttcattgaac aatggtgatg ttgcatggtt tttgaacggt 300 aaattgaatg catcatacaa ttgtgttgac agacatgcct ttgctaatcc cgacaagcca 360 gctttgatct atgaagctga tgacgaatcc gacaacaaaa tcatcacatt tggtgaatta 420 ctcagaaaag tttcccaaat cgctggtgtc ttaaaaagct ggggcgttaa gaaaggtgac 480 acagtggcta tctatttgcc aatgattcca gaagcggtca ttgctatgtt ggctgtggct 540 cgtattggtg ctattcactc tgttgtcttt gctgggttct ccgctggttc gttgaaagat 600 cgtgtcgttg acgctaattc taaagtggtc atcacttgtg atgaaggtaa aagaggtggt 660 aagaccatca acactaaaaa aattgttgac gaaggtttga acggagtcga tttggtttcc 720 cgtatcttgg ttttccaaag aactggtact gaaggtattc caatgaaggc cggtagagat 780 tactggtggc atgaggaggc cgctaagcag agaacttacc tacctcctgt ttcatgtgac 840 gctgaagatc ctctattttt attatacact tccggttcca ctggttctcc aaagggtgtc 900 gttcacacta caggtggtta tttattaggt gccgctttaa caactagata cgtttttgat 960 attcacccag aagatgttct cttcactgcc ggtgacgtcg gctggatcac gggtcacacc 1020 tatgctctat atggtccatt aaccttgggt accgcctcaa taattttcga atccactcct 1080 gcctacccag attatggtag atattggaga attatccaac gtcacaaggc tacccatttc 1140 tatgtggctc caactgcttt aagattaatc aaacgtgtag gtgaagccga aattgccaaa 1200 tatgacactt cctcattacg tgtcttgggt tccgtcggtg aaccaatctc tccagactta 1260 tgggaatggt atcatgaaaa agtgggtaac aaaaactgtg tcatttgtga cactatgtgg 1320 caaacagagt ctggttctca tttaattgct cctttggcag gtgctgtccc aacaaaacct 1380 ggttctgcta ccgtgccatt ctttggtatt aacgcttgta tcattgaccc tgttacaggt 1440 gtggaattag aaggtaatga tgtcgaaggt gtccttgccg ttaaatcacc atggccatca 1500 atggctagat ctgtttggaa ccaccacgac cgttacatgg atacttactt gaaaccttat 1560 cctggtcact atttcacagg tgatggtgct ggtagagatc atgatggtta ctactggatc 1620 aggggtagag ttgacgacgt tgtaaatgtt tccggtcata gattatccac atcagaaatt 1680 gaagcatcta tctcaaatca cgaaaacgtc tcggaagctg ctgttgtcgg tattccagat 1740 gaattgaccg gtcaaaccgt cgttgcatat gtttccctaa aagatggtta tctacaaaac 1800 aacgctactg aaggtgatgc agaacacatc acaccagata atttacgtag agaattgatc 1860 ttacaagtta ggggtgagat tggtcctttc gcctcaccaa aaaccattat tctagttaga 1920 gatctaccaa gaacaaggtc aggaaagatt atgagaagag ttctaagaaa ggttgcttct 1980 aacgaagccg aacagctagg tgacctaact actttggcca acccagaagt tgtacctgcc 2040 atcatttctg ctgtagagaa ccaatttttc tctcaaaaaa agaaataact taaatgagaa 2100 aaatttcgta atgagataaa atttcgctcc ttttctgttt tctattttct attttcccaa 2160 cttttgctct attcagttat aaattactat ttatccatca gttaaaaaac aagatctttt 2220 actggtcagc taggaaagcg aaaatacaaa gactttatgc actatccccg cgtgcttggc 2280 cggccgt 2287 <210> 6 <211> 683 <212> PRT <213> Saccharomyces cerevisiae <220> <221> misc_feature <222> (1)..(683) <223> Saccharomyces cerevisiae ACS2 protein sequence <400> 6 Met Thr Ile Lys Glu His Lys Val Val Tyr Glu Ala His Asn Val Lys 1 5 10 15 Ala Leu Lys Ala Pro Gln His Phe Tyr Asn Ser Gln Pro Gly Lys Gly 20 25 30 Tyr Val Thr Asp Met Gln His Tyr Gln Glu Met Tyr Gln Gln Ser Ile 35 40 45 Asn Glu Pro Glu Lys Phe Phe Asp Lys Met Ala Lys Glu Tyr Leu His 50 55 60 Trp Asp Ala Pro Tyr Thr Lys Val Gln Ser Gly Ser Leu Asn Asn Gly 65 70 75 80 Asp Val Ala Trp Phe Leu Asn Gly Lys Leu Asn Ala Ser Tyr Asn Cys 85 90 95 Val Asp Arg His Ala Phe Ala Asn Pro Asp Lys Pro Ala Leu Ile Tyr 100 105 110 Glu Ala Asp Asp Glu Ser Asp Asn Lys Ile Ile Thr Phe Gly Glu Leu 115 120 125 Leu Arg Lys Val Ser Gln Ile Ala Gly Val Leu Lys Ser Trp Gly Val 130 135 140 Lys Lys Gly Asp Thr Val Ala Ile Tyr Leu Pro Met Ile Pro Glu Ala 145 150 155 160 Val Ile Ala Met Leu Ala Val Ala Arg Ile Gly Ala Ile His Ser Val 165 170 175 Val Phe Ala Gly Phe Ser Ala Gly Ser Leu Lys Asp Arg Val Val Asp 180 185 190 Ala Asn Ser Lys Val Val Ile Thr Cys Asp Glu Gly Lys Arg Gly Gly 195 200 205 Lys Thr Ile Asn Thr Lys Lys Ile Val Asp Glu Gly Leu Asn Gly Val 210 215 220 Asp Leu Val Ser Arg Ile Leu Val Phe Gln Arg Thr Gly Thr Glu Gly 225 230 235 240 Ile Pro Met Lys Ala Gly Arg Asp Tyr Trp Trp His Glu Glu Ala Ala 245 250 255 Lys Gln Arg Thr Tyr Leu Pro Pro Val Ser Cys Asp Ala Glu Asp Pro 260 265 270 Leu Phe Leu Leu Tyr Thr Ser Gly Ser Thr Gly Ser Pro Lys Gly Val 275 280 285 Val His Thr Thr Gly Gly Tyr Leu Leu Gly Ala Ala Leu Thr Thr Arg 290 295 300 Tyr Val Phe Asp Ile His Pro Glu Asp Val Leu Phe Thr Ala Gly Asp 305 310 315 320 Val Gly Trp Ile Thr Gly His Thr Tyr Ala Leu Tyr Gly Pro Leu Thr 325 330 335 Leu Gly Thr Ala Ser Ile Ile Phe Glu Ser Thr Pro Ala Tyr Pro Asp 340 345 350 Tyr Gly Arg Tyr Trp Arg Ile Ile Gln Arg His Lys Ala Thr His Phe 355 360 365 Tyr Val Ala Pro Thr Ala Leu Arg Leu Ile Lys Arg Val Gly Glu Ala 370 375 380 Glu Ile Ala Lys Tyr Asp Thr Ser Ser Leu Arg Val Leu Gly Ser Val 385 390 395 400 Gly Glu Pro Ile Ser Pro Asp Leu Trp Glu Trp Tyr His Glu Lys Val 405 410 415 Gly Asn Lys Asn Cys Val Ile Cys Asp Thr Met Trp Gln Thr Glu Ser 420 425 430 Gly Ser His Leu Ile Ala Pro Leu Ala Gly Ala Val Pro Thr Lys Pro 435 440 445 Gly Ser Ala Thr Val Pro Phe Phe Gly Ile Asn Ala Cys Ile Ile Asp 450 455 460 Pro Val Thr Gly Val Glu Leu Glu Gly Asn Asp Val Glu Gly Val Leu 465 470 475 480 Ala Val Lys Ser Pro Trp Pro Ser Met Ala Arg Ser Val Trp Asn His 485 490 495 His Asp Arg Tyr Met Asp Thr Tyr Leu Lys Pro Tyr Pro Gly His Tyr 500 505 510 Phe Thr Gly Asp Gly Ala Gly Arg Asp His Asp Gly Tyr Tyr Trp Ile 515 520 525 Arg Gly Arg Val Asp Asp Val Val Asn Val Ser Gly His Arg Leu Ser 530 535 540 Thr Ser Glu Ile Glu Ala Ser Ile Ser Asn His Glu Asn Val Ser Glu 545 550 555 560 Ala Ala Val Val Gly Ile Pro Asp Glu Leu Thr Gly Gln Thr Val Val 565 570 575 Ala Tyr Val Ser Leu Lys Asp Gly Tyr Leu Gln Asn Asn Ala Thr Glu 580 585 590 Gly Asp Ala Glu His Ile Thr Pro Asp Asn Leu Arg Arg Glu Leu Ile 595 600 605 Leu Gln Val Arg Gly Glu Ile Gly Pro Phe Ala Ser Pro Lys Thr Ile 610 615 620 Ile Leu Val Arg Asp Leu Pro Arg Thr Arg Ser Gly Lys Ile Met Arg 625 630 635 640 Arg Val Leu Arg Lys Val Ala Ser Asn Glu Ala Glu Gln Leu Gly Asp 645 650 655 Leu Thr Thr Leu Ala Asn Pro Glu Val Val Pro Ala Ile Ile Ser Ala 660 665 670 Val Glu Asn Gln Phe Phe Ser Gln Lys Lys Lys 675 680 <210> 7 <211> 1798 <212> DNA <213> Saccharomyces cerevisiae <220> <221> misc_feature <222> (1)..(1798) <223> Saccharomyces cerevisiae ALD4 nucleotide sequence <400> 7 gcacccaggg acacacagca gcgaagtatt ttcagaatgt tcagtagatc tacgctctgc 60 ttaaagacgt ctgcatcctc cattgggaga cttcaattga gatatttctc acaccttcct 120 atgacagtgc ctatcaagct gcccaatggg ttggaatatg agcaaccaac ggggttgttc 180 atcaacaaca agtttgttcc ttctaaacag aacaagacct tcgaagtcat taacccttcc 240 acggaagaag aaatatgtca tatttatgaa ggtagagagg acgatgtgga agaggccgtg 300 caggccgccg accgtgcctt ctctaatggg tcttggaacg gtatcgaccc tattgacagg 360 ggtaaggctt tgtacaggtt agccgaatta attgaacagg acaaggatgt cattgcttcc 420 atcgagactt tggataacgg taaagctatc tcttcctcga gaggagatgt tgatttagtc 480 atcaactatt tgaaatcttc tgctggcttt gctgataaaa ttgatggtag aatgattgat 540 actggtagaa cccatttttc ttacactaag agacagcctt tgggtgtttg tgggcagatt 600 attccttgga atttcccact gttgatgtgg gcctggaaga ttgcccctgc tttggtcacc 660 ggtaacaccg tcgtgttgaa gactgccgaa tccaccccat tgtccgcttt gtatgtgtct 720 aaatacatcc cacaggcggg tattccacct ggtgtgatca acattgtatc cgggtttggt 780 aagattgtgg gtgaggccat tacaaaccat ccaaaaatca aaaaggttgc cttcacaggg 840 tccacggcta cgggtagaca catttaccag tccgcagccg caggcttgaa aaaagtgact 900 ttggagctgg gtggtaaatc accaaacatt gtcttcgcgg acgccgagtt gaaaaaagcc 960 gtgcaaaaca ttatccttgg tatctactac aattctggtg aggtctgttg tgcgggttca 1020 agggtgtatg ttgaagaatc tatttacgac aaattcattg aagagttcaa agccgcttct 1080 gaatccatca aggtgggcga cccattcgat gaatctactt tccaaggtgc acaaacctct 1140 caaatgcaac taaacaaaat cttgaaatac gttgacattg gtaagaatga aggtgctact 1200 ttgattaccg gtggtgaaag attaggtagc aagggttact tcattaagcc aactgtcttt 1260 ggtgacgtta aggaagacat gagaattgtc aaagaggaaa tctttggccc tgttgtcact 1320 gtaaccaaat tcaaatctgc cgacgaagtc attaacatgg cgaacgattc tgaatacggg 1380 ttggctgctg gtattcacac ctctaatatt aataccgcct taaaagtggc tgatagagtt 1440 aatgcgggta cggtctggat aaacacttat aacgatttcc accacgcagt tcctttcggt 1500 gggttcaatg catctggttt gggcagggaa atgtctgttg atgctttaca aaactacttg 1560 caagttaaag cggtccgtgc caaattggac gagtaaggtc atcaataagc ctggtgtcca 1620 atcgatgctt acatacataa aattaaatat tctgtctctg ttatatttcc acatgtcatc 1680 atttcaaata tatgtacttt aaagaaaata aaataaaaaa taaaattttt ttctcccgat 1740 aatcaatttt cttaattaat taattgcgtt acgaaacgcg atcgccgacg ccgccgat 1798 <210> 8 <211> 519 <212> PRT <213> Saccharomyces cerevisiae <220> <221> misc_feature <222> (1)..(519) <223> Saccharomyces cerevisiae ALD4 protein sequence <400> 8 Met Phe Ser Arg Ser Thr Leu Cys Leu Lys Thr Ser Ala Ser Ser Ile 1 5 10 15 Gly Arg Leu Gln Leu Arg Tyr Phe Ser His Leu Pro Met Thr Val Pro 20 25 30 Ile Lys Leu Pro Asn Gly Leu Glu Tyr Glu Gln Pro Thr Gly Leu Phe 35 40 45 Ile Asn Asn Lys Phe Val Pro Ser Lys Gln Asn Lys Thr Phe Glu Val 50 55 60 Ile Asn Pro Ser Thr Glu Glu Glu Ile Cys His Ile Tyr Glu Gly Arg 65 70 75 80 Glu Asp Asp Val Glu Glu Ala Val Gln Ala Ala Asp Arg Ala Phe Ser 85 90 95 Asn Gly Ser Trp Asn Gly Ile Asp Pro Ile Asp Arg Gly Lys Ala Leu 100 105 110 Tyr Arg Leu Ala Glu Leu Ile Glu Gln Asp Lys Asp Val Ile Ala Ser 115 120 125 Ile Glu Thr Leu Asp Asn Gly Lys Ala Ile Ser Ser Ser Arg Gly Asp 130 135 140 Val Asp Leu Val Ile Asn Tyr Leu Lys Ser Ser Ala Gly Phe Ala Asp 145 150 155 160 Lys Ile Asp Gly Arg Met Ile Asp Thr Gly Arg Thr His Phe Ser Tyr 165 170 175 Thr Lys Arg Gln Pro Leu Gly Val Cys Gly Gln Ile Ile Pro Trp Asn 180 185 190 Phe Pro Leu Leu Met Trp Ala Trp Lys Ile Ala Pro Ala Leu Val Thr 195 200 205 Gly Asn Thr Val Val Leu Lys Thr Ala Glu Ser Thr Pro Leu Ser Ala 210 215 220 Leu Tyr Val Ser Lys Tyr Ile Pro Gln Ala Gly Ile Pro Pro Gly Val 225 230 235 240 Ile Asn Ile Val Ser Gly Phe Gly Lys Ile Val Gly Glu Ala Ile Thr 245 250 255 Asn His Pro Lys Ile Lys Lys Val Ala Phe Thr Gly Ser Thr Ala Thr 260 265 270 Gly Arg His Ile Tyr Gln Ser Ala Ala Ala Gly Leu Lys Lys Val Thr 275 280 285 Leu Glu Leu Gly Gly Lys Ser Pro Asn Ile Val Phe Ala Asp Ala Glu 290 295 300 Leu Lys Lys Ala Val Gln Asn Ile Ile Leu Gly Ile Tyr Tyr Asn Ser 305 310 315 320 Gly Glu Val Cys Cys Ala Gly Ser Arg Val Tyr Val Glu Glu Ser Ile 325 330 335 Tyr Asp Lys Phe Ile Glu Glu Phe Lys Ala Ala Ser Glu Ser Ile Lys 340 345 350 Val Gly Asp Pro Phe Asp Glu Ser Thr Phe Gln Gly Ala Gln Thr Ser 355 360 365 Gln Met Gln Leu Asn Lys Ile Leu Lys Tyr Val Asp Ile Gly Lys Asn 370 375 380 Glu Gly Ala Thr Leu Ile Thr Gly Gly Glu Arg Leu Gly Ser Lys Gly 385 390 395 400 Tyr Phe Ile Lys Pro Thr Val Phe Gly Asp Val Lys Glu Asp Met Arg 405 410 415 Ile Val Lys Glu Glu Ile Phe Gly Pro Val Val Thr Val Thr Lys Phe 420 425 430 Lys Ser Ala Asp Glu Val Ile Asn Met Ala Asn Asp Ser Glu Tyr Gly 435 440 445 Leu Ala Ala Gly Ile His Thr Ser Asn Ile Asn Thr Ala Leu Lys Val 450 455 460 Ala Asp Arg Val Asn Ala Gly Thr Val Trp Ile Asn Thr Tyr Asn Asp 465 470 475 480 Phe His His Ala Val Pro Phe Gly Gly Phe Asn Ala Ser Gly Leu Gly 485 490 495 Arg Glu Met Ser Val Asp Ala Leu Gln Asn Tyr Leu Gln Val Lys Ala 500 505 510 Val Arg Ala Lys Leu Asp Glu 515 <210> 9 <211> 2744 <212> DNA <213> Saccharomyces cerevisiae <220> <221> misc_feature <222> (1)..(2744) <223> Saccharomyces cerevisiae cytosolic aldehyde dehydrogenase 6 (ALD6) nucleotide sequence <400> 9 catatggcgt atccaagccg aaaccctttg cctcatcccc acggaataag gcagccgaca 60 aaagaaaaac gaccgaaaag gaaccagaaa gaaaaaagag ggtgggcgcg ccgcggacgt 120 gtaaaaagat atgcatccag cttctatatc gctttaactt taccgttttg ggcatcggga 180 acgtatgtaa cattgatctc ctcttgggaa cggtgagtgc aacagatgcg atatagcacc 240 gaccatgtgg gcaaattcgt aataaattcg gggtgagggg gattcaagac aagcaacctt 300 gttagtcagc tcaaacagcg atttaacggt tgagtaacac atcaaaacac cgttcgaggt 360 caagcctggc gtgtttaaca agttcttgat atcatatata aatgtaataa gaagtttggt 420 aatattcaat tcgaagtgtt cagtctttta cttctcttgt tttatagaag aaaaaacatc 480 aagaaacatc tttaacatac acaaacacat actatcagaa tacaatgact aagctacact 540 ttgacactgc tgaaccagtc aagatcacac ttccaaatgg tttgacatac gagcaaccaa 600 ccggtctatt cattaacaac aagtttatga aagctcaaga cggtaagacc tatcccgtcg 660 aagatccttc cactgaaaac accgtttgtg aggtctcttc tgccaccact gaagatgttg 720 aatatgctat cgaatgtgcc gaccgtgctt tccacgacac tgaatgggct acccaagacc 780 caagagaaag aggccgtcta ctaagtaagt tggctgacga attggaaagc caaattgact 840 tggtttcttc cattgaagct ttggacaatg gtaaaacttt ggcctttaag gcccgtgggg 900 atgttaccat tgcaatcaac tgtctaagag atgctgctgc ctatgccgac aaagtcaacg 960 gtagaacaat caacaccggt gacggctaca tgaacttcac caccttagag ccaatcggtg 1020 tctgtggtca aattattcca tggaactttc caataatgat gttggcttgg aagatcgccc 1080 cagcattggc catgggtaac gtctgtatct tgaaacccgc tgctgtcaca cctttaaatg 1140 ccctatactt tgcttcttta tgtaagaagg ttggtattcc agctggtgtc gtcaacatcg 1200 ttccaggtcc tggtagaact gttggtgctg ctttgaccaa cgacccaaga atcagaaagc 1260 tggcttttac cggttctaca gaagtcggta agagtgttgc tgtcgactct tctgaatcta 1320 acttgaagaa aatcactttg gaactaggtg gtaagtccgc ccatttggtc tttgacgatg 1380 ctaacattaa gaagacttta ccaaatctag taaacggtat tttcaagaac gctggtcaaa 1440 tttgttcctc tggttctaga atttacgttc aagaaggtat ttacgacgaa ctattggctg 1500 ctttcaaggc ttacttggaa accgaaatca aagttggtaa tccatttgac aaggctaact 1560 tccaaggtgc tatcactaac cgtcaacaat tcgacacaat tatgaactac atcgatatcg 1620 gtaagaaaga aggcgccaag atcttaactg gtggcgaaaa agttggtgac aagggttact 1680 tcatcagacc aaccgttttc tacgatgtta atgaagacat gagaattgtt aaggaagaaa 1740 tttttggacc agttgtcact gtcgcaaagt tcaagacttt agaagaaggt gtcgaaatgg 1800 ctaacagctc tgaattcggt ctaggttctg gtatcgaaac agaatctttg agcacaggtt 1860 tgaaggtggc caagatgttg aaggccggta ccgtctggat caacacatac aacgattttg 1920 actccagagt tccattcggt ggtgttaagc aatctggtta cggtagagaa atgggtgaag 1980 aagtctacca tgcatacact gaagtaaaag ctgtcagaat taagttgtaa tgtaccaacc 2040 tgcatttctt tccgtcatat acacaaaata ctttcatata aacttacttg gtcttacgtc 2100 ataaataaat atgtatacat ataaattaaa aaatttggtt ttatattttt acaaaaagaa 2160 tcgtttactt catttctccc ttttaagcga tacaatccat gaaaaaagag aaaaagagag 2220 aacaggcttg tgccttcttt aaaacatccc acacaaaatc atattgaatt gaattttaca 2280 tcttaagcta gtgtacaaca actgctatat ccaaagaaaa ctaacgtgga ccgcttttag 2340 agttgagaaa aaggtttgaa aaaaatagca atacaaagac ttgtttcata tataaaatac 2400 agggagcaca ttgagctaat ataacataaa cactgcgaac caattccaat caaaaggtac 2460 acatgagagc attcccccga gtactgccat ttcgccatca gagatcatat aataacatcc 2520 ttcttcgaac agtaaggctt tttggttcat cactttcttc ttttgatttc tctaggcaaa 2580 tgcctaaggt ggaccctgac aataccgctg caatgctact acagaaaaac ttgatccaaa 2640 gaaacaacat gctctatggg tatggatcag ggacaatacg atgtactttg ctagactcaa 2700 ctggacgagc caaatcacca ttagtagaga taaaacgtga ggat 2744 <210> 10 <211> 500 <212> PRT <213> Saccharomyces cerevisiae <220> <221> misc_feature <222> (1)..(500) <223> Saccharomyces cerevisiae cytosolic aldehyde dehydrogenase 6 (ALD6) protein sequence <400> 10 Met Thr Lys Leu His Phe Asp Thr Ala Glu Pro Val Lys Ile Thr Leu 1 5 10 15 Pro Asn Gly Leu Thr Tyr Glu Gln Pro Thr Gly Leu Phe Ile Asn Asn 20 25 30 Lys Phe Met Lys Ala Gln Asp Gly Lys Thr Tyr Pro Val Glu Asp Pro 35 40 45 Ser Thr Glu Asn Thr Val Cys Glu Val Ser Ser Ala Thr Thr Glu Asp 50 55 60 Val Glu Tyr Ala Ile Glu Cys Ala Asp Arg Ala Phe His Asp Thr Glu 65 70 75 80 Trp Ala Thr Gln Asp Pro Arg Glu Arg Gly Arg Leu Leu Ser Lys Leu 85 90 95 Ala Asp Glu Leu Glu Ser Gln Ile Asp Leu Val Ser Ser Ile Glu Ala 100 105 110 Leu Asp Asn Gly Lys Thr Leu Ala Leu Ala Arg Gly Asp Val Thr Ile 115 120 125 Ala Ile Asn Cys Leu Arg Asp Ala Ala Ala Tyr Ala Asp Lys Val Asn 130 135 140 Gly Arg Thr Ile Asn Thr Gly Asp Gly Tyr Met Asn Phe Thr Thr Leu 145 150 155 160 Glu Pro Ile Gly Val Cys Gly Gln Ile Ile Pro Trp Asn Phe Pro Ile 165 170 175 Met Met Leu Ala Trp Lys Ile Ala Pro Ala Leu Ala Met Gly Asn Val 180 185 190 Cys Ile Leu Lys Pro Ala Ala Val Thr Pro Leu Asn Ala Leu Tyr Phe 195 200 205 Ala Ser Leu Cys Lys Lys Val Gly Ile Pro Ala Gly Val Val Asn Ile 210 215 220 Val Pro Gly Pro Gly Arg Thr Val Gly Ala Ala Leu Thr Asn Asp Pro 225 230 235 240 Arg Ile Arg Lys Leu Ala Phe Thr Gly Ser Thr Glu Val Gly Lys Ser 245 250 255 Val Ala Val Asp Ser Ser Glu Ser Asn Leu Lys Lys Ile Thr Leu Glu 260 265 270 Leu Gly Gly Lys Ser Ala His Leu Val Phe Asp Asp Ala Asn Ile Lys 275 280 285 Lys Thr Leu Pro Asn Leu Val Asn Gly Ile Phe Lys Asn Ala Gly Gln 290 295 300 Ile Cys Ser Ser Gly Ser Arg Ile Tyr Val Gln Glu Gly Ile Tyr Asp 305 310 315 320 Glu Leu Leu Ala Ala Phe Lys Ala Tyr Leu Glu Thr Glu Ile Lys Val 325 330 335 Gly Asn Pro Phe Asp Lys Ala Asn Phe Gln Gly Ala Ile Thr Asn Arg 340 345 350 Gln Gln Phe Asp Thr Ile Met Asn Tyr Ile Asp Ile Gly Lys Lys Glu 355 360 365 Gly Ala Lys Ile Leu Thr Gly Gly Glu Lys Val Gly Asp Lys Gly Tyr 370 375 380 Phe Ile Arg Pro Thr Val Phe Tyr Asp Val Asn Glu Asp Met Arg Ile 385 390 395 400 Val Lys Glu Glu Ile Phe Gly Pro Val Val Thr Val Ala Lys Phe Lys 405 410 415 Thr Leu Glu Glu Gly Val Glu Met Ala Asn Ser Ser Glu Phe Gly Leu 420 425 430 Gly Ser Gly Ile Glu Thr Glu Ser Leu Ser Thr Gly Leu Lys Val Ala 435 440 445 Lys Met Leu Lys Ala Gly Thr Val Trp Ile Asn Thr Tyr Asn Asp Phe 450 455 460 Asp Ser Arg Val Pro Phe Gly Gly Val Lys Gln Ser Gly Tyr Gly Arg 465 470 475 480 Glu Met Gly Glu Glu Val Tyr His Ala Tyr Thr Glu Val Lys Ala Val 485 490 495 Arg Ile Lys Leu 500 <210> 11 <211> 2749 <212> DNA <213> Leuconostoc mesenteroides <220> <221> misc_feature <222> (1)..(2749) <223> Leuconostoc mesenteroides Phosphoketolase (PK) gene sequence <400> 11 gttacggaag aagtcgtggt ttacggtgtt tatgattctt gcaaaaaata aggagtactt 60 aatctcatgg cagatttcga ttcaaaagag tacttggaac ttgttgataa gtggtggcgc 120 gcaactaact atttgtcagc tgggatgatc tttttgaaga gcaacccatt gttctcagtt 180 actaatacac ctatcaaggc tgaagatgta aaagttaagc caatcggaca ctggggtact 240 atctcaggtc agacattctt gtatgcacat gctaaccgtt tgatcaacaa gtatggtttg 300 aacatgtttt acgttggtgg tcctggtcac ggtggccaag ttatggttac taacgcttac 360 ttagacggcg catatactga agattatcct gaaattactc aagatatcga aggtatgagc 420 cacttgttca agcgtttctc attccctggc ggtattggat cacacatgac agctcaaaca 480 cctggttcat tacacgaagg tggtgaattg ggctattcat tgagccacgc ttttggtgcc 540 gttttggaca atcctgacca agttgctttc gcagttgttg gtgatggtga agctgaaaca 600 ggtccttcaa tggcttcatg gcactcaatt aagtttttga atgctaagaa tgatggtgcc 660 gttttgcctg tcttggattt gaacggattc aagatttcaa acccaactat cttctcacgt 720 atgagtgatg aagaaatcac aaagttcttt gaaggtttgg gttattcacc tcgcttcatc 780 gaaaacgatg atattcatga ctacgcaaca tatcaccaac ttgcagcaaa cattttggat 840 caagctattg aagatattca agctattcaa aatgatgcac gtgaaaatgg taagtatcaa 900 gatggtgaaa tccctgcatg gccagtaatt attgctcgct tgccaaaggg ctggggtgga 960 ccaacgcacg atgcaagtaa caatcctatt gaaaactcat tccgtgcgca ccaagtgcca 1020 ttgcctcttg aacaacacga tcttgcaaca ttgcctgaat tcgaagactg gatgaactca 1080 tacaagcctg aagaattatt caatgctgat ggttctttga aggatgaatt gaaagctatc 1140 gctcctaagg gtgacaagcg tatgtcagct aaccctatta caaatggtgg tgctgatcgt 1200 tcagacttga agttgcctaa ctggagagaa ttcgctaacg atatcaatga tgatacacgt 1260 ggtaaggaat tcgctgatag caagcgcaat atggacatgg caacattgtc aaactacttg 1320 ggtgctgttt cacaattgaa cccaactcgt ttccgcttct tcggtcctga tgaaacaatg 1380 tcaaaccgtt tgtggggatt gttcaatgtt acaccacgtc aatggatgga agaaatcaag 1440 gaaccacaag atcaattgtt gagccctacg ggtcgcatta ttgattcaca attgtctgaa 1500 catcaagctg aaggttggct tgaaggatat actttgactg gtcgtgttgg aatcttcgca 1560 tcatacgagt cattcttgcg tgttgtcgat acaatggtta cgcaacactt caagtggttg 1620 cgtcacgctt cagaacaagc atggcgtaat gactatccat cattgaactt gattgcaact 1680 tcaactgctt tccaacaaga tcacaatgga tatactcacc aagatccagg tatgttgact 1740 cacttggctg aaaagaagtc taactttatt cgtgaatatt tgccagctga tggtaactca 1800 ttgttggctg ttcaagaacg tgctttctca gaacgtcata aggttaactt gttgattgct 1860 tctaagcaac cacgtcaaca atggtttaca gttgaagaag ctgaagtatt ggctaacgaa 1920 ggtttgaaga tcattgattg ggcttctact gcaccttcta gtgatgttga tattacattc 1980 gcatctgctg gtactgaacc aacaattgaa actttggctg ctttgtggtt gattaaccaa 2040 gcattcccag atgttaagtt ccgttatgtt aacgttgttg aattactacg tttgcaaaag 2100 aagtcagaac ctaacatgaa tgatgaacgt gaattatcag ccgaagaatt caacaagtat 2160 ttccaagctg atacaccagt tatcttcggt ttccatgctt atgaaaactt gattgaatca 2220 ttcttcttcg aacgtaagtt cacgggtgat gtatacgttc atggatatcg tgaagatggt 2280 gacatcacaa cgacatatga tatgcgtgta tattcacact tggatcgctt ccatcaagct 2340 aaggaagctg ctgaaatctt gtctgcaaat ggtaagattg atcaagctgc tgctgataca 2400 ttcatcgcta agatggatga tactttggca aagcatttcc aagttactcg taacgaaggt 2460 cgtgatatcg aagaattcac tgactggaca tggtcaccac ttaagtaatt taaaattatt 2520 ttatcaaaac caactattat ttttaatagt tggttttttt atggctaaat tgactacata 2580 ctaaacgaaa ccatgtaaaa gtgccacata gttttactta ataagttcct tttatttttt 2640 gatttgcaat gcaaaattgt aagcgtaata tgaataataa aaacccccaa ttagttagct 2700 aattgggggt tttgtaaatc accatatcag ccgctcatag tcttagacg 2749 <210> 12 <211> 813 <212> PRT <213> Leuconostoc mesenteroides <220> <221> misc_feature <222> (1)..(813) <223> Leuconostoc mesenteroides Phosphoketolase (PK) protein sequence <400> 12 Met Ala Asp Phe Asp Ser Lys Glu Tyr Leu Glu Leu Val Asp Lys Trp 1 5 10 15 Trp Arg Ala Thr Asn Tyr Leu Ser Ala Gly Met Ile Phe Leu Lys Ser 20 25 30 Asn Pro Leu Phe Ser Val Thr Asn Thr Pro Ile Lys Ala Glu Asp Val 35 40 45 Lys Val Lys Pro Ile Gly His Trp Gly Thr Ile Ser Gly Gln Thr Phe 50 55 60 Leu Tyr Ala His Ala Asn Arg Leu Ile Asn Lys Tyr Gly Leu Asn Met 65 70 75 80 Phe Tyr Val Gly Gly Pro Gly His Gly Gly Gln Val Met Val Thr Asn 85 90 95 Ala Tyr Leu Asp Gly Ala Tyr Thr Glu Asp Tyr Pro Glu Ile Thr Gln 100 105 110 Asp Ile Glu Gly Met Ser His Leu Phe Lys Arg Phe Ser Phe Pro Gly 115 120 125 Gly Ile Gly Ser His Met Thr Ala Gln Thr Pro Gly Ser Leu His Glu 130 135 140 Gly Gly Glu Leu Gly Tyr Ser Leu Ser His Ala Phe Gly Ala Val Leu 145 150 155 160 Asp Asn Pro Asp Gln Val Ala Phe Ala Val Val Gly Asp Gly Glu Ala 165 170 175 Glu Thr Gly Pro Ser Met Ala Ser Trp His Ser Ile Lys Phe Leu Asn 180 185 190 Ala Lys Asn Asp Gly Ala Val Leu Pro Val Leu Asp Leu Asn Gly Phe 195 200 205 Lys Ile Ser Asn Pro Thr Ile Phe Ser Arg Met Ser Asp Glu Glu Ile 210 215 220 Thr Lys Phe Phe Glu Gly Leu Gly Tyr Ser Pro Arg Phe Ile Glu Asn 225 230 235 240 Asp Asp Ile His Asp Tyr Ala Thr Tyr His Gln Leu Ala Ala Asn Ile 245 250 255 Leu Asp Gln Ala Ile Glu Asp Ile Gln Ala Ile Gln Asn Asp Ala Arg 260 265 270 Glu Asn Gly Lys Tyr Gln Asp Gly Glu Ile Pro Ala Trp Pro Val Ile 275 280 285 Ile Ala Arg Leu Pro Lys Gly Trp Gly Gly Pro Thr His Asp Ala Ser 290 295 300 Asn Asn Pro Ile Glu Asn Ser Phe Arg Ala His Gln Val Pro Leu Pro 305 310 315 320 Leu Glu Gln His Asp Leu Ala Thr Leu Pro Glu Phe Glu Asp Trp Met 325 330 335 Asn Ser Tyr Lys Pro Glu Glu Leu Phe Asn Ala Asp Gly Ser Leu Lys 340 345 350 Asp Glu Leu Lys Ala Ile Ala Pro Lys Gly Asp Lys Arg Met Ser Ala 355 360 365 Asn Pro Ile Thr Asn Gly Gly Ala Asp Arg Ser Asp Leu Lys Leu Pro 370 375 380 Asn Trp Arg Glu Phe Ala Asn Asp Ile Asn Asp Asp Thr Arg Gly Lys 385 390 395 400 Glu Phe Ala Asp Ser Lys Arg Asn Met Asp Met Ala Thr Leu Ser Asn 405 410 415 Tyr Leu Gly Ala Val Ser Gln Leu Asn Pro Thr Arg Phe Arg Phe Phe 420 425 430 Gly Pro Asp Glu Thr Met Ser Asn Arg Leu Trp Gly Leu Phe Asn Val 435 440 445 Thr Pro Arg Gln Trp Met Glu Glu Ile Lys Glu Pro Gln Asp Gln Leu 450 455 460 Leu Ser Pro Thr Gly Arg Ile Ile Asp Ser Gln Leu Ser Glu His Gln 465 470 475 480 Ala Glu Gly Trp Leu Glu Gly Tyr Thr Leu Thr Gly Arg Val Gly Ile 485 490 495 Phe Ala Ser Tyr Glu Ser Phe Leu Arg Val Val Asp Thr Met Val Thr 500 505 510 Gln His Phe Lys Trp Leu Arg His Ala Ser Glu Gln Ala Trp Arg Asn 515 520 525 Asp Tyr Pro Ser Leu Asn Leu Ile Ala Thr Ser Thr Ala Phe Gln Gln 530 535 540 Asp His Asn Gly Tyr Thr His Gln Asp Pro Gly Met Leu Thr His Leu 545 550 555 560 Ala Glu Lys Lys Ser Asn Phe Ile Arg Glu Tyr Leu Pro Ala Asp Gly 565 570 575 Asn Ser Leu Leu Ala Val Gln Glu Arg Ala Phe Ser Glu Arg His Lys 580 585 590 Val Asn Leu Leu Ile Ala Ser Lys Gln Pro Arg Gln Gln Trp Phe Thr 595 600 605 Val Glu Glu Ala Glu Val Leu Ala Asn Glu Gly Leu Lys Ile Ile Asp 610 615 620 Trp Ala Ser Thr Ala Pro Ser Ser Asp Val Asp Ile Thr Phe Ala Ser 625 630 635 640 Ala Gly Thr Glu Pro Thr Ile Glu Thr Leu Ala Ala Leu Trp Leu Ile 645 650 655 Asn Gln Ala Phe Pro Asp Val Lys Phe Arg Tyr Val Asn Val Val Glu 660 665 670 Leu Leu Arg Leu Gln Lys Lys Ser Glu Pro Asn Met Asn Asp Glu Arg 675 680 685 Glu Leu Ser Ala Glu Glu Phe Asn Lys Tyr Phe Gln Ala Asp Thr Pro 690 695 700 Val Ile Phe Gly Phe His Ala Tyr Glu Asn Leu Ile Glu Ser Phe Phe 705 710 715 720 Phe Glu Arg Lys Phe Thr Gly Asp Val Tyr Val His Gly Tyr Arg Glu 725 730 735 Asp Gly Asp Ile Thr Thr Thr Tyr Asp Met Arg Val Tyr Ser His Leu 740 745 750 Asp Arg Phe His Gln Ala Lys Glu Ala Ala Glu Ile Leu Ser Ala Asn 755 760 765 Gly Lys Ile Asp Gln Ala Ala Ala Asp Thr Phe Ile Ala Lys Met Asp 770 775 780 Asp Thr Leu Ala Lys His Phe Gln Val Thr Arg Asn Glu Gly Arg Asp 785 790 795 800 Ile Glu Glu Phe Thr Asp Trp Thr Trp Ser Pro Leu Lys 805 810 <210> 13 <211> 1002 <212> DNA <213> Clostridium kluyveri <220> <221> misc_feature <222> (1)..(1002) <223> Clostridium kluyveri Phosphotransacetylase (PTA) gene sequence <400> 13 atgaaattaa tggaaaatat ttttggttta gccaaagcag ataagaaaaa aattgttttg 60 gcagaaggag aagaagaaag gaacattaga gcttccgaag aaataataag ggatggtatt 120 gcagatataa ttttagtagg aagtgaaagt gtaataaaag agaatgcagc taaatttggg 180 gttaacttag ctggagtgga aatagtagat cctgaaactt caagtaaaac tgcaggctat 240 gccaatgctt tttatgaaat tagaaagaat aaaggagtta cactggaaaa agcagataaa 300 atagttagag atcctatata ttttgcaaca atgatggtga aacttggaga tgcagatggt 360 ttagtttcag gtgcaataca tacaacggga gatcttttga gaccaggact tcaaatagtg 420 aagacagttc caggtgcttc tgtggtttcc agtgtatttt taatgagtgt accagattgt 480 gaatatggag aagatggatt cttgttattt gctgattgtg ctgtaaatgt atgtcctact 540 gctgaagaat tatcttcaat tgcaataact acagcagaaa ctgcaaaaaa tttgtgtaaa 600 atagaaccaa gagttgccat gctttcattt tctactatgg gaagtgctag tcatgaattg 660 gtagataaag ttacaaaagc aacaaaactt gctaaagaag ctagacctga tttggatata 720 gatggagaac ttcaattgga tgcttcccta gtaaaaaaag ttgcagactt aaaagctccg 780 ggcagtaaag tggcaggaaa agccaatgta cttatattcc ctgatataca agcaggaaat 840 ataggatata agttagttca aagatttgca aaagctgagg ctataggacc tatatgtcag 900 ggatttgcaa agcctataaa tgatttatca agaggctgca gcgttgatga tatagtaaag 960 gtagtggctg taactgcagt tcaagcacag gcacagggtt ag 1002 <210> 14 <211> 333 <212> PRT <213> Clostridium kluyveri <220> <221> misc_feature <222> (1)..(333) <223> Clostridium kluyveri Phosphotransacetylase (PTA) protein sequence <400> 14 Met Lys Leu Met Glu Asn Ile Phe Gly Leu Ala Lys Ala Asp Lys Lys 1 5 10 15 Lys Ile Val Leu Ala Glu Gly Glu Glu Glu Arg Asn Ile Arg Ala Ser 20 25 30 Glu Glu Ile Ile Arg Asp Gly Ile Ala Asp Ile Ile Leu Val Gly Ser 35 40 45 Glu Ser Val Ile Lys Glu Asn Ala Ala Lys Phe Gly Val Asn Leu Ala 50 55 60 Gly Val Glu Ile Val Asp Pro Glu Thr Ser Ser Lys Thr Ala Gly Tyr 65 70 75 80 Ala Asn Ala Phe Tyr Glu Ile Arg Lys Asn Lys Gly Val Thr Leu Glu 85 90 95 Lys Ala Asp Lys Ile Val Arg Asp Pro Ile Tyr Phe Ala Thr Met Met 100 105 110 Val Lys Leu Gly Asp Ala Asp Gly Leu Val Ser Gly Ala Ile His Thr 115 120 125 Thr Gly Asp Leu Leu Arg Pro Gly Leu Gln Ile Val Lys Thr Val Pro 130 135 140 Gly Ala Ser Val Val Ser Ser Val Phe Leu Met Ser Val Pro Asp Cys 145 150 155 160 Glu Tyr Gly Glu Asp Gly Phe Leu Leu Phe Ala Asp Cys Ala Val Asn 165 170 175 Val Cys Pro Thr Ala Glu Glu Leu Ser Ser Ile Ala Ile Thr Thr Ala 180 185 190 Glu Thr Ala Lys Asn Leu Cys Lys Ile Glu Pro Arg Val Ala Met Leu 195 200 205 Ser Phe Ser Thr Met Gly Ser Ala Ser His Glu Leu Val Asp Lys Val 210 215 220 Thr Lys Ala Thr Lys Leu Ala Lys Glu Ala Arg Pro Asp Leu Asp Ile 225 230 235 240 Asp Gly Glu Leu Gln Leu Asp Ala Ser Leu Val Lys Lys Val Ala Asp 245 250 255 Leu Lys Ala Pro Gly Ser Lys Val Ala Gly Lys Ala Asn Val Leu Ile 260 265 270 Phe Pro Asp Ile Gln Ala Gly Asn Ile Gly Tyr Lys Leu Val Gln Arg 275 280 285 Phe Ala Lys Ala Glu Ala Ile Gly Pro Ile Cys Gln Gly Phe Ala Lys 290 295 300 Pro Ile Asn Asp Leu Ser Arg Gly Cys Ser Val Asp Asp Ile Val Lys 305 310 315 320 Val Val Ala Val Thr Ala Val Gln Ala Gln Ala Gln Gly 325 330 <210> 15 <211> 2137 <212> DNA <213> Streptomyces sp. CL190 <220> <221> misc_feature <222> (1)..(2137) <223> Streptomyces sp. CL190 nphT7 gene sequence <400> 15 cctgcaggcc gtcgagggcg cctggaagga ctacgcggag caggacggcc ggtcgctgga 60 ggagttcgcg gcgttcgtct accaccagcc gttcacgaag atggcctaca aggcgcaccg 120 ccacctgctg aacttcaacg gctacgacac cgacaaggac gccatcgagg gcgccctcgg 180 ccagacgacg gcgtacaaca acgtcatcgg caacagctac accgcgtcgg tgtacctggg 240 cctggccgcc ctgctcgacc aggcggacga cctgacgggc cgttccatcg gcttcctgag 300 ctacggctcg ggcagcgtcg ccgagttctt ctcgggcacc gtcgtcgccg ggtaccgcga 360 gcgtctgcgc accgaggcga accaggaggc gatcgcccgg cgcaagagcg tcgactacgc 420 cacctaccgc gagctgcacg agtacacgct cccgtccgac ggcggcgacc acgccacccc 480 ggtgcagacc accggcccct tccggctggc cgggatcaac gaccacaagc gcatctacga 540 ggcgcgctag cgacacccct cggcaacggg gtgcgccact gttcggcgca ccccgtgccg 600 ggctttcgca cagctattca cgaccatttg aggggcgggc agccgcatga ccgacgtccg 660 attccgcatt atcggtacgg gtgcctacgt accggaacgg atcgtctcca acgatgaagt 720 cggcgcgccg gccggggtgg acgacgactg gatcacccgc aagaccggta tccggcagcg 780 tcgctgggcc gccgacgacc aggccacctc ggacctggcc acggccgcgg ggcgggcagc 840 gctgaaagcg gcgggcatca cgcccgagca gctgaccgtg atcgcggtcg ccacctccac 900 gccggaccgg ccgcagccgc ccacggcggc ctatgtccag caccacctcg gtgcgaccgg 960 cactgcggcg ttcgacgtca acgcggtctg ctccggcacc gtgttcgcgc tgtcctcggt 1020 ggcgggcacc ctcgtgtacc ggggcggtta cgcgctggtc atcggcgcgg acctgtactc 1080 gcgcatcctc aacccggccg accgcaagac ggtcgtgctg ttcggggacg gcgccggcgc 1140 aatggtcctc gggccgacct cgaccggcac gggccccatc gtccggcgcg tcgccctgca 1200 caccttcggc ggcctcaccg acctgatccg tgtgcccgcg ggcggcagcc gccagccgct 1260 ggacacggat ggcctcgacg cgggactgca gtacttcgcg atggacgggc gtgaggtgcg 1320 ccgcttcgtc acggagcacc tgccgcagct gatcaagggc ttcctgcacg aggccggggt 1380 cgacgccgcc gacatcagcc acttcgtgcc gcatcaggcc aacggtgtca tgctcgacga 1440 ggtcttcggc gagctgcatc tgccgcgggc gaccatgcac cggacggtcg agacctacgg 1500 caacacggga gcggcctcca tcccgatcac catggacgcg gccgtgcgcg ccggttcctt 1560 ccggccgggc gagctggtcc tgctggccgg gttcggcggc ggcatggccg cgagcttcgc 1620 cctgatcgag tggtagtcgc ccgtaccacc acagcggtcc ggcgccacct gttccctgcg 1680 ccgggccgcc ctcggggcct ttaggcccca caccgcccca gccgacggat tcagtcgcgg 1740 cagtacctca gatgtccgct gcgacggcgt cccggagagc ccgggcgaga tcgcgggccc 1800 ccttctgctc gtccccggcc cctcccgcga gcaccacccg cggcggacgg ccgccgtcct 1860 ccgcgatacg ccgggcgagg tcgcaggcga gcacgccgga cccggagaag ccccccagca 1920 ccagcgaccg gccgactccg tgcgcggcca gggcaggctg cgcgccgtcg acgtcggtga 1980 gcagcaccag gagctcctgc ggcccggcgt agaggtcggc cagccggtcg tagcaggtcg 2040 cgggcgcgcc cggcggcggg atcagacaga tcgtgcccgc ccgctcgtgc ctcgccgccc 2100 gcagcgtgac cagcggaatg tcccgcccag ctccgga 2137 <210> 16 <211> 325 <212> PRT <213> Streptomyces sp. CL190 <220> <221> misc_feature <222> (1)..(325) <223> Streptomyces sp. CL190 acetyl-CoA:malonyl-CoA acyltransferase protein sequence <400> 16 Arg Phe Arg Ile Ile Gly Thr Gly Ala Tyr Val Pro Glu Arg Ile Val 1 5 10 15 Ser Asn Asp Glu Val Gly Ala Pro Ala Gly Val Asp Asp Asp Trp Ile 20 25 30 Thr Arg Lys Thr Gly Ile Arg Gln Arg Arg Trp Ala Ala Asp Asp Gln 35 40 45 Ala Thr Ser Asp Leu Ala Thr Ala Ala Gly Arg Ala Ala Leu Lys Ala 50 55 60 Ala Gly Ile Thr Pro Glu Gln Leu Thr Val Ile Ala Val Ala Thr Ser 65 70 75 80 Thr Pro Asp Arg Pro Gln Pro Pro Thr Ala Ala Tyr Val Gln His His 85 90 95 Leu Gly Ala Thr Gly Thr Ala Ala Phe Asp Val Asn Ala Val Cys Ser 100 105 110 Gly Thr Val Phe Ala Leu Ser Ser Val Ala Gly Thr Leu Val Tyr Arg 115 120 125 Gly Gly Tyr Ala Leu Val Ile Gly Ala Asp Leu Tyr Ser Arg Ile Leu 130 135 140 Asn Pro Ala Asp Arg Lys Thr Val Val Leu Phe Gly Asp Gly Ala Gly 145 150 155 160 Ala Met Val Leu Gly Pro Thr Ser Thr Gly Thr Gly Pro Ile Val Arg 165 170 175 Arg Val Ala Leu His Thr Phe Gly Gly Leu Thr Asp Leu Ile Arg Val 180 185 190 Pro Ala Gly Gly Ser Arg Gln Pro Leu Asp Thr Asp Gly Leu Asp Ala 195 200 205 Gly Leu Gln Tyr Phe Ala Met Asp Gly Arg Glu Val Arg Arg Phe Val 210 215 220 Thr Glu His Leu Pro Gln Leu Ile Lys Gly Phe Leu His Glu Ala Gly 225 230 235 240 Val Asp Ala Ala Asp Ile Ser His Phe Val Pro His Gln Ala Asn Gly 245 250 255 Val Met Leu Asp Glu Val Phe Gly Glu Leu His Leu Pro Arg Ala Thr 260 265 270 Met His Arg Thr Val Glu Thr Tyr Gly Asn Thr Gly Ala Ala Ser Ile 275 280 285 Pro Ile Thr Met Asp Ala Ala Val Arg Ala Gly Ser Phe Arg Pro Gly 290 295 300 Glu Leu Val Leu Leu Ala Gly Phe Gly Gly Gly Met Ala Ala Ser Phe 305 310 315 320 Ala Leu Ile Glu Trp 325 <210> 17 <211> 1287 <212> DNA <213> Pseudomonas mevalonii <220> <221> misc_feature <222> (1)..(1287) <223> Pseudomonas mevalonii HMG-CoA reductase (mvaA) gene sequence <400> 17 atgagcctcg attcccgcct gcccgctttc cgtaacctgt cccctgccgc gcgcctggac 60 cacatcggcc agttgctcgg cctgagccac gacgatgtca gcctgctggc caacgccggt 120 gccctgccga tggacatcgc caacggcatg atcgaaaacg tcatcggcac cttcgagctg 180 ccctatgccg tggccagcaa cttccagatc aatggccgtg atgtgctggt gccgctggtg 240 gtggaagagc cctcgatcgt cgccgctgct tcgtacatgg ccaagctggc ccgtgccaac 300 ggcggcttca ccacctccag cagcgccccg ctgatgcatg cccaggtaca gatcgtcggc 360 atacaggacc cgctcaatgc acgcctgagc ctgctgcgcc gcaaagacga aatcattgaa 420 ctggccaacc gcaaggacca gttgctcaac agcctcggcg gcggctgccg cgacatcgaa 480 gtgcacacct tcgccgatac cccgcgtggc ccgatgctgg tggcgcacct gatcgtcgat 540 gtacgcgatg ccatgggcgc caacaccgtc aataccatgg ccgaggccgt tgcgccgctg 600 atggaagcca tcaccggggg ccaggtacgc ctgcgcattc tgtccaacct ggccgacctg 660 cgcctggcca gggcccaggt gcggattact ccgcagcaac tggaaacggc cgaattcagt 720 ggcgaggcag tgatcgaagg catcctcgac gcctacgcct tcgctgcggt cgacccttac 780 cgcgcggcca cccacaacaa gggcatcatg aatggcatcg acccactgat cgtcgccact 840 ggcaacgact ggcgtgcagt ggaagccggc gcccatgcgt atgcctgccg cagtggtcac 900 tacggctcgc tgaccacctg ggaaaaggac aacaacggcc atttggtcgg caccctggaa 960 atgccgatgc ccgtaggcct ggtcggcggc gccaccaaaa cccatccgct ggcgcaactg 1020 tcgctgcgca tcctcggcgt gaaaacagcc caggcgctcg ctgagattgc cgtggccgta 1080 ggcctggcgc aaaacctcgg ggccatgcgc gccctggcca ccgaaggcat ccagcgcggc 1140 cacatggccc tgcatgcgcg caatattgcc gtggtggcgg gcgcccgagg cgatgaggtg 1200 gactgggttg cccggcagtt ggtggaatac cacgacgtgc gcgccgaccg cgccgtagca 1260 ctgctgaaac aaaagcgcgg ccaatga 1287 <210> 18 <211> 428 <212> PRT <213> Pseudomonas mevalonii <220> <221> misc_feature <222> (1)..(428) <223> Pseudomonas mevalonii hydroxymethylglutaryl -CoA reductase protein sequence <400> 18 Met Ser Leu Asp Ser Arg Leu Pro Ala Phe Arg Asn Leu Ser Pro Ala 1 5 10 15 Ala Arg Leu Asp His Ile Gly Gln Leu Leu Gly Leu Ser His Asp Asp 20 25 30 Val Ser Leu Leu Ala Asn Ala Gly Ala Leu Pro Met Asp Ile Ala Asn 35 40 45 Gly Met Ile Glu Asn Val Ile Gly Thr Phe Glu Leu Pro Tyr Ala Val 50 55 60 Ala Ser Asn Phe Gln Ile Asn Gly Arg Asp Val Leu Val Pro Leu Val 65 70 75 80 Val Glu Glu Pro Ser Ile Val Ala Ala Ala Ser Tyr Met Ala Lys Leu 85 90 95 Ala Arg Ala Asn Gly Gly Phe Thr Thr Ser Ser Ser Ala Pro Leu Met 100 105 110 His Ala Gln Val Gln Ile Val Gly Ile Gln Asp Pro Leu Asn Ala Arg 115 120 125 Leu Ser Leu Leu Arg Arg Lys Asp Glu Ile Ile Glu Leu Ala Asn Arg 130 135 140 Lys Asp Gln Leu Leu Asn Ser Leu Gly Gly Gly Cys Arg Asp Ile Glu 145 150 155 160 Val His Thr Phe Ala Asp Thr Pro Arg Gly Pro Met Leu Val Ala His 165 170 175 Leu Ile Val Asp Val Arg Asp Ala Met Gly Ala Asn Thr Val Asn Thr 180 185 190 Met Ala Glu Ala Val Ala Pro Leu Met Glu Ala Ile Thr Gly Gly Gln 195 200 205 Val Arg Leu Arg Ile Leu Ser Asn Leu Ala Asp Leu Arg Leu Ala Arg 210 215 220 Ala Gln Val Arg Ile Thr Pro Gln Gln Leu Glu Thr Ala Glu Phe Ser 225 230 235 240 Gly Glu Ala Val Ile Glu Gly Ile Leu Asp Ala Tyr Ala Phe Ala Ala 245 250 255 Val Asp Pro Tyr Arg Ala Ala Thr His Asn Lys Gly Ile Met Asn Gly 260 265 270 Ile Asp Pro Leu Ile Val Ala Thr Gly Asn Asp Trp Arg Ala Val Glu 275 280 285 Ala Gly Ala His Ala Tyr Ala Cys Arg Ser Gly His Tyr Gly Ser Leu 290 295 300 Thr Thr Trp Glu Lys Asp Asn Asn Gly His Leu Val Gly Thr Leu Glu 305 310 315 320 Met Pro Met Pro Val Gly Leu Val Gly Gly Ala Thr Lys Thr His Pro 325 330 335 Leu Ala Gln Leu Ser Leu Arg Ile Leu Gly Val Lys Thr Ala Gln Ala 340 345 350 Leu Ala Glu Ile Ala Val Ala Val Gly Leu Ala Gln Asn Leu Gly Ala 355 360 365 Met Arg Ala Leu Ala Thr Glu Gly Ile Gln Arg Gly His Met Ala Leu 370 375 380 His Ala Arg Asn Ile Ala Val Val Ala Gly Ala Arg Gly Asp Glu Val 385 390 395 400 Asp Trp Val Ala Arg Gln Leu Val Glu Tyr His Asp Val Arg Ala Asp 405 410 415 Arg Ala Val Ala Leu Leu Lys Gln Lys Arg Gly Gln 420 425 <210> 19 <211> 1302 <212> DNA <213> Silicibacter pomeroyi <220> <221> misc_feature <222> (1)..(1302) <223> Silicibacter pomeroyi hydroxymethylglutaryl-CoA reductase gene sequence <400> 19 atgacaggca agacgggtca catcgatggt ttgaactcgc gcattgaaaa gatgcgagat 60 ctcgaccccg cacaacggct ggtgcgcgtt gccgaggcgg cgggcctcga gcccgaggcg 120 atcagcgcgc tggcgggtaa cggcgccctg cccctctcgc tggccaacgg gatgatcgag 180 aacgtcatcg gcaaattcga actgccgctg ggcgtggcca cgaatttcac tgtgaacggc 240 cgcgactatc tgatcccgat ggcggtcgaa gagccctcgg tggtggcggc cgcgtcctat 300 atggcgcgta tcgcgcgcga gaatggcgga ttcaccgcgc atggcaccgc gcccttgatg 360 cgcgcccaga tccaggtggt cgggttgggt gatcccgagg gcgcccggca gcgtctcctc 420 gcccacaagg ccgcgttcat ggaggcggcg gacgctgtcg atccggtgct tgtcgggctg 480 ggtggcggct gccgcgatat cgaggttcac gtgttccggg atacgccggt gggcgcgatg 540 gtcgtcctgc acctgatcgt cgatgtgcgc gacgcgatgg gggccaatac ggtcaacacg 600 atggccgaac ggctggcccc cgaggtcgag cggattgccg gtggcaccgt gcggctgcgc 660 atcctgtcga acctcgccga cctgcgattg gtccgggcgc gggtggaact ggccccggaa 720 acactgacaa cgcagggcta tgacggcgcc gacgtggcgc ggggcatggt cgaggcctgc 780 gcgcttgcca tcgtcgaccc ctatcgcgcg gcgacccata acaaggggat catgaacggc 840 atcgacccgg tcgtcgtcgc caccggcaat gactggcgcg cgatcgaggc gggtgcccat 900 gcctatgccg cccgcacggg tcattatacc tcgctgaccc gctgggaact ggcgaatgac 960 gggcggcttg tgggcacgat cgaactgccc ctggcgcttg gccttgtcgg cggcgcgacc 1020 aagacgcacc cgaccgcacg ggcggcgctg gccctgatgc aggtagagac tgcaaccgaa 1080 ctggcccagg tcaccgccgc cgtgggtctg gcgcagaaca tggccgccat ccgcgcgctg 1140 gcgaccgaag gcatccagcg cggtcacatg acccttcatg cgcgcaacat cgcgatcatg 1200 gccggcgcaa caggcgccga tatcgaccgc gtcacccggg tcattgtcga agcgggcgac 1260 gtcagcgtgg cccgtgcaaa acaggtgctg gaaaacacct ga 1302 <210> 20 <211> 433 <212> PRT <213> Silicibacter pomeroyi <220> <221> misc_feature <222> (1)..(433) <223> Silicibacter pomeroyi hydroxymethylglutaryl-CoA reductase protein sequence <400> 20 Met Thr Gly Lys Thr Gly His Ile Asp Gly Leu Asn Ser Arg Ile Glu 1 5 10 15 Lys Met Arg Asp Leu Asp Pro Ala Gln Arg Leu Val Arg Val Ala Glu 20 25 30 Ala Ala Gly Leu Glu Pro Glu Ala Ile Ser Ala Leu Ala Gly Asn Gly 35 40 45 Ala Leu Pro Leu Ser Leu Ala Asn Gly Met Ile Glu Asn Val Ile Gly 50 55 60 Lys Phe Glu Leu Pro Leu Gly Val Ala Thr Asn Phe Thr Val Asn Gly 65 70 75 80 Arg Asp Tyr Leu Ile Pro Met Ala Val Glu Glu Pro Ser Val Val Ala 85 90 95 Ala Ala Ser Tyr Met Ala Arg Ile Ala Arg Glu Asn Gly Gly Phe Thr 100 105 110 Ala His Gly Thr Ala Pro Leu Met Arg Ala Gln Ile Gln Val Val Gly 115 120 125 Leu Gly Asp Pro Glu Gly Ala Arg Gln Arg Leu Leu Ala His Lys Ala 130 135 140 Ala Phe Met Glu Ala Ala Asp Ala Val Asp Pro Val Leu Val Gly Leu 145 150 155 160 Gly Gly Gly Cys Arg Asp Ile Glu Val His Val Phe Arg Asp Thr Pro 165 170 175 Val Gly Ala Met Val Val Leu His Leu Ile Val Asp Val Arg Asp Ala 180 185 190 Met Gly Ala Asn Thr Val Asn Thr Met Ala Glu Arg Leu Ala Pro Glu 195 200 205 Val Glu Arg Ile Ala Gly Gly Thr Val Arg Leu Arg Ile Leu Ser Asn 210 215 220 Leu Ala Asp Leu Arg Leu Val Arg Ala Arg Val Glu Leu Ala Pro Glu 225 230 235 240 Thr Leu Thr Thr Gln Gly Tyr Asp Gly Ala Asp Val Ala Arg Gly Met 245 250 255 Val Glu Ala Cys Ala Leu Ala Ile Val Asp Pro Tyr Arg Ala Ala Thr 260 265 270 His Asn Lys Gly Ile Met Asn Gly Ile Asp Pro Val Val Val Ala Thr 275 280 285 Gly Asn Asp Trp Arg Ala Ile Glu Ala Gly Ala His Ala Tyr Ala Ala 290 295 300 Arg Thr Gly His Tyr Thr Ser Leu Thr Arg Trp Glu Leu Ala Asn Asp 305 310 315 320 Gly Arg Leu Val Gly Thr Ile Glu Leu Pro Leu Ala Leu Gly Leu Val 325 330 335 Gly Gly Ala Thr Lys Thr His Pro Thr Ala Arg Ala Ala Leu Ala Leu 340 345 350 Met Gln Val Glu Thr Ala Thr Glu Leu Ala Gln Val Thr Ala Ala Val 355 360 365 Gly Leu Ala Gln Asn Met Ala Ala Ile Arg Ala Leu Ala Thr Glu Gly 370 375 380 Ile Gln Arg Gly His Met Thr Leu His Ala Arg Asn Ile Ala Ile Met 385 390 395 400 Ala Gly Ala Thr Gly Ala Asp Ile Asp Arg Val Thr Arg Val Ile Val 405 410 415 Glu Ala Gly Asp Val Ser Val Ala Arg Ala Lys Gln Val Leu Glu Asn 420 425 430 Thr <210> 21 <211> 1290 <212> DNA <213> Delftia acidovorans <220> <221> misc_feature <222> (1)..(1290) <223> Delftia acidovorans hydroxymethylglutaryl-CoA reductase nucleotide sequence <400> 21 atggttgccg attcgcgact gcccaatttc cgcgccctca caccggccca gcgccgggat 60 ttcctggccg atgcctgcgg cctgtccgat gccgagcgcg ccctgctcgc tgcccccggt 120 gccctgcccc tggcgctggc cgacggcatg atcgagaacg tgttcggcag cttcgagctg 180 ccgctgggcg tggccggcaa cttccgcgtc aacggccgcg acgtgctggt gcccatggcg 240 gtggaggagc cctcggtggt ggccgccgcc tcgtacatgg ccaagctggc gcgcgaggac 300 gggggctttc agacctcaag cacgctgccg ctgatgcgcg cccaggtcca ggtgctgggc 360 gtgaccgatc cacacggcgc gcgcctggcc gtgctgcagg cgcgtgcgca gatcatcgag 420 cgcgccaaca gccgcgacaa ggtgctgatc ggcctgggcg gcggctgcaa ggacatcgag 480 gtccatgtct tccccgacac gccgcgcggc cccatgctgg tggtccacct gatcgtggac 540 gtgcgcgacg ccatgggcgc caacaccgtc aacaccatgg ccgaatcggt ggcgcccctg 600 gtcgagaaga tcacgggcgg cagcgtgcgg ctgcgcatcc tgtccaacct ggccgacctg 660 cggctggccc gcgcccgcgt gcggctcacg ccgcagaccc tggccacgca ggatcgcagc 720 ggcgaggaga tcatcgaagg cgtgctggac gcctatacct tcgcggccat cgacccctac 780 cgcgcggcca cgcacaacaa gggaatcatg aacggcatcg accccgtcat cgtggccacg 840 ggcaacgact ggcgcgcggt cgaggccggc gcccatgcct atgccagccg cagcggcagc 900 tacacctcgc tgacgcgctg ggaaaaggat gccggcggcg ccctggtcgg cagcatcgag 960 ctgcccatgc cggtgggcct tgtcggcggc gccaccaaga cccatccgct ggcacgcctg 1020 gcgctgaaga tcatggacct gcagtccgcc cagcagctgg gcgagatcgc cgccgccgtg 1080 ggcctggcgc agaacctggg cgccctgcgc gccctggcca ccgaaggcat tcagcgcggc 1140 cacatggccc tgcacgcccg caacatcgcc ctggtggccg gcgccacggg cgacgaggtc 1200 gatgccgtgg cgcgccagct ggccgccgag cacgacgtgc gcaccgaccg cgcgctggaa 1260 gtgctggccg cgctgcgcgc cagggcctga 1290 <210> 22 <211> 429 <212> PRT <213> Delftia acidovorans <220> <221> misc_feature <222> (1)..(429) <223> Delftia acidovorans hydroxymethylglutaryl-CoA reductase protein sequence <400> 22 Met Val Ala Asp Ser Arg Leu Pro Asn Phe Arg Ala Leu Thr Pro Ala 1 5 10 15 Gln Arg Arg Asp Phe Leu Ala Asp Ala Cys Gly Leu Ser Asp Ala Glu 20 25 30 Arg Ala Leu Leu Ala Ala Pro Gly Ala Leu Pro Leu Ala Leu Ala Asp 35 40 45 Gly Met Ile Glu Asn Val Phe Gly Ser Phe Glu Leu Pro Leu Gly Val 50 55 60 Ala Gly Asn Phe Arg Val Asn Gly Arg Asp Val Leu Val Pro Met Ala 65 70 75 80 Val Glu Glu Pro Ser Val Val Ala Ala Ala Ser Tyr Met Ala Lys Leu 85 90 95 Ala Arg Glu Asp Gly Gly Phe Gln Thr Ser Ser Thr Leu Pro Leu Met 100 105 110 Arg Ala Gln Val Gln Val Leu Gly Val Thr Asp Pro His Gly Ala Arg 115 120 125 Leu Ala Val Leu Gln Ala Arg Ala Gln Ile Ile Glu Arg Ala Asn Ser 130 135 140 Arg Asp Lys Val Leu Ile Gly Leu Gly Gly Gly Cys Lys Asp Ile Glu 145 150 155 160 Val His Val Phe Pro Asp Thr Pro Arg Gly Pro Met Leu Val Val His 165 170 175 Leu Ile Val Asp Val Arg Asp Ala Met Gly Ala Asn Thr Val Asn Thr 180 185 190 Met Ala Glu Ser Val Ala Pro Leu Val Glu Lys Ile Thr Gly Gly Ser 195 200 205 Val Arg Leu Arg Ile Leu Ser Asn Leu Ala Asp Leu Arg Leu Ala Arg 210 215 220 Ala Arg Val Arg Leu Thr Pro Gln Thr Leu Ala Thr Gln Asp Arg Ser 225 230 235 240 Gly Glu Glu Ile Ile Glu Gly Val Leu Asp Ala Tyr Thr Phe Ala Ala 245 250 255 Ile Asp Pro Tyr Arg Ala Ala Thr His Asn Lys Gly Ile Met Asn Gly 260 265 270 Ile Asp Pro Val Ile Val Ala Thr Gly Asn Asp Trp Arg Ala Val Glu 275 280 285 Ala Gly Ala His Ala Tyr Ala Ser Arg Ser Gly Ser Tyr Thr Ser Leu 290 295 300 Thr Arg Trp Glu Lys Asp Ala Gly Gly Ala Leu Val Gly Ser Ile Glu 305 310 315 320 Leu Pro Met Pro Val Gly Leu Val Gly Gly Ala Thr Lys Thr His Pro 325 330 335 Leu Ala Arg Leu Ala Leu Lys Ile Met Asp Leu Gln Ser Ala Gln Gln 340 345 350 Leu Gly Glu Ile Ala Ala Ala Val Gly Leu Ala Gln Asn Leu Gly Ala 355 360 365 Leu Arg Ala Leu Ala Thr Glu Gly Ile Gln Arg Gly His Met Ala Leu 370 375 380 His Ala Arg Asn Ile Ala Leu Val Ala Gly Ala Thr Gly Asp Glu Val 385 390 395 400 Asp Ala Val Ala Arg Gln Leu Ala Ala Glu His Asp Val Arg Thr Asp 405 410 415 Arg Ala Leu Glu Val Leu Ala Ala Leu Arg Ala Arg Ala 420 425 <210> 23 <211> 5726 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct: pAM70 plasmid <400> 23 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accataccac agcttttcaa ttcaattcat catttttttt ttattctttt ttttgatttc 240 ggtttctttg aaattttttt gattcggtaa tctccgaaca gaaggaagaa cgaaggaagg 300 agcacagact tagattggta tatatacgca tatgtagtgt tgaagaaaca tgaaattgcc 360 cagtattctt aacccaactg cacagaacaa aaacctgcag gaaacgaaga taaatcatgt 420 cgaaagctac atataaggaa cgtgctgcta ctcatcctag tcctgttgct gccaagctat 480 ttaatatcat gcacgaaaag caaacaaact tgtgtgcttc attggatgtt cgtaccacca 540 aggaattact ggagttagtt gaagcattag gtcccaaaat ttgtttacta aaaacacatg 600 tggatatctt gactgatttt tccatggagg gcacagttaa gccgctaaag gcattatccg 660 ccaagtacaa ttttttactc ttcgaagaca gaaaatttgc tgacattggt aatacagtca 720 aattgcagta ctctgcgggt gtatacagaa tagcagaatg ggcagacatt acgaatgcac 780 acggtgtggt gggcccaggt attgttagcg gtttgaagca ggcggcagaa gaagtaacaa 840 aggaacctag aggccttttg atgttagcag aattgtcatg caagggctcc ctatctactg 900 gagaatatac taagggtact gttgacattg cgaagagcga caaagatttt gttatcggct 960 ttattgctca aagagacatg ggtggaagag atgaaggtta cgattggttg attatgacac 1020 ccggtgtggg tttagatgac aagggagacg cattgggtca acagtataga accgtggatg 1080 atgtggtctc tacaggatct gacattatta ttgttggaag aggactattt gcaaagggaa 1140 gggatgctaa ggtagagggt gaacgttaca gaaaagcagg ctgggaagca tatttgagaa 1200 gatgcggcca gcaaaactaa aaaactgtat tataagtaaa tgcatgtata ctaaactcac 1260 aaattagagc ttcaatttaa ttatatcagt tattacccta tgcggtgtga aataccgcac 1320 agatgcgtaa ggagaaaata ccgcatcagg aaattgtaaa cgttaatatt ttgttaaaat 1380 tcgcgttaaa tttttgttaa atcagctcat tttttaacca ataggccgaa atcggcaaaa 1440 tcccttataa atcaaaagaa tagaccgaga tagggttgag tgttgttcca gtttggaaca 1500 agagtccact attaaagaac gtggactcca acgtcaaagg gcgaaaaacc gtctatcagg 1560 gcgatggccc actacgtgaa ccatcaccct aatcaagttt tttggggtcg aggtgccgta 1620 aagcactaaa tcggaaccct aaagggagcc cccgatttag agcttgacgg ggaaagccgg 1680 cgaacgtggc gagaaaggaa gggaagaaag cgaaaggagc gggcgctagg gcgctggcaa 1740 gtgtagcggt cacgctgcgc gtaaccacca cacccgccgc gcttaatgcg ccgctacagg 1800 gcgcgtcgcg ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg 1860 cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga ttaagttggg 1920 taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgag cgcgcgtaat 1980 acgactcact atagggcgaa ttgggtaccg ggccccccct cgaggtcgac ggtatcgata 2040 agcttgatat cgaattcctg cagcccgggg gatccactag ttctagagcg gccgccaccg 2100 cggtggagct ccagcttttg ttccctttag tgagggttaa ttgcgcgctt ggcgtaatca 2160 tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatagga 2220 gccggaagca taaagtgtaa agcctggggt gcctaatgag tgaggtaact cacattaatt 2280 gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga 2340 atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 2400 actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 2460 gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 2520 cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 2580 ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 2640 ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 2700 ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 2760 agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 2820 cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 2880 aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 2940 gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 3000 agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 3060 ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 3120 cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 3180 tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 3240 aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 3300 tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 3360 atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 3420 cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg 3480 gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct 3540 gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt 3600 tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc 3660 tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga 3720 tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt 3780 aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc 3840 atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa 3900 tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca 3960 catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca 4020 aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct 4080 tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc 4140 gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa 4200 tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt 4260 tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgaacga 4320 agcatctgtg cttcattttg tagaacaaaa atgcaacgcg agagcgctaa tttttcaaac 4380 aaagaatctg agctgcattt ttacagaaca gaaatgcaac gcgaaagcgc tattttacca 4440 acgaagaatc tgtgcttcat ttttgtaaaa caaaaatgca acgcgagagc gctaattttt 4500 caaacaaaga atctgagctg catttttaca gaacagaaat gcaacgcgag agcgctattt 4560 taccaacaaa gaatctatac ttcttttttg ttctacaaaa atgcatcccg agagcgctat 4620 ttttctaaca aagcatctta gattactttt tttctccttt gtgcgctcta taatgcagtc 4680 tcttgataac tttttgcact gtaggtccgt taaggttaga agaaggctac tttggtgtct 4740 attttctctt ccataaaaaa agcctgactc cacttcccgc gtttactgat tactagcgaa 4800 gctgcgggtg cattttttca agataaaggc atccccgatt atattctata ccgatgtgga 4860 ttgcgcatac tttgtgaaca gaaagtgata gcgttgatga ttcttcattg gtcagaaaat 4920 tatgaacggt ttcttctatt ttgtctctat atactacgta taggaaatgt ttacattttc 4980 gtattgtttt cgattcactc tatgaatagt tcttactaca atttttttgt ctaaagagta 5040 atactagaga taaacataaa aaatgtagag gtcgagttta gatgcaagtt caaggagcga 5100 aaggtggatg ggtaggttat atagggatat agcacagaga tatatagcaa agagatactt 5160 ttgagcaatg tttgtggaag cggtattcgc aatattttag tagctcgtta cagtccggtg 5220 cgtttttggt tttttgaaag tgcgtcttca gagcgctttt ggttttcaaa agcgctctga 5280 agttcctata ctttctagag aataggaact tcggaatagg aacttcaaag cgtttccgaa 5340 aacgagcgct tccgaaaatg caacgcgagc tgcgcacata cagctcactg ttcacgtcgc 5400 acctatatct gcgtgttgcc tgtatatata tatacatgag aagaacggca tagtgcgtgt 5460 ttatgcttaa atgcgtactt atatgcgtct atttatgtag gatgaaaggt agtctagtac 5520 ctcctgtgat attatcccat tccatgcggg gtatcgtatg cttccttcag cactaccctt 5580 tagctgttct atatgctgcc actcctcaat tggattagtc tcatccttca atgctatcat 5640 ttcctttgat attggatcat actaagaaac cattattatc atgacattaa cctataaaaa 5700 taggcgtatc acgaggccct ttcgtc 5726 <210> 24 <211> 8125 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct: pAM01147 plasmid <400> 24 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accataccac agcttttcaa ttcaattcat catttttttt ttattctttt ttttgatttc 240 ggtttctttg aaattttttt gattcggtaa tctccgaaca gaaggaagaa cgaaggaagg 300 agcacagact tagattggta tatatacgca tatgtagtgt tgaagaaaca tgaaattgcc 360 cagtattctt aacccaactg cacagaacaa aaacctgcag gaaacgaaga taaatcatgt 420 cgaaagctac atataaggaa cgtgctgcta ctcatcctag tcctgttgct gccaagctat 480 ttaatatcat gcacgaaaag caaacaaact tgtgtgcttc attggatgtt cgtaccacca 540 aggaattact ggagttagtt gaagcattag gtcccaaaat ttgtttacta aaaacacatg 600 tggatatctt gactgatttt tccatggagg gcacagttaa gccgctaaag gcattatccg 660 ccaagtacaa ttttttactc ttcgaagaca gaaaatttgc tgacattggt aatacagtca 720 aattgcagta ctctgcgggt gtatacagaa tagcagaatg ggcagacatt acgaatgcac 780 acggtgtggt gggcccaggt attgttagcg gtttgaagca ggcggcagaa gaagtaacaa 840 aggaacctag aggccttttg atgttagcag aattgtcatg caagggctcc ctatctactg 900 gagaatatac taagggtact gttgacattg cgaagagcga caaagatttt gttatcggct 960 ttattgctca aagagacatg ggtggaagag atgaaggtta cgattggttg attatgacac 1020 ccggtgtggg tttagatgac aagggagacg cattgggtca acagtataga accgtggatg 1080 atgtggtctc tacaggatct gacattatta ttgttggaag aggactattt gcaaagggaa 1140 gggatgctaa ggtagagggt gaacgttaca gaaaagcagg ctgggaagca tatttgagaa 1200 gatgcggcca gcaaaactaa aaaactgtat tataagtaaa tgcatgtata ctaaactcac 1260 aaattagagc ttcaatttaa ttatatcagt tattacccta tgcggtgtga aataccgcac 1320 agatgcgtaa ggagaaaata ccgcatcagg aaattgtaaa cgttaatatt ttgttaaaat 1380 tcgcgttaaa tttttgttaa atcagctcat tttttaacca ataggccgaa atcggcaaaa 1440 tcccttataa atcaaaagaa tagaccgaga tagggttgag tgttgttcca gtttggaaca 1500 agagtccact attaaagaac gtggactcca acgtcaaagg gcgaaaaacc gtctatcagg 1560 gcgatggccc actacgtgaa ccatcaccct aatcaagttt tttggggtcg aggtgccgta 1620 aagcactaaa tcggaaccct aaagggagcc cccgatttag agcttgacgg ggaaagccgg 1680 cgaacgtggc gagaaaggaa gggaagaaag cgaaaggagc gggcgctagg gcgctggcaa 1740 gtgtagcggt cacgctgcgc gtaaccacca cacccgccgc gcttaatgcg ccgctacagg 1800 gcgcgtcgcg ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg 1860 cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga ttaagttggg 1920 taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgag cgcgcgtaat 1980 acgactcact atagggcgaa ttgggtaccg ggccccccct cgaggtcgac ggtatcgata 2040 agcttgatat cgaattcctg cagcccgggg gatccactag ttctagagcg gccgcttatt 2100 gcagaagatt agactttttt tgttgcaagt gggatgagct tggagcagga agaatacact 2160 atactggatc taaagagtac aatagatgga taagaatatt ggcagcgcaa aaaggcttca 2220 agcttacaca acacggttta tttcgaaata atatccttct cgaaagcttt aacgaacgca 2280 gaattttcga gttattaaac ttaaaatacg ctgaacccga acatagaaat atcgaatggg 2340 aaaaaaaaac tgcataaagg cattaaaaga ggagcgaatt tttttttaat aaaaatctta 2400 ataatcatta aaagataaat aatagtctat atatacgtat ataaataaaa aatattcaaa 2460 aaataaaata aactattatt ttagcgtaaa ggatggggaa agagaaaaga aaaaaattga 2520 tctatcgatt tcaattcaat tcaattcagt ggtgatggtg atgatgccct ttatcgtcat 2580 cgtccttata atcgaattcc tggcctctct tttgttttag aagtgcgacg gcacgatctg 2640 ctctgacatc gtgatattca actaattgtc tggcaaccca atcgacttcg tcgccccttg 2700 cacctgctac aaccgctata ttcctcgcat gcaaggccat gtgacccctt tgaatacctt 2760 cagttgctaa agccctcatt gcacccaaat tttgagcaag accaacagcc acagcgatct 2820 ctgccaaggc ttgggcagtt ttaactccta atattcttaa agataattga gccagagggt 2880 gggtcttcgt tgcaccacct actaatccaa ccggcatcgg catctccaga gtaccgacta 2940 aatgaccatt attatccttc tcccaagtag ttagagaacc ataatgtccg gacctacaag 3000 cgtacgcgtg agccccagcc tctacggctc tccaatcgtt accagtagca acaattagtg 3060 gatctatgcc gttcataata cctttattat gtgtagcggc tctgtatggg tcaacagcgg 3120 cgaaagcata agcgtctaga ataccttcaa tcacagcctc ccccgaaaat tccgctgttt 3180 ccaattgctg tggggttatt cttacttgtg cacgagctaa tcttagatca gctaaattag 3240 acaagatcct tagacgcact tgaccgccag taattgcctc cattaatggt gcgacggctt 3300 cagccattgt gtttactgtg ttcgccccca ttgcatcacg aacatctacg attaagtgag 3360 caactaacat aggtcctcta ggagtgtcag cgaatgtatg cacttcgatg tctctacaac 3420 caccacctaa cgaatttaac aattgatctt ttctattagc caattctatt atctcatctt 3480 ttcttctcaa caatgaaagt ctggcgttta aaggatcttg tataccaacg atttgtactt 3540 gagcatgcat aagtggggct gaactgctgg tggtgaaacc tccgttcgct cttgccaatt 3600 tagccatgta tgatgctgct gcaactatag atggttcctc aacgactagt gggaccaaaa 3660 catccctacc attaatttga aaattcgaag caacggcgta cggaagttcg aaagtaccta 3720 taacattttc gatcatacca ttagcgatgt ccataggcaa tgctccagcg ttggccaaca 3780 aagaaacgtc atcatggctt aatcccaata gttgtcctat gtgatctaaa cgagcagccg 3840 gactcaggtt tctgaatgct ggcaatctgc tatctaaaga catatgtttt gagggaatat 3900 tcaactgttt ttttttatca tgttgatgct ctgcataata atgcccataa atatttccga 3960 cctgctttta tatctttgct agccaaacta actgaacata gctacacatt attttcagct 4020 tggctatttt gtgaacactg tatagccagt ccttcggatc acggtcaaca gttgtccgag 4080 cgctttttgg accctttccc ttatttttgg gttaaggaaa atgacagaaa atatatctaa 4140 tgagccttcg ctcaacagtg ctccgaagta tagctttcca aaaggagagg caaagcaatt 4200 taagaatgta tgaacaaaat aaaggggaaa aattaccccc tctactttac caaacgaata 4260 ctaccaataa tatttacaac ttttccttat gattttttca ctgaagcgct tcgcaatagt 4320 tgtgagcgat atcaaaagta acgaaatgaa cttcgcggct cgtgctatat tcttgttgct 4380 accgtccata tctttccata gattttcaat ctttgatgtc tccatggtgg tacagagaac 4440 ttgtaaacaa ttcggtccct acatgtgagg aaattcgctg tgacacgcgg ccgccaccgc 4500 ggtggagctc cagcttttgt tccctttagt gagggttaat tgcgcgcttg gcgtaatcat 4560 ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacataggag 4620 ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gaggtaactc acattaattg 4680 cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 4740 tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 4800 ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 4860 taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 4920 agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 4980 cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 5040 tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 5100 tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 5160 gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 5220 acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 5280 acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 5340 cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 5400 gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 5460 gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 5520 agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 5580 ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 5640 ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 5700 atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 5760 tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 5820 gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 5880 ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 5940 caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 6000 cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 6060 cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 6120 cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 6180 agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 6240 tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 6300 agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 6360 atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 6420 ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 6480 cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 6540 caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 6600 attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 6660 agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgaacgaa 6720 gcatctgtgc ttcattttgt agaacaaaaa tgcaacgcga gagcgctaat ttttcaaaca 6780 aagaatctga gctgcatttt tacagaacag aaatgcaacg cgaaagcgct attttaccaa 6840 cgaagaatct gtgcttcatt tttgtaaaac aaaaatgcaa cgcgagagcg ctaatttttc 6900 aaacaaagaa tctgagctgc atttttacag aacagaaatg caacgcgaga gcgctatttt 6960 accaacaaag aatctatact tcttttttgt tctacaaaaa tgcatcccga gagcgctatt 7020 tttctaacaa agcatcttag attacttttt ttctcctttg tgcgctctat aatgcagtct 7080 cttgataact ttttgcactg taggtccgtt aaggttagaa gaaggctact ttggtgtcta 7140 ttttctcttc cataaaaaaa gcctgactcc acttcccgcg tttactgatt actagcgaag 7200 ctgcgggtgc attttttcaa gataaaggca tccccgatta tattctatac cgatgtggat 7260 tgcgcatact ttgtgaacag aaagtgatag cgttgatgat tcttcattgg tcagaaaatt 7320 atgaacggtt tcttctattt tgtctctata tactacgtat aggaaatgtt tacattttcg 7380 tattgttttc gattcactct atgaatagtt cttactacaa tttttttgtc taaagagtaa 7440 tactagagat aaacataaaa aatgtagagg tcgagtttag atgcaagttc aaggagcgaa 7500 aggtggatgg gtaggttata tagggatata gcacagagat atatagcaaa gagatacttt 7560 tgagcaatgt ttgtggaagc ggtattcgca atattttagt agctcgttac agtccggtgc 7620 gtttttggtt ttttgaaagt gcgtcttcag agcgcttttg gttttcaaaa gcgctctgaa 7680 gttcctatac tttctagaga ataggaactt cggaatagga acttcaaagc gtttccgaaa 7740 acgagcgctt ccgaaaatgc aacgcgagct gcgcacatac agctcactgt tcacgtcgca 7800 cctatatctg cgtgttgcct gtatatatat atacatgaga agaacggcat agtgcgtgtt 7860 tatgcttaaa tgcgtactta tatgcgtcta tttatgtagg atgaaaggta gtctagtacc 7920 tcctgtgata ttatcccatt ccatgcgggg tatcgtatgc ttccttcagc actacccttt 7980 agctgttcta tatgctgcca ctcctcaatt ggattagtct catccttcaa tgctatcatt 8040 tcctttgata ttggatcata ctaagaaacc attattatca tgacattaac ctataaaaat 8100 aggcgtatca cgaggccctt tcgtc 8125 <210> 25 <211> 10881 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct: ERG10-ERG13 integration construct <400> 25 agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60 acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120 tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180 ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gccaagctat 240 ttaggtgaca ctatagaata ctcaagctat gcatcaagct tggtaccgag ctcggatcca 300 ctagtaacgg ccgccagtgt gctggaattc gcccttaaat atgaccccca atatgagaaa 360 ttaaggctag attattctca ggaaaaagct tttcatcttg aaatgctgca attatgtcgg 420 gtcccatttc tccacactta gcatctctct tataatgccc acagactaag ttccaatctc 480 ttagaaaagt ttcaccctga aaccttgtaa gctttctatg atgcacttca tgaacctgtt 540 gggaagcctt ggccttaccg cttaaataat cctggaagga tagctttggt gcttgaatag 600 ctccttcatc taaaaaagat gcaaattcct cgatgtccgt ttccttaatt acataaagct 660 tcatgtcagg aataacaaaa aaataaagcc attcatcgtg ttgttttggc cttggaataa 720 attcattttg caaatgcacc gcatttatta gtattcctgg agaaccacct aaatgggagc 780 gcaatttact aatggcatta tatggccgat ttgtattagt atccaaatta tgattccatg 840 ctaccttcca tggttgagca aacctatcac ccggtgataa cagcaaaaca tgcttattgt 900 aattgggcgt tctatgagga agcttgatat gaggatctaa tggatcagtt tttgaaggca 960 gccttgcgtt tatttcttgg caataacagt ttgtttgatc attttgagca cgggtatgaa 1020 gatcaggaac gctaatatgt ttgaagctat gatggaagga tgcccgctgc tgcaaagttt 1080 tgacagttat acgtagcatt ttattttttg tgtcagtgca ccttctctca cttttctact 1140 aaggaaattt gatatttcaa atgtagtatg ctaataaata agaacacccg catgcacgaa 1200 aaagggaaat ttaaaactag ttaggtaaac aaagttcaga acaagaaatg atatggttgt 1260 tttacataga tatatactca gtattcgttt ttataacgtt cgctgcactg gggggtctaa 1320 ggcgcctgat tcaagaaata tcttgaccgc agttaactgt gggaatactc aggtatcgta 1380 agatgcaaga gttcgaatct cttagcaacc attatttttt tcctcaacat aacgagaaca 1440 cacaggggcg ctatcgcaca gaatcaaatt cgatgactgg aaattttttg ttaatttcag 1500 aggtcgcctg acgcatatac ctttttcaac tgaaaaattg ggagaaaaag gaaaggtgag 1560 agcgccggaa ccggcttttc atatagaata gagaagcgtt catgactaaa tgcttgcatc 1620 acaatacttg aagttgacaa tattatttaa ggacctattg ttttttccaa taggtggtta 1680 gcaatcgtct tactttctaa cttttcttac cttttacatt tcagcaatat atatatatat 1740 atttcaagga tataccattc taatgtctgc ccctaagaag atcgtcgttt tgccaggtga 1800 ccacgttggt caagaaatca cagccgaagc cattaaggtt cttaaagcta tttctgatgt 1860 tcgttccaat gtcaagttcg atttcgaaaa tcatttaatt ggtggtgctg ctatcgatgc 1920 tacaggtgtt ccacttccag atgaggcgct ggaagcctcc aagaaggctg atgccgtttt 1980 gttaggtgct gtgggtggtc ctaaatgggg taccggtagt gttagacctg aacaaggttt 2040 actaaaaatc cgtaaagaac ttcaattgta cgccaactta agaccatgta actttgcatc 2100 cgactctctt ttagacttat ctccaatcaa gccacaattt gctaaaggta ctgacttcgt 2160 tgttgtcaga gaattagtgg gaggtattta ctttggtaag agaaaggaag acgatggtga 2220 tggtgtcgct tgggatagtg aacaatacac cgttccagaa gtgcaaagaa tcacaagaat 2280 ggccgctttc atggccctac aacatgagcc accattgcct atttggtcct tggataaagc 2340 taatgttttg gcctcttcaa gattatggag aaaaactgtg gaggaaacca tcaagaacga 2400 attccctaca ttgaaggttc aacatcaatt gattgattct gccgccatga tcctagttaa 2460 gaacccaacc cacctaaatg gtattataat caccagcaac atgtttggtg atatcatctc 2520 cgatgaagcc tccgttatcc caggttcctt gggtttgttg ccatctgcgt ccttggcctc 2580 tttgccagac aagaacaccg catttggttt gtacgaacca tgccacggtt ctgctccaga 2640 tttgccaaag aataaggtca accctatcgc cactatcttg tctgctgcaa tgatgttgaa 2700 attgtcattg aacttgcctg aagaaggtaa ggccattgaa gatgcagtta aaaaggtttt 2760 ggatgcaggt atcagaactg gtgatttagg tggttccaac agtaccaccg aagtcggtga 2820 tgctgtcgcc gaagaagtta agaaaatcct tgcttaaaaa gattctcttt ttttatgata 2880 tttgtacata aactttataa atgaaattca taatagaaac gacacgaaat tacaaaatgg 2940 aatatgttca tagggtagac gaaactatat acgcaatcta catacattta tcaagaagga 3000 gaaaaaggag gatgtaaagg aatacaggta agcaaattga tactaatggc tcaacgtaaa 3060 agtaagtcaa aaggcacacc tcagcgtttg agtacctgaa aaacgatgaa tcgcaaataa 3120 aactttaaat tatgcctgtt atacataaag ccatttatat atttatgtat tttatgaaaa 3180 agatcatgag aaaatcgcag aacgtaatca tatcttttca atgacaatag aggaagcacc 3240 accaccacca ttacaaatgg cggcaacacc gatcttacct ccttcttgct gtaagatgga 3300 tagcagtgta acaaccactc tagcaccaga acaacccaat gggtgaccta gagcaacagc 3360 accaccatat acattaacct tagatgggtc tagcttcaaa atcttagtgt tcaccaaacc 3420 gacaaccgaa aaggcttcat tgaattcaaa gtaatcaaca gaattgatgt cttcgatgcc 3480 agcatgtttc aaagcctttg gaactgcaag agatggagcc catgtaaaat cagctggttg 3540 atgagcggcc tcaccccaac ctttgataat agccaaaggc ttcaaattct tttccttcaa 3600 aactttttcg gaaaccaaga tgacggctgc agcaccatcg ttgattggag aagcgttagc 3660 ggcagtaaca gtaccgtttt ctttttggaa aacagtcctt gcagatctca atttttcaac 3720 gtgtaatcta gcaggttcct cgtccttcgt gacttgagta tcaggcttac ctctaaatcc 3780 cttaatggta acaggtacaa tttcattgtc gaatttacct tccttttgag atttttgaga 3840 tttttggtag gattcgatgg caaaattgtc ttgttgttct ctagtaatat cccaatcacg 3900 ggcacacttt tctgcgtgta cacccatggc tagaccatcg tacgcatcgt tcaacccatc 3960 tctttcgaca ccatcaacaa gaacagtttg gccaaatttg gcacccgcac gggctgctgg 4020 catgtagtat ggtgcgttag tcatagattc acaaccacca gctacgacaa catcagcatt 4080 accacatttg atggattgag cacccaaaat gattgccttc atagcggatg cacagacctt 4140 gttaactgtg cttgcaacga tatgattact caaaccggca gccaaagcaa cttgtctggc 4200 cggagcttgg cccaaattgg cagaaagaac gttaccaaaa ataatttcgt caaaatcctt 4260 ggatgcatcc aattctggaa ccttagccaa ggcgcctttt aaagcaacag cacccaattc 4320 cactgctgtc ttggaggata gagaaccctg gaatgaacca attggggttc tggcagtcga 4380 tacaatgtaa acgttctgag acattatagt tttttctcct tgacgttaaa gtatagaggt 4440 atattaacaa ttttttgttg atacttttat gacatttgaa taagaagtaa tacaaaccga 4500 aaatgttgaa agtattagtt aaagtggtta tgcagctttt gcatttatat atctgttaat 4560 agatcaaaaa tcatcgcttc gctgattaat taccccagaa ataaggctaa aaaactaatc 4620 gcattattat cctatggttg ttaatttgat tcgttgattt gaaggtttgt ggggccaggt 4680 tactgccaat ttttcctctt cataaccata aaagctagta ttgtagaatc tttattgttc 4740 ggagcagtgc ggcgcgaggc acatctgcgt ttcaggaacg cgaccggtga agaccaggac 4800 gcacggagga gagtcttccg tcggagggct gtcgcccgct cggcggcttc taatccgtac 4860 ttcaatatag caatgagcag ttaagcgtat tactgaaagt tccaaagaga aggttttttt 4920 aggctaagat aatggggctc tttacatttc cacaacatat aagtaagatt agatatggat 4980 atgtatatgg tggtattgcc atgtaatatg attattaaac ttctttgcgt ccatccaaaa 5040 aaaaagtaag aatttttgaa aattcaatat aaatgaaact ctcaactaaa ctttgttggt 5100 gtggtattaa aggaagactt aggccgcaaa agcaacaaca attacacaat acaaacttgc 5160 aaatgactga actaaaaaaa caaaagaccg ctgaacaaaa aaccagacct caaaatgtcg 5220 gtattaaagg tatccaaatt tacatcccaa ctcaatgtgt caaccaatct gagctagaga 5280 aatttgatgg cgtttctcaa ggtaaataca caattggtct gggccaaacc aacatgtctt 5340 ttgtcaatga cagagaagat atctactcga tgtccctaac tgttttgtct aagttgatca 5400 agagttacaa catcgacacc aacaaaattg gtagattaga agtcggtact gaaactctga 5460 ttgacaagtc caagtctgtc aagtctgtct tgatgcaatt gtttggtgaa aacactgacg 5520 tcgaaggtat tgacacgctt aatgcctgtt acggtggtac caacgcgttg ttcaactctt 5580 tgaactggat tgaatctaac gcatgggatg gtagagacgc cattgtagtt tgcggtgata 5640 ttgccatcta cgataagggt gccgcaagac caaccggtgg tgccggtact gttgctatgt 5700 ggatcggtcc tgatgctcca attgtatttg actctgtaag agcttcttac atggaacacg 5760 cctacgattt ttacaagcca gatttcacca gcgaatatcc ttacgtcgat ggtcattttt 5820 cattaacttg ttacgtcaag gctcttgatc aagtttacaa gagttattcc aagaaggcta 5880 tttctaaagg gttggttagc gatcccgctg gttcggatgc tttgaacgtt ttgaaatatt 5940 tcgactacaa cgttttccat gttccaacct gtaaattggt cacaaaatca tacggtagat 6000 tactatataa cgatttcaga gccaatcctc aattgttccc agaagttgac gccgaattag 6060 ctactcgcga ttatgacgaa tctttaaccg ataagaacat tgaaaaaact tttgttaatg 6120 ttgctaagcc attccacaaa gagagagttg cccaatcttt gattgttcca acaaacacag 6180 gtaacatgta caccgcatct gtttatgccg cctttgcatc tctattaaac tatgttggat 6240 ctgacgactt acaaggcaag cgtgttggtt tattttctta cggttccggt ttagctgcat 6300 ctctatattc ttgcaaaatt gttggtgacg tccaacatat tatcaaggaa ttagatatta 6360 ctaacaaatt agccaagaga atcaccgaaa ctccaaagga ttacgaagct gccatcgaat 6420 tgagagaaaa tgcccatttg aagaagaact tcaaacctca aggttccatt gagcatttgc 6480 aaagtggtgt ttactacttg accaacatcg atgacaaatt tagaagatct tacgatgtta 6540 aaaaataatc ttcccccatc gattgcatct tgctgaaccc ccttcataaa tgctttattt 6600 ttttggcagc ctgctttttt tagctctcat ttaatagagt agttttttaa tctatatact 6660 aggaaaactc tttatttaat aacaatgata tatatataga cgggagtgga aagaacggga 6720 aaccaactat cgagattgta tacgctggtc ggcaaggacc agcagtgaca tgtgatgtat 6780 atatattcag gttcaaaaaa aaaagttatg agcttttggt tattatgaat gtagcagaca 6840 ttttgaggtc gttcgggcga gagtgcgccg gtaaatgaag aaaatatagg atattattaa 6900 tattagaatt aaactattat attgcagggg agagaagaaa ggggtataaa tatatattac 6960 aaagcggaaa acttgcgcca tttaaacaga gacatcgtcc gggcgctcgt gtgattttct 7020 tatagtgaag aagttaatac ctttaggttg gttttccgta gcagcagtgg cagtgaccgg 7080 attagcattg gaagaaggcc ccactatgct tgcactttgt tgcatgtctt caggtccagt 7140 ggcagtcaat attgggtcag ttgcttgctc cttctctcta tggaagggat tccatctgga 7200 ggaggttctg tatcttgaat tgtcgatgga gtaagtagag gccaaccttg ccctaacaga 7260 ccagaagacc agcaggataa attccacgat acataaaaag acacttgccc aagccatacc 7320 catcatagag gcacccaatt gggcactacg atgatcgtca tggaaagcat tctttgccat 7380 ggcagaggcg gccgtttgca agacaacggc tgccgtattg aagacaaacc caaaagacat 7440 gaggataagc accatctctg aaagcatctt cgagcaccaa gtcaaaacgt aaaggataaa 7500 cgacacacct acaaaggcaa gcgcaatcca aaagaaacaa aatgaaaatc tagtcaggta 7560 gtaaaaagcg tctcttttgg aaataaactg gtgagggaca ttgatgtgtg tgttgaagtt 7620 atctactggg gaaatggggt atgcaggtgc caaattgctt gtgcaggtat ccgacccgtc 7680 tttatcctgt agacaggcaa gggcgaattc tgcagatatc catcacactg gcggccgctc 7740 gagcatgcat ctagagggcc caattcgccc tatagtgagt cgtattacaa ttcactggcc 7800 gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa tcgccttgca 7860 gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc 7920 caacagttgc gcagcctata cgtacggcag tttaaggttt acacctataa aagagagagc 7980 cgttatcgtc tgtttgtgga tgtacagagt gatattattg acacgccggg gcgacggatg 8040 gtgatccccc tggccagtgc acgtctgctg tcagataaag tctcccgtga actttacccg 8100 gtggtgcata tcggggatga aagctggcgc atgatgacca ccgatatggc cagtgtgccg 8160 gtctccgtta tcggggaaga agtggctgat ctcagccacc gcgaaaatga catcaaaaac 8220 gccattaacc tgatgttctg gggaatataa atgtcaggca tgagattatc aaaaaggatc 8280 ttcacctaga tccttttcac gtagaaagcc agtccgcaga aacggtgctg accccggatg 8340 aatgtcagct actgggctat ctggacaagg gaaaacgcaa gcgcaaagag aaagcaggta 8400 gcttgcagtg ggcttacatg gcgatagcta gactgggcgg ttttatggac agcaagcgaa 8460 ccggaattgc cagctggggc gccctctggt aaggttggga agccctgcaa agtaaactgg 8520 atggctttct cgccgccaag gatctgatgg cgcaggggat caagctctga tcaagagaca 8580 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 8640 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 8700 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 8760 ggtgccctga atgaactgca agacgaggca gcgcggctat cgtggctggc cacgacgggc 8820 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 8880 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 8940 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 9000 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 9060 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 9120 aaggcgagca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 9180 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 9240 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 9300 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 9360 gccttctatc gccttcttga cgagttcttc tgaattatta acgcttacaa tttcctgatg 9420 cggtattttc tccttacgca tctgtgcggt atttcacacc gcatacaggt ggcacttttc 9480 ggggaaatgt gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc 9540 cgctcatgag acaataaccc tgataaatgc ttcaataata gcacgtgagg agggccacca 9600 tggccaagtt gaccagtgcc gttccggtgc tcaccgcgcg cgacgtcgcc ggagcggtcg 9660 agttctggac cgaccggctc gggttctccc gggacttcgt ggaggacgac ttcgccggtg 9720 tggtccggga cgacgtgacc ctgttcatca gcgcggtcca ggaccaggtg gtgccggaca 9780 acaccctggc ctgggtgtgg gtgcgcggcc tggacgagct gtacgccgag tggtcggagg 9840 tcgtgtccac gaacttccgg gacgcctccg ggccggccat gaccgagatc ggcgagcagc 9900 cgtgggggcg ggagttcgcc ctgcgcgacc cggccggcaa ctgcgtgcac ttcgtggccg 9960 aggagcagga ctgacacgtg ctaaaacttc atttttaatt taaaaggatc taggtgaaga 10020 tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 10080 cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 10140 gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 10200 taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc 10260 ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 10320 tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 10380 ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 10440 cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 10500 agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 10560 gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 10620 atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 10680 gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctgggctttt 10740 gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 10800 ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 10860 cagtgagcga ggaagcggaa g 10881 <210> 26 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer YT_164_36_001 <400> 26 gcctgtctac aggataaaga cggg 24 <210> 27 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer YT_164_36_002 <400> 27 tcccgttctt tccactcccg tctatatata tatcattgtt atta 44 <210> 28 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer YT_164_36_003 <400> 28 taataacaat gatatatata tagacgggag tggaaagaac ggga 44 <210> 29 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer YT_164_36_004 <400> 29 ccaacaaagt ttagttgaga gtttcattta tattgaattt tcaaaaattc ttac 54 <210> 30 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer YT_164_36_005 <400> 30 gtaagaattt ttgaaaattc aatataaatg aaactctcaa ctaaactttg ttgg 54 <210> 31 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer YT_164_36_006 <400> 31 gtcaaggaga aaaaactata atgtctcaga acgtttacat tgtatcgact gccagaaccc 60 <210> 32 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer YT_164_36_007 <400> 32 gggttctggc agtcgataca atgtaaacgt tctgagacat tatagttttt tctccttgac 60 <210> 33 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer YT_164_36_008 <400> 33 gtgtgccttt tgacttactt ttacgttgag ccattagtat ca 42 <210> 34 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer YT_164_36_009 <400> 34 tgatactaat ggctcaacgt aaaagtaagt caaaaggcac ac 42 <210> 35 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer YT_164_36_010 <400> 35 gatatttctt gaatcaggcg ccttagaccc cccagtgcag cgaacgttat aaaaac 56 <210> 36 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer YT_164_36_011 <400> 36 gtttttataa cgttcgctgc actggggggt ctaaggcgcc tgattcaaga aatatc 56 <210> 37 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct: Linker YT_164_36_012 <400> 37 aaatatgacc cccaatatga gaaattaagg c 31 <210> 38 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer YT_164_30_Gal3F <400> 38 gagctcgcgg ccgcgtacat acctctctcc gtatcctcgt aatcattttc ttgt 54 <210> 39 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer YT_164_30_Gal3R <400> 39 catatgacta tgtgttgccc taccttttta cttttatttt ctcttt 46 <210> 40 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer YT_164_30_Gal7F <400> 40 gagctcgcgg ccgcgtgtca cagcgaattt cctcacatgt agggaccgaa ttgt 54 <210> 41 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer YT_164_30_Gal7R <400> 41 catatgtttt gagggaatat tcaactgttt ttttttatca tgttga 46 <210> 42 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct: RYSE Linker 0 <400> 42 gacggcacgg ccacgcgttt aaaccgcc 28 <210> 43 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct: RYSE Linker 19 <400> 43 cccgccaggc gctggggttt aaacacc 27 <210> 44 <211> 2738 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct: Kan A-ADH1 disruption construct <400> 44 gacggcacgg ccacgcgttt aaaccgccaa tgggctaaac aagactacac caattacact 60 gcctcattga tggtggtaca taacgaacta atactgtagc cctagacttg atagccatca 120 tcatatcgaa gtttcactac cctttttcca tttgccatct attgaagtaa taataggcgc 180 atgcaacttc ttttcttttt ttttcttttc tctctccccc gttgttgtct caccatatcc 240 gcaatgacaa aaaaatgatg gaagacacta aaggaaaaaa ttaacgacaa agacagcacc 300 aacagatgtc gttgttccag agctgatgag gggtatctcg aagcacacga aactttttcc 360 ttccttcatt cacgcacact actctctaat gagcaacggt atacggcctt ccttccagtt 420 acttgaattt gaaataaaaa aaagtttgct gtcttgctat caagtataaa tagacctgca 480 attattaatc ttttgtttcc tcgtcattgt tctcgctcac acgcggccag ggggagcctc 540 gacactagta atacacatca tcgtcctaca agttcatcaa agtgttggac agacaactat 600 accagcatgg atctcttgta tcggttcttt tctcccgctc tctcgcaata acaatgaaca 660 ctgggtcaat catagcctac acaggtgaac agagtagcgt ttatacaggg tttatacggt 720 gattcctacg gcaaaaattt ttcatttcta aaaaaaaaaa gaaaaatttt tctttccaac 780 gctagaagga aaagaaaaat ctaattaaat tgatttggtg attttctgag agttcccttt 840 ttcatatatc gaattttgaa tataaaagga gatcgaaaaa atttttctat tcaatctgtt 900 ttctggtttt atttgatagt ttttttgtgt attattatta tggattagta ctggtttata 960 tgggtttttc tgtataactt ctttttattt tagtttgttt aatcttattt tgagttacat 1020 tatagttccc taactgcaag agaagtaaca ttaaaaatgg gtaaggaaaa gactcacgtt 1080 tcgaggccgc gattaaattc caacatggat gctgatttat atgggtataa atgggctcgc 1140 gataatgtcg ggcaatcagg tgcgacaatc tatcgattgt atgggaagcc cgatgcgcca 1200 gagttgtttc tgaaacatgg caaaggtagc gttgccaatg atgttacaga tgagatggtc 1260 agactaaact ggctgacgga atttatgcct cttccgacca tcaagcattt tatccgtact 1320 cctgatgatg catggttact caccactgcg atccccggca aaacagcatt ccaggtatta 1380 gaagaatatc ctgattcagg tgaaaatatt gttgatgcgc tggcagtgtt cctgcgccgg 1440 ttgcattcga ttcctgtttg taattgtcct tttaacagcg atcgcgtatt tcgtctcgct 1500 caggcgcaat cacgaatgaa taacggtttg gttgatgcga gtgattttga tgacgagcgt 1560 aatggctggc ctgttgaaca agtctggaaa gaaatgcata agcttttgcc attctcaccg 1620 gattcagtcg tcactcatgg tgatttctca cttgataacc ttatttttga cgaggggaaa 1680 ttaataggtt gtattgatgt tggacgagtc ggaatcgcag accgatacca ggatcttgcc 1740 atcctatgga actgcctcgg tgagttttct ccttcattac agaaacggct ttttcaaaaa 1800 tatggtattg ataatcctga tatgaataaa ttgcagtttc atttgatgct cgatgagttt 1860 ttctaagttt aacttgatac tactagattt tttctcttca tttataaaat ttttggttat 1920 aattgaagct ttagaagtat gaaaaaatcc ttttttttca ttctttgcaa ccaaaataag 1980 aagcttcttt tattcattga aatgatgaat ataaacctaa caaaagaaaa agactcgaat 2040 atcaaacatt aaaaaaaaat aaaagaggtt atctgttttc ccatttagtt ggagtttgca 2100 ttttctaata gatagaactc tcaattaatg tggatttagt ttctctgttc gttttttttt 2160 gttttgttct cactgtattt acatttctat ttagtattta gttattcata taatcttaac 2220 ttctcgagga gctccgctcg tccaacgccg gcggaccttt taaaacgaaa attcttattc 2280 ttgagtaact ctttcctgta ggtcaggttg ctttctcagg tatagcatga ggtcgctctt 2340 attgaccaca cctctaccgg catgccgagc aaatgcctgc aaatcgctcc ccatttcacc 2400 caattgtaga tatgctaact ccagcaatga gttgatgaat ctcggtgtgt attttatgtc 2460 ctcagaggac aacacctgtt gtaatcgttc ttccacacgg atccacagcc tagccttcag 2520 ttgggctcta tcttcatcgt cattcattgc atctactagc cccttacctg agcttcaaga 2580 cgttatatcg cttttatgta tcatgatctt atcttgagat atgaatacat aaatatattt 2640 actcaagtgt atacgtgcat gcttttttta cggcagcatt tttttttcaa ctctgatcgc 2700 ccctttactg cggtgtttaa accccagcgc ctggcggg 2738 <210> 45 <211> 3059 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct: i2235 integration construct <400> 45 gacggcacgg ccacgcgttt aaaccgcctc gatatttcct gtgagaagtt taaatccact 60 aaggtttttc attgttgctg cagatgtgtt tttccattca tcctgaaata tgcactgcta 120 ttccgcattc cattccccta gtctttttta gttctttccg ttcgaccttc atcgaaaaat 180 gacaaaacgc gttaggaaca acaaccaatt gcaaacaagc agtgaaacaa aaccatcaag 240 gcccgaaaat acaagtgtgt actaatacag taagtaggtc aaatacgcaa tgaccaaaga 300 tgccgtgaat ctagatgctt acaccgtgag cttcatgcct ttctataccg agtatcaagg 360 accaaccgaa gagtttaagg attacaaatt cgaagatact atttactttc gtggcaagga 420 actgaagagg gaaaagtctg cgacgccttc cagtagcgat aacacaacta gtaatacctt 480 cagtaatggc gccatcctct cgggaaacac aataactggc aagatagttt cagtgaataa 540 ttacgaaaga gagggcactg atcgcaacga attggcgcga ttgcaagaat tgatctccct 600 catcgatgtc ataaatcagt aaatataagc tcacacgcgg ccagggggag cccgttgagc 660 cattagtatc aatttgctta cctgtattcc tttactatcc tcctttttct ccttcttgat 720 aaatgtatgt agattgcgta tatagtttcg tctaccctat gaacatattc cattttgtaa 780 tttcgtgtcg tttctattat gaatttcatt tataaagttt atgtacaaat atcataaaaa 840 aagagaatct ttttaagcaa ggattttctt aacttcttcg gcgacagcat caccgacttc 900 ggtggtactg ttggaaccac ctaaatcacc agttctgata cctgcatcca aaaccttttt 960 aactgcatct tcaatggcct taccttcttc aggcaagttc aatgacaatt tcaacatcat 1020 tgcagcagac aagatagtgg cgatagggtc aaccttattc tttggcaaat ctggagcaga 1080 accgtggcat ggttcgtaca aaccaaatgc ggtgttcttg tctggcaaag aggccaagga 1140 cgcagatggc aacaaaccca aggaacctgg gataacggag gcttcatcgg agatgatatc 1200 accaaacatg ttgctggtga ttataatacc atttaggtgg gttgggttct taactaggat 1260 catggcggca gaatcaatca attgatgttg aaccttcaat gtagggaatt cgttcttgat 1320 ggtttcctcc acagtttttc tccataatct tgaagaggcc aaaacattag ctttatccaa 1380 ggaccaaata ggcaatggtg gctcatgttg tagggccatg aaagcggcca ttcttgtgat 1440 tctttgcact tctggaacgg tgtattgttc actatcccaa gcgacaccat caccatcgtc 1500 ttcctttctc ttaccaaagt aaatacctcc cactaattct ctgacaacaa cgaagtcagt 1560 acctttagca aattgtggct tgattggaga taagtctaaa agagagtcgg atgcaaagtt 1620 acatggtctt aagttggcgt acaattgaag ttctttacgg atttttagta aaccttgttc 1680 aggtctaaca ctaccggtac cccatttagg accacccaca gcacctaaca aaacggcatc 1740 aaccttcttg gaggcttcca gcgcctcatc tggaagtggg acacctgtag catcgatagc 1800 agcaccacca attaaatgat tttcgaaatc gaacttgaca ttggaacgaa catcagaaat 1860 agctttaaga accttaatgg cttcggctgt gatttcttga ccaacgtggt cacctggcaa 1920 aacgacgatc ttcttagggg cagacatagg ggcagacatt agaatggtat atccttgaaa 1980 tatatatata tattgctgaa atgtaaaagg taagaaaagt tagaaagtaa gacgattgct 2040 aaccacctat tggaaaaaac aataggtcct taaataatat tgtcaacttc aagtattgtg 2100 atgcaagcat ttagtcatga acgcttctct attctatatg aaaagccggt tccggcctct 2160 cacctttcct ttttctccca atttttcagt tgaaaaaggt atatgcgtca ggcgacctct 2220 gaaattaaca aaaaatttcc agtcatcgaa tttgattctg tgcgatagcg cccctgtgtg 2280 ttctcgttat gttgaggaaa aaaataatgg ttgctaagag attcgaactc ttgcatctta 2340 cgatacctga gtattcccac agttaactgc ggtcaagata tttcttgaat caggcgcctc 2400 gctcgtccaa cgccggcgga cctcttaaat gagaaaaatt tcgtaatgag ataaaatttc 2460 gctccttttc tgttttctat tttctatttt cccaactttt gctctattca gttataaatt 2520 actatttatc catcagttaa aaaacaagat cttttactgg tcagctagga aagcgaaaat 2580 acaaagactt tatgcactta gtgatatata tgtatagata tatccatttt tacgcactta 2640 tcatatatct tagttatcta aatacaatct agttattcgt acacaatcgc ccctgttatc 2700 cctatagtgg gaataaagta atgcactgtg acggggttct tcgcccggga tagggtaaaa 2760 ggatattgcc gtttcaagaa acttcgggga taatcgaata agataccgag aaagctattg 2820 ttcgttgtgc acgtaggatg tatattgaac aagcatgacc agaatctgat gcattacgag 2880 aaggttacgg gatgatatca gacctccgaa gtccatgttg caaaatgtgc cgactttccg 2940 cggcgctatt tggcacaaat ttcaggagaa acatcactgt cggtgttata gaattccatc 3000 tatattgttt tccccgtagg catacgtcga gcggtgttta aaccccagcg cctggcggg 3059 <210> 46 <211> 8106 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct: i74804 integration construct <400> 46 gacggcacgg ccacgcgttt aaaccgcccg ctcgcctcat ccccacggga ataaggcagc 60 cgacaaaaga aaaacgaccg aaaaggaacc agaaagaaaa aagagggtgg gcgcgccgcg 120 gacgtgtaaa aagatatgca tccagcttct atatcgcttt aactttaccg ttttgggcat 180 cgggaacgta tgtaacattg atctcctctt gggaacggtg agtgcaacga atgcgatata 240 gcaccgacca tgtgggcaaa ttcgtaataa attcggggtg agggggattc aagacaagca 300 accttgttag tcagctcaaa cagcgattta acggttgagt aacacatcaa aacaccgttc 360 gaggtcaagc ctggcgtgtt taacaagttc ttgatatcat atataaatgt aataagaagt 420 ttggtaatat tcaattcgaa gtgttcagtc ttttacttct cttgttttat agaagaaaaa 480 acatcaagaa acatctttaa catacacaaa cacatactat cagaatacac gctcgtccaa 540 cgccggcgga cctttcagac gcgactgcct catcagtaag acccgttgaa aagaacttac 600 ctgaaaaaaa cgaatatata ctagcgttga atgttagcgt caacaacaag aagtttaatg 660 acgcggaggc caaggcaaaa agattccttg attacgtaag ggagttagaa tcattttgaa 720 taaaaaacac gctttttcag ttcgagttta tcattatcaa tactgccatt tcaaagaata 780 cgtaaataat taatagtagt gattttccta actttattta gtcaaaaaat tagcctttta 840 attctgctgt aacccgtaca tgcccaaaat agggggcggg ttacacagaa tatataacat 900 cgtaggtgtc tgggtgaaca gtttattcct ggcatccact aaatataatg gagcccgctt 960 tttaagctgg catccagaaa aaaaaagaat cccagcacca aaatattgtt ttcttcacca 1020 accatcagtt cataggtcca ttctcttagc gcaactacag agaacagggg cacaaacagg 1080 caaaaaacgg gcacaacctc aatggagtga tgcaacctgc ctggagtaaa tgatgacaca 1140 aggcaattga cccacgcatg tatctatctc attttcttac accttctatt accttctgct 1200 ctctctgatt tggaaaaagc tgaaaaaaaa ggttgaaacc agttccctga aattattccc 1260 ctacttgact aataagtata taaagacggt aggtattgat tgtaattctg taaatctatt 1320 tcttaaactt cttaaattct acttttatag ttagtctttt ttttagtttt aaaacaccaa 1380 gaacttagtt tcgacctccc gcgacctcca aaatcgaact accttcacaa tggaacattc 1440 tgtaatcgaa ccaactgtgc ccatgccgct accagccatg tttgacgctc catctggtat 1500 ttttagctct ttggacgacg ctgtgcaagc agccacctta gcccaacaac aactaagttc 1560 agttgagttg cgtcagcaag taatcaaagc cataagagtg gccggagaaa ggtatgcaca 1620 agttttggct gaaatggcag ttgctgaaac tggtatgggt agggtggtgg ataagtacat 1680 taagaatgtc tctcaagctc gtcatacgcc tggtatagaa tgtttatcgg ccgaggttct 1740 tacgggtgat aatggcctaa cattgattga aaatgcccct tggggagtcg tagcttcagt 1800 cacgccaagc acaaatccag cagctacggt aattaataat gcaatctcaa tgattgcagc 1860 ggggaattca gtcgtgttcg caccacatcc ttctgccaaa aacgtctcac taaggactat 1920 ttctttactc aacaaggcca ttgtcgctac cggcggccca gaaaatttac tagttagtgt 1980 ggcaaaccct aacatcgaaa ctgcacagag attattcaga tatccgggta ttggattgtt 2040 agttgtgaca ggtggtgaag ccgtcgttga agccgctagg aagcatacag ataaaaggtt 2100 aattgcagcc ggcgctggta atcctcctgt tgttgtggac gaaactgctg acatacctaa 2160 agccgcaaga gcaattgtca agggtgcttc tttcgacaac aacataattt gtgctgatga 2220 aaaagttttg attgtggtag acagagttgc agatgcacta ttggcagaaa tgcaaagaaa 2280 taacgccgtc ttacttacac ccgaacagac cgaaagacta ctacccgctc ttttgtccga 2340 tattgacgaa cagggcaaag gacgtgtgaa tagagattat gttggaagag atgcggctaa 2400 attagcagcg gctattggtc tggaagttag cgaacatact cgtctactcc tggcagagac 2460 agacgctgat catccattcg ccgtgacgga gctgatgatg ccagtgttac cagtaataag 2520 agtcaagaat gtagatgatg caatcgcatt ggcagttaag ctagagtcag gctgcagaca 2580 cacagctgcg atgcactcta ctaatataag aaacttaaat agaatggcta atgccatcaa 2640 tacctctatc tttgtaaaaa atggtccatg tattgcaggt ttgggtttag gcggtgaagg 2700 ttggacttca atgactatta gcactccgac cggtgaaggt gttacaagcg ctcgtacctt 2760 tgtcagatta agaaggtgtg tcttagtcga catgtttcgg attgcttaag cggccgcgag 2820 taataattat tgcttccata taatattttt atatacctct tatttttatg tattagttaa 2880 ttaagtattt ttatctatct gcttatcatt ttcttttcat ataggggggg ttggtgtttt 2940 cttgcccatc agattgatgt cctccaactc ggcactattt tacaaagggt ttttttgtaa 3000 gagaaggaga agacagatac taaaccatac gttactcgaa acaaaaaaaa aaaaaatgga 3060 aaaagctgct atcaacaaaa gacggcctca tcaaacctaa agaaaccatg tcagcgtatg 3120 tatatacctt gtaatttacg tttccttaaa tcttctttct actaacgttt tcattattct 3180 atactctatg accaataaaa acagactgta ctttcaaaat ttacccagta ggccagcaaa 3240 taaagaaaat tataccagat tacttctgaa acacattaat cccaacaaca agtatgccat 3300 taatccgtcg ctaccccatc cccgcgtgct tggccggccg tacactgagt aatggtagtt 3360 ataagaaaga gaccgagtta gggacagtta gaggcggtgg agatattcct tatggcatgt 3420 ctggcgatga taaaactttt caaacggcag ccccgatcta aaagagctga cagggaaatg 3480 gtcagaaaaa gaaacgtgca cccgcccgtc tggacgcgcc gctcacccgc acggcagaga 3540 ccaatcagta aaaatcaacg gttaacgaca ttactatata tataatatag gaagcattta 3600 atagaacagc atcgtaatat atgtgtactt tgcagttatg acgccagatg gcagtagtgg 3660 aagatattct ttattgaaaa atagcttgtc accttacgta caatcttgat ccggagcttt 3720 tctttttttg ccgattaaga attcggtcga aaaaagaaaa ggagagggcc aagagggagg 3780 gcattggtga ctattgagca cgtgagtata cgtgattaag cacacaaagg cagcttggag 3840 tatgtctgtt attaatttca caggtagttc tggtccattg gtgaaagttt gcggcttgca 3900 gagcacagag gccgcagaat gtgctctaga ttccgatgct gacttgctgg gtattatatg 3960 tgtgcccaat agaaagagaa caattgaccc ggttattgca aggaaaattt caagtcttgt 4020 aaaagcatat aaaaatagtt caggcactcc gaaatacttg gttggcgtgt ttcgtaatca 4080 acctaaggag gatgttttgg ctctggtcaa tgattacggc attgatatcg tccaactgca 4140 tggagatgag tcgtggcaag aataccaaga gttcctcggt ttgccagtta ttaaaagact 4200 cgtatttcca aaagactgca acatactact cagtgcagct tcacagaaac ctcattcgtt 4260 tattcccttg tttgattcag aagcaggtgg gacaggtgaa cttttggatt ggaactcgat 4320 ttctgactgg gttggaaggc aagagagccc cgaaagctta cattttatgt tagctggtgg 4380 actgacgcca gaaaatgttg gtgatgcgct tagattaaat ggcgttattg gtgttgatgt 4440 aagcggaggt gtggagacaa atggtgtaaa agactctaac aaaatagcaa atttcgtcaa 4500 aaatgctaag aaataggtta ttactgagta gtatttattt aagtattgtt tgtgcacttg 4560 cctgcaggcc ttttgaaaag caagcataaa agatctaaac ataaaatctg taaaataaca 4620 agatgtaaag ataatgctaa atcatttggc tttttgattg attgtacagg aaaatataca 4680 tcgcaggggg ttgactttta ccatttcacc gcaatggaat caaacttgtt gaagagaatg 4740 ttcacaggcg catacgctac aatgacacgg ccggccaagc acgcggggat ggggtagcga 4800 cggattaatg gcatacttgt tgttgggatt aatgtgtttc agaagtaatc tggtataatt 4860 ttctttattt gctggcctac tgggtaaatt ttgaaagtac agtctgtttt tattggtcat 4920 agagtataga ataatgaaaa cgttagtaga aagaagattt aaggaaacgt aaattacaag 4980 gtatatacat acgctgacat ggtttcttta ggtttgatga ggccgtcttt tgttgatagc 5040 agctttttcc attttttttt tttttgtttc gagtaacgta tggtttagta tctgtcttct 5100 ccttctctta caaaaaaacc ctttgtaaaa tagtgccgag ttggaggaca tcaatctgat 5160 gggcaagaaa acaccaaccc cccctatatg aaaagaaaat gataagcaga tagataaaaa 5220 tacttaatta actaatacat aaaaataaga ggtatataaa aatattatat ggaagcaata 5280 attattactc gcggccgctt aagcaatccg aaacatgtcg actaagacac accttcttaa 5340 tctgacaaag gtacgagcgc ttgtaacacc ttcaccggtc ggagtgctaa tagtcattga 5400 agtccaacct tcaccgccta aacccaaacc tgcaatacat ggaccatttt ttacaaagat 5460 agaggtattg atggcattag ccattctatt taagtttctt atattagtag agtgcatcgc 5520 agctgtgtgt ctgcagcctg actctagctt aactgccaat gcgattgcat catctacatt 5580 cttgactctt attactggta acactggcat catcagctcc gtcacggcga atggatgatc 5640 agcgtctgtc tctgccagga gtagacgagt atgttcgcta acttccagac caatagccgc 5700 tgctaattta gccgcatctc ttccaacata atctctattc acacgtcctt tgccctgttc 5760 gtcaatatcg gacaaaagag cgggtagtag tctttcggtc tgttcgggtg taagtaagac 5820 ggcgttattt ctttgcattt ctgccaatag tgcatctgca actctgtcta ccacaatcaa 5880 aactttttca tcagcacaaa ttatgttgtt gtcgaaagaa gcacccttga caattgctct 5940 tgcggcttta ggtatgtcag cagtttcgtc cacaacaaca ggaggattac cagcgccggc 6000 tgcaattaac cttttatctg tatgcttcct agcggcttca acgacggctt caccacctgt 6060 cacaactaac aatccaatac ccggatatct gaataatctc tgtgcagttt cgatgttagg 6120 gtttgccaca ctaactagta aattttctgg gccgccggta gcgacaatgg ccttgttgag 6180 taaagaaata gtccttagtg agacgttttt ggcagaagga tgtggtgcga acacgactga 6240 attccccgct gcaatcattg agattgcatt attaattacc gtagctgctg gatttgtgct 6300 tggcgtgact gaagctacga ctccccaagg ggcattttca atcaatgtta ggccattatc 6360 acccgtaaga acctcggccg ataaacattc tataccaggc gtatgacgag cttgagagac 6420 attcttaatg tacttatcca ccaccctacc cataccagtt tcagcaactg ccatttcagc 6480 caaaacttgt gcataccttt ctccggccac tcttatggct ttgattactt gctgacgcaa 6540 ctcaactgaa cttagttgtt gttgggctaa ggtggctgct tgcacagcgt cgtccaaaga 6600 gctaaaaata ccagatggag cgtcaaacat ggctggtagc ggcatgggca cagttggttc 6660 gattacagaa tgttccattg tgaaggtagt tcgattttgg aggtcgcggg aggtcgaaac 6720 taagttcttg gtgttttaaa actaaaaaaa agactaacta taaaagtaga atttaagaag 6780 tttaagaaat agatttacag aattacaatc aatacctacc gtctttatat acttattagt 6840 caagtagggg aataatttca gggaactggt ttcaaccttt tttttcagct ttttccaaat 6900 cagagagagc agaaggtaat agaaggtgta agaaaatgag atagatacat gcgtgggtca 6960 attgccttgt gtcatcattt actccaggca ggttgcatca ctccattgag gttgtgcccg 7020 ttttttgcct gtttgtgccc ctgttctctg tagttgcgct aagagaatgg acctatgaac 7080 tgatggttgg tgaagaaaac aatattttgg tgctgggatt cttttttttt ctggatgcca 7140 gcttaaaaag cgggctccat tatatttagt ggatgccagg aataaactgt tcacccagac 7200 acctacgatg ttatatattc tgtgtaaccc gccccctatt ttgggcatgt acgggttaca 7260 gcagaattaa aaggctaatt ttttgactaa ataaagttag gaaaatcact actattaatt 7320 atttacgtat tctttgaaat ggcagtattg ataatgataa actcgaactg aaaaagcgtg 7380 ttttttattc aaaatgattc taactccctt acgtaatcaa ggaatctttt tgccttggcc 7440 tccgcgtcat taaacttctt gttgttgacg ctaacattca acgctagtat atattcgttt 7500 ttttcaggta agttcttttc aacgggtctt actgatgagg cagtcgcgtc tgaaaggtcc 7560 gccggcgttg gacgagcgtg taccaacctg catttctttc cgtcatatac acaaaatact 7620 ttcatataaa cttacttggt cttacgtcat aaataaatat gtatacatat aaattaaaaa 7680 atttggtttt atatttttac aaaaagaatc gtttacttca tttctccctt ttaagcgata 7740 caatccatga aaaaagagaa aaagagagaa caggcttgtg ccttctttaa aacatcccac 7800 acaaaatcat attgaattga attttacatc ttaagctagt gtacaacaac tgctatatcc 7860 aaagaaaact aacgtggacc gcttttagag ttgagaaaaa ggtttgaaaa aaatagcaat 7920 acaaagactt gtttcatata taaaatacag ggagcacatt gagctaatat aacataaaca 7980 ctgcgaacca attccaatca aaaggtacac atgagagcat tcccccgagt actgccattt 8040 cgccatcaga gatcatataa taacatcctt cttcgaacgg cggtttaaac gcgtggccgt 8100 gccgtc 8106 <210> 47 <211> 2404 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct: i76220 integration construct <400> 47 gacggcacgg ccacgcgttt aaaccgccgc acgtgtatgt acggctgtgt aaatatgata 60 atcatctcgg acgaacggcg tagtactctc catcccctaa aaatgttcac gtgtgactgc 120 tccatttcgc cggatgtcga gatgaccccc ccccctcaaa aggcactcac ctgctgacat 180 gccgtggcaa atgattgggg tcatcctttt tttctgttat ctctaagatc caaagaaaag 240 taaaaaaaaa aggttggggt acgaattgcc gccgagcctc cgatgccatt attcaatggg 300 tattgcagtt ggggtatagt tcctcggtgg caaatagttc tcccttcatt ttgtatataa 360 actgggcggc tattctaagc atatttctcc cttaggttat ctggtagtac gttatatctt 420 gttcttatat tttctatcta taagcaaaac caaacatatc aaaactacta gaaagacatt 480 gccccactgt gttcgctcgt ccaacgccgg cggacctttc tcgacgtggg cctttttctt 540 gccatatgga tccgctgcac ggtcctgttc cctagcatgt acgtgagcgt atttcctttt 600 aaaccacgac gctttgtctt cattcaacgt ttcccattgt ttttttctac tattgctttg 660 ctgtgggaaa aacttatcga aagatgacga ctttttctta attctcgttt taagagcttg 720 gtgagcgcta ggagtcactg ccaggtatcg tttgaacacg gcattagtca gggaagtcat 780 aacacagtcc tttcccgcaa ttttcttttt ctattactct tggcctcctc tagtacactc 840 tatatttttt tatgcctcgg taatgatttt catttttttt tttccaccta gcggatgact 900 cttttttttt cttagcgatt ggcattatca cataatgaat tatacattat ataaagtaat 960 gtgatttctt cgaagaatat actaaaaaat gagcaggcaa gataaacgaa ggcaaagatg 1020 acagagcaga aagccctagt aaagcgtatt acaaatgaaa ccaagattca gattgcgatc 1080 tctttaaagg gtggtcccct agcgatagag cactcgatct tcccagaaaa agaggcagaa 1140 gcagtagcag aacaggccac acaatcgcaa gtgattaacg tccacacagg tatagggttt 1200 ctggaccata tgatacatgc tctggccaag cattccggct ggtcgctaat cgttgagtgc 1260 attggtgact tacacataga cgaccatcac accactgaag actgcgggat tgctctcggt 1320 caagctttta aagaggccct aggggccgtg cgtggagtaa aaaggtttgg atcaggattt 1380 gcgcctttgg atgaggcact ttccagagcg gtggtagatc tttcgaacag gccgtacgca 1440 gttgtcgaac ttggtttgca aagggagaaa gtaggagatc tctcttgcga gatgatcccg 1500 cattttcttg aaagctttgc agaggctagc agaattaccc tccacgttga ttgtctgcga 1560 ggcaagaatg atcatcaccg tagtgagagt gcgttcaagg ctcttgcggt tgccataaga 1620 gaagccacct cgcccaatgg taccaacgat gttccctcca ccaaaggtgt tcttatgtag 1680 tgacaccgat tatttaaagc tgcagcatac gatatatata catgtgtata tatgtatacc 1740 tatgaatgtc agtaagtatg tatacgaaca gtatgatact gaagatgaca aggtaatgca 1800 tcattctata cgtgtcattc tgaacgaggc gcgctttcct tttttctttt tgctttttct 1860 ttttttttct cttgaactcg aggtccgccg gcgttggacg agcgtgatga tttctttcct 1920 ttttatattg acgacttttt ttttttcgtg tgtttttgtt ctcttataac cgagctgctt 1980 acttattatt atttcacctt ctctttttat ttatacttat aattatttat tctttacata 2040 ctgttacaag aaactctttt ctacattaat tgcataaagt gtcaatcagc acatcctcta 2100 tatcgctatc aacaacaaat ttgacaaacc tgcctatatc ttcaggaaca actgccgcat 2160 cgctaccacc actacttgtg aagtccctgg agtttaatat gcactgaaat ttacctagcc 2220 gttttacaca agaccataat ccatccatgc tatcgcagta tatgattttg tgttcgtttt 2280 tcgtcttgcg aaaggcatcc tcaatggctt gtttcattga tccatcagtg tggctcgtag 2340 gtaccagcaa aaccacttca tcagcggcgt actcctggcg gtttaaacgc gtggccgtgc 2400 cgtc 2404 <210> 48 <211> 8536 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct: i73830 integration construct <400> 48 gacggcacgg ccacgcgttt aaaccgccac ccagccaagg tagtctaaaa gctaatttct 60 ctaaaaggga gaaagttggt gattttttat ctcgcattat tatatatgca agaatagtta 120 aggtatagtt ataaagtttt atcttaattg ccacatacgt acattgacac gtagaaggac 180 tccattattt ttttcattct agcatactat tattccttgt aacgtcccag agtattccat 240 ttaattgtcc tccatttctt aacggtgacg aaggatcacc atacaacaac tactaaagat 300 tatagtacac tctcaccttg caactattta tctgacattt gccttacttt tatctccagc 360 ttcccctcga ttttattttt caatttgatt tctaaagctt tttgcttagg cataccaaac 420 catccactca tttaacacct tatttttttt ttcgaagaca gcatccaact ttatacgttc 480 actacctttt tttttacaac aatttcattc ttcatcctat gaacgctcgt ccaacgccgg 540 cggacctttc agacgcgact gcctcatcag taagacccgt tgaaaagaac ttacctgaaa 600 aaaacgaata tatactagcg ttgaatgtta gcgtcaacaa caagaagttt aatgacgcgg 660 aggccaaggc aaaaagattc cttgattacg taagggagtt agaatcattt tgaataaaaa 720 acacgctttt tcagttcgag tttatcatta tcaatactgc catttcaaag aatacgtaaa 780 taattaatag tagtgatttt cctaacttta tttagtcaaa aaattagcct tttaattctg 840 ctgtaacccg tacatgccca aaataggggg cgggttacac agaatatata acatcgtagg 900 tgtctgggtg aacagtttat tcctggcatc cactaaatat aatggagccc gctttttaag 960 ctggcatcca gaaaaaaaaa gaatcccagc accaaaatat tgttttcttc accaaccatc 1020 agttcatagg tccattctct tagcgcaact acagagaaca ggggcacaaa caggcaaaaa 1080 acgggcacaa cctcaatgga gtgatgcaac ctgcctggag taaatgatga cacaaggcaa 1140 ttgacccacg catgtatcta tctcattttc ttacaccttc tattaccttc tgctctctct 1200 gatttggaaa aagctgaaaa aaaaggttga aaccagttcc ctgaaattat tcccctactt 1260 gactaataag tatataaaga cggtaggtat tgattgtaat tctgtaaatc tatttcttaa 1320 acttcttaaa ttctactttt atagttagtc ttttttttag ttttaaaaca ccaagaactt 1380 agtttcgacc tcccgcgacc tccaaaatcg aactaccttc acaatggctg atttcgattc 1440 taaagaatac ttggagttag ttgacaagtg gtggcgtgcc accaactact tgtccgctgg 1500 tatgattttc ttgaagtcca acccattatt ctctgttact aataccccaa tcaaggccga 1560 agatgtcaaa gttaaaccaa ttggtcactg gggtactatt tccggtcaaa ctttcttata 1620 cgcccacgct aaccgtttga ttaacaagta cggtctcaac atgttttacg ttggtggtcc 1680 aggtcacggt ggtcaagtca tggttactaa cgcctactta gacggtgcct acaccgaaga 1740 ttacccagaa attactcaag acatcgaagg tatgtctcat ttgttcaagc gtttctcttt 1800 ccctggtggt attggttccc atatgaccgc tcaaactcca ggttccttgc acgaaggtgg 1860 tgaattgggt tactctttgt cccatgcttt cggtgctgtt ttggacaacc cagaccaagt 1920 tgcttttgct gtcgttggtg atggtgaagc tgaaactggt ccatctatgg cctcttggca 1980 ttccattaag ttcttaaatg ccaagaacga tggtgccgtt ttgccagttt tggatttaaa 2040 cggtttcaag atttccaatc caaccatttt ttctagaatg tctgatgaag aaattactaa 2100 gttcttcgaa ggtttgggtt attcccctag attcattgaa aatgatgaca ttcacgacta 2160 cgccacctac caccaattgg ccgctaacat cttagatcaa gccatcgaag acattcaagc 2220 tattcaaaat gacgccagag agaatggtaa atatcaagat ggtgaaattc cagcttggcc 2280 tgttattatc gctagattgc caaagggttg gggtggtcca acccacgatg cttctaataa 2340 tccaattgaa aactctttca gagctcacca agttccatta ccattggaac aacacgattt 2400 ggccaccttg ccagaattcg aagattggat gaactcttac aagccagaag aattattcaa 2460 cgctgatggt tccttgaagg atgagttgaa agctattgcc ccaaagggtg ataagagaat 2520 gtctgctaac ccaatcacca acggtggtgc tgacagatcc gacttgaaat tgccaaattg 2580 gagagaattc gctaacgaca tcaacgacga taccagaggt aaggaattcg ctgactctaa 2640 gagaaacatg gatatggcta ctttatccaa ctatttaggt gccgtttctc aattgaaccc 2700 aaccagattc agattcttcg gtccagatga aaccatgtcc aacagattgt ggggtttgtt 2760 taatgttacc ccacgtcaat ggatggaaga aatcaaggaa ccacaagatc aattgttgtc 2820 tccaactggt cgtatcatcg attcccaatt gtctgaacac caagctgaag gttggttgga 2880 aggttacact ttgactggta gagttggtat ctttgcctct tacgaatctt tcttgagagt 2940 tgttgatacc atggtcactc aacatttcaa gtggttgcgt cacgcttccg aacaagcttg 3000 gagaaatgac tatccatcct taaatttgat cgctacctct accgctttcc aacaagatca 3060 taacggttat actcaccaag accctggtat gttaactcat ttggccgaga agaagtctaa 3120 cttcattaga gaatatttgc cagccgacgg taactctttg ttagccgttc aagagagagc 3180 tttctctgaa agacataagg ttaacttatt gatcgcttct aaacaaccaa gacaacaatg 3240 gttcactgtt gaagaagctg aagtcttagc taacgaaggt ttgaagatta tcgattgggc 3300 ttctactgct ccatcttccg atgttgatat tacttttgct tctgccggta ctgaaccaac 3360 cattgagact ttggccgcct tatggttgat taatcaagct ttccctgacg ttaagtttag 3420 atacgttaac gttgttgaat tgttaagatt gcaaaagaaa tctgaaccaa acatgaacga 3480 cgaaagagaa ttatctgccg aagaatttaa taagtacttc caagccgaca ctccagttat 3540 cttcggtttc cacgcttacg aaaacttgat tgaatctttc tttttcgaga gaaagttcac 3600 cggtgatgtc tatgttcacg gttatagaga agatggtgat atcactacca cctacgatat 3660 gagagtctat tcccacttgg atcgtttcca tcaagccaag gaagccgccg aaatcttgtc 3720 tgctaacggt aaaatcgacc aagccgctgc cgacaccttt attgctaaga tggacgacac 3780 tttggccaaa cacttccaag ttactagaaa tgaaggtaga gatattgaag aattcactga 3840 ctggacttgg tctccattga agtaagtgaa tttactttaa atcttgcatt taaataaatt 3900 ttctttttat agctttatga cttagtttca atttatatac tattttaatg acattttcga 3960 ttcattgatt gaaagctttg tgttttttct tgatgcgcta ttgcattgtt cttgtctttt 4020 tcgccacatg taatatctgt agtagatacc tgatacattg tggatgctga gtgaaatttt 4080 agttaataat ggaggcgctc ttaataattt tggggatatt ggcttatccc cgcgtgcttg 4140 gccggccgta cgaaaatcgt tattgtcttg aaggtgaaat ttctactctt attaatggtg 4200 aacgttaagc tgatgctatg atggaagctg attggtctta acttgcttgt catcttgcta 4260 atggtcattg gctcgtgtta ttacttaagt tatttgtact cgttttgaac gtaatgctaa 4320 tgatcatctt atggaataat agtgagtggt ttcagggtcc ataaagcttt tcaattcatc 4380 tttttttttt ttgttctttt ttttgattcc ggtttctttg aaattttttt gattcggtaa 4440 tctccgagca gaaggaagaa cgaaggaagg agcacagact tagattggta tatatacgca 4500 tatgtggtgt tgaagaaaca tgaaattgcc cagtattctt aacccaactg cacagaacaa 4560 aaacctgcag gaaacgaaga taaatcatgt cgaaagctac atataaggaa cgtgctgcta 4620 ctcatcctag tcctgttgct gccaagctat ttaatatcat gcacgaaaag caaacaaact 4680 tgtgtgcttc attggatgtt cgtaccacca aggaattact ggagttagtt gaagcattag 4740 gtcccaaaat ttgtttacta aaaacacatg tggatatctt gactgatttt tccatggagg 4800 gcacagttaa gccgctaaag gcattatccg ccaagtacaa ttttttactc ttcgaagaca 4860 gaaaatttgc tgacattggt aatacagtca aattgcagta ctctgcgggt gtatacagaa 4920 tagcagaatg ggcagacatt acgaatgcac acggtgtggt gggcccaggt attgttagcg 4980 gtttgaagca ggcggcggaa gaagtaacaa aggaacctag aggccttttg atgttagcag 5040 aattgtcatg caagggctcc ctagctactg gagaatatac taagggtact gttgacattg 5100 cgaagagtga caaagatttt gttatcggct ttattgctca aagagacatg ggtggaagag 5160 atgaaggtta cgattggttg attatgacac ccggtgtggg tttagatgac aagggagacg 5220 cattgggtca acagtataga accgtggatg atgtggtctc tacaggatct gacattatta 5280 ttgttggaag aggactattt gcaaagggaa gggatgctaa ggtagagggt gaacgttaca 5340 gaaaagcagg ctgggaagca tatttgagaa gatgcggcca gcaaaactaa aaaactgtat 5400 tataagtaaa tgcatgtata ctaaactcac aaattagagc ttcaatttaa ttatatcagt 5460 tattaccacg aaaatcgtta ttgtcttgaa ggtgaaattt ctactcttat taatggtgaa 5520 cgttaagctg atgctatgat ggaagctgat tggtcttaac ttgcttgtca tcttgctaat 5580 ggtcatatgg ctcgtgttat tacttaagtt atttgtactc gttttgaacg taatgctaat 5640 gatcatctta tggaataata gtgaacggcc ggccaagcac gcggggatgg gatgagcttg 5700 gagcaggaag aatacactat actggatcta aagagtacaa tagatggata agaatattgg 5760 cagcgcaaaa aggcttcaag cttacacaac acggtttatt tcgaaataat atccttctcg 5820 aaagctttaa cgaacgcaga attttcgagt tattaaactt aaaatacgct gaacccgaac 5880 atagaaatat cgaatgggaa aaaaaaactg cataaaggca ttaaaagagg agcgaatttt 5940 tttttaataa aaatcttaat aatcattaaa agataaataa tagtctatat atacgtatat 6000 aaataaaaaa tattcaaaaa ataaaataaa ctattatttt agcgtaaagg atggggaaag 6060 agaaaagaaa aaaattgatc tatcgatttc aattcaattc aatagatctt tatccttgtg 6120 cttgtgcctg aactgcggta acggcaacaa ctttgacgat gtcgtcgact gaacatcccc 6180 ttgacaaatc gttgataggt ttggcaaatc cctgacatat aggaccgatg gcttcggcct 6240 ttgcgaatct ttggaccaac ttgtatccga tgtttcctgc ctggatgtct gggaagatca 6300 agacatttgc cttaccagcg actttagatc caggggcttt caaatctgcg accttcttaa 6360 ccaatgaggc gtctaactgc aattcaccgt cgatgtctaa gtcaggccta gcctccttag 6420 ccaattttgt tgcctttgta accttgtcga ctaattcatg tgaggctgat cccatggttg 6480 agaatgacaa catggctacc cttggctcga tcttgcacaa attctttgca gtctcagcag 6540 tggtaattgc gattgaagat aactcttcag cggtaggaca aacatttaca gcgcagtcag 6600 cgaataacaa aaaaccgtcc tctccatact cgcagtcagg tactgacatc aagaagactg 6660 atgagacgac agatgcacct ggtactgttt tgacaatctg caaaccaggc cttaacaagt 6720 ctcctgtagt atgtatagca ccagatacca aaccgtcagc gtcacctaac ttgaccatca 6780 ttgttgcgaa gtagattggg tccctgacga ttttgtcagc cttctccaag gtgactccct 6840 tgttttttct gatctcgtag aaagcgttgg cgtaaccggc ggtcttagaa gaagtttctg 6900 ggtcgactat ctctactccg gccaaattta ctccgaattt tgcggcgttt tccttaatga 6960 cagactctga accgaccaag attatgtcgg caataccgtc cctaataatc tcctctgaag 7020 ccctgatgtt cctctcttcc tcaccctctg ccaaaacgat tttcttcttg tcggccttgg 7080 ccaatccgaa gatattctcc atcaatttca ttgtgaaggt agttcgattt tggaggtcgc 7140 gggaggtcga aactaagttc ttggtgtttt aaaactaaaa aaaagactaa ctataaaagt 7200 agaatttaag aagtttaaga aatagattta cagaattaca atcaatacct accgtcttta 7260 tatacttatt agtcaagtag gggaataatt tcagggaact ggtttcaacc ttttttttca 7320 gctttttcca aatcagagag agcagaaggt aatagaaggt gtaagaaaat gagatagata 7380 catgcgtggg tcaattgcct tgtgtcatca tttactccag gcaggttgca tcactccatt 7440 gaggttgtgc ccgttttttg cctgtttgtg cccctgttct ctgtagttgc gctaagagaa 7500 tggacctatg aactgatggt tggtgaagaa aacaatattt tggtgctggg attctttttt 7560 tttctggatg ccagcttaaa aagcgggctc cattatattt agtggatgcc aggaataaac 7620 tgttcaccca gacacctacg atgttatata ttctgtgtaa cccgccccct attttgggca 7680 tgtacgggtt acagcagaat taaaaggcta attttttgac taaataaagt taggaaaatc 7740 actactatta attatttacg tattctttga aatggcagta ttgataatga taaactcgaa 7800 ctgaaaaagc gtgtttttta ttcaaaatga ttctaactcc cttacgtaat caaggaatct 7860 ttttgccttg gcctccgcgt cattaaactt cttgttgttg acgctaacat tcaacgctag 7920 tatatattcg tttttttcag gtaagttctt ttcaacgggt cttactgatg aggcagtcgc 7980 gtctgaaagg tccgccggcg ttggacgagc gctccatgct ggacttactc gtcgaagatt 8040 tcctgctact ctctatataa ttagacaccc atgttataga tttcagaaaa caatgtaata 8100 atatatggta gcctcctgaa actaccaagg gaaaaatctc aacaccaaga gctcatattc 8160 gttggaatag cgataatatc tctttacctc aatcttatat gcatgttatt tgctcttata 8220 attggtctct atttagggaa aaaagtcggt ttgagagctt ctcgcgatgt gaaatctcaa 8280 tttgaactgc acgccaaagc tagcccattt cacgaacacc agaaagaaga aatccccaag 8340 gatcgcatga cagagtatgc tctctcatat cgttgagtat gaatgccaat acactgatca 8400 gctttacaag aaacgtaaaa tctggcacga tggtagactg aaatactttc agttaaacaa 8460 cagattcatg ctttatacgg aaaaggataa cgttttgtta gctagtgagg cggtttaaac 8520 gcgtggccgt gccgtc 8536 <210> 49 <211> 9734 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct: i74810 integration construct <400> 49 gacggcacgg ccacgcgttt aaaccgcccg ctcgcctcat ccccacggga ataaggcagc 60 cgacaaaaga aaaacgaccg aaaaggaacc agaaagaaaa aagagggtgg gcgcgccgcg 120 gacgtgtaaa aagatatgca tccagcttct atatcgcttt aactttaccg ttttgggcat 180 cgggaacgta tgtaacattg atctcctctt gggaacggtg agtgcaacga atgcgatata 240 gcaccgacca tgtgggcaaa ttcgtaataa attcggggtg agggggattc aagacaagca 300 accttgttag tcagctcaaa cagcgattta acggttgagt aacacatcaa aacaccgttc 360 gaggtcaagc ctggcgtgtt taacaagttc ttgatatcat atataaatgt aataagaagt 420 ttggtaatat tcaattcgaa gtgttcagtc ttttacttct cttgttttat agaagaaaaa 480 acatcaagaa acatctttaa catacacaaa cacatactat cagaatacac gctcgtccaa 540 cgccggcgga cctttcagac gcgactgcct catcagtaag acccgttgaa aagaacttac 600 ctgaaaaaaa cgaatatata ctagcgttga atgttagcgt caacaacaag aagtttaatg 660 acgcggaggc caaggcaaaa agattccttg attacgtaag ggagttagaa tcattttgaa 720 taaaaaacac gctttttcag ttcgagttta tcattatcaa tactgccatt tcaaagaata 780 cgtaaataat taatagtagt gattttccta actttattta gtcaaaaaat tagcctttta 840 attctgctgt aacccgtaca tgcccaaaat agggggcggg ttacacagaa tatataacat 900 cgtaggtgtc tgggtgaaca gtttattcct ggcatccact aaatataatg gagcccgctt 960 tttaagctgg catccagaaa aaaaaagaat cccagcacca aaatattgtt ttcttcacca 1020 accatcagtt cataggtcca ttctcttagc gcaactacag agaacagggg cacaaacagg 1080 caaaaaacgg gcacaacctc aatggagtga tgcaacctgc ctggagtaaa tgatgacaca 1140 aggcaattga cccacgcatg tatctatctc attttcttac accttctatt accttctgct 1200 ctctctgatt tggaaaaagc tgaaaaaaaa ggttgaaacc agttccctga aattattccc 1260 ctacttgact aataagtata taaagacggt aggtattgat tgtaattctg taaatctatt 1320 tcttaaactt cttaaattct acttttatag ttagtctttt ttttagtttt aaaacaccaa 1380 gaacttagtt tcgacctccc gcgacctcca aaatcgaact accttcacaa tggctgattt 1440 cgattctaaa gaatacttgg agttagttga caagtggtgg cgtgccacca actacttgtc 1500 cgctggtatg attttcttga agtccaaccc attattctct gttactaata ccccaatcaa 1560 ggccgaagat gtcaaagtta aaccaattgg tcactggggt actatttccg gtcaaacttt 1620 cttatacgcc cacgctaacc gtttgattaa caagtacggt ctcaacatgt tttacgttgg 1680 tggtccaggt cacggtggtc aagtcatggt tactaacgcc tacttagacg gtgcctacac 1740 cgaagattac ccagaaatta ctcaagacat cgaaggtatg tctcatttgt tcaagcgttt 1800 ctctttccct ggtggtattg gttcccatat gaccgctcaa actccaggtt ccttgcacga 1860 aggtggtgaa ttgggttact ctttgtccca tgctttcggt gctgttttgg acaacccaga 1920 ccaagttgct tttgctgtcg ttggtgatgg tgaagctgaa actggtccat ctatggcctc 1980 ttggcattcc attaagttct taaatgccaa gaacgatggt gccgttttgc cagttttgga 2040 tttaaacggt ttcaagattt ccaatccaac cattttttct agaatgtctg atgaagaaat 2100 tactaagttc ttcgaaggtt tgggttattc ccctagattc attgaaaatg atgacattca 2160 cgactacgcc acctaccacc aattggccgc taacatctta gatcaagcca tcgaagacat 2220 tcaagctatt caaaatgacg ccagagagaa tggtaaatat caagatggtg aaattccagc 2280 ttggcctgtt attatcgcta gattgccaaa gggttggggt ggtccaaccc acgatgcttc 2340 taataatcca attgaaaact ctttcagagc tcaccaagtt ccattaccat tggaacaaca 2400 cgatttggcc accttgccag aattcgaaga ttggatgaac tcttacaagc cagaagaatt 2460 attcaacgct gatggttcct tgaaggatga gttgaaagct attgccccaa agggtgataa 2520 gagaatgtct gctaacccaa tcaccaacgg tggtgctgac agatccgact tgaaattgcc 2580 aaattggaga gaattcgcta acgacatcaa cgacgatacc agaggtaagg aattcgctga 2640 ctctaagaga aacatggata tggctacttt atccaactat ttaggtgccg tttctcaatt 2700 gaacccaacc agattcagat tcttcggtcc agatgaaacc atgtccaaca gattgtgggg 2760 tttgtttaat gttaccccac gtcaatggat ggaagaaatc aaggaaccac aagatcaatt 2820 gttgtctcca actggtcgta tcatcgattc ccaattgtct gaacaccaag ctgaaggttg 2880 gttggaaggt tacactttga ctggtagagt tggtatcttt gcctcttacg aatctttctt 2940 gagagttgtt gataccatgg tcactcaaca tttcaagtgg ttgcgtcacg cttccgaaca 3000 agcttggaga aatgactatc catccttaaa tttgatcgct acctctaccg ctttccaaca 3060 agatcataac ggttatactc accaagaccc tggtatgtta actcatttgg ccgagaagaa 3120 gtctaacttc attagagaat atttgccagc cgacggtaac tctttgttag ccgttcaaga 3180 gagagctttc tctgaaagac ataaggttaa cttattgatc gcttctaaac aaccaagaca 3240 acaatggttc actgttgaag aagctgaagt cttagctaac gaaggtttga agattatcga 3300 ttgggcttct actgctccat cttccgatgt tgatattact tttgcttctg ccggtactga 3360 accaaccatt gagactttgg ccgccttatg gttgattaat caagctttcc ctgacgttaa 3420 gtttagatac gttaacgttg ttgaattgtt aagattgcaa aagaaatctg aaccaaacat 3480 gaacgacgaa agagaattat ctgccgaaga atttaataag tacttccaag ccgacactcc 3540 agttatcttc ggtttccacg cttacgaaaa cttgattgaa tctttctttt tcgagagaaa 3600 gttcaccggt gatgtctatg ttcacggtta tagagaagat ggtgatatca ctaccaccta 3660 cgatatgaga gtctattccc acttggatcg tttccatcaa gccaaggaag ccgccgaaat 3720 cttgtctgct aacggtaaaa tcgaccaagc cgctgccgac acctttattg ctaagatgga 3780 cgacactttg gccaaacact tccaagttac tagaaatgaa ggtagagata ttgaagaatt 3840 cactgactgg acttggtctc cattgaagta agtgaattta ctttaaatct tgcatttaaa 3900 taaattttct ttttatagct ttatgactta gtttcaattt atatactatt ttaatgacat 3960 tttcgattca ttgattgaaa gctttgtgtt ttttcttgat gcgctattgc attgttcttg 4020 tctttttcgc cacatgtaat atctgtagta gatacctgat acattgtgga tgctgagtga 4080 aattttagtt aataatggag gcgctcttaa taattttggg gatattggct tatccccgcg 4140 tgcttggccg gccgtacact gagtaatggt agttataaga aagagaccga gttagggaca 4200 gttagaggcg gtggagatat tccttatggc atgtctggcg atgataaaac ttttcaaacg 4260 gcagccccga tctaaaagag ctgacaggga aatggtcaga aaaagaaacg tgcacccgcc 4320 cgtctggacg cgccgctcac ccgcacggca gagaccaatc agtaaaaatc aacggttaac 4380 gacattacta tatatataat ataggaagca tttaatagaa cagcatcgta atatatgtgt 4440 actttgcagt tatgacgcca gatggcagta gtggaagata ttctttattg aaaaatagct 4500 tgtcacctta cgtacaatct tgatccggag cttttctttt tttgccgatt aagaattcgg 4560 tcgaaaaaag aaaaggagag ggccaagagg gagggcattg gtgactattg agcacgtgag 4620 tatacgtgat taagcacaca aaggcagctt ggagtatgtc tgttattaat ttcacaggta 4680 gttctggtcc attggtgaaa gtttgcggct tgcagagcac agaggccgca gaatgtgctc 4740 tagattccga tgctgacttg ctgggtatta tatgtgtgcc caatagaaag agaacaattg 4800 acccggttat tgcaaggaaa atttcaagtc ttgtaaaagc atataaaaat agttcaggca 4860 ctccgaaata cttggttggc gtgtttcgta atcaacctaa ggaggatgtt ttggctctgg 4920 tcaatgatta cggcattgat atcgtccaac tgcatggaga tgagtcgtgg caagaatacc 4980 aagagttcct cggtttgcca gttattaaaa gactcgtatt tccaaaagac tgcaacatac 5040 tactcagtgc agcttcacag aaacctcatt cgtttattcc cttgtttgat tcagaagcag 5100 gtgggacagg tgaacttttg gattggaact cgatttctga ctgggttgga aggcaagaga 5160 gccccgaaag cttacatttt atgttagctg gtggactgac gccagaaaat gttggtgatg 5220 cgcttagatt aaatggcgtt attggtgttg atgtaagcgg aggtgtggag acaaatggtg 5280 taaaagactc taacaaaata gcaaatttcg tcaaaaatgc taagaaatag gttattactg 5340 agtagtattt atttaagtat tgtttgtgca cttgcctgca ggccttttga aaagcaagca 5400 taaaagatct aaacataaaa tctgtaaaat aacaagatgt aaagataatg ctaaatcatt 5460 tggctttttg attgattgta caggaaaata tacatcgcag ggggttgact tttaccattt 5520 caccgcaatg gaatcaaact tgttgaagag aatgttcaca ggcgcatacg ctacaatgac 5580 acggccggcc aagcacgcgg ggataagcca atatccccaa aattattaag agcgcctcca 5640 ttattaacta aaatttcact cagcatccac aatgtatcag gtatctacta cagatattac 5700 atgtggcgaa aaagacaaga acaatgcaat agcgcatcaa gaaaaaacac aaagctttca 5760 atcaatgaat cgaaaatgtc attaaaatag tatataaatt gaaactaagt cataaagcta 5820 taaaaagaaa atttatttaa atgcaagatt taaagtaaat tcacttactt caatggagac 5880 caagtccagt cagtgaattc ttcaatatct ctaccttcat ttctagtaac ttggaagtgt 5940 ttggccaaag tgtcgtccat cttagcaata aaggtgtcgg cagcggcttg gtcgatttta 6000 ccgttagcag acaagatttc ggcggcttcc ttggcttgat ggaaacgatc caagtgggaa 6060 tagactctca tatcgtaggt ggtagtgata tcaccatctt ctctataacc gtgaacatag 6120 acatcaccgg tgaactttct ctcgaaaaag aaagattcaa tcaagttttc gtaagcgtgg 6180 aaaccgaaga taactggagt gtcggcttgg aagtacttat taaattcttc ggcagataat 6240 tctctttcgt cgttcatgtt tggttcagat ttcttttgca atcttaacaa ttcaacaacg 6300 ttaacgtatc taaacttaac gtcagggaaa gcttgattaa tcaaccataa ggcggccaaa 6360 gtctcaatgg ttggttcagt accggcagaa gcaaaagtaa tatcaacatc ggaagatgga 6420 gcagtagaag cccaatcgat aatcttcaaa ccttcgttag ctaagacttc agcttcttca 6480 acagtgaacc attgttgtct tggttgttta gaagcgatca ataagttaac cttatgtctt 6540 tcagagaaag ctctctcttg aacggctaac aaagagttac cgtcggctgg caaatattct 6600 ctaatgaagt tagacttctt ctcggccaaa tgagttaaca taccagggtc ttggtgagta 6660 taaccgttat gatcttgttg gaaagcggta gaggtagcga tcaaatttaa ggatggatag 6720 tcatttctcc aagcttgttc ggaagcgtga cgcaaccact tgaaatgttg agtgaccatg 6780 gtatcaacaa ctctcaagaa agattcgtaa gaggcaaaga taccaactct accagtcaaa 6840 gtgtaacctt ccaaccaacc ttcagcttgg tgttcagaca attgggaatc gatgatacga 6900 ccagttggag acaacaattg atcttgtggt tccttgattt cttccatcca ttgacgtggg 6960 gtaacattaa acaaacccca caatctgttg gacatggttt catctggacc gaagaatctg 7020 aatctggttg ggttcaattg agaaacggca cctaaatagt tggataaagt agccatatcc 7080 atgtttctct tagagtcagc gaattcctta cctctggtat cgtcgttgat gtcgttagcg 7140 aattctctcc aatttggcaa tttcaagtcg gatctgtcag caccaccgtt ggtgattggg 7200 ttagcagaca ttctcttatc accctttggg gcaatagctt tcaactcatc cttcaaggaa 7260 ccatcagcgt tgaataattc ttctggcttg taagagttca tccaatcttc gaattctggc 7320 aaggtggcca aatcgtgttg ttccaatggt aatggaactt ggtgagctct gaaagagttt 7380 tcaattggat tattagaagc atcgtgggtt ggaccacccc aaccctttgg caatctagcg 7440 ataataacag gccaagctgg aatttcacca tcttgatatt taccattctc tctggcgtca 7500 ttttgaatag cttgaatgtc ttcgatggct tgatctaaga tgttagcggc caattggtgg 7560 taggtggcgt agtcgtgaat gtcatcattt tcaatgaatc taggggaata acccaaacct 7620 tcgaagaact tagtaatttc ttcatcagac attctagaaa aaatggttgg attggaaatc 7680 ttgaaaccgt ttaaatccaa aactggcaaa acggcaccat cgttcttggc atttaagaac 7740 ttaatggaat gccaagaggc catagatgga ccagtttcag cttcaccatc accaacgaca 7800 gcaaaagcaa cttggtctgg gttgtccaaa acagcaccga aagcatggga caaagagtaa 7860 cccaattcac caccttcgtg caaggaacct ggagtttgag cggtcatatg ggaaccaata 7920 ccaccaggga aagagaaacg cttgaacaaa tgagacatac cttcgatgtc ttgagtaatt 7980 tctgggtaat cttcggtgta ggcaccgtct aagtaggcgt tagtaaccat gacttgacca 8040 ccgtgacctg gaccaccaac gtaaaacatg ttgagaccgt acttgttaat caaacggtta 8100 gcgtgggcgt ataagaaagt ttgaccggaa atagtacccc agtgaccaat tggtttaact 8160 ttgacatctt cggccttgat tggggtatta gtaacagaga ataatgggtt ggacttcaag 8220 aaaatcatac cagcggacaa gtagttggtg gcacgccacc acttgtcaac taactccaag 8280 tattctttag aatcgaaatc agccattgtg aaggtagttc gattttggag gtcgcgggag 8340 gtcgaaacta agttcttggt gttttaaaac taaaaaaaag actaactata aaagtagaat 8400 ttaagaagtt taagaaatag atttacagaa ttacaatcaa tacctaccgt ctttatatac 8460 ttattagtca agtaggggaa taatttcagg gaactggttt caaccttttt tttcagcttt 8520 ttccaaatca gagagagcag aaggtaatag aaggtgtaag aaaatgagat agatacatgc 8580 gtgggtcaat tgccttgtgt catcatttac tccaggcagg ttgcatcact ccattgaggt 8640 tgtgcccgtt ttttgcctgt ttgtgcccct gttctctgta gttgcgctaa gagaatggac 8700 ctatgaactg atggttggtg aagaaaacaa tattttggtg ctgggattct ttttttttct 8760 ggatgccagc ttaaaaagcg ggctccatta tatttagtgg atgccaggaa taaactgttc 8820 acccagacac ctacgatgtt atatattctg tgtaacccgc cccctatttt gggcatgtac 8880 gggttacagc agaattaaaa ggctaatttt ttgactaaat aaagttagga aaatcactac 8940 tattaattat ttacgtattc tttgaaatgg cagtattgat aatgataaac tcgaactgaa 9000 aaagcgtgtt ttttattcaa aatgattcta actcccttac gtaatcaagg aatctttttg 9060 ccttggcctc cgcgtcatta aacttcttgt tgttgacgct aacattcaac gctagtatat 9120 attcgttttt ttcaggtaag ttcttttcaa cgggtcttac tgatgaggca gtcgcgtctg 9180 aaaggtccgc cggcgttgga cgagcgtgta ccaacctgca tttctttccg tcatatacac 9240 aaaatacttt catataaact tacttggtct tacgtcataa ataaatatgt atacatataa 9300 attaaaaaat ttggttttat atttttacaa aaagaatcgt ttacttcatt tctccctttt 9360 aagcgataca atccatgaaa aaagagaaaa agagagaaca ggcttgtgcc ttctttaaaa 9420 catcccacac aaaatcatat tgaattgaat tttacatctt aagctagtgt acaacaactg 9480 ctatatccaa agaaaactaa cgtggaccgc ttttagagtt gagaaaaagg tttgaaaaaa 9540 atagcaatac aaagacttgt ttcatatata aaatacaggg agcacattga gctaatataa 9600 cataaacact gcgaaccaat tccaatcaaa aggtacacat gagagcattc ccccgagtac 9660 tgccatttcg ccatcagaga tcatataata acatccttct tcgaacggcg gtttaaacgc 9720 gtggccgtgc cgtc 9734 <210> 50 <211> 7980 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct: i76221 integration construct <400> 50 gacggcacgg ccacgcgttt aaaccgccgc acgtgtatgt acggctgtgt aaatatgata 60 atcatctcgg acgaacggcg tagtactctc catcccctaa aaatgttcac gtgtgactgc 120 tccatttcgc cggatgtcga gatgaccccc ccccctcaaa aggcactcac ctgctgacat 180 gccgtggcaa atgattgggg tcatcctttt tttctgttat ctctaagatc caaagaaaag 240 taaaaaaaaa aggttggggt acgaattgcc gccgagcctc cgatgccatt attcaatggg 300 tattgcagtt ggggtatagt tcctcggtgg caaatagttc tcccttcatt ttgtatataa 360 actgggcggc tattctaagc atatttctcc cttaggttat ctggtagtac gttatatctt 420 gttcttatat tttctatcta taagcaaaac caaacatatc aaaactacta gaaagacatt 480 gccccactgt gttcgctcgt ccaacgccgg cggacctttc agacgcgact gcctcatcag 540 taagacccgt tgaaaagaac ttacctgaaa aaaacgaata tatactagcg ttgaatgtta 600 gcgtcaacaa caagaagttt aatgacgcgg aggccaaggc aaaaagattc cttgattacg 660 taagggagtt agaatcattt tgaataaaaa acacgctttt tcagttcgag tttatcatta 720 tcaatactgc catttcaaag aatacgtaaa taattaatag tagtgatttt cctaacttta 780 tttagtcaaa aaattagcct tttaattctg ctgtaacccg tacatgccca aaataggggg 840 cgggttacac agaatatata acatcgtagg tgtctgggtg aacagtttat tcctggcatc 900 cactaaatat aatggagccc gctttttaag ctggcatcca gaaaaaaaaa gaatcccagc 960 accaaaatat tgttttcttc accaaccatc agttcatagg tccattctct tagcgcaact 1020 acagagaaca ggggcacaaa caggcaaaaa acgggcacaa cctcaatgga gtgatgcaac 1080 ctgcctggag taaatgatga cacaaggcaa ttgacccacg catgtatcta tctcattttc 1140 ttacaccttc tattaccttc tgctctctct gatttggaaa aagctgaaaa aaaaggttga 1200 aaccagttcc ctgaaattat tcccctactt gactaataag tatataaaga cggtaggtat 1260 tgattgtaat tctgtaaatc tatttcttaa acttcttaaa ttctactttt atagttagtc 1320 ttttttttag ttttaaaaca ccaagaactt agtttcgacc tcccgcgacc tccaaaatcg 1380 aactaccttc acaatggaac attctgtaat cgaaccaact gtgcccatgc cgctaccagc 1440 catgtttgac gctccatctg gtatttttag ctctttggac gacgctgtgc aagcagccac 1500 cttagcccaa caacaactaa gttcagttga gttgcgtcag caagtaatca aagccataag 1560 agtggccgga gaaaggtatg cacaagtttt ggctgaaatg gcagttgctg aaactggtat 1620 gggtagggtg gtggataagt acattaagaa tgtctctcaa gctcgtcata cgcctggtat 1680 agaatgttta tcggccgagg ttcttacggg tgataatggc ctaacattga ttgaaaatgc 1740 cccttgggga gtcgtagctt cagtcacgcc aagcacaaat ccagcagcta cggtaattaa 1800 taatgcaatc tcaatgattg cagcggggaa ttcagtcgtg ttcgcaccac atccttctgc 1860 caaaaacgtc tcactaagga ctatttcttt actcaacaag gccattgtcg ctaccggcgg 1920 cccagaaaat ttactagtta gtgtggcaaa ccctaacatc gaaactgcac agagattatt 1980 cagatatccg ggtattggat tgttagttgt gacaggtggt gaagccgtcg ttgaagccgc 2040 taggaagcat acagataaaa ggttaattgc agccggcgct ggtaatcctc ctgttgttgt 2100 ggacgaaact gctgacatac ctaaagccgc aagagcaatt gtcaagggtg cttctttcga 2160 caacaacata atttgtgctg atgaaaaagt tttgattgtg gtagacagag ttgcagatgc 2220 actattggca gaaatgcaaa gaaataacgc cgtcttactt acacccgaac agaccgaaag 2280 actactaccc gctcttttgt ccgatattga cgaacagggc aaaggacgtg tgaatagaga 2340 ttatgttgga agagatgcgg ctaaattagc agcggctatt ggtctggaag ttagcgaaca 2400 tactcgtcta ctcctggcag agacagacgc tgatcatcca ttcgccgtga cggagctgat 2460 gatgccagtg ttaccagtaa taagagtcaa gaatgtagat gatgcaatcg cattggcagt 2520 taagctagag tcaggctgca gacacacagc tgcgatgcac tctactaata taagaaactt 2580 aaatagaatg gctaatgcca tcaatacctc tatctttgta aaaaatggtc catgtattgc 2640 aggtttgggt ttaggcggtg aaggttggac ttcaatgact attagcactc cgaccggtga 2700 aggtgttaca agcgctcgta cctttgtcag attaagaagg tgtgtcttag tcgacatgtt 2760 tcggattgct taagcggccg cgagtaataa ttattgcttc catataatat ttttatatac 2820 ctcttatttt tatgtattag ttaattaagt atttttatct atctgcttat cattttcttt 2880 tcatataggg ggggttggtg ttttcttgcc catcagattg atgtcctcca actcggcact 2940 attttacaaa gggttttttt gtaagagaag gagaagacag atactaaacc atacgttact 3000 cgaaacaaaa aaaaaaaaaa tggaaaaagc tgctatcaac aaaagacggc ctcatcaaac 3060 ctaaagaaac catgtcagcg tatgtatata ccttgtaatt tacgtttcct taaatcttct 3120 ttctactaac gttttcatta ttctatactc tatgaccaat aaaaacagac tgtactttca 3180 aaatttaccc agtaggccag caaataaaga aaattatacc agattacttc tgaaacacat 3240 taatcccaac aacaagtatg ccattaatcc gtcgctaccc catccccgcg tgcttggccg 3300 gccgtttctc gacgtgggcc tttttcttgc catatggatc cgctgcacgg tcctgttccc 3360 tagcatgtac gtgagcgtat ttccttttaa accacgacgc tttgtcttca ttcaacgttt 3420 cccattgttt ttttctacta ttgctttgct gtgggaaaaa cttatcgaaa gatgacgact 3480 ttttcttaat tctcgtttta agagcttggt gagcgctagg agtcactgcc aggtatcgtt 3540 tgaacacggc attagtcagg gaagtcataa cacagtcctt tcccgcaatt ttctttttct 3600 attactcttg gcctcctcta gtacactcta tattttttta tgcctcggta atgattttca 3660 tttttttttt tccacctagc ggatgactct ttttttttct tagcgattgg cattatcaca 3720 taatgaatta tacattatat aaagtaatgt gatttcttcg aagaatatac taaaaaatga 3780 gcaggcaaga taaacgaagg caaagatgac agagcagaaa gccctagtaa agcgtattac 3840 aaatgaaacc aagattcaga ttgcgatctc tttaaagggt ggtcccctag cgatagagca 3900 ctcgatcttc ccagaaaaag aggcagaagc agtagcagaa caggccacac aatcgcaagt 3960 gattaacgtc cacacaggta tagggtttct ggaccatatg atacatgctc tggccaagca 4020 ttccggctgg tcgctaatcg ttgagtgcat tggtgactta cacatagacg accatcacac 4080 cactgaagac tgcgggattg ctctcggtca agcttttaaa gaggccctag gggccgtgcg 4140 tggagtaaaa aggtttggat caggatttgc gcctttggat gaggcacttt ccagagcggt 4200 ggtagatctt tcgaacaggc cgtacgcagt tgtcgaactt ggtttgcaaa gggagaaagt 4260 aggagatctc tcttgcgaga tgatcccgca ttttcttgaa agctttgcag aggctagcag 4320 aattaccctc cacgttgatt gtctgcgagg caagaatgat catcaccgta gtgagagtgc 4380 gttcaaggct cttgcggttg ccataagaga agccacctcg cccaatggta ccaacgatgt 4440 tccctccacc aaaggtgttc ttatgtagtg acaccgatta tttaaagctg cagcatacga 4500 tatatataca tgtgtatata tgtataccta tgaatgtcag taagtatgta tacgaacagt 4560 atgatactga agatgacaag gtaatgcatc attctatacg tgtcattctg aacgaggcgc 4620 gctttccttt tttctttttg ctttttcttt ttttttctct tgaactcgac ggccggccaa 4680 gcacgcgggg atggggtagc gacggattaa tggcatactt gttgttggga ttaatgtgtt 4740 tcagaagtaa tctggtataa ttttctttat ttgctggcct actgggtaaa ttttgaaagt 4800 acagtctgtt tttattggtc atagagtata gaataatgaa aacgttagta gaaagaagat 4860 ttaaggaaac gtaaattaca aggtatatac atacgctgac atggtttctt taggtttgat 4920 gaggccgtct tttgttgata gcagcttttt ccattttttt tttttttgtt tcgagtaacg 4980 tatggtttag tatctgtctt ctccttctct tacaaaaaaa ccctttgtaa aatagtgccg 5040 agttggagga catcaatctg atgggcaaga aaacaccaac cccccctata tgaaaagaaa 5100 atgataagca gatagataaa aatacttaat taactaatac ataaaaataa gaggtatata 5160 aaaatattat atggaagcaa taattattac tcgcggccgc ttaagcaatc cgaaacatgt 5220 cgactaagac acaccttctt aatctgacaa aggtacgagc gcttgtaaca ccttcaccgg 5280 tcggagtgct aatagtcatt gaagtccaac cttcaccgcc taaacccaaa cctgcaatac 5340 atggaccatt ttttacaaag atagaggtat tgatggcatt agccattcta tttaagtttc 5400 ttatattagt agagtgcatc gcagctgtgt gtctgcagcc tgactctagc ttaactgcca 5460 atgcgattgc atcatctaca ttcttgactc ttattactgg taacactggc atcatcagct 5520 ccgtcacggc gaatggatga tcagcgtctg tctctgccag gagtagacga gtatgttcgc 5580 taacttccag accaatagcc gctgctaatt tagccgcatc tcttccaaca taatctctat 5640 tcacacgtcc tttgccctgt tcgtcaatat cggacaaaag agcgggtagt agtctttcgg 5700 tctgttcggg tgtaagtaag acggcgttat ttctttgcat ttctgccaat agtgcatctg 5760 caactctgtc taccacaatc aaaacttttt catcagcaca aattatgttg ttgtcgaaag 5820 aagcaccctt gacaattgct cttgcggctt taggtatgtc agcagtttcg tccacaacaa 5880 caggaggatt accagcgccg gctgcaatta accttttatc tgtatgcttc ctagcggctt 5940 caacgacggc ttcaccacct gtcacaacta acaatccaat acccggatat ctgaataatc 6000 tctgtgcagt ttcgatgtta gggtttgcca cactaactag taaattttct gggccgccgg 6060 tagcgacaat ggccttgttg agtaaagaaa tagtccttag tgagacgttt ttggcagaag 6120 gatgtggtgc gaacacgact gaattccccg ctgcaatcat tgagattgca ttattaatta 6180 ccgtagctgc tggatttgtg cttggcgtga ctgaagctac gactccccaa ggggcatttt 6240 caatcaatgt taggccatta tcacccgtaa gaacctcggc cgataaacat tctataccag 6300 gcgtatgacg agcttgagag acattcttaa tgtacttatc caccacccta cccataccag 6360 tttcagcaac tgccatttca gccaaaactt gtgcatacct ttctccggcc actcttatgg 6420 ctttgattac ttgctgacgc aactcaactg aacttagttg ttgttgggct aaggtggctg 6480 cttgcacagc gtcgtccaaa gagctaaaaa taccagatgg agcgtcaaac atggctggta 6540 gcggcatggg cacagttggt tcgattacag aatgttccat tgtgaaggta gttcgatttt 6600 ggaggtcgcg ggaggtcgaa actaagttct tggtgtttta aaactaaaaa aaagactaac 6660 tataaaagta gaatttaaga agtttaagaa atagatttac agaattacaa tcaataccta 6720 ccgtctttat atacttatta gtcaagtagg ggaataattt cagggaactg gtttcaacct 6780 tttttttcag ctttttccaa atcagagaga gcagaaggta atagaaggtg taagaaaatg 6840 agatagatac atgcgtgggt caattgcctt gtgtcatcat ttactccagg caggttgcat 6900 cactccattg aggttgtgcc cgttttttgc ctgtttgtgc ccctgttctc tgtagttgcg 6960 ctaagagaat ggacctatga actgatggtt ggtgaagaaa acaatatttt ggtgctggga 7020 ttcttttttt ttctggatgc cagcttaaaa agcgggctcc attatattta gtggatgcca 7080 ggaataaact gttcacccag acacctacga tgttatatat tctgtgtaac ccgcccccta 7140 ttttgggcat gtacgggtta cagcagaatt aaaaggctaa ttttttgact aaataaagtt 7200 aggaaaatca ctactattaa ttatttacgt attctttgaa atggcagtat tgataatgat 7260 aaactcgaac tgaaaaagcg tgttttttat tcaaaatgat tctaactccc ttacgtaatc 7320 aaggaatctt tttgccttgg cctccgcgtc attaaacttc ttgttgttga cgctaacatt 7380 caacgctagt atatattcgt ttttttcagg taagttcttt tcaacgggtc ttactgatga 7440 ggcagtcgcg tctgaaaggt ccgccggcgt tggacgagcg tgatgatttc tttccttttt 7500 atattgacga cttttttttt ttcgtgtgtt tttgttctct tataaccgag ctgcttactt 7560 attattattt caccttctct ttttatttat acttataatt atttattctt tacatactgt 7620 tacaagaaac tcttttctac attaattgca taaagtgtca atcagcacat cctctatatc 7680 gctatcaaca acaaatttga caaacctgcc tatatcttca ggaacaactg ccgcatcgct 7740 accaccacta cttgtgaagt ccctggagtt taatatgcac tgaaatttac ctagccgttt 7800 tacacaagac cataatccat ccatgctatc gcagtatatg attttgtgtt cgtttttcgt 7860 cttgcgaaag gcatcctcaa tggcttgttt cattgatcca tcagtgtggc tcgtaggtac 7920 cagcaaaacc acttcatcag cggcgtactc ctggcggttt aaacgcgtgg ccgtgccgtc 7980 <210> 51 <211> 13266 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct: i84022 integration construct <400> 51 gacggcacgg ccacgcgttt aaaccgccaa gtgatgtaac taaatacacg attaccatgg 60 aaattaacgt accttttttg tgcgtgtatt gaaatattat gacatattac agaaagggtt 120 cgcaagtcct gtttctatgc ctttctctta gtaattcacg aaataaacct atggtttacg 180 aaatgatcca cgaaaatcat gttattattt acatcaacat atcgcgaaaa ttcatgtcat 240 gtccacatta acatcattgc agagcaacaa ttcattttca tagagaaatt tgctactatc 300 acccactagt actaccattg gtacctacta ctttgaattg tactaccgct gggcgttatt 360 aggtgtgaaa ccacgaaaag ttcaccataa cttcgaataa agtcgcggaa aaaagtaaac 420 agctattgct actcaaatga ggtttgcaga agcttgttga agcatgatga agcgttctaa 480 acgcactatt catcattaaa tatttaaagc tcataaaatt gtattcaatt cctattctaa 540 atggctttta tttctattac aactattagc tctaaatcca tatcctcata agcagcaatc 600 aattctatct atactttaaa cgctcgtcca acgccggcgg acctgatgtg tattactagt 660 gtcgacgaca gcattcgccc agtatttttt ttattctaca aaccttctat aatttcaaag 720 tatttacata attctgtatc agtttaatca ccataatatc gttttctttg tttagtgcaa 780 ttaatttttc ctattgttac ttcgggcctt tttctgtttt atgagctatt ttttccgtca 840 tccttccgga tccagatttt cagcttcatc tccagattgt gtctacgtaa tgcacgccat 900 cattttaaga gaggacctcc cgcgacctcc aaaatcgaac taccttcaca atgaaacttc 960 ttagtagtat tgagcaggcg tgtgacatct gtagattgaa gaaattgaaa tgtagtaagg 1020 agaagcccaa atgtgcgaaa tgccttaaaa ataattggga atgcagatat agtccgaaga 1080 cgaagcgcag tccccttacc cgcgcgcacc ttacggaggt cgagagtcgc cttgagcgcc 1140 ttgagcaact tttccttctt atcttcccca gagaggattt ggatatgatc cttaagatgg 1200 acagtcttca agacattaag gcgcttctta cggggctttt cgtgcaggac aacgtcaaca 1260 aggacgcggt gacggaccgc cttgccagtg tcgaaaccga catgcccctt acgcttcgcc 1320 aacaccgcat ttccgccacg agtagtagtg aggaatcctc caataagggg cagcgccaac 1380 ttaccgtgag tatcgatagt gcggcccacc acgacaatag tacgatcccc cttgacttca 1440 tgccgcgcga cgccttgcac gggttcgact ggagtgagga agacgatatg agtgacggtc 1500 ttccgtttct taagaccgat ccgaataaca acggtttttt cggtgatggg agtttgcttt 1560 gcatcttgag aagtatcggt ttcaagcccg agaactatac caatagtaat gtcaatcgct 1620 tgcccacgat gatcaccgac cgctataccc ttgccagtcg cagtacgacg agtagacttt 1680 tgcagtccta cttgaacaac ttccatccgt attgtcccat tgtccatagt cccaccctta 1740 tgatgcttta caacaatcaa atcgagattg ccagtaaaga ccagtggcag attttgttca 1800 attgtattct tgcgatcggg gcgtggtgca ttgaaggtga gagtaccgac attgacgtct 1860 tctattacca gaacgccaag agtcacctta cctccaaagt gtttgaaagt gggagtatta 1920 tccttgtcac ggcgcttcac ttgcttagta gatacacgca atggcgccaa aagacgaaca 1980 cctcctacaa cttccattcc ttcagtattc gcatggcgat tagtcttggt cttaaccgcg 2040 atttgccgag tagtttttcc gactcctcca tccttgagca gcgcagaaga atctggtgga 2100 gtgtgtatag ttgggaaatt cagcttagtc ttttgtacgg gagaagtatt caattgagtc 2160 aaaacacgat tagttttccc agtagtgtgg atgacgtcca aagaacgacg acggggccga 2220 cgatttacca cggtattatc gagacggcgc gcttgcttca ggtctttacg aagatttacg 2280 agcttgataa gacggtgacc gcggagaagt cccccatttg cgcgaagaag tgtcttatga 2340 tctgcaacga aatcgaagaa gtcagtcgcc aagcgccgaa attccttcag atggacatca 2400 gtacgacggc ccttacgaac cttcttaaag agcatccctg gcttagtttc acgcgctttg 2460 agcttaaatg gaagcaactt agtttgatta tctacgtgct tcgcgacttc tttaccaact 2520 tcacgcaaaa gaaaagtcag cttgagcaag accagaacga ccaccagtcc tacgaggtca 2580 agagatgtag tattatgctt tccgacgcgg cgcagcgcac cgtcatgagt gtgtcctcct 2640 acatggataa ccacaacgtg acgccgtact tcgcgtggaa ctgcagttac tatcttttta 2700 acgcggtgct tgtgccgatt aaaacccttt tgagtaatag taagagtaac gccgaaaaca 2760 atgaaacggc gcagcttctt cagcagatca ataccgtcct tatgcttctt aagaagcttg 2820 cgaccttcaa gattcaaacc tgcgagaagt atatccaggt gcttgaggaa gtgtgcgccc 2880 ccttccttct tagtcaatgc gcgattccgc ttccccacat ttcctacaat aactccaacg 2940 ggtccgcgat caagaacatc gtggggagtg cgaccattgc gcagtatccc accttgcccg 3000 aagagaacgt gaataacatt tccgtcaagt acgtcagtcc cggtagtgtg ggtcccagtc 3060 ccgtcccgct taagagtggg gcgtcctttt ccgaccttgt gaaacttctt agtaatagac 3120 cgccgagtag aaatagtccg gtcacgattc cgcgctccac gcccagtcac agaagtgtga 3180 cccccttcct tggtcagcaa cagcaacttc agagtcttgt cccgcttacg cccagtgccc 3240 ttttcggggg tgcgaacttc aaccagtccg gtaacatcgc cgactccagt cttagtttta 3300 cctttaccaa ttcctccaat gggcccaatt tgattacgac ccagacgaac agtcaggcct 3360 tgagtcagcc gatcgcgagt agtaatgtcc acgacaattt tatgaacaac gagattaccg 3420 cctccaagat cgacgacggg aacaacagta agccgcttag tcccgggtgg accgatcaga 3480 ccgcctacaa tgccttcggg attaccacgg gtatgttcaa cacgaccacg atggacgacg 3540 tgtacaatta cctttttgac gacgaggaca cgccgccgaa tccgaagaag gaatgagcca 3600 attggtgcgg caattgataa taacgaaaat gtcttttaat gatctgggta taatgaggaa 3660 ttttccgaac gtttttactt tatatatata tatacatgta acatatattc tatacgctat 3720 atcgagaaaa cgcgatggtg gggtgacttt caactcggcg tatccccgcg tgcttggccg 3780 gccgtagtta tgacaattac aacaacagaa ttctttctat atatgcacga acttgtaata 3840 tggaagaaat tatgacgtac aaactataaa gtaaatattt tacgtaacac atggtgctgt 3900 tgtgcttctt tttcaagaga ataccaatga cgtatgacta agtttatgta ttttccaaaa 3960 cctgtttagc cctggcgaca gatacgtctc cggcttcaac gatgaccctg gtgaccctgt 4020 caatgtcggc tccggtggca ccggccatga ttgcgatgtt ccttgcgtgt aaggtcatgt 4080 gtcccctttg gattccctcg gttgccaagg ccctaattgc ggccatattc tgagccaaac 4140 caacggcggc agtaacctgg gccaactcag tagcggtttc gacctgcatt aaggccaaag 4200 cggccctagc tgtagggtga gtcttggtgg ctcctcctac caaacccaag gccaaaggca 4260 attcaatggt accgaccaac ctaccgtcgt tggccaactc ccaccttgtc aaagaggtgt 4320 aatgtccggt cctggcggcg taggcgtggg ctccagcttc gatggccctc cagtcgttac 4380 ctgttgcgac gacgactggg tcaattccgt tcataattcc cttgttatgg gttgcggccc 4440 tgtaagggtc gactattgct aaggcgcagg cttcaaccat tccccttgca acgtcggcac 4500 catcgtatcc ctgggtggtc aaagtctcag gggctaactc aaccctggct cttaccaacc 4560 tcaagtcggc caagttagac aaaatcctca acctgacggt tccaccagcg atcctctcta 4620 cctctggagc taacctttca gccatggtgt taactgtgtt ggcacccatg gcgtctctga 4680 catcaacaat caagtgcaat acgaccattg caccaacagg ggtgtcccta aaaacatgga 4740 cctcaatgtc tctgcaacca ccacctaaac caaccaaaac tggatctacg gcatctgctg 4800 cttccatgaa agcagcctta tgggccaaca acctttgcct agctccttct gggtctccta 4860 atccgacaac ttggatttgg gccctcatta aaggtgcagt tccgtgtgcg gtgaatccac 4920 cgttctctct agctatcctt gccatatatg aggctgcggc aacaacagat ggttcctcga 4980 ctgccatagg tattaagtag tcccttccgt tgacggtgaa gttggtggcg acacccaatg 5040 gcaactcaaa ttttccgata acattctcga tcataccgtt ggccaatgac aaaggcaaag 5100 caccgttacc ggccaatgca gaaatggctt caggttccaa tcctgcggct tcggcaaccc 5160 taactaacct ctgagcagga tccaagtccc tcatcttctc gatccttgag ttcaatccgt 5220 cgatgtgacc tgtctttcca gtcattgtaa agttagttgg ttgcgcgact tcgggtgggg 5280 taagtataga ggtatattaa caattttttg ttgatacttt tatgacattt gaataagaag 5340 taatacaaac cgaaaatgtt gaaagtatta gttaaagtgg ttatgcagct tttgcattta 5400 tatatctgtt aatagatcaa aaatcatcgc ttcgctgatt aattacccca gaaataaggc 5460 taaaaaacta atcgcattat tatcctatgg ttgttaattt gattcgttga tttgaaggtt 5520 tgtggggcca ggttactgcc aatttttcct cttcataacc ataaaagcta gtattgtaga 5580 atctttattg ttcggagcag tgcggcgcga ggcacatctg cgtttcagga acgcgaccgg 5640 tgaagaccag gacgcacgga ggagagtctt ccgtcggagg gctgtcgccc gctcggcggc 5700 ttctaatccg tacttcaata tagcaatgag cagttaagcg tattactgaa agttccaaag 5760 agaaggtttt tttaggctaa gataatgggg ctctttacat ttccacaaca tataagtaag 5820 attagatatg gatatgtata tggtggtatt gccatgtaat atgattatta aacttctttg 5880 cgtccatcca aaaaaaaagt aacgcacgca cactcccgac agacaactag cttgataatg 5940 tctcagaacg tttacattgt atcgactgcc agaaccccaa ttggttcatt ccagggttct 6000 ctatcctcca agacagcagt ggaattgggt gctgttgctt taaaaggcgc cttggctaag 6060 gttccagaat tggatgcatc caaggatttt gacgaaatta tttttggtaa cgttctttct 6120 gccaatttgg gccaagctcc ggccagacaa gttgctttgg ctgccggttt gagtaatcat 6180 atcgttgcaa gcacagttaa caaggtctgt gcatccgcta tgaaggcaat cattttgggt 6240 gctcaatcca tcaaatgtgg taatgctgat gttgtcgtag ctggtggttg tgaatctatg 6300 actaacgcac catactacat gccagcagcc cgtgcgggtg ccaaatttgg ccaaactgtt 6360 cttgttgatg gtgtcgaaag agatgggttg aacgatgcgt acgatggtct agccatgggt 6420 gtacacgcag aaaagtgtgc ccgtgattgg gatattacta gagaacaaca agacaatttt 6480 gccatcgaat cctaccaaaa atctcaaaaa tctcaaaagg aaggtaaatt cgacaatgaa 6540 attgtacctg ttaccattaa gggatttaga ggtaagcctg atactcaagt cacgaaggac 6600 gaggaacctg ctagattaca cgttgaaaaa ttgagatctg caaggactgt tttccaaaaa 6660 gaaaacggta ctgttactgc cgctaacgct tctccaatca acgatggtgc tgcagccgtc 6720 atcttggttt ccgaaaaagt tttgaaggaa aagaatttga agcctttggc tattatcaaa 6780 ggttggggtg aggccgctca tcaaccagct gattttacat gggctccatc tcttgcagtt 6840 ccaaaggctt tgaaacatgc tggcatcgaa gacatcaatt ctgttgatta ctttgaattc 6900 aatgaagcct tttcggttgt cggtttggtg aacactaaga ttttgaagct agacccatct 6960 aaggttaatg tatatggtgg tgctgttgct ctaggtcacc cattgggttg ttctggtgct 7020 agagtggttg ttacactgct atccatctta cagcaagaag gaggtaagat cggtgttgcc 7080 gccatttgta atggtggtgg tggtgcttcc tctattgtca ttgaaaagat atgattacgt 7140 tctgcgattt tctcatgatc tttttcataa aatacataaa tatataaatg gctttatgta 7200 taacaggcat aatttaaagt tttatttgcg attcatcgtt tttcaggtac tcaaacgctg 7260 aggtgtgcct tttgacttac ttttccgcct tggcaagctg gccgaacctg caggccgcga 7320 gcgccgatac gaaaatcgtt attgtcttga aggtgaaatt tctactctta ttaatggtga 7380 acgttaagct gatgctatga tggaagctga ttggtcttaa cttgcttgtc atcttgctaa 7440 tggtcattgg ctcgtgttat tacttaagtt atttgtactc gttttgaacg taatgctaat 7500 gatcatctta tggaataata gtgagtggtt tcagggtcca taaagctttt caattcatct 7560 tttttttttt tgttcttttt tttgattccg gtttctttga aatttttttg attcggtaat 7620 ctccgagcag aaggaagaac gaaggaagga gcacagactt agattggtat atatacgcat 7680 atgtggtgtt gaagaaacat gaaattgccc agtattctta acccaactgc acagaacaaa 7740 aacctgcagg aaacgaagat aaatcatgtc gaaagctaca tataaggaac gtgctgctac 7800 tcatcctagt cctgttgctg ccaagctatt taatatcatg cacgaaaagc aaacaaactt 7860 gtgtgcttca ttggatgttc gtaccaccaa ggaattactg gagttagttg aagcattagg 7920 tcccaaaatt tgtttactaa aaacacatgt ggatatcttg actgattttt ccatggaggg 7980 cacagttaag ccgctaaagg cattatccgc caagtacaat tttttactct tcgaagacag 8040 aaaatttgct gacattggta atacagtcaa attgcagtac tctgcgggtg tatacagaat 8100 agcagaatgg gcagacatta cgaatgcaca cggtgtggtg ggcccaggta ttgttagcgg 8160 tttgaagcag gcggcggaag aagtaacaaa ggaacctaga ggccttttga tgttagcaga 8220 attgtcatgc aagggctccc tagctactgg agaatatact aagggtactg ttgacattgc 8280 gaagagtgac aaagattttg ttatcggctt tattgctcaa agagacatgg gtggaagaga 8340 tgaaggttac gattggttga ttatgacacc cggtgtgggt ttagatgaca agggagacgc 8400 attgggtcaa cagtatagaa ccgtggatga tgtggtctct acaggatctg acattattat 8460 tgttggaaga ggactatttg caaagggaag ggatgctaag gtagagggtg aacgttacag 8520 aaaagcaggc tgggaagcat atttgagaag atgcggccag caaaactaaa aaactgtatt 8580 ataagtaaat gcatgtatac taaactcaca aattagagct tcaatttaat tatatcagtt 8640 attaccacga aaatcgttat tgtcttgaag gtgaaatttc tactcttatt aatggtgaac 8700 gttaagctga tgctatgatg gaagctgatt ggtcttaact tgcttgtcat cttgctaatg 8760 gtcatatggc tcgtgttatt acttaagtta tttgtactcg ttttgaacgt aatgctaatg 8820 atcatcttat ggaataatag tgaacggccg gccaagcacg cggggattga atgagaaaaa 8880 aaatcggttg ggcttaactt taaagaaaaa agttgagatt agatttattg tgttataaat 8940 atagatatac aattctttat aaaaaaaata tatatatata tcattgttat taaataaaga 9000 gttttcctag tatatagatt aaaaaactac tctattaaat gagagctaaa aaaagcaggc 9060 tgccaaaaaa ataaagcatt tatgaagggg gttcagcaag atgcaatcga tgggggaaga 9120 ttatttttta acatcgtaag atcttctaaa tttgtcatcg atgttggtca agtagtaaac 9180 accactttgc aaatgctcaa tggaaccttg aggtttgaag ttcttcttca aatgggcatt 9240 ttctctcaat tcgatggcag cttcgtaatc ctttggagtt tcggtgattc tcttggctaa 9300 tttgttagta atatctaatt ccttgataat atgttggacg tcaccaacaa ttttgcaaga 9360 atatagagat gcagctaaac cggaaccgta agaaaataaa ccaacacgct tgccttgtaa 9420 gtcgtcagat ccaacatagt ttaatagaga tgcaaaggcg gcataaacag atgcggtgta 9480 catgttacct gtgtttgttg gaacaatcaa agattgggca actctctctt tgtggaatgg 9540 cttagcaaca ttaacaaaag ttttttcaat gttcttatcg gttaaagatt cgtcataatc 9600 gcgagtagct aattcggcgt caacttctgg gaacaattga ggattggctc tgaaatcgtt 9660 atatagtaat ctaccgtatg attttgtgac caatttacag gttggaacat ggaaaacgtt 9720 gtagtcgaaa tatttcaaaa cgttcaaagc atccgaacca gcgggatcgc taaccaaccc 9780 tttagaaata gccttcttgg aataactctt gtaaacttga tcaagagcct tgacgtaaca 9840 agttaatgaa aaatgaccat cgacgtaagg atattcgctg gtgaaatctg gcttgtaaaa 9900 atcgtaggcg tgttccatgt aagaagctct tacagagtca aatacaattg gagcatcagg 9960 accgatccac atagcaacag taccggcacc accggttggt cttgcggcac ccttatcgta 10020 gatggcaata tcaccgcaaa ctacaatggc gtctctacca tcccatgcgt tagattcaat 10080 ccagttcaaa gagttgaaca acgcgttggt accaccgtaa caggcattaa gcgtgtcaat 10140 accttcgacg tcagtgtttt caccaaacaa ttgcatcaag acagacttga cagacttgga 10200 cttgtcaatc agagtttcag taccgacttc taatctacca attttgttgg tgtcgatgtt 10260 gtaactcttg atcaacttag acaaaacagt tagggacatc gagtagatat cttctctgtc 10320 attgacaaaa gacatgttgg tttggcccag accaattgtg tatttacctt gagaaacgcc 10380 atcaaatttc tctagctcag attggttgac acattgagtt gggatgtaaa tttggatacc 10440 tttaataccg acattttgag gtctggtttt ttgttcagcg gtcttttgtt tttttagttc 10500 agtcatttgc aagtttgtat tgtgtaattg ttgttgcttt tgcggcctaa gtcttccttt 10560 aataccacac caacaaagtt tagttgagag tttcattgtg aaggtagttc gattttggag 10620 gtcgcgggag gttacttttt ttttggatgg acgcaaagaa gtttaataat catattacat 10680 ggcaatacca ccatatacat atccatatct aatcttactt atatgttgtg gaaatgtaaa 10740 gagccccatt atcttagcct aaaaaaacct tctctttgga actttcagta atacgcttaa 10800 ctgctcattg ctatattgaa gtacggatta gaagccgccg agcgggcgac agccctccga 10860 cggaagactc tcctccgtgc gtcctggtct tcaccggtcg cgttcctgaa acgcagatgt 10920 gcctcgcgcc gcactgctcc gaacaataaa gattctacaa tactagcttt tatggttatg 10980 aagaggaaaa attggcagta acctggcccc acaaaccttc aaatcaacga atcaaattaa 11040 caaccatagg ataataatgc gattagtttt ttagccttat ttctggggta attaatcagc 11100 gaagcgatga tttttgatct attaacagat atataaatgc aaaagctgca taaccacttt 11160 aactaatact ttcaacattt tcggtttgta ttacttctta ttcaaatgtc ataaaagtat 11220 caacaaaaaa ttgttaatat acctctatac ttaccccacc cgaagtcgcg caaccaacta 11280 actttacaat gactggaaag acaggtcaca tcgacggatt gaactcaagg atcgagaaga 11340 tgagggactt ggatcctgct cagaggttag ttagggttgc cgaagccgca ggattggaac 11400 ctgaagccat ttctgcattg gccggtaacg gtgctttgcc tttgtcattg gccaacggta 11460 tgatcgagaa tgttatcgga aaatttgagt tgccattggg tgtcgccacc aacttcaccg 11520 tcaacggaag ggactactta atacctatgg cagtcgagga accatctgtt gttgccgcag 11580 cctcatatat ggcaaggata gctagagaga acggtggatt caccgcacac ggaactgcac 11640 ctttaatgag ggcccaaatc caagttgtcg gattaggaga cccagaagga gctaggcaaa 11700 ggttgttggc ccataaggct gctttcatgg aagcagcaga tgccgtagat ccagttttgg 11760 ttggtttagg tggtggttgc agagacattg aggtccatgt ttttagggac acccctgttg 11820 gtgcaatggt cgtattgcac ttgattgttg atgtcagaga cgccatgggt gccaacacag 11880 ttaacaccat ggctgaaagg ttagctccag aggtagagag gatcgctggt ggaaccgtca 11940 ggttgaggat tttgtctaac ttggccgact tgaggttggt aagagccagg gttgagttag 12000 cccctgagac tttgaccacc cagggatacg atggtgccga cgttgcaagg ggaatggttg 12060 aagcctgcgc cttagcaata gtcgaccctt acagggccgc aacccataac aagggaatta 12120 tgaacggaat tgacccagtc gtcgtcgcaa caggtaacga ctggagggcc atcgaagctg 12180 gagcccacgc ctacgccgcc aggaccggac attacacctc tttgacaagg tgggagttgg 12240 ccaacgacgg taggttggtc ggtaccattg aattgccttt ggccttgggt ttggtaggag 12300 gagccaccaa gactcaccct acagctaggg ccgctttggc cttaatgcag gtcgaaaccg 12360 ctactgagtt ggcccaggtt actgccgccg ttggtttggc tcagaatatg gccgcaatta 12420 gggccttggc aaccgaggga atccaaaggg gacacatgac cttacacgca aggaacatcg 12480 caatcatggc cggtgccacc ggagccgaca ttgacagggt caccagggtc atcgttgaag 12540 ccggagacgt atctgtcgcc agggctaaac aggttttgga aaatacataa acttagtcat 12600 acgtcattgg tattctcttg aaaaagaagc acaacagcac catgtgttac gtaaaatatt 12660 tactttatag tttgtacgtc ataatttctt ccatattaca agttcgtgca tatatagaaa 12720 gaattctgtt gttgtaattg tcataactag gtccgccggc gttggacgag cgaatgtgta 12780 tattagttta aaaagttgta tgtaataaaa gtaaaattta atattttgga tgaaaaaaac 12840 catttttaga ctttttctta actagaatgc tggagtagaa atacgccatc tcaagataca 12900 aaaagcgtta ccggcactga tttgtttcaa ccagtatata gattattatt gggtcttgat 12960 caactttcct cagacatatc agtaacagtt atcaagctaa atatttacgc gaaagaaaaa 13020 caaatatttt aattgtgata cttgtgaatt ttattttatt aaggatacaa agttaagaga 13080 aaacaaaatt tatatacaat ataagtaata ttcatatata tgtgatgaat gcagtcttaa 13140 cgagaagaca tggccttggt gacaactctc ttcaaaccaa cttcagcctt tctcaattca 13200 tcagcagatg ggtcttcgat ttgcaaagca gccaaagcgg cggtttaaac gcgtggccgt 13260 gccgtc 13266 <210> 52 <211> 13712 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct: i84024 integration construct <400> 52 gacggcacgg ccacgcgttt aaaccgccaa gtgatgtaac taaatacacg attaccatgg 60 aaattaacgt accttttttg tgcgtgtatt gaaatattat gacatattac agaaagggtt 120 cgcaagtcct gtttctatgc ctttctctta gtaattcacg aaataaacct atggtttacg 180 aaatgatcca cgaaaatcat gttattattt acatcaacat atcgcgaaaa ttcatgtcat 240 gtccacatta acatcattgc agagcaacaa ttcattttca tagagaaatt tgctactatc 300 acccactagt actaccattg gtacctacta ctttgaattg tactaccgct gggcgttatt 360 aggtgtgaaa ccacgaaaag ttcaccataa cttcgaataa agtcgcggaa aaaagtaaac 420 agctattgct actcaaatga ggtttgcaga agcttgttga agcatgatga agcgttctaa 480 acgcactatt catcattaaa tatttaaagc tcataaaatt gtattcaatt cctattctaa 540 atggctttta tttctattac aactattagc tctaaatcca tatcctcata agcagcaatc 600 aattctatct atactttaaa cgctcgtcca acgccggcgg acctgatgtg tattactagt 660 gtcgacgaca gcattcgccc agtatttttt ttattctaca aaccttctat aatttcaaag 720 tatttacata attctgtatc agtttaatca ccataatatc gttttctttg tttagtgcaa 780 ttaatttttc ctattgttac ttcgggcctt tttctgtttt atgagctatt ttttccgtca 840 tccttccgga tccagatttt cagcttcatc tccagattgt gtctacgtaa tgcacgccat 900 cattttaaga gaggacctcc cgcgacctcc aaaatcgaac taccttcaca atgaaacttc 960 ttagtagtat tgagcaggcg tgtgacatct gtagattgaa gaaattgaaa tgtagtaagg 1020 agaagcccaa atgtgcgaaa tgccttaaaa ataattggga atgcagatat agtccgaaga 1080 cgaagcgcag tccccttacc cgcgcgcacc ttacggaggt cgagagtcgc cttgagcgcc 1140 ttgagcaact tttccttctt atcttcccca gagaggattt ggatatgatc cttaagatgg 1200 acagtcttca agacattaag gcgcttctta cggggctttt cgtgcaggac aacgtcaaca 1260 aggacgcggt gacggaccgc cttgccagtg tcgaaaccga catgcccctt acgcttcgcc 1320 aacaccgcat ttccgccacg agtagtagtg aggaatcctc caataagggg cagcgccaac 1380 ttaccgtgag tatcgatagt gcggcccacc acgacaatag tacgatcccc cttgacttca 1440 tgccgcgcga cgccttgcac gggttcgact ggagtgagga agacgatatg agtgacggtc 1500 ttccgtttct taagaccgat ccgaataaca acggtttttt cggtgatggg agtttgcttt 1560 gcatcttgag aagtatcggt ttcaagcccg agaactatac caatagtaat gtcaatcgct 1620 tgcccacgat gatcaccgac cgctataccc ttgccagtcg cagtacgacg agtagacttt 1680 tgcagtccta cttgaacaac ttccatccgt attgtcccat tgtccatagt cccaccctta 1740 tgatgcttta caacaatcaa atcgagattg ccagtaaaga ccagtggcag attttgttca 1800 attgtattct tgcgatcggg gcgtggtgca ttgaaggtga gagtaccgac attgacgtct 1860 tctattacca gaacgccaag agtcacctta cctccaaagt gtttgaaagt gggagtatta 1920 tccttgtcac ggcgcttcac ttgcttagta gatacacgca atggcgccaa aagacgaaca 1980 cctcctacaa cttccattcc ttcagtattc gcatggcgat tagtcttggt cttaaccgcg 2040 atttgccgag tagtttttcc gactcctcca tccttgagca gcgcagaaga atctggtgga 2100 gtgtgtatag ttgggaaatt cagcttagtc ttttgtacgg gagaagtatt caattgagtc 2160 aaaacacgat tagttttccc agtagtgtgg atgacgtcca aagaacgacg acggggccga 2220 cgatttacca cggtattatc gagacggcgc gcttgcttca ggtctttacg aagatttacg 2280 agcttgataa gacggtgacc gcggagaagt cccccatttg cgcgaagaag tgtcttatga 2340 tctgcaacga aatcgaagaa gtcagtcgcc aagcgccgaa attccttcag atggacatca 2400 gtacgacggc ccttacgaac cttcttaaag agcatccctg gcttagtttc acgcgctttg 2460 agcttaaatg gaagcaactt agtttgatta tctacgtgct tcgcgacttc tttaccaact 2520 tcacgcaaaa gaaaagtcag cttgagcaag accagaacga ccaccagtcc tacgaggtca 2580 agagatgtag tattatgctt tccgacgcgg cgcagcgcac cgtcatgagt gtgtcctcct 2640 acatggataa ccacaacgtg acgccgtact tcgcgtggaa ctgcagttac tatcttttta 2700 acgcggtgct tgtgccgatt aaaacccttt tgagtaatag taagagtaac gccgaaaaca 2760 atgaaacggc gcagcttctt cagcagatca ataccgtcct tatgcttctt aagaagcttg 2820 cgaccttcaa gattcaaacc tgcgagaagt atatccaggt gcttgaggaa gtgtgcgccc 2880 ccttccttct tagtcaatgc gcgattccgc ttccccacat ttcctacaat aactccaacg 2940 ggtccgcgat caagaacatc gtggggagtg cgaccattgc gcagtatccc accttgcccg 3000 aagagaacgt gaataacatt tccgtcaagt acgtcagtcc cggtagtgtg ggtcccagtc 3060 ccgtcccgct taagagtggg gcgtcctttt ccgaccttgt gaaacttctt agtaatagac 3120 cgccgagtag aaatagtccg gtcacgattc cgcgctccac gcccagtcac agaagtgtga 3180 cccccttcct tggtcagcaa cagcaacttc agagtcttgt cccgcttacg cccagtgccc 3240 ttttcggggg tgcgaacttc aaccagtccg gtaacatcgc cgactccagt cttagtttta 3300 cctttaccaa ttcctccaat gggcccaatt tgattacgac ccagacgaac agtcaggcct 3360 tgagtcagcc gatcgcgagt agtaatgtcc acgacaattt tatgaacaac gagattaccg 3420 cctccaagat cgacgacggg aacaacagta agccgcttag tcccgggtgg accgatcaga 3480 ccgcctacaa tgccttcggg attaccacgg gtatgttcaa cacgaccacg atggacgacg 3540 tgtacaatta cctttttgac gacgaggaca cgccgccgaa tccgaagaag gaatgagcca 3600 attggtgcgg caattgataa taacgaaaat gtcttttaat gatctgggta taatgaggaa 3660 ttttccgaac gtttttactt tatatatata tatacatgta acatatattc tatacgctat 3720 atcgagaaaa cgcgatggtg gggtgacttt caactcggcg tatccccgcg tgcttggccg 3780 gccgtccgca tgactcaaga gaagcatgtg gtttttgagt ttttttcgtt gaattttcag 3840 gtaaagctca atagttatga caattacaac aacagaattc tttctatata tgcacgaact 3900 tgtaatatgg aagaaattat gacgtacaaa ctataaagta aatattttac gtaacacatg 3960 gtgctgttgt gcttcttttt caagagaata ccaatgacgt atgactaagt ttaggattta 4020 atgcaggtga cggacccatc tttcaaacga tttatatcag tggcgtccaa attgttaggt 4080 tttgttggtt cagcaggttt cctgttgtgg gtcatatgac tttgaaccaa atggccggct 4140 gctagggcag cacataagga taattcacct gccaagacgg cacaggcaac tattcttgct 4200 aattgacgtg cgttggtacc aggagcggta gcatgtgggc ctcttacacc taataagtcc 4260 aacatggcac cttgtggttc tagaacagta ccaccaccga tggtacctac ttcgatggat 4320 ggcatggata cggaaattct caaatcaccg tccacttctt tcatcaatgt tatacagttg 4380 gaactttcga cattttgtgc aggatcttgt cctaatgcca agaaaacagc tgtcactaaa 4440 ttagctgcat gtgcgttaaa tccaccaaca gacccagcca ttgcagatcc aaccaaattc 4500 ttagcaatgt tcaactcaac caatgcggaa acatcacttt ttaacacttt tctgacaaca 4560 tcaccaggaa tagtagcttc tgcgacgaca ctcttaccac gaccttcgat ccagttgatg 4620 gcagctggtt ttttgtcggt acagtagtta ccagaaacgg agacaacctc catatcttcc 4680 cagccatact cttctaccat ttgctttaat gagtattcga cacccttaga aatcatattc 4740 atacccattg cgtcaccagt agttgttcta aatctcatga agagtaaatc tcctgctaga 4800 caagtttgaa tatgttgcag acgtgcaaat cttgatgtag agttaaaagc ttttttaatt 4860 gcgttttgtc cctcttctga gtctaaccat atcttacagg caccagatct tttcaaagtt 4920 gggaaacgga ctactgggcc tcttgtcata ccatccttag ttaaaacagt tgttgcacca 4980 ccgccagcat tgattgcctt acagccacgc atggcagaag ctaccaaaca accctctgta 5040 gttgccattg gtatatgata agatgtacca tcgataacca aggggcctat aacaccaacg 5100 ggcaaaggca tgtaacctat aacattttca caacaagcgc caaatacgcg gtcgtagtca 5160 taatttttat atggtaaacg atcagatgct aatacaggag cttctgccaa aattgaaaga 5220 gccttcctac gtaccgcaac cgctctcgta gtatcaccta attttttctc caaagcgtac 5280 aaaggtaact taccgtgaat aaccaaggca gcgacctctt tgttcttcaa ttgttttgta 5340 tttccactac ttaataatgc ttctaattct tctaaaggac gtattttctt atccaagctt 5400 tcaatatcgc gggaatcatc ttcctcacta gatgatgaag gtcctgatga gctcgattgc 5460 gcagatgata aacttttgac tttcgatcca gaaatgactg ttttattggt taaaactggt 5520 gtagaagcct tttgtacagg agcagtaaaa gacttcttgg tgacttcagt cttcaccaat 5580 tggtctgcag ccattgtaaa gttagttggt tgcgcgactt cgggtggggt aagtatagag 5640 gtatattaac aattttttgt tgatactttt atgacatttg aataagaagt aatacaaacc 5700 gaaaatgttg aaagtattag ttaaagtggt tatgcagctt ttgcatttat atatctgtta 5760 atagatcaaa aatcatcgct tcgctgatta attaccccag aaataaggct aaaaaactaa 5820 tcgcattatt atcctatggt tgttaatttg attcgttgat ttgaaggttt gtggggccag 5880 gttactgcca atttttcctc ttcataacca taaaagctag tattgtagaa tctttattgt 5940 tcggagcagt gcggcgcgag gcacatctgc gtttcaggaa cgcgaccggt gaagaccagg 6000 acgcacggag gagagtcttc cgtcggaggg ctgtcgcccg ctcggcggct tctaatccgt 6060 acttcaatat agcaatgagc agttaagcgt attactgaaa gttccaaaga gaaggttttt 6120 ttaggctaag ataatggggc tctttacatt tccacaacat ataagtaaga ttagatatgg 6180 atatgtatat ggtggtattg ccatgtaata tgattattaa acttctttgc gtccatccaa 6240 aaaaaaagta acgcacgcac actcccgaca gacaactagc ttgataatga ctgatgttcg 6300 tttcagaatc atcggtaccg gtgcctatgt tccagaaaga attgtttcta acgacgaagt 6360 tggtgctcca gctggtgttg atgacgactg gatcaccaga aagactggta tcagacaaag 6420 aagatgggct gctgatgacc aagctacttc tgacttagct actgctgctg gtagagccgc 6480 cttgaaggct gctggtatta ctccagaaca attgactgtt atcgctgttg ctacctccac 6540 tccagataga ccacaaccac ctaccgctgc ctacgttcaa caccacttgg gtgctactgg 6600 tactgctgct ttcgacgtta acgctgtttg ttccggtact gttttcgcct tatcttctgt 6660 cgccggtacc ttggtctaca gaggtggtta tgctttggtt atcggtgctg acttgtactc 6720 cagaatcttg aatccagctg acagaaagac cgttgttttg ttcggtgatg gtgctggtgc 6780 tatggttttg ggtccaactt ctactggtac tggtccaatc gttagaagag tcgctttaca 6840 cacctttggt ggtttaaccg atttgattag agttccagct ggtggttcta gacaaccatt 6900 ggacactgac ggtttggacg ccggtttgca atactttgcc atggacggta gagaagttag 6960 acgtttcgtc actgaacatt tgccacaatt gatcaaaggt ttcttgcatg aagctggtgt 7020 tgacgctgct gatatttctc atttcgtccc acatcaagcc aacggtgtta tgttggacga 7080 agtttttggt gaattgcatt tgccaagagc taccatgcac agaactgttg aaacttacgg 7140 taataccggt gctgcttcca ttccaattac tatggacgct gctgttagag ccggttcctt 7200 tagaccaggt gaattggtct tattggctgg ttttggtggt ggtatggccg cctctttcgc 7260 cttgattgaa tggtagatgc tatgtaatag acaataaaac catgtttata taaaaaaaat 7320 tcaaaataga aaacgattct gtacaaggag tatttttttt ttgttctagt gtgtttatat 7380 tatccttggc taagaggcac taacctgcag gccgcgagcg ccgatacgaa aatcgttatt 7440 gtcttgaagg tgaaatttct actcttatta atggtgaacg ttaagctgat gctatgatgg 7500 aagctgattg gtcttaactt gcttgtcatc ttgctaatgg tcattggctc gtgttattac 7560 ttaagttatt tgtactcgtt ttgaacgtaa tgctaatgat catcttatgg aataatagtg 7620 agtggtttca gggtccataa agcttttcaa ttcatctttt ttttttttgt tctttttttt 7680 gattccggtt tctttgaaat ttttttgatt cggtaatctc cgagcagaag gaagaacgaa 7740 ggaaggagca cagacttaga ttggtatata tacgcatatg tggtgttgaa gaaacatgaa 7800 attgcccagt attcttaacc caactgcaca gaacaaaaac ctgcaggaaa cgaagataaa 7860 tcatgtcgaa agctacatat aaggaacgtg ctgctactca tcctagtcct gttgctgcca 7920 agctatttaa tatcatgcac gaaaagcaaa caaacttgtg tgcttcattg gatgttcgta 7980 ccaccaagga attactggag ttagttgaag cattaggtcc caaaatttgt ttactaaaaa 8040 cacatgtgga tatcttgact gatttttcca tggagggcac agttaagccg ctaaaggcat 8100 tatccgccaa gtacaatttt ttactcttcg aagacagaaa atttgctgac attggtaata 8160 cagtcaaatt gcagtactct gcgggtgtat acagaatagc agaatgggca gacattacga 8220 atgcacacgg tgtggtgggc ccaggtattg ttagcggttt gaagcaggcg gcggaagaag 8280 taacaaagga acctagaggc cttttgatgt tagcagaatt gtcatgcaag ggctccctag 8340 ctactggaga atatactaag ggtactgttg acattgcgaa gagtgacaaa gattttgtta 8400 tcggctttat tgctcaaaga gacatgggtg gaagagatga aggttacgat tggttgatta 8460 tgacacccgg tgtgggttta gatgacaagg gagacgcatt gggtcaacag tatagaaccg 8520 tggatgatgt ggtctctaca ggatctgaca ttattattgt tggaagagga ctatttgcaa 8580 agggaaggga tgctaaggta gagggtgaac gttacagaaa agcaggctgg gaagcatatt 8640 tgagaagatg cggccagcaa aactaaaaaa ctgtattata agtaaatgca tgtatactaa 8700 actcacaaat tagagcttca atttaattat atcagttatt accacgaaaa tcgttattgt 8760 cttgaaggtg aaatttctac tcttattaat ggtgaacgtt aagctgatgc tatgatggaa 8820 gctgattggt cttaacttgc ttgtcatctt gctaatggtc atatggctcg tgttattact 8880 taagttattt gtactcgttt tgaacgtaat gctaatgatc atcttatgga ataatagtga 8940 acggccggcc aagcacgcgg ggattgaatg agaaaaaaaa tcggttgggc ttaactttaa 9000 agaaaaaagt tgagattaga tttattgtgt tataaatata gatatacaat tctttataaa 9060 aaaaatatat atatatatca ttgttattaa ataaagagtt ttcctagtat atagattaaa 9120 aaactactct attaaatgag agctaaaaaa agcaggctgc caaaaaaata aagcatttat 9180 gaagggggtt cagcaagatg caatcgatgg gggaagatta ttttttaaca tcgtaagatc 9240 ttctaaattt gtcatcgatg ttggtcaagt agtaaacacc actttgcaaa tgctcaatgg 9300 aaccttgagg tttgaagttc ttcttcaaat gggcattttc tctcaattcg atggcagctt 9360 cgtaatcctt tggagtttcg gtgattctct tggctaattt gttagtaata tctaattcct 9420 tgataatatg ttggacgtca ccaacaattt tgcaagaata tagagatgca gctaaaccgg 9480 aaccgtaaga aaataaacca acacgcttgc cttgtaagtc gtcagatcca acatagttta 9540 atagagatgc aaaggcggca taaacagatg cggtgtacat gttacctgtg tttgttggaa 9600 caatcaaaga ttgggcaact ctctctttgt ggaatggctt agcaacatta acaaaagttt 9660 tttcaatgtt cttatcggtt aaagattcgt cataatcgcg agtagctaat tcggcgtcaa 9720 cttctgggaa caattgagga ttggctctga aatcgttata tagtaatcta ccgtatgatt 9780 ttgtgaccaa tttacaggtt ggaacatgga aaacgttgta gtcgaaatat ttcaaaacgt 9840 tcaaagcatc cgaaccagcg ggatcgctaa ccaacccttt agaaatagcc ttcttggaat 9900 aactcttgta aacttgatca agagccttga cgtaacaagt taatgaaaaa tgaccatcga 9960 cgtaaggata ttcgctggtg aaatctggct tgtaaaaatc gtaggcgtgt tccatgtaag 10020 aagctcttac agagtcaaat acaattggag catcaggacc gatccacata gcaacagtac 10080 cggcaccacc ggttggtctt gcggcaccct tatcgtagat ggcaatatca ccgcaaacta 10140 caatggcgtc tctaccatcc catgcgttag attcaatcca gttcaaagag ttgaacaacg 10200 cgttggtacc accgtaacag gcattaagcg tgtcaatacc ttcgacgtca gtgttttcac 10260 caaacaattg catcaagaca gacttgacag acttggactt gtcaatcaga gtttcagtac 10320 cgacttctaa tctaccaatt ttgttggtgt cgatgttgta actcttgatc aacttagaca 10380 aaacagttag ggacatcgag tagatatctt ctctgtcatt gacaaaagac atgttggttt 10440 ggcccagacc aattgtgtat ttaccttgag aaacgccatc aaatttctct agctcagatt 10500 ggttgacaca ttgagttggg atgtaaattt ggataccttt aataccgaca ttttgaggtc 10560 tggttttttg ttcagcggtc ttttgttttt ttagttcagt catttgcaag tttgtattgt 10620 gtaattgttg ttgcttttgc ggcctaagtc ttcctttaat accacaccaa caaagtttag 10680 ttgagagttt cattgtgaag gtagttcgat tttggaggtc gcgggaggtt actttttttt 10740 tggatggacg caaagaagtt taataatcat attacatggc aataccacca tatacatatc 10800 catatctaat cttacttata tgttgtggaa atgtaaagag ccccattatc ttagcctaaa 10860 aaaaccttct ctttggaact ttcagtaata cgcttaactg ctcattgcta tattgaagta 10920 cggattagaa gccgccgagc gggcgacagc cctccgacgg aagactctcc tccgtgcgtc 10980 ctggtcttca ccggtcgcgt tcctgaaacg cagatgtgcc tcgcgccgca ctgctccgaa 11040 caataaagat tctacaatac tagcttttat ggttatgaag aggaaaaatt ggcagtaacc 11100 tggccccaca aaccttcaaa tcaacgaatc aaattaacaa ccataggata ataatgcgat 11160 tagtttttta gccttatttc tggggtaatt aatcagcgaa gcgatgattt ttgatctatt 11220 aacagatata taaatgcaaa agctgcataa ccactttaac taatactttc aacattttcg 11280 gtttgtatta cttcttattc aaatgtcata aaagtatcaa caaaaaattg ttaatatacc 11340 tctatactta ccccacccga agtcgcgcaa ccaactaact ttacaatggc tgcagaccaa 11400 ttggtgaaga ctgaagtcac caagaagtct tttactgctc ctgtacaaaa ggcttctaca 11460 ccagttttaa ccaataaaac agtcatttct ggatcgaaag tcaaaagttt atcatctgcg 11520 caatcgagct catcaggacc ttcatcatct agtgaggaag atgattcccg cgatattgaa 11580 agcttggata agaaaatacg tcctttagaa gaattagaag cattattaag tagtggaaat 11640 acaaaacaat tgaagaacaa agaggtcgct gccttggtta ttcacggtaa gttacctttg 11700 tacgctttgg agaaaaaatt aggtgatact acgagagcgg ttgcggtacg taggaaggct 11760 ctttcaattt tggcagaagc tcctgtatta gcatctgatc gtttaccata taaaaattat 11820 gactacgacc gcgtatttgg cgcttgttgt gaaaatgtta taggttacat gcctttgccc 11880 gttggtgtta taggcccctt ggttatcgat ggtacatctt atcatatacc aatggcaact 11940 acagagggtt gtttggtagc ttctgccatg cgtggctgta aggcaatcaa tgctggcggt 12000 ggtgcaacaa ctgttttaac taaggatggt atgacaagag gcccagtagt ccgtttccca 12060 actttgaaaa gatctggtgc ctgtaagata tggttagact cagaagaggg acaaaacgca 12120 attaaaaaag cttttaactc tacatcaaga tttgcacgtc tgcaacatat tcaaacttgt 12180 ctagcaggag atttactctt catgagattt agaacaacta ctggtgacgc aatgggtatg 12240 aatatgattt ctaagggtgt cgaatactca ttaaagcaaa tggtagaaga gtatggctgg 12300 gaagatatgg aggttgtctc cgtttctggt aactactgta ccgacaaaaa accagctgcc 12360 atcaactgga tcgaaggtcg tggtaagagt gtcgtcgcag aagctactat tcctggtgat 12420 gttgtcagaa aagtgttaaa aagtgatgtt tccgcattgg ttgagttgaa cattgctaag 12480 aatttggttg gatctgcaat ggctgggtct gttggtggat ttaacgcaca tgcagctaat 12540 ttagtgacag ctgttttctt ggcattagga caagatcctg cacaaaatgt cgaaagttcc 12600 aactgtataa cattgatgaa agaagtggac ggtgatttga gaatttccgt atccatgcca 12660 tccatcgaag taggtaccat cggtggtggt actgttctag aaccacaagg tgccatgttg 12720 gacttattag gtgtaagagg cccacatgct accgctcctg gtaccaacgc acgtcaatta 12780 gcaagaatag ttgcctgtgc cgtcttggca ggtgaattat ccttatgtgc tgccctagca 12840 gccggccatt tggttcaaag tcatatgacc cacaacagga aacctgctga accaacaaaa 12900 cctaacaatt tggacgccac tgatataaat cgtttgaaag atgggtccgt cacctgcatt 12960 aaatcctaaa cttagtcata cgtcattggt attctcttga aaaagaagca caacagcacc 13020 atgtgttacg taaaatattt actttatagt ttgtacgtca taatttcttc catattacaa 13080 gttcgtgcat atatagaaag aattctgttg ttgtaattgt cataactatt gagctttacc 13140 tgaaaattca acgaaaaaaa ctcaaaaacc acatgcttct cttgagtcat gcggaggtcc 13200 gccggcgttg gacgagcgaa tgtgtatatt agtttaaaaa gttgtatgta ataaaagtaa 13260 aatttaatat tttggatgaa aaaaaccatt tttagacttt ttcttaacta gaatgctgga 13320 gtagaaatac gccatctcaa gatacaaaaa gcgttaccgg cactgatttg tttcaaccag 13380 tatatagatt attattgggt cttgatcaac tttcctcaga catatcagta acagttatca 13440 agctaaatat ttacgcgaaa gaaaaacaaa tattttaatt gtgatacttg tgaattttat 13500 tttattaagg atacaaagtt aagagaaaac aaaatttata tacaatataa gtaatattca 13560 tatatatgtg atgaatgcag tcttaacgag aagacatggc cttggtgaca actctcttca 13620 aaccaacttc agcctttctc aattcatcag cagatgggtc ttcgatttgc aaagcagcca 13680 aagcggcggt ttaaacgcgt ggccgtgccg tc 13712 <210> 53 <211> 13964 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct: i84026 integration construct <400> 53 gacggcacgg ccacgcgttt aaaccgccaa gtgatgtaac taaatacacg attaccatgg 60 aaattaacgt accttttttg tgcgtgtatt gaaatattat gacatattac agaaagggtt 120 cgcaagtcct gtttctatgc ctttctctta gtaattcacg aaataaacct atggtttacg 180 aaatgatcca cgaaaatcat gttattattt acatcaacat atcgcgaaaa ttcatgtcat 240 gtccacatta acatcattgc agagcaacaa ttcattttca tagagaaatt tgctactatc 300 acccactagt actaccattg gtacctacta ctttgaattg tactaccgct gggcgttatt 360 aggtgtgaaa ccacgaaaag ttcaccataa cttcgaataa agtcgcggaa aaaagtaaac 420 agctattgct actcaaatga ggtttgcaga agcttgttga agcatgatga agcgttctaa 480 acgcactatt catcattaaa tatttaaagc tcataaaatt gtattcaatt cctattctaa 540 atggctttta tttctattac aactattagc tctaaatcca tatcctcata agcagcaatc 600 aattctatct atactttaaa cgctcgtcca acgccggcgg acctgatgtg tattactagt 660 gtcgacgaca gcattcgccc agtatttttt ttattctaca aaccttctat aatttcaaag 720 tatttacata attctgtatc agtttaatca ccataatatc gttttctttg tttagtgcaa 780 ttaatttttc ctattgttac ttcgggcctt tttctgtttt atgagctatt ttttccgtca 840 tccttccgga tccagatttt cagcttcatc tccagattgt gtctacgtaa tgcacgccat 900 cattttaaga gaggacctcc cgcgacctcc aaaatcgaac taccttcaca atgaaacttc 960 ttagtagtat tgagcaggcg tgtgacatct gtagattgaa gaaattgaaa tgtagtaagg 1020 agaagcccaa atgtgcgaaa tgccttaaaa ataattggga atgcagatat agtccgaaga 1080 cgaagcgcag tccccttacc cgcgcgcacc ttacggaggt cgagagtcgc cttgagcgcc 1140 ttgagcaact tttccttctt atcttcccca gagaggattt ggatatgatc cttaagatgg 1200 acagtcttca agacattaag gcgcttctta cggggctttt cgtgcaggac aacgtcaaca 1260 aggacgcggt gacggaccgc cttgccagtg tcgaaaccga catgcccctt acgcttcgcc 1320 aacaccgcat ttccgccacg agtagtagtg aggaatcctc caataagggg cagcgccaac 1380 ttaccgtgag tatcgatagt gcggcccacc acgacaatag tacgatcccc cttgacttca 1440 tgccgcgcga cgccttgcac gggttcgact ggagtgagga agacgatatg agtgacggtc 1500 ttccgtttct taagaccgat ccgaataaca acggtttttt cggtgatggg agtttgcttt 1560 gcatcttgag aagtatcggt ttcaagcccg agaactatac caatagtaat gtcaatcgct 1620 tgcccacgat gatcaccgac cgctataccc ttgccagtcg cagtacgacg agtagacttt 1680 tgcagtccta cttgaacaac ttccatccgt attgtcccat tgtccatagt cccaccctta 1740 tgatgcttta caacaatcaa atcgagattg ccagtaaaga ccagtggcag attttgttca 1800 attgtattct tgcgatcggg gcgtggtgca ttgaaggtga gagtaccgac attgacgtct 1860 tctattacca gaacgccaag agtcacctta cctccaaagt gtttgaaagt gggagtatta 1920 tccttgtcac ggcgcttcac ttgcttagta gatacacgca atggcgccaa aagacgaaca 1980 cctcctacaa cttccattcc ttcagtattc gcatggcgat tagtcttggt cttaaccgcg 2040 atttgccgag tagtttttcc gactcctcca tccttgagca gcgcagaaga atctggtgga 2100 gtgtgtatag ttgggaaatt cagcttagtc ttttgtacgg gagaagtatt caattgagtc 2160 aaaacacgat tagttttccc agtagtgtgg atgacgtcca aagaacgacg acggggccga 2220 cgatttacca cggtattatc gagacggcgc gcttgcttca ggtctttacg aagatttacg 2280 agcttgataa gacggtgacc gcggagaagt cccccatttg cgcgaagaag tgtcttatga 2340 tctgcaacga aatcgaagaa gtcagtcgcc aagcgccgaa attccttcag atggacatca 2400 gtacgacggc ccttacgaac cttcttaaag agcatccctg gcttagtttc acgcgctttg 2460 agcttaaatg gaagcaactt agtttgatta tctacgtgct tcgcgacttc tttaccaact 2520 tcacgcaaaa gaaaagtcag cttgagcaag accagaacga ccaccagtcc tacgaggtca 2580 agagatgtag tattatgctt tccgacgcgg cgcagcgcac cgtcatgagt gtgtcctcct 2640 acatggataa ccacaacgtg acgccgtact tcgcgtggaa ctgcagttac tatcttttta 2700 acgcggtgct tgtgccgatt aaaacccttt tgagtaatag taagagtaac gccgaaaaca 2760 atgaaacggc gcagcttctt cagcagatca ataccgtcct tatgcttctt aagaagcttg 2820 cgaccttcaa gattcaaacc tgcgagaagt atatccaggt gcttgaggaa gtgtgcgccc 2880 ccttccttct tagtcaatgc gcgattccgc ttccccacat ttcctacaat aactccaacg 2940 ggtccgcgat caagaacatc gtggggagtg cgaccattgc gcagtatccc accttgcccg 3000 aagagaacgt gaataacatt tccgtcaagt acgtcagtcc cggtagtgtg ggtcccagtc 3060 ccgtcccgct taagagtggg gcgtcctttt ccgaccttgt gaaacttctt agtaatagac 3120 cgccgagtag aaatagtccg gtcacgattc cgcgctccac gcccagtcac agaagtgtga 3180 cccccttcct tggtcagcaa cagcaacttc agagtcttgt cccgcttacg cccagtgccc 3240 ttttcggggg tgcgaacttc aaccagtccg gtaacatcgc cgactccagt cttagtttta 3300 cctttaccaa ttcctccaat gggcccaatt tgattacgac ccagacgaac agtcaggcct 3360 tgagtcagcc gatcgcgagt agtaatgtcc acgacaattt tatgaacaac gagattaccg 3420 cctccaagat cgacgacggg aacaacagta agccgcttag tcccgggtgg accgatcaga 3480 ccgcctacaa tgccttcggg attaccacgg gtatgttcaa cacgaccacg atggacgacg 3540 tgtacaatta cctttttgac gacgaggaca cgccgccgaa tccgaagaag gaatgagcca 3600 attggtgcgg caattgataa taacgaaaat gtcttttaat gatctgggta taatgaggaa 3660 ttttccgaac gtttttactt tatatatata tatacatgta acatatattc tatacgctat 3720 atcgagaaaa cgcgatggtg gggtgacttt caactcggcg tatccccgcg tgcttggccg 3780 gccgtccgca tgactcaaga gaagcatgtg gtttttgagt ttttttcgtt gaattttcag 3840 gtaaagctca atagttatga caattacaac aacagaattc tttctatata tgcacgaact 3900 tgtaatatgg aagaaattat gacgtacaaa ctataaagta aatattttac gtaacacatg 3960 gtgctgttgt gcttcttttt caagagaata ccaatgacgt atgactaagt ttaggattta 4020 atgcaggtga cggacccatc tttcaaacga tttatatcag tggcgtccaa attgttaggt 4080 tttgttggtt cagcaggttt cctgttgtgg gtcatatgac tttgaaccaa atggccggct 4140 gctagggcag cacataagga taattcacct gccaagacgg cacaggcaac tattcttgct 4200 aattgacgtg cgttggtacc aggagcggta gcatgtgggc ctcttacacc taataagtcc 4260 aacatggcac cttgtggttc tagaacagta ccaccaccga tggtacctac ttcgatggat 4320 ggcatggata cggaaattct caaatcaccg tccacttctt tcatcaatgt tatacagttg 4380 gaactttcga cattttgtgc aggatcttgt cctaatgcca agaaaacagc tgtcactaaa 4440 ttagctgcat gtgcgttaaa tccaccaaca gacccagcca ttgcagatcc aaccaaattc 4500 ttagcaatgt tcaactcaac caatgcggaa acatcacttt ttaacacttt tctgacaaca 4560 tcaccaggaa tagtagcttc tgcgacgaca ctcttaccac gaccttcgat ccagttgatg 4620 gcagctggtt ttttgtcggt acagtagtta ccagaaacgg agacaacctc catatcttcc 4680 cagccatact cttctaccat ttgctttaat gagtattcga cacccttaga aatcatattc 4740 atacccattg cgtcaccagt agttgttcta aatctcatga agagtaaatc tcctgctaga 4800 caagtttgaa tatgttgcag acgtgcaaat cttgatgtag agttaaaagc ttttttaatt 4860 gcgttttgtc cctcttctga gtctaaccat atcttacagg caccagatct tttcaaagtt 4920 gggaaacgga ctactgggcc tcttgtcata ccatccttag ttaaaacagt tgttgcacca 4980 ccgccagcat tgattgcctt acagccacgc atggcagaag ctaccaaaca accctctgta 5040 gttgccattg gtatatgata agatgtacca tcgataacca aggggcctat aacaccaacg 5100 ggcaaaggca tgtaacctat aacattttca caacaagcgc caaatacgcg gtcgtagtca 5160 taatttttat atggtaaacg atcagatgct aatacaggag cttctgccaa aattgaaaga 5220 gccttcctac gtaccgcaac cgctctcgta gtatcaccta attttttctc caaagcgtac 5280 aaaggtaact taccgtgaat aaccaaggca gcgacctctt tgttcttcaa ttgttttgta 5340 tttccactac ttaataatgc ttctaattct tctaaaggac gtattttctt atccaagctt 5400 tcaatatcgc gggaatcatc ttcctcacta gatgatgaag gtcctgatga gctcgattgc 5460 gcagatgata aacttttgac tttcgatcca gaaatgactg ttttattggt taaaactggt 5520 gtagaagcct tttgtacagg agcagtaaaa gacttcttgg tgacttcagt cttcaccaat 5580 tggtctgcag ccattgtaaa gttagttggt tgcgcgactt cgggtggggt aagtatagag 5640 gtatattaac aattttttgt tgatactttt atgacatttg aataagaagt aatacaaacc 5700 gaaaatgttg aaagtattag ttaaagtggt tatgcagctt ttgcatttat atatctgtta 5760 atagatcaaa aatcatcgct tcgctgatta attaccccag aaataaggct aaaaaactaa 5820 tcgcattatt atcctatggt tgttaatttg attcgttgat ttgaaggttt gtggggccag 5880 gttactgcca atttttcctc ttcataacca taaaagctag tattgtagaa tctttattgt 5940 tcggagcagt gcggcgcgag gcacatctgc gtttcaggaa cgcgaccggt gaagaccagg 6000 acgcacggag gagagtcttc cgtcggaggg ctgtcgcccg ctcggcggct tctaatccgt 6060 acttcaatat agcaatgagc agttaagcgt attactgaaa gttccaaaga gaaggttttt 6120 ttaggctaag ataatggggc tctttacatt tccacaacat ataagtaaga ttagatatgg 6180 atatgtatat ggtggtattg ccatgtaata tgattattaa acttctttgc gtccatccaa 6240 aaaaaaagta acgcacgcac actcccgaca gacaactagc ttgataatgt ctcagaacgt 6300 ttacattgta tcgactgcca gaaccccaat tggttcattc cagggttctc tatcctccaa 6360 gacagcagtg gaattgggtg ctgttgcttt aaaaggcgcc ttggctaagg ttccagaatt 6420 ggatgcatcc aaggattttg acgaaattat ttttggtaac gttctttctg ccaatttggg 6480 ccaagctccg gccagacaag ttgctttggc tgccggtttg agtaatcata tcgttgcaag 6540 cacagttaac aaggtctgtg catccgctat gaaggcaatc attttgggtg ctcaatccat 6600 caaatgtggt aatgctgatg ttgtcgtagc tggtggttgt gaatctatga ctaacgcacc 6660 atactacatg ccagcagccc gtgcgggtgc caaatttggc caaactgttc ttgttgatgg 6720 tgtcgaaaga gatgggttga acgatgcgta cgatggtcta gccatgggtg tacacgcaga 6780 aaagtgtgcc cgtgattggg atattactag agaacaacaa gacaattttg ccatcgaatc 6840 ctaccaaaaa tctcaaaaat ctcaaaagga aggtaaattc gacaatgaaa ttgtacctgt 6900 taccattaag ggatttagag gtaagcctga tactcaagtc acgaaggacg aggaacctgc 6960 tagattacac gttgaaaaat tgagatctgc aaggactgtt ttccaaaaag aaaacggtac 7020 tgttactgcc gctaacgctt ctccaatcaa cgatggtgct gcagccgtca tcttggtttc 7080 cgaaaaagtt ttgaaggaaa agaatttgaa gcctttggct attatcaaag gttggggtga 7140 ggccgctcat caaccagctg attttacatg ggctccatct cttgcagttc caaaggcttt 7200 gaaacatgct ggcatcgaag acatcaattc tgttgattac tttgaattca atgaagcctt 7260 ttcggttgtc ggtttggtga acactaagat tttgaagcta gacccatcta aggttaatgt 7320 atatggtggt gctgttgctc taggtcaccc attgggttgt tctggtgcta gagtggttgt 7380 tacactgcta tccatcttac agcaagaagg aggtaagatc ggtgttgccg ccatttgtaa 7440 tggtggtggt ggtgcttcct ctattgtcat tgaaaagata tgattacgtt ctgcgatttt 7500 ctcatgatct ttttcataaa atacataaat atataaatgg ctttatgtat aacaggcata 7560 atttaaagtt ttatttgcga ttcatcgttt ttcaggtact caaacgctga ggtgtgcctt 7620 ttgacttact tttccgcctt ggcaagctgg ccgaacctgc aggccgcgag cgccgatacg 7680 aaaatcgtta ttgtcttgaa ggtgaaattt ctactcttat taatggtgaa cgttaagctg 7740 atgctatgat ggaagctgat tggtcttaac ttgcttgtca tcttgctaat ggtcattggc 7800 tcgtgttatt acttaagtta tttgtactcg ttttgaacgt aatgctaatg atcatcttat 7860 ggaataatag tgagtggttt cagggtccat aaagcttttc aattcatctt tttttttttt 7920 gttctttttt ttgattccgg tttctttgaa atttttttga ttcggtaatc tccgagcaga 7980 aggaagaacg aaggaaggag cacagactta gattggtata tatacgcata tgtggtgttg 8040 aagaaacatg aaattgccca gtattcttaa cccaactgca cagaacaaaa acctgcagga 8100 aacgaagata aatcatgtcg aaagctacat ataaggaacg tgctgctact catcctagtc 8160 ctgttgctgc caagctattt aatatcatgc acgaaaagca aacaaacttg tgtgcttcat 8220 tggatgttcg taccaccaag gaattactgg agttagttga agcattaggt cccaaaattt 8280 gtttactaaa aacacatgtg gatatcttga ctgatttttc catggagggc acagttaagc 8340 cgctaaaggc attatccgcc aagtacaatt ttttactctt cgaagacaga aaatttgctg 8400 acattggtaa tacagtcaaa ttgcagtact ctgcgggtgt atacagaata gcagaatggg 8460 cagacattac gaatgcacac ggtgtggtgg gcccaggtat tgttagcggt ttgaagcagg 8520 cggcggaaga agtaacaaag gaacctagag gccttttgat gttagcagaa ttgtcatgca 8580 agggctccct agctactgga gaatatacta agggtactgt tgacattgcg aagagtgaca 8640 aagattttgt tatcggcttt attgctcaaa gagacatggg tggaagagat gaaggttacg 8700 attggttgat tatgacaccc ggtgtgggtt tagatgacaa gggagacgca ttgggtcaac 8760 agtatagaac cgtggatgat gtggtctcta caggatctga cattattatt gttggaagag 8820 gactatttgc aaagggaagg gatgctaagg tagagggtga acgttacaga aaagcaggct 8880 gggaagcata tttgagaaga tgcggccagc aaaactaaaa aactgtatta taagtaaatg 8940 catgtatact aaactcacaa attagagctt caatttaatt atatcagtta ttaccacgaa 9000 aatcgttatt gtcttgaagg tgaaatttct actcttatta atggtgaacg ttaagctgat 9060 gctatgatgg aagctgattg gtcttaactt gcttgtcatc ttgctaatgg tcatatggct 9120 cgtgttatta cttaagttat ttgtactcgt tttgaacgta atgctaatga tcatcttatg 9180 gaataatagt gaacggccgg ccaagcacgc ggggattgaa tgagaaaaaa aatcggttgg 9240 gcttaacttt aaagaaaaaa gttgagatta gatttattgt gttataaata tagatataca 9300 attctttata aaaaaaatat atatatatat cattgttatt aaataaagag ttttcctagt 9360 atatagatta aaaaactact ctattaaatg agagctaaaa aaagcaggct gccaaaaaaa 9420 taaagcattt atgaaggggg ttcagcaaga tgcaatcgat gggggaagat tattttttaa 9480 catcgtaaga tcttctaaat ttgtcatcga tgttggtcaa gtagtaaaca ccactttgca 9540 aatgctcaat ggaaccttga ggtttgaagt tcttcttcaa atgggcattt tctctcaatt 9600 cgatggcagc ttcgtaatcc tttggagttt cggtgattct cttggctaat ttgttagtaa 9660 tatctaattc cttgataata tgttggacgt caccaacaat tttgcaagaa tatagagatg 9720 cagctaaacc ggaaccgtaa gaaaataaac caacacgctt gccttgtaag tcgtcagatc 9780 caacatagtt taatagagat gcaaaggcgg cataaacaga tgcggtgtac atgttacctg 9840 tgtttgttgg aacaatcaaa gattgggcaa ctctctcttt gtggaatggc ttagcaacat 9900 taacaaaagt tttttcaatg ttcttatcgg ttaaagattc gtcataatcg cgagtagcta 9960 attcggcgtc aacttctggg aacaattgag gattggctct gaaatcgtta tatagtaatc 10020 taccgtatga ttttgtgacc aatttacagg ttggaacatg gaaaacgttg tagtcgaaat 10080 atttcaaaac gttcaaagca tccgaaccag cgggatcgct aaccaaccct ttagaaatag 10140 ccttcttgga ataactcttg taaacttgat caagagcctt gacgtaacaa gttaatgaaa 10200 aatgaccatc gacgtaagga tattcgctgg tgaaatctgg cttgtaaaaa tcgtaggcgt 10260 gttccatgta agaagctctt acagagtcaa atacaattgg agcatcagga ccgatccaca 10320 tagcaacagt accggcacca ccggttggtc ttgcggcacc cttatcgtag atggcaatat 10380 caccgcaaac tacaatggcg tctctaccat cccatgcgtt agattcaatc cagttcaaag 10440 agttgaacaa cgcgttggta ccaccgtaac aggcattaag cgtgtcaata ccttcgacgt 10500 cagtgttttc accaaacaat tgcatcaaga cagacttgac agacttggac ttgtcaatca 10560 gagtttcagt accgacttct aatctaccaa ttttgttggt gtcgatgttg taactcttga 10620 tcaacttaga caaaacagtt agggacatcg agtagatatc ttctctgtca ttgacaaaag 10680 acatgttggt ttggcccaga ccaattgtgt atttaccttg agaaacgcca tcaaatttct 10740 ctagctcaga ttggttgaca cattgagttg ggatgtaaat ttggatacct ttaataccga 10800 cattttgagg tctggttttt tgttcagcgg tcttttgttt ttttagttca gtcatttgca 10860 agtttgtatt gtgtaattgt tgttgctttt gcggcctaag tcttccttta ataccacacc 10920 aacaaagttt agttgagagt ttcattgtga aggtagttcg attttggagg tcgcgggagg 10980 ttactttttt tttggatgga cgcaaagaag tttaataatc atattacatg gcaataccac 11040 catatacata tccatatcta atcttactta tatgttgtgg aaatgtaaag agccccatta 11100 tcttagccta aaaaaacctt ctctttggaa ctttcagtaa tacgcttaac tgctcattgc 11160 tatattgaag tacggattag aagccgccga gcgggcgaca gccctccgac ggaagactct 11220 cctccgtgcg tcctggtctt caccggtcgc gttcctgaaa cgcagatgtg cctcgcgccg 11280 cactgctccg aacaataaag attctacaat actagctttt atggttatga agaggaaaaa 11340 ttggcagtaa cctggcccca caaaccttca aatcaacgaa tcaaattaac aaccatagga 11400 taataatgcg attagttttt tagccttatt tctggggtaa ttaatcagcg aagcgatgat 11460 ttttgatcta ttaacagata tataaatgca aaagctgcat aaccacttta actaatactt 11520 tcaacatttt cggtttgtat tacttcttat tcaaatgtca taaaagtatc aacaaaaaat 11580 tgttaatata cctctatact taccccaccc gaagtcgcgc aaccaactaa ctttacaatg 11640 gctgcagacc aattggtgaa gactgaagtc accaagaagt cttttactgc tcctgtacaa 11700 aaggcttcta caccagtttt aaccaataaa acagtcattt ctggatcgaa agtcaaaagt 11760 ttatcatctg cgcaatcgag ctcatcagga ccttcatcat ctagtgagga agatgattcc 11820 cgcgatattg aaagcttgga taagaaaata cgtcctttag aagaattaga agcattatta 11880 agtagtggaa atacaaaaca attgaagaac aaagaggtcg ctgccttggt tattcacggt 11940 aagttacctt tgtacgcttt ggagaaaaaa ttaggtgata ctacgagagc ggttgcggta 12000 cgtaggaagg ctctttcaat tttggcagaa gctcctgtat tagcatctga tcgtttacca 12060 tataaaaatt atgactacga ccgcgtattt ggcgcttgtt gtgaaaatgt tataggttac 12120 atgcctttgc ccgttggtgt tataggcccc ttggttatcg atggtacatc ttatcatata 12180 ccaatggcaa ctacagaggg ttgtttggta gcttctgcca tgcgtggctg taaggcaatc 12240 aatgctggcg gtggtgcaac aactgtttta actaaggatg gtatgacaag aggcccagta 12300 gtccgtttcc caactttgaa aagatctggt gcctgtaaga tatggttaga ctcagaagag 12360 ggacaaaacg caattaaaaa agcttttaac tctacatcaa gatttgcacg tctgcaacat 12420 attcaaactt gtctagcagg agatttactc ttcatgagat ttagaacaac tactggtgac 12480 gcaatgggta tgaatatgat ttctaagggt gtcgaatact cattaaagca aatggtagaa 12540 gagtatggct gggaagatat ggaggttgtc tccgtttctg gtaactactg taccgacaaa 12600 aaaccagctg ccatcaactg gatcgaaggt cgtggtaaga gtgtcgtcgc agaagctact 12660 attcctggtg atgttgtcag aaaagtgtta aaaagtgatg tttccgcatt ggttgagttg 12720 aacattgcta agaatttggt tggatctgca atggctgggt ctgttggtgg atttaacgca 12780 catgcagcta atttagtgac agctgttttc ttggcattag gacaagatcc tgcacaaaat 12840 gtcgaaagtt ccaactgtat aacattgatg aaagaagtgg acggtgattt gagaatttcc 12900 gtatccatgc catccatcga agtaggtacc atcggtggtg gtactgttct agaaccacaa 12960 ggtgccatgt tggacttatt aggtgtaaga ggcccacatg ctaccgctcc tggtaccaac 13020 gcacgtcaat tagcaagaat agttgcctgt gccgtcttgg caggtgaatt atccttatgt 13080 gctgccctag cagccggcca tttggttcaa agtcatatga cccacaacag gaaacctgct 13140 gaaccaacaa aacctaacaa tttggacgcc actgatataa atcgtttgaa agatgggtcc 13200 gtcacctgca ttaaatccta aacttagtca tacgtcattg gtattctctt gaaaaagaag 13260 cacaacagca ccatgtgtta cgtaaaatat ttactttata gtttgtacgt cataatttct 13320 tccatattac aagttcgtgc atatatagaa agaattctgt tgttgtaatt gtcataacta 13380 ttgagcttta cctgaaaatt caacgaaaaa aactcaaaaa ccacatgctt ctcttgagtc 13440 atgcggaggt ccgccggcgt tggacgagcg aatgtgtata ttagtttaaa aagttgtatg 13500 taataaaagt aaaatttaat attttggatg aaaaaaacca tttttagact ttttcttaac 13560 tagaatgctg gagtagaaat acgccatctc aagatacaaa aagcgttacc ggcactgatt 13620 tgtttcaacc agtatataga ttattattgg gtcttgatca actttcctca gacatatcag 13680 taacagttat caagctaaat atttacgcga aagaaaaaca aatattttaa ttgtgatact 13740 tgtgaatttt attttattaa ggatacaaag ttaagagaaa acaaaattta tatacaatat 13800 aagtaatatt catatatatg tgatgaatgc agtcttaacg agaagacatg gccttggtga 13860 caactctctt caaaccaact tcagcctttc tcaattcatc agcagatggg tcttcgattt 13920 gcaaagcagc caaagcggcg gtttaaacgc gtggccgtgc cgtc 13964 <210> 54 <211> 13963 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct: i85207 integration construct <400> 54 gacggcacgg ccacgcgttt aaaccgccag ggcaaggttg gcctctactt actccatcga 60 caattcaaga tacagaacct cctccagatg gaatcccttc catagagaga aggagcaagc 120 aactgaccca atattgactg ccactggacc tgaagacatg caacaaagtg caagcatagt 180 ggggccttct tccaatgcta atccggtcac tgccactgct gctacggaaa accaacctaa 240 aggtattaac ttcttcacta taagaaaatc acacgagcgc ccggacgatg tctctgttta 300 aatggcgcaa gttttccgct ttgtaatata tatttatacc cctttcttct ctcccctgca 360 atataatagt ttaattctaa tattaataat atcctatatt ttcttcattt accggcgcac 420 tctcgcccga acgacctcaa aatgtctgct acattcataa taaccaaaag ctcataactt 480 ttttttttga acctgaatat atatacatca catgtcactg ctggtccttg ccgaccagcg 540 tatacaatct cgatagttgg tttcccgttc tttccactcc cgtccgctcg tccaacgccg 600 gcggaccttc acatgtaggg accgaattgt ttacaagttc tctgtaccac catggagaca 660 tcaaagattg aaaatctatg gaaagatatg gacggtagca acaagaatat agcacgagcc 720 gcgaagttca tttcgttact tttgatatcg ctcacaacta ttgcgaagcg cttcagtgaa 780 aaaatcataa ggaaaagttg taaatattat tggtagtatt cgtttggtaa agtagagggg 840 gtaatttttc ccctttattt tgttcataca ttcttaaatt gctttgcctc tccttttgga 900 aagctatact tcggagcact gttgagcgaa ggctcattag atatattttc tgtcattttc 960 cttaacccaa aaataaggga aagggtccaa aaagcgctcg gacaactgtt gaccgtgatc 1020 cgaaggactg gctatacagt gttcacaaaa tagccaagct gaaaataatg tgtagctatg 1080 ttcagttagt ttggctagca aagatataaa agcaggtcgg aaatatttat gggcattatt 1140 atgcagagca tcaacatgat aaaaaaacct cccgcgacct ccaaaatcga actaccttca 1200 caatgactgc cgacaacaat agtatgcccc atggtgcagt atctagttac gccaaattag 1260 tgcaaaacca aacacctgaa gacattttgg aagagtttcc tgaaattatt ccattacaac 1320 aaagacctaa tacccgatct agtgagacgt caaatgacga aagcggagaa acatgttttt 1380 ctggtcatga tgaggagcaa attaagttaa tgaatgaaaa ttgtattgtt ttggattggg 1440 acgataatgc tattggtgcc ggtaccaaga aagtttgtca tttaatggaa aatattgaaa 1500 agggtttact acatcgtgca ttctccgtct ttattttcaa tgaacaaggt gaattacttt 1560 tacaacaaag agccactgaa aaaataactt tccctgatct ttggactaac acatgctgct 1620 ctcatccact atgtattgat gacgaattag gtttgaaggg taagctagac gataagatta 1680 agggcgctat tactgcggcg gtgagaaaac tagatcatga attaggtatt ccagaagatg 1740 aaactaagac aaggggtaag tttcactttt taaacagaat ccattacatg gcaccaagca 1800 atgaaccatg gggtgaacat gaaattgatt acatcctatt ttataagatc aacgctaaag 1860 aaaacttgac tgtcaaccca aacgtcaatg aagttagaga cttcaaatgg gtttcaccaa 1920 atgatttgaa aactatgttt gctgacccaa gttacaagtt tacgccttgg tttaagatta 1980 tttgcgagaa ttacttattc aactggtggg agcaattaga tgacctttct gaagtggaaa 2040 atgacaggca aattcataga atgctataac aacgcgtcaa taatataggc tacataaaaa 2100 tcataataac tttgttatca tagcaaaatg tgatataaaa cgtttcattt cacctgaaaa 2160 atagtaaaaa taggcgacaa aaatccttag taatatgtaa actttatttt ctttatttat 2220 ttacagaact ctgaatatac attgattgtt cacatttttt ttttctcttc tcaatttccc 2280 ttgattatat tcaaaaggtt attggcctct tgaatgtttc ccactgaatc cccgcgtgct 2340 tggccggccg tggagcgacc tcatgctata cctgagaaag caacctgacc tacaggaaag 2400 agttactcaa gaataagaat tttcgtttta aaacctaaga gtcactttaa aatttgtata 2460 cacttatttt ttttataact tatttaataa taaaaatcat aaatcataag aaattcgctc 2520 aaacgaccat tggatggaca aagaaggact tcatgtaaga tttcatgtca ccttcggcgt 2580 gagtgaaacc atcgttaaca gagtataaaa cttcacacat tctagccaag ttgatagctg 2640 gcattaacaa agggaatgga acggcggttg gtctcaaaga ttctctgtta ataaccttcc 2700 aggcgtcttc gacttttcta gagatgtatt cacaggcttc ttcttcagaa gcaccggatt 2760 ccttagaata acattcgatg gaggaggcaa catgacctct ttcttgttct tctttatgag 2820 agacaatatc atccatcaat ctaatgataa cacaagaagc ttcaacaata ggtgggtagg 2880 aagaaaccca tttaaaagtg tcctcgttaa caatgtcacc tctaccaacg taagatctag 2940 cagtgatcaa accgtaggta ccggtaacca tggaaacaga catgtactct tccaaagtag 3000 gcatgtaacc ttctttcaac catctggctt caaccaagta gtttctgacc aattccttag 3060 ccatttcctt aacgtagtgg atttgataag ccttaccttc cttttctaaa gattcttcca 3120 tttcaacgtg caagttaacc aattcttggt agatcaactt catgtattct ggcaacatgt 3180 ccaaacaaga aatggaccac ttctcaacgg cttgagtgaa aatttccaat tcttcgtagg 3240 taccgtagtt gtcgaaggta tcatccaaaa cgaccaacca catacaagac ttcatcaaga 3300 acattctggt tctggcatgt tgtggttcat agtaaataga caaaatccag aagtaacctt 3360 cgacaactct atcacgaacg aatggcaatt tgttttgcaa gtctaaatct ttccaccact 3420 tgcagatgtg agacaattct ttcttatgca tggattgcaa aacagagaaa tctaacttag 3480 ccaacttcaa caaaacctcg tcgtgagaag tttcttgttg gtaaattggc atatagtgta 3540 aagcttcgat tctggccaat cttcttctca atggttgctt caaggcttgg tggatttggg 3600 ttcttaagga agagtcacaa gatggatcct tggcaataat gtccaagtga accttagaga 3660 attccaaagc gttgtccaag atggtttcat cttcgactct catgaaagca gcttcgtaca 3720 aggccaagat accttgagcg tcgttacaca aagattcctt aaatttacct ttttcgtcca 3780 taaagtcctt gaaaacacca gaggagacat tgaaaccttg ttgacgcaac aaacgaaacc 3840 acaaggagat agattgtaaa ttttccttat cgacccattg ttcaccgtaa gtgacatgga 3900 tatgttgtaa agcttcttcg atttcttctt caaaatggta agcaatacct aaacgttgaa 3960 cagcattgat taattcgatc aacttaacat gttgcatagg ttcgttagaa cccttaatag 4020 taatcaattc cttcttaact tcctccttta actcttcgac taattgcttc ttcataacca 4080 agtcctctgg ttcatcgtaa gtcaaaaatt gatcacccca aatggaagcg ttgaagttag 4140 cggtatgtct aataacgtct ggcttggtag aatccttatc atcgacaaca attggggaag 4200 tagatggaga ggaagaaaca gaggaaatag gcaaagtgga cattgtaaag ttagttggtt 4260 gcgcgacttc gggtggggta agtatagagg tatattaaca attttttgtt gatactttta 4320 tgacatttga ataagaagta atacaaaccg aaaatgttga aagtattagt taaagtggtt 4380 atgcagcttt tgcatttata tatctgttaa tagatcaaaa atcatcgctt cgctgattaa 4440 ttaccccaga aataaggcta aaaaactaat cgcattatta tcctatggtt gttaatttga 4500 ttcgttgatt tgaaggtttg tggggccagg ttactgccaa tttttcctct tcataaccat 4560 aaaagctagt attgtagaat ctttattgtt cggagcagtg cggcgcgagg cacatctgcg 4620 tttcaggaac gcgaccggtg aagaccagga cgcacggagg agagtcttcc gtcggagggc 4680 tgtcgcccgc tcggcggctt ctaatccgta cttcaatata gcaatgagca gttaagcgta 4740 ttactgaaag ttccaaagag aaggtttttt taggctaaga taatggggct ctttacattt 4800 ccacaacata taagtaagat tagatatgga tatgtatatg gtggtattgc catgtaatat 4860 gattattaaa cttctttgcg tccatccaaa aaaaaagtaa cgcacgcaca ctcccgacag 4920 acaactagct tgataatggc ttcagaaaaa gaaattagga gagagagatt cttgaacgtt 4980 ttccctaaat tagtagagga attgaacgca tcgcttttgg cttacggtat gcctaaggaa 5040 gcatgtgact ggtatgccca ctcattgaac tacaacactc caggcggtaa gttaaataga 5100 ggtttgtccg ttgtggacac gtatgctatt ctctccaaca agaccgttga acaattgggg 5160 caagaagaat acgaaaaggt tgctattcta ggttggtgca ttgagttgtt gcaggcttac 5220 ttcttggtcg ccgatgatat gatggacaag tccattacca gaagaggcca accatgttgg 5280 tacaaggttc ctgaagttgg ggaaattgcc atcaatgacg cattcatgtt agaggctgct 5340 atctacaagc ttttgaaatc tcacttcaga aacgaaaaat actacataga tatcaccgaa 5400 ttgttccatg aagtcacctt ccaaaccgaa ttgggccaat tgatggactt aatcactgca 5460 cctgaagaca aagtcgactt gagtaagttc tccctaaaga agcactcctt catagttact 5520 ttcaagactg cttactattc tttctacttg cctgtcgcat tggctatgta cgttgccggt 5580 atcacagatg aaaaggattt gaaacaagcc agagatgtct tgattccatt gggtgaatat 5640 ttccaaattc aagatgacta cttagactgc ttcggtaccc cagaacagat cggtaagatc 5700 ggtacagata tccaagataa caaatgttct tgggtaatca acaaggcatt agaacttgct 5760 tccgcagaac aaagaaagac tttagacgaa aattacggta agaaggactc agtcgcagaa 5820 gccaaatgca aaaagatttt caatgacttg aaaatcgacc agttatacca cgaatatgaa 5880 gagtctgttg ccaaggattt gaaggccaag atctcccaag tcgacgagtc tcgtggcttc 5940 aaagccgacg tcttaactgc gtttttgaac aaggtttaca agagaagtaa atagaactaa 6000 cgctaatcga taaaacatta gatttcagat tagataagga ccatgtataa gaaatatata 6060 cttccactat aatatagtat aagcttacag atagtatctc tcgatctacc gttccacgtg 6120 actagtccaa gaacctgcag gccgcgagcg ccgatacgaa aatcgttatt gtcttgaagg 6180 tgaaatttct actcttatta atggtgaacg ttaagctgat gctatgatgg aagctgattg 6240 gtcttaactt gcttgtcatc ttgctaatgg tcattggctc gtgttattac ttaagttatt 6300 tgtactcgtt ttgaacgtaa tgctaatgat catcttatgg aataatagtg agtggtttca 6360 gggtccataa agcttttcaa ttcatctttt ttttttttgt tctttttttt gattccggtt 6420 tctttgaaat ttttttgatt cggtaatctc cgagcagaag gaagaacgaa ggaaggagca 6480 cagacttaga ttggtatata tacgcatatg tggtgttgaa gaaacatgaa attgcccagt 6540 attcttaacc caactgcaca gaacaaaaac ctgcaggaaa cgaagataaa tcatgtcgaa 6600 agctacatat aaggaacgtg ctgctactca tcctagtcct gttgctgcca agctatttaa 6660 tatcatgcac gaaaagcaaa caaacttgtg tgcttcattg gatgttcgta ccaccaagga 6720 attactggag ttagttgaag cattaggtcc caaaatttgt ttactaaaaa cacatgtgga 6780 tatcttgact gatttttcca tggagggcac agttaagccg ctaaaggcat tatccgccaa 6840 gtacaatttt ttactcttcg aagacagaaa atttgctgac attggtaata cagtcaaatt 6900 gcagtactct gcgggtgtat acagaatagc agaatgggca gacattacga atgcacacgg 6960 tgtggtgggc ccaggtattg ttagcggttt gaagcaggcg gcggaagaag taacaaagga 7020 acctagaggc cttttgatgt tagcagaatt gtcatgcaag ggctccctag ctactggaga 7080 atatactaag ggtactgttg acattgcgaa gagtgacaaa gattttgtta tcggctttat 7140 tgctcaaaga gacatgggtg gaagagatga aggttacgat tggttgatta tgacacccgg 7200 tgtgggttta gatgacaagg gagacgcatt gggtcaacag tatagaaccg tggatgatgt 7260 ggtctctaca ggatctgaca ttattattgt tggaagagga ctatttgcaa agggaaggga 7320 tgctaaggta gagggtgaac gttacagaaa agcaggctgg gaagcatatt tgagaagatg 7380 cggccagcaa aactaaaaaa ctgtattata agtaaatgca tgtatactaa actcacaaat 7440 tagagcttca atttaattat atcagttatt accacgaaaa tcgttattgt cttgaaggtg 7500 aaatttctac tcttattaat ggtgaacgtt aagctgatgc tatgatggaa gctgattggt 7560 cttaacttgc ttgtcatctt gctaatggtc atatggctcg tgttattact taagttattt 7620 gtactcgttt tgaacgtaat gctaatgatc atcttatgga ataatagtga atcggcgctc 7680 gcggcctgca ggtttcctca tcctagtatg tatagcttgt acccattaaa cgaattttat 7740 catgccgccg aaaggaacaa tttcaagtac tatcggaaga tgaatggtta gatgttaagc 7800 gcggtcactt caaacttcac atttataaag atgtcacatg gaccactatt atctacctta 7860 agttatttat caagataagt ttccggatct ttttctttcc taacacccca gtcagcctga 7920 gttacatcca gccattgaac cttagaaaat cttttgtcat cagcggtttg agccctaaga 7980 tcaacatctt gcttagcaat cactgcaatg gcgtcataac caccagcacc aggtattaag 8040 caagtaagaa ctccttttaa ggtctggcaa tcatccaata agctagtttg tacgggaggt 8100 tcgatatcgg caccagattc tttagttatt tttctaaagg aacgtctaat tgtggcaact 8160 gcatctctaa cttctgtgat ctcaggatac ttttgacagg tacagtcatt cctctcaaga 8220 gactcaaata tctgatcgct gtaatcgtca tgagtctcgt gtaagcgatc tagtttagat 8280 agtccatcca taaatctaga atttgcatga tcgagttctg tatatatttt caagctttcc 8340 ggcatatgcg aatcatacca attttttacc ttctggacca gttttactgt ttctgaacca 8400 ttcttaatat cgcccatcca taaagttaat cccgaaggta aatggttact tttaatcgtt 8460 atattccagt cttcttcatt aaccaaatgc gccagtttac tgccgtaagt agcacttcca 8520 atatctggca aattagagat taatgcgggt gggaatcttc tatatctgat agatccatat 8580 gctgccgccg ctacatcaaa cccgcttcca attttaccct gagcttgaca atgagcaact 8640 tgtgataaat tatgaataac ttctctatat ttgtctacat tattttccag gtccgataca 8700 aaaaaggagg ccaaagctgt agttaaaact gtgactaaac ctgccgagga gcccagccct 8760 gttttgggaa cttcttcaat tctgtgcgaa tgaaaactca atcttctgtt gccacgatgt 8820 tcggtaacgc tgtcctcctg agaatggtag gcatcatcag agaaaatatc aataacgaac 8880 aagtttctat tgcagtagtc gtccatgtta ggcttaaagt agctaaatac gttagcgata 8940 actttttcaa tgaaagggtt cttagatccg cctatcgaaa caggaatgaa gccagtttta 9000 ggacttatat ggtacagcca ctccccatct ttaaattgtt tacttttcac acgcacttca 9060 aacttatcag actcttgcaa tgaaccgtaa ggatgggcta cagcatgcat tcttgccgat 9120 aatccgacta caaatgcttc atatttcgga tctaaaacta aatatccacc agctagtaac 9180 gctttccctg gggcactgaa ggctctcaac tctgacatta tcaagctagt tgtctgtcgg 9240 gagtgtgcgt gcgttttttt atcatgttga tgctctgcat aataatgccc ataaatattt 9300 ccgacctgct tttatatctt tgctagccaa actaactgaa catagctaca cattattttc 9360 agcttggcta ttttgtgaac actgtatagc cagtccttcg gatcacggtc aacagttgtc 9420 cgagcgcttt ttggaccctt tcccttattt ttgggttaag gaaaatgaca gaaaatatat 9480 ctaatgagcc ttcgctcaac agtgctccga agtatagctt tccaaaagga gaggcaaagc 9540 aatttaagaa tgtatgaaca aaataaaggg gaaaaattac cccctctact ttaccaaacg 9600 aatactacca ataatattta caacttttcc ttatgatttt ttcactgaag cgcttcgcaa 9660 tagttgtgag cgatatcaaa agtaacgaaa tgaacttcgc ggctcgtgct atattcttgt 9720 tgctaccgtc catatctttc catagatttt caatctttga tgtctccatg gtggtacaga 9780 gaacttgtaa acaattcggt ccctacatgt gaacggccgg ccaagcacgc ggggatccga 9840 agcatgtagg gaggtcatga tatgaaaaag caaaagagta ggcatcaaaa agtttctcat 9900 tcaagtggta actgctgtta aaattaagat atttataaat tgaagcttgg tcgttccgac 9960 caataccgta gggaaacgta aattagctat tgtaaaaaaa ggaaaagaaa agaaaagaaa 10020 aatgttacat atcgaattga tcttattcct ttggtagacc agtctttgcg tcaatcaaag 10080 attcgtttgt ttcttgtggg cctgaaccga cttgagttaa aatcactctg gcaacatcct 10140 tttgcaactc aagatccaat tcacgtgcag taaagttaga tgattcaaat tgatggttga 10200 aagcctcaag ctgctcagta gtaaatttct tgtcccatcc aggaacagag ccaaacaatt 10260 tatagataaa tgcaaagagt ttcgactcat tttcagctaa gtagtacaac acagcatttg 10320 gacctgcatc aaacgtgtat gcaacgattg tttctccgta aaactgatta atggtgtggc 10380 accaactgat gatacgcttg gaagtgtcat tcatgtagaa tattggaggg aaagagtcca 10440 aacatgtggc atggaaagag ttggaatcca tcattgtttc ctttgcaaag gtggcgaaat 10500 ctttttcaac aatggcttta cgcatgactt caaatctctt tggtacgaca tgttcaattc 10560 tttctttaaa tagttcggag gttgccacgg tcaattgcat accctgagtg gaactcacat 10620 cctttttaat atcgctgaca actaggacac aagctttcat ctgaggccag tcagagctgt 10680 ctgcgatttg tactgccatg gaatcatgac catcttcagc ttttcccatt tcccaggcca 10740 cgtatccgcc aaacaacgat ctacaagctg aaccagaccc ctttcttgct attctagata 10800 tttctgaagt tgactgtggt aattggtata acttagcaat tgcagagacc aatgcagcaa 10860 agccagcagc ggaggaagct aaaccagctg ctgtaggaaa gttattttcg gagacaatgt 10920 ggagtttcca ttgagataat gtgggcaatg aggcgtcctt cgattccatt tcctttctta 10980 attggcgtag gtcgcgcaga caattttgag ttctttcatt gtcgatgctg tgtggttctc 11040 catttaacca caaagtgtcg cgttcaaact caggtgcagt agccgcagag gtcaacgttc 11100 tgaggtcatc ttgcgataaa gtcactgata tggacgaatt ggtgggcaga ttcaacttcg 11160 tgtccctttt cccccaatac ttaagggttg cgatgttgac gggtgcggta acggatgctg 11220 tgtaaacggt cattgtgaag gtagttcgat tttggaggtc gcgggaggtt actttttttt 11280 tggatggacg caaagaagtt taataatcat attacatggc aataccacca tatacatatc 11340 catatctaat cttacttata tgttgtggaa atgtaaagag ccccattatc ttagcctaaa 11400 aaaaccttct ctttggaact ttcagtaata cgcttaactg ctcattgcta tattgaagta 11460 cggattagaa gccgccgagc gggcgacagc cctccgacgg aagactctcc tccgtgcgtc 11520 ctggtcttca ccggtcgcgt tcctgaaacg cagatgtgcc tcgcgccgca ctgctccgaa 11580 caataaagat tctacaatac tagcttttat ggttatgaag aggaaaaatt ggcagtaacc 11640 tggccccaca aaccttcaaa tcaacgaatc aaattaacaa ccataggata ataatgcgat 11700 tagtttttta gccttatttc tggggtaatt aatcagcgaa gcgatgattt ttgatctatt 11760 aacagatata taaatgcaaa agctgcataa ccactttaac taatactttc aacattttcg 11820 gtttgtatta cttcttattc aaatgtcata aaagtatcaa caaaaaattg ttaatatacc 11880 tctatactta ccccacccga agtcgcgcaa ccaactaact ttacaatgtc attaccgttc 11940 ttaacttctg caccgggaaa ggttattatt tttggtgaac actctgctgt gtacaacaag 12000 cctgccgtcg ctgctagtgt gtctgcgttg agaacctacc tgctaataag cgagtcatct 12060 gcaccagata ctattgaatt ggacttcccg gacattagct ttaatcataa gtggtccatc 12120 aatgatttca atgccatcac cgaggatcaa gtaaactccc aaaaattggc caaggctcaa 12180 caagccaccg atggcttgtc tcaggaactc gttagtcttt tggatccgtt gttagctcaa 12240 ctatccgaat ccttccacta ccatgcagcg ttttgtttcc tgtatatgtt tgtttgccta 12300 tgcccccatg ccaagaatat taagttttct ttaaagtcta ctttacccat cggtgctggg 12360 ttgggctcaa gcgcctctat ttctgtatca ctggccttag ctatggccta cttggggggg 12420 ttaataggat ctaatgactt ggaaaagctg tcagaaaacg ataagcatat agtgaatcaa 12480 tgggccttca taggtgaaaa gtgtattcac ggtacccctt caggaataga taacgctgtg 12540 gccacttatg gtaatgccct gctatttgaa aaagactcac ataatggaac aataaacaca 12600 aacaatttta agttcttaga tgatttccca gccattccaa tgatcctaac ctatactaga 12660 attccaaggt ctacaaaaga tcttgttgct cgcgttcgtg tgttggtcac cgagaaattt 12720 cctgaagtta tgaagccaat tctagatgcc atgggtgaat gtgccctaca aggcttagag 12780 atcatgacta agttaagtaa atgtaaaggc accgatgacg aggctgtaga aactaataat 12840 gaactgtatg aacaactatt ggaattgata agaataaatc atggactgct tgtctcaatc 12900 ggtgtttctc atcctggatt agaacttatt aaaaatctga gcgatgattt gagaattggc 12960 tccacaaaac ttaccggtgc tggtggcggc ggttgctctt tgactttgtt acgaagagac 13020 attactcaag agcaaattga cagtttcaaa aagaaattgc aagatgattt tagttacgag 13080 acatttgaaa cagacttggg tgggactggc tgctgtttgt taagcgcaaa aaatttgaat 13140 aaagatctta aaatcaaatc cctagtattc caattatttg aaaataaaac taccacaaag 13200 caacaaattg acgatctatt attgccagga aacacgaatt taccatggac ttcataagct 13260 aatttgcgat aggcattatt tattagttgt ttttaatctt aactgtgtat gaagttttat 13320 gtaataaaga tagaaagaga aacaaaaaaa aatttttcgt agtatcaatt cagctttcga 13380 agacagaatg aaatttaagc agaccatagt atccttgata cattgactca ggtccgccgg 13440 cgttggacga gcgaagcatc ttgccctgtg cttggccccc agtgcagcga acgttataaa 13500 aacgaatact gagtatatat ctatgtaaaa caaccatatc atttcttgtt ctgaactttg 13560 tttacctaac tagttttaaa tttccctttt tcgtgcatgc gggtgttctt atttattagc 13620 atactacatt tgaaatatca aatttcctta gtagaaaagt gagagaaggt gcactgacac 13680 aaaaaataaa atgctacgta taactgtcaa aactttgcag cagcgggcat ccttccatca 13740 tagcttcaaa catattagcg ttcctgatct tcatacccgt gctcaaaatg atcaaacaaa 13800 ctgttattgc caagaaataa acgcaaggct gccttcaaaa actgatccat tagatcctca 13860 tatcaagctt cctcatagaa cgcccaatta caataagcat gttttgctgt tatcaccggg 13920 tgataggttt gctcaggcgg tttaaacgcg tggccgtgcc gtc 13963

Claims

이소프레노이드를 생산할 수 있는 유전자 변형된 숙주 세포로서,
상기 세포는,
(a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종 핵산; 및
(b) 아실화 아세틸알데하이드 데하이드로게나제 (ADA)를 코딩하는 이종 핵산을 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항에 있어서, 상기 MEV 경로의 하나 이상의 효소가 아세틸-CoA를 말로닐-CoA와 축합하여 아세토아세틸-CoA를 형성하는 효소를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항 또는 제2항에 있어서, 상기 MEV 경로의 하나 이상의 효소가 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항 내지 제3항 중 어느 한항에 있어서, 상기 MEV 경로의 하나 이상의 효소가 3-하이드록시-3-메틸글루타릴-CoA (HMG-CoA)를 메발로네이트로 변환하는 NADH-가용성 효소를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항 내지 제4항 중 어느 한항에 있어서, 상기 MEV 경로의 하나 이상의 효소가 NADH-가용성 HMG-CoA 리덕타제를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항 내지 제5항 중 어느 한항에 있어서, 포스포케톨라제 (PK)를 코딩하는 이종의 핵산을 추가로 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항 내지 제6항 중 어느 한항에 있어서, 포스포트랜스아세틸라제 (PTA)를 코딩하는 이종의 핵산을 추가로 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항 내지 제7항 중 어느 한항에 있어서, 천연적인 피루베이트 데하이드로게나제 (PDH)-바이패스의 하나 이상의 효소가 기능적으로 파괴된 것을 추가로 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제8항에 있어서, 상기 PDH-바이패스의 하나 이상의 효소가 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로부터 선택되는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제9항에 있어서, ACS1이 기능적으로 파괴된 것을 특징으로 하는 유전자 변형된 숙주 세포.
제9항에 있어서, ACS2가 기능적으로 파괴된 것을 특징으로 하는 유전자 변형된 숙주 세포.
제9항에 있어서, ALD6가 기능적으로 파괴된 것을 특징으로 하는 유전자 변형된 숙주 세포.
제9항에 있어서, ACS1 및 ACS2가 기능적으로 파괴된 것을 특징으로 하는 유전자 변형된 숙주 세포.
제9항에 있어서, ACS1, ACS2 및 ALD6가 기능적으로 파괴된 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항 내지 제14항 중 어느 한항에 있어서, 알코올 데하이드로게나제 (ADH) 활성을 가진 하나 이상의 효소가 기능적으로 파괴된 것을 더 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제15항에 있어서, 상기 ADH 활성을 가진 하나 이상의 효소가 알코올 데하이드로게나제 1 (ADH1), 알코올 데하이드로게나제 3 (ADH3), 알코올 데하이드로게나제 4 (ADH4) 및 알코올 데하이드로게나제 5 (ADH5)로 이루어진 군으로부터 선택되는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항 내지 제16항 중 어느 한항에 있어서, 상기 ADA의 아미노산 서열이 서열번호 2와 80% 이상 동일한 것을 특징으로 하는 유전자 변형된 숙주 세포.
제3항에 있어서, 상기 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제의 아미노산 서열이 서열번호 16과 80% 이상 동일한 것을 특징으로 하는 유전자 변형된 숙주 세포.
제5항에 있어서, 상기 NADH-가용성 HMG-CoA 리덕타제의 아미노산 서열이 서열번호 20과 80% 이상 동일한 것을 특징으로 하는 유전자 변형된 숙주 세포.
제6항에 있어서, 상기 포스포케톨라제 (PK)의 아미노산 서열이 서열번호 12와 80% 이상 동일한 것을 특징으로 하는 유전자 변형된 숙주 세포.
제7항에 있어서, 상기 포스포트랜스아세틸라제 (PTA)의 아미노산 서열이 서열번호 14와 80% 이상 동일한 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항, 제4항 내지 제17항 또는 제19항 내지 제21항 중 어느 한항에 있어서, 상기 MEV 경로의 하나 이상의 효소가 아세틸-CoA 분자 2개를 축합하여 아세토아세틸-CoA를 형성하는 효소를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항 내지 제22항 중 어느 한항에 있어서, 상기 MEV 경로의 하나 이상의 효소가 아세토아세틸-CoA를 아세틸-CoA와 축합하여 HMG-CoA를 형성하는 효소를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항 내지 제3항, 제6항 내지 제18항, 또는 제20항 내지 제22항 중 어느 한항에 있어서, 상기 MEV 경로의 하나 이상의 효소가 HMG-CoA를 메발로네이트로 변환하는 효소를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항 내지 제24항 중 어느 한항에 있어서, 상기 MEV 경로의 하나 이상의 효소가 메발로네이트를 메발로네이트 5-포스페이트로 인산화하는 효소를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항 내지 제25항 중 어느 한항에 있어서, 상기 MEV 경로의 하나 이상의 효소가 메발로네이트 5-포스페이트를 메발로네이트 5-피로포스페이트로 변환하는 효소를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항 내지 제26항 중 어느 한항에 있어서, 상기 MEV 경로의 하나 이상의 효소가 메발로네이트 5-피로포스페이트를 이소펜테닐 피로포스페이트로 변환하는 효소를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항 내지 제27항 중 어느 한항에 있어서, 상기 MEV 경로의 하나 이상의 효소가 HMG-CoA 신타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 및 메발로네이트 피로포스페이트 데카르복실라제로부터 선택되는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항 내지 제28항 중 어느 한항에 있어서, 상기 숙주 세포가 상기 MEV 경로의 모든 효소를 코딩하는 복수의 이종의 핵산을 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항 내지 제29항 중 어느 한항에 있어서, 상기 MEV 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종의 핵산이 단일 전사 조절인자의 통제를 받는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항 내지 제29항 중 어느 한항에 있어서, 상기 MEV 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종의 핵산이 복수의 이종 전사 조절인자의 통제를 받는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항 내지 제31항 중 어느 한항에 있어서, 이소펜테닐 피로포스페이트 (IPP)를 다이메틸알릴 피로포스페이트 (DMAPP)로 변환할 수 있는 효소를 코딩하는 이종의 핵산을 더 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항 내지 제32항 중 어느 한항에 있어서, IPP 및/또는 DMAPP 분자를 축합하여 폴리프레닐 화합물을 형성할 수 있는 효소를 코딩하는 이종의 핵산을 더 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항 내지 제33항 중 어느 한항에 있어서, IPP 또는 폴리프레닐을 변형하여 이소프레노이드 화합물을 형성할 수 있는 효소를 코딩하는 이종의 핵산을 더 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제34항에 있어서, 상기 IPP 또는 폴리프레닐을 변형하여 이소프레노이드 화합물을 형성할 수 있는 효소가 카렌 신타제 (carene synthase), 게라니올 신타제 (geraniol synthase), 리날롤 신타제 (linalool synthase), 리모넨 신타제 (limonene synthase), 미르센 신타제 (myrcene synthase), 옥시멘 신타제 (ocimene synthase), α-피넨 신타제 (α-pinene synthase), β-피넨 신타제 (β-pinene synthase), γ-테르피넨 신타제 (γ-terpinene synthase), 테르피놀렌 신타제 (terpinolene synthase), 아모르파디엔 신타제 (amorphadiene synthase), α-파르네센 신타제 (α-farnesene synthase), β-파르네센 신타제 (β-farnesene synthase), 파르네솔 신타제 (farnesol synthase), 네롤리돌 신타제 (nerolidol synthase), 패출리올 신타제 (patchouliol synthase), 노트카톤 신타제 (nootkatone synthase) 및 아비에타디엔 신타제 (abietadiene synthase)로 이루어진 군으로부터 선택되는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제34항에 있어서, 상기 이소프레노이드는 헤미테르펜, 모노테르펜, 다이테르펜, 트리테르펜, 테트라테르펜, 세스퀴테르펜 및 폴리테르펜으로 이루어진 군으로부터 선택되는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제34항에 있어서, 상기 이소프레노이드가 세스퀴테르펜인 것을 특징으로 하는 유전자 변형된 숙주 세포.
제34항에 있어서, 상기 이소프레노이드가 C₅-C₂₀ 이소프레노이드인 것을 특징으로 하는 유전자 변형된 숙주 세포.
제34항에 있어서, 상기 이소프레노이드가 아비에타디엔, 아모르파디엔, 카렌, α-파르네센, β-파르네센, 파르네솔, 게라니올, 게라닐게라니올, 이소프렌, 리날롤, 리모넨, 미르센, 네롤리돌, 옥시멘, 패출롤, β-피넨, 사비넨, γ-테르피넨, 테르피놀렌 및 발렌센으로 이루어진 군으로부터 선택되는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제1항 내지 제39항 중 어느 한항에 있어서, 상기 세포가 효모 세포인 것을 특징으로 하는 유전자 변형된 숙주 세포.
제40항에 있어서, 상기 효모 세포가 액시쿨로코니듐 (Aciculoconidium), 암브로시오지마 (Ambrosiozyma), 아르트로아스쿠스 (Arthroascus), 아릭시오지마 (Arxiozyma), 아쉬비아 (Ashbya), 바브제비아 (Babjevia), 벤싱토니아 (Bensingtonia), 보트리오아스쿠스 (Botryoascus), 보트리오지마 (Botryozyma), 브레타노마이세스 (Brettanomyces), 불레라 (Bullera), 불레로마이세스 (Bulleromyces), 칸디다 (Candida), 시테로마이세스 (Citeromyces), 클라비스포라 (Clavispora), 크립토코커스 (Cryptococcus), 시스토필로바시듐 (Cystofilobasidium), 데바리오마이세스 (Debaryomyces), 데카라 (Dekkara), 디포다스콥시스 (Dipodascopsis), 디포다스쿠스 (Dipodascus), 에니엘라 (Eeniella), 엔도마이콥셀라 (Endomycopsella), 에레마스쿠스 (Eremascus), 에레모테시움 (Eremothecium), 에리트로바시듐 (Erythrobasidium), 펠로마이세스 (Fellomyces), 필로바시듐 (Filobasidium), 갈락토마이세스 (Galactomyces), 제오트리쿰 (Geotrichum), 귈리리에르몬델라 (Guilliermondella), 한세니아스포라 (Hanseniaspora), 한세눌라 (Hansenula), 하세가와이 (Hasegawaea), 폴터마니아 (Holtermannia), 호르모아스쿠스 (Hormoascus), 하이포피키아 (Hyphopichia), 이사첸티아 (Issatchenkia), 클로엑케라 (Kloeckera), 클로엑케라스포라 (Kloeckeraspora), 클루이베로마이세스 (Kluyveromyces), 콘도아 (Kondoa), 쿠라이시아 (Kuraishia), 쿠르츠마모마이세스 (Kurtzmanomyces), 루코스포리듐 (Leucosporidium), 리포마이세스 (Lipomyces), 로데로마이세스 (Lodderomyces), 말라세지아 (Malassezia), 메츠니코위아 (Metschnikowia), 므라키아 (Mrakia), 믹소지마 (Myxozyma), 나드소니아 (Nadsonia), 나카자와에아 (Nakazawaea), 네마토스포라 (Nematospora), 오가타에 (Ogataea), 오스포리디움 (Oosporidium), 파키솔렌 (Pachysolen), 파키티코스포라 (Phachytichospora), 파피아 (Phaffia), 피키아 (Pichia), 로도스포리듐 (Rhodosporidium), 로도토룰라 (Rhodotorula), 사카로마이세스 (Saccharomyces), 사카로마이코데스 (Saccharomycodes), 사카로마이콥시스 (Saccharomycopsis), 사이토엘라 (Saitoella), 사카구키아 (Sakaguchia), 사투라노스포라 (Saturnospora), 스키조블라스토스포리온 (Schizoblastosporion), 스키조사카로마이세스 (Schizosaccharomyces), 슈반니오마이세스 (Schwanniomyces), 스포리디오볼루스 (Sporidiobolus), 스포로볼로마이세스 (Sporobolomyces), 스포로파키더미아 (Sporopachydermia), 스테파노아스쿠스 (Stephanoascus), 스테리그마토마이세스 (Sterigmatomyces), 스테리그마토스포리듐 (Sterigmatosporidium), 심비오타프리나 (Symbiotaphrina), 심포디오마이세스 (Sympodiomyces), 심포디오마이콥시스 (Sympodiomycopsis), 토룰라스포라 (Torulaspora), 트리코스포리엘라 (Trichosporiella), 트리코스포론 (Trichosporon), 트리고놉시스 (Trigonopsis), 츠키야에아 (Tsuchiyaea), 우데니오마이세스 (Udeniomyces), 왈토마이세스 (Waltomyces), 윅커하미아 (Wickerhamia), 윅커하미엘라 (Wickerhamiella), 빌리옵시스 (Williopsis), 야마다지마 (Yamadazyma), 야로위니아 (Yarrowia), 자이고아스쿠스 (Zygoascus), 자이고사카로마이세스 (Zygosaccharomyces), 자이고빌리옵시스 (Zygowilliopsis) 및 자이고지마 (Zygozyma)로 이루어진 군으로부터 선택되는 속에 속하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제40항에 있어서, 상기 효모가 사카로마이세스 세레비지애 (Saccharomyces cerevisiae), 피키아 패스토리스 (Pichia pastoris), 스키조사카로마이세스 폼베 (Schizosaccharomyces pombe), 데케라 브룩셀렌시스 (Dekkera bruxellensis), 클루이베로마이세스 락티스 (Kluyveromyces lactis) (이전 명칭: 사카로마이세스 락티스 (Saccharomyces lactis)), 클루이베로마이세스 마르시아누스 (Kluyveromyces marxianus), 아르술라 아데니니보란스 (Arxula adeninivorans) 및 한세눌라 폴리모르파 (Hansenula polymorpha) (현재 피키아 앙구스타 (Pichia angusta)라고도 함)로 이루어진 군으로부터 선택되는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제40항에 있어서, 상기 효소가 칸디다 리폴리티카 (Candida lipolytica), 칸디다 길리어몬디 (Candida guilliermondii), 칸디다 크루세이 (Candida krusei), 칸디다 슈도트로피칼리스 (Candida pseudotropicalis) 및 칸디다 유틸리스 (Candida utilis)로 이루어진 군으로부터 선택되는 것을 특징으로 하는 유전자 변형된 숙주 세포.
제40항에 있어서, 상기 효모가 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)인 것을 특징으로 하는 유전자 변형된 숙주 세포.
제44항에 있어서, 상기 효모가 빵 효모, CBS 7959, CBS 7960, CBS 7961, CBS 7962, CBS 7963, CBS 7964, IZ-1904, TA, BG-1, CR-1, SA-1, M-26, Y-904, PE-2, PE-5, VR-1, BR-1, BR-2, ME-2, VR-2, MA-3, MA-4, CAT-1, CB-1, NR-1, BT-1 및 AL-1으로 이루어진 군으로부터 선택되는 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 균주인 것을 특징으로 하는 유전자 변형된 숙주 세포.
이소프레노이드를 생산할 수 있는 유전자 변형된 숙주 세포로서,
상기 세포는,
(a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종의 핵산;
(b) 아세틸알데하이드 데하이드로게나제, 아세틸화 (ADA)를 코딩하는 이종의 핵산;
(c) 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로 이루어진 군으로부터 선택되는 천연적인 PDH-바이패스의 하나 이상의 효소의 기능적 파괴;
(d) 포스포케톨라제 (PK)를 코딩하는 이종의 핵산; 및
(e) 포스포트랜스아세틸라제 (PTA)를 코딩하는 이종의 핵산을 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
이소프레노이드를 생산할 수 있는 유전자 변형된 숙주 세포로서,
상기 세포는,
(a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종의 핵산으로서, 상기 하나 이상의 효소는 NADH-가용성 HMG-CoA 리덕타제를 포함하는 것인, 핵산;
(b) 아세틸알데하이드 데하이드로게나제, 아세틸화 (ADA)를 코딩하는 이종의 핵산; 및
(c) 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로 이루어진 군으로부터 선택되는 천연적인 PDH-바이패스의 하나 이상의 효소의 기능적 파괴를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
이소프레노이드를 생산할 수 있는 유전자 변형된 숙주 세포로서,
상기 세포는,
(a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종의 핵산으로서, 상기 하나 이상의 효소는 NADH-가용성 HMG-CoA 리덕타제를 포함하는 것인, 핵산;
(b) 아세틸알데하이드 데하이드로게나제, 아세틸화 (ADA)를 코딩하는 이종의 핵산;
(c) 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로 이루어진 군으로부터 선택되는 천연적인 PDH-바이패스의 하나 이상의 효소의 기능적 파괴;
(d) 포스포케톨라제 (PK)를 코딩하는 이종의 핵산; 및
(e) 포스포트랜스아세틸라제 (PTA)를 코딩하는 이종의 핵산을 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
이소프레노이드를 생산할 수 있는 유전자 변형된 숙주 세포로서,
상기 세포는,
(a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종의 핵산으로서, 상기 하나 이상의 효소는 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제를 포함하는 것인, 핵산;
(b) 아세틸알데하이드 데하이드로게나제, 아세틸화 (ADA)를 코딩하는 이종의 핵산; 및
(c) 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로 이루어진 군으로부터 선택되는 천연적인 PDH-바이패스의 하나 이상의 효소의 기능적 파괴를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
이소프레노이드를 생산할 수 있는 유전자 변형된 숙주 세포로서,
상기 세포는,
(a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 하나 이상의 효소를 코딩하는 복수의 이종 핵산으로서, 상기 복수의 효소는 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제와 NADH-가용성 HMG-CoA 리덕타제를 포함하는 것인, 핵산;
(b) 아세틸알데하이드 데하이드로게나제, 아세틸화 (ADA)를 코딩하는 이종의 핵산;
(c) 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로 이루어진 군으로부터 선택되는 천연적인 PDH-바이패스의 하나 이상의 효소의 기능적 파괴;
(d) 포스포케톨라제 (PK)를 코딩하는 이종의 핵산; 및
(e) 포스포트랜스아세틸라제 (PTA)를 코딩하는 이종의 핵산을 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
이소프레노이드의 제조 방법으로서,
(a) 제1항 내지 제50항 중 어느 한항에 따른 유전자 변형된 효소 세포를, 상기 이소프레노이드 화합물을 생산하기에 적합한 조건 하에, 탄소원이 구비된 배지에서 배양하는 단계; 및
(b) 상기 이소프레노이드 화합물을 상기 배지로부터 회수하는 단계를 포함하는 것인, 제조 방법.
제51항에 있어서, 상기 이소프레노이드 화합물이 배지 1 L 당 > 약 10 mg의 양으로 제조되는 것을 특징으로 하는 제조 방법.
제51항에 있어서, 상기 이소프레노이드 화합물이 건조 세포 중량 1 g 당 > 약 50 mg의 양으로 제조되는 것을 특징으로 하는 제조 방법.
제51항 내지 제53항 중 어느 한항에 있어서, 상기 숙주 세포가 상기 ADA를 코딩하는 이종의 뉴클레오티드 서열을 포함하지 않는 동일 숙주 세포에 비해 이소프레노이드 화합물을 증가된 양으로 제조하는 것을 특징으로 하는 제조 방법.
제54항에 있어서, 상기 증가된 양이 10% 이상인 것을 특징으로 하는 제조 방법.