KR102215530B1

KR102215530B1 - 개선된 아세틸-ｃｏａ 카르복실라아제 변이체

Info

Publication number: KR102215530B1
Application number: KR1020167009710A
Authority: KR
Inventors: 데렉 엘. 그린필드; 도날드 이. 트림버; 안드레아스 더블유. 셔머; 신디 창; 베나즈 베로우지안; 제시카 윙어
Original assignee: 알이지 라이프 사이언시스, 엘엘씨
Priority date: 2013-09-13
Filing date: 2014-09-12
Publication date: 2021-02-15
Also published as: EP2964756B1; BR112016006859A2; CN110791482A; JP6837089B2; JP6486372B2; US20210009983A1; EP2964756A2; WO2015038970A3; CN105705513A; AU2014318531A1; MX2016003255A; JP2019103507A; CN105705513B; ES2631807T3; US11142756B2; CA2923730A1; US10604750B2; AU2014318531B2; CN113493759A; EP3739042A1

Abstract

본 발명은 지방산 유도체를 포함하는 말로닐-CoA 유래 화합물의 생성을 위해 아세틸-CoA 카르복실라아제(ACC) 변이체들 및 이들을 발현시키는 숙주 세포들에 관한 것이다. 또한, 증가된 양의 말로닐-CoA 유래 화합물들 및 관련 세포 배양물들을 생성하는 방법들이 고려된다.

Description

개선된 아세틸-ＣＯＡ 카르복실라아제 변이체{IMPROVED ACETYL-COA CARBOXYLASE VARIANTS}

관련 출원에 대한 상호-참조

본 출원은 2013년 9월 13일에 출원된 미국 가출원 61/877,418 및 2013년 10월 17일에 출원된 미국 가출원 61/892,242의 이익을 주장하며, 이의 전체 내용이 본 명세서에서 인용 참조된다.

서열 목록

본 출원은 EFS-Web을 통하여 ASCII 포맷으로 제출된 서열 목록을 포함하며, 본 명세서에서 전문이 인용 참조된다. 2014년 9월 12일에 작성된 상기의 ASCII의 복사본은 파일명을 LS00050PCT_SL.txt라고 하였고, 크기는 128,259 바이트이다.

분야

본 발명은 지방산 유도체를 포함하는 말로닐-CoA 유래 화합물의 생성을 위한 아세틸-CoA 카르복실라아제(ACC) 변이체들에 관한 것이다. 또한, ACC 변이체 및 관련 세포 배양물(cell culture)을 발현시키는 숙주 세포들이 고려된다. 나아가, ACC 변이체들을 발현시키는 숙주 세포들을 이용함으로써 말로닐-CoA 유래 화합물들을 생성하는 방법들이 포함된다.

석유는 액체, 기체 또는 고체 형태로 지구에서 발견되는 제한된 천연 자원이다. 하지만, 석유 제품은 재정적인 면과 환경적인 면에서 상당한 비용으로 개발된다. 그 자연적인 형태로, 지구에서 추출된 원유는 몇 가지 상업적인 용도를 갖는다. 이는, 가변적인 길이 및 복잡도의 탄화수소, 예를 들어 파라핀(또는 알칸), 올레핀(또는 알켄), 알킨, 나프텐(또는 시클로알칸), 지방족 화합물, 방향족 화합물 등의 혼합물이다. 또한, 원유는 다른 유기 화합물(예를 들어, 질소, 산소, 황 등을 함유한 유기 화합물) 및 불순물(예를 들어, 황, 염, 산, 금속 등)을 함유한다. 이의 높은 에너지 밀도와 용이한 수송성(transportability)으로 인해, 대부분의 석유는 수송 연료(예를 들어, 가솔린, 디젤, 항공유 등), 난방유, 액화 석유 가스 등과 같은 연료로 정제된다.

석유화학은 플라스틱, 수지, 섬유, 엘라스토머, 의약품, 윤활제, 또는 젤 등과 같은 특수 화학제품을 제조하는 데 사용될 수 있다. 특수 화학제품은 다수의 상업적인 용도를 갖는다. 석유화학 원료로부터 생성될 수 있는 특수 화학제품의 예시들은 지방산, 탄화수소[예를 들어, 긴 사슬형 탄화수소(long chain hydrocarbons), 분지쇄형 탄화수소(branched chain hydrocarbons), 포화 탄화수소, 불포화 탄화수소 등], 지방족 알코올, 지방족 에스테르, 지방족 알데히드, 케톤, 윤활제 등을 포함한다. 지방산은 계면활성제로서 상업적으로 이용된다. 계면활성제는, 예를 들어 세제 및 비누에서 발견될 수 있다. 또한, 지방산은 연료의 첨가제, 윤활유, 페인트, 래커(lacquers), 양초, 쇼트닝, 화장품, 및 유화제로서 사용될 수 있다. 또한, 지방산은 고무 제품에서 촉진 활성제(accelerator activator)로서 사용된다. 또한, 지방산은 메틸 에스테르, 아미드, 아민, 산 클로라이드(acid chlorides), 무수물, 케텐 다이머(ketene dimer), 및 퍼옥시산 및 에스테르를 생성하기 위한 공급원료(feedstock)로서 사용될 수 있다.

지방족 에스테르는 다수의 상업적인 용도를 갖는다. 예를 들어, 대체 연료인 바이오디젤은 에스테르[예를 들어, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE) 등]로 이루어져 있다. 몇몇 저 분자량의 에스테르는 방향제 또는 착향료로서 유용하게 하는 기분 좋은 냄새(pleasant odor)를 갖는 휘발성이다. 또한, 에스테르는 래커, 페인트 및 바니쉬에 대한 용매로서 사용된다. 또한, 왁스, 지방 및 오일과 같이 자연적으로 발생하는 몇몇 물질이 에스테르로 이루어진다. 또한, 에스테르는 수지 및 플라스틱의 연화제, 가소제, 난연제, 및 가솔린 및 오일의 첨가제로서 사용된다. 또한, 에스테르는 중합체, 필름, 직물, 염료, 및 의약품의 제조에도 사용될 수 있다.

유사하게, 지방족 알코올도 많은 상업적인 용도를 갖는다. 예를 들어, 지방족 알코올들 및 그들의 유도체의 세계 연간 판매량은 미화 10억 달러를 넘어선다. 짧은 사슬형 지방족 알코올들은 유화제, 연화제 및 증점제(thickener)로서 화장품 및 식품 산업에 사용된다. 이들의 양친매성(amphiphilic) 성질로 인해, 지방족 알코올들은 비이온성 계면활성제처럼 거동하고, 상기 비이온성 계면활성제는 예를 들어 세제와 같은 개인 위생 용품 및 가정 용품에 유용하다. 또한, 지방족 알코올들은 왁스, 검(gum), 수지, 의약용 로션, 윤활유 첨가제, 직물 정전기 방지제 및 가공제(finishing agents), 가소제, 화장품, 공업 용매 및 지방용 용매에 사용된다.

아세틸 CoA 카르복실라아제(ACC)는 지방산 합성 및 분해를 조절하는 데 중요한 역할을 한다. 이는, 지방산 생합성의 제 1 개입 단계(committed step)를 촉매화하는, 즉 아세틸-CoA를 말로닐-CoA로 비가역적으로 카르복실화하는 비오틴-의존적 효소 복합체(biotin-dependent enzyme complex)이다. ACC는 이의 2 개의 촉매 활성, 즉 비오틴 카르복실라아제(BC) 및 카르복실트랜스퍼라아제(CT)를 통해 말로닐-CoA를 생성한다. 대부분의 원핵생물에서, ACC는 다수의 조절 수준을 통해 동등한 발현(coordinate expression)이 조절되는 별개의 유전자들에 의해 코딩되는 4 개의 폴리펩티드(서브유닛)를 포함하는 다-서브유닛 효소이다(Cronan 외 (2002) Progress in Lipid Research 41:407-435; James 외 (2004) Journal of Biological Chemistry 279(4):2520-2527). ACC의 4 개의 폴리펩티드는 복합체를 고정된 비율로 조립한다(Broussard 외 (2013) Structure 21:650-657). 더 구체적으로, ACC 반응은 4 개의 단백질, 즉 비오틴 카르복실라아제(BC), 비오티노일(또는 비오틴) 카르복실 운반 단백질(BCCP) 및 카르복실트랜스퍼라아제(CT)를 형성하는 2 개의 단백질을 필요로 한다. 전체 ACC 반응은 산-불안정성(acid-labile) NaH¹⁴C0₃의 산-안정성 말론산으로의 ATP-의존적 전환에 의해 검사(assay)될 수 있다. 박테리아 및 식물 플라스미드(plant plastid)의 ACC 서브유닛들 간에 유사성 및 차이점이 존재한다. 하지만, 식물 단백질들의 복합성에도 불구하고, ACC 활성에 필수적인 서열들은 박테리아 동족체(bacterial homologue)와 크게 다르지 않다(Cronan 외, 위 참조).

대장균 ACC는 알려진 ACC 효소들에 덜 안정하다는 것이 보고되었다. 2 개의 부분 반응은 희석 단백질 용액에서 측정될 수 있다 하더라도, 4 개의 모든 서브유닛이 고농도로 존재할 때에만 전체 활성이 측정될 수 있다. 안정한 복합체들은 BC 복합체 및 CT α ₂ β ₂ 복합체인 것으로 여겨진다. 전체 길이의 BCCP는 다이머로서 정제되었으며, 불안정한 BC₂-BCCP₂ 복합체의 존재의 힌트이다. 다른 박테리아 ACC는 대장균보다 더 안정할 것이며, ACC 활성은 헬리코박터 파일로리(Helicobacter pylori) 및 슈도모나스 시트로넬로리스(Pseudomonas citronellolis)의 희석 추출물에서 측정될 수 있다. 또한, 식물 플라스미드 ACC도 대장균 ACC보다 더 안정할 것이다. 하지만, 대장균에서와 같이 온전한 효소(intact enzyme)의 추가 정제는 ACC 활성의 해리 및 손실을 유도(result in)하며, 이는 부분 반응 활성을 포함하는 프랙션(fraction)들을 혼합함으로써 회복될 수 있다. 서브복합체들은 BC-BCCP 및 CT이고, 온전한 BCCP가 없거나 CT 베타가 없는 것에 대한 증거는 없으며, BCCP 및 CT 베타가 용액에 없다면 분해된 것으로 추정한다(Cronan 외, 위 참조).

accA, accB, accC 및 accD를 포함하는 대장균 acc 유전자들의 식별은 ACC 단백질의 연구를 가능하게 하였다. ACC 서브유닛들 BCCP 및 CT 베타를 각각 코딩하는 유전자들 accB 및 accD에 포함되어 있는 지방산 합성의 돌연변이체들을 분리(isolate)시키기 위해, 방사선 자멸 선택(radiation suicide selection)이 사용되었다. accB 돌연변이체는 더 광범위하게 연구되었으며, 돌연변이 G133S는 온도 민감성 성장을 담당한다. 이 돌연변이는 비오티노일 도메인 내에서 입체 충돌(steric clash)을 유도한다. 이 결과적인 돌연변이 단백질은 더 고온에서 쉽게 변성되며, 따라서 세포내 프로테아제에 민감하다. 돌연변이 BCCP 균주는 30 ℃에서 성장될 때 BCCP의 정상 수준의 약 25 %만을 갖지만, 성장 속도 및 지방산 합성은 정상이다(Cronan 외, 위 참조). 하지만, ACC의 4 개의 모든 단백질의 농도를 증가시키는 것이 지방산 생합성을 통한 플럭스(flux)를 어느 정도 개선시킬 수 있음이 알려져 있다(Davis 외 (2000) Journal of Biological Chemistry 275(37):28593-28598). 반대로, 대장균 ACC는 ACP의 아실화 유도체들에 의해 억제될 수 있는 한편, 아실 모이어티가 부족한 ACP는 ACC를 억제할 수 없는 것으로 나타났다(Davies 외 (2001) Journal of Bacteriology 183(4): 1499-1503).

현재 석유로부터 유래되는 연료와 제품 둘 모두를 생성하기 위한 대안적인 루트에 대한 필요성이 존재한다. 이와 같이, 미생물 시스템은 다수의 타입의 바이오연료와 화학물질의 생물학적 생성에 대한 잠재력을 제공한다. 재생가능한 연료 및 화학물질은 [박테리아, 효모, 조류(algae)와 같이] 유전적으로 조작된 유기체(genetically engineered organism)들로부터 유래될 수 있다. 자연 발생적 생합성 경로는 조작된 유기체가 재생가능한 연료와 화학 제품을 합성할 수 있도록 유전적으로 변형될 수 있다. 또한, 연료 및 화학 제품의 생성을 위한 공급원료로서 다양한 탄소원을 이용하기 위해, 미생물이 맞춰지거나(tailored) 대사 조작될(metabolically engineered) 수 있다. 따라서, 재조합 숙주 세포에서 발현될 때, 말로닐-유래 화합물들(예를 들어, 지방족 에스테르, 지방족 알코올 및 다른 지방산 유도체, 그리고 비-지방산 화합물들)의 더 높은 수율을 생성하도록 ACC를 조작하는 것이 바람직할 것이다.

해당 분야의 발전에도 불구하고, 유전적 변형 효소, 재조합 숙주 세포, 그리고 재조합 숙주 세포의 발효를 통한 연료 및 화학물질의 강건하고(robust) 비용-효율적인 생성을 달성하기 위한 방법 및 시스템의 개선에 대한 요구가 남아 있다. 본 발명은 말로닐-유래 화합물들의 수율 및 역가를 증가시키는 ACC 변이체들을 제공함으로써 이러한 필요성을 해결한다.

요약

본 발명의 일 측면은 그 아미노산 서열에 적어도 하나의 돌연변이를 갖는 변이 비오틴 카르복실 운반 단백질(biotin carboxyl carrier protein: BCCP)을 제공한다. 특정한 일 측면에서, 본 발명은 그 아미노산 서열에 적어도 하나의 돌연변이를 포함하는 변이 비오틴 카르복실 운반 단백질(BCCP)을 제공하고, 변이 BCCP는 다음의 서열 식별 번호들 - SEQ ID NOS: 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88 및 90을 포함함 - 중 어느 하나 또는 하나 이상으로부터 폴리펩티드 서열을 갖는다. 일 구현예에서, 변이 BCCP는 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 세포에 부여(confer)한다. 또 다른 구현예에서, 변이 BCCP는 세포에서 발현될 때 개선된 아세틸-CoA 카르복실라아제(ACC) 활성을 부여할 수 있어, 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 유도한다. 말로닐-CoA-유래 화합물은 지방산 유도체, 예컨대 유리 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체(예를 들어, ω-하이드록시 지방산, ω-하이드록시 디올, ω-하이드록시 FAME, ω-하이드록시 FAEE), 불포화 지방산 유도체, 그리고 비-지방산계 화합물, 예컨대 플라바논 및/또는 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함한다(단, 이로 제한되지 않음).

본 발명의 또 다른 측면은 그 아미노산 서열에 적어도 하나의 돌연변이를 갖는 변이 비오틴 카르복실 운반 단백질(BCCP)을 제공하고, 돌연변이는 N-말단 아미노산 부위에 있다. 일 구현예에서, 돌연변이는 SEQ ID NO: 2의 아미노산 위치 2에 있다. 또 다른 구현예에서, 변이 BCCP는 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 세포에 부여한다. 또 다른 구현예에서, 변이 BCCP는 세포에서 발현될 때 개선된 아세틸-CoA 카르복실라아제(ACC) 활성을 부여할 수 있으며, 이는 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 유도한다.

본 발명의 또 다른 측면은 그 아미노산 서열에 적어도 하나의 돌연변이를 갖는 변이 비오틴 카르복실 운반 단백질(BCCP)을 제공하고, 변이 BCCP는 SEQ ID NOS: 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88 및/또는 90으로부터 선택된다. 일 구현예에서, 변이 BCCP는 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 세포에 부여한다. 또 다른 구현예에서, 변이 BCCP는 세포에서 발현될 때 개선된 아세틸-CoA 카르복실라아제(ACC) 활성을 부여할 수 있으며, 이는 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 유도한다.

본 발명의 또 다른 측면은 변이 accB 유전자 또는 accB 핵산 서열에 의해 코딩되는 변이 BCCP를 제공하고, 핵산 서열은 SEQ ID NOS: 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87 및/또는 89로부터 선택된다.

본 발명의 또 다른 측면은 변이 BCCP를 발현시키는 재조합 세포 또는 재조합 미생물을 제공하고, 변이 BCCP는 그 아미노산 서열에 적어도 하나의 돌연변이를 갖는다. 일 구현예에서, 세포는 숙주 세포이다. 또 다른 구현예에서, 세포는 미생물 세포 또는 미생물 숙주 세포이다. 또 다른 구현예에서, 미생물은 미생물 세포 또는 미생물 숙주 세포 또는 마이크로브(microbe)이다. 일 구현예에서, 돌연변이는 N-말단 아미노산 부위에 있다. 또 다른 구현예에서, 돌연변이는 SEQ ID NO: 2의 아미노산 위치 2에 있다. 또 다른 구현예에서, 돌연변이는 치환(substitution)이다. 다양한 구현예들에서, 치환은: 아스파르테이트(D)의 아스파라긴(N)으로의; 또는 아스파르테이트(D)의 히스티딘(H)으로의; 또는 아스파르테이트(D)의 이소류신(I)으로의; 또는 아스파르테이트(D)의 트레오닌(T)으로의; 또는 아스파르테이트(D)의 세린(S)으로의; 또는 아스파르테이트(D)의 티로신(Y)으로의; 또는 아스파르테이트(D)의 아르기닌(R)으로의; 또는 아스파르테이트(D)의 류신(L)으로의; 또는 아스파르테이트(D)의 글루타민(Q)으로의; 또는 아스파르테이트(D)의 글루타메이트(G)로의 치환이다. 또 다른 구현예에서, 변이 BCCP는 아스파르테이트(D)의 아스파라긴(N)으로의 치환을 포함하는 돌연변이를 갖는 폴리펩티드를 포함하는 SEQ ID NO: 6을 갖는다. 또 다른 구현예에서, 변이 BCCP는 아스파르테이트(D)의 히스티딘(H)으로의 치환을 포함하는 돌연변이를 갖는 폴리펩티드를 포함하는 SEQ ID NO: 4 또는 SEQ ID NO: 8을 갖는다. 또 다른 구현예에서, 변이 BCCP는 아스파르테이트(D)의 이소류신(I)으로의 치환을 포함하는 돌연변이를 갖는 폴리펩티드를 포함하는 SEQ ID NO: 10 또는 SEQ ID NO: 12를 갖는다. 일 구현예에서, 변이 BCCP는 그 아미노산 서열에 적어도 하나의 돌연변이를 갖고, 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 재조합 세포에 부여한다. 또 다른 구현예에서, 변이 BCCP는 그 아미노산 서열에 적어도 하나의 돌연변이를 갖고, 재조합 세포에 개선된 아세틸-CoA 카르복실라아제(ACC) 활성을 부여할 수 있으며, 이는 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 유도한다. 또 다른 구현예에서, 세포는 야생형 미생물 또는 야생형 숙주 세포와 대조되거나 비교될 수 있는 재조합 미생물 또는 재조합 숙주 세포이다. 또 다른 구현예에서, 세포는 본질적으로 미생물이다.

본 발명의 또 다른 측면은 말로닐-CoA-유래 화합물을 생성하는 방법을 제공하고, 상기 방법은 탄소원을 포함하는 발효 브로쓰(fermentation broth)에서 변이 BCCP를 발현시키는 세포를 배양하는 단계를 포함한다. 말로닐-CoA-유래 화합물은 지방산 유도체, 이를테면, 예컨대 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체(예를 들어, ω-하이드록시 지방산, ω-하이드록시 디올, ω-하이드록시 FAME, ω-하이드록시 FAEE), 불포화 지방산 유도체, 그리고 비-지방산계 화합물, 예컨대 플라바논 및/또는 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함한다. 일 구현예에서, 세포는 야생형 미생물 또는 야생형 숙주 세포와 각각 대조되거나 비교될 수 있는 재조합 미생물 또는 재조합 숙주 세포이다. 또 다른 구현예에서, 세포는 본질적으로 미생물이다.

또한, 본 발명은 BCCP의 발현을 조절하는 변이 오페론을 고려한다. 일 구현예에서, 오페론은 야생형 세포와 비교 시 재조합 세포에서 BCCP 발현의 변화를 유도한다. 일 구현예에서, 세포는 야생형 미생물 숙주 세포 또는 야생형 미생물과 비교 시 각각 재조합 미생물 숙주 세포 또는 재조합 미생물이다. 또 다른 구현예에서, 오페론은 재조합 세포에서 BCCP 발현의 증가를 유도함에 따라, 재조합 세포에서 아세틸-CoA 카르복실라아제(ACC) 활성을 개선하며, 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 유도한다. 일 측면에서, 변이 오페론은 프로모터를 더 포함한다. 프로모터는 이종 프로모터(heterologous promoter), 이종 프로모터 변이체 및 합성 프로모터를 포함한다(단, 이로 제한되지 않음). 일 구현예에서, 프로모터는 유전적으로 변형된(genetically modified) accBC 프로모터, 자연 발생적 대장균 프로모터 또는 대장균 프로모터 변이체를 포함한다. 또 다른 구현예에서, 프로모터는 accBC 프로모터 변이체이다. 또 다른 구현예에서, 프로모터는 T5 프로모터 또는 T5 프로모터 변이체이다. 일 구현예에서, 프로모터는 accBC T5 프로모터이다. 또 다른 구현예에서, accBC T5 프로모터는 SEQ ID NOS: 93, 94, 95 또는 96, 또는 이의 변이체로부터 선택된다.

또한, 본 발명은 BCCP의 발현을 조절하는 변이 오페론을 포함하는 재조합 미생물 또는 숙주 세포를 제공한다. 일 구현예에서, 오페론은 BCCP 발현의 변화를 유도한다. 일 구현예에서, 오페론은 재조합 세포에서 BCCP 발현의 증가를 유도함에 따라, 재조합 세포에서 아세틸-CoA 카르복실라아제(ACC) 활성을 개선하며, 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 유도한다. 또 다른 구현예에서, 변이 오페론은 프로모터를 더 포함한다.

본 발명의 또 다른 측면은 말로닐-CoA-유래 화합물을 생성하는 방법을 제공하고, 상기 방법은 탄소원을 포함하는 발효 브로쓰에서 변이 오페론을 발현시키는 미생물 또는 숙주 세포를 배양하는 단계를 포함한다. 일 구현예에서, 세포는 야생형 미생물 또는 야생형 숙주 세포와 각각 대조되거나 비교될 수 있는 재조합 미생물 또는 재조합 숙주 세포이다. 또 다른 구현예에서, 세포는 본질적으로 미생물이다. 말로닐-CoA-유래 화합물은 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체(예를 들어, ω-하이드록시 지방산, ω-하이드록시 디올, ω-하이드록시 FAME, ω-하이드록시 FAEE), 불포화 지방산 유도체, 그리고 비-지방산계 화합물, 예컨대 플라바논 및/또는 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함한다.

본 발명의 또 다른 측면은 말로닐-CoA-유래 화합물을 생성하는 방법을 제공하고, 상기 방법은 탄소원을 포함하는 발효 브로쓰에서 변이 BCCP 및 변이 오페론을 발현시키는 숙주 세포를 배양하는 단계를 포함한다. 일 구현예에서, 세포는 야생형 미생물 또는 야생형 숙주 세포와 각각 대조되거나 비교될 수 있는 재조합 미생물 또는 재조합 숙주 세포이다. 또 다른 구현예에서, 세포는 본질적으로 미생물이다. 말로닐-CoA-유래 화합물은 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체(ω-하이드록시 지방산, ω-하이드록시 디올, ω-하이드록시 FAME, ω-하이드록시 FAEE를 포함함), 불포화 지방산 유도체, 그리고 비-지방산계 화합물, 예컨대 플라바논 및/또는 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함한다.

또한, 본 발명은 그 아미노산 서열에 적어도 하나의 돌연변이를 갖는 변이 비오틴 카르복실 운반 단백질(BCCP)을 포함하는 미생물을 고려한다. 일 구현예에서, 변이 BCCP는 N-말단 아미노산 부위에 돌연변이를 갖는다. 또 다른 구현예에서, 돌연변이는 치환이다. 다양한 구현예들에서, 치환은: 아스파르테이트(D)의 아스파라긴(N)으로의; 또는 아스파르테이트(D)의 히스티딘(H)으로의; 또는 아스파르테이트(D)의 이소류신(I)으로의; 또는 아스파르테이트(D)의 트레오닌(T)으로의; 또는 아스파르테이트(D)의 세린(S)으로의; 또는 아스파르테이트(D)의 티로신(Y)으로의; 또는 아스파르테이트(D)의 아르기닌(R)으로의; 또는 아스파르테이트(D)의 류신(L)으로의; 또는 아스파르테이트(D)의 글루타민(Q)으로의; 또는 아스파르테이트(D)의 글루타메이트(G)로의 치환이다. 또 다른 구현예에서, 변이 BCCP는, 아스파르테이트(D)의 아스파라긴(N)으로의; 아스파르테이트(D)의 히스티딘(H)으로의; 아스파르테이트(D)의 이소류신(I)으로의; 아스파르테이트(D)의 트레오닌(T)으로의; 아스파르테이트(D)의 세린(S)으로의; 아스파르테이트(D)의 티로신(Y)으로의; 아스파르테이트(D)의 아르기닌(R)으로의; 아스파르테이트(D)의 류신(L)으로의; 아스파르테이트(D)의 글루타민(Q)으로의; 및/또는 아스파르테이트(D)의 글루타메이트(G)로의 치환들을 포함하는 하나 이상의 돌연변이(들)를 갖는다. 또 다른 구현예에서, 변이 BCCP는 아스파르테이트(D)의 아스파라긴(N)으로의 치환을 포함하는 돌연변이를 갖는 폴리펩티드를 포함하는 SEQ ID NO: 6을 갖는다. 또 다른 구현예에서, 변이 BCCP는 아스파르테이트(D)의 히스티딘(H)으로의 치환을 포함하는 돌연변이를 갖는 폴리펩티드를 포함하는 SEQ ID NO: 4 또는 SEQ ID NO: 8을 갖는다. 또 다른 구현예에서, 변이 BCCP는 아스파르테이트(D)의 이소류신(I)으로의 치환을 포함하는 돌연변이를 갖는 폴리펩티드를 포함하는 SEQ ID NO: 10 또는 SEQ ID NO: 12를 갖는다. 또 다른 구현예에서, 변이 BCCP의 발현은 미생물에 말로닐-CoA-유래 화합물의 증가된 생성을 부여한다. 또 다른 구현예에서, 변이 BCCP의 발현은 미생물에 개선된 아세틸-CoA-카르복실라아제(ACC) 활성을 부여할 수 있으며, 미생물에 의해 말로닐-CoA-유래 화합물의 증가된 생성을 유도한다. 말로닐-CoA-유래 화합물은 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체, 불포화 지방산 유도체, 플라바논, 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함한다(단, 이로 제한되지 않음). 일 구현예에서, 말로닐-CoA-유래 화합물은 FAME 또는 FAEE이다. 또 다른 구현예에서, 말로닐-CoA-유래 화합물은 지방족 알코올이다. 또 다른 구현예에서, 미생물은 미생물 세포이다. 또 다른 구현예에서, 미생물 세포는 재조합 세포이다. 미생물 세포들의 예시는 에 스체리치아(Escherichia) 속, 바실러스(Bacillus) 속, 시아노피타(Cyanophyta) 속, 락토바실러스(Lactobacillus) 속, 자이모모나스(Zymomonas) 속, 로도코쿠 스(Rhodococcus) 속, 슈도모나스(Pseudomonas) 속, 아스페르길루스(Aspergillus) 속, 트리코데르마(Trichoderma) 속, 뉴로스포라(Neurospora) 속, 푸사리 움(Fusarium) 속, 후미콜라(Humicola) 속, 리조무코르(Rhizomucor) 속, 클루이베로마이세스(Kluyveromyces) 속, 피치아(Pichia) 속, 무코르(Mucor) 속, 미셀리오프토라(Myceliophtora) 속, 페 니실리움(Penicillium) 속, 파네로카에 테(Phanerochaete) 속, 플레우로투 스(Pleurotus) 속, 트라메테스(Trametes) 속, 크리소스포리움(Chrysosporium) 속, 사카로마이세스(Saccharomyces) 속, 스테노트로파모나스(Stenotrophamonas) 속, 스 키조사카로마이세스(Schizosaccharomyces) 속, 야로위아(Yarrowia) 속, 또는 스트렙토마이세스(Streptomyces) 속으로부터의 세포들을 포함한다(단, 이로 제한되지 않음). 일 구현예에서, 미생물 세포는 에스체리치아 속으로부터의 세포이다. 일 구현예에서, 미생물 세포는 대장균으로부터의 세포이다. 또 다른 구현예에서, 미생물 세포는 시아노박테리아 또는 시아노피타 속으로부터의 세포이다. 또 다른 구현예에서, 미생물 세포는 프로클로로코쿠 스(Prochlorococcus), 시네코코쿠스(Synechococcus), 시네코시스티 스(Synechocystis), 시아노테세(Cyanothece) 및 노스톡 펑크티포르 메(Nostoc Punctiforme)를 포함하는(단, 이로 제한되지 않음) 시아노박테리아 또는 시아노피타로부터의 세포이다. 또 다른 구현예에서, 미생물 세포는 시네코코쿠스 엘롱가투스(Synechococcus elongatus) PCC7942, 시네코시스티스 종(Synechocystis sp.) PCC6803, 및 시네코코쿠스 종 PCC7001을 포함하는(단, 이로 제한되지 않음) 특이적 시아노박테리아 종으로부터의 세포이다.

본 발명의 또 다른 측면은 accB 또는 accC, 또는 이의 조합을 포함하는 핵산 서열의 변경된 발현(altered expression)을 갖는 재조합 미생물을 제공하며, 미생물에 의해 말로닐-CoA-유래 화합물의 변경된 생성을 유도한다. 일 구현예에서, 변경된 발현은 증가된 발현이다. 또 다른 구현예에서, 변경된 발현은 감소된 발현이다. 또 다른 구현예에서, 변경된 발현은 핵산 서열의 발현을 추진(drive)하는 하나 이상의 프로모터의 변화에 기인한다. accB의 핵산 서열은 BCCP를 코딩한다. 일 구현예에서, accB의 변이 핵산 서열은 변이 BCCP를 코딩한다. 일 구현예에서, 말로닐-CoA-유래 화합물은 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체, 불포화 지방산 유도체, 플라바논, 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함한다(단, 이로 제한되지 않음). 일 구현예에서, 미생물은 에스체리치아 속, 바실러스 속, 시아노피타 속, 락토바실러스 속, 자이모모나스 속, 로도코쿠스 속, 슈도모나스 속, 아스페르길루스 속, 트리코데르마 속, 뉴 로스포라 속, 푸사리움 속, 후미콜라 속, 리조무코르 속, 클루이베로마이세스 속, 피치아 속, 무코르 속, 미셀리오프토라 속, 페니실리움 속, 파네로카에테 속, 플레 우로투스 속, 트라메테스 속, 크리소스포리움 속, 사카로마이세스 속, 스테노트로 파모나스 속, 스키조사카로마이세스 속, 야로위아 속, 또는 스트렙토마이세스 속으로부터의 미생물을 포함한다(단, 이로 제한되지 않음). 일 구현예에서, 미생물 세포는 에스체리치아 속으로부터의 세포이다. 일 구현예에서, 미생물 세포는 대장균으로부터의 세포이다. 또 다른 구현예에서, 미생물 세포는 시아노박테리아 또는 시아 노피타 속으로부터의 세포이다. 또 다른 구현예에서, 미생물은 프로클로로코쿠스, 시네코코쿠스, 시네코시스티스, 시아노테세 또는 노스톡 펑크티포르메로부터의 시아노박테리아 또는 시아노피타이다. 일 구현예에서, 미생물은 시네코코쿠스 엘롱 가투스 PCC7942, 시네코시스티스 종 PCC6803 또는 시네코코쿠스 종 PCC7001로부터의 시아노박테리아 종이다.

본 발명의 또 다른 측면은, ACC 변이체의 변경된 발현을 갖고 지방산 생합성 단백질을 더 발현시키는 미생물 또는 숙주 세포를 제공한다. 일 구현예에서, 숙주 세포는 미생물 세포이다. 또 다른 구현예에서, 숙주 세포는 재조합 세포이다. 또 다른 구현예에서, 숙주 세포는 재조합 박테리아 세포이다. 또 다른 구현예에서, ACC 변이체는 비오틴 카르복실 운반 단백질(BCCP) 또는 비오틴 카르복실라아제(BC) 또는 이의 조합이다. 일 구현예에서, 변경된 발현은 증가된 또는 감소된 발현이다. 일 구현예에서, 변경된 발현은 증가된 발현이고, 증가된 발현은 미생물 세포가 탄소원으로 배양될 때 말로닐-CoA-유래 화합물의 증가된 생성을 유도한다.

본 발명의 특정 구현예들에서, 숙주 세포는 지방산 유도체의 생성을 증가시킬 수 있는 효소 활성을 갖는 생합성 단백질을 더 발현시킬 수 있다. 일 구현예에서, 효소 활성을 갖는 단백질은 숙주 세포에 자연적으로 존재할 수 있고, 그 유전자는 프로모터 또는 다른 유전적 변경을 통해 과발현될 수 있다. 또 다른 구현예에서, 효소 활성을 갖는 단백질은 숙주 세포에서 발현되는 외인성 또는 이종 유전자의 결과일 수 있다. 이러한 효소 활성의 예시는 티오에스테라아제 활성(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5), 에스테르 신타아제 활성(E.C. 2.3.1.75), 아실-ACP 리덕타아제(AAR) 활성(E.C. 1.2.1.80), 알코올 디하이드로게나아제 활성(E.C. 1.1.1.1), 지방족 알코올 아실-CoA 리덕타아제(FAR) 활성(E.C. 1.1.1.*), 카르복실산 리덕타아제(CAR) 활성(E.C. 1.2.99.6), 디카르보닐라아제 또는 디포밀라아제 활성, 아실-CoA 리덕타아제 활성(E.C. 1.2.1.50), 아실-CoA 신타아제(FadD) 활성(E.C. 2.3.1.86), OleA 활성 및 OleBCD 활성을 포함한다(단, 이로 제한되지 않음).

또 다른 측면에서, 본 발명은 ACC 변이체의 변경된 발현을 갖고 지방산 생합성 단백질을 더 발현시키는 미생물 또는 숙주 세포를 제공하고, 변경된 발현은 세포가 탄소원으로 배양될 때 말로닐-CoA-유래 화합물의 증가된 생성을 유도하는 증가된 발현이다. 일 구현예에서, 숙주 세포는 미생물 세포이다. 또 다른 구현예에서, 숙주 세포는 재조합 세포이다. 또 다른 구현예에서, 숙주 세포는 재조합 박테리아 세포이다. 또 다른 구현예에서, 미생물 또는 숙주 세포는 동일한 조건들 하에서 야생형 세포와 비교되거나 대조될 수 있는 재조합 세포이다. 본 명세서에서, 말로닐-CoA-유래 화합물은 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체, 불포화 지방산 유도체, 플라바논, 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함한다(단, 이로 제한되지 않음). 일 구현예에서, 미생물 세포는 에스체리치아 속, 바실러스 속, 시아노피타 속, 락토바실러스 속, 자이모모나스 속, 로도코쿠스 속, 슈도모나스 속, 아스페르길루스 속, 트리코데르마 속, 뉴로스포라 속, 푸사리움 속, 후미콜라 속, 리조무코르 속, 클루이베로마이세스 속, 피치아 속, 무코르 속, 미셀리오프토라 속, 페니실리움 속, 파네로카에테 속, 플레우로투스 속, 트라메테스 속, 크리소스포리움 속, 사카로마이세스 속, 스 테노트로파모나스 속, 스키조사카로마이세스 속, 야로위아 속, 또는 스트렙토마이세스 속의 세포들로부터 선택된다.

본 발명의 또 다른 측면은 SEQ ID NO: 6을 갖는 변이 비오틴 카르복실 운반 단백질(BCCP)을 제공한다. 일 구현예에서, 돌연변이는 아스파르테이트(D)의 아스파라긴(N)으로의 치환을 갖는 N-말단 아미노산 부위에 있고, 치환은 아미노산 위치 2에 있다. 또 다른 구현예에서, 변이 BCCP는 변이 accB 유전자에 의해 코딩되고, 변이 accB 유전자는 SEQ ID NO: 5의 핵산 서열을 갖는다. 본 발명의 또 다른 측면은 SEQ ID NO: 4 또는 SEQ ID NO: 8을 갖는 변이 비오틴 카르복실 운반 단백질(BCCP)을 제공한다. 일 구현예에서, 돌연변이는 아스파르테이트(D)의 히스티딘(H)으로의 치환을 갖는 N-말단 아미노산 부위에 있고, 치환은 아미노산 위치 2에 있다. 또 다른 구현예에서, 변이 BCCP는 변이 accB 유전자에 의해 코딩되고, 변이 accB 유전자는 각각 SEQ ID NO: 3 또는 SEQ ID NO: 7의 핵산 서열을 갖는다. 본 발명의 또 다른 측면은 SEQ ID NO: 10 또는 SEQ ID NO: 12를 갖는 변이 비오틴 카르복실 운반 단백질(BCCP)을 제공한다. 일 구현예에서, 돌연변이는 아스파르테이트(D)의 이소류신(I)으로의 치환을 갖는 N-말단 아미노산 부위에 있고, 치환은 아미노산 위치 2에 있다. 또 다른 구현예에서, 변이 BCCP는 변이 accB 유전자에 의해 코딩되고, 변이 accB 유전자는 각각 SEQ ID NO: 9 또는 SEQ ID NO: 11의 핵산 서열을 갖는다.

다양한 구현예들에서, 변이 BCCP는 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 재조합 세포에 부여하고, 상기 말로닐-CoA-유래 화합물은 지방산 유도체인 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체 및 불포화 지방산 유도체; 또는 비-지방산계 화합물, 예컨대 플라바논, 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함한다. 또한, 본 발명은 변이 BCCP를 포함하거나 발현시키는 재조합 미생물을 포함한다. 일 구현예에서, 미생물은 에스체리치아 속, 바실러스 속, 시아노피타 속, 락토바실러스 속, 자이모모나스 속, 로도코쿠스 속, 슈도모나스 속, 아스페르길루스 속, 트리코데르마 속, 뉴로스포라 속, 푸사리움 속, 후미콜라 속, 리조무코르 속, 클루이베로마이세스 속, 피치아 속, 무코르 속, 미셀리오프토라 속, 페니실리움 속, 파네로 카에테 속, 플레우로투스 속, 트라메테스 속, 크리소스포리움 속, 사카로마이세스 속, 스테노트로파모나스 속, 스키조사카로마이세스 속, 야로위아 속, 또는 스트렙토마이세스 속의 미생물로부터 선택된다.

또한, 말로닐-CoA-유래 화합물을 생성하는 방법이 고려되고, 상기 방법은 탄소원을 포함하는 발효 브로쓰에서 변이 BCCP를 발현시키는 재조합 미생물을 배양하는 단계를 포함한다. 이 방법에 의해 생성되는 말로닐-유래 화합물은 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체 및 불포화 지방산 유도체를 포함하는 지방산 유도체; 또는 비-지방산계 화합물, 예컨대 플라바논, 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함한다.

본 발명은 바람직한 구현예들을 예시하는 역할을 하는 첨부한 도면들과 연계하여 읽을 때 가장 잘 이해될 것이다. 하지만, 본 발명은 도면들에 개시된 특정 구현예들로 제한되지 않음을 이해할 것이다.
도 1은 변이 비오틴 카르복실 운반 단백질(BCCP)과 같은 아세틸-CoA 카르복실라아제(ACC) 변이체들을 수반하는 조작된 생화학 경로의 일 구현예의 개략도이다. 나타낸 바와 같이, BCCP는 세포에서 발현될 때 개선된 아세틸-CoA 카르복실라아제(ACC) 활성을 부여할 수 있다. 이는 말로닐-CoA 및 아실-ACP의 증가된 생성을 유도할 수 있으며, 이에 따라 이는, 예를 들어 지방산 유도체, 예컨대 지방족 에스테르, 지방족 알데히드, 지방족 알코올, 지방산 및 다른 지방산 유도체를 포함하는 말로닐-CoA-유래 화합물의 증가된 생성을 유도할 수 있다.
도 2는 7 개의 상이한 종으로부터 BCCP의 7 개의 아미노산 서열의 정렬을 나타낸다. 박스로 나타낸 영역은 대부분의 BCCP 종에 걸쳐 보존된 모티프(motif)를 나타낸다.
도 3은 변이 비오틴 카르복실 운반 단백질(BCCP)과 같은 아세틸-CoA 카르복실라아제(ACC) 변이체들을 수반하는 조작된 생화학 경로의 또 다른 구현예의 개략도이다. 나타낸 바와 같이, BCCP는 세포에서 발현될 때 개선된 아세틸-CoA 카르복실라아제(ACC) 활성을 부여할 수 있다. 이는 말로닐-CoA 및 아실-CoA의 증가된 생성을 유도할 수 있으며, 이에 따라 이는, 예를 들어 지방산 유도체, 예컨대 지방족 에스테르, 지방족 알데히드, 지방족 알코올, 지방산 및 다른 지방산 유도체를 포함하는 말로닐-CoA-유래 화합물의 증가된 생성을 유도할 수 있다.
도 4는 변이 비오틴 카르복실 운반 단백질(BCCP)과 같은 아세틸-CoA 카르복실라아제(ACC) 변이체들을 수반하는 조작된 생화학 경로의 몇몇 구현들의 요약이다. 나타낸 바와 같이, BCCP는 세포에서 발현될 때 개선된 아세틸-CoA 카르복실라아제(ACC) 활성을 부여할 수 있다. 이는, 폴리케티드, 3-하이드록시프로피온산(3-HP), 플라바논 및 플라보노이드, 그리고 증가된 중간체들, 이를테면, 예컨대 증가된 아실-CoA(또한, 도 3 참조); 증가된 아실-ACP(또한, 도 1 참조); 그리고 증가된 말로네이트(또는 말론산)를 포함하는 말로닐-CoA 및 말로닐-CoA 유래 화합물의 증가된 생성을 유도할 수 있다. 또한, 증가된 중간체들은 지방산, 지방족 에스테르, 지방족 알데히드, 지방족 알코올 및 다른 지방산 유도체를 포함하는 지방산 유도체와 같은 증가된 최종-생성물을 유도할 수 있다.
도 5는 대장균 숙주 세포에서 (accB 유전자의 위치 2에) 다양한 BCCP 변이체들을 발현시키는 결과로서 FAS 역가(FAME)를 도시한 그래프를 나타낸다. WT는 야생형 ACC 복합체에 대한 대조군이다. 이 BCCP 변이체들의 일부는 5-배(fold)가 넘게 FAS 역가를 개선하였다(또한, 표 1 참조).

개관(General Overview)

본 발명은 미생물에서 발현될 수 있는 변이 아세틸-CoA 카르복실라아제(ACC) 폴리펩티드(들) 또는 ACC 변이체(들)에 관한 것이다. 이 ACC 변이체는 유전적으로 변경되고, 지방산 유도체를 포함하는 말로닐-CoA 유래 화합물의 증가된 생성을 위해 개선된 효소 활성을 부여할 것으로 여겨진다. 본 명세서에서, 본 발명은, 야생형 세포에서 대응하는 ACC 활성과 비교할 때, 숙주 세포에서 발현될 때 개선된 아세틸-CoA 카르복실라아제(ACC) 활성을 유도할 수 있는 폴리펩티드(들) 및 단백질(들)에 관한 것이다. 이를 예시하기 위해, ACC 유전자는 하나의 ACC 유전자 그리고 하나의 ACC 오페론에 돌연변이를 도입함으로써 변경되었다. 이 두 변경은 숙주 세포에서 지방산 유도체 생성을 독립적으로 증가시킬 수 있다. 이 돌연변이는 지방산-유래 화합물(즉, 지방산 유도체), 이를테면, 예컨대 지방산, 지방족 에스테르, 지방족 알코올, 지방족 알데히드, 지방족 아민, 이작용성 지방산 유도체, 및 비-지방산계 화합물, 이를테면, 예컨대 플라바논 및 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함하는(단, 이로 제한되지 않음) 말로닐-CoA로부터 유래된 생성물의 역가 및 수율을 개선할 것으로 예상된다. 지방족 에스테르의 예시는 지방산 메틸 에스테르(FAME) 및 지방산 에틸 에스테르(FAEE)이다. 이작용성 지방산 유도체의 예시는 ω-하이드록시 지방산, ω-하이드록시 디올, ω-하이드록시 FAME 및 ω-하이드록시 FAEE를 포함한다(단, 이로 제한되지 않음).

말로닐-CoA 유래 화합물의 더 높은 수율을 생성하기 위해, 완전한 ACC 복합체를 코딩하는 4 개의 모든 ACC 유전자의 증가된 발현이 요구된다는 것이 명시되었다(Davis 외 (2000) 위 참조). 하지만, 본 발명은 오직 하나의 ACC 유전자에서 표적 돌연변이(targeted mutation)가 지방산 유도체를 포함하는 말로닐-CoA로부터 유래된 화합물의 생성을 개선할 수 있다는 놀라운 조사결과를 보여준다. 예를 들어, accB 유전자의 표적 돌연변이 및/또는 accBC 오페론의 표적 발현 변화는 지방족 에스테르 생성을 최대 630 %로 크게 개선하였다.(아래의 도 5, 그리고 표 1 및 실시예들 참조). 이론에 의해 한정되지 않고, 변이 ACC 폴리펩티드 또는 ACC 변이체는 숙주 세포에서 말로닐-CoA 유래 화합물의 더 높은 생성을 유도하는 개선된 효소 활성을 ACC 복합체 상에 직접적으로 또는 간접적으로 부여할 것으로 여겨진다. 숙주 세포의 특이적 활성이 증가할 것으로 여겨짐에 따라, 말로닐-CoA 유래 화합물의 증가된 생성을 유도한다. 이러한 말로닐-CoA 유래 화합물은 지방산 유도체 및 비-지방산계 화합물을 포함한다.

정의

본 명세서 및 첨부된 청구항에서 사용되는 바와 같이, 단수 형태 "a", "an" 및 "the"는 본문에 명확히 달리 명시되지 않는다면 복수의 지시대상(referent)을 포함한다. 따라서, 예를 들어 "숙주 세포"에 대한 언급은 이러한 2 이상의 숙주 세포를 포함하고, "지방족 에스테르"에 대한 언급은 하나 이상의 지방족 에스테르 또는 에스테르의 혼합물을 포함하며, "핵산 서열"에 대한 언급은 하나 이상의 핵산 서열을 포함하고, "효소"에 대한 언급은 하나 이상의 효소를 포함한다.

본 명세서 전반에 걸쳐 서열 수탁 번호는 (여기에서 "NCBI 수탁 번호" 또는 대안적으로 "GenBank 수탁 번호" 또는 대안적으로 단순히 "수탁 번호"로 식별되는) 미국 국립보건원에 의해 유지되는 NCBI(미국 국립 생물공학 정보센터)에 의해 제공되는 데이터베이스로부터 그리고 (여기에서 "UniProtKB 수탁 번호"로 식별되는) 스위스 생물정보학 연구소에 의해 제공되는 UniProt 지식베이스(UniProtKB) 및 Swiss-Prot 데이터베이스로부터 얻어졌다.

효소 분류(enzyme classification: EC) 번호는 생화학 및 분자생물학 국제 연합(International Union of Biochemistry and Molecular Biology: IUBMB)의 명명 위원회(Nomenclature Committee)에 의해 제정되며, 이의 설명은 월드 와이드 웹의 IUBMB 효소 명명 웹사이트에서 이용가능하다. EC 번호는 효소들이 촉매화하는 반응에 따라 효소들을 분류한다. 예를 들어, 아세틸-CoA 카르복실라아제(ACC) 효소 활성은 E.C. 6.4.1.2로 분류된다. ACC는 대부분의 원핵생물에 그리고 대부분의 식물 및 조류의 엽록체에 존재하는 다-서브유닛 효소 복합체이다. ACC는 ATP 및 아세틸-CoA 및 HCO₃ _-의 ADP 및 포스페이트 및 말로닐-CoA로의 반응을 촉매화한다. ACC의 기능은 하나의 종으로부터 다음 종으로 대부분의 원핵생물에 보존된다. 따라서, 상이한 미생물 종이 E.C. 6.4.1.2로 분류된 동일한 아세틸-CoA 카르복실라아제(ACC) 효소 활성을 수행할 수 있다.

본 명세서에서 사용되는 바와 같이, "뉴클레오티드"라는 용어는 헤테로사이클릭 염기, 당 및 하나 이상의 인산기로 이루어진 폴리뉴클레오티드의 단위체 단위를 지칭한다. 자연적으로 발생하는 염기들[구아닌(G), 아데닌(A), 사이토신(C), 티민(T) 및 우라실(U)]은 통상적으로 퓨린 또는 피리미딘의 유도체들이지만, 자연적으로 및 비-자연적으로 발생하는 염기 유사체(base analog)들도 포함되는 것으로 이해하여야 한다. 자연적으로 발생하는 당은 펜토오스(5-탄당)의 (DNA를 형성하는) 디옥시리보오스 또는 (RNA를 형성하는) 리보오스이지만, 자연적으로 및 비-자연적으로 발생하는 당 유사체들도 포함되는 것으로 이해하여야 한다. 핵산은 통상적으로 핵산 또는 폴리뉴클레오티드를 형성하는 인산 결합을 통해 연결되지만, 많은 다른 연결들(예를 들어, 포스포로티오에이트, 보라노포스페이트 등)이 해당 기술분야에 알려져 있다.

"폴리뉴클레오티드"라는 용어는 리보뉴클레오티드(RNA) 또는 디옥시리보뉴클레오티드(DNA)의 중합체를 지칭하고, 이는 단일 가닥 또는 이중 가닥일 수 있으며, 비-자연적 또는 변경된 뉴클레오티드들을 함유할 수 있다. "폴리뉴클레오티드", "핵산 서열" 및 "뉴클레오티드 서열"이라는 용어는 여하한의 길이의 뉴클레오티드의 중합체 형태, RNA 또는 DNA 중 하나를 지칭하는 데 교환가능하게 사용된다. 이러한 용어는 분자의 일차 구조를 지칭하고, 따라서 이중 및 단일 가닥의 DNA, 및 이중 및 단일 가닥의 RNA를 포함한다. 이 용어는 메틸화된 및/또는 캡핑된(capped) 폴리뉴클레오티드(단, 이로 제한되지 않음)와 같은 변형된 폴리뉴클레오티드 및 뉴클레오티드 유사체로부터 만들어지는 RNA 또는 DNA 중 어느 하나의 유사체를 등가물로서 포함한다. 폴리뉴클레오티드는 플라스미드, 바이러스성, 염색체의, EST, cDNA, mRNA 및 rRNA를 포함하는(단, 이로 제한되지 않음) 여하한 형태로 존재할 수 있다.

본 명세서에서 사용되는 바와 같이, "폴리펩티드" 및 "단백질"이라는 용어는 아미노산 잔기의 중합체를 지칭하는 데 교환가능하게 사용된다. "재조합 폴리펩티드"라는 용어는 재조합 기술들에 의해 생성된 폴리펩티드를 지칭하며, 일반적으로 발현된 단백질을 코딩하는 DNA 또는 RNA는 숙주 세포를 형질전환하여 폴리펩티드를 생성하는 데 사용되는 적합한 발현 벡터(expression vector) 내로 삽입된다. 또한, 발현된 단백질을 코딩하는 DNA 또는 RNA는 상동 재조합(homologous recombination) 또는 해당 기술분야에 잘 알려진 다른 수단을 통해 숙주 염색체 내로 삽입될 수 있으며, 따라서 숙주 세포를 형질전환하여 폴리펩티드를 생성하는 데 사용된다. 유사하게, "재조합 폴리뉴클레오티드" 또는 "재조합 핵산" 또는 "재조합 DNA"라는 용어는 해당 기술분야의 당업자에게 알려져 있는 재조합 기술들에 의해 생성된다.

본 명세서에서 사용되는 바와 같이, "동족체(homolog)" 및 "상동(homologous)"이라는 용어는 대응하는 폴리뉴클레오티드 또는 폴리펩티드 서열과 적어도 약 50 퍼센트(%) 동일한 서열을 포함하는 폴리뉴클레오티드 또는 폴리펩티드 서열을 지칭한다. 바람직하게, 상동 폴리뉴클레오티드 또는 폴리펩티드는 대응하는 아미노산 서열 또는 폴리뉴클레오티드 서열과 적어도 약 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 약 99 % 상동성(homology)을 갖는 폴리뉴클레오티드 서열 또는 아미노산 서열을 갖는다. 본 명세서에서 사용되는 바와 같이, 서열 "상동성" 및 서열 "동일성"이라는 용어는 교환가능하게 사용된다.

해당 기술분야의 당업자라면, 2 이상의 서열 간의 상동성을 결정하는 방법들을 잘 알고 있을 것이다. 간명하게, 두 서열 간의 "상동성"의 계산은 다음과 같이 수행될 수 있다. 서열은 최적의 비교를 위해 정렬된다[예를 들어, 최적의 정렬을 위해 제 1 및 제 2 아미노산 또는 핵산 서열 중 하나 또는 둘 모두에 갭(gap)이 도입될 수 있으며, 비교를 위해 비-상동 서열은 무시될 수 있다]. 바람직한 일 구현예에서, 비교를 위해 정렬되는 제 1 서열의 길이는 제 2 서열의 길이의 적어도 약 30 %, 바람직하게는 적어도 약 40 %, 더 바람직하게는 적어도 약 50 %, 훨씬 더 바람직하게는 적어도 약 60 %, 그리고 훨씬 더 바람직하게는 적어도 약 70 %, 적어도 약 80 %, 적어도 약 85 %, 적어도 약 90 %, 적어도 약 95 %, 적어도 약 98 % 또는 약 100 %이다. 이후, 제 1 및 제 2 서열들의 대응하는 아미노산 위치 또는 뉴클레오티드 위치에서의 아미노산 잔기 또는 뉴클레오티드가 비교된다. 제 1 서열의 위치가 제 2 서열의 대응하는 위치와 동일한 아미노산 잔기 또는 뉴클레오티드에 의해 점유될 때, 분자들은 그 위치에서 동일하다. 두 서열 간의 퍼센트 상동성은 두 서열의 최적의 정렬을 위해 도입될 필요가 있는, 갭의 개수 및 각 갭의 길이를 고려한, 서열들에 의해 공유되는 동일한 위치들의 개수의 함수이다. 두 서열 간의 퍼센트 상동성의 결정 및 서열의 비교는 BLAST와 같은 수학적 알고리즘을 이용하여 달성될 수 있다(Altschul 외 (1990) J. Mol . Biol. 215(3):403-410). 또한, 두 아미노산 서열 간의 퍼센트 상동성은 Blossum 62 매트릭스 또는 PAM250 매트릭스 중 어느 하나, 그리고 16, 14, 12, 10, 8, 6 또는 4의 갭 중량(gap weight) 및 1, 2, 3, 4, 5 또는 6의 길이 중량(length weight)을 이용하는, GCG 소프트웨어 패키지의 GAP 프로그램에 통합된 Needleman 및 Wunsch 알고리즘을 사용하여 결정될 수 있다(Needleman 및 Wunsch (1970) J. Mol . Biol . 48:444-453). 또한, 두 뉴클레오티드 서열 간의 퍼센트 상동성은 NWSgapdna.CMP 매트릭스 그리고 40, 50, 60, 70 또는 80의 갭 중량 및 1, 2, 3, 4, 5 또는 6의 길이 중량을 이용하는, GCG 소프트웨어 패키지의 GAP 프로그램을 이용하여 결정될 수 있다. 해당 기술분야의 당업자는 초기 상동성 계산을 수행할 수 있으며, 이에 따라 알고리즘 파라미터들을 조정할 수 있다. 바람직한 파라미터들의 세트(및, 당업자가, 분자가 청구항들의 상동성 제한 내에 있는지 여부를 결정하기 위해 어떤 파라미터들이 적용되어야 하는지에 대한 확신이 없는 경우에 사용되어야 하는 파라미터들의 세트)는 12의 갭 페널티(gap penalty), 4의 갭 확장 페널티 및 5의 프레임시프트 갭 페널티(frameshift gap penalty)를 갖는 Blossum 62 스코어링 매트릭스(scoring matrix)이다. 서열 정렬의 추가 방법들이 생물공학 분야에 알려져 있다(예를 들어, Rosenberg (2005) BMC Bioinformatics 6:278; Altschul 외 (2005) FEBS J. 272(20):5101-5109 참조).

"낮은 엄격성(stringency), 중간 엄격성, 높은 엄격성 또는 매우 높은 엄격성 조건들 하에서 혼성화한다(hybridizes)"라는 용어는 혼성화 및 세정에 대한 조건들을 설명한다. 혼성화 반응을 수행하기 위한 안내는 Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6에서 찾을 수 있다. 수성 및 비-수성 방법들이 상기 참고문헌에 설명되며, 어느 하나가 사용될 수 있다. 여기에 언급된 특이적 혼성화 조건들은 다음과 같다: (1) 낮은 엄격성 혼성화 조건 -- 약 45 ℃에서 6X 소듐 클로라이드/소듐 시트레이트(SSC), 이후에 적어도 50 ℃에서 0.2X SSC, 0.1 % SDS로 두 번 세정(세정의 온도는 낮은 엄격성 조건에 대해 55 ℃로 증가될 수 있음); (2) 중간 엄격성 혼성화 조건 -- 약 45 ℃에서 6X SSC, 이후에 60 ℃에서 0.2X SSC, 0.1 % SDS로 한번 이상 세정; (3) 높은 엄격성 혼성화 조건 -- 약 45 ℃에서 6X SSC, 이후에 65 ℃에서 0.2X SSC, 0.1 % SDS로 한번 이상 세정; 및 (4) 매우 높은 엄격성 혼성화 조건 -- 65 ℃에서 0.5 M 소듐 포스페이트, 7 % SDS, 이후에 65 ℃에서 0.2X SSC, 1 % SDS로 한번 이상 세정. 달리 명시하지 않는다면, 매우 높은 엄격성 조건 (4)가 바람직한 조건이다.

"내인성" 폴리펩티드는 모 세포(parental cell)(또는 숙주 세포)의 게놈에 의해 코딩되는 폴리펩티드를 지칭한다. "외인성" 폴리펩티드는 모 세포의 게놈에 의해 코딩되지 않은 폴리펩티드를 지칭한다. 변이 또는 돌연변이 폴리펩티드는 외인성 폴리펩티드의 일 예시이다. 따라서, 비-자연적으로-발생하는 핵산 분자가, 세포 내로 도입되면, 그 세포에 대해 외인성인 것으로 고려된다. 또한, 자연적으로-발생하는 핵산 분자는 특정 세포에 대해 외인성일 수 있다. 예를 들어, 세포 X로부터 분리된(isolated) 전체 코딩 서열은, 그 코딩 서열이 세포 Y 내로 도입되면, X 및 Y가 동일한 세포 타입이더라도, 세포 Y에 대해 외인성 핵산이다.

"과발현된"이라는 용어는, 유전자가 그 유전자에 대한 내인성 전사율(transcription rate)에 비해 상승된 비율로 전사되도록 유도됨을 의미한다. 몇몇 예시들에서, 과발현은 추가적으로 유전자에 대한 내인성 번역률(translation rate)에 비해 유전자의 상승된 번역률을 포함한다. 과발현에 대한 테스트 방법들은 해당 기술분야에 잘 알려져 있으며, 예를 들어 전사된 RNA 수준이 rtPCR을 이용하여 평가되고, 단백질 수준이 SDS 페이지 겔 분석(page gel analysis)을 이용하여 평가될 수 있다.

"이종"이라는 용어는 상이한 유기체, 상이한 세포 유형 또는 상이한 종으로부터 유래됨을 의미한다. 본 명세서에서 사용되는 바와 같이, 이는 주어진 유기체에 자연적으로 존재하지 않는 뉴클레오티드-, 폴리뉴클레오티드-, 폴리펩티드-, 또는 단백질 서열을 지칭한다. 예를 들어, 시아노박테리아에 원래 있는(native) 폴리뉴클레오티드 서열이 재조합 방법들에 의해 대장균의 숙주 세포 내로 도입될 수 있으며, 이후 시아노박테리아로부터의 폴리뉴클레오티드는 대장균 세포(예를 들어, 재조합 세포)에 대해 이종이다. 또한, "이종"이라는 용어는 비-원래 상태에서 재조합 숙주 세포에 존재하는 뉴클레오티드-, 폴리뉴클레오티드-, 폴리펩티드-, 또는 단백질 서열에 대한 언급에 사용될 수 있다. 예를 들어, "이종" 뉴클레오티드, 폴리뉴클레오티드, 폴리펩티드 또는 단백질 서열은 대응하는 야생형 숙주 세포에 자연적으로 존재하는 야생형 서열에 대해 변형될 수 있으며, 이는 예를 들어 발현의 수준, 또는 뉴클레오티드, 폴리뉴클레오티드, 폴리펩티드 또는 단백질의 서열의 변형이다.

본 명세서에서 사용되는 바와 같이, 폴리펩티드의 "단편(fragment)"이라는 용어는 2 개의 아미노산 잔기에서부터 1 개의 아미노산 잔기를 뺀 전체 아미노산 서열에 이르는 크기 범위를 갖는 전체-길이 폴리펩티드 또는 단백질의 더 짧은 부분을 지칭한다. 본 발명의 특정 구현예들에서, 단편은 폴리펩티드 또는 단백질의 도메인(예를 들어, 기질 결합 도메인 또는 촉매 도메인)의 전체 아미노산 서열을 지칭한다.

"돌연변이유발(mutagenesis)"이라는 용어는 유기체의 유전 정보가 안정한 방식으로 변화되는 과정을 지칭한다. 단백질 코딩 핵산 서열의 돌연변이유발은 돌연변이 단백질을 생성한다. 또한, 돌연변이유발은 변형된 단백질 활성을 유도하는 비-코딩 핵산 서열의 변화를 지칭한다.

본 명세서에서 사용되는 바와 같은 "돌연변이"는 유전자의 핵산 위치 또는 폴리펩티드 또는 단백질의 아미노산 위치의 영구적인 변화를 지칭한다. 돌연변이는 치환, 추가, 삽입 및 결실을 포함한다. 예를 들어, 아미노산 위치의 돌연변이는 일 유형의 아미노산의 다른 유형의 아미노산으로의 치환일 수 있다[예를 들어, 아스파르테이트(D)가 티로신(Y)으로 치환될 수 있고, 리신(L)이 트레오닌(T)으로 치환될 수 있다]. 이와 같이, 폴리펩티드 또는 단백질은 하나 이상의 돌연변이를 가질 수 있으며, 일 아미노산이 다른 아미노산으로 치환된다. 예를 들어, ACC 관련 폴리펩티드 또는 단백질은 그 아미노산 서열에서 하나 이상의 돌연변이를 가질 수 있다.

본 명세서에서 사용되는 바와 같이, "유전자"라는 용어는 RNA 생성물 또는 단백질 생성물 중 어느 하나를 코딩하는 핵산 서열뿐만 아니라, RNA 또는 단백질의 발현에 영향을 주는 작동가능하게-연결된(operably-linked) 핵산 서열[예를 들어, 이러한 서열은 프로모터 또는 인핸서(enhancer) 서열을 포함함(단, 이로 제한되지 않음)] 또는 RNA 또는 단백질의 발현에 영향을 주는 서열을 코딩하는 작동가능하게-연결된 핵산 서열[예를 들어, 이러한 서열은 리보솜 결합 부위 또는 번역 조절 서열(translational control sequence)을 포함함(단, 이로 제한되지 않음)]을 지칭한다.

발현 조절 서열은 해당 기술분야에 알려져 있으며, 예를 들어 숙주 세포에서 폴리뉴클레오티드 서열의 발현을 위하여 제공되는 프로모터, 인핸서, 아데닐산중합반응 신호(polyadenylation signal), 전사 종결자(transcription terminator), 내부 리보솜 유입점(internal ribosome entry sites: IRES) 등을 포함한다. 발현 조절 서열은 전사에 관련된 세포성 단백질과 특이적으로 상호작용한다(Maniatis 외 Science 236:1237-1245(1987)). 예시적인 발현 조절 서열은, 예를 들어 Goeddel, Gene Expression Technology: Methods in Enzymology, Vol. 185, Academic Press, San Diego, Calif.(1990)에 개시되어 있다. 본 발명의 방법들에서, 발현 조절 서열은 폴리뉴클레오티드 서열에 작동가능하게 연결된다. "작동가능하게 연결된"이라는 것은, 적절한 분자들(예를 들어, 전사 활성화인자 단백질들)이 발현 조절 서열(들)에 결합될 때, 폴리뉴클레오티드 서열 및 발현 조절 서열(들)이 유전자 발현을 허용하는 방식으로 연결되는 것을 의미한다. 작동가능하게 연결된 프로모터는, 전사 및 번역의 방향에 관하여, 선택된 폴리뉴클레오티드 서열의 상류에 위치된다. 작동가능하게 연결된 인핸서는 선택된 폴리뉴클레오티드의 상류, 내부 또는 하류에 위치될 수 있다.

본 명세서에서 사용되는 바와 같이, "벡터"라는 용어는 벡터가 연결된 다른 핵산, 즉 폴리뉴클레오티드 서열을 수송할 수 있는 핵산 분자를 지칭한다. 일 유형의 유용한 벡터는 에피솜(episome)[즉, 염색체외 복제(extra-chromosomal replication)가 가능한 핵산]이다. 유용한 벡터는 벡터가 연결된 핵산의 자율 복제 및/또는 발현이 가능한 벡터이다. 작동가능하게 연결된 유전자의 발현을 지향할 수 있는 벡터는 본 명세서에서 "발현 벡터"로 칭해진다. 일반적으로, 재조합 DNA 기술들에 유용한 발현 벡터는 흔히 "플라스미드"의 형태로 되어 있으며, 이는 일반적으로 벡터 형태로 염색체에 결합되지 않는 원형의 이중 가닥 DNA 루프를 지칭한다. 플라스미드가 가장 많이 보편적으로 사용되는 벡터의 형태이므로, "플라스미드" 및 "벡터"라는 용어는 본 명세서에서 교환가능하게 사용된다. 하지만, 등가의 기능들을 제공하고, 이후에 해당 기술분야에 알려지는 이러한 다른 형태들의 발현 벡터도 포함된다. 몇몇 구현예들에서, 재조합 벡터는 폴리뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 더 포함한다. 몇몇 구현예들에서, 프로모터는 발달-조절된(developmentally-regulated), 세포소기관-특이적(organelle-specific), 조직-특이적(tissue-specific), 유도성(inducible), 구성적(constitutive), 또는 세포-특이적 프로모터이다. 재조합 벡터는 통상적으로, 폴리뉴클레오티드 서열에 작동가능하게 연결된 발현 조절 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; 폴리뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티(purification moiety); 폴리뉴클레오티드 서열에 작동가능하게 연결된 분비 서열(secretion sequence); 및 폴리뉴클레오티드 서열에 작동가능하게 연결된 표적 서열(targeting sequence)로부터 선택된 적어도 하나의 서열을 포함한다. 특정 구현예들에서, 뉴클레오티드 서열은 숙주 세포의 게놈 DNA 내로 안정하게 통합되며, 뉴클레오티드 서열의 발현은 조절된 프로모터 구역의 조절을 받는다. 본 명세서에 사용되는 발현 벡터는 숙주 세포에서의 폴리뉴클레오티드 서열의 발현에 적합한 형태로 된 본 명세서에 설명된 폴리뉴클레오티드 서열을 포함한다. 해당 기술분야의 당업자라면, 발현 벡터의 설계는 형질전환될 숙주 세포의 선택, 의도한 폴리펩티드의 발현 수준 등과 같은 인자들에 의존할 수 있음을 이해할 것이다. 본 명세서에 설명되는 발현 벡터는 본 명세서에 설명되는 바와 같은 폴리뉴클레오티드 서열에 의해 코딩되는, 융합 폴리펩티드를 포함하는 폴리펩티드를 생성하기 위하여 숙주 세포 내로 도입될 수 있다.

"재조합 세포" 및 "재조합 숙주 세포"라는 용어는 본 명세서에서 교환가능하게 사용되고, 말로닐-CoA 유래 화합물을 생성하기 위해 재조합 세포의 특이적 활성을 증가시킬 수 있는 변이 오페론을 포함하고 및/또는 ACC 변이체를 발현시킬 수 있는 세포를 지칭한다. 재조합 세포는 박테리아, 바이러스 또는 균류와 같은 미생물로부터 유래될 수 있다. 또한, 재조합 세포는 식물 또는 동물 세포로부터 유래될 수 있다. 재조합 세포는, 지방산, 지방족 에스테르[예를 들어, 왁스, 지방산 에스테르, 지방족 에스테르, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE)], 지방족 알코올, 짧은 및 긴 사슬형 알코올, 지방족 알데히드, 탄화수소, 지방족 아민, 말단 올레핀, 내부 올레핀, 케톤, 이작용성 지방산 유도체(예를 들어, ω-하이드록시 지방산, ω-하이드록시 디올, ω-하이드록시 FAME, ω-하이드록시 FAEE); 그리고 비-지방산계 화합물, 예컨대 플라바논, 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함하는(단, 이로 제한되지 않음) 하나 이상의 지방산 유도체를 생성하기 위해 사용될 수 있다. 몇몇 구현예들에서, 재조합 세포는 하나 이상의 폴리뉴클레오티드를 포함하고, 각각의 폴리뉴클레오티드는 지방산 생합성 효소 활성을 갖는 폴리펩티드를 코딩하며, 재조합 세포는 폴리뉴클레오티드를 발현시키기에 효과적인 조건들에서 탄소원의 존재 하에서 배양될 때 지방산 유도체 조성물을 생성한다.

본 명세서 사용되는 바와 같이, "미생물"이라는 용어는 미세한 생물체(microscopic organism)를 지칭한다. 미생물의 예시는 박테리아, 바이러스 또는 균류이다. 일 구현예에서, 미생물은 박테리아성 세포이다. 또 다른 구현예에서, 미생물은 원핵생물 또는 원핵 세포이다. 또 다른 구현예에서, 미생물은 효모 세포와 같은 균류 세포이다. 또 다른 구현예에서, 미생물은 바이러스성 세포이다. 관련 구현예에서, "재조합 미생물"은 유전적으로 변경된 또한 외인성 및/또는 이종 핵산 서열을 발현시키거나 포함하는 미생물이다.

본 명세서에서 사용되는 바와 같이, "아실-ACP"는 아실기 운반 단백질(ACP)의 포스포판테테이닐 모이어티의 술피드릴기와 알킬 사슬의 카르보닐 탄소 사이에서 형성되는 아실 티오에스테르를 지칭한다. 포스포판테테이닐 모이어티는 홀로(holo)-아실기 운반 단백질 신타아제(ACPS)인 포스포판테테이닐 트랜스퍼라아제의 작용에 의해 ACP 상의 보존된 세린 잔기에 번역후(post-translationally) 부착된다. 몇몇 구현예들에서, 아실-ACP는 완전히 포화된 아실-ACP의 합성에 있어서 중간체이다. 다른 구현예들에서, 아실-ACP는 불포화된 아실-ACP의 합성에 있어서 중간체이다. 몇몇 구현예들에서, 탄소 사슬은 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 또는 26 개의 탄소들을 가질 것이다. 이러한 아실-ACP의 각각은 이를 지방산 유도체로 전환시키는 효소에 대한 기질이다.

"말로닐-CoA 유래 화합물"이라는 용어는 생화학 경로를 통해 만들어지는 여하한의 화합물 또는 화학적 개체(즉, 중간체 또는 최종 생성물)를 포함하고, 말로닐-CoA는 중간체로서 기능하며, 및/또는 화합물 또는 화학적 개체의 상류에서 만들어진다(예를 들어, 도 4 참조). 예를 들어, 말로닐-CoA 유래 화합물은 지방산 유도체, 이를테면, 예컨대 지방산; 지방산 메틸 에스테르(FAME) 및/또는 지방산 에틸 에스테르(FAEE)를 포함하는(단, 이로 제한되지 않음) 지방족 에스테르; 지방족 알코올; 지방족 알데히드; 지방족 아민; 알칸; 올레핀 또는 알켄; 탄화수소; 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체, 및 불포화 지방산 유도체를 포함한다(단, 이로 제한되지 않음). 또한, 말로닐-CoA 유래 화합물은 비-지방산 화합물, 이를테면, 예컨대 플라바논, 플라보노이드, 폴리케티드, 말로네이트 및 3-하이드록시프로피온산을 포함한다(단, 이로 제한되지 않음).

"지방산"이라는 용어는 화학식 RCOOH를 갖는 카르복실산을 의미한다. R은 지방족기(aliphatic group), 바람직하게는 알킬기를 나타낸다. R은 약 4 내지 약 22 개의 탄소 원자들을 포함할 수 있다. 지방산은 분지쇄형 사슬 또는 직쇄형 사슬을 가질 수 있고, 포화, 단일불포화 또는 다중불포화될 수 있다.

"지방산 유도체"는 부분적으로 생성 숙주 유기체의 지방산 생합성 경로로부터 만들어지는 생성물이다. "지방산 유도체"는 아실-ACP 또는 아실-ACP 유도체를 포함하는 말로닐-CoA 유래 화합물로부터 만들어지는 생성물을 포함한다. 예시적인 지방산 유도체는 지방산, 지방족 에스테르[예를 들어, 왁스, 지방산 에스테르, 지방족 에스테르, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE)], 지방족 아민, 지방족 알데히드, 지방족 알코올, 짧은 및 긴 사슬형 알코올, 탄화수소, 케톤, 말단 올레핀, 내부 올레핀, 케톤, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체(예를 들어, ω-하이드록시 지방산, ω-하이드록시 디올, ω-하이드록시 FAME, ω-OH FAEE) 및 불포화 지방산 유도체를 포함한다. 또한, "지방산 유도체"는 아실-CoA 또는 아실-CoA 유도체와 같은 말로닐-CoA 유래 화합물로부터 만들어지는 생성물을 포함한다.

본 명세서에서 언급된 바와 같은 "지방산 유도체 조성물"은 재조합 숙주 세포에 의해 생성되며, 통상적으로 지방산 유도체의 혼합물을 포함한다. 몇몇 경우, 혼합물은 하나 이상의 유형의 지방산 유도체 생성물(예를 들어, 지방산, 지방족 에스테르, 지방족 알코올, 지방족 알데히드, 지방족 아민, 이작용성 지방산 유도체 등)을 포함한다. 다른 경우, 지방산 유도체 조성물은, 예를 들어 상이한 사슬 길이, 포화 및/또는 분지 특성을 갖는 지방족 에스테르(또는 다른 지방산 유도체)의 혼합물을 포함할 수 있다. 다른 경우, 지방산 유도체 조성물은 상이한 사슬 길이, 포화 및/또는 분지 특성을 갖는 지방산 유도체와 하나 이상의 유형의 지방산 유도체 생성물의 혼합물을 둘 모두 포함할 수 있다. 다른 경우, 지방산 유도체 조성물은, 예를 들어 지방족 에스테르와 베타 하이드록시 에스테르의 혼합물을 포함할 수 있다. 다른 경우, 지방산 유도체 조성물은, 예를 들어 지방족 알코올과 지방족 알데히드의 혼합물을 포함할 수 있다. 다른 경우, 지방산 유도체 조성물은, 예를 들어 FAME 및/또는 FAEE의 혼합물을 포함할 수 있다.

"변이 비오틴 카르복실 운반 단백질(BCCP)" 및 "비오틴 카르복실 운반 단백질(BCCP) 변이체"는 본 명세서에서 교환가능하게 사용되며, 그 아미노산 서열에 하나 이상의 돌연변이를 갖는 ACC 변이체를 지칭한다. 일 예시에서, 아미노산 서열은 1[즉, ATG 개시 부위(start site)에 기초한 초기 메티오닌(M)]에서 156까지의 범위를 갖는다. 이러한 BCCP 변이체는 아미노산 위치 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 및/또는 156에서 하나 이상의 돌연변이(들)를 가질 수 있다. 일 구현예에서, 돌연변이는 약 위치 1에서 약 위치 60까지의 범위를 갖는 N-말단 아미노산 부위의 돌연변이를 포함한다. 일 구현예에서, 돌연변이는 아미노산 위치 2(개시 코돈 바로 다음)의 돌연변이를 포함한다

"발현이 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 재조합 세포에 부여한다"는 용어는 그 아미노산 서열에 하나 이상의 돌연변이(즉, ACC 변이체 또는 ACC 돌연변이체)를 갖는 ACC 관련 폴리펩티드 또는 단백질의 기능을 지칭하며, ACC 변이체 또는 돌연변이체를 발현시키지 않는 야생형 세포와 비교할 때, 세포에서 발현될 때 말로닐-CoA 유래 화합물(들)의 증가된 생성을 그 세포에 유도한다. 또한, 이는, 세포에서 발현될 때, 말로닐-CoA 유래 화합물(들)을 생성함에 있어서 세포의 더 높은 특이적 활성을 유도하는 효과를 갖는 ACC 변이체의 기능을 지칭한다. 이론에 의해 한정되지 않고, 이는 세포에 더 높은 아세틸-CoA 카르복실라아제(ACC) 효소 활성(E.C. 6.4.1.2)을 직접적으로 또는 간접적으로 유도한 결과일 수 있다. 이는, 대응하는 야생형 세포(즉, ACC 변이체를 발현시키지 않는 세포)에 의해 생성된 말로닐-CoA 유래 화합물의 역가 및/또는 수율과, ACC 변이체를 발현시키는 세포에 의해 생성된 말로닐-CoA 유래 화합물의 역가 및/또는 수율을 비교함으로써 측정될 수 있다. 해당 기술분야의 당업자라면, 예를 들어 GC-FID(gas chromatography flame ionization detector) 등을 포함하는 측정 방법들이 쉽게 이용가능함을 이해할 것이다. ACC 변이 단백질의 일 예시는 비오틴 카르복실 운반 단백질(BCCP) 변이체이다. ACC 변이체(들)는 ACC 복합체의 4 개의 서브유닛들 중 어느 하나 및/또는 2 개의 돌연변이를 포함할 수 있다. ACC 변이체(들)는 4 개의 서브유닛들 중 어느 하나 및/또는 2 개에서의 농도의 변화를 포함할 수 있다. 세포가 ACC 변이체로 형질전환되었을 때, 이는 ACC 변이체를 발현시키는 세포(즉, 재조합 세포)이다. 일 구현예에서, ACC 변이체를 발현시키는 세포에 의해 생성된 말로닐-CoA 유래 화합물의 역가 및/또는 수율은 대응하는 야생형 세포(즉, ACC 변이체를 발현시키지 않는 대응 세포)의 역가 및/또는 수율의 적어도 2 배이다. 또 다른 구현예에서, ACC 변이체를 발현시키는 세포에 의해 생성된 말로닐-CoA 유래 화합물의 역가 및/또는 수율은 대응하는 야생형 세포의 역가 및/또는 수율보다 적어도 약 1 배, 적어도 약 2 배, 적어도 약 3 배, 적어도 약 4 배, 적어도 약 5 배, 적어도 약 6 배, 적어도 약 7 배, 적어도 약 8 배, 적어도 약 9 배, 또는 적어도 약 10 배 더 크다. 일 구현예에서, ACC 변이체를 발현시키는 세포에 의해 생성된 말로닐-CoA 유래 화합물의 역가 및/또는 수율은 대응하는 야생형 세포의 역가 및/또는 수율보다 적어도 약 1 %, 적어도 약 2 %, 적어도 약 3 %, 적어도 약 4 %, 적어도 약 5 %, 적어도 약 6 %, 적어도 약 7 %, 적어도 약 8 %, 적어도 약 9 %, 또는 약 10 % 더 크다. 또 다른 구현예에서, ACC 변이체의 발현으로 인한 역가 및/또는 수율은 야생형 ACC 복합체의 역가 및/또는 수율보다 적어도 약 20 % 내지 적어도 약 100 % 더 크다. 일 구현예에서, 세포에 의해 생성된 말로닐-CoA 유래 화합물의 역가 및/또는 수율은 대응하는 야생형 세포의 역가 및/또는 수율보다 적어도 약 20 %, 적어도 약 25 %, 적어도 약 30 %, 적어도 약 35 %, 적어도 약 40 %, 적어도 약 45 %, 적어도 약 50 %, 적어도 약 55 %, 적어도 약 60 %, 적어도 약 65 %, 적어도 약 70 %, 적어도 약 75 %, 적어도 약 80 %, 적어도 약 85 %, 적어도 약 90 %, 적어도 약 95 %, 적어도 약 97 %, 적어도 약 98 %, 적어도 약 100 % 더 크다. 또 다른 구현예에서, 세포에 의해 생성된 말로닐-CoA 유래 화합물의 역가 및/또는 수율은 대응하는 야생형 세포의 역가 및/또는 수율보다 적어도 약 200 %, 적어도 약 250 %, 적어도 약 300 %, 적어도 약 350 %, 적어도 약 400 %, 적어도 약 450 %, 적어도 약 500 %, 적어도 약 550 %, 적어도 약 600 %, 적어도 약 610, 620, 630, 640 또는 650 %, 적어도 약 700 %, 적어도 약 750 %, 적어도 약 800 %, 또는 적어도 약 850 % 더 크다.

본 명세서에서 사용되는 바와 같이, "지방산 생합성 경로"라는 용어는 지방산 유도체를 생성하는 생합성 경로를 의미한다. 지방산 생합성 경로는 의도한 특성을 갖는 지방산 유도체를 생성하기 위해 추가 효소들을 포함할 수 있다.

본 명세서에서 사용되는 바와 같이, "지방족 에스테르"는 화학식 RCOOR'를 갖는 에스테르를 의미한다. 본 명세서에서 언급되는 지방족 에스테르는 지방산, 예를 들어 지방산 에스테르로부터 만들어지는 여하한의 에스테르일 수 있다. 몇몇 구현예들에서, R기는 길이가 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11 , 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18 또는 적어도 19 개의 탄소들이다. 대안적으로 또는 추가적으로, R기는 길이가 20 이하, 19 이하, 18 이하, 17 이하, 16 이하, 15 이하, 14 이하, 13 이하, 12 이하, 11 이하, 10 이하, 9 이하, 8 이하, 7 이하 또는 6 이하의 탄소들이다. 따라서, R기는 상기의 종단점들 중 어느 2 개에 의해 한정되는 R기를 가질 수 있다. 예를 들어, R기는 길이가 6 내지 16 개의 탄소들, 길이가 10 내지 14 개의 탄소들, 또는 길이가 12 내지 18 개의 탄소들일 수 있다. 몇몇 구현예들에서, 지방족 에스테르 조성물은 C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25 및 C26 지방족 에스테르 중 하나 이상을 포함한다. 다른 구현예들에서, 지방족 에스테르 조성물은 C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17 및 C18 지방족 에스테르 중 하나 이상을 포함한다. 또 다른 구현예들에서, 지방족 에스테르 조성물은 C12, C14, C16 및 C18 지방족 에스테르; C12, C14 및 C16 지방족 에스테르; C14, C16 및 C18 지방족 에스테르; 또는 C12 및 C14 지방족 에스테르를 포함한다.

지방산 유도체, 예를 들어 지방족 에스테르의 R기는 직쇄형 또는 분지쇄형일 수 있다. 분지쇄형은 하나 이상의 분지점을 가질 수 있으며, 사이클릭형 분지들을 포함할 수 있다. 몇몇 구현예들에서, 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 에스테르는 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25 또는 C26 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 에스테르이다. 특정 구현예들에서, 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 에스테르는 C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17 또는 C18 분지형 지방산 또는 분지형 지방족 에스테르이다. 본 명세서의 지방족 에스테르는 A 측 및 B 측을 포함하는 것으로 언급될 수 있다. 본 명세서에서 사용되는 바와 같이, 에스테르의 "A 측"은 에스테르의 카르복실레이트 산소에 부착된 탄소 사슬을 지칭한다. 본 명세서에서 사용되는 바와 같이, 에스테르의 "B 측"은 에스테르의 모(parent) 카르복실레이트를 포함하는 탄소 사슬을 지칭한다. 지방족 에스테르가 지방산 생합성 경로로부터 유래될 때, A 측은 통상적으로 알코올에 의해 기여되고, B 측은 지방산에 의해 기여된다.

지방족 에스테르의 A 측을 형성하기 위해 여하한의 알코올이 사용될 수 있다. 예를 들어, 알코올은 본 명세서에 설명된 것과 같은 지방산 생합성 경로로부터 유래될 수 있다. 대안적으로, 알코올은 비-지방산 생합성 경로를 통해 생성될 수 있다. 또한, 알코올은 외인성으로 제공될 수 있다. 예를 들어, 지방족 에스테르가 유기체에 의해 생성되는 경우, 알코올은 발효 브로쓰에 공급될 수 있다. 대안적으로, 지방족 에스테르가 알코올을 생성할 수 있는 유기체에 의해 생성되는 경우, 지방산 또는 아세트산과 같은 카르복실산은 외인성으로 공급될 수 있다.

에스테르의 A 측 또는 B 측을 포함하는 탄소 사슬은 여하한의 길이로 되어 있을 수 있다. 일 구현예에서, 에스테르의 A 측은 길이가 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 10, 12, 14, 16 또는 18 개의 탄소들이다. 지방족 에스테르가 지방산 메틸 에스테르일 때, 에스테르의 A 측은 길이가 1 개의 탄소이다. 지방족 에스테르가 지방산 에틸 에스테르일 때, 에스테르의 A 측은 길이가 2 개의 탄소들이다. 에스테르의 B 측은 길이가 적어도 약 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24 또는 26 개의 탄소들일 수 있다. A 측 및/또는 B 측은 직쇄형 또는 분지쇄형일 수 있다. 분지쇄형은 하나 이상의 분지점을 가질 수 있다. 또한, 분지쇄형은 사이클릭형 분지들을 포함할 수 있다. 또한, A 측 및/또는 B 측은 포화되거나 불포화될 수 있다. 불포화된 경우, A 측 및/또는 B 측은 하나 이상의 불포화점을 가질 수 있다. 또한, 본 발명에 따라 생성된 지방족 에스테르의 알코올기는 반드시 첫 번째(C1) 위치에 존재할 필요는 없다. 일 구현예에서, 지방족 에스테르는 생합성으로 생성된다. 이 구현예에서는, 먼저 지방산이 "활성화된다". "활성화된" 지방산의 비-제한적인 예시는 아실-CoA, 아실 ACP 및 아실 포스페이트이다. 아실-CoA는 지방산 생합성 또는 분해의 직접적인 산물일 수 있다. 또한, 아실-CoA는 유리 지방산, CoA 및 아데노신 뉴클레오티드 트리포스페이트(ATP)로부터 합성될 수 있다. 아실-CoA를 생성하는 효소의 일 예시는 아실-CoA 신타아제이다.

특정 구현예들에서, 분지형 지방산 유도체는 이소(iso)-지방산 유도체, 예를 들어 이소-지방족 에스테르, 또는 안테이소(anteiso)-지방산 유도체, 예를 들어 안테이소-지방족 에스테르이다. 예시적인 구현예들에서, 분지형 지방산 유도체는 이소-C7:0, 이소-C8:0, 이소-C9:0, 이소-C10:0, 이소-C11:0, 이소-C12:0, 이소-C13:0, 이소-C14:0, 이소-C15:0, 이소-C16:0, 이소-C17:0, 이소-C18:0, 이소-C19:0, 안테이소-C7:0, 안테이소-C8:0, 안테이소-C9:0, 안테이소-C10:0, 안테이소-C11:0, 안테이소-C12:0, 안테이소-C13:0, 안테이소-C14:0, 안테이소-C15:0, 안테이소-C16:0, 안테이소-C17:0, 안테이소-C18:0 및 안테이소-C19:0 분지형 지방족 에스테르로부터 선택된다.

분지형 또는 비분지형 지방산 유도체의 R기는 포화되거나 불포화될 수 있다. 불포화된 경우, R기는 하나 이상의 불포화점을 가질 수 있다. 몇몇 구현예들에서, 불포화 지방산 유도체는 단일불포화 지방산 유도체이다. 특정 구현예들에서, 불포화 지방산 유도체는 C6:1, C7:1, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1, C20:1, C21:1, C22:1, C23:1, C24:1, C25:1 또는 C26:1 불포화 지방산 유도체이다. 특정 구현예들에서, 불포화 지방산 유도체는 C10:1, C12:1, C14:1, C16:1 또는 C18:1 불포화 지방산 유도체이다. 다른 구현예들에서, 불포화 지방산 유도체는 오메가-7 위치에서 불포화된다. 특정 구현예들에서, 불포화 지방산 유도체는 시스(cis) 이중 결합을 포함한다.

본 명세서에서 사용되는 바와 같이, "클론"이라는 용어는 통상적으로 단일 공통 선조와 본질적으로 유전적으로 동일하고 이의 자손인 세포 또는 세포들의 그룹, 예를 들어 단일 박테리아성 세포에서 발생하는 클로닝된 박테리아성 콜로니(cloned bacterial colony)의 박테리아를 지칭한다.

본 명세서에서 사용되는 바와 같이, "배양물"이라는 용어는 통상적으로 생세포(viable cell)를 포함하는 액체 배지를 지칭한다. 일 구현예에서, 배양물은 조절된 조건들 하에서 사전설정된 배양 배지에서 번식하는 세포, 예를 들어 선택된 탄소원 및 질소를 포함하는 액체 배지에서 성장되는 재조합 숙주 세포의 배양물을 포함한다. "배양하는" 또는 "배양"은 액체 또는 고체 배지의 적절한 조건들 하에서 숙주 세포(예를 들어, 재조합 숙주 세포)의 개체군을 성장시키는 것을 지칭한다. 특정 구현예들에서, 배양은 최종 생성물로의 기질의 발효성 생물전환(bioconversion)을 지칭한다. 배양 배지는 잘 알려져 있으며, 이러한 배양 배지의 개별 성분들은 예를 들어 Difco™ 배지 및 BBL™ 배지의 상용 공급원(commercial source)으로부터 이용가능하다. 비-제한적인 일 예시에서, 수성 영양 배지는 YP 배지와 같이 질소, 염 및 탄소의 복합원을 포함하는 "풍부한 배지(rich medium)"이며, 이는 이러한 배지의 10 g/L의 펩톤 및 10 g/L 효모 추출물을 포함한다.

본 명세서에서 사용되는 바와 같이, 재조합 숙주 세포 내에서 단백질, 예를 들어 효소의 "변형된" 또는 "변경된 수준"의 활성은 모(parent) 또는 원래 숙주 세포에 대해 결정된 활성의 하나 이상의 특징의 차이를 지칭한다. 통상적으로, 활성의 차이는 변형된 활성을 갖는 재조합 숙주 세포와 대응하는 야생형 숙주 세포 사이에서 결정된다(예를 들어, 대응하는 야생형 숙주 세포에 대한 재조합 숙주 세포의 배양물의 비교). 예를 들어, 변형된 활성은 [예를 들어, 단백질을 코딩하는 DNA 서열의 증가 또는 감소된 수의 복제, 단백질을 코딩하는 증가 또는 감소된 수의 mRNA 전사체, 및/또는 mRNA로부터의 단백질의 증가 또는 감소된 양의 단백질 번역의 결과로서] 재조합 숙주 세포에 의해 발현되는 변형된 양의 단백질; 단백질의 구조 변화[예를 들어, 기질 특이성의 변화, 관찰되는 운동 파라미터(kinetic parameter)들의 변화를 유도하는 단백질 코딩 서열에 대한 변화와 같은 일차 구조에 대한 변화); 및 단백질 안정성의 변화(예를 들어, 단백질의 증가 또는 감소된 분해)의 결과일 수 있다. 몇몇 구현예들에서, 폴리펩티드는 본 명세서에 설명된 폴리펩티드 중 어느 하나의 돌연변이체 또는 변이체, 예를 들어 변이 BCCP를 포함하는 변이 ACC이다. 특정 경우에서, 본 명세서에 설명된 폴리펩티드들에 대한 코딩 서열은 특정 숙주 세포에서의 발현에 최적화된 코돈이다. 예를 들어, 대장균의 발현에 대하여, 하나 이상의 코돈이 최적화될 수 있다(Grosjean 외 (1982) Gene 18:199-209 ).

통상적으로, 본 명세서에서 사용되는 바와 같은 "조절 서열(regulatory sequences)"이라는 용어는 궁극적으로 단백질의 발현을 조절하는 단백질을 코딩하는 DNA 서열들에 작동가능하게-연결된, DNA의 염기 서열을 지칭한다. 조절 서열의 예시들은 RNA 프로모터 서열, 전사 인자 결합 서열, 전사 종결 서열, (인핸서 요소와 같은) 전사의 조절인자(modulator), RNA 안정성에 영향을 주는 뉴클레오티드 서열, 및 번역 조절 서열[예컨대, 리보솜 결합 부위(예를 들어, 원핵생물의 샤인-달가노 서열(Shine-Dalgarno sequence) 또는 진핵생물의 코작 서열(Kozak sequence)), 개시 코돈, 종결 코돈]을 포함한다(단, 이로 제한되지 않음). 본 명세서에 사용되는 바와 같이, "상기 뉴클레오티드 서열의 발현은 야생형 뉴클레오티드 서열에 대해 변형된다"라는 어구는, 내인성 뉴클레오티드 서열의 발현 및/또는 활성 또는 이종 혹은 비-원래 폴리펩티드-코딩 뉴클레오티드 서열의 발현 및/또는 활성의 수준의 증가 또는 감소를 의미한다. "변경된 수준의 발현" 및 "변형된 수준의 발현"이라는 용어는 교환가능하게 사용되며, 폴리뉴클레오티드, 폴리펩티드 또는 탄화수소가 동일한 조건들 하에서 대응하는 야생형 세포의 농도와 비교 시 조작된 숙주 세포에서 상이한 농도로 존재함을 의미한다. 본 명세서에 사용되는 바와 같이, 폴리뉴클레오티드에 대한 "발현"이라는 용어는 이것이 기능하게 한다는 것이다. 폴리펩티드(또는 단백질)를 코딩하는 폴리뉴클레오티드는, 발현될 때, 그 폴리펩티드(또는 단백질)를 생성하기 위해 전사 및 번역될 것이다. 본 명세서에 사용되는 바와 같이, "과발현"이라는 용어는 동일한 조건들 하에서 대응하는 야생형 세포에서 정상적으로 발현되는 것보다 더 높은 농도로 세포에서 폴리뉴클레오티드 또는 폴리펩티드를 발현시키거나 발현되게 하는 것을 의미한다.

본 명세서에서 사용되는 바와 같이, "역가"라는 용어는 숙주 세포 배양물의 단위 부피당 생성된 지방산 유도체를 포함하는 말로닐-CoA 유래 화합물의 양을 지칭한다. 본 명세서에 설명된 조성물들 및 방법들의 어느 한 측면에서, 지방산 유도체 또는 다른 화합물은 약 25 mg/L, 약 50 mg/L, 약 75 mg/L, 약 100 mg/L, 약 125 mg/L, 약 150 mg/L, 약 175 mg/L, 약 200 mg/L, 약 225 mg/L, 약 250 mg/L, 약 275 mg/L, 약 300 mg/L, 약 325 mg/L, 약 350 mg/L, 약 375 mg/L, 약 400 mg/L, 약 425 mg/L, 약 450 mg/L, 약 475 mg/L, 약 500 mg/L, 약 525 mg/L, 약 550 mg/L, 약 575 mg/L, 약 600 mg/L, 약 625 mg/L, 약 650 mg/L, 약 675 mg/L, 약 700 mg/L, 약 725 mg/L, 약 750 mg/L, 약 775 mg/L, 약 800 mg/L, 약 825 mg/L, 약 850 mg/L, 약 875 mg/L, 약 900 mg/L, 약 925 mg/L, 약 950 mg/L, 약 975 mg/L, 약 1000 mg/L, 약 1050 mg/L, 약 1075 mg/L, 약 1100 mg/L, 약 1125 mg/L, 약 1150 mg/L, 약 1175 mg/L, 약 1200 mg/L, 약 1225 mg/L, 약 1250 mg/L, 약 1275 mg/L, 약 1300 mg/L, 약 1325 mg/L, 약 1350 mg/L, 약 1375 mg/L, 약 1400 mg/L, 약 1425 mg/L, 약 1450 mg/L, 약 1475 mg/L, 약 1500 mg/L, 약 1525 mg/L, 약 1550 mg/L, 약 1575 mg/L, 약 1600 mg/L, 약 1625 mg/L, 약 1650 mg/L, 약 1675 mg/L, 약 1700 mg/L, 약 1725 mg/L, 약 1750 mg/L, 약 1775 mg/L, 약 1800 mg/L, 약 1825 mg/L, 약 1850 mg/L, 약 1875 mg/L, 약 1900 mg/L, 약 1925 mg/L, 약 1950 mg/L, 약 1975 mg/L, 약 2000 mg/L(2 g/L), 3 g/L, 5 g/L, 1O g/L, 20 g/L, 30 g/L, 40 g/L, 50 g/L, 60 g/L, 70 g/L, 80 g/L, 90 g/L, 1OO g/L 또는 상기 값들 중 어느 2 개에 의해 한정되는 범위의 역가로 생성된다. 다른 구현예들에서, 지방산 유도체 또는 다른 화합물은 1OO g/L 초과, 200 g/L 초과 또는 300 g/L 초과의 역가로 생성된다. 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성되는 지방산 유도체 또는 다른 화합물의 바람직한 역가는 5 g/L 내지 200g/L, 1O g/L 내지 150 g/L, 20 g/L 내지 120 g/L, 및 30 g/L 내지 1OO g/L이다. 역가는 주어진 재조합 숙주 세포 배양물에 의해 생성되는 특정 지방산 유도체 또는 지방산 유도체들의 조합물 또는 또 다른 화합물 또는 다른 화합물들의 조합물을 지칭할 수 있다. 예를 들어, 대장균과 같은 재조합 숙주 세포에서의 ACC 변이체의 발현은 대응하는 야생형 폴리펩티드를 발현시키는 재조합 숙주 세포와 비교 시 더 높은 역가의 생성을 유도한다. 일 구현예에서, 더 높은 역가는 적어도 약 5 g/L에서 약 200 g/L의 범위를 갖는다.

본 명세서에서 사용되는 바와 같이, "숙주 세포에 의해 생성되는 지방산 유도체 또는 다른 화합물을 포함하는 말로닐-CoA 유래 화합물의 수율"은 투입된 탄소원이 숙주 세포의 생성물(즉, 지방산 유도체 및/또는 다른 화합물을 포함하는 말로닐-CoA 유래 화합물)로 전환되는 효율을 지칭한다. 본 발명의 방법들에 따라 지방산 유도체를 포함하는 말로닐-CoA 유래 화합물을 생성하도록 조작된 숙주 세포는 적어도 약 3 %, 적어도 약 4 %, 적어도 약 5 %, 적어도 약 6 %, 적어도 약 7 %, 적어도 약 8 %, 적어도 약 9 %, 적어도 약 10 %, 적어도 약 11 %, 적어도 약 12 %, 적어도 약 13 %, 적어도 약 14 %, 적어도 약 15 %, 적어도 약 16 %, 적어도 약 17 %, 적어도 약 18 %, 적어도 약 19 %, 적어도 약 20 %, 적어도 약 21 %, 적어도 약 22 %, 적어도 약 23 %, 적어도 약 24 %, 적어도 약 25 %, 적어도 약 26 %, 적어도 약 27 %, 적어도 약 28 %, 적어도 약 29 % 또는 적어도 약 30 %, 또는 상기 값들 중 어느 2 개에 의해 한정되는 범위의 수율을 갖는다. 다른 구현예들에서, 지방산 유도체 또는 유도체들 또는 다른 화합물(들)은 약 30 % 이상, 약 35 % 이상, 약 40 % 이상, 약 45 % 이상, 약 50 % 이상, 약 55 % 이상, 약 60 % 이상, 약 65 % 이상, 약 70 % 이상, 약 75 % 이상, 약 80 % 이상, 약 85 % 이상, 약 90 % 이상, 약 100 % 이상, 약 200 % 이상, 약 250 % 이상, 약 300 % 이상, 약 350 % 이상, 약 400 % 이상, 약 450 % 이상, 약 500 % 이상, 약 550 % 이상, 약 600 % 이상, 약 650 % 이상, 약 700 % 이상, 약 750 % 이상, 또는 그 이상의 수율로 생성된다. 대안적으로 또는 추가적으로, 수율은 약 30 % 이하, 약 27 % 이하, 약 25 % 이하 또는 약 22 % 이하이다. 또 다른 구현예에서, 수율은 약 50 % 이하, 약 45 % 이하, 또는 약 35 % 이하이다. 또 다른 구현예에서, 수율은 약 95 % 이하, 약 90 % 이하, 약 85 % 이하, 약 80 % 이하, 약 75 % 이하, 약 70 % 이하, 약 65 % 이하, 약 60 % 이하, 약 55 % 이하, 또는 약 50 % 이하이다. 따라서, 수율은 상기 종단점들 중 어느 2 개에 의해 한정될 수 있다. 예를 들어, 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성되는 지방산 유도체 또는 유도체들을 포함하는 말로닐-CoA 유래 화합물의 수율은 약 5 % 내지 약 15 %, 약 10 % 내지 약 25 %, 약 10 % 내지 약 22 %, 약 15 % 내지 약 27 %, 약 18 % 내지 약 22 %, 약 20 % 내지 약 28 %, 또는 약 20 % 내지 약 30 %, 약 30 % 내지 약 40 %, 약 40 % 내지 약 50 %, 약 50 % 내지 약 60 %, 약 60 % 내지 약 70 %, 약 70 % 내지 약 80 %, 약 80 % 내지 약 90 %, 약 90 % 내지 약 100 %, 약 100 % 내지 약 200 %, 약 200 % 내지 약 300 %, 약 300 % 내지 약 400 %, 약 400 % 내지 약 500 %, 약 500 % 내지 약 600 %, 약 600 % 내지 약 700 % 또는 약 700 % 내지 약 800 %일 수 있다. 수율은 주어진 재조합 숙주 세포 배양물에 의해 생성되는 지방산 유도체 또는 지방산 유도체들의 조합물 또는 또 다른 화합물 또는 화합물들의 또 다른 조합물을 포함하는 특정 말로닐-CoA 유래 화합물을 지칭할 수 있다. 일 구현예에서, 대장균과 같은 재조합 숙주 세포에서의 ACC 변이체의 발현은, 대응하는 야생형 폴리펩티드를 발현시키는 숙주 세포와 비교 시, 지방산 유도체, 이를테면, 예컨대 지방족 에스테르를 포함하는 말로닐-CoA 유래 화합물의 더 높은 수율의 생성을 유도한다. 일 구현예에서, 더 높은 수율은 이론적인 수율의 약 10 %에서 약 800 %의 범위를 갖는다.

본 명세서에서 사용되는 바와 같이, "생산성"이라는 용어는 단위 시간당 숙주 세포 배양물의 단위 부피당 생성된 지방산 유도체 또는 유도체들 또는 또 다른 화합물 또는 화합물들을 포함하는 말로닐-CoA 유래 화합물의 양을 지칭한다. 본 명세서에 설명된 조성물들 및 방법들의 어느 한 측면에서, 재조합 숙주 세포에 의해 생성된 지방산 유도체 또는 유도체들 또는 다른 화합물 또는 화합물들을 포함하는 말로닐-CoA 유래 화합물의 생산성은 100 mg/L/시간, 적어도 200 mg/L/시간, 적어도 300 mg/L/시간, 적어도 400 mg/L/시간, 적어도 500 mg/L/시간, 적어도 600 mg/L/시간, 적어도 700 mg/L/시간, 적어도 800 mg/L/시간, 적어도 900 mg/L/시간, 적어도 1000 mg/L/시간, 적어도 1100 mg/L/시간, 적어도 1200 mg/L/시간, 적어도 1300 mg/L/시간, 적어도 1400 mg/L/시간, 적어도 1500 mg/L/시간, 적어도 1600 mg/L/시간, 적어도 1700 mg/L/시간, 적어도 1800 mg/L/시간, 적어도 1900 mg/L/시간, 적어도 2000 mg/L/시간, 적어도 2100 mg/L/시간, 적어도 2200 mg/L/시간, 적어도 2300 mg/L/시간, 적어도 2400 mg/L/시간, 적어도 2500 mg/L/시간이거나, (세포 질량에 따라) 10 g/L/시간만큼 높다. 예를 들어, 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성된 지방산 유도체 또는 유도체들 또는 다른 화합물(들)을 포함하는 말로닐-CoA 유래 화합물의 생산성은 500 mg/L/시간 내지 2500 mg/L/시간, 또는 700 mg/L/시간 내지 2000 mg/L/시간일 수 있다. 생산성은 주어진 재조합 숙주 세포 배양에 의해 생성된 지방산 유도체 또는 지방산 유도체들의 조합물 또는 다른 화합물(들)을 포함하는 특정 말로닐-CoA 유래 화합물을 지칭할 수 있다. 예를 들어, 대장균과 같은 재조합 숙주 세포에서의 ACC 변이체의 발현은 대응하는 야생형 폴리펩티드를 발현시키는 재조합 숙주 세포와 비교 시 지방산 유도체들 또는 다른 화합물들을 포함하는 말로닐-CoA 유래 화합물들의 증가된 생산성의 생성을 유도한다. 일 구현예에서, 더 높은 생산성은 약 0.3 g/L/h에서 약 3 g/L/h까지 약 10 g/L/h까지 약 100 g/L/h까지 약 1000 g/L/h까지의 범위를 갖는다.

본 명세서에서 사용되는 바와 같이, "총 지방 종들(fatty species)" 및 "총 지방산 생성물" 및 "지방산 유도체"라는 용어는 GC-FID에 의해 평가되는 바와 같이 ACC 변이체를 발현시키는 숙주 세포에 의해 생성될 수 있는 지방산 유도체의 양과 관련하여 본 명세서에서 교환가능하게 사용될 수 있다. 동일한 용어들은, 지방산 유도체 분석과 관련 있는 경우, 예를 들어 지방족 에스테르, 지방족 알코올, 지방족 알데히드, 지방족 아민 및 유리 지방산을 의미하는 데 사용될 수 있다.

본 명세서에서 사용되는 바와 같이, "글루코오스 이용률"이라는 용어는 그램/리터/시간(g/L/hr)으로 기록되는 단위 시간당 배양물에 사용되는 글루코오스의 양을 의미한다.

본 명세서에서 사용되는 바와 같이, "탄소원"이라는 용어는 원핵 또는 단순 진핵 세포 성장을 위한 탄소원으로서 사용되기에 적합한 기질 또는 화합물을 지칭한다. 탄소원은 중합체, 탄수화물, 산, 알코올, 알데히드, 케톤, 아미노산, 펩티드 및 기체(예를 들어, CO 및 CO₂)를 포함하는(단, 이로 제한되지 않음) 다양한 형태로 존재할 수 있다. 예시적인 탄소원은 글루코오스, 프럭토오스, 만노오스, 갈락토오스, 자일로오스 및 아라비노오스와 같은 단당류; 프럭토-올리고당 및 갈락토-올리고당과 같은 올리고당류; 녹말, 셀룰로오스, 펙틴 및 자일란과 같은 다당류; 수크로오스, 말토오스, 셀로비오스 및 투라노오스(turanose)와 같은 이당류; 헤미셀룰로오스(hemicellulose), 메틸 셀룰로오스 및 소듐 카르복시메틸 셀룰로오스와 같은 셀룰로오스 물질 및 변이체; 숙시네이트, 락테이트 및 아세테이트와 같은 포화 또는 불포화 지방산류; 에탄올, 메탄올 및 글리세롤과 같은 알코올류, 또는 이의 혼합물들을 포함한다(단, 이로 제한되지 않음). 또한, 탄소원은 글루코오스와 같은 광합성의 산물일 수 있다. 특정 구현예들에서, 탄소원은 바이오매스이다. 다른 구현예들에서, 탄소원은 글루코오스이다. 다른 구현예들에서, 탄소원은 수크로오스이다. 다른 구현예들에서, 탄소원은 글리세롤이다. 다른 구현예들에서, 탄소원은 단순한 탄소원이다. 다른 구현예들에서, 탄소원은 재생가능한 탄소원이다.

본 명세서에서 사용되는 바와 같이, "바이오매스"라는 용어는 탄소원이 유래되는 여하한의 생물학적 물질을 지칭한다. 몇몇 구현예들에서, 바이오매스는 탄소원으로 처리되며, 이는 생물전환에 적합하다. 다른 구현예들에서, 바이오매스는 탄소원으로의 추가적인 처리를 요구하지 않는다. 탄소원은 지방족 에스테르를 포함하는 조성물로 전환될 수 있다. 지방족 에스테르는 계면활성제, 중합체, 필름, 직물, 염료, 의약품, 방향제 및 착향료, 래커, 페인트, 바니쉬, 수지 및 플라스틱의 연화제, 가소제, 난연제, 및 가솔린 및 오일의 첨가제를 포함하는(단, 이로 제한되지 않음) 다수의 생성물에서 유용성을 찾을 수 있다.

예시적인 바이오매스의 공급원은 옥수수, 사탕수수 또는 스위치그래스(switchgrass)와 같은 식물성 물질 또는 식생(vegetation)이다. 또 다른 예시적인 바이오매스의 공급원은 동물성 물질[예를 들어, 우분(cow manure)]과 같은 대사 노폐물(metabolic waste products)이다. 또 다른 예시적인 바이오매스의 공급원은 조류 및 여타의 해양 식물을 포함한다. 또한, 바이오매스는 글리세롤, 발효 찌꺼기, 목초, 짚, 목재, 오수, 쓰레기, 셀룰로오스성 도시 폐기물 및 음식 쓰레기(예를 들어, 비누, 오일 및 지방산)를 포함하는(단, 이로 제한되지 않음) 산업, 농업, 임업 및 가정으로부터의 폐기물을 포함한다. 또한, "바이오매스"라는 용어는 탄수화물(예를 들어, 단당류, 이당류 또는 다당류)과 같은 탄소원을 지칭할 수 있다.

본 명세서에서 사용되는 바와 같이, 생성물들에 대하여 "분리된"이라는 용어는 세포 성분, 세포 배양 배지, 또는 화학적 또는 합성 전구체로부터 분별된(separated) 생성물들을 지칭한다. 본 명세서에 설명된 방법들에 의해 생성된 지방산 유도체는 발효 브로쓰에서 그리고 세포질에서 상대적으로 혼합되지 않을 수 있다. 그러므로, 지방산 유도체는 세포내 또는 세포외에서 유기 상(organic phase)으로 수집될 수 있다.

본 명세서에서 사용되는 바와 같이, "정제한다", "정제된" 또는 "정제"라는 용어는, 예를 들어 분리 또는 분별에 의해 그 환경으로부터 분자의 제거 또는 분리를 의미한다. "실질적으로 정제된" 분자는 이것이 연계된 다른 성분들로부터 적어도 약 60 % 유리(free)(예를 들어, 적어도 약 70 % 유리, 적어도 약 75 % 유리, 적어도 약 85 % 유리, 적어도 약 90 % 유리, 적어도 약 95 % 유리, 적어도 약 97 % 유리, 적어도 약 99 % 유리)된다. 본 명세서에서 사용되는 바와 같이, 또한 이러한 용어들은 샘플로부터 오염물의 제거를 지칭한다. 예를 들어, 오염물의 제거는 샘플에서의 지방산 유도체 또는 다른 화합물을 포함하는 말로닐-CoA 유래 화합물의 백분율의 증가를 유도할 수 있다. 예를 들어, 지방산 유도체 또는 다른 화합물을 포함하는 말로닐-CoA 유래 화합물이 재조합 숙주 세포에서 생성될 때, 지방산 유도체 또는 다른 화합물을 포함하는 말로닐-CoA 유래 화합물이 숙주 세포 단백질의 제거에 의해 정제될 수 있다. 정제 후, 샘플에서의 지방산 유도체 또는 다른 화합물을 포함하는 말로닐-CoA 유래 화합물의 백분율이 증가된다. "정제한다", "정제된" 및 "정제"라는 용어는 절대 순도를 요구하지 않는 상대적인 용어이다. 따라서, 예를 들어, (지방산 유도체 또는 다른 화합물을 포함하는) 말로닐-CoA 유래 화합물이 재조합 숙주 세포들에서 생성될 때, (정제된 지방산 유도체 또는 다른 화합물을 포함하는) 말로닐-CoA 유래 화합물은 다른 세포 성분(예를 들어, 핵산, 폴리펩티드, 지질, 탄수화물 또는 다른 탄화수소)과 실질적으로 분별되는 (지방산 유도체 또는 다른 화합물을 포함하는) 말로닐-CoA 유래 화합물이다.

본 명세서에 사용되는 바와 같이, "감쇠"라는 용어는 약화, 감소 또는 줄어듦을 의미한다. 예를 들어, 폴리펩티드는 그 활성을 감소시키기 위해 폴리펩티드를 변형시킴으로써(예를 들어, 폴리펩티드를 코딩하는 뉴클레오티드 서열을 변형시킴으로써) 감쇠될 수 있다.

아세틸- CoA 카르복실라아제( ACC ) 변이체

지방산 신타아제(FAS)는 아실 사슬의 개시 및 연장을 촉매화하는 폴리펩티드들의 그룹을 나타낸다(Marrakchi 외 (2002) Biochemical Society 30:1050-1055). FAS 경로에서 효소들과 함께 아실기 운반 단백질(ACP)은 생성되는 지방산의 길이, 포화도 및 분지를 조절한다. FAS 경로에 포함되는 효소들은 ACC, FabD, FabH, FabG, FabA, FabZ, FabI, FabK, FabL, FabM, FabB 및 FabF를 포함한다(단, 이로 제한되지 않음). 의도한 생성물에 따라, 이러한 유전자들 중 하나 이상이 재조합 숙주 세포에서 선택적으로 감쇠되거나 과발현될 수 있다(예를 들어, 미국 특허 8,658,404; 8,597,922; 8,535,916; 8,530,221; 8,372,610; 8,323,924; 8,313,934; 8,283,143; 8,268,599; 8,183,028; 8,110,670; 8,110,093; 및 8,097,439 참조).

ACC 효소(E.C. 6.4.1.2.)는 아세틸-CoA를 말로닐-CoA로 카르복실화하는 지방산 생합성의 제 1 개입 단계(committed step)를 촉매화한다. 이와 같이, 이는 지방산, 지방산 유도체 및 다른 비-지방산 화합물의 생합성을 위한 말로닐-CoA 기질을 제공한다(예를 들어, 도 4 참조). ACC 효소는 대부분의 생물에서 발견되며, 모든 원핵생물의 대부분에 그리고 대다수의 식물 및 조류의 엽록체에 다-서브유닛 효소로서 존재한다. 원핵 ACC 효소 또는 ACC 효소 복합체는 고정된 비율로 복합체로 조립되는 4 개의 상이한 유전자(즉, accA, accB, accC, 및 accD)에 의해 코딩된 4 개의 상이한 단백질을 포함한다(Broussard 외 (2013) 위 참조). 유전자 accB 및 accC는 ACC 서브유닛들, 비오틴 카르복실 운반 단백질(BCCP) 및 비오틴 카르복실라아제(BC)를 각각 코딩한다. 놀랍게도, 본 발명은 ACC 유전자들(예를 들어, accB, accC) 중 오직 하나 또는 2 개의 돌연변이(들)가 지방산 메틸 에스테르(FAME)와 같은 지방산 유도체를 포함하는 말로닐-CoA 유래 화합물의 더 높은 역가 및/또는 수율을 유도하고 지방산 플럭스(fatty acid flux)를 증가시키기에 충분하다는 것을 나타낸다. 본 발명은 accB의 코딩 부위의 돌연변이들이 유익하고, 또한 accB와 accC 유전자 둘 모두의 동시적 발현 변화가 유익함을 나타낸다. 대장균에서, accB 및 accC 유전자는 염색체에서 오페론에 인접한 것으로 발견된다. 본 명세서에 개시된 ACC 변이체는 4 개의 ACC 유전자 중 하나 또는 2 개의 발현 변화 또는 돌연변이를 포함하며, 이는 다른 ACC 서브유닛 유전자 및 폴리펩티드를 이미 포함한 세포 상으로 증가된 ACC 효소 활성을 부여하기에 충분하다.

따라서, 본 발명은, 특히 세포에서 발현될 때 말로닐-CoA 유래 화합물들의 더 높은 역가 및/또는 더 높은 수율을 유도하는 ACC 변이체; 이러한 ACC 변이체의 폴리펩티드 서열 및 이의 기능적 단편; ACC 변이 폴리펩티드 서열을 코딩하는 폴리뉴클레오티드; ACC 변이 폴리펩티드를 코딩하는 핵산을 포함하는 재조합 미생물; ACC 변이 폴리펩티드를 발현시킬 수 있는 미생물; 이러한 미생물의 배양물; 지방산 유도체 및 비-지방산 화합물을 포함하는 말로닐-CoA-유래 화합물을 생성하는 공정; 및 결과적인 조성물에 관한 것이다. 특히, ACC 변이 폴리펩티드 및 이 폴리펩티드를 발현시키는 미생물 그리고 관련 방법들이 본 명세서에 제공된다. ACC 변이체의 예시는 표 1 및 표 3(아래 참조)에 나타낸 바와 같은 BCCP 변이체이다.

accB의 대장균 야생형 핵산 서열이 SEQ ID NO: 1에 나타내어진다. (SEQ ID NO: 1의 accB에 의해 코딩된) BCCP에 대한 대응하는 대장균 야생형 아미노산 서열이 SEQ ID NO: 2에 나타내어진다. SEQ ID NO: 2는 본 발명을 예시하기 위해 개선된 ACC 변이 폴리펩티드를 생성하는 템플릿으로서 사용되었다(아래의 실시예 1 참조). 바람직한 ACC 변이체는 SEQ ID NO: 2의 야생형 대장균의 아미노산 서열에 대해 적어도 약 50 %, 약 60 %, 약 70 %, 약 80 %, 약 90 %, 또는 약 99 %의 서열 동일성을 갖는다. ATG 다음의 첫번째 아미노산은 아미노산 "2"로 지정된다.

일 측면에서, 본 발명은 ACC 변이 폴리펩티드 또는 ACC 변이체 및 이를 코딩하는 뉴클레오티드 서열을 제공한다. 상이한 아미노산 위치(또는 잔기)에서의 다양한 돌연변이는, 예를 들어 지방산 메틸 에스테르(FAME) 생성과 같은 다양한 지방산 유도체의 생성을 증가시킬 것이다. 예를 들어, 어느 위치 및 돌연변이가 가장 큰 개선을 제공하는지를 결정하기 위해 표적 부위-포화 돌연변이유발과 같은 기술들이 사용될 수 있다.

야생형 accB 유전자는 아스파르트산 또는 아스파테이트(Asp, D)를 코딩하는 위치 2에서 GAT 코돈을 함유한다. 일 구현예에서, SEQ ID NO: 2의 야생형 accB 유전자 내의 아미노산 위치 2에서의 돌연변이가 FAME 생성을 증가시켰음을 알 수 있다. (부연하면, 돌연변이 accB 유전자에 의해 코딩된) 이 변이 ACC 폴리펩티드는 야생형 ACC에 대한 지방족 에스테르의 생성을 증가시킬 수 있다. 아래의 표 1은 accB 위치 2에 대한 최적의 변위체의 요약을 나타낸다. 당업자라면, 에스테르 생성을 증가시키는 것이, 예를 들어 지방산 유도체 생성과 같은 말로닐-CoA 유래 화합물을 증가시킬 수 있는 능력에 대해 변이 ACC 폴리펩티드를 테스트하는 한 가지 방식임을 이해할 것이다. (예를 들어, 지방족 알코올 생성 또는 지방족 알데히드 생성 또는 지방산 생성 등과 같은 여타의 지방산 유도체 생성이 아닌) 지방족 에스테르 생성은 단지 예시를 위해 사용되었으며, 본 발명을 제한하려는 의미는 아니다. 또한, 당업자라면, 본 발명의 교시를 따름으로써, 또한 해당 기술분야의 당업자가 일반적으로 이용가능하고 본 명세서에 개시된 바와 같은 방법들 및 프로토콜들을 이용함으로써, 말로닐-CoA로부터 유래되는 다른 화합물들이 증가될 수 있음을 인지할 것이다.

표 1: 증가된 FAME 생성을 갖는 accB 변이체들

돌연변이된 위치에 따라, 특정화된 위치에서의 단일 또는 다수의 아미노산 변화는 지방산 유도체 생성의 증가 그리고 비-지방산 화합물의 생성의 증가를 가져온다. 일 구현예에서, 단일 또는 다수의 아미노산 변화는 지방산 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 지방산 메틸 에스테르(FAME) 및/또는 지방산 에틸 에스테르(FAEE)를 포함하는(단, 이로 제한되지 않음) 지방족 에스테르 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 지방족 알데히드 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 지방족 알코올 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 지방족 아민 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 탄화수소 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 알칸 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 알켄 또는 올레핀 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 하이드록시 지방산 및/또는 이산을 포함하는(단, 이로 제한되지 않음) 이작용성 지방산 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 이작용성 지방족 알코올 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 이작용성 지방족 에스테르 및/또는 지방족 아민 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 베타-하이드록시 지방산 유래 화합물의 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 불포화 지방산 유래 화합물의 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 플라바논 및/또는 플라보노이드의 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 폴리케티드의 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 3-하이드록시프로피온산(3-HP)의 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 말론산 또는 말로네이트의 생성의 증가를 유도한다.

따라서, 특정화된 위치에서의 하나 이상의 아미노산 변화의 조합은 지방산 유도체 및/또는 유리 지방산 생성 및/또는 비-지방산계 화합물, 예컨대 플라바논 및/또는 플라보노이드, 폴리케티드, 말로네이트, 3-하이드록시프로피온산(3-HP) 등의 증가를 가져올 수 있다. 지방산 유도체 생성에 관한 각각의 개별 아미노산 변화의 효과는 지방산 유도체 생성 또는 비-지방산 화합물의 생성에 관한 다른 개별 아미노산 변화의 효과에 추가될 수 있거나 추가되지 않을 수 있다. 몇몇 구현예들에서, 특정화된 위치에서의 하나 이상의 아미노산 변화의 조합은 지방산 유도체 생성의 증가를 유도한다. 따라서, 특정화된 위치에서의 하나 또는 다수의 아미노산 변화는 지방산 유도체 생성의 증가를 가져올 수 있다. 유사하게, 특정화된 위치에서의 하나 또는 다수의 아미노산 변화는 비-지방산 화합물의 증가를 가져올 수 있다.

상기의 표 1에 도시된 ACC 변이체들에 더하여, accB 유전자의 오류 유발 라이브러리(error prone library)가 구축되었고, 템플릿으로서 SEQ ID NO: 1을 이용하여 스크리닝(screen)되었다. 단일 또는 다수의 돌연변이(아래의 실시예 1, 표 3 참조)를 도입함으로써 추가 accB 변이체들이 식별되었다. 따라서, 63 개의 유익한 돌연변이(표 1 및 표 3 참조)가 FAME의 증가된 역가를 유도한 accB의 코딩 부위에서 식별되었다. 특히, 약 아미노산 위치 1에서 약 위치 60까지의 범위를 갖는 N-말단 아미노산 부위에서 높은 수의 돌연변이가 발견되었다.

일 측면에서, 본 발명은 SEQ ID NO: 2에 대해 적어도 약 50 %의 서열 동일성을 갖는 ACC 변이 폴리펩티드에 관한 것이다. 몇몇 구현예들에서, 변이 ACC 폴리펩티드는 SEQ ID NO: 2의 야생형 ACC 서열에 대해 적어도 약 50 %, (예를 들어, 약 48 % 내지 약 52 %), 적어도 약 60 %, 적어도 약 70 %, 적어도 약 75 %, 적어도 약 76 %, 적어도 약 77 %, 적어도 약 78 %, 적어도 약 79 %, 적어도 약 80 %, 적어도 약 81 %, 적어도 약 82 %, 적어도 약 83 %, 적어도 약 84 %, 적어도 약 85 %, 적어도 약 86 %, 적어도 약 87 %, 적어도 약 88 %, 적어도 약 89 %, 적어도 약 90 %, 적어도 약 91 %, 적어도 약 92 %, 적어도 약 93 %, 적어도 약 94 %, 적어도 약 95 %, 적어도 약 96 %, 적어도 약 97 %, 적어도 약 98 %, 또는 적어도 99 %의 서열 동일성을 나타내고, 또한 본 명세서에 설명된 바와 같은 유용한 특징들 및/또는 특성들을 유도하는 하나 이상의 치환을 포함한다. 본 발명의 일 측면에서, 개선된 특징을 갖는 ACC 변이 폴리펩티드는 SEQ ID NO: 6에 대해 약 100 %의 서열 동일성을 갖는다. 본 발명의 또 다른 측면에서, ACC 변이 폴리펩티드는 다음의 SEQ ID NOS - SEQ ID NO: 4, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, 및 SEQ ID NO: 90을 포함함(단, 이로 제한되지 않음) - 중 어느 하나에 대해 약 100 %의 서열 동일성을 갖는다.

관련 측면에서, ACC 변이 폴리펩티드는 SEQ ID NO: 5에 대해 100 %의 서열 동일성을 갖는 뉴클레오티드 서열에 의해 코딩된다. 또 다른 관련 측면에서, ACC 변이 폴리펩티드는 다음의 SEQ ID NOS - SEQ ID NO: 3, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, 및 SEQ ID NO: 89를 포함함(단, 이로 제한되지 않음) - 중 어느 하나에 대해 약 100 %의 서열 동일성을 갖는 뉴클레오티드 서열에 의해 코딩된다.

또 다른 측면에서, 본 발명은 SEQ ID NO: 6에 대해 적어도 약 50 %의 서열 동일성을 갖는 개선된 ACC 활성을 갖는 ACC 변이 폴리펩티드에 관한 것이다. 몇몇 구현예들에서, ACC 변이 폴리펩티드는 SEQ ID NO: 6의 ACC 변이 서열에 대해 적어도 약 50 %, (예를 들어, 약 48 % 내지 약 52 %), 적어도 약 60 %, 적어도 약 70 %, 적어도 약 75 %, 적어도 약 76 %, 적어도 약 77 %, 적어도 약 78 %, 적어도 약 79 %, 적어도 약 80 %, 적어도 약 81 %, 적어도 약 82 %, 적어도 약 83 %, 적어도 약 84 %, 적어도 약 85 %, 적어도 약 86 %, 적어도 약 87 %, 적어도 약 88 %, 적어도 약 89 %, 적어도 약 90 %, 적어도 약 91 %, 적어도 약 92 %, 적어도 약 93 %, 적어도 약 94 %, 적어도 약 95 %, 적어도 약 96 %, 적어도 약 97 %, 적어도 약 98 %, 또는 적어도 99 %의 서열 동일성을 갖고, 또한 본 명세서에 설명된 바와 같은 개선된 특징들 및/또는 특성들을 유도하는 하나 이상의 치환을 포함한다. 또 다른 측면에서, 본 발명은 다음의 SEQ ID NOS - SEQ ID NO: 4, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, 및 SEQ ID NO: 90을 포함함(단, 이로 제한되지 않음) - 중 어느 하나에 대해 적어도 약 50 %의 서열 동일성을 갖는 ACC 변이 폴리펩티드에 관한 것이다. 몇몇 구현예들에서, ACC 변이 폴리펩티드는 다음의 SEQ ID NOS - SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, 및 SEQ ID NO: 90을 포함함(단, 이로 제한되지 않음) - 중 어느 하나의 ACC 서열에 대해 적어도 약 50 %, (예를 들어, 약 48 % 내지 약 52 %), 적어도 약 60 %, 적어도 약 70 %, 적어도 약 75 %, 적어도 약 76 %, 적어도 약 77 %, 적어도 약 78 %, 적어도 약 79 %, 적어도 약 80 %, 적어도 약 81 %, 적어도 약 82 %, 적어도 약 83 %, 적어도 약 84 %, 적어도 약 85 %, 적어도 약 86 %, 적어도 약 87 %, 적어도 약 88 %, 적어도 약 89 %, 적어도 약 90 %, 적어도 약 91 %, 적어도 약 92 %, 적어도 약 93 %, 적어도 약 94 %, 적어도 약 95 %, 적어도 약 96 %, 적어도 약 97 %, 적어도 약 98 %, 또는 적어도 99 %의 서열 동일성을 갖고, 이는 본 명세서에 설명된 바와 같은 개선된 특징들 및/또는 특성들을 유도하는 하나 이상의 치환을 포함한다.

또 다른 측면에서, 본 발명은 SEQ ID NO: 5의 ACC 변이 서열에 대해 적어도 약 70 %, 적어도 약 75 %, 적어도 약 76 %, 적어도 약 77 %, 적어도 약 78 %, 적어도 약 79 %, 적어도 약 80 %, 적어도 약 81 %, 적어도 약 82 %, 적어도 약 83 %, 적어도 약 84 %, 적어도 약 85 %, 적어도 약 86 %, 적어도 약 87 %, 적어도 약 88 %, 적어도 약 89 %, 적어도 약 90 %, 적어도 약 91 %, 적어도 약 92 %, 적어도 약 93 %, 적어도 약 94 %, 적어도 약 95 %, 적어도 약 96 %, 적어도 약 97 %, 적어도 약 98 %, 또는 적어도 99 %의 서열 동일성을 갖는 핵산 서열에 의해 코딩되는 아미노산 서열을 포함하는 ACC 변이 폴리펩티드에 관한 것이다. 몇몇 구현예들에서, 핵산 서열은 본 명세서에 설명된 바와 같은 개선된 특징들 및/또는 특성들을 유도하는 하나 이상의 치환을 갖는 ACC 변이체를 코딩한다. 다른 구현예들에서, 변이 ACC 핵산 서열은 대장균과 같은 유기체에 의해 유래된다. 또 다른 측면에서, 본 발명은 다음의 SEQ ID NOS - SEQ ID NO: 3, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, 및 SEQ ID NO: 89를 포함함(단, 이로 제한되지 않음) - 중 어느 하나의 ACC 변이 서열에 대해 적어도 약 70 %, 적어도 약 75 %, 적어도 약 76 %, 적어도 약 77 %, 적어도 약 78 %, 적어도 약 79 %, 적어도 약 80 %, 적어도 약 81 %, 적어도 약 82 %, 적어도 약 83 %, 적어도 약 84 %, 적어도 약 85 %, 적어도 약 86 %, 적어도 약 87 %, 적어도 약 88 %, 적어도 약 89 %, 적어도 약 90 %, 적어도 약 91 %, 적어도 약 92 %, 적어도 약 93 %, 적어도 약 94 %, 적어도 약 95 %, 적어도 약 96 %, 적어도 약 97 %, 적어도 약 98 %, 또는 적어도 99 %의 서열 동일성을 갖는 핵산 서열에 의해 코딩되는 아미노산 서열을 포함하는 ACC 변이 폴리펩티드에 관한 것이다. 몇몇 구현예들에서, 핵산 서열은 본 명세서에 설명된 바와 같은 개선된 특징들 및/또는 특성들을 유도하는 하나 이상의 치환을 갖는 ACC 변이체를 코딩한다. 다른 구현예들에서, ACC 변이 핵산 서열은 대장균과 같은 유기체에 의해 유래된다.

또 다른 측면에서, 본 발명은 다음의 SEQ ID NOS - SEQ ID NO:3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, 및 SEQ ID NO: 89를 포함함(단, 이로 제한되지 않음) - 중 어느 하나에 대응하는 핵산의 실질적인 전체 길이에 걸쳐 엄격한 조건들 하에서 혼성화되는 핵산 서열에 의해 코딩되는 아미노산 서열을 포함하는 ACC 변이 폴리펩티드에 관한 것이다. 몇몇 구현예들에서, 핵산 서열은 대장균과 같은 유기체로부터 유래된 ACC 변이 핵산 서열을 코딩한다. 관련 측면에서, 본 발명은 SEQ ID NO: 1에 대해 적어도 약 70 %, 적어도 약 75 %, 적어도 약 76 %, 적어도 약 77 %, 적어도 약 78 %, 적어도 약 79 %, 적어도 약 80 %, 적어도 약 81 %, 적어도 약 82 %, 적어도 약 83 %, 적어도 약 84 %, 적어도 약 85 %, 적어도 약 86 %, 적어도 약 87 %, 적어도 약 88 %, 적어도 약 89 %, 적어도 약 90 %, 적어도 약 91 %, 적어도 약 92 %, 적어도 약 93 %, 적어도 약 94 %, 적어도 약 95 %, 적어도 약 96 %, 적어도 약 97 %, 적어도 약 98 %, 또는 적어도 99 %의 서열 동일성을 갖는 뉴클레오티드 서열에 의해 코딩되는 ACC 변이체를 제공하고, 본 명세서에 개시된 치환들 중 하나 이상을 포함한다.

본 발명은 accB 유전자 단독의 코딩 부위의 돌연변이들이 유익한 한편(위 참조), accB와 accC 유전자 둘 모두의 동시적 발현 변화 또한 유익함을 나타낸다. 대장균에서, accB 및 accC 유전자는 염색체에서 오페론에 인접한 것으로 발견된다. 따라서, accBC 오페론의 발현 라이브러리가 구축되었고, 야생형 accBC 프로모터를 넘어서는 ACC 활성의 개선을 나타낸(즉, 세포에서 말로닐-CoA 유래 화합물의 증가된 생성에 의해 측정된) 변이체들에 대해 스크리닝되었다. 표 2(아래 참조)는 아래에 나타낸 바와 같은 accBC T5 프로모터 서열에 기초한 최적의 변이체들의 요약을 나타낸다:

대장균 야생형 accBC 프로모터(PaccBC) 부위 뉴클레오티드 서열(SEQ ID NO: 91):

TTGTTGCAAATTACACGGTGTTGAAGGTTATTTACATGTTAGCTGTTGATTATCTTC

CCTGATAAGACCAGTATTTAGCT

박테리오파지(Bacteriophage) T5 프로모터(PT5) 뉴클레오티드 서열(SEQ ID NO: 92):

AATCATAAAAAATTTATTTGCTTTCAGGAAAATTTTTCTGTATAATAGATTC

표 2: 증가된 FAME 생성을 갖는 accBC T5 프로모터 변이체들

라이브러리는 원래 accBC 프로모터 부위를 여하한의 적절한 프로모터 라이브러리(예를 들어, 하이브리드 프로모터, 인공 또는 합성 프로모터, 상이한 유기체로부터의 프로모터, 동일한 유기체 내의 상이한 유전자로부터의 프로모터, 상업적 프로모터 등)로 대체하는 프라이머를 이용하여 구축될 수 있으며, 이는 통상적으로 변성 뉴클레오티드(degenerate nucleotide)를 함유하여 무작위 돌연변위를 도입한다. 특정 구현예들에서, 프로모터는 발달-조절된, 세포소기관-특이적, 조직-특이적, 유도성, 구성적, 또는 세포-특이적 프로모터이다. 모든 적절한 프로모터들이 여기에서 고려된다. 다른 구현예들에서, 프로모터의 상이한 대장균 프로모터 또는 이종 프로모터로의 대체, 원래 프로모터의 돌연변이, 따로 또는 함께 accB 및 accC의 리보솜 결합 부위(RBS)에서의 돌연변이들, accBC 프로모터 및 accB 유전자 간의 비-번역 부위(untranslated region: UTR)의 변경, 염색체 내로의 또는 플라스미드 상으로의 accBC 오페론의 복제, 염색체 accBC 오페론의 플라스미드-코딩된 오페론으로의 대체, accBC 프로모터 부위를 결합시키는 전사 인자들의 조작을 포함하는(단, 이로 제한되지 않음) 해당 기술분야의 당업자에게 알려진 다수의 기술을 이용하여, accBC 오페론에 대한 발현 변화가 행해질 수 있다. 예시적인 일 구현예에서, 박테리오파지 T5 프로모터가 사용된다. 일 구현예에서, 프로모터 라이브러리가 PCR 기술을 이용하여 적절한 상동 부위들에 결합될 수 있고, 이후 라이브러리는 박테리아 염색체 내로 통합될 수 있으며(실시예 2 참조), 원래 accBC 프로모터를 대체할 수 있다. 발현 라이브러리는 실시예 2(아래 참조)에 나타낸 바와 같이 스크리닝될 수 있다.

ACC 변이체의 개선된 특성

야생형 BCCP(SEQ ID NOS: 1 및 2)는 예시적인 모델(아래의 실시예 1 참조)로서 대장균에서의 발현을 이용하여 여타의 유전자를 과발현시킬 필요없이 FAME과 같은 높은 %의 말로닐-CoA 유래 화합물을 생성하기 위해 돌연변이유발을 통해 유전적으로 변경되었다. 이는 accBC 오페론(아래의 실시예 2 참조)을 유전적으로 변경함으로써 동일하게 달성되었다. 따라서, 대장균과 같은 재조합 숙주 세포에서 발현될 때, 야생형 BCCP의 변이체들은 의도한 생성물의 더 높은 역가 및 수율을 유도한다, 즉 이들은 숙주 세포(즉, 재조합 세포)에서 발현될 때 (ACC 변이체를 발현시키지 않는) 야생형 숙주 세포에 비해 지방산 유도체와 같은 말로닐-CoA 유래 화합물의 더 많은 양을 생성한다. 야생형 ACC는 원래 단백질 복합체이고, 이는 정상적으로 그 활성을 위해 4 개의 모든 단백질 - 비오틴 카르복실라아제(BC), 비오틴 카르복실 운반 단백질(BCCP), 및 카르복실트랜스퍼라아제(CT)를 형성하는 2 개의 단백질을 포함함 - 을 필요로 한다. 하지만, 본 발명의 변이 BCCP는 말로닐-CoA 유래 화합물의 생성을 증가시킬 수 있는 능력을 세포에 부여할 것이다. 이론에 의해 한정되지 않고, 이는 원래 ACC를 발현시키는 세포들에 증가된 ACC 활성을 직접적으로 또는 간접적으로 부여하는 변이 BCCP의 직접적인 결과일 수 있음이 고려된다. 예를 들어, BCCP 변이 폴리펩티드는 야생형 세포에 비해 숙주 세포(위의 표 1 및 아래의 표 3을 참조)에서 발현될 때 약 100 % 내지 약 650 %의 FAME을 생성하였다. 이는 FAME의 관찰된 역가가 야생형 세포에 의해 정상적으로 생성되는 FAME 역가의 최대 650 %의 범위를 가짐을 의미한다. 또 다른 예시에서, accBC 오페론의 변화는 야생형 세포에 비해 숙주 세포(위의 표 2 참조)에서 발현될 때 약 200 % 내지 약 350 %의 FAME 역가를 생성한 변이 BCCP 폴리펩티드를 유도한다.

일 구현예에서, ACC 변이 폴리펩티드는, 야생형 ACC 효소에 비해, 지방산 메틸 에스테르(FAME) 및 지방산 에틸 에스테르(FAEE)와 같은 지방족 에스테르, 지방족 아민, 지방족 알데히드, 지방족 알코올, 짧은 및 긴 사슬형 알코올, 탄화수소, 케톤, 알칸, 말단 올레핀, 내부 올레핀, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체, 및 불포화 지방산 유도체를 포함하는(단, 이로 제한되지 않음) 증가된 양의 지방산 유도체를 생성할 것으로 예상된다. 또 다른 구현예에서, ACC 변이 폴리펩티드는 야생형 ACC 효소에 비해 증가된 양의 비-지방산계 화합물들(예를 들어, 플라바논 및 플라보노이드, 폴리케티드, 3-하이드록시프로피온산, 말로네이트 등)을 생성할 것으로 예상된다. 당업자라면, ACC 변이체를 통해 생성될 수 있는 최종 생성물이 말로닐-CoA의 상향조절(upregulation)에 의해 영향을 받는 다양한 생화학 경로에 따라 지방산 유도체 및 비-지방산 화합물을 포함하는 몇 가지 부류의 화합물들을 포함한다는 것을 인지할 것이다. 도 4는 가능한 화합물의 비-제한적인(non-exhaustive) 예시를 제공한다.

ACC 변이체를 제조하는 방법

본 발명의 방법들을 구현하는 데 있어서, 스크리닝을 위해 재조합 숙주 세포의 그룹을 제조하기 위해 돌연변이유발이 사용된다. 통상적으로, 재조합 숙주 세포는 작동가능하게 연결된 조절 서열과 함께 변이 accB 유전자와 같은 ACC 변이 폴리펩티드를 위한 개방형 해독틀(open reading frame)을 포함하는 하나 이상의 폴리뉴클레오티드 서열을 포함한다. 본 발명의 방법들의 구현에 유용한 변이 BCCP 폴리펩티드를 포함하는 변이 ACC 폴리펩티드의 다수의 예시들이 본 명세서에 설명된다. 본 발명의 방법들의 구현에 유용한 조절 서열의 예시들 또한 본 명세서에 설명된다. 이러한 폴리뉴클레오티드 서열의 돌연변이유발은, 부위 지향 돌연변이, 무작위 화학적 돌연변이, 엑소뉴클레아제 Ⅲ 결실 절차, 또는 표준 클로닝 기술들과 같은 유전자 조작 기술들을 이용하여 생성될 수 있다. 대안적으로, 폴리뉴클레오티드 서열의 돌연변이는 화학적 합성 또는 변형 절차들을 이용하여 생성될 수 있다. 해당 기술분야의 당업자라면, 본 명세서에 설명된 프로토콜 및 절차들이 변형될 수 있으며, 이러한 변형들은 본 발명의 변경들에 따른 것임을 인지할 것이다. 예를 들어, 방법 단계들이 특정 순서로 설명될 때, 단계들의 순서가 변경될 수 있으며, 및/또는 병행하여 또는 순차적으로 수행될 수 있다.

돌연변이유발 방법들은 해당 기술분야에 잘 알려져 있으며, 예를 들어 다음을 포함한다. 오류 유발 PCR(Leung 외 (1989) Technique 1:11-15; 및 Caldwell 외 (1992) PCR Methods Applic. 2:28-33)에서, PCR은 DNA 폴리메라아제의 복사 정확도(copying fidelity)가 낮은 조건들 하에서 수행되어, PCR 생성물의 전체 길이를 따라 높은 점 돌연변이율(high rate of point mutations)이 얻어지도록 한다. 간명하게, 이러한 절차들에서, 돌연변이유발될 폴리뉴클레오티드는 PCR 생성물의 전체 길이를 따라 높은 점 돌연변이율을 달성하기 위하여 PCR 프라이머, 반응 완충제, MgCl₂, MnCl₂, Taq 폴리메라아제, 및 적절한 농도의 dNTP와 혼합된다. 예를 들어, 이러한 반응은 돌연변이유발될 20 fmole의 핵산, 30 pmole의 각 PCR 프라이머, 50 mM KCl, 10 mM Tris HCl(pH 8.3), 0.01 % 젤라틴을 포함하는 반응 완충제, 7 mM MgCl₂, 0.5 mM MnCl₂, 5 단위(unit)의 Taq 폴리메라아제, 0.2 mM dGTP, 0.2 mM dATP, 1 mM dCTP, 그리고 1 mM dTTP를 이용하여 수행될 수 있다. PCR은 94 ℃에서 1 분, 45 ℃에서 1 분, 그리고 72 ℃에서 1 분의 30 회 주기 동안 수행될 수 있다. 이러한 파라미터들은 적절하게 변동될 수 있음을 이해할 것이다. 이후, 돌연변이유발된 폴리뉴클레오티드는 적절한 벡터로 클로닝되며, 돌연변이유발된 폴리뉴클레오티드에 의해 코딩되는 영향을 받은 폴리펩티드들의 활성이 평가된다. 또한, 돌연변이유발은 관심 있는 여하한의 클로닝된 DNA의 부위 특이적 돌연변이를 생성하기 위해 올리고뉴클레오티드 지향 돌연변이유발을 이용하여 수행될 수 있다(예를 들어, Reidhaar-Olson 외 (1988) Science 241:53-57). 간명하게, 이러한 절차들에서, 클로닝된 DNA 내로 도입될 하나 이상의 돌연변이를 지닌 복수의 이중 가닥 올리고뉴클레오티드가 합성되고, 돌연변이유발될 클로닝된 DNA 내로 조립된다. 돌연변이유발된 DNA를 함유한 클론들이 회수되고, 영향을 받은 폴리펩티드의 활성이 평가된다. 폴리뉴클레오티드 서열 변이체를 생성하기 위한 또 다른 돌연변이유발 방법은 조립(assembly) PCR이다. 조립 PCR은 작은 DNA 단편의 혼합으로부터 PCR 생성물의 조립을 수반한다. 다수의 상이한 PCR 반응이 동일한 바이알에서 병행하여 일어나며, 일 반응의 생성물이 또 다른 반응의 생성물을 프라이밍한다(priming). 조립 PCR은, 예를 들어 미국 특허 5,965,408에 개시되어 있다. 폴리뉴클레오티드 서열 변이체를 생성하는 또 다른 돌연변이유발 방법은 유성(sexual) PCR 돌연변이유발이다(Stemmer (1994) PNAS, USA 91:10747-10751). 유성 PCR 돌연변이유발에서는, 강제된(forced) 상동성 재조합이 서열 상동성에 기초한 DNA 분자의 무작위 단편화의 결과로서 시험관 내에서 상이하지만 고도로 관련된 DNA 서열의 DNA 분자들 사이에 일어난다. 이후, PCR 반응의 프라이머 신장법(primer extension)에 의한 크로스오버(crossover)의 고정(fixation)이 후속된다.

또한, ACC 변이체들은 생체 내 돌연변이유발에 의해 생성될 수 있다. 몇몇 구현예들에서, 핵산 서열에서의 무작위 돌연변이는 DNA 보수 경로(repair pathway) 중 하나 이상에서 돌연변이를 갖는 박테리아 균주, 예컨대 대장균 균주에서의 폴리뉴클레오티드 서열을 증식시킴으로써 생성된다. 이러한 "돌연변이유발 유전자(mutator)" 균주는 야생형 균주보다 높은 무작위 돌연변이율을 갖는다. 이러한 균주들 중 하나에서의 DNA 서열의 증식이 결국 DNA 내에서 무작위 돌연변이를 생성할 것이다. 생체 내 돌연변이유발에 사용하기 적절한 돌연변이유발 유전자 균주는, 예를 들어 PCT 국제 공보 WO 91/16427에 기술되어 있다.

또한, ACC 변이체들은 카세트 돌연변이유발(cassette mutagenesis)을 이용하여 생성될 수 있다. 카세트 돌연변이유발에서는, 이중 가닥 DNA 분자의 작은 부위가 원래의 폴리뉴클레오티드 서열과 상이한 합성 올리고뉴클레오티드 "카세트"로 대체된다. 올리고뉴클레오티드는 흔히 완전히 및/또는 부분적으로 무작위화된 버전의 원래의 폴리뉴클레오티드 서열을 포함한다. 카세트 돌연변이유발의 다수의 적용들이 존재한다; 예를 들어, 카세트 돌연변이유발에 의한 돌연변이 단백질 제조(Richards, J. H. (1986) Nature 323:187; Ecker 외 (1987) J. Biol . Chem. 262:3524-3527); 개개의 코돈을 삽입 또는 대체하기 위한 코돈 카세트 돌연변이유발(Kegler-Ebo 외 (1994) Nucleic Acids Res. 22(9):1593-1599); 조절 서열을 포함하는 비-코딩 폴리뉴클레오티드 서열의 무작위화에 의한 변이 폴리뉴클레오티드 서열 제조(예를 들어, 리보솜 결합 부위, 예를 들어, Barrick 외 (1994) Nucleic Acids Res. 22(7):1287-1295; Wilson 외 (1994) Biotechniques 17:944-953 참조).

또한, 반복 앙상블 돌연변이유발(recursive ensemble mutagenesis)(Arkin 외 (1992) PNAS , U.S.A . 89:7811-7815)이 폴리뉴클레오티드 서열 변이체들을 생성하는 데 사용될 수 있다. 반복 앙상블 돌연변이유발은 표현형 관련 돌연변이체(phenotypically related mutant)(이의 요소들은 아미노산 서열이 상이함)의 다양한 개체군들을 생성하기 위해 개발된 단백질 조작(즉, 단백질 돌연변이유발)을 위한 알고리즘이다. 이 방법은 조합 카세트 돌연변이유발의 연속 라운드(successive round)를 조절하기 위해 피드백 메커니즘을 이용한다. 또한, 지수 앙상블 돌연변이유발(exponential ensemble mutagenesis)(Delegrave 외 (1993) Biotech. Res. 11:1548-1552)이 ACC의 폴리뉴클레오티드 서열 변이체들을 생성하는 데 사용될 수 있다. 지수 앙상블 돌연변이유발은 높은 백분율의 독특한 기능성 돌연변이체를 갖는 조합 라이브러리들을 생성하는 프로세스이며, 잔기들의 작은 그룹들이 기능성 단백질들을 야기하는 아미노산을 각각의 변경된 위치에서 식별하기 위해 병행하여 무작위화된다. 또한, 무작위 및 부위 지향 돌연변이유발이 사용될 수 있다(Arnold (1993) Curr. Opin. Biotech. 4:450-455).

또한, 생체 내 돌연변이유발의 표준 방법들이 사용될 수 있다. 예를 들어, 작동가능하게-연결된 조절 서열뿐만 아니라, ACC 폴리펩티드를 위한 개방형 해독틀을 포함하는 하나 이상의 폴리뉴클레오티드 서열을 포함하는 숙주 세포들이, 방사선(예를 들어, UV 광 또는 X-선)으로의 노출 또는 화학제(예를 들어, 에틸화제, 알킬화제, 또는 핵산 유사체)로의 노출을 통해 돌연변이유발을 겪을 수 있다. 또한, 몇몇 숙주 세포 유형들, 예를 들어 박테리아, 효모 및 식물에서는, 전이 인자들이 생체 내 돌연변이유발을 위해 사용될 수 있다.

ACC 관련 폴리펩티드를 코딩하는 하나 이상의 폴리뉴클레오티드 서열의 돌연변이유발은 일반적으로 변형되고 개선된 생물학적 기능을 입증하는 ACC 폴리펩티드 생성물의 발현을 유도한다. 예를 들어, accB를 포함하는 하나 이상의 폴리뉴클레오티드 서열의 돌연변이유발은 일반적으로 향상된 ACC 활성과 같이 변형되고 개선된 생물학적 기능을 입증하는 BCCP 폴리펩티드 생성물의 발현을 유도한다. BCCP 및 작동가능하게-연결된 조절 서열을 코딩하는 개방형 해독틀을 포함하는 하나 이상의 폴리뉴클레오티드 서열의 돌연변이유발에 의한 재조합 미생물의 그룹을 제조할 때, 결과적인 돌연변이유발된 폴리뉴클레오티드 서열로부터 발현된 단백질은 증가된 ACC 생물학적 가능을 나타낼 것이다. 따라서, 지방산 유도체 또는 다른 화합물과 같은 말로닐-CoA 유래 화합물, 및/또는 (사슬 길이, 포화 등과 관련하여) 지방산 유도체 또는 다른 화합물의 변형된 혼합물을 포함하는 개선된 조성물의 개선된 수율은 돌연변이 accB 폴리뉴클레오티드를 발현시키기에 효과적인 조건들 하에서 재조합 미생물의 배양 시에 관찰된다.

핫 스폿(Hot Spot)

또한, 본 발명은 적어도 부분적으로 변이 BCCP 폴리펩티드를 포함하는 변이 ACC 폴리펩티드 중에서 구조적으로 보존된 특정 "핫 스폿들"의 식별에 기초한다. 핫 스폿들은, 높은 수의 돌연변이가 FAME과 같은 지방산 유도체의 더 높은 역가 또는 비-지방산 화합물의 더 높은 역가를 유도하는 것으로 관찰되는 부위들이다. 특히, 이러한 부위들은 변이 BCCP 폴리펩티드에 나타난다, 즉 핫 스폿들은 아미노산 위치 1에서부터 (예를 들어, 가장 높은 수의 돌연변이를 나타내는) 약 아미노산 위치 60까지의 범위를 갖는 N-말단 아미노산 부위에서 관찰된다.

모티프

또한, 본 발명은 적어도 부분적으로 변이 BCCP 폴리펩티드를 포함하는 변이 ACC 폴리펩티드 중에서 구조적으로 보존된 특정 모티프들의 식별에 기초한다. 홀로카르복실라아제 신테타아제(holocarboxylase synthetase)로도 알려진 비오틴 단백질 리가아제(EC 6.3.4.15)는, ACC의 BCCP 서브유닛의 특이적 리신으로의 비오틴 보결분자단(biotin prosthetic group)의 공유 부착을 촉매화한다. BCCP-타입 단백질은 비오틴 부착 부위에서 보존된 모티프를 갖는다. 모티프는 비오틴화된 리신 잔기인 K(리신)를 포함한다. 다양한 박테리아 종의 BCCP 폴리펩티드는 이 보존된 모티프를 가지며, 그 부위에서의 여하한의 돌연변이가 감소된 기능을 유도할 수 있음을 시사한다. 모티프에 대한 공통 서열은 아래에 나타나 있으며, K는 비오틴화된 리신이다:

(L/I/V)E(A/V)MＫ(M/L)

도 2는 대장균(SEQ ID NO: 97 (부분); SEQ ID NO: 2 (전체); 수탁 번호 NP_417721), 락토바실러스 브레비스(SEQ ID NO: 98 (부분); SEQ ID NO: 104 (전체); 수탁 번호 WP_011667655), 스테노트로파모나스 말토필리아(SEQ ID NO: 99 (부분); SEQ ID NO: 105 (전체); 수탁 번호 AIL09846), 슈도모나스 퓨티다(SEQ ID NO: 100 (부분); SEQ ID NO: 106 (전체); 수탁 번호 AE016246_3), 바실러스 서브틸리스(SEQ ID NO: 101 (부분); SEQ ID NO: 107 (전체); 수탁 번호 NP_390315), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)(SEQ ID NO: 102 (부분); SEQ ID NO: 108 (전체); 수탁 번호 WP_011013826), 및 사카로마이세스 세레비지에(SEQ ID NO: 103 (부분); SEQ ID NO: 109 (전체); 수탁 번호 AAA20073)를 포함하는 7 개의 상이한 박테리아 종으로부터의 BCCP 아미노산 서열들의 일 구간의 정렬을 나타낸다. 모티프는 약 10 % 퍼센트 내지 약 66 % 퍼센트의 범위를 갖는 전체 아미노산 서열 동일성과 무관하게 7 개의 모든 종에 걸쳐 보존된다(도 2에 박스로 나타낸 영역 참조). 예를 들어, 락토바실러스 브레비스로부터의 BCCP는 대장균과 비교할 때 28 %의 동일성을 나타내었다. 스테노트로파모나스 말토필리아로부터의 BCCP는 대장균과 비교할 때 55 %의 동일성을 나타내었다. 슈도모나스 퓨티다로부터의 BCCP는 대장균과 비교할 때 66 %의 동일성을 나타내었다. 바실러스 서브틸리스로부터의 BCCP는 대장균과 비교할 때 40 %의 동일성을 나타내었다. 코리네박테리움 글루타 미쿰 및 사카로마이세스 세레비지에로부터의 BCCP는 대장균과 비교할 때 10 %의 동일성을 나타내었다. 이는 다른 종들에서도 모티프가 보존됨을 확인한다. 하지만, 몇몇 경우들에서, BCCP 폴리펩티드는 다양한 종에 걸쳐 약 85 %의 동일성 내지 약 100 %의 동일성 범위를 갖는 높은 아미노산 서열 동일성을 갖는다. 예를 들어, 에스체리치아 알베르 티(Escherichia alberti)으로부터의 BCCP는 대장균과 약 98 % 동일하고; 시겔라 플렉스네리(Shigella flexneri)로부터의 BCCP는 대장균과 약 93 % 동일하며; 크렙시엘라 뉴모니아(Klebsiella pneumonia)는 대장균과 약 85 % 동일하다.

숙주 세포 및 숙주 세포 배양물

본 발명의 관점에서, 본 명세서에서 고려되는 구현예들 중 어느 구현예가 하나 이상의 ACC 변이체를 코딩하는 하나 이상의 핵산 서열의 도입을 통해 유전적으로 변형될 수 있는 여하한의 숙주 세포 또는 미생물로 구현될 수 있음을 이해하여야 한다. 이와 같이, 본 명세서의 재조합 미생물은 숙주 세포로 기능하고, 숙주 세포에서 ACC 폴리펩티드의 발현을 가능하게 하는 작동가능하게-연결된 조절 서열과 함께, 말로닐-CoA 유래 화합물의 개선된/증가된 생성 및/또는 개선된/증가된 ACC 활성을 부여하는 변이 ACC 폴리펩티드를 코딩하는 개방형 해독틀을 포함하는 하나 이상의 폴리뉴클레오티드 서열을 포함한다. 일 구현예에서, 말로닐-CoA 유래 화합물의 개선된/증가된 생성 및/또는 개선된/증가된 ACC 활성을 부여하는 폴리펩티드는 BCCP의 변이체 또는 돌연변이체이다. 또 다른 구현예에서, 말로닐-CoA 유래 화합물의 개선된/증가된 생성 및/또는 개선된/증가된 ACC 활성을 부여하는 폴리펩티드는 개선된 BCCP 또는 다른 개선된 ACC 폴리펩티드 또는 accBC 오페론의 발현 변화에 기인한 이의 조합물이다. 본 발명의 재조합 숙주 세포에서, 개방형 해독틀 코딩 서열 및/또는 조절 서열은 BCCP 폴리펩티드의 대응하는 야생형 코딩 서열에 대해 변형될 수 있다. 지방족 유도체 조성물은 변이 BCCP를 포함하는 변이 ACC 폴리펩티드를 발현시키기에 효과적인 조건들에서 탄소원의 존재 하에서 ACC 변이체를 발현시키는 숙주 세포(즉, 재조합 숙주 세포)를 배양함으로써 생성된다(도 1 및 도 3 참조). 돌연변이 또는 변이 ACC 폴리펩티드의 발현은 지방산, 지방족 에스테르, 지방족 알코올, 지방족 아민, 지방족 알데히드, 이작용성 지방산 유도체, 이산, 탄화수소, 케톤, 알칸, 알켄 또는 올레핀 등의 증가된 수율을 갖는 지방산 유도체 조성물의 생성을 유도한다. 일 구현예에서, 변이 BCCP 폴리펩티드와 같은 돌연변이 또는 변이 ACC 폴리펩티드의 발현은 FAME 및/또는 FAEE를 포함하는 지방족 에스테르 조성물의 증가된 수율을 유도한다. 비-지방산 화합물은 변이 BCCP를 포함하는 변이 ACC 폴리펩티드를 발현시키기에 효과적인 조건들에서 탄소원의 존재 하에서 ACC 변이체를 발현시키는 숙주 세포(즉, 재조합 숙주 세포)를 배양함으로써 생성된다(도 4 참조). 돌연변이 또는 변이 ACC 폴리펩티드의 발현은 폴리케티드, 플라바논, 플라보노이드, 3-하이드록시프로피온산(3-HP), 말로네이트 등을 포함하는 증가된 수율을 갖는 비-지방산 화합물의 생성을 유도한다(도 4 참조).

본 발명의 숙주 세포 또는 미생물은, 효소 활성에 대한 특이적 돌연변이의 효율성을 테스트하기 위해 유전적 변경을 포함하도록 유전적으로 조작된 숙주 균주 또는 숙주 세포(즉, 재조합 세포 또는 미생물)을 포함한다. 다양한 선택적인 유전적 조작(manipulation) 및 변경이, 어떤 원래의 효소 경로들이 원래 숙주 세포에 존재하는지에 따라 한 숙주 세포로부터 다른 숙주 세포로 교환가능하게 사용될 수 있다. 일 구현예에서, 숙주 균주는 ACC 변이체를 테스트하는 데 사용될 수 있다. 숙주 균주는, 발효 성분, 탄소원(예를 들어, 공급원료), 온도, 압력, 감소된 배양 오염 조건, 및 산소 수준을 포함한 배양 조건들을 포함하는(단, 이로 제한되지 않음) 특이적 변수들 및 배양 환경들을 테스트하기 위해 다수의 유전적 변경을 포함할 수 있다.

일 구현예에서, 숙주 균주, 소위 BD64가 사용된다. BD64는 선택적인 fadE 및 fhuA 결실을 포함하는 대장균 균주 MG1655에 기초한다. 아실-CoA 디하이드로게나아제(FadE)는 지방산을 대사시키는 데 중요한 효소이다. 이는 지방산 이용(베타-산화)의 두번째 단계를 촉매화하며, 이는 지방산(아실-CoA)의 긴 사슬들을 아세틸-CoA 분자들로 쪼개는 공정이다. 더 구체적으로, 박테리아에서 지방산 분해의 β-산화 사이클의 두번째 단계는 아실-CoA의 2-엔오일-CoA로의 산화이며, 이는 FadE에 의해 촉매화된다. 대장균에 FadE가 없는 경우, 이는 탄소원으로서 지방산에서 성장할 수 없지만, 아세테이트에서 성장할 수 있다. 여하한의 사슬 길이의 지방산을 이용하는 불가능성(inability)은 fadE 균주들, 즉 FadE 기능이 파괴되는 fadE 돌연변이 균주들의 보고된 표현형과 일치한다. fadE 유전자는 선택적으로 녹아웃(knock out)되거나 감쇠되어, 이 경로에서 중간체일 수 있는 아실-CoA가 세포에 누적될 수 있도록 보장하여, 모든 아실-CoA가 에스테르 신타아제에 의해 지방족 에스테르로 효율적으로 전환될 수 있도록 한다. 하지만, fadE 감쇠는 탄소원으로서 당이 사용될 때 선택적인데, 이는 이러한 조건 하에서 FadE의 발현이 억제될 가능성이 있고, 이에 따라 FadE가 소량만 존재할 수 있으며, 아실-CoA 기질에 대해 에스테르 신타아제와 효율적으로 경쟁할 수 없기 때문이다. FadE는 분해대사물 억제(catabolite repression)로 인해 억제된다. 대장균 및 많은 다른 미생물들이 지방산보다 당의 소모를 선호하므로, 두 공급원들이 이용가능한 경우 fad 레귤론을 억제함으로써 당이 우선적으로 소모된다(D. Clark, J Bacteriol. (1981) 148(2):521-6 참조). 또한, 당의 부재는 FadE 발현을 유도한다. (FadE를 포함한) fad 레귤론에 의해 발현되는 단백질이 상향-조절되고 아실-CoA에 대해 효율적으로 경쟁할 것이기 때문에, 아실-CoA 중간체들이 베타 산화 경로에 대해 손실될 수 있다. 따라서, fadE 유전자가 녹아웃되거나 감쇠되는 것이 유리할 수 있다. 대부분의 탄소원들이 주로 당 기반이기 때문에, FadE를 감쇠시키는 것은 선택적이다. 유전자 fhuA는 TonA 단백질을 코딩하며, 이는 대장균의 외막에서의 에너지-관련 운반체(energy-coupled transporter) 및 수용체이다(V. Braun (2009) J Bacteriol. 191(11):3431-3436). 이것의 결실은 선택적이다. fhuA 결실은 세포로 하여금 특정 발효 조건들에 유리할 수 있는 파지 공격(phage attack)에 대해 더 저항성 있게 한다. 따라서, 발효 진행 시 잠재적 오염을 겪기 쉬운 숙주 세포에 fhuA를 결실시키는 것이 바람직할 수 있다.

또한, 숙주 균주 BD64(위 참조)는 다음의 유전자들 - 대장균으로부터의 fadR, 쥐티푸스균(Salmonella typhimurium)으로부터의 fabA(NP_460041), 쥐티푸스균으로부터의 fabD(NP_460164), 쥐티푸스균으로부터의 fabG(NP_460165), 쥐티푸스균으로부터의 fabH(NP_460163), 콜레라균(Vibrio cholera)으로부터의 fabV(YP_001217283), 및 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum)으로부터의 fabF(NP_350156) 중 하나 이상의 선택적인 과발현을 포함한다. 지방산 생합성에서의 조절제 및 효소를 코딩하는 이러한 유전자들 중 하나 이상의 과발현은 다양한 배양 조건들 하에서 지방산 유도체 조성물의 역가를 더 증가시키는 역할을 할 수 있다.

또 다른 구현예에서, 야생형 대장균 균주들 MG1655 또는 W3110이 지방산 유도체의 생성을 위한 예시적인 숙주 세포로서 사용된다. 유사하게, 이러한 숙주 세포는 다양한 배양 조건들 하에서 지방산 유도체 화합물의 역가를 증가시킬 수 있는 하나 이상의 생합성 유전자(즉, 지방산 생합성의 조절제 및 효소를 코딩하는 유전자)의 선택적인 과발현을 제공한다. 유전적 변경은 대장균으로부터의 fadR, 쥐티푸스균으로부터의 fabA(NP_460041), 쥐티푸스균으로부터의 fabD(NP_460164), 쥐티푸스균으로부터의 fabG(NP_460165), 쥐티푸스균으로부터의 fabH(NP_460163), 콜레라균으로부터의 fabV(YP_001217283), 및 클로스트리디움 아세토부틸리쿰으로부터의 fabF(NP_350156)를 포함한다.

몇몇 구현예들에서, 변이 ACC 폴리펩티드를 발현시키는 데 사용되는 숙주 세포 또는 미생물은 하나 이상의 특정 지방산 유도체(들), 예컨대 지방족 에스테르, 지방족 알코올, 지방족 아민, 지방족 알데히드, 이작용성 지방산 유도체, 이산 등(도 1 및 도 3 참조) 그리고 알칸, 알켄 또는 올레핀, 및 케톤에 대한 생성을 증가시킬 수 있는 특정 효소 활성을 포함하는 유전자들을 더 발현시킬 것이다. 일 구현예에서, 숙주 세포는 유전자를 과발현시킴으로써 증가될 수 있는 지방산의 생성을 위해 티오에스테라아제 활성(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5)을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 에스테르의 생성을 위해 에스테르 신타아제 활성(E.C. 2.3.1.75)을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 알코올의 생성을 위해 아실-ACP 리덕타아제(AAR)(E.C, 1.2.1.80) 활성 및/또는 알코올 디하이드로게나아제 활성(E.C. 1.1.1.1) 및/또는 지방족 알코올 아실-CoA 리덕타아제(FAR)(E.C. 1.1.1.*) 활성 및/또는 카르복실산 리덕타아제(CAR)(E.C. 1.2.99.6) 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 알데히드의 생성을 위해 아실-ACP 리덕타아제(AAR)(E.C. 1.2.1.80) 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 알칸 및 알켄의 생성을 위해 아실-ACP 리덕타아제(AAR)(E.C. 1.2.1.80) 활성 및 디카르보닐라아제 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 알코올의 생성을 위해 아실-CoA 리덕타아제(E.C. 1.2.1.50) 활성, 아실-CoA 신타아제(FadD)(E.C. 2.3.1.86) 활성, 및 티오에스테라아제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 에스테르의 생성을 위해 에스테르 신타아제 활성(E.C. 2.3.1.75), 아실-CoA 신타아제(FadD)(E.C. 2.3.1.86) 활성, 및 티오에스테라아제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 케톤의 생성을 위해 OleA 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 내부 올레핀의 생성을 위해 OleBCD 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 알코올의 생성을 위해 아실-ACP 리덕타아제(AAR)(E.C. 1.2.1.80) 활성 및 알코올 디하이드로게나아제 활성(E.C. 1.1.1.1)을 갖는다. 또 다른 구현예에서, 숙주 세포는 말단 올레핀을 만들기 위해 티오에스테라제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성 및 디카르복실라아제 활성을 갖는다. 미생물 및 미생물 세포에서의 효소 활성의 발현은 미국 특허 8,097,439; 8,110,093; 8,110,670; 8,183,028; 8,268,599; 8,283,143; 8,232,924; 8,372,610; 및 8,530,221에 개시되어 있으며, 이들은 본 명세서에서 인용 참조된다.

다른 구현예들에서, 변이 ACC 폴리펩티드를 발현시키는 데 사용되는 숙주 세포 또는 미생물은, 지방족 에스테르, 지방족 알코올, 지방족 아민, 지방족 알데히드, 이작용성 지방산 유도체, 이산 등(도 1 참조)과 같은 하나 이상의 특정 지방산 유도체(들)를 생성하기 위해 상향조절되거나 과발현되는 특정한 원래의 효소 활성을 포함할 것이다. 일 구현예에서, 숙주 세포는 티오에스테라아제 유전자를 과발현시킴으로써 증가될 수 있는 지방산의 생성을 위해 원래의 티오에스테라아제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성을 갖는다.

본 발명은 변이 BCCP 폴리펩티드 서열을 포함하는 변이 ACC 폴리펩티드 서열을 발현시키는 숙주 균주 또는 미생물을 포함한다. 숙주 세포에서 발현될 때 지방족 에스테르를 포함하는 지방산 유도체의 더 높은 역가를 유도하는 변이 BCCP 폴리펩티드 서열의 예시들은, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, 및 SEQ ID NO: 90을 포함한다(단, 이로 제한되지 않음).

재조합 숙주 세포는, 지방산 메틸 에스테르(FAME) 또는 지방산 에틸 에스테르(FAEE)와 같은 지방족 에스테르, 지방족 알코올, 지방족 아민, 지방족 알데히드, 이작용성 지방산 유도체, 이산, 알칸, 올레핀, 탄화수소 등; 또는 플라바논, 플라보노이드, 폴리케티드, 말로네이트 또는 3-하이드록시프로피온산과 같은 비-지방산 화합물을 생성할 수 있다. 지방산 유도체 또는 다른 화합물들은 통상적으로 배양 배지로부터 회수되고, 및/또는 숙주 세포로부터 분리된다. 일 구현예에서, 지방산 유도체 또는 다른 화합물들은 배양 배지(세포외)로부터 회수된다. 또 다른 구현예에서, 지방산 유도체 또는 다른 화합물들은 숙주 세포(세포내)로부터 분리된다. 또 다른 구현예에서, 지방산 유도체 또는 다른 화합물들은 배양 배지로부터 회수되고, 숙주 세포로부터 분리된다. 숙주 세포에 의해 생성되는 지방산 유도체 조성물은, 지방산 유도체 조성물의 성분들의 포화도 및 사슬 길이뿐만 아니라 특정 지방산 유도체의 분포를 결정하기 위해, 해당 기술분야에 알려진 방법들, 예를 들어 GC-FID를 이용하여 분석될 수 있다. 유사하게, 해당 기술분야에 잘 알려진 다른 방법들을 통해 다른 화합물들이 분석될 수 있다.

미생물로서 기능하는 숙주 세포들의 예시들은 에스체리치아 속, 바실러스 속, 락토바실러스 속, 자이모모나스 속, 로도코쿠스 속, 슈도모나스 속, 아스페르 길루스 속, 트리코데르마 속, 뉴로스포라 속, 푸사리움 속, 후미콜라 속, 리조무코 르 속, 클루이베로마이세스 속, 피치아 속, 무코르 속, 미셀리오프토라 속, 페니실 리움 속, 파네로카에테 속, 플레우로투스 속, 트라메테스 속, 크리소스포리움 속, 사카로마이세스 속, 스테노트로파모나스 속, 스키조사카로마이세스 속, 야로위아 속, 또는 스트렙토마이세스 속으로부터의 세포들을 포함한다(단, 이로 제한되지 않음). 몇몇 구현예들에서, 숙주 세포는 그람-양성(Gram-positive) 박테리아 세포이다. 다른 구현예들에서, 숙주 세포는 그람-음성(Gram-negative) 박테리아 세포이다. 몇몇 구현예들에서, 숙주 세포는 대장균 세포이다. 다른 구현예들에서, 숙주 세포는 바실러스 렌투스(Bacillus lentus) 세포, 바실러스 브레비스(Bacillus brevis) 세포, 바실러스 스테아로서모필루스(Bacillus stearothermophilus) 세포, 바실러스 리케니포르미스(Bacillus lichenoformis) 세포, 바실러스 알칼로필루스(Bacillus alkalophilus) 세포, 바실러스 코아굴란스(Bacillus coagulans) 세포, 바실러스 키르쿨란스(Bacillus circulans) 세포, 바실러스 푸밀리스(Bacillus pumilis) 세포, 바실러스 투린지엔시스(Bacillus thuringiensis) 세포, 바실러스 클라우시(Bacillus clausii) 세포, 바실러스 메가테리움(Bacillus megaterium) 세포, 바실러스 서브틸리스(Bacillus subtilis) 세포, 또는 바실러스 아밀로리퀴파시엔스(Bacillus amyloliquefaciens) 세포이다.

또 다른 구현예들에서, 숙주 세포는 트리코데르마 코닌지(Trichoderma koningii) 세포, 트리코데르마 비리데(Trichoderma viride) 세포, 트리코데르마 르 에세이(Trichoderma reesei) 세포, 트리코데르마 롱기브라키아텀(Trichoderma longibrachiatum) 세포, 아스페르길루스 아와모리(Aspergillus awamori) 세포, 아스페르길루스 푸미가테스(Aspergillus fumigates) 세포, 아스페르길루스 포에티두스(Aspergillus foetidus) 세포, 아스페르길루스 니둘란스(Aspergillus nidulans) 세포, 아스페르길루스 니게르(Aspergillus niger) 세포, 아스페르길루스 오리재(Aspergillus oryzae) 세포, 후미콜라 인솔렌스(Humicola insolens) 세포, 후미콜라 라누기노세(Humicola lanuginose) 세포, 로도코쿠스오파쿠스(Rhodococcusopacus) 세포, 리조무코르미에헤이(Rhizomucormiehei) 세포, 또는 무코르미에헤이(Mucormichei) 세포이다. 또 다른 구현예들에서, 숙주 세포는 스트 렙토마이세스 리비단스(Streptomyces lividans) 세포 또는 스트렙토마이세스 무리누스(Streptomyces murinus) 세포이다. 또 다른 구현예들에서, 숙주 세포는 방선균(Actinomycetes) 세포이다. 몇몇 구현예들에서, 숙주 세포는 사카로마이세스 세레비지에 세포이다.

다른 구현예들에서, 숙주 세포는 진핵 식물, 조류, 남세균(cyanobacterium), 녹색-황 세균, 녹색 비-황 세균(green non-sulfur bacterium), 자색 황 세균, 자색 비-황 세균, 극한 생물(extremophile), 효모, 균류, 이의 조작된 유기체, 또는 합성 유기체로부터의 세포이다. 몇몇 구현예들에서, 숙주 세포는 광 의존적이거나 탄소를 고정시킨다. 몇몇 구현예들에서, 숙주 세포는 독립영양적 활성을 갖는다.

몇몇 구현예들에서, 숙주 세포는 빛의 존재 하에서와 같이, 광독립영양적 활성(photoautotrophic activity)을 갖는다. 몇몇 구현예들에서, 숙주 세포는 빛의 부재 하에서 종속영양적 또는 혼합영양적이다. 특정 구현예들에서, 숙주 세포는 애기장대(Arabidopsis thaliana), 파니쿰 비르가툼(Panicum virgatum), 미스칸투스 기간테우스(Miscanthus giganteus), 제아 메이스(Zea mays), 보트리오코쿠스 브라우니(Botryococcuse braunii), 녹조류(Chlamydomonas reinhardtii), 두나리엘라 살리나(Dunaliela salina), 시네코코쿠스 종 PCC 7002, 시네코코쿠스 종 PCC 7942, 시네코시스티스 종 PCC 6803, 서모시네코코쿠스 엘롱게이트(Thermosynechococcus elongates) BP-1, 클로로비움 테피둠(Chlorobium tepidum), 클로로프렉수스 아우란티쿠스(Chlorojlexus auranticus), 크로마티움 비노숨(Chromatiumm vinosum), 로도스피릴룸 루브룸(Rhodospirillum rubrum), 로도박 터 캡술라투스(Rhodobacter capsulatus), 로도슈도모나스 파루스리스(Rhodopseudomonas palusris), 클로스트리디움 융달리(Clostridium ljungdahlii), 클로스트리디움 서모셀룸(Clostridium thermocellum), 페니실리움 크리소게눔(Penicillium chrysogenum), 피치아 파스토 리스(Pichia pastoris), 사카로마이세스 세레비지에, 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 또는 자이모모나스 모빌리스(Zymomonas mobilis)로부터의 세포이다.

일 구현예에서, 미생물 세포는 프로클로로코쿠스(Prochlorococcus), 시네코 코쿠스, 시네코시스티스, 시아노테세, 및 노스톡 펑크티포르메를 포함하는(단, 이로 제한되지 않음) 시아노박테리아로부터의 세포이다. 또 다른 구현예에서, 미생물 세포는 시네코코쿠스 엘롱가투스 PCC7942, 시네코시스티스 종 PCC6803, 및 시네 코코쿠스 종 PCC7001을 포함하는(단, 이로 제한되지 않음) 특이적 시아노박테리아 종으로부터의 세포이다.

재조합 숙주 세포 및 배양물을 제조하는 방법

숙주 세포를 유전적으로 조작하여 지방산 유도체 및/또는 지방산 유도체 조성물 또는 다른 화합물을 생성하기 위해 해당 기술분야에 잘 알려진 다양한 방법들이 사용될 수 있다. 이러한 방법들은 본 명세서에 설명된 바와 같이 돌연변이 또는 변이 BCCP를 포함하는 돌연변이 또는 변이 ACC를 코딩하는 핵산을 포함하는 벡터, 바람직하게는 발현 벡터의 사용을 포함할 수 있다. 당업자라면, 다양한 바이러스 및 비-바이러스 벡터가 본 명세서에 설명된 방법들에 사용될 수 있음을 알 수 있을 것이다.

본 발명의 몇몇 구현예들에서, 특정 조성물의 지방산 에스테르와 같은 화합물의 더 높은 역가는, 재조합 숙주 세포 배양물에 의해 생성된 특정 유형의 지방산 에스테르 또는 지방산 에스테르의 조합이 대응하는 야생형 숙주 세포의 대조 배양물에 의해 생성된 동일한 지방산 에스테르 또는 지방산 에스테르의 조합에 대해 더 높은 역가이다. 몇몇 구현예들에서, 다른 지방산 유도체 또는 비-지방산 화합물들이 유사한 방식으로 재조합 숙주 세포 배양물에 의해 생성된다. 몇몇 구현예들에서, 돌연변이 또는 변이 accB 폴리뉴클레오티드(또는 유전자)를 포함하는 돌연변이 또는 변이 ACC 폴리뉴클레오티드(또는 유전자) 서열이 폴리뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함하는 재조합 벡터에 의해 숙주 세포에 제공된다. 특정 구현예들에서, 프로모터는 발달-조절된, 세포소기관-특이적, 조직-특이적, 유도성, 구성적, 또는 세포-특이적 프로모터이다. 재조합 벡터는 통상적으로 폴리뉴클레오티드 서열에 작동가능하게 연결된 발현 조절 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; 폴리뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티; 폴리뉴클레오티드 서열에 작동가능하게 연결된 분비 서열; 및 폴리뉴클레오티드 서열에 작동가능하게 연결된 표적화 서열로부터 선택되는 적어도 하나의 서열을 포함한다. 단백질 및 작동가능하게 연결된 조절 서열을 코딩하는 개방형 해독틀을 포함하는 폴리뉴클레오티드 서열은 재조합 숙주 세포의 염색체 내로 통합될 수 있거나, 재조합 숙주 세포에 내재하는 하나 이상의 플라스미드 발현계에 포함될 수 있거나, 둘 모두가 구현될 수 있다.

본 명세서에 설명된 발현 벡터들은 숙주 세포 내에서의 폴리뉴클레오티드 서열의 발현에 적절한 형태로 된 본 명세서에 설명된 폴리뉴클레오티드 서열을 포함한다. 당업자라면, 발현 벡터의 설계가 형질전환될 숙주 세포의 선택, 의도한 폴리펩티드의 발현 수준 등과 같은 요인들에 의존할 수 있다는 것을 이해할 것이다. 본 명세서에 설명된 발현 벡터들은 본 명세서에 설명된 바와 같은 폴리뉴클레오티드 서열에 의해 코딩되는, 융합 폴리펩티드를 포함하는 폴리펩티드를 생성하도록 숙주 세포들에 도입될 수 있다. 흔히, 원핵생물, 예를 들어 대장균에서 폴리펩티드를 코딩하는 유전자의 발현은 대부분 융합 또는 비-융합 폴리펩티드 중 어느 하나의 발현을 지시하는 구성적 또는 유도성 프로모터를 함유하는 벡터들로 수행된다. 원핵 세포 및 진핵 세포 둘 모두에 적절한 발현 시스템들이 해당 기술분야에 잘 알려져 있다; 예를 들어, Sambrook 외, "Molecular Cloning: A Laboratory Manual", second edition, Cold Spring Harbor Laboratory, (1989) 참조. 특정 구현예들에서, 본 발명의 폴리뉴클레오티드 서열은 박테리오파지 T5로부터 유래된 프로모터에 작동가능하게 연결된다. 일 구현예에서, 숙주 세포는 효모 세포이다. 이 구현예에서, 발현 벡터는 효모 발현 벡터이다. 벡터들은 외래(foreign) 핵산(예를 들어, DNA)을 숙주 세포 내로 도입하기 위하여 본 기술분야에서 인정되는 다양한 기술들을 통해 원핵 세포 또는 진핵 세포 내로 도입될 수 있다. 숙주 세포를 형질전환 또는 형질감염(transfecting)시키는 적절한 방법들은, 예를 들어 Sambrook 외에서 찾아볼 수 있다(위 참조).

박테리아 세포들의 안정한 형질전환을 위하여, 사용되는 발현 벡터 및 형질전환 기술에 따라, 세포들의 일부만이 발현 벡터를 흡수하고 복제하는 것으로 알려져 있다. 이 형질전환체들을 식별하고 선택하기 위하여, 선별가능한 마커(예를 들어, 항생제에 대한 내성)를 코딩하는 유전자가 관심 유전자와 함께 숙주 세포 내로 도입될 수 있다. 선별가능한 마커들은 암피실린, 카나마이신, 클로람페니콜, 또는 테트라사이클린과 같은(단, 이로 제한되지 않음) 약물들에 대한 내성을 부여하는 것들을 포함한다. 선택가능한 마커를 코딩하는 핵산들은 본 명세서에서 설명되는 폴리펩티드를 코딩하는 벡터와 동일한 벡터에서 숙주 세포 내로 도입될 수 있거나, 또는 별개의 벡터에 도입될 수 있다. 도입된 핵산으로 안정적으로 형질전환된 세포는 적절한 선택 약물의 존재 하에서 성장에 의해 식별될 수 있다.

재조합 숙주 세포의 배양물 및 발효

본 명세서에서 사용되는 바와 같이, "발효"라는 용어는 광범위하게 숙주 세포에 의한 유기 물질의 표적 물질로의 전환, 예를 들어 탄소원을 포함하는 배지에서 재조합 숙주 세포의 배양물을 증식시킴으로써 재조합 숙주 세포에 의한 탄소원의 지방산 또는 이의 유도체로의 전환을 지칭한다. 본 명세서에서 사용되는 바와 같이, "생성을 위하여 허용되는 조건들"이라는 용어는 숙주 세포로 하여금 의도한 생성물, 예컨대 지방산 유도체 및 다른 비-지방산 화합물을 포함하는 말로닐-CoA 유래 화합물을 생성하게 하는 여하한의 조건들을 지칭한다. 이와 유사하게, "벡터의 폴리뉴클레오티드 서열이 발현되는 조건들"이라는 용어는 숙주 세포로 하여금 폴리펩티드를 합성하게 하는 여하한의 조건들을 의미한다. 적절한 조건들은, 예를 들어 발효 조건들을 포함한다. 발효 조건들은 온도 범위, 통기 수준, 공급량(feed rate), 및 배지 조성물을 포함하는(단, 이로 제한되지 않음) 다수의 파라미터를 포함할 수 있다. 이러한 조건들의 각각은 개별적으로 그리고 조합하여 숙주 세포가 성장하게 한다. 발효는 호기성, 혐기성, 또는 [미-호기성(micro-aerobic)과 같은] 이의 변이성(variation)일 수 있다. 예시적인 배양 배지는 브로쓰 또는 겔을 포함한다. 일반적으로, 배지는 숙주 세포에 의해 직접적으로 대사될 수 있는 탄소원을 포함한다. 또한, 효소들이 탄소원의 가동화(mobilization)[예를 들어, 전분 또는 셀룰로오스의 발효성 당들로의 해중합(depolymerization)] 및 후속 대사를 가능하게 하도록 배지에서 사용될 수 있다.

소규모 생성을 위해, 조작된 숙주 세포들은 예를 들어 약 100 μL, 200 μL, 300 μL, 400 μL, 500 μL, 1 mL, 5 mL, 10 mL, 15 mL, 25 mL, 50 mL, 75 mL, 100 mL, 500 mL, 1 L, 2 L, 5 L 또는 10 L의 뱃치(batch)에서 성장될 수 있고; 발효될 수 있으며; 의도한 폴리뉴클레오티드 서열, 예컨대 ACC 변이 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 발현시키도록 유도될 수 있다. 대규모 생성을 위해, 조작된 숙주 세포들은 약 10 L, 100 L, 1000 L, 10,000 L, 100,000 L 및 1,000,000 L 또는 그 이상의 부피의 뱃치를 갖는 배양물에서 성장될 수 있고; 발효될 수 있으며; 의도한 폴리뉴클레오티드 서열을 발현시키도록 유도될 수 있다. 본 명세서에서 설명되는 지방산 유도체 조성물 또는 다른 화합물들은 재조합 숙주 세포 배양물의 세포외 환경에서 발견될 수 있고, 배양 배지로부터 쉽게 분리될 수 있다. 지방산 유도체는 재조합 숙주 세포에 의해 분비될 수 있고, 세포외 환경으로 수송될 수 있거나, 또는 수동적으로 재조합 숙주 세포 배양물의 세포외 환경으로 전달될 수 있다. 일 구현예에서, 지방족 에스테르 조성물은 해당 기술분야에 알려진 통상의 방법들을 이용하여 재조합 숙주 세포 배양물로부터 분리될 수 있다. 여하한의 비-지방산 화합물들이 세포외에서 또는 세포내에서 생성될 수 있다.

재조합 숙주 세포의 스크리닝

본 발명의 일 구현예에서, 돌연변이 또는 변이 ACC 폴리펩티드의 활성은 (하나 이상의 돌연변이유발된 또는 변이 ACC 폴리뉴클레오티드 서열을 포함하는) 재조합 숙주 세포를 배양함으로써 결정되며, 이후 재조합 숙주 세포에 의해 생성된, 예를 들어 지방산 유도체 조성물 또는 다른 화합물들의 특징들; 예를 들어, 지방산 유도체 또는 다른 화합물들의 역가, 수율 및 생산성을 식별하기 위해 스크리닝이 후속된다. 또 다른 구현예에서, 돌연변이 또는 변이 ACC 폴리펩티드의 활성은 (하나 이상의 돌연변이유발된 또는 변이 ACC 폴리뉴클레오티드 서열을 포함하는) 재조합 숙주 세포를 배양함으로써 결정되며, 이후 재조합 숙주 세포에 의해 생성된, 예를 들어 지방산 유도체 조성물(예를 들어, 지방족 에스테르, 지방족 알코올, 지방산 알데히드 등) 또는 다른 화합물들의 특징들; 예를 들어, 지방산 유도체 또는 다른 화합물들의 역가, 수율 및 생산성을 식별하기 위해 스크리닝이 후속된다. 돌연변이 또는 변이 ACC 폴리펩티드 또는 돌연변이 또는 변이 BCCP 폴리펩티드 및 이의 단편은 통상의 방법들을 이용하여 말로닐-CoA 유래 화합물의 개선된/증가된 생성 및/또는 개선된 ACC 활성에 대해 검사될(assay) 수 있다. 예를 들어, 돌연변이 또는 변이 ACC 폴리펩티드 또는 BCCP 폴리펩티드 또는 이의 단편은 폴리펩티드가 기능하게 하는 조건들 하에서 기질(예를 들어, 아실-CoA, 아실-ACP, 유리 지방산, 알코올)과 접촉된다. 일 구현예에서, ACC 활성을 결정하기 위해 기질의 수준의 감소 또는 지방족 에스테르 또는 지방족 에스테르 조성물의 수준의 증가가 측정될 수 있다. 이는 지방족 알코올, 지방족 알데히드, 지방족 아민 및 다른 지방산 유도체 그리고 다른 화합물의 생성에도 동일하게 적용된다.

재조합 미생물들로부터 유도된 생성물

본 명세서에서 사용되는 바와 같이, "현대 탄소의 분율" 또는 fM은 각각 옥살산 표준 HOxI 및 HOxII로 알려져 있는 미국 국립표준기술연구소(National Institute of Standards and Technology: NIST) 표준 물질(Standard Reference Material: SRM) 4990B 및 4990C에 의해 정의된 것과 동일한 의미를 갖는다. 기본적인 정의는 (AD 1950을 기준으로) 0.95 배의 14C/12C 동위원소 비율 HOxI에 관한 것이다. 이는 붕괴-보정된 산업혁명-전 목재(decay-corrected pre-Industrial Revolution wood)와 거의 등가이다. 현재 생존 생물권(living biosphere)(식물 재료)에 대하여, fM은 약 1.1이다.

생물학적으로 생성되는 유기 화합물을 포함하는 바이오생성물(예를 들어, 본 발명에 따라 생성되는 지방산 유도체 조성물 또는 비-지방산 조성물), 및 특히 본 명세서에 설명된 지방산 생합성 경로를 이용하여 생성되는 지방족 에스테르 조성물은 재생가능한 탄소원로부터 생성되었으며, 이를테면 새로운 물질의 조성물이다. 이러한 새로운 바이오생성물은 이중 탄소-동위원소 핑거프린팅(dual carbon-isotopic fingerprinting) 또는 ¹⁴C 연대측정(dating)에 기초하여 석유화학의 탄소로부터 유래되는 유기 화합물과 구별될 수 있다. 추가적으로, 생물자원 탄소(biosourced carbon)의 특이적 공급원(예를 들어, 글루코오스 대 글리세롤)은 이중 탄소-동위원소 핑거프린팅에 의해 결정될 수 있다(예를 들어, 미국 특허 7,169,588 참조). 석유 기반 유기 화합물과 바이오생성물을 구별하는 능력은 상업적으로(in commerce) 이러한 물질들을 추적하는 데 유익하다. 예를 들어, 생물학적 기반 및 석유 기반 탄소 동위원소 프로파일 둘 모두를 포함하는 유기 화합물 또는 화학물질들은 석유 기반 물질들로만 만들어진 유기 화합물 및 화학물질들과 구별될 수 있다. 따라서, 본 명세서의 바이오생성물은 이들의 특유한 탄소 동위원소 프로파일에 기초하여 상업적으로 후속되거나 추적될 수 있다. 바이오생성물은 각 샘플의 안정한 탄소 동위원소 비율(¹³C/¹²C)을 비교함으로써 석유 기반 유기 화합물과 구별될 수 있다. 주어진 바이오생성물의 ¹³C/¹²C 비율은, 이산화탄소가 고정된 시간에 대기 중의 이산화탄소에서의 ¹³C/¹²C 비율의 결과이다. 또한, 이는 정확한 대사 경로를 반영한다. 또한, 국부적인 변이들도 일어난다. 석유, C3 식물(활엽), C4 식물(목초), 및 해양 탄산염(marine carbonate)이 모두 ¹³C/¹²C 및 대응하는 δ¹³C 값들에서 상당한 차이를 나타낸다. C4 및 C3 식물들이 모두 ¹³C/¹²C 동위원소 비율의 범위를 나타내지만, 통상적인 값들은 C4 식물에 대해 약 -7 내지 약 -13 퍼밀(per mil)이고, C3 식물에 대해 약 -19 내지 약 -27 퍼밀이다(예를 들어, Stuiver 외, Radiocarbon 19:355 (1977) 참조). 석탄 및 석유는 일반적으로 이 후자의 범위에 속한다.

일련의 대안적인 RM가 IAEA, USGS, NIST 및 다른 선택된 국제 동위원소 실험실과 협력하여 개발되었다. PDB로부터의 퍼밀 편차에 대한 표기는 δ¹³C이다. 질량 44, 45 및 46의 분자 이온들에 대한 고정밀 안정 비율 질량 분석(high precision stable ratio mass spectrometry)(IRMS)에 의해 CO₂에 대해 측정이 행해진다. 본 명세서에서 설명되는 조성물들은 본 명세서에서 설명되는 방법들 중 어느 하나에 의해 생성되는 지방족 에스테르 조성물 및 생성물을 포함한다. 구체적으로, 지방족 에스테르 조성물 또는 생성물은 약 -28 이상, 약 -27 이상, -20 이상, -18 이상, -15 이상, -13 이상, -10 이상, 또는 -8 이상의 δ¹³C를 가질 수 있다. 예를 들어, 지방족 에스테르 조성물 또는 생성물은 약 -30 내지 약 -15, 약 -27 내지 약 -19, 약 -25 내지 약 -21, 약 -15 내지 약 -5, 약 -13 내지 약 -7, 또는 약 -13 내지 약 -10의 δ¹³C를 가질 수 있다. 다른 경우들에서, 지방족 에스테르 조성물 또는 생성물은 약 -10, -11, -12 또는 -12.3의 δ¹³C를 가질 수 있다. 또한, 본 명세서의 기재내용에 따라 생성되는 지방족 에스테르 조성물 및 생성물은 각 화합물의 ¹⁴C의 양을 비교함으로써 석유 기반 유기 화합물과 구별될 수 있다. ¹⁴C는 핵 반감기가 5730년이기 때문에, "더 오래된" 탄소를 함유한 석유 기반 연료가 "더 새로운" 탄소를 함유한 지방족 에스테르 조성물 및 생성물과 구별될 수 있다(예를 들어, Currie, "Source Apportionment of Atmospheric Particles", Characterization of Environmental Particles, J. Buffle and H. P. van Leeuwen, Eds., 1 of Vol. I of the IUPAC Environmental Analytical Chemistry Series (Lewis Publishers, Inc.) 3-74, (1992) 참조).

방사성탄소 연대측정법(radiocarbon dating)의 기본적인 가정은 대기 중의 ¹⁴C 농도의 항상성(constancy)이 생물(living organism)의 ¹⁴C의 항상성을 유도한다는 것이다. 하지만, 1950년 이후부터의 대기권 핵실험 및 1850년 이후부터의 화석 연료의 연소로 인하여, ¹⁴C는 제 2의, 지구화학적인 시간 특성을 얻었다. 대기 CO₂ 및 이에 따른 생물권(living biosphere)에서의 그 농도는 1960년대 중반의 핵실험 피크의 거의 두 배였다. 이후, 7년 내지 10년의 근사적 이완 "반-감기"(approximate relaxation "half-life")를 갖는, 약 1.2×10^-12의 정상-상태 우주기원(steady-state cosmogenic) (대기) 기준 동위원소 비율(¹⁴C/¹²C)로 점진적으로 복귀되었다. (이 후자의 반감기가 문자 그대로 받아들여져야 하는 것이 아니라; 그보다는 핵무기 시대의 시작 이후로 대기권 및 생물권의 ¹⁴C의 변이성을 추적하기 위해 상세한 대기 핵 투입/붕괴의 함수(detailed atmospheric nuclear input/decay function)를 사용하여야 한다. 이는 최근 생물권 탄소의 매년 연대측정의 가능성(promise of annual dating)을 지속하는 후자의 생물권 ¹⁴C 시간 특성이다. ¹⁴C는 "현대 탄소의 분율"(fM)의 단위로 주어지는 결과들을 갖는 가속기 질량 분광 분석(accelerator mass spectrometry: AMS)에 의해 측정될 수 있다. 본 명세서에서 설명되는 지방족 에스테르 조성물 및 생성물은 적어도 약 1의 fM ¹⁴C를 가질 수 있는 바이오생성물을 포함한다. 예를 들어, 본 발명의 바이오생성물은 적어도 약 1.01의 fM ¹⁴C, 약 1 내지 약 1.5의 fM ¹⁴C, 약 1.04 내지 약 1.18의 fM ¹⁴C, 또는 약 1.111 내지 약 1.124의 fM ¹⁴C를 가질 수 있다.

¹⁴C의 또 다른 측정은 pMC(percent of modern carbon)로 알려져 있다. ¹⁴C 연대를 이용하는 고고학자 또는 지질학자에 대하여, AD 1950년은 "0의 해(zero years old)"와 같다. 또한, 이는 100 pMC를 나타낸다. 대기 중의 "핵무기 탄소(bomb carbon)"는 열-핵무기의 피크에서 1963년의 통상 수준의 거의 두 배에 달하였다. 대기권 내의 이의 분포는 이의 출연 이후로 근사화되었으며, AD 1950년 이후로 살아 있는 식물들 및 동물들에 대하여 100 pMC보다 더 큰 값을 나타낸다. 이는 시간이 지나면서 107.5 pMC 부근인 현재의 값으로 점차 감소하였다. 이는 옥수수와 같은 신선한(fresh) 바이오매스 물질이 107.5 pMC 부근의 ¹⁴C 시그너처(signature)를 제공한다는 것을 의미한다. 석유 기반 화합물들은 0의 pMC 값을 가질 것이다. 오늘날의 탄소와 화석 탄소의 조합은 오늘날의 pMC 함량의 희석을 유도할 것이다. 107.5 pMC가 오늘날의 바이오매스 물질의 ¹⁴C 함량을 나타내고 0 pMC가 석유 기반 생성물의 ¹⁴C 함량을 나타낸다고 가정함으로써, 물질에 대해 측정된 pMC 값은 두 성분 유형의 비율을 반영할 것이다. 예를 들어, 오늘날의 콩으로부터 100 % 유래된 물질은 107.5 pMC 부근의 방사성탄소 시그너처를 제공할 것이다. 그 물질이 석유 기반 생성물로 50 % 희석되었다면, 이는 약 54 pMC의 방사성탄소 시그너처를 제공할 것이다. 생물학적 기반 탄소 함량은 107.5 pMC와 같은 "100 %", 및 0 pMC와 같은 "0 %"를 할당함으로써 유래된다. 예를 들어, 99 pMC를 측정한 샘플은 93 %의 등가의 생물학적 기반 탄소 함량을 제공할 것이다. 이 값은 평균 생물학적 기반 탄소 결과로 지칭되며, 오늘날의 생물학적 물질 또는 석유 기반 물질 중 어느 하나로부터 비롯된 분석된 물질 내의 모든 성분을 가정한다. 본 명세서에서 설명되는 바와 같은 하나 이상의 지방족 에스테르를 포함하는 바이오생성물은 적어도 약 50, 60, 70, 75, 80, 85, 90, 95, 96, 97, 98, 99 또는 100의 pMC를 가질 수 있다. 다른 경우에, 본 명세서에서 설명되는 지방족 에스테르 조성물은 약 50 내지 약 100; 약 60 내지 약 100; 약 70 내지 약 100; 약 80 내지 약 100; 약 85 내지 약 100; 약 87 내지 약 98; 또는 약 90 내지 약 95의 pMC를 가질 수 있다. 또 다른 경우에, 본 명세서에서 설명되는 지방족 에스테르 조성물은 약 90, 91, 92, 93, 94, 또는 94.2의 pMC를 가질 수 있다.

지방족 에스테르 조성물

지방족 에스테르의 예시들은 지방산 에스테르, 예컨대 FAEE 및 FAME를 포함하는 짧은 사슬형 알코올로부터 유래되는 것들 그리고 더 긴 사슬형 지방족 알코올로부터 유래되는 것들을 포함한다. 생성되는 지방족 에스테르 및/또는 지방족 에스테르 조성물은 바이오연료(예를 들어, 바이오디젤), 공업용 화학물질, 또는 바이오연료 또는 공업용 화학물질의 성분 또는 이에 대한 공급원료로서 개별적으로 또는 적절히 조합하여 사용될 수 있다. 몇몇 측면들에서, 본 발명은, 예를 들어 FAEE, FAME를 포함하는 하나 이상의 지방산 에스테르 및/또는 더 긴 사슬형 알코올의 다른 지방산 에스테르 유도체를 포함하는 지방족 에스테르 조성물을 생성하는 방법에 관한 것이다. 관련 측면에서, 상기 방법은 FAME, FAEE, 지방산 프로필 에스테르, 지방산 이소프로필 에스테르, 지방산 부틸 에스테르, 모노글리세라이드, 지방산 이소부틸 에스테르, 지방산 2-부틸 에스테르 및 지방산 3차-부틸 에스테르 등을 포함하는(단, 이로 제한되지 않음) 지방족 에스테르 및 지방족 에스테르 조성물을 제조하는 데 적합한 유전적으로 조작된 생성 숙주를 포함한다.

에스테르는 다수의 상업적인 용도를 갖는다. 예를 들어, 대체 연료인 바이오디젤은 에스테르[예를 들어, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE) 등]로 이루어져 있다. 몇몇 저 분자량의 에스테르는 방향제 또는 착향료로서 유용하게 하는 기분 좋은 냄새를 갖는 휘발성이다. 또한, 에스테르는 래커, 페인트 및 바니쉬에 대한 용매로서 사용된다. 또한, 왁스, 지방 및 오일과 같이 자연적으로 발생하는 몇몇 물질이 에스테르로 이루어진다. 또한, 에스테르는 수지 및 플라스틱의 연화제, 가소제, 난연제, 및 가솔린 및 오일의 첨가제로서 사용된다. 또한, 에스테르는 중합체, 필름, 직물, 염료, 및 의약품의 제조에도 사용될 수 있다.

일반적으로, 지방족 에스테르 또는 지방족 에스테르 조성물은 숙주 세포의 세포외 환경으로부터 분리된다. 몇몇 구현예들에서, 지방족 에스테르 또는 지방족 에스테르 조성물은 숙주 세포로부터 부분적으로 또는 완전히 동시에 분비된다. 대안적인 구현예들에서, 지방족 에스테르 또는 지방족 에스테르 조성물은, 선택적으로 하나 이상의 수송 단백질의 도움으로, 세포외 환경 내로 수송된다. 또 다른 구현예들에서, 지방족 에스테르 또는 지방족 에스테르 조성물은 세포외 환경 내로 수동적으로 수송된다.

지방족 알코올 조성물

지방족 알코올의 예시들은 포화-, 불포화-, 직쇄형-, 및 분지쇄형 지방족 알코올을 포함한다. 생성되는 지방족 알코올 및/또는 지방족 알코올 조성물은 세제, 공업용 화학물질, 또는 공업용 화학물질의 성분 또는 이에 대한 공급원료로서 개별적으로 또는 적절히 조합하여 사용될 수 있다. 몇몇 측면들에서, 본 발명은, 예를 들어 더 짧은 및 더 긴 사슬형 지방족 알코올을 포함하는 하나 이상의 지방족 알코올을 포함하는 지방족 알코올 조성물을 생성하는 방법에 관한 것이다. 관련 측면에서, 상기 방법은 지방족 알코올 및 지방족 알코올 조성물을 제조하는 데 적합한 생성 숙주를 포함한다.

상기 방법들은 C6 내지 C26 지방족 알코올을 포함하는 지방족 알코올을 생성할 수 있다. 몇몇 구현예들에서, 지방족 알코올은 C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25 및/또는 C26 지방족 알코올을 포함한다. 특정 구현예들에서, 지방족 알코올은 1-데칸올, 1-도데칸올, 1-미리스틸 알코올, 1-헥사데칸올, 옥타데센올, 테트라데센올 또는 헥사데센올이다. 다른 구현예들에서, 지방족 알코올은 직쇄형 지방족 알코올이다. 다른 구현예들에서, 지방족 알코올은 분지쇄형 지방족 알코올이다. 또 다른 구현예들에서, 지방족 알코올은 사이클릭 모이어티를 포함한다. 몇몇 구현예들에서, 지방족 알코올은 불포화 지방족 알코올이다. 다른 구현예들에서, 지방족 알코올은 단일불포화 지방족 알코올이다. 또 다른 구현예들에서, 지방족 알코올은 포화 지방족 알코올이다. 또 다른 측면에서, 본 발명은 본 명세서에 설명되는 미생물들 중 어느 하나 또는 방법들 중 어느 하나에 의해 생성되는 지방족 알코올, 또는 본 명세서에 설명되는 미생물들 중 어느 하나 또는 방법들 중 어느 하나에 의해 생성되는 지방족 알코올을 포함하는 계면 활성제를 특성화한다. 몇몇 구현예들에서, 지방족 알코올은 약 -15.4 이상의 δ¹³C를 갖는다. 특정 구현예들에서, 지방족 알코올은 약 -15.4 내지 약 -10.9 또는 약 -13.92 내지 약 -13.84의 δ¹³C를 갖는다. 몇몇 구현예들에서, 지방족 알코올은 적어도 약 1.003의 f_M ¹⁴C를 갖는다. 특정 구현예들에서, 지방족 알코올은 적어도 약 1.01 또는 적어도 약 1.5의 f_M ¹⁴C를 갖는다. 몇몇 구현예들에서, 지방족 알코올은 약 1.111 내지 약 1.124의 f_M ¹⁴C를 갖는다.

지방족 알코올은 많은 상업적인 용도를 갖는다. 짧은 사슬형 지방족 알코올들은 유화제, 연화제 및 증점제로서 화장품 및 식품 산업에 사용된다. 이들의 양친매성 성질로 인해, 지방족 알코올들은 비이온성 계면활성제처럼 거동하고, 상기 비이온성 계면활성제는 세제로서 유용하다. 또한, 지방족 알코올들은 왁스, 검, 수지, 의약용 로션, 윤활유 첨가제, 직물 정전기 방지제 및 가공제, 가소제, 화장품, 공업 용매 및 지방용 용매에 사용된다.

일반적으로, 지방족 알코올 또는 지방족 알코올 조성물은 숙주 세포의 세포외 환경으로부터 분리된다. 몇몇 구현예들에서, 지방족 알코올 또는 지방족 알코올 조성물은 숙주 세포로부터 부분적으로 또는 완전히 동시에 분비된다. 대안적인 구현예들에서, 지방족 알코올 또는 지방족 알코올 조성물은, 선택적으로 하나 이상의 수송 단백질의 도움으로, 세포외 환경 내로 수송된다. 또 다른 구현예들에서, 지방족 알코올 또는 지방족 알코올 조성물은 세포외 환경 내로 수동적으로 수송된다.

실시예들

다음의 특정 실시예들은 본 발명을 예시하기 위해 의도된 것이며, 청구항의 범위를 제한하는 것으로 해석되어서는 안 된다.

본 발명을 예시하기 위하여, 개선된 FAME 생성을 위해 원래 대장균 ACC 효소를 개선하는, 즉 더 높은 역가 및 수율을 달성하는 두 가지 상이한 방법이 개발되었다. 4 개의 모든 대장균 ACC 유전자의 증가된 발현이 지방산 생성을 개선할 수 있다는 것은 문헌에 알려져 있지만, accB 유전자의 표적 돌연변이 및 accBC 오페론의 표적 발현 변화가 FAME 생성을 개선할 수 있다는 것을 발견한 것은 놀라운 일이었다.

프로토콜:

1. accBC에 대한 균주 구성

생성 숙주 균주, 소위 BD64(위 참조)가 accBC를 발현시키는 데 사용되었다. 생성 숙주 균주는 accBC의 발현에 대해 테스트하기 위해 수 개의 유전적 조작(genetic manipulation)을 포함하였다. accBC 오페론을 함유한 염색체 부위가 변형되었다. 유전적 조작은 ACC 보체계(complementation system)의 존재 하에서 수행되었다. 말로네이트가 10 mM 공급되었고, 동시에 리조비움 트리폴 리(Rhizobium trifolii)로부터의 2 개의 말로네이트 이용 유전자 matB 및 matC가 낮은 카피 플라스미드(low copy plasmid)로부터 발현되었다. 이러한 유전자들은 표준 조작 기술들을 이용하여 pKD46 통합 플라스미드에서 구성적 프로모터 뒤에 클로닝되었다. 선택적 플레이트들이 10 mM 말로네이트를 함유한 것을 제외하고는, accBC 오페론이 녹아웃되었다(Datsenko 외 (2000) Proceedings of the National Academy of Sciences 97(12):6640-6645 참조). 변형된 accBC 오페론은, 선택적 플레이트에 말로네이트가 결여된 것을 제외하고는 동일한 절차를 이용하여 통합되었다.

2. accB에 대한 균주 구성

생성 숙주 균주, 소위 BD64(위 참조)가 accB를 발현시키는 데 사용되었다. accBC의 구성(위 참조)에 사용된 동일한 전략을 이용하여 accB 유전자를 함유한 염색체 부위가 변형되었다.

3. ACC FAME 생성 검사

대장균 ACC 효소 활성에 대한 변화가 FAME 생성 시스템을 이용하여 검사되었다. 의도한 ACC 돌연변이(들)를 함유한 균주 BD64(위 참조)가 에스테르 신타아제(ES) 플라스미드, 소위 pKEV13으로 형질전환되었다. 플라스미드 pKEV13은 마리노박터 하이드로카보노클라스티쿠스(Marinobacter hydrocarbonoclasticus) ATCC 49840으로부터의 에스테르 신타아제 유전자 및 상업적 pTrc 프로모터(Life Technologies)를 플라스미드 pCL1920(Lerner 외 (1990) Nucleic acids research 18(15):4631)으로 클로닝함으로써 구성되었다. 균주들은 발효되었고, 추출되었으며, 아래에 자세히 설명된 표준 절차들에 따라 FAME 생성이 측정되었다.

발효는 다음과 같이 수행되었다; 96 웰 플레이트(well plate)에서 성장된 LB 배양물로부터, 30 μL의 LB 배양물이 270 μL의 FA2P 배지에 접종(inoculate)하는 데 사용되었으며, 이는 이후 진탕 배양기에서 32 ℃로 약 16 시간 동안 배양되었다. 하룻밤이 지난 씨드(overnight seed)의 30 μL가 2 % 메탄올 및 1mM IPTG를 함유한 300 μL의 FA4P 배지에 접종하는 데 사용되었다. FA2P 및 FA4P 배지 둘 모두는 (각각) 0.2 g/L 또는 0.4 g/L의 포스페이트를 함유한 변형된 M9 최소 배지이다. FA2P 및 FA4P 배지 둘 모두의 탄소원은 50 g/L 글루코오스이다. 배양물들이 아래에 자세히 설명된 표준 추출 프로토콜을 따라 추출되었을 때, 배양물들은 진탕 배양기에서 32 ℃로 24 시간 동안 배양되었다.

추출은 다음과 같이 수행되었다; 각각의 웰에 40 μL의 1M HCl이 추출되게 하기 위해, 이후 내부 표준으로서 500 mg/L C11-FAME을 갖는 300 μL의 부틸 아세테이트가 첨가되었다. 96 웰 플레이트는 플레이트 실러(plate sealer)(ALPS-300; Abgene, ThermoScientific, Rockford, IL)를 이용하여 열-융착되었고(heat-sealed), MIXMATE(Eppendorf, Hamburg, Germany)를 이용하여 2000 rpm으로 15 분 동안 진탕되었다. 진탕 후, 플레이트는 실온에서 4500 rpm으로 10 분 동안 원심분리되어(Allegra X-15R, rotor SX4750A, Beckman Coulter, Brea, CA), 수성 및 유기 층들을 분리하였다. 50 μL의 유기 층이 96 웰 플레이트(96-웰 플레이트, 폴리프로필렌, Corning, Amsterdam, The Netherlands)로 이동되었다. 플레이트는 열-융착되었고, 이후 GC-FID(gas chromatography flame ionization detector)에 의해 평가될 때까지 -20 ℃로 저장되었다.

FAME 정량화(quantification)의 추출은 다음과 같이 수행되었다; 1 μL의 샘플이 FID(flame ionization detector)를 갖는 Trace GC Ultra(Thermo Fisher Scientific, Waltham, MA)에서 UFM 컬럼(column)(cat #: UFMC00001010401, Thermo Fisher Scientific, Waltham, MA) 상으로 주입되었다. 장비는, C8 내지 C18 FAME을 검출하고 C12 내지 C18 β-OH FAME을 정량화하도록 셋업되었다.

실시예 1: accB 의 돌연변이가 FAME 생성을 증가시킴

accB 유전자의 오류 유발 라이브러리가 구축되었고, 야생형 유전자를 넘어서는 개선을 나타낸 변이체들에 대해 스크리닝되었다. 표 3은 최적의 변이체들의 요약을 나타낸다. accB 유전자의 오류 유발 라이브러리는 상업적으로 이용가능한 키트(Genemorph II, Agilent Technologies)를 이용하여 구축되었다. accB 유전자는 SOE PCR 기술을 이용하여 적절한 상동 부위에 결합되었고, 라이브러리는 프로토콜 1에 설명된 바와 같은 대장균 염색체 내로 통합되어, 원래 대장균 accB 유전자를 대체하였다. 오류-유발 라이브러리는 프로토콜 2에 따라 스크리닝되었다.

표 3: FAME 생성을 위한 accB의 변이체들

표 3의 컬럼들은 변이체의 원래 웰 위치, 대조군을 넘어서는 FAME 역가 개선, 및 각 변이체에서의 아미노산 및 DNA 코돈 변화를 나타낸다. 표 3의 결과는 아미노산 위치 2의 돌연변이가 역가의 최대 증가를 달성할 수 있음을 시사한다. 웰 5A02는 정상적인 ACC 활성의 435 %의 역가의 증가를 나타내었다.

다음, 어느 개별 위치 및 돌연변이가 가장 큰 개선을 제공하는 지를 결정하기 위해 표적 부위-포화 돌연변이유발이 수행되었다. 실제로 accB의 (개시 코돈 바로 다음의) 위치 2의 돌연변이가 FAME 역가의 가장 큰 증가를 제공하는 것으로 결정되었다. 야생형 accB는 아스파르트산(Asp, D)을 코딩하는 위치 2에서 GAT 코돈을 함유한다. 표 1(위 참조)은 accB 위치 2에 대한 최적의 변이체들의 요약을 나타낸다. 부위-포화 라이브러리는 두 번째 accB 위치에서 변성 염기 NNN을 함유하는 올리고뉴클레오티드 프라이머를 이용하여 구축되었다. accB 유전자는 SOE PCR 기술을 이용하여 적절한 상동 부위에 결합되었고, 라이브러리는 프로토콜 1에 설명된 바와 같은 대장균 염색체 내로 통합되어, 원래 대장균 accB 유전자를 대체하였다. 오류-유발 라이브러리는 프로토콜 2에 따라 스크리닝되었다. 표 1(위 참조)에서 알 수 있는 바와 같이, 정상적인 ACC 활성의 최대 630 %의 역가의 증가가 돌연변이 D2H에서 관찰되었다. 도 5는 이러한 조사결과들을 더욱 반영하며, mg/L의 FAS 역가를 나타내는 그래프를 나타낸다. 더 구체적으로, 상기 도면은 대장균 숙주 세포에서 (accB 유전자의 위치 2에) 다양한 BCCP 변이체를 발현시킨 결과로서의 FAS 역가(FAME)를 나타낸다. WT는 야생형 ACC 복합체에 대한 대조군이다. 이러한 BCCP 변이체들의 일부는 5-배가 넘게 FAS 역가를 개선하였다(또한, 표 1 참조). 이 조사결과들은, BCCP 변이체들이 지방산 유도체를 생성할 때 전체 ACC 복합체를 능가하였기 때문에 놀라웠다. 동일한 아미노산 치환을 코딩하는 상이한 코돈들이 테스트되었고, 효과는 동일한 것으로 나타났으며, 말로닐-유래 화합물, 이 경우 지방산 유도체를 증가시키는 효과가 BCCP의 아미노산 변화와 상관되어 있었음을 확인하였다.

실시예 2: accBC 오페론의 발현 변형이 FAME 생성을 증가시킴

accBC 오페론의 발현 라이브러리가 구축되었고, 야생형 accBC 프로모터를 넘어서는 개선을 나타낸 변이체들에 대해 스크리닝되었다. 표 2(위 참조)는 최적의 변이체들의 요약을 나타낸다. 라이브러리는, 원래 accBC 프로모터 부위를, 무작위 돌연변이를 도입하도록 변성 뉴클레오티드를 함유한 박테리오파지 T5 프로모터 라이브러리로 대체한 프라이머들을 이용하여 구축되었다. T5 프로모터 라이브러리는 SOE PCR 기술을 이용하여 적절한 상동 부위에 결합되었고, 라이브러리는 프로토콜 1에 설명된 바와 같은 대장균 염색체 내로 통합되어, 원래 대장균 accBC 프로모터를 대체하였다. 발현 라이브러리는 프로토콜 2에 따라 스크리닝되었다. 표 2(위 참조)에서 알 수 있는 바와 같이, 정상적인 ACC 활성의 최대 315 %의 역가의 증가가 변이 프로모터로 관찰되었다.

실시예 3: accB 및 accBC 조작은 여하한의 말로닐 -유래 화합물의 생성을 개선할 수 있음

accB 돌연변이(실시예 1) 및 accBC 발현 변화(실시예 2)는 말로닐-CoA로부터 유래된 여하한의 생성물의 역가 및 수율을 증가시키는 데 사용될 수 있다. 실시예 1로부터의 특이적 돌연변이는 표준 유전적 조작 기술들을 이용하여 여하한의 미생물 균주 내로 도입될 수 있다. accBC의 발현은 실시예 2에 따른 박테리아 또는 효모에서 변형될 수 있거나, 표준 유전적 조작 기술들을 이용하여 해당 기술분야에 알려진 다른 방법들을 통해 변형될 수 있다. accBC의 오페론 구조는 다수의 박테리아 및 다른 미생물들에서 고도로 보존되고 발견된다. 이는 동일한 기술들이 여러 상이한 유기체들에 사용되게 할 것이다. 말로닐-CoA로부터 유래된 화합물들은 많으며, 지방산, 지방산 에스테르(FAME, FAEE 등), 지방족 알코올, 지방족 아민, 이작용성 지방산(하이드록시, 이산), 이작용성 지방족 알코올, 이작용성 지방족 에스테르, 이작용성 지방족 아민, 베타-하이드록시 지방산 유래 화합물, 불포화 지방산-유래 화합물, 그리고 비-지방산계 플라바논 및 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함한다.

해당 기술분야의 당업자에게 명백한 바와 같이, 상기의 측면들 및 구현예들의 다양한 변형들 및 변경들이 본 발명의 기술사상 및 범위를 벗어나지 않고 행해질 수 있다. 이러한 변형들 및 변경들은 본 발명의 범위 내에 있다.

SEQUENCE LISTING <110> LS9, INC. <120> IMPROVED ACETYL-COA CARBOXYLASE VARIANTS <130> LS00050PCT <140> <141> <150> 61/892,242 <151> 2013-10-17 <150> 61/877,418 <151> 2013-09-13 <160> 109 <170> PatentIn version 3.5 <210> 1 <211> 471 <212> DNA <213> Escherichia coli <400> 1 atggatattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 2 <211> 156 <212> PRT <213> Escherichia coli <400> 2 Met Asp Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 3 <211> 471 <212> DNA <213> Escherichia coli <400> 3 atgcacattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 4 <211> 156 <212> PRT <213> Escherichia coli <400> 4 Met His Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 5 <211> 471 <212> DNA <213> Escherichia coli <400> 5 atgaacattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 6 <211> 156 <212> PRT <213> Escherichia coli <400> 6 Met Asn Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 7 <211> 471 <212> DNA <213> Escherichia coli <400> 7 atgcatattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 8 <211> 156 <212> PRT <213> Escherichia coli <400> 8 Met His Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 9 <211> 471 <212> DNA <213> Escherichia coli <400> 9 atgattattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 10 <211> 156 <212> PRT <213> Escherichia coli <400> 10 Met Ile Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 11 <211> 471 <212> DNA <213> Escherichia coli <400> 11 atgattattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 12 <211> 156 <212> PRT <213> Escherichia coli <400> 12 Met Ile Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 13 <211> 471 <212> DNA <213> Escherichia coli <400> 13 atgactattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 14 <211> 156 <212> PRT <213> Escherichia coli <400> 14 Met Thr Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 15 <211> 471 <212> DNA <213> Escherichia coli <400> 15 atgtctattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 16 <211> 156 <212> PRT <213> Escherichia coli <400> 16 Met Ser Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 17 <211> 471 <212> DNA <213> Escherichia coli <400> 17 atgagcattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 18 <211> 156 <212> PRT <213> Escherichia coli <400> 18 Met Ser Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 19 <211> 471 <212> DNA <213> Escherichia coli <400> 19 atgcgaattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 20 <211> 156 <212> PRT <213> Escherichia coli <400> 20 Met Arg Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 21 <211> 471 <212> DNA <213> Escherichia coli <400> 21 atgtctattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 22 <211> 156 <212> PRT <213> Escherichia coli <400> 22 Met Ser Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 23 <211> 471 <212> DNA <213> Escherichia coli <400> 23 atgtatattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 24 <211> 156 <212> PRT <213> Escherichia coli <400> 24 Met Tyr Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 25 <211> 471 <212> DNA <213> Escherichia coli <400> 25 atgtcaattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 26 <211> 156 <212> PRT <213> Escherichia coli <400> 26 Met Ser Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 27 <211> 471 <212> DNA <213> Escherichia coli <400> 27 atgtacattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 28 <211> 156 <212> PRT <213> Escherichia coli <400> 28 Met Tyr Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 29 <211> 471 <212> DNA <213> Escherichia coli <400> 29 atgtacattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 30 <211> 156 <212> PRT <213> Escherichia coli <400> 30 Met Tyr Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 31 <211> 471 <212> DNA <213> Escherichia coli <400> 31 atgcttattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 32 <211> 156 <212> PRT <213> Escherichia coli <400> 32 Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 33 <211> 471 <212> DNA <213> Escherichia coli <400> 33 atgcgaattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 34 <211> 156 <212> PRT <213> Escherichia coli <400> 34 Met Arg Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 35 <211> 471 <212> DNA <213> Escherichia coli <400> 35 atgttgattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 36 <211> 156 <212> PRT <213> Escherichia coli <400> 36 Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 37 <211> 471 <212> DNA <213> Escherichia coli <400> 37 atgcgaattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 38 <211> 156 <212> PRT <213> Escherichia coli <400> 38 Met Arg Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 39 <211> 471 <212> DNA <213> Escherichia coli <400> 39 atgacgattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 40 <211> 156 <212> PRT <213> Escherichia coli <400> 40 Met Thr Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 41 <211> 471 <212> DNA <213> Escherichia coli <400> 41 atgtatattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 42 <211> 156 <212> PRT <213> Escherichia coli <400> 42 Met Tyr Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 43 <211> 471 <212> DNA <213> Escherichia coli <400> 43 atgcttattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 44 <211> 156 <212> PRT <213> Escherichia coli <400> 44 Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 45 <211> 471 <212> DNA <213> Escherichia coli <400> 45 atgttaattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 46 <211> 156 <212> PRT <213> Escherichia coli <400> 46 Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 47 <211> 471 <212> DNA <213> Escherichia coli <400> 47 atgcagattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 48 <211> 156 <212> PRT <213> Escherichia coli <400> 48 Met Gln Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 49 <211> 471 <212> DNA <213> Escherichia coli <400> 49 atgtatattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 50 <211> 156 <212> PRT <213> Escherichia coli <400> 50 Met Tyr Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 51 <211> 471 <212> DNA <213> Escherichia coli <400> 51 atgttaattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 52 <211> 156 <212> PRT <213> Escherichia coli <400> 52 Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 53 <211> 471 <212> DNA <213> Escherichia coli <400> 53 atgttaattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 54 <211> 156 <212> PRT <213> Escherichia coli <400> 54 Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 55 <211> 471 <212> DNA <213> Escherichia coli <400> 55 atgttaattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 56 <211> 156 <212> PRT <213> Escherichia coli <400> 56 Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 57 <211> 471 <212> DNA <213> Escherichia coli <400> 57 atgttaattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 58 <211> 156 <212> PRT <213> Escherichia coli <400> 58 Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 59 <211> 471 <212> DNA <213> Escherichia coli <400> 59 atgttgattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 60 <211> 156 <212> PRT <213> Escherichia coli <400> 60 Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 61 <211> 471 <212> DNA <213> Escherichia coli <400> 61 atgttgattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 62 <211> 156 <212> PRT <213> Escherichia coli <400> 62 Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 63 <211> 471 <212> DNA <213> Escherichia coli <400> 63 atgcttattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 64 <211> 156 <212> PRT <213> Escherichia coli <400> 64 Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 65 <211> 471 <212> DNA <213> Escherichia coli <400> 65 atgatcattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 66 <211> 156 <212> PRT <213> Escherichia coli <400> 66 Met Ile Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 67 <211> 471 <212> DNA <213> Escherichia coli <400> 67 atgtatattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 68 <211> 156 <212> PRT <213> Escherichia coli <400> 68 Met Tyr Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 69 <211> 471 <212> DNA <213> Escherichia coli <400> 69 atggaaattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 70 <211> 156 <212> PRT <213> Escherichia coli <400> 70 Met Glu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 71 <211> 471 <212> DNA <213> Escherichia coli <400> 71 atgctcattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 72 <211> 156 <212> PRT <213> Escherichia coli <400> 72 Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 73 <211> 471 <212> DNA <213> Escherichia coli <400> 73 atgctcattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 74 <211> 156 <212> PRT <213> Escherichia coli <400> 74 Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 75 <211> 471 <212> DNA <213> Escherichia coli <400> 75 atgctcattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 76 <211> 156 <212> PRT <213> Escherichia coli <400> 76 Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 77 <211> 471 <212> DNA <213> Escherichia coli <400> 77 atgatcattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 78 <211> 156 <212> PRT <213> Escherichia coli <400> 78 Met Ile Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 79 <211> 471 <212> DNA <213> Escherichia coli <400> 79 atggaaattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 80 <211> 156 <212> PRT <213> Escherichia coli <400> 80 Met Glu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 81 <211> 471 <212> DNA <213> Escherichia coli <400> 81 atgtcgattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 82 <211> 156 <212> PRT <213> Escherichia coli <400> 82 Met Ser Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 83 <211> 471 <212> DNA <213> Escherichia coli <400> 83 atgtcgattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 84 <211> 156 <212> PRT <213> Escherichia coli <400> 84 Met Ser Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 85 <211> 471 <212> DNA <213> Escherichia coli <400> 85 atgtcgattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 86 <211> 156 <212> PRT <213> Escherichia coli <400> 86 Met Ser Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 87 <211> 471 <212> DNA <213> Escherichia coli <400> 87 atgtcgattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 88 <211> 156 <212> PRT <213> Escherichia coli <400> 88 Met Ser Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 89 <211> 471 <212> DNA <213> Escherichia coli <400> 89 atgtcgattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60 ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120 ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180 gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240 cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300 gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360 atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420 gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471 <210> 90 <211> 156 <212> PRT <213> Escherichia coli <400> 90 Met Ser Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser 1 5 10 15 Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr 35 40 45 Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro 50 55 60 Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly 65 70 75 80 His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser 85 90 95 Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly 100 105 110 Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu 115 120 125 Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln 130 135 140 Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu 145 150 155 <210> 91 <211> 80 <212> DNA <213> Escherichia coli <400> 91 ttgttgcaaa ttacacggtg ttgaaggtta tttacatgtt agctgttgat tatcttccct 60 gataagacca gtatttagct 80 <210> 92 <211> 52 <212> DNA <213> Escherichia coli <400> 92 aatcataaaa aatttatttg ctttcaggaa aatttttctg tataatagat tc 52 <210> 93 <211> 52 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 93 aatcataaaa aatttatttg ctctcaggaa aatttttctg gataatagat tc 52 <210> 94 <211> 52 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 94 aatcataaaa aatttatctt ctctcaggaa aatttttctg tattatagat tc 52 <210> 95 <211> 52 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 95 aatcataaaa aatttatctg ccttcaggaa aatttttctg tataatagat tc 52 <210> 96 <211> 52 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 96 aatcataaaa aatttatttg ccttcaggaa aatttttctg tatagtagat tc 52 <210> 97 <211> 30 <212> PRT <213> Escherichia coli <400> 97 Gly Gln Lys Val Asn Val Gly Asp Thr Leu Cys Ile Val Glu Ala Met 1 5 10 15 Lys Met Met Asn Gln Ile Glu Ala Asp Lys Ser Gly Thr Val 20 25 30 <210> 98 <211> 30 <212> PRT <213> Lactobacillus brevis <400> 98 Gly Asp His Val Glu Lys Gly Asp Val Val Cys Val Val Glu Ala Met 1 5 10 15 Lys Met Ile Asn Glu Val Lys Ser Asp Leu Thr Gly Thr Leu 20 25 30 <210> 99 <211> 30 <212> PRT <213> Stenotrophomonas maltophilia <400> 99 Gly Gln Gln Val Lys Glu Gly Glu Thr Leu Ala Ile Ile Glu Ala Met 1 5 10 15 Lys Met Phe Asn Pro Ile Glu Ala Asp Thr Ser Gly Thr Ile 20 25 30 <210> 100 <211> 30 <212> PRT <213> Pseudomonas putida <400> 100 Gly Gln Ser Val Lys Lys Gly Asp Thr Leu Cys Ile Val Glu Ala Met 1 5 10 15 Lys Met Met Asn His Ile Glu Ala Asp Ile Gly Gly Val Ile 20 25 30 <210> 101 <211> 30 <212> PRT <213> Bacillus subtilis <400> 101 Gly Ser Lys Val Asn Glu Asn Thr Val Val Cys Ile Val Glu Ala Met 1 5 10 15 Lys Leu Phe Asn Glu Ile Glu Ala Glu Val Lys Gly Glu Ile 20 25 30 <210> 102 <211> 30 <212> PRT <213> Corynebacterium glutamicum <400> 102 Gly Ala Glu Val Asn Glu Gly Asp Thr Val Val Val Leu Glu Ala Met 1 5 10 15 Lys Met Glu Asn Pro Val Lys Ala His Lys Ser Gly Thr Val 20 25 30 <210> 103 <211> 30 <212> PRT <213> Saccharomyces cerevisiae <400> 103 Gly Glu His Ile Ile Lys Gly Gln Pro Tyr Ala Glu Ile Glu Val Met 1 5 10 15 Lys Met Gln Met Pro Leu Val Ser Gln Glu Asn Gly Ile Val 20 25 30 <210> 104 <211> 141 <212> PRT <213> Lactobacillus brevis <400> 104 Met Lys Asn Glu Asp Ile Glu His Leu Leu Glu Lys Phe Asp His Ser 1 5 10 15 Ser Leu Lys Asp Phe His Leu Val Gln Asp Asp Phe Gln Leu Ser Leu 20 25 30 Ser Lys Arg Glu Asp Thr Asn Val Pro Thr Pro Ala Thr Ile Asp Gln 35 40 45 Pro Thr Pro Glu Pro Ala Gly Glu Thr Ala Lys Glu Ser Ala Glu Pro 50 55 60 Thr Ile Thr Ala Pro Leu Val Gly Val Val Tyr Leu Ala Pro Ala Pro 65 70 75 80 Glu Lys Pro Val Phe Lys Gln Ile Gly Asp His Val Glu Lys Gly Asp 85 90 95 Val Val Cys Val Val Glu Ala Met Lys Met Ile Asn Glu Val Lys Ser 100 105 110 Asp Leu Thr Gly Thr Leu Thr Lys Val Leu Val Thr Asp Gly Ser Met 115 120 125 Val Glu Tyr Asp Glu Pro Leu Leu Gln Ile Lys Pro Asp 130 135 140 <210> 105 <211> 159 <212> PRT <213> Stenotrophomonas maltophilia <400> 105 Met Asp Leu Arg Lys Ile Lys Lys Leu Ile Asp Leu Leu Glu Glu Ser 1 5 10 15 Asn Leu Ala Glu Ile Glu Ile Lys Glu Gly Glu Glu Ser Val Arg Leu 20 25 30 Ser Arg Ala Pro Val Ala Gly Tyr Ala Ala Pro Val Ala Ala Pro Val 35 40 45 Tyr Ala Ala Pro Ala Ala Pro Ala Pro Gln Ala Met Pro Met Gln Ser 50 55 60 Pro Thr Glu Ala Ser Thr Gly Gly Thr Ala Lys Pro Gly Pro Ala Leu 65 70 75 80 Pro Glu Gly His Val Leu Arg Ser Pro Met Val Gly Thr Phe Tyr Ala 85 90 95 Ser Ser Ala Pro Asp Lys Pro Ala Phe Val Thr Val Gly Gln Gln Val 100 105 110 Lys Glu Gly Glu Thr Leu Ala Ile Ile Glu Ala Met Lys Met Phe Asn 115 120 125 Pro Ile Glu Ala Asp Thr Ser Gly Thr Ile Val Ala Ile Leu Gly Glu 130 135 140 Asn Gly Gln Pro Val Glu Phe Asp Gln Pro Leu Phe Val Ile Gly 145 150 155 <210> 106 <211> 153 <212> PRT <213> Pseudomonas putida <400> 106 Met Asp Ile Arg Lys Val Lys Lys Leu Ile Glu Leu Leu Glu Glu Ser 1 5 10 15 Gly Ile Asp Glu Leu Glu Ile Lys Glu Gly Glu Glu Ser Val Arg Ile 20 25 30 Ser Arg His Ser Lys Thr Pro Ala Ala Gln Gln Phe Tyr Ala Pro Ala 35 40 45 Pro Met Ala Ala Ala Pro Ala Ala Ala Pro Val Ala Ala Ala Ala Pro 50 55 60 Ala Ala Glu Ala Thr Ala Ala Ala Pro Ala Leu Lys Gly Thr Val Val 65 70 75 80 Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Lys Pro Ser Pro Thr Ser 85 90 95 Pro Asn Phe Ala Glu Val Gly Gln Ser Val Lys Lys Gly Asp Thr Leu 100 105 110 Cys Ile Val Glu Ala Met Lys Met Met Asn His Ile Glu Ala Asp Ile 115 120 125 Gly Gly Val Ile Asp Ala Ile Leu Val Glu Asp Gly Gln Pro Val Glu 130 135 140 Phe Asp Gln Pro Leu Phe Thr Ile Val 145 150 <210> 107 <211> 159 <212> PRT <213> Bacillus subtilis <400> 107 Met Leu Asn Ile Lys Glu Ile His Glu Leu Ile Lys Ala Ile Asp Glu 1 5 10 15 Ser Thr Ile Asp Glu Phe Val Tyr Glu Asn Glu Gly Val Ser Leu Lys 20 25 30 Leu Lys Lys His Glu Ala Gly Thr Val Gln Val Met Gln Gln Ala Pro 35 40 45 Ala Ala Pro Val Gln Ala Gln Ala Pro Gln Ala Val Gln Pro Gln Ala 50 55 60 Gln Gln Ala Ala Ala Pro Ala Gln Glu Ala Pro Lys Gln Asp Glu Asn 65 70 75 80 Leu His Lys Ile Thr Ser Pro Met Val Gly Thr Phe Tyr Ala Ser Ser 85 90 95 Ser Pro Glu Ala Gly Pro Tyr Val Thr Ala Gly Ser Lys Val Asn Glu 100 105 110 Asn Thr Val Val Cys Ile Val Glu Ala Met Lys Leu Phe Asn Glu Ile 115 120 125 Glu Ala Glu Val Lys Gly Glu Ile Val Glu Val Leu Val Glu Asn Gly 130 135 140 Gln Leu Val Glu Tyr Gly Gln Pro Leu Phe Leu Val Lys Ala Glu 145 150 155 <210> 108 <211> 591 <212> PRT <213> Corynebacterium glutamicum <400> 108 Met Ser Val Glu Thr Arg Lys Ile Thr Lys Val Leu Val Ala Asn Arg 1 5 10 15 Gly Glu Ile Ala Ile Arg Val Phe Arg Ala Ala Arg Asp Glu Gly Ile 20 25 30 Gly Ser Val Ala Val Tyr Ala Glu Pro Asp Ala Asp Ala Pro Phe Val 35 40 45 Ser Tyr Ala Asp Glu Ala Phe Ala Leu Gly Gly Gln Thr Ser Ala Glu 50 55 60 Ser Tyr Leu Val Ile Asp Lys Ile Ile Asp Ala Ala Arg Lys Ser Gly 65 70 75 80 Ala Asp Ala Ile His Pro Gly Tyr Gly Phe Leu Ala Glu Asn Ala Asp 85 90 95 Phe Ala Glu Ala Val Ile Asn Glu Gly Leu Ile Trp Ile Gly Pro Ser 100 105 110 Pro Glu Ser Ile Arg Ser Leu Gly Asp Lys Val Thr Ala Arg His Ile 115 120 125 Ala Asp Thr Ala Lys Ala Pro Met Ala Pro Gly Thr Lys Glu Pro Val 130 135 140 Lys Asp Ala Ala Glu Val Val Ala Phe Ala Glu Glu Phe Gly Leu Pro 145 150 155 160 Ile Ala Ile Lys Ala Ala Phe Gly Gly Gly Gly Arg Gly Met Lys Val 165 170 175 Ala Tyr Lys Met Glu Glu Val Ala Asp Leu Phe Glu Ser Ala Thr Arg 180 185 190 Glu Ala Thr Ala Ala Phe Gly Arg Gly Glu Cys Phe Val Glu Arg Tyr 195 200 205 Leu Asp Lys Ala Arg His Val Glu Ala Gln Val Ile Ala Asp Lys His 210 215 220 Gly Asn Val Val Val Ala Gly Thr Arg Asp Cys Ser Leu Gln Arg Arg 225 230 235 240 Phe Gln Lys Leu Val Glu Glu Ala Pro Ala Pro Phe Leu Thr Asp Asp 245 250 255 Gln Arg Glu Arg Leu His Ser Ser Ala Lys Ala Ile Cys Lys Glu Ala 260 265 270 Gly Tyr Tyr Gly Ala Gly Thr Val Glu Tyr Leu Val Gly Ser Asp Gly 275 280 285 Leu Ile Ser Phe Leu Glu Val Asn Thr Arg Leu Gln Val Glu His Pro 290 295 300 Val Thr Glu Glu Thr Thr Gly Ile Asp Leu Val Arg Glu Met Phe Arg 305 310 315 320 Ile Ala Glu Gly His Glu Leu Ser Ile Lys Glu Asp Pro Ala Pro Arg 325 330 335 Gly His Ala Phe Glu Phe Arg Ile Asn Gly Glu Asp Ala Gly Ser Asn 340 345 350 Phe Met Pro Ala Pro Gly Lys Ile Thr Ser Tyr Arg Glu Pro Gln Gly 355 360 365 Pro Gly Val Arg Met Asp Ser Gly Val Val Glu Gly Ser Glu Ile Ser 370 375 380 Gly Gln Phe Asp Ser Met Leu Ala Lys Leu Ile Val Trp Gly Asp Thr 385 390 395 400 Arg Glu Gln Ala Leu Gln Arg Ser Arg Arg Ala Leu Ala Glu Tyr Val 405 410 415 Val Glu Gly Met Pro Thr Val Ile Pro Phe His Gln His Ile Val Glu 420 425 430 Asn Pro Ala Phe Val Gly Asn Asp Glu Gly Phe Glu Ile Tyr Thr Lys 435 440 445 Trp Ile Glu Glu Val Trp Asp Asn Pro Ile Ala Pro Tyr Val Asp Ala 450 455 460 Ser Glu Leu Asp Glu Asp Glu Asp Lys Thr Pro Ala Gln Lys Val Val 465 470 475 480 Val Glu Ile Asn Gly Arg Arg Val Glu Val Ala Leu Pro Gly Asp Leu 485 490 495 Ala Leu Gly Gly Thr Ala Gly Pro Lys Lys Lys Ala Lys Lys Arg Arg 500 505 510 Ala Gly Gly Ala Lys Ala Gly Val Ser Gly Asp Ala Val Ala Ala Pro 515 520 525 Met Gln Gly Thr Val Ile Lys Val Asn Val Glu Glu Gly Ala Glu Val 530 535 540 Asn Glu Gly Asp Thr Val Val Val Leu Glu Ala Met Lys Met Glu Asn 545 550 555 560 Pro Val Lys Ala His Lys Ser Gly Thr Val Thr Gly Leu Thr Val Ala 565 570 575 Ala Gly Glu Gly Val Asn Lys Gly Val Val Leu Leu Glu Ile Lys 580 585 590 <210> 109 <211> 2237 <212> PRT <213> Saccharomyces cerevisiae <400> 109 Met Ser Glu Glu Ser Leu Phe Glu Ser Ser Pro Gln Lys Met Glu Tyr 1 5 10 15 Glu Ile Thr Asn Tyr Ser Glu Arg His Thr Glu Leu Pro Gly His Phe 20 25 30 Ile Gly Leu Asn Thr Val Asp Lys Leu Glu Glu Ser Pro Leu Arg Asp 35 40 45 Phe Val Lys Ser His Gly Gly His Thr Val Ile Ser Lys Ile Leu Ile 50 55 60 Ala Asn Asn Gly Ile Ala Ala Val Lys Glu Ile Arg Ser Val Arg Lys 65 70 75 80 Trp Ala Tyr Glu Thr Phe Gly Asp Asp Arg Thr Val Gln Phe Val Ala 85 90 95 Met Ala Thr Pro Glu Asp Leu Glu Ala Asn Ala Glu Tyr Ile Arg Met 100 105 110 Ala Asp Gln Tyr Ile Glu Val Pro Gly Gly Thr Asn Asn Asn Asn Tyr 115 120 125 Ala Asn Val Asp Leu Ile Val Asp Ile Ala Glu Arg Ala Asp Val Asp 130 135 140 Ala Val Trp Ala Gly Trp Gly His Ala Ser Glu Asn Pro Leu Leu Pro 145 150 155 160 Glu Lys Leu Ser Gln Ser Lys Arg Lys Val Ile Phe Ile Gly Pro Pro 165 170 175 Gly Asn Ala Met Arg Ser Leu Gly Asp Lys Ile Ser Ser Thr Ile Val 180 185 190 Ala Gln Ser Ala Lys Val Pro Cys Ile Pro Trp Ser Gly Thr Gly Val 195 200 205 Asp Thr Val His Val Asp Glu Lys Thr Gly Leu Val Ser Val Asp Asp 210 215 220 Asp Ile Tyr Gln Lys Gly Cys Cys Thr Ser Pro Glu Asp Gly Leu Gln 225 230 235 240 Lys Ala Lys Arg Ile Gly Phe Pro Val Met Ile Lys Ala Ser Glu Gly 245 250 255 Gly Gly Gly Lys Gly Ile Arg Gln Val Glu Arg Glu Glu Asp Phe Ile 260 265 270 Ala Leu Tyr His Gln Ala Ala Asn Glu Ile Pro Gly Ser Pro Ile Phe 275 280 285 Ile Met Lys Leu Ala Gly Arg Ala Arg His Leu Glu Val Gln Leu Leu 290 295 300 Ala Asp Gln Tyr Gly Thr Asn Ile Ser Leu Phe Gly Arg Asp Cys Ser 305 310 315 320 Val Gln Arg Arg His Gln Lys Ile Ile Glu Glu Ala Pro Val Thr Ile 325 330 335 Ala Lys Ala Glu Thr Phe His Glu Met Glu Lys Ala Ala Val Arg Leu 340 345 350 Gly Lys Leu Val Gly Tyr Val Ser Ala Gly Thr Val Glu Tyr Leu Tyr 355 360 365 Ser His Asp Asp Gly Lys Phe Tyr Phe Leu Glu Leu Asn Pro Arg Leu 370 375 380 Gln Val Glu His Pro Thr Thr Glu Met Val Ser Gly Val Asn Leu Pro 385 390 395 400 Ala Ala Gln Leu Gln Ile Ala Met Gly Ile Pro Met His Arg Ile Ser 405 410 415 Asp Ile Arg Thr Leu Tyr Gly Met Asn Pro His Ser Ala Ser Glu Ile 420 425 430 Asp Phe Glu Phe Lys Thr Gln Asp Ala Thr Lys Lys Gln Arg Arg Pro 435 440 445 Ile Pro Lys Gly His Cys Thr Ala Cys Arg Ile Thr Ser Glu Asp Pro 450 455 460 Asn Asp Gly Phe Lys Pro Ser Gly Gly Thr Leu His Glu Leu Asn Phe 465 470 475 480 Arg Ser Ser Ser Asn Val Trp Gly Tyr Phe Ser Val Gly Asn Asn Gly 485 490 495 Asn Ile His Ser Phe Ser Asp Ser Gln Phe Gly His Ile Phe Ala Phe 500 505 510 Gly Glu Asn Arg Gln Ala Ser Arg Lys His Met Val Val Ala Leu Lys 515 520 525 Glu Leu Ser Ile Arg Gly Asp Phe Arg Thr Thr Val Glu Tyr Leu Ile 530 535 540 Lys Leu Leu Glu Thr Glu Asp Phe Glu Asp Asn Thr Ile Thr Thr Gly 545 550 555 560 Trp Leu Asp Asp Leu Ile Thr His Lys Met Thr Ala Glu Lys Pro Asp 565 570 575 Pro Thr Leu Ala Val Ile Cys Gly Ala Ala Thr Lys Ala Phe Leu Ala 580 585 590 Ser Glu Glu Ala Arg His Lys Tyr Ile Glu Ser Leu Gln Lys Gly Gln 595 600 605 Val Leu Ser Lys Asp Leu Leu Gln Thr Met Phe Pro Val Asp Phe Ile 610 615 620 His Glu Gly Lys Arg Tyr Lys Phe Thr Val Ala Lys Ser Gly Asn Asp 625 630 635 640 Arg Tyr Thr Leu Phe Ile Asn Gly Ser Lys Cys Asp Ile Ile Leu Arg 645 650 655 Gln Leu Ser Asp Gly Gly Leu Leu Ile Ala Ile Gly Gly Lys Ser His 660 665 670 Thr Ile Tyr Trp Lys Glu Glu Val Ala Ala Thr Arg Leu Ser Val Asp 675 680 685 Ser Met Thr Thr Leu Leu Glu Val Glu Asn Asp Pro Thr Gln Leu Arg 690 695 700 Thr Pro Ser Pro Gly Lys Leu Val Lys Phe Leu Val Glu Asn Gly Glu 705 710 715 720 His Ile Ile Lys Gly Gln Pro Tyr Ala Glu Ile Glu Val Met Lys Met 725 730 735 Gln Met Pro Leu Val Ser Gln Glu Asn Gly Ile Val Gln Leu Leu Lys 740 745 750 Gln Pro Gly Ser Thr Ile Val Ala Gly Asp Ile Met Ala Ile Met Thr 755 760 765 Leu Asp Asp Pro Ser Lys Val Lys His Ala Leu Pro Phe Glu Gly Met 770 775 780 Leu Pro Asp Phe Gly Ser Pro Val Ile Glu Gly Thr Lys Pro Ala Tyr 785 790 795 800 Lys Phe Lys Ser Leu Val Ser Thr Leu Glu Asn Ile Leu Lys Gly Tyr 805 810 815 Asp Asn Gln Val Ile Met Asn Ala Ser Leu Gln Gln Leu Ile Glu Val 820 825 830 Leu Arg Asn Pro Lys Leu Pro Tyr Ser Glu Trp Lys Leu His Ile Ser 835 840 845 Ala Leu His Ser Arg Leu Pro Ala Lys Leu Asp Glu Gln Met Glu Glu 850 855 860 Leu Val Ala Arg Ser Leu Arg Arg Gly Ala Val Phe Pro Ala Arg Gln 865 870 875 880 Leu Ser Lys Leu Ile Asp Met Ala Val Lys Asn Pro Glu Tyr Asn Pro 885 890 895 Asp Lys Leu Leu Gly Ala Val Val Glu Pro Leu Ala Asp Ile Ala His 900 905 910 Lys Tyr Ser Asn Gly Leu Glu Ala His Glu His Ser Ile Phe Val His 915 920 925 Phe Leu Glu Glu Tyr Tyr Glu Val Glu Lys Leu Phe Asn Gly Pro Asn 930 935 940 Val Arg Glu Glu Asn Ile Ile Leu Lys Leu Arg Asp Glu Asn Pro Lys 945 950 955 960 Asp Leu Asp Lys Val Ala Leu Thr Val Leu Ser His Ser Lys Val Ser 965 970 975 Ala Lys Asn Asn Leu Ile Leu Ala Ile Leu Lys His Tyr Gln Pro Leu 980 985 990 Cys Lys Leu Ser Ser Lys Val Ser Ala Ile Phe Ser Thr Pro Leu Gln 995 1000 1005 His Ile Val Glu Leu Glu Ser Lys Ala Thr Ala Lys Val Ala Leu 1010 1015 1020 Gln Ala Arg Glu Ile Leu Ile Gln Gly Ala Leu Pro Ser Val Lys 1025 1030 1035 Glu Arg Thr Glu Gln Ile Glu His Ile Leu Lys Ser Ser Val Val 1040 1045 1050 Lys Val Ala Tyr Gly Ser Ser Asn Pro Lys Arg Ser Glu Pro Asp 1055 1060 1065 Leu Asn Ile Leu Lys Asp Leu Ile Asp Ser Asn Tyr Val Val Phe 1070 1075 1080 Asp Val Leu Leu Gln Phe Leu Thr His Gln Asp Pro Val Val Thr 1085 1090 1095 Ala Ala Ala Ala Gln Val Tyr Ile Arg Arg Ala Tyr Arg Ala Tyr 1100 1105 1110 Thr Ile Gly Asp Ile Arg Val His Glu Gly Val Thr Val Pro Ile 1115 1120 1125 Val Glu Trp Lys Phe Gln Leu Pro Ser Ala Ala Phe Ser Thr Phe 1130 1135 1140 Pro Thr Val Lys Ser Lys Met Gly Met Asn Arg Ala Val Ser Val 1145 1150 1155 Ser Asp Leu Ser Tyr Val Ala Asn Ser Gln Ser Ser Pro Leu Arg 1160 1165 1170 Glu Gly Ile Leu Met Ala Val Asp His Leu Asp Asp Val Asp Glu 1175 1180 1185 Ile Leu Ser Gln Ser Leu Glu Val Ile Pro Arg His Gln Ser Ser 1190 1195 1200 Ser Asn Gly Pro Ala Pro Asp Arg Ser Gly Ser Ser Ala Ser Leu 1205 1210 1215 Ser Asn Val Ala Asn Val Cys Val Ala Ser Thr Glu Gly Phe Glu 1220 1225 1230 Ser Glu Glu Glu Ile Leu Val Arg Leu Arg Glu Ile Leu Asp Leu 1235 1240 1245 Asn Lys Gln Glu Leu Ile Asn Ala Ser Ile Arg Arg Ile Thr Phe 1250 1255 1260 Met Phe Gly Phe Lys Asp Gly Ser Tyr Pro Lys Tyr Tyr Thr Phe 1265 1270 1275 Asn Gly Pro Asn Tyr Asn Glu Asn Glu Thr Ile Arg His Ile Glu 1280 1285 1290 Pro Ala Leu Ala Phe Gln Leu Glu Leu Gly Arg Leu Ser Asn Phe 1295 1300 1305 Asn Ile Lys Pro Ile Phe Thr Asp Asn Arg Asn Ile His Val Tyr 1310 1315 1320 Glu Ala Val Ser Lys Thr Ser Pro Leu Asp Lys Arg Phe Phe Thr 1325 1330 1335 Arg Gly Ile Ile Arg Thr Gly His Ile Arg Asp Asp Ile Ser Ile 1340 1345 1350 Gln Glu Tyr Leu Thr Ser Glu Ala Asn Arg Leu Met Ser Asp Ile 1355 1360 1365 Leu Asp Asn Leu Glu Val Thr Asp Thr Ser Asn Ser Asp Leu Asn 1370 1375 1380 His Ile Phe Ile Asn Phe Ile Ala Val Phe Asp Ile Ser Pro Glu 1385 1390 1395 Asp Val Glu Ala Ala Phe Gly Gly Phe Leu Glu Arg Phe Gly Lys 1400 1405 1410 Arg Leu Leu Arg Leu Arg Val Ser Ser Ala Glu Ile Arg Ile Ile 1415 1420 1425 Ile Lys Asp Pro Gln Thr Gly Ala Pro Val Pro Leu Arg Ala Leu 1430 1435 1440 Ile Asn Asn Val Ser Gly Tyr Val Ile Lys Thr Glu Met Tyr Thr 1445 1450 1455 Glu Val Lys Asn Ala Lys Gly Glu Trp Val Phe Lys Ser Leu Gly 1460 1465 1470 Lys Pro Gly Ser Met His Leu Arg Pro Ile Ala Thr Pro Tyr Pro 1475 1480 1485 Val Lys Glu Trp Leu Gln Pro Lys Arg Tyr Lys Ala His Leu Met 1490 1495 1500 Gly Thr Thr Tyr Val Tyr Asp Phe Pro Glu Leu Phe Arg Gln Ala 1505 1510 1515 Ser Ser Ser Gln Gly Lys Asn Phe Ser Ala Asp Val Lys Leu Thr 1520 1525 1530 Asp Asp Phe Phe Ile Ser Asn Glu Leu Ile Glu Asp Glu Asn Gly 1535 1540 1545 Glu Leu Thr Glu Val Glu Arg Glu Pro Gly Ala Asn Ala Ile Gly 1550 1555 1560 Met Val Ala Phe Lys Ile Thr Val Lys Thr Pro Glu Tyr Pro Arg 1565 1570 1575 Gly Arg Gln Phe Val Val Val Ala Asn Asp Ile Thr Phe Lys Ile 1580 1585 1590 Gly Ser Phe Gly Pro Gln Glu Asp Glu Phe Phe Asn Lys Val Thr 1595 1600 1605 Glu Tyr Ala Arg Lys Arg Gly Ile Pro Arg Ile Tyr Leu Ala Ala 1610 1615 1620 Asn Ser Gly Ala Arg Ile Gly Met Ala Glu Glu Ile Val Pro Leu 1625 1630 1635 Phe Gln Val Ala Trp Asn Asp Ala Ala Asn Pro Asp Lys Gly Phe 1640 1645 1650 Gln Tyr Leu Tyr Leu Thr Ser Glu Gly Met Glu Thr Leu Lys Lys 1655 1660 1665 Phe Asp Lys Glu Asn Ser Val Leu Thr Glu Arg Thr Val Ile Asn 1670 1675 1680 Gly Glu Glu Arg Phe Val Ile Lys Thr Ile Ile Gly Ser Glu Asp 1685 1690 1695 Gly Leu Gly Val Glu Cys Leu Arg Gly Ser Gly Leu Ile Ala Gly 1700 1705 1710 Ala Thr Ser Arg Ala Tyr His Asp Ile Phe Thr Ile Thr Leu Val 1715 1720 1725 Thr Cys Arg Ser Val Gly Ile Gly Ala Tyr Leu Val Arg Leu Gly 1730 1735 1740 Gln Arg Ala Ile Gln Val Glu Gly Gln Pro Ile Ile Trp Tyr Arg 1745 1750 1755 Cys Leu Leu Thr Gly Ala Pro Glu Ser Thr Asn Ala Gly Arg Glu 1760 1765 1770 Val Tyr Thr Ser Asn Leu Gln Leu Gly Gly Thr Gln Ile Met Tyr 1775 1780 1785 Asn Asn Gly Val Ser His Leu Thr Ala Val Asp Asp Leu Ala Gly 1790 1795 1800 Val Glu Lys Ile Val Glu Trp Met Ser Tyr Val Pro Ala Lys Arg 1805 1810 1815 Asn Met Pro Val Pro Ile Leu Glu Thr Lys Asp Thr Trp Asp Arg 1820 1825 1830 Pro Val Asp Phe Thr Pro Thr Asn Asp Glu Thr Tyr Asp Val Arg 1835 1840 1845 Trp Met Ile Glu Gly Arg Glu Thr Glu Ser Gly Phe Glu Tyr Gly 1850 1855 1860 Leu Phe Asp Lys Gly Ser Phe Phe Glu Thr Leu Ser Gly Trp Ala 1865 1870 1875 Lys Gly Val Val Val Gly Arg Ala Arg Leu Gly Gly Ile Pro Leu 1880 1885 1890 Gly Val Ile Gly Val Glu Thr Arg Thr Val Glu Asn Leu Ile Pro 1895 1900 1905 Ala Asp Pro Ala Asn Pro Asn Ser Ala Glu Thr Leu Ile Gln Glu 1910 1915 1920 Pro Gly Gln Val Trp His Pro Asn Ser Ala Phe Lys Thr Ala Gln 1925 1930 1935 Ala Ile Asn Asp Phe Asn Asn Gly Glu Gln Leu Pro Met Met Ile 1940 1945 1950 Leu Ala Asn Trp Arg Gly Phe Ser Gly Gly Gln Arg Asp Met Phe 1955 1960 1965 Asn Glu Val Leu Lys Tyr Gly Ser Phe Ile Val Asp Ala Leu Val 1970 1975 1980 Asp Tyr Lys Gln Pro Ile Ile Ile Tyr Ile Pro Pro Thr Gly Glu 1985 1990 1995 Leu Arg Gly Gly Ser Trp Val Val Val Asp Pro Thr Ile Asn Ala 2000 2005 2010 Asp Gln Met Glu Met Tyr Ala Asp Val Asn Ala Arg Ala Gly Val 2015 2020 2025 Leu Glu Pro Gln Gly Met Val Gly Ile Lys Phe Arg Arg Glu Lys 2030 2035 2040 Leu Leu Asp Thr Met Asn Arg Leu Asp Asp Lys Tyr Arg Glu Leu 2045 2050 2055 Arg Ser Gln Leu Ser Asn Lys Ser Leu Ala Pro Glu Val His Gln 2060 2065 2070 Gln Ile Ser Lys Gln Leu Ala Asp Arg Glu Arg Glu Leu Leu Pro 2075 2080 2085 Ile Tyr Gly Gln Ile Ser Leu Gln Phe Ala Asp Leu His Asp Arg 2090 2095 2100 Ser Ser Arg Met Val Ala Lys Gly Val Ile Ser Lys Glu Leu Glu 2105 2110 2115 Trp Thr Glu Ala Arg Arg Phe Phe Phe Trp Arg Leu Arg Arg Arg 2120 2125 2130 Leu Asn Glu Glu Tyr Leu Ile Lys Arg Leu Ser His Gln Val Gly 2135 2140 2145 Glu Ala Ser Arg Leu Glu Lys Ile Ala Arg Ile Arg Ser Trp Tyr 2150 2155 2160 Pro Ala Ser Val Asp His Glu Asp Asp Arg Gln Val Ala Thr Trp 2165 2170 2175 Ile Glu Glu Asn Tyr Lys Thr Leu Asp Asp Lys Leu Lys Gly Leu 2180 2185 2190 Lys Leu Glu Ser Phe Ala Gln Asp Leu Ala Lys Lys Ile Arg Ser 2195 2200 2205 Asp His Asp Asn Ala Ile Asp Gly Leu Ser Glu Val Ile Lys Met 2210 2215 2220 Leu Ser Thr Asp Asp Lys Glu Lys Leu Leu Lys Thr Leu Lys 2225 2230 2235

Claims

SEQ ID NO: 2의 위치 2에 아미노산 치환을 포함하는 SEQ ID NO: 2의 변이 비오틴 카르복실 운반 단백질(biotin carboxyl carrier protein: BCCP)에 있어서,
상기 변이 BCCP는 SEQ ID NOS: 4, 6, 10, 14, 16, 20, 24, 32, 48, 70으로 구성되는 그룹으로부터 선택되는 폴리펩티드 서열을 포함하는 변이 BCCP.
제 1 항에 있어서,
상기 변이 BCCP의 발현은, 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체 및 불포화 지방산 유도체 중 어느 하나의 지방산 유도체를 포함하는 말로닐-CoA-유래 화합물의 증가된 생성을 재조합 세포에 부여하는 변이 BCCP.
제 2 항에 있어서,
상기 말로닐-CoA-유래 화합물은 FAME인 변이 BCCP.
제 1 항에 있어서,
상기 BCCP는 변이 accB 유전자에 의해 코딩되는 변이 BCCP.
제 4 항에 있어서,
상기 변이 accB 유전자는 SEQ ID NOS: 3, 5, 7, 9, 13, 15, 17, 19, 23, 25, 27, 31, 35, 39, 45, 47, 65, 69, 71 및 81로 구성되는 그룹으로부터 선택되는 핵산 서열을 포함하는 변이 BCCP.
청구항 제 1 항 내지 제 5 항 중 어느 한 항에 따른 변이 BCCP를 포함하는 재조합 미생물로서,
상기 미생물은 원핵생물 또는 원핵세포인, 재조합 미생물.
말로닐-CoA-유래 화합물을 생성하는 방법에 있어서,
탄소원을 포함하는 발효 브로쓰(fermentation broth)에서 제 6 항의 재조합 미생물을 배양하는 단계를 포함하는, 말로닐-CoA-유래 화합물을 생성하는 방법.
제 7 항에 있어서,
상기 재조합 미생물은 BCCP의 발현을 조절하는 변이 오페론을 더 포함하고, 상기 오페론은 야생형 미생물 세포와 비교 시 재조합 미생물 세포에서 BCCP 발현의 변화를 유도(result in)하는, 말로닐-CoA-유래 화합물을 생성하는 방법.
SEQ ID NO: 2의 위치 2에 아미노산 치환을 갖는 SEQ ID NO: 2의 변이 비오틴 카르복실 운반 단백질(BCCP)을 포함하는 재조합 미생물에 있어서,
상기 변이 BCCP의 발현은 상기 재조합 미생물에 말로닐-CoA-유래 화합물의 증가된 생성을 부여하고,
상기 미생물은 원핵생물 또는 원핵세포인, 재조합 미생물.
제 7 항에 있어서,
상기 말로닐-CoA-유래 화합물은 지방산 유도체, 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체 및 불포화 지방산 유도체로 구성되는 그룹으로부터 선택되는, 말로닐-CoA-유래 화합물을 생성하는 방법.
제 10 항에 있어서,
상기 말로닐-CoA-유래 화합물은 FAME인, 말로닐-CoA-유래 화합물을 생성하는 방법.
제 6 항에 있어서,
상기 재조합 미생물은 에스체리치아(Escherichia), 바실러스(Bacillus), 시아노피타(Cyanophyta), 락토바실러스(Lactobacillus), 자이모모나스(Zymomonas), 로도코쿠스(Rhodococcus), 슈도모나스(Pseudomonas), 및 스트렙토마이세스(Streptomyces)로 구성되는 그룹으로부터 선택되는 재조합 미생물.
제 9 항에 있어서,
상기 재조합 미생물은 에스체리치아(Escherichia), 바실러스(Bacillus), 시아노피타(Cyanophyta), 락토바실러스(Lactobacillus), 자이모모나스(Zymomonas), 로도코쿠스(Rhodococcus), 슈도모나스(Pseudomonas), 및 스트렙토마이세스(Streptomyces)로 구성되는 그룹으로부터 선택되는 재조합 미생물.
말로닐-CoA-유래 화합물을 생성하는 방법에 있어서,
탄소원을 포함하는 발효 브로쓰에서 제 9 항의 재조합 미생물을 배양하는 단계를 포함하는, 말로닐-CoA-유래 화합물을 생성하는 방법.
제 14 항에 있어서,
상기 말로닐-CoA-유래 화합물은 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체 및 불포화 지방산 유도체 중 어느 하나의 지방산 유도체를 포함하는, 말로닐-CoA-유래 화합물을 생성하는 방법.
제 15 항에 있어서,
상기 말로닐-CoA-유래 화합물은 FAME인, 말로닐-CoA-유래 화합물을 생성하는 방법.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제