KR20240049856A

KR20240049856A - 오메가-수산화 지방산 유도체를 생성하는 방법들

Info

Publication number: KR20240049856A
Application number: KR1020247011911A
Authority: KR
Inventors: 안드레아스 더블유. 셔머; 하이보 왕; 스티븐 비. 델 카다이레; 지하오 흐; 루이스 지. 홈; 바오롱 주; 신디 창; 엠마누엘라 이. 포포바
Original assignee: 게노마티카 인코포레이티드
Priority date: 2013-06-14
Filing date: 2014-06-16
Publication date: 2024-04-17
Also published as: WO2014201474A1; EP3745133A1; JP2020022473A; KR102256678B1; SI2984490T1; BR122020002919B1; JP2021176340A; US20160130616A1; BR112015031233A2; JP7168539B2; JP7406529B2; KR20220053681A; US10711288B2; CN105378486A; AU2020294235B2; AU2014277874A1; EP2984490A1; JP7004500B2; KR20210060678A; CA2915229A1

Abstract

본 발명은 오메가-수산화 지방산 유도체들 및 이들을 생성하는 방법들에 관한 것이다. 본 명세서에서, 본 발명은 높은 순도 및 수율로 오메가-수산화 지방산 유도체들을 제공하는 신규하고 환경 친화적인 생성 방법을 포함한다. 또한, 선택 발효를 통해 오메가-수산화 지방산 유도체들을 생성하는 재조합 미생물들이 포함된다.

Description

오메가-수산화 지방산 유도체를 생성하는 방법들{METHODS OF PRODUCING OMEGA-HYDROXYLATED FATTY ACID DERIVATIVES}

본 출원은 2013년 6월 14일에 출원된 미국 가출원 61/835,464의 이익을 주장하며, 이의 전체 내용이 본 명세서에서 인용 참조된다.

본 출원은 ASCII 포맷으로 전자 제출된 서열 목록을 포함하며, 본 명세서에서 전문이 인용 참조된다. 2014년 6월 14일에 작성된 상기의 ASCII의 복사본은 파일명을 LS00048PCT_SL.txt라고 하였고, 크기는 342,103 바이트이다.

오메가-수산화(ω-하이드록시) 지방산 유도체들은 산업용 약품(industrial agent)의 성분들으로서 다수의 상업적인 용도를 갖는다. 해당 산업분야에는, ω-하이드록시 지방산들; ω-하이드록시 지방산 메틸 에스테르들; ω-옥소 지방산들; ω-아미노 지방산들; ω-아미노 지방산 메틸 에스테르들; 알파-, 오메가-이산들(diacids)(α,ω-이산들); 오메가-카르복시 지방산 메틸 에스테르들(ω-카르복시 지방산 메틸 에스테르); 알파-, 오메가-디에스테르들(α,ω-디에스테르들); 알파-, 오메가-디올들(α,ω-디올들) 등을 포함하는 다양한 타입의 ω-하이드록시 지방산 유도체들이 알려져 있다. 또한, 이러한 분자들은 다양한 다른 화합물들에 대한 전구체들로서 중요하다. 예를 들어, α,ω-디카르복실산들 및 다른 α,ω-이작용성 분자(bifunctional molecule)들은 중합체 수지, 금속 가공 유체, 접착제, 부식 억제제, 커패시터 전해질, 디에스테르 합성 윤활제, 섬유, 분체 도료 경화제(powder coating curatives), 가소제, 폴리에스테르 도료, 에폭시 수지, 폴리아미드 수지, 향미제(flavors),향료(fragrances), 계면활성제, 세제, 첨가제 등의 산업적 적용들을 갖는 중요한 화학제들이다. 요즘에도, ω-하이드록시 지방산 유도체들은 여전히 석유계 재료들로 만들어지거나 파라핀과 지방산들의 생물전환(bioconversion)을 통해 만들어진다. 이러한 화합물들을 생성하는 화학적인 방법들은 유해 시약들의 사용을 필요로 하며, 에너지 집중적(energy intensive)이고, 환경 고비용적(environmentally costly)이다. 반대로, 그린 프로세스(green processe)들을 고려하면서 발현 경로(fermentation route)들을 밝혀내는 것은 여전히 너무 비용이 많이 들며, 만들어질 수 있는 생성물들의 타입들이 제한된다.

따라서, 재생가능한 공급원료(renewable feedstock)들로부터 다양한 타입들 및 기능들의 ω-하이드록시 지방산 유도체들의 직접적인 생성을 위한 공정이 환경에 대해 더 안전할 뿐만 아니라 또한 더 비용 효과적일 것이다. 본 발명은 이러한 필요성을 해결한다.

본 발명의 일 실시형태는, 재생가능한 공급원료로부터 탄소원의 존재 시 발효액(fermentation broth)에서 성장될 때 생체 내에서(in vivo) 오메가-수산화(ω-하이드록시) 지방산 유도체를 생성하는 재조합 미생물을 제공한다. 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제(thioesterase); 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제(ester synthase); 및 EC 1.14.15.3의 변형된(modified) ω-하이드록실라아제(hydroxylase)를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된(engineered) 경로를 포함한다. 변형된 ω-하이드록실라아제는 변형된 시토크롬 P450 모노옥시게나아제(monooxygenase) (P450) 효소 활성을 가지며, 생체 내에서 탄화수소 사슬들의 ω-위치를 효율적으로 촉매화한다(catalyze). 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체(hybrid fusion protein variant)이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제(reductase) 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적(self-sufficient) CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성(sequence identity)을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다. 본 명세서에서, ω-하이드록실라아제 혼성 융합 단백질 변이체는 아미노산 27, 82, 141, 178, 231, 309, 407, 415, 516, 666 및/또는 796 위치에서 적어도 하나의 돌연변이를 갖는다. 재조합 미생물은 ω-하이드록시 지방산들 및 ω-하이드록시 지방산 메틸 에스테르들을 포함하는 ω-하이드록시 지방산 유도체들을 생성한다(단, 이로 제한되지 않음).

본 발명의 또 다른 실시형태는, 재생가능한 공급원료로부터의 탄소원의 존재 시 발효액에서 성장될 때 생체 내에서 ω-하이드록시 지방산 유도체를 생성하는 재조합 미생물을 제공한다. 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 포함한다. 변형된 ω-하이드록실라아제는 변형된 시토크롬 P450 모노옥시게나아제 (P450) 효소 활성을 가지며, 생체 내에서 탄화수소 사슬들의 ω-위치를 효율적으로 촉매화한다. 일 실시형태에서, 재조합 미생물은 EC 1.1.1.1/2의 알코올 디하이드로게나아제 또는 EC 1.1.3.13 또는 EC 1.1.3.20의 알코올 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다. 재조합 미생물은 ω-옥소 지방산들 및 ω-옥소 지방산 메틸 에스테르들을 포함하는 ω-하이드록시 지방산 유도체들을 생성한다(단, 이로 제한되지 않음).

본 발명의 또 다른 실시형태는, 재생가능한 공급원료로부터의 탄소원의 존재 시 발효액에서 성장될 때 생체 내에서 ω-하이드록시 지방산 유도체를 생성하는 재조합 미생물을 제공한다. 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제(시토크롬 P450 모노옥시게나아제)를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 포함한다. 또한, 일 실시형태에서, 재조합 미생물은 EC 1.1.1.1/2의 알코올 디하이드로게나아제 또는 EC 1.1.3.13 또는 EC 1.1.3.20의 알코올 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 또 다른 실시형태에서, 재조합 미생물은 EC 1.2.1.3/4/5의 알데히드 디하이드로게나아제 또는 EC 1.2.3.1의 알데히드 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 변형된 ω-하이드록실라아제는 변형된 시토크롬 P450 모노옥시게나아제 (P450) 효소 활성을 가지며, 생체 내에서 탄화수소 사슬들의 ω-위치를 효율적으로 촉매화한다. 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다. 재조합 미생물은 α,ω-이산들 또는 ω-카르복시 지방산 메틸 에스테르들인 ω-하이드록시 지방산 유도체들을 포함하는 ω-하이드록시 지방산 유도체들을 생성한다(단, 이로 제한되지 않음).

또한, 본 발명의 또 다른 실시형태는, 재생가능한 공급원료로부터의 탄소원의 존재 시 발효액에서 성장될 때 생체 내에서 ω-하이드록시 지방산 유도체를 생성하는 재조합 미생물을 제공한다. 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 포함한다. 일 실시형태에서, 재조합 미생물은 EC 1.1.1.1/2의 알코올 디하이드로게나아제 또는 EC 1.1.3.13 또는 EC 1.1.3.20의 알코올 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 또한, 또 다른 실시형태에서, 재조합 미생물은 EC 1.2.1.3/4/5의 알데히드 디하이드로게나아제 또는 EC 1.2.3.1의 알데히드 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 또 다른 실시형태에서, 재조합 미생물은 EC 6.2.1.3의 아실-CoA 리가아제(ligase) 또는 EC 2.8.3.6의 아실-CoA 트랜스퍼라아제(transferase)를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 변형된 ω-하이드록실라아제는 변형된 시토크롬 P450 모노옥시게나아제 (P450) 효소 활성을 가지며, 생체 내에서 탄화수소 사슬들의 ω-위치를 효율적으로 촉매화한다. 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다. 재조합 미생물은 α,ω-디에스테르들인 ω-하이드록시 지방산 유도체들을 포함하는 ω-하이드록시 지방산 유도체들을 생성한다(단, 이로 제한되지 않음).

또한, 본 발명은, 재생가능한 공급원료로부터의 탄소원의 존재 시 발효액에서 성장될 때 생체 내에서 ω-하이드록시 지방산 유도체를 생성하는 재조합 미생물을 포함한다. 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 포함한다. 일 실시형태에서, 재조합 미생물은 EC 1.1.1.1/2의 알코올 디하이드로게나아제 또는 EC 1.1.3.13 또는 EC 1.1.3.20의 알코올 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 또 다른 실시형태에서, 재조합 미생물은 EC 2.6.1의 아미노 트랜스퍼라아제 또는 EC 1.4.9, EC 1.4.98 또는 EC 1.4.99의 아민 디하이드로게나아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. ω-하이드록실라아제는 변형된 시토크롬 P450 모노옥시게나아제 (P450) 효소 활성을 가지며, 생체 내에서 탄화수소 사슬들의 ω-위치를 효율적으로 촉매화한다. 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다. 재조합 미생물은 ω-아미노 지방산들 및 ω-아미노 지방산 메틸 에스테르들을 포함하는 ω-하이드록시 지방산 유도체들을 생성한다(단, 이로 제한되지 않음).

본 발명의 또 다른 실시형태는, 재생가능한 공급원료로부터의 탄소원의 존재 시 발효액에서 성장될 때 생체 내에서 ω-하이드록시 지방산 유도체를 생성하는 재조합 미생물을 제공한다. 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 포함한다. 일 실시형태에서, 재조합 미생물은 EC 1.1.-.-의 알코올 디하이드로게나아제 및 1.2.99의 카르복실산 리덕타아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. ω-하이드록실라아제는 변형된 시토크롬 P450 모노옥시게나아제 (P450) 효소 활성을 가지며, 생체 내에서 탄화수소 사슬들의 ω-위치를 효율적으로 촉매화한다. 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다. 재조합 미생물은 α,ω-디올들인 ω-하이드록시 지방산 유도체들을 포함하는 ω-하이드록시 지방산 유도체들을 생성한다(단, 이로 제한되지 않음).

또한, 본 발명은 미생물(위 참조)을 포함하는 세포 배양물(cell culture)을 고려하며, 세포 배양물은 ω-하이드록시 유리 지방산들; ω-하이드록시 지방산 메틸 에스테르들; ω-옥소 지방산들; ω-옥소 지방산 메틸 에스테르들; α,ω-이산들; α,ω-디올들; α,ω-디에스테르들; ω-카르복시 지방산 메틸 에스테르들; ω-아미노 지방산들; 및 ω-아미노 지방산 메틸 에스테르들을 포함하는 ω-하이드록시 지방산들을 포함하는 ω-하이드록시 지방산 유도체들을 생성한다(단, 이로 제한되지 않음).

본 발명의 또 다른 실시형태는 발효액에 재조합 미생물을 제공하는 단계를 포함하는 ω-하이드록시 지방산 유도체를 생성하는 방법을 제공하며, 상기 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 갖는다. 또한, 상기 방법은 탄소원을 함유한 재생가능한 공급원료를 발효액에 첨가하는 단계, 및 발효액으로부터 ω-하이드록시 지방산 유도체를 분리시키는(isolating) 단계를 포함한다. 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다. 일 실시형태에서, 생성된 ω-하이드록시 지방산 유도체는 ω-하이드록시 유리 지방산 또는 ω-하이드록시 지방산 메틸 에스테르이다.

본 발명의 또 다른 실시형태는 발효액에 재조합 미생물을 제공하는 단계를 포함하는 ω-하이드록시 지방산 유도체를 생성하는 방법을 제공하며, 상기 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및 EC 1.14.15.3의 ω-하이드록실라아제(시토크롬 P450 모노옥시게나아제)를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 갖는다. 특정한 일 실시형태에서, 재조합 미생물은 EC 1.1.1.1/2의 알코올 디하이드로게나아제 또는 EC 1.1.3.13 또는 EC 1.1.3.20의 알코올 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 또한, 상기 방법은 탄소원을 함유한 재생가능한 공급원료를 발효액에 첨가하는 단계, 및 발효액으로부터 ω-하이드록시 지방산 유도체를 분리시키는 단계를 포함한다. 일 실시형태에서, 생성된 ω-하이드록시 지방산 유도체는 ω-옥소 지방산 또는 ω-옥소 지방산 메틸 에스테르이다.

본 발명의 또 다른 실시형태는 발효액에 재조합 미생물을 제공하는 단계를 포함하는 ω-하이드록시 지방산 유도체를 생성하는 방법을 제공하며, 상기 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 갖는다. 특정한 일 실시형태에서, 재조합 미생물은 EC 1.1.1.1/2의 알코올 디하이드로게나아제 또는 EC 1.1.3.13 또는 EC 1.1.3.20의 알코올 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 특정한 또 다른 실시형태에서, 재조합 미생물은 EC 1.2.1.3/4/5의 알데히드 디하이드로게나아제 또는 EC 1.2.3.1의 알데히드 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 또한, 상기 방법은 탄소원을 함유한 재생가능한 공급원료를 발효액에 첨가하는 단계, 및 발효액으로부터 ω-하이드록시 지방산 유도체를 분리시키는 단계를 포함한다. 일 실시형태에서, 생성된 ω-하이드록시 지방산 유도체는 α,ω-이산 또는 α,ω-지방산 디메틸 에스테르이다. 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다.

본 발명의 또 다른 실시형태는 발효액에 재조합 미생물을 제공하는 단계를 포함하는 ω-하이드록시 지방산 유도체를 생성하는 방법을 제공하며, 상기 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 갖는다. 특정한 일 실시형태에서, 재조합 미생물은 EC 1.1.1.1/2의 알코올 디하이드로게나아제 또는 EC 1.1.3.13 또는 EC 1.1.3.20의 알코올 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 특정한 또 다른 실시형태에서, 재조합 미생물은 EC 2.6.1의 아미노 트랜스퍼라아제 또는 EC 1.4.9, EC 1.4.98 또는 EC 1.4.99의 아민 디하이드로게나아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 또한, 상기 방법은 탄소원을 함유한 재생가능한 공급원료를 발효액에 첨가하는 단계, 및 발효액으로부터 ω-하이드록시 지방산 유도체를 분리시키는 단계를 포함한다. 일 실시형태에서, 생성된 ω-하이드록시 지방산 유도체는 ω-아미노 지방산 또는 ω-아미노 지방산 메틸 에스테르이다. 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다.

또한, 본 발명은 발효액에 재조합 미생물을 제공하는 단계를 포함하는 ω-하이드록시 지방산 유도체를 생성하는 방법을 고려하며, 상기 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 갖는다. 특정한 일 실시형태에서, 재조합 미생물은 EC 1.2.99.6의 카르복실산 리덕타아제 및 EC 1.1.-.-의 알코올 디하이드로게나아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 또한, 상기 방법은 탄소원을 함유한 재생가능한 공급원료를 발효액에 첨가하는 단계, 및 발효액으로부터 ω-하이드록시 지방산 유도체를 분리시키는 단계를 포함한다. 일 실시형태에서, 생성된 ω-하이드록시 지방산 유도체는 α,ω-디올이다. 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다.

본 발명의 또 다른 실시형태는 일 방법(위 참조)을 제공하며, 재생가능한 공급원료는 옥수수, 사탕수수, 수수, 사탕무, 스위치그래스(switchgrass), 목초, 짚, 목재, 펄프, 오수, 쓰레기, 셀룰로오스 도시 폐기물, 플루-가스(flu-gas), 합성-가스, 이산화탄소를 포함하는 탄소계이다(단, 이로 제한되지 않음). 일 실시형태에서, 탄소원은 글루코오스, 프럭토오스, 만노오스, 갈락토오스, 자일로오스, 아라비노오스, 프럭토-올리고당, 갈락토-올리고당, 녹말, 셀룰로오스, 펙틴, 자일란, 수크로오스, 말토오스, 셀로비오스, 투라노오스(turanose), 헤미셀룰로오스(hemicellulose), 메틸 셀룰로오스, 소듐 카르복시메틸 셀룰로오스, 숙시네이트, 락테이트, 아세테이트, 에탄올, 메탄올, 글리세롤 및 이의 혼합물들로부터 선택된다.

또한, 본 발명은 본 명세서에 개시된 방법들(위 참조)에 의해 생성되는 중합체 조성물을 고려하며, 중합체 조성물은 폴리우레탄, 폴리에스테르 폴리올, 폴리에스테르 수지, 알킬 코팅 수지, 유리섬유 수지, 겔 코팅 수지 및 폴리에스테르 열가소성 수지를 포함한다(단, 이로 제한되지 않음).

본 발명의 또 다른 실시형태는, 재생가능한 공급원료로부터의 탄소원의 존재 시 발효액에서 성장될 때 생체 내에서 ω-하이드록시 지방산 유도체를 생성하는 재조합 미생물을 제공하며, 상기 미생물은 EC 1.2.1.42의 아실-ACP 리덕타아제, EC 1.1.-.-의 알코올 디하이드로게나아제 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 3 개의 핵산 서열들을 발현시키도록 조작된 경로를 포함한다. ω-하이드록실라아제는 변형된 시토크롬 P450 모노옥시게나아제 (P450) 효소 활성을 가지며, 생체 내에서 탄화수소 사슬들의 ω-위치를 효율적으로 촉매화한다. 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다. 생성된 ω-하이드록시 지방산 유도체는 α,ω-디올이다. 또한, 일 실시형태에서는, 본 명세서에 개시된 미생물들(위 참조)을 포함하는 세포 배양물이 제공된다.

또한, 본 발명의 또 다른 실시형태는, 발효액에 재조합 미생물을 제공하는 단계를 포함하는 ω-하이드록시 지방산 유도체를 생성하는 방법을 제공하며, 상기 미생물은 EC 1.2.1.42의 아실-ACP 리덕타아제, EC 1.1.-.-의 알코올 디하이드로게나아제 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 3 개의 핵산 서열들을 발현시키도록 조작된 경로를 갖는다. 또한, 상기 방법은 탄소원을 함유한 재생가능한 공급원료를 발효액에 첨가하는 단계, 및 발효액으로부터 ω-하이드록시 지방산 유도체를 분리시키는 단계를 포함한다. 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다. 여기서, ω-하이드록시 지방산 유도체는 α,ω-디올이다. 일 실시형태에서, 재생가능한 공급원료는 탄소계이며, 옥수수, 사탕수수, 수수, 사탕무, 스위치그래스, 목초, 짚, 목재, 펄프, 오수, 쓰레기, 셀룰로오스 도시 폐기물, 플루-가스, 합성-가스, 이산화탄소를 포함한다. 또 다른 실시형태에서, 탄소원은 글루코오스, 프럭토오스, 만노오스, 갈락토오스, 자일로오스, 아라비노오스, 프럭토-올리고당, 갈락토-올리고당, 녹말, 셀룰로오스, 펙틴, 자일란, 수크로오스, 말토오스, 셀로비오스, 투라노오스(turanose), 헤미셀룰로오스(hemicellulose), 메틸 셀룰로오스, 소듐 카르복시메틸 셀룰로오스, 숙시네이트, 락테이트, 아세테이트, 에탄올, 메탄올, 글리세롤 및 이의 혼합물들로부터 선택된다. 또한, 상기 방법에 의해 생성되는 중합체 조성물이 포함되며, 중합체 조성물은 폴리우레탄, 폴리에스테르 폴리올, 폴리에스테르 수지, 알킬 코팅 수지, 유리섬유 수지, 겔 코팅 수지 및 폴리에스테르 열가소성 수지를 포함한다(단, 이로 제한되지 않음).

또한, 본 발명은 본 명세서에 설명된 방법들(위 참조)에 의해 생성되는 향료 화학 조성물(fragrance chemical composition)을 고려하며, 향료 화학 조성물은 C9 내지 C16 포화 또는 불포화 매크로라이드(macrolide)이다. 향료 화학 조성물은 암브레톨리드(ambrettolide), 디하이드로 암브레톨리드, 15-하이드록시 펜타데칸산(pentadecanoic acid)의 매크로락톤(macrolactone), 및 15-하이드록시 펜타데센산(pentadecenoic acid)의 매크로락톤 등으로부터 선택된 화학적 개체들(chemical entities)을 포함한다.

본 발명은 바람직한 구현예들을 예시하는데 도움을 주는 첨부한 도면들과 연계하여 읽을 때 가장 잘 이해될 것이다. 하지만, 본 발명은 도면들에 개시된 특정 구현예들로 제한되지 않음을 이해할 것이다.
도 1은 ω-하이드록시-카르복실산, ω-옥소-카르복실산, ω-아미노-카르복실산 및 α,ω-이산을 만드는 경로들을 도시한 도면이다. 일 예시로서, 12 개의 탄소 원자들을 갖는 지방산 유도체가 도시되어 있다.
도 2a는 메틸 에스테르 중간체를 통해 ω-하이드록시-카르복실산, ω-아미노-카르복실산 및 α,ω-이산을 만드는 경로들을 도시한 도면이다. 일 예시로서, 12 개의 탄소 원자들을 갖는 지방산 유도체가 도시되어 있다.
도 2b는 디메틸 에스테르 중간체를 통해 α,ω-이산을 만드는 경로를 도시한 도면이다. 일 예시로서, 12 개의 탄소 원자들을 갖는 지방산 유도체가 도시되어 있다.
도 3은 티오에스테라아제 및 카르복실산 리덕타아제를 이용하여 α,ω-디올을 만드는 경로를 도시한 도면이다. 일 예시로서, 12 개의 탄소 원자들을 갖는 지방산 유도체가 도시되어 있다.
도 4는 아실-ACP 리덕타아제를 이용하여 α,ω-디올을 만드는 경로를 도시한 도면이다. 일 예시로서, 12 개의 탄소 원자들을 갖는 지방산 유도체가 도시되어 있다.
도 5는 ω-아미노 카르복실산을 락탐으로 전환시키는 경로를 예시한다. 일 예시로서, 12 개의 탄소 원자들을 갖는 지방산 유도체가 도시되어 있다.
도 6은 도데칸산을 제공했을 때 12-하이드록시 도데칸산 형성을 유도하는 cypl53A 오페론을 발현시키는 재조합 대장균 균주로부터의 추출물의 GC/MS 크로마토그래프를 나타낸다. 또한, 대조 균주(MG1655 ΔfadD)로부터의 추출물의 GC/MS 크로마토그래프가 도시된다.
도 7a 내지 도 7c는 유도된 12-하이드록시 도데칸산(12.297 분에서 피크: 도 7a), 유도된 12-하이드록시 도데칸산 진정적 표준(authentic standard: 도 7b), 및 비-유도된 12-하이드록시 도데칸산(11.393 분에서 피크: 도 7c)의 질량 스펙트럼을 예시한다. 유도제(derivatizing agent)는 BSTFA+1%TMCS이었다. 도 7a 및 도 7c의 질량 스펙트럼은 대장균 균주 sAS.321의 추출물로부터 얻어졌다.
도 8a 및 도 8b는 유도된 12-하이드록시도데칸산(12-트리메틸실릴옥시도데칸산 트리메틸실릴 에스테르: 도 8a) 및 비-유도된 12-하이드록시도데칸산(도 8b)의 이온 단편화 패턴(ion fragmentation pattern)을 예시한다.
도 9는 도데칸산이 공급되었을 때 12-하이드록시 도데칸산 형성을 야기하는 CYP153A 오페론들을 발현시키는 재조합 대장균 균주들로부터의 추출물들의 GC/MS 크로마토그래프를 나타낸다. 균주 sAS.335가 개선된 CYP153A 오페론을 발현시킨다.
도 10a 내지 도 10c는 도데칸산으로부터 12-하이드록시 도데칸산(도 10a), 도데칸산 메틸 에스테르로부터 12-하이드록시 도데칸산 메틸 에스테르(도 10b) 및 도데칸올로부터 1,12-도데칸디올(도 10c)의 형성을 야기하는 CYP153A-RedRhF 융합 단백질들을 발현시키는 대장균 균주로부터의 추출물의 GC/MS 크로마토그래프를 나타낸다. 또한, 대조 균주 MG1655 ΔfadD 의 추출물이 도시된다.
도 11a 및 도 11b는 균주 sAS.336의 추출물로부터 유도된 1,12-도데칸디올(11.948 분에서 피크: 도 11a) 및 진정적 유도된 1,12-도데칸디올 표준(도 11b)의 질량 스펙트럼을 도시한다. 유도제는 BSTFA+1%TMCS이었다.
도 12a 및 도 12b는 균주 sAS.336의 추출물로부터의 12-하이드록시 도데칸산 메틸 에스테르의 질량 스펙트럼을 도시한다. 비-유도된(11.662 분에서 피크: 도 12a) 및 유도된(11.107 분에서 피크: 도 12b) 샘플들이 도시된다. 유도제는 BSTFA+1%TMCS이었다.
도 13a 및 도 13b는 유도화(derivatization)를 갖지 않는 1,12-도데칸디올(도 13a) 및 12-하이드록시도데칸산 메틸 에스테르(도 13b)의 이온 단편화 패턴을 예시한다.
도 14a 내지 도 14c는 ω-OH 지방산(도 14a), ω-OH 지방산 메틸 에스테르(도 14b) 또는 글루코오스로부터 α,ω-디올(도 14c)을 생성하는 CYP153A-RedRhF 융합 단백질들을 발현시키는 재조합 대장균 균주들로부터의 추출물들의 GC/MS 크로마토그래프를 나타낸다. 모든 샘플들은 BSTFA+1%TMCS로 유도되었다.
도 15는 ω-하이드록시 지방산이 생성 세포들로부터 효율적으로 분비(secret)되었음을 입증한다.
도 16은 글루코오스 상에서 성장되었을 때 2 개의 대장균 균주들로부터 생성된 ω-하이드록시 지방산들의 조성을 나타낸다.
도 17은 CYP153A-RedRhF 융합 단백질, 알코올 옥시다아제 및 α,ω-이산을 생성하는 알데히드 디하이드로게나아제를 발현시키는 재조합 대장균 균주들로부터의 추출물의 GC/MS 크로마토그래프를 나타낸다. 모든 샘플들은 BSTFA+1%TMCS로 유도되었다.
도 18a 및 도 18b는 균주 sEP.690의 추출물로부터의 유도된 1,14-테트라데칸디오익산(tetradecanedioic acid)(13.367 분에서 피크: 도 18a) 및 진정적 유도된 1,14-테트라데칸디오익산 표준(도 18b)의 질량 스펙트럼을 도시한다. 유도제는 BSTFA+1%TMCS이었다.
도 19a는 유도된 1,14-테트라데칸디오익산의 이온 단편화 패턴을 예시한다. 유도제는 BSTFA+1%TMCS이었다.
도 20은 소량의 아말단(subterminally) (예를 들어, ω-1, ω-2 및/또는 ω-3) 수산화 지방산들을 생성하는 cyp102A1(F87A)을 발현시키는 재조합 대장균 균주로부터의 추출물의 GC/MS 크로마토그래프를 나타낸다. 또한, 대조 균주 AlcV334의 추출물의 GC/MS 크로마토그래프가 도시된다. 샘플들은 BSTFA+1%TMCS로 유도되었다.
도 21a 내지 도 21e는 11-하이드록시 도데칸산(도 21a), 10-하이드록시 도데칸산(도 21b), 9-하이드록시 도데칸산(도 21c), 8-하이드록시 도데칸산(도 21d), 7-하이드록시 도데칸산(도 21e)으로서 식별된 (도 20으로부터의) RT 7.195에서 7.510까지의 피크들의 질량 스펙트럼을 도시한다. 진단적 이온 단편들이 각각의 수산화 위치에 대해 설명된다. 샘플들은 BSTFA+1%TMCS로 유도되었다.
도 22a 및 도 22b는 ω-1, ω-2 및 ω-3 하이드록시 지방산들(도 22a), 또는 글루코오스로부터 ω-1, ω-2 및 ω-3 하이드록시 지방족 알코올들(도 22b)을 생성하는 cyp102A7- 단백질들을 발현시키는 재조합 대장균 균주들로부터의 추출물들의 GC/MS 크로마토그래프를 나타낸다. 모든 샘플들은 BSTFA+1%TMCS로 유도되었다.
도 23a 내지 도 23c는 유도된 9-하이드록시 도데칸올(9.653 분에서 피크: 도 23a), 유도된 10-하이드록시 도데칸올(9.808 분에서 피크: 도 23b), 및 유도된 11-하이드록시 도데칸올(9.905 분에서 피크: 도 23c)의 질량 스펙트럼 및 이온 단편화 패턴들을 예시한다. 유도제는 BSTFA+1%TMCS이었다. 샘플들은 대장균 균주 XL963의 추출물들로부터 얻어졌다.
도 24a 및 도 24b는 아말단(예를 들어, ω-1, ω-2 및/또는 ω-3) 수산화 지방산들(도 24a), 및 cyp102A7을 발현시키는 재조합 대장균 균주들에 의해 글루코오스로부터 생성된 아말단 수산화 지방족 알코올들(도 24b)의 양을 나타낸다.
도 25는 대장균 균주 stEP.798에 의해 생성된 ω-수산화 지방산들을 나타낸다.
도 26은 대장균 L1017에 의해 생성된 α,ω-이산을 나타낸다.
도 27은 CYP153A-리덕타아제 혼성 융합 단백질 변이체들을 발현시키는 미생물들을 배양시킨 결과치들이다. 나타낸 바와 같이, V141T(SEQ ID: 46)를 갖는 변이체들이 가장 높은 ω-하이드록시 헥사데센산 역가(hexadecenoic acid titer) 및 헥사데센산으로부터의 가장 높은 전환을 생성하였다.

개관(General Overview)

ω-하이드록시 지방산 유도체들을 생성하는 새롭고 환경-친화적인 방법의 개발은 해당 산업 분야에 상당한 개선을 나타낸다. 상기 방법은 이러한 화합물들이 재생가능한 공급원료로부터 유도되는 단순한 탄소원으로부터 효율적으로 생성되게 한다. 특히, 상기 방법은 옥수수, 사탕수수 또는 목질계 바이오매스(lignocellulosic biomass)로부터의 탄수화물; 또는 글리세롤, 플루-가스, 합성-가스와 같은 노폐물(waste products); 또는 바이오매스 또는 천연 가스 또는 이산화탄소와 같은 유기 재료의 재형성물(reformation)과 같은 재생가능한 재료들로부터 ω-하이드록시 지방산 유도체들의 생성을 제공한다.

더 구체적으로, 본 발명은 탄수화물과 같은 재생가능한 공급원료들을, ω-하이드록시 지방산들; ω-하이드록시-지방산 메틸 에스테르들; ω-카르복시-지방산 메틸 에스테르들; ω-옥소 지방산들; ω-아미노 지방산들; ω-아미노 지방산 메틸 에스테르들, α,ω-이산들; α,ω-디에스테르들; α,ω-디올들 등을 포함하는 특정 ω-하이드록시 지방산 유도체들로 전환시키도록 조작된 신규한 재조합 미생물들을 제공한다. 이와 같이, 이작용성 분자들은 ω-하이드록시 지방산들; α,ω-하이드록시 지방족 알코올들; α,ω-하이드록시-지방산 메틸 에스테르들; α,ω-하이드록시 아민들; α,ω-이산들; α,ω-이-지방산(di-fatty acid) 메틸 에스테르들, α,ω-디올들 등을 포함한다(단, 이로 제한되지 않음). 재조합 미생물들은 이러한 화합물들의 생성을 위해 비용-효율적인 발효 공정들을 허용한다. 본 발명은 미생물 지방산 대사 및 이의 중간체들의 특정 화학물질들로의 전환을 포함한다.

본 발명의 장점들은 매우 많다. 본 발명은 더 단순한, 즉 다수의 화학적 및/또는 생체촉매적 공정들이기보다는 단순한 발효 과정을 이용하는 생성 방법을 제공하며, 이는 노폐물이 거의 생성되지 않기 때문에, 더 빠르고, 비용이 덜 들며, 더 환경-친화적이다. 원료 재료(source material)들로서 재생가능한 공급원료[지속가능한 원 재료(raw material)] 및/또는 산업 폐기물(예를 들어, 글리세롤)의 사용은 또 하나의 비용 이점을 추가하고, 환경을 보호한다. 본 발명은 특정 타겟 생성물들, 즉 선택적 사슬 길이 및 화학적 성질(chemistry)을 갖는 화학적 개체들을 포함하는 조성물들의 선택적인 제조를 제공한다. 다양한 화학적 기능들에 대한 접근은 새로운 타겟 시장 적용을 허용한다.

정의

본 명세서에서 사용되는 바와 같이, "오메가-수산화 지방산 유도체" 및 "ω-수산화 지방산 유도체" 및 "ω-하이드록시 지방산 유도체" 및 "ω-하이드록실 지방산 유도체" 및 "ω-OH 지방산 유도체"라는 용어들은 본 명세서에서 교환가능하게 사용되며, 지방산 대사로부터 발생되고, 오메가 위치에서 적어도 하나의 OH 기를 갖거나, 오메가 위치에서 적어도 하나의 OH 기를 갖는 중간체로부터 유도된 화학적 개체를 지칭한다. 본 명세서에서, "오메가 위치"는 그 1차 작용기에 대해 반대쪽 단부에 있는 지방산 유도체의 말단 탄소 원자를 지칭한다. 이러한 ω-하이드록시 지방산 유도체들은, ω-하이드록시 지방산들; ω-하이드록시-지방산 메틸 에스테르들; ω-카르복시-지방산 메틸 에스테르들; ω-옥소 지방산들; ω-아미노 지방산들; ω-아미노 지방산 메틸 에스테르들; 그리고 α,ω-이산들; α,ω-디에스테르들; 및 α,ω-디올들을 포함한다(단, 이로 제한되지 않음). "ω-하이드록시 지방산 유도체"라는 용어는 "α,ω-이작용성 지방산 유도체들"을 포함한다.

본 명세서에 언급된 바와 같은 "ω-하이드록시 지방산 유도체 조성물"은 재조합 숙주 세포에 의해 생성되며, 통상적으로 다양한 사슬 길이 및/또는 포화도 및/또는 분지 특성을 갖는 특정 타입의 ω-하이드록시 지방산 유도체들의 혼합물(예를 들어, 다양한 사슬 길이 및/또는 포화도 및/또는 분지 특성의 α,ω-이산들; 또는 다양한 사슬 길이 및/또는 포화도 및/또는 분지 특성의 α,ω-디에스테르들; 또는 다양한 사슬 길이 및/또는 포화도 및/또는 분지 특성의 α,ω-디올들 등)을 포함한다. 몇몇 경우, ω-하이드록시 지방산 유도체 조성물은 주로 한 가지 타입의 ω-하이드록시 지방산 유도체, 예컨대 1,12-도데센디올, 또는 1,14-테트라데칸디올, 또는 16-하이드록시 헥사데칸산 메틸 에스테르, 또는 16-하이드록시-헥사데센산, 또는 15-하이드록시-펜타데칸산 또는 15-하이드록시펜타데센산, 또는 18-하이드록시 옥타데센산, 또는 이러한 지방산 유도체들 중 어느 것의 메틸 에스테르 등을 포함한다. 몇몇 다른 경우들에서, ω-하이드록시 지방산 유도체 조성물은 특이적으로 설계된 조성물을 제공하기 위해 하나 이상의 타입의 ω-하이드록시 지방산 유도체 조성물의 혼합물을 포함한다(예를 들어, 동일한 조성에서 약 20 %의 1,12-도데센디올 및 약 80 %의 1,16-헥사데칸디올은 이러한 일 예시를 제공할 것이다).

"아말단(subterminally)" 수산화 지방산 유도체라는 용어는 오메가-1 위치 및/또는 오메가-2 위치 및/또는 오메가-3 위치 및/또는 오메가-4 위치 등(예를 들어, ω-1, ω-2 및/또는 ω-3; 등)에서 적어도 하나의 OH 기를 갖는(또는 적어도 하나의 OH 기를 갖는 중간체로부터 유도된) 화학적 개체를 지칭한다. 예시적인 종은 ω-1, ω-2 및/또는 ω-3-하이드록시 지방산; 또는 ω-1-하이드록시 지방산 메틸 에스테르; 또는 ω-1, ω-2, ω-3, ω-4 및/또는 ω-5-하이드록시 도데칸 산; 등이 있다.

"효소 분류(enzyme classification: EC) 번호"라는 용어는 특정 효소 활성을 나타내는 번호를 지칭한다. EC 번호는 효소 명명법의 시스템 하에서 효소들이 촉매화하는 반응에 따라 효소들을 분류한다. EC 번호는 효소-촉매화 반응들을 특정화한다. 예를 들어, 상이한 유기체들로부터의 상이한 효소들이 동일한 반응을 촉매화하는 경우, 이들은 동일한 EC 번호를 갖는다. 또한, 상이한 단백질 폴드(protein fold)들이 동일한 반응을 촉매화할 수 있으므로, 동일한 EC 번호[예를 들어, 비상동성 동기능 효소들(non-homologous isofunctional enzymes) 또는 NISE]가 할당될 것이다. EC 번호는 생화학 및 분자생물학 국제 연합(international union of biochemistry and molecular biology: IUBMB)의 명명 위원회(nomenclature committee)에 의해 제정되며, 이의 설명은 월드 와이드 웹의 IUBMB 효소 명명 웹사이트에서 이용가능하다. 예를 들어, ω-하이드록실라아제 또는 ω-옥시게나아제 효소 활성을 포함하는 시토크롬 P450 모노옥시게나아제 (P450) 효소 활성은 EC 1.14.15.3으로 분류된다(또한, 긴-사슬형 아실-[아실-운반체-단백질] 리덕타아제로도 알려져 있다). P450 효소 계열에 속하는 효소들의 기능은 하나의 종으로부터 다음 종으로 대부분의 원핵생물들에 보존된다. 따라서, 상이한 미생물 종이 EC 1.14.15.3으로 분류된 동일한 효소 활성을 수행할 수 있다. EC 1.14.15.3에 의해 특성화된 효소 활성의 일 예시는 본 명세서에 설명된 바와 같은 CYP153A-리덕타아제 혼성 융합 폴리펩티드 또는 이의 변이체(위 참조)의 효소 활성이다.

"EC 1.14.15.3의 변형된 ω-하이드록실라아제" 및 "변형된 ω-하이드록실라아제"라는 용어는 본 명세서에서 교환가능하게 사용되며, 생체 내에서(예를 들어, 미생물에서) 탄화수소 사슬들의 ω 위치를 효율적으로 촉매화하는 시토크롬 P450 모노옥시게나아제 효소 활성을 지칭한다.

"EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 변이체" 및 "ω-하이드록실라아제 혼성 융합 단백질 변이체"라는 용어는 본 명세서에서 교환가능하게 사용되며, 재조합 숙주 세포들에서의 ω-하이드록실라아제 혼성 융합 단백질 변이체의 발현이, 대응하는 숙주 세포에서의 천연 P450 융합 단백질의 발현에 비해, ω-OH 지방산들 및/또는 ω-OH 지방산 유도체 조성물들의 개선된 역가, 수율 및/또는 생산성을 유도하도록, 아미노산 서열에 적어도 하나의 돌연변이를 갖는 변형된 ω-하이드록실라아제 혼성 융합 폴리펩티드를 지칭한다. 예를 들어, 세포가 ω-하이드록실라아제 혼성 융합 단백질 변이체로 형질전환되었을 때, 이는 ω-하이드록실라아제 혼성 융합 단백질 변이체를 발현시키는 세포(예를 들어, 재조합 숙주 세포)이다. 일 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체를 발현시키는 세포에 의해 생성된 ω-OH 지방산의 역가 및/또는 수율은 천연 P450 융합 단백질을 발현시키는 대응 세포의 역가 및/또는 수율의 적어도 2 배이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체를 발현시키는 세포에 의해 생성된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은 천연 P450 융합 단백질을 발현시키는 대응 세포의 역가 및/또는 수율보다 적어도 약 1 배, 적어도 약 2 배, 적어도 약 3 배, 적어도 약 4 배, 적어도 약 5 배, 적어도 약 6 배, 적어도 약 7 배, 적어도 약 8 배, 적어도 약 9 배, 또는 적어도 약 10 배 더 크다. 일 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체를 발현시키는 세포에 의해 생성된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은 천연 P450 융합 단백질을 발현시키는 대응 세포의 역가 및/또는 수율보다 적어도 약 1 퍼센트, 약 2 퍼센트, 약 3 퍼센트, 약 4 퍼센트, 약 5 퍼센트, 약 6 퍼센트, 약 7 퍼센트, 약 8 퍼센트, 약 9 퍼센트, 약 10 퍼센트 더 크다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체의 발현으로 인해 재조합 세포에서 생성된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은 천연 P450 융합 단백질을 발현시키는 대응 세포의 역가 및/또는 수율보다 적어도 약 20 퍼센트에서 적어도 약 80 퍼센트 더 크다. 몇몇 구현예들에서, 세포에 의해 생성된 ω-OH 지방산의 역가 및/또는 수율은 천연 P450 융합 단백질을 발현시키는 대응 세포의 역가 및/또는 수율보다 적어도 약 20 퍼센트, 적어도 약 25 퍼센트, 적어도 약 30 퍼센트, 적어도 약 35 퍼센트, 적어도 약 40 퍼센트, 적어도 약 45 퍼센트, 적어도 약 50 퍼센트, 적어도 약 55 퍼센트, 적어도 약 60 퍼센트, 적어도 약 65 퍼센트, 적어도 약 70 퍼센트, 적어도 약 75 퍼센트, 적어도 약 80 퍼센트, 적어도 약 85 퍼센트, 적어도 약 90 퍼센트, 적어도 약 95 퍼센트, 적어도 약 97 퍼센트, 적어도 약 98 퍼센트, 또는 적어도 약 100 퍼센트 더 크다.

"CYP153A-리덕타아제 혼성 융합 폴리펩티드"라는 용어는 SEQ ID NO: 6에 대해 적어도 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % 또는 100 % 서열 동일성을 갖는 폴리펩티드 서열을 지칭한다. CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적이며, 지방산의 ω-OH 지방산으로의 반응을 촉매화하는 ω-하이드록실라아제 효소 활성을 갖는다. CYP153A-리덕타아제 혼성 융합 폴리펩티드의 일 예시는 혼성 cypl53A-RedRhF-타입 융합 폴리펩티드이다.

"수탁 번호" 또는 "NCBI 수탁 번호" 또는 "GenBank 수탁 번호"는 특정한 핵산 서열을 나타내는 번호를 지칭한다. 본 명세서에 설명되는 서열 수탁 번호들은 미국 국립보건원에 의해 유지되는 NCBI(미국 국립 생물공학 정보센터)에 의해 제공되는 데이터베이스로부터 그리고 (UniProtKB 수탁 번호라고도 지칭되는) 스위스 생물정보학 연구소에 의해 제공되는 UniProt 지식베이스(UniProtKB) 및 Swiss-Prot 데이터베이스로부터 얻어졌다.

본 명세서에서 사용되는 바와 같이, "뉴클레오티드"라는 용어는 헤테로사이클릭 염기, 당 및 하나 이상의 인산기로 이루어진 폴리뉴클레오티드의 단위체 단위를 지칭한다. 자연적으로 발생하는 염기들[구아닌(G), 아데닌(A), 사이토신(C), 티민(T) 및 우라실(U)]은 통상적으로 퓨린 또는 피리미딘의 유도체들이지만, 자연적으로 및 비-자연적으로 발생하는 염기 유사체(base analog)들도 포함되는 것으로 이해하여야 한다. 자연적으로 발생하는 당은 펜토오스(5-탄당)의 (DNA를 형성하는) 디옥시리보오스 또는 (RNA를 형성하는) 리보오스이지만, 자연적으로 및 비-자연적으로 발생하는 당 유사체들도 포함되는 것으로 이해하여야 한다. 핵산은 통상적으로 핵산 또는 폴리뉴클레오티드를 형성하는 인산 결합을 통해 연결되지만, 많은 다른 연결들(예를 들어, 포스포로티오에이트, 보라노포스페이트 등)이 해당 기술분야에 알려져 있다.

본 명세서에서 사용되는 바와 같이, "폴리뉴클레오티드"라는 용어는 리보뉴클레오티드(RNA) 또는 디옥시리보뉴클레오티드(DNA)의 중합체를 지칭하고, 이는 외가닥 또는 이중 가닥일 수 있으며, 비-자연적 또는 변경된 뉴클레오티드들을 함유할 수 있다. "폴리뉴클레오티드", "핵산 서열" 및 "뉴클레오티드 서열"이라는 용어는 여하한 길이의 뉴클레오티드의 중합체 형태, RNA 또는 DNA 중 하나를 지칭하는데 교환가능하게 사용된다. 이러한 용어는 분자의 일차 구조를 지칭하고, 따라서 이중 및 외가닥의 DNA, 및 이중 및 외가닥의 RNA를 포함한다. 이 용어는 메틸화된 및/또는 캡핑된(capped) 폴리뉴클레오티드(단, 이로 제한되지 않음)와 같은 변형된 폴리뉴클레오티드 및 뉴클레오티드 유사체로부터 만들어지는 RNA 또는 DNA 중 어느 하나의 유사체를 등가물로서 포함한다. 폴리뉴클레오티드는 플라스미드, 바이러스성, 염색체의, EST, cDNA, mRNA 및 rRNA를 포함하는(단, 이로 제한되지 않음) 여하한 형태로 존재할 수 있다.

본 명세서에서 사용되는 바와 같이, "폴리펩티드" 및 "단백질"이라는 용어는 아미노산 잔기의 중합체를 지칭하는데 교환가능하게 사용된다. "재조합 폴리펩티드"라는 용어는 재조합 기술들에 의해 생성된 폴리펩티드를 지칭하며, 일반적으로 발현된 단백질을 코딩하는 DNA 또는 RNA는 숙주 세포를 형질전환하여 폴리펩티드를 생성하는데 사용되는 적합한 발현 벡터(expression vector) 내로 삽입된다.

본 명세서에서 사용되는 바와 같이, "동족체(homolog)" 및 "상동(homologous)"이라는 용어는 대응하는 폴리뉴클레오티드 또는 폴리펩티드 서열과 적어도 약 50 % 동일한 서열을 포함하는 폴리뉴클레오티드 또는 폴리펩티드 서열을 지칭한다. 바람직하게, 상동 폴리뉴클레오티드들 또는 폴리펩티드들은 대응하는 아미노산 서열 또는 폴리뉴클레오티드 서열과 적어도 약 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 약 99 % 상동성(homology)을 갖는 폴리뉴클레오티드 서열들 또는 아미노산 서열들을 갖는다. 본 명세서에서 사용되는 바와 같이, 서열 "상동성" 및 서열 "동일성"이라는 용어는 교환가능하게 사용된다. 해당 기술분야의 당업자라면, 2 이상의 서열들 간의 상동성을 결정하는 방법들을 잘 알고 있을 것이다. 간명하게, 두 서열들 간의 "상동성"의 계산은 다음과 같이 수행될 수 있다. 서열들은 최적의 비교를 위해 정렬된다[예를 들어, 최적의 정렬을 위해 제 1 및 제 2 아미노산 또는 핵산 서열 중 하나 또는 둘 모두에 갭(gap)이 도입될 수 있으며, 비교를 위해 비-상동 서열들은 무시될 수 있다]. 바람직한 일 구현예에서, 비교를 위해 정렬되는 제 1 서열의 길이는 제 2 서열의 길이의 적어도 약 30 %, 바람직하게는 적어도 약 40 %, 더 바람직하게는 적어도 약 50 %, 훨씬 더 바람직하게는 적어도 약 60 %, 그리고 훨씬 더 바람직하게는 적어도 약 70 %, 적어도 약 75 %, 적어도 약 80 %, 적어도 약 85 %, 적어도 약 90 %, 적어도 약 95 %, 또는 약 100 %이다. 이후, 제 1 및 제 2 서열들의 대응하는 아미노산 위치들 또는 뉴클레오티드 위치들에서의 아미노산 잔기들 또는 뉴클레오티드들이 비교된다. 제 1 서열의 위치가 제 2 서열의 대응하는 위치와 동일한 아미노산 잔기 또는 뉴클레오티드에 의해 점유될 때, 분자들은 그 위치에서 동일하다. 두 서열들 간의 퍼센트 상동성은 두 서열들의 최적의 정렬을 위해 도입될 필요가 있는, 갭의 개수 및 각 갭의 길이를 고려한, 서열들에 의해 공유되는 동일한 위치들의 개수의 함수이다. 두 서열들 간의 퍼센트 상동성의 결정 및 서열의 비교는 BLAST와 같은 수학적 알고리즘을 이용하여 달성될 수 있다(Altschul 외(1990) J. Mol. Biol. 215(3):403-410). 또한, 두 아미노산 서열들 간의 퍼센트 상동성은 Blossum 62 매트릭스 또는 PAM250 매트릭스 중 어느 하나, 그리고 16, 14, 12, 10, 8, 6 또는 4의 갭 중량(gap weight) 및 1, 2, 3, 4, 5 또는 6의 길이 중량(length weight)을 이용하는, GCG 소프트웨어 패키지의 GAP 프로그램에 통합된 Needleman 및 Wunsch 알고리즘을 사용하여 결정될 수 있다(Needleman 및 Wunsch(1970), J. Mol. Biol. 48:444-453). 또한, 두 뉴클레오티드 서열들 간의 퍼센트 상동성은 NWSgapdna.CMP 매트릭스 그리고 40, 50, 60, 70 또는 80의 갭 중량 및 1, 2, 3, 4, 5 또는 6의 길이 중량을 이용하는, GCG 소프트웨어 패키지의 GAP 프로그램을 이용하여 결정될 수 있다. 해당 기술분야의 당업자는 초기 상동성 계산을 수행할 수 있으며, 이에 따라 알고리즘 파라미터들을 조정할 수 있다. 바람직한 파라미터들의 세트(및, 당업자가, 분자가 청구항들의 상동성 제한 내에 있는지 여부를 결정하기 위해 어떤 파라미터들이 적용되어야 하는지에 대한 확신이 없는 경우에 사용되어야 하는 파라미터들의 세트)는 12의 갭 페널티(gap penalty), 4의 갭 확장 페널티 및 5의 프레임시프트 갭 페널티(frameshift gap penalty)를 갖는 Blossum 62 스코어링 매트릭스(scoring matrix)이다. 서열 정렬의 추가적인 방법들은 생물공학 분야에 알려져 있다(예를 들어, Rosenberg(2005) BMC Bioinformatics 6:278; Altschul 외(2005) FEBS J. 272(20):5101-5109).

"내인성" 폴리펩티드는 재조합 세포가 조작되거나 유래된 숙주 세포[예를 들어, 모 미생물 세포(parental microbial cell)]의 게놈에 의해 의해 코딩되는 폴리펩티드를 지칭한다.

"외인성" 폴리펩티드는 모 미생물 세포의 게놈에 의해 코딩되지 않은 폴리펩티드를 지칭한다. 변이(즉, 돌연변이) 폴리펩티드는 외인성 폴리펩티드의 일 예시이다.

"이종(heterologous)"이라는 용어는 일반적으로 상이한 종으로부터 유도되거나 상이한 유기체로부터 유도됨을 의미한다. 본 명세서에서 사용되는 바와 같이, 이는 특정 유기체에 자연적으로 존재하지 않는 뉴클레오티드 서열 또는 폴리펩티드 서열을 지칭한다. 이종 발현은 단백질 또는 폴리펩티드가 그 단백질을 정상적으로 발현시키지 않는 세포에 실험적으로 추가됨을 의미한다. 이와 같이, 이종은 전달된 단백질이 초기에 수용자(recipient)와 상이한 세포 타입 또는 상이한 종으로부터 유도된 사실을 지칭한다. 예를 들어, 식물 세포에 대해 내인성인 폴리뉴클레오티드 서열이 재조합 방법들에 의해 박테리아성 숙주 세포 내로 도입될 수 있으며, 이때 식물 폴리뉴클레오티드는 재조합 박테리아성 숙주 세포의 이종 폴리뉴클레오티드이다.

본 명세서에서 사용되는 바와 같이, 폴리펩티드의 "단편(fragment)"이라는 용어는 4 개의 아미노산 잔기에서부터 1 개의 아미노산 잔기를 뺀 전체 아미노산 서열에 이르는 크기 범위를 갖는 전체-길이 폴리펩티드 또는 단백질의 더 짧은 부분을 지칭한다. 본 발명의 특정 구현예들에서, 단편은 폴리펩티드 또는 단백질의 도메인(예를 들어, 기질 결합 도메인 또는 촉매 도메인)의 전체 아미노산 서열을 지칭한다.

본 명세서에서 사용되는 바와 같이, "돌연변이유발(mutagenesis)"이라는 용어는 유기체의 유전 정보가 안정한 방식으로 변화되는 과정을 지칭한다. 단백질 코딩 핵산 서열의 돌연변이유발은 돌연변이 단백질을 생성한다. 또한, 돌연변이유발은 변형된 단백질 활성을 유도하는 비-코딩 핵산 서열의 변화를 지칭한다.

본 명세서에서 사용되는 바와 같이, "유전자"라는 용어는 RNA 생성물 또는 단백질 생성물 중 어느 하나를 코딩하는 핵산 서열뿐만 아니라, RNA 또는 단백질의 발현에 영향을 주는 작동가능하게-연결된 핵산 서열들(operably-linked nucleic acid sequences)[예를 들어, 이러한 서열들은 프로모터 또는 인핸서(enhancer) 서열들을 포함함(단, 이로 제한되지 않음)] 또는 RNA 또는 단백질의 발현에 영향을 주는 서열들을 코딩하는 작동가능하게-연결된 핵산 서열들[예를 들어, 이러한 서열들은 리보솜 결합 부위 또는 번역 조절 서열(translational control sequence)들을 포함함(단, 이로 제한되지 않음)]을 지칭한다.

발현 조절 서열(expression control sequence)들은 해당 기술분야에 알려져 있으며, 예를 들어 숙주 세포에서 폴리뉴클레오티드 서열의 발현을 위하여 제공되는 프로모터, 증폭자, 아데닐산중합반응 신호(polyadenylation signal), 전사 종결자(transcription terminator), 내부 리보솜 유입점(internal ribosome entry sites: IRES) 등을 포함한다. 발현 조절 서열들은 구체적으로 전사에 관련된 세포성 단백질들과 상호작용한다(Maniatis 외(1987) Science 236:1237-1245). 예시적인 발현 조절 서열들은, 예를 들어 Goeddel, Gene Expression Technology: Methods in Enzymology, Vol. 185, Academic Press, San Diego, Calif.(1990)에 개시되어 있다.

본 발명의 방법들에서, 발현 조절 서열은 폴리뉴클레오티드 서열에 작동가능하게 연결된다. "작동가능하게 연결된"이라는 것은, 적절한 분자들(예를 들어, 전사 활성화인자 단백질들)이 발현 조절 서열(들)에 결합될 때, 폴리뉴클레오티드 서열 및 발현 조절 서열(들)이 유전자 발현을 허용하는 방식으로 연결되는 것을 의미한다. 작동가능하게 연결된 프로모터는, 전사 및 번역의 방향에 관하여, 선택된 폴리뉴클레오티드 서열의 상류에 위치된다. 작동가능하게 연결된 인핸서는 선택된 폴리뉴클레오티드의 상류, 내부 또는 하류에 위치될 수 있다.

본 명세서에서 사용되는 바와 같이, "벡터"라는 용어는 벡터가 연결된 다른 핵산, 즉 폴리뉴클레오티드 서열을 수송할 수 있는 핵산 분자를 지칭한다. 일 유형의 유용한 벡터는 에피솜(episome)[즉, 염색체외 복제(extra-chromosomal replication)가 가능한 핵산]이다. 유용한 벡터는 벡터가 연결된 핵산의 자율 복제 및/또는 발현이 가능한 벡터이다. 작동가능하게 연결된 유전자의 발현을 지향할 수 있는 벡터는 본 명세서에서 "발현 벡터"로 칭해진다. 일반적으로, 재조합 DNA 기술들에 유용한 발현 벡터는 흔히 "플라스미드"의 형태로 되어 있으며, 이는 일반적으로 벡터 형태로 염색체에 결합되지 않는 원형 이중 가닥 DNA 루프를 지칭한다. 플라스미드가 가장 보편적으로 사용되는 벡터의 형태이므로, "플라스미드" 및 "벡터"라는 용어는 본 명세서에서 교환가능하게 사용된다. 하지만, 등가의 기능들을 제공하고, 이후에 해당 기술분야에 알려지는 이러한 다른 형태들의 발현 벡터도 포함된다. 몇몇 구현예들에서, 재조합 벡터는 폴리뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 더 포함한다. 몇몇 구현예들에서, 프로모터는 발달-조절된(developmentally-regulated), 세포소기관-특이적(organelle-specific), 조직-특이적(tissue-specific), 유도성(inducible), 구성적(constitutive), 또는 세포-특이적 프로모터이다. 재조합 벡터는 통상적으로, (a) 폴리뉴클레오티드 서열에 작동가능하게 연결된 발현 조절 서열; (b) 폴리뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; (c) 폴리뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; (d) 폴리뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티(purification moiety); (e) 폴리뉴클레오티드 서열에 작동가능하게 연결된 분비 서열(secretion sequence); 및 (f) 폴리뉴클레오티드 서열에 작동가능하게 연결된 표적화 서열(targeting sequence)을 포함하는 적어도 하나의 서열을 포함한다. 특정 구현예들에서, 뉴클레오티드 서열은 숙주 세포의 게놈 DNA 내로 안정하게 통합되며, 뉴클레오티드 서열의 발현은 조절된 프로모터 구역의 제어를 받는다. 본 명세서에 사용되는 발현 벡터는 숙주 세포에서의 폴리뉴클레오티드 서열의 발현에 적합한 형태로 된 본 명세서에 설명된 폴리뉴클레오티드 서열을 포함한다. 해당 기술분야의 당업자라면, 발현 벡터의 설계는 형질전환될 숙주 세포의 선택, 의도한 폴리펩티드의 발현 수준 등과 같은 인자들에 의존할 수 있음을 이해할 것이다. 본 명세서에 설명되는 발현 벡터는 본 명세서에 설명되는 바와 같은 폴리뉴클레오티드 서열들에 의해 코딩되는, 융합 폴리펩티드들을 포함하는 폴리펩티드들을 생성하기 위하여 숙주 세포들 내로 도입될 수 있다. 원핵생물, 예를 들어 대장균에서 폴리펩티드들을 코딩하는 유전자의 발현은 대부분 융합 및 비-융합 폴리펩티드들 중 어느 하나의 발현을 지향하는 구성적 또는 유도성 프로모터를 포함하는 벡터들로 수행된다. 융합 벡터들은 그 안에 코딩된 폴리펩티드에, 일반적으로는 재조합 폴리펩티드의 아미노- 또는 카르복시-말단에 다수의 아미노산들을 추가한다. 이러한 융합 벡터들은 통상적으로 다음의 세 가지 목적: (1) 재조합 폴리펩티드의 발현을 증가시키고; (2) 재조합 폴리펩티드의 용해도를 증가시키며; (3) 친화성 정제에서 리간드로서 작용함으로써 재조합 폴리펩티드의 정제를 돕는 것 중 하나 이상을 제공한다. 흔히, 융합 발현 벡터에서, 융합 모이어티와 재조합 폴리펩티드의 접합점에 단백질분해 절단 부위(proteolytic cleavage site)가 도입된다. 이는 융합 폴리펩티드의 정제 이후에 융합 모이어티로부터 재조합 폴리펩티드의 분리를 가능하게 한다. 특정 구현예들에서, 본 발명의 폴리뉴클레오티드 서열은 박테리오파지(bacteriophage) T5로부터 유도된 프로모터에 작동가능하게 연결된다. 특정 구현예들에서, 숙주 세포는 효모 세포이고, 발현 벡터는 효모 발현 벡터이다. 효모인 S. 세레비지에(S. cerevisiae)에서의 발현을 위한 벡터들의 예시들은 pYepSec1(Baldari 외(1987) EMBO J. 6:229-234); pMFa(Kurjan 외(1982) Cell 30:933-943); pJRY88(Schultz 외(1987) Gene 54:113-123); pYES2(Invitrogen Corp., San Diego, CA), 및 picZ(Invitrogen Corp., San Diego, CA)를 포함한다. 다른 구현예들에서, 숙주 세포는 곤충 세포이고, 발현 벡터는 배큘로바이러스 발현 벡터이다. 배양된 곤충 세포들(예를 들어, Sf9 세포들)에서의 단백질들의 발현에 이용가능한 배큘로바이러스 벡터들은, 예를 들어 pAc 계열(series)(Smith 외(1983) Mol. Cell Biol. 3:2156-2165) 및 pVL 계열(Lucklow 외(1989) Virology 170:31-39)을 포함한다. 또 다른 구현예에서, 본 명세서에 설명된 폴리뉴클레오티드 서열들은 포유동물 발현 벡터를 이용하여 포유동물 세포들에서 발현될 수 있다. 원핵 및 진핵 세포들 둘 모두에 대한 다른 적절한 발현계들이 당업계에 잘 알려져 있다; 예를 들어, Sambrook 외, "Molecular Cloning: A Laboratory Manual", 제 2 판, Cold Spring Harbor Laboratory(1989)를 참조한다.

본 명세서에서 사용되는 바와 같이, "아실-CoA"는 조효소 A(CoA)의 4'-포스포판테티오닐 모이어티의 술피드릴기와 알킬 사슬의 카르보닐 탄소 사이에서 형성되는 아실 티오에스테르를 지칭하고, 이는 화학식 R-C(O)S-CoA를 가지며, 여기서 R은 적어도 4 개의 탄소 원자들을 갖는 여하한의 알킬기이다.

본 명세서에서 사용되는 바와 같이, "아실-ACP"는 아실기 운반 단백질(ACP)의 포스포판테테이닐 모이어티의 술피드릴기와 알킬 사슬의 카르보닐 탄소 사이에서 형성되는 아실 티오에스테르를 지칭한다. 포스포판테테이닐 모이어티는 홀로(holo)-아실기 운반 단백질 신타아제(ACPS)인 포스포판테테이닐 트랜스퍼라아제의 작용에 의해 ACP 상의 보존된 세린 잔기에 이후-번역되도록(post-translationally) 부착된다. 몇몇 구현예들에서, 아실-ACP는 완전히 포화된 아실-ACP들의 합성에 있어서 중간체이다. 다른 구현예들에서, 아실-ACP는 불포화된 아실-ACP들의 합성에 있어서 중간체이다. 몇몇 구현예들에서, 탄소 사슬은 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 또는 26 개의 탄소들을 가질 것이다. 이러한 아실-ACP들의 각각은 이들을 지방산 유도체들로 전환시키는 효소들에 대한 기질들이다.

본 명세서에서 사용되는 바와 같이, "지방산 생합성 경로"라는 용어는 지방산들 및 이의 유도체들(ω-수산화 지방산 유도체들을 포함함)을 생성하는 생합성 경로를 의미한다. 지방산 생합성 경로는 의도한 특성들을 갖는 지방산 유도체들, 예컨대 ω-수산화 지방산 유도체들을 생성하기 위해 본 명세서에 기재된 것들 외에도 효소 활성을 갖는 폴리펩티드들 또는 추가 효소들을 포함할 수 있다.

본 명세서에서 사용되는 바와 같이, "클론"이라는 용어는 통상적으로 단일 공통 선조와 본질적으로 유전적으로 동일하고 이의 자손인 세포 또는 세포들의 그룹, 예를 들어 단일 박테리아성 세포에서 발생하는 클로닝된 박테리아성 콜로니(cloned bacterial colony)의 박테리아를 지칭한다.

본 명세서에서 사용되는 바와 같이, "배양물"이라는 용어는 통상적으로 생세포(viable cell)들을 포함하는 액체 배지를 지칭한다. 일 구현예에서, 배양물은 제어된 조건들 하에서 사전설정된 배양 배지에서 번식하는 세포들, 예를 들어 선택된 탄소원 및/또는 질소를 포함하는 액체 배지에서 성장되는 재조합 숙주 세포들의 배양물을 포함한다. "배양하는" 또는 "배양"은 액체 또는 고체 배지의 적절한 조건들 하에서 재조합 숙주 세포들의 개체군을 성장시키는 것을 지칭한다. 특정 구현예들에서, 배양은 최종 생성물로의 기질의 발효성 생물전환(bioconversion)을 지칭한다. 배양 배지는 잘 알려져 있으며, 이러한 배양 배지의 각각의 성분들은 예를 들어 상표명 Difco™ 및 BBL™의 상용 공급원(commercial source)들로부터 이용가능하다. 비-제한적인 일 예시에서, 수성 영양 배지(aqueous nutrient medium)는 YP 배지와 같이 질소, 염 및 탄소의 복합원을 포함하는 "풍부한 배지(rich medium)"이며, 이는 이러한 배지의 10 g/L의 펩톤 및 10 g/L 효모 추출물을 포함한다. 추가적으로, 배양물의 숙주 세포는 미국 특허 5,000,000; 5,028,539; 5,424,202; 5,482,846; 5,602,030; WO 2010127318에 설명된 방법들에 따라, 탄소를 효율적으로 동화시키고 탄소원으로서 셀룰로오스 물질(cellulosic material)들을 사용하도록 조작될 수 있다. 또한, 몇몇 구현예들에서, 숙주 세포는 인버르타아제(invertase)를 발현시키도록 조작되어, 수크로오스가 탄소원으로서 사용될 수 있도록 한다.

본 명세서에서 사용되는 바와 같이, "유전적으로 조작된 폴리뉴클레오티드 서열을 발현시키기에 효과적인 조건들 하에서"라는 용어는 숙주 세포가 의도한 ω-하이드록시 지방산 유도체를 생성하게 하는 여하한 조건들을 의미한다. 적합한 조건들은, 예를 들어 발효 조건들을 포함한다.

"재조합 미생물"이라는 용어는, 유전적으로 변형되어 숙주 세포 내의 특정 효소 활성들이 모 세포(parent cell) 또는 원시 숙주 세포(native host cell)에 대해 변경, 추가 및/또는 결실된 숙주 세포를 지칭한다. 유전적으로 변형된 숙주 세포는 재조합 미생물의 일 예시이다. 이와 같이, 재조합 숙주 세포에서 효소와 같은 "단백질의 변형된 또는 변경된 수준의 활성"은 동일한 변형이 없는 모 또는 원시 숙주 세포에 대해 결정된 활성의 하나 이상의 특성의 차이를 지칭한다. 통상적으로, 활성의 차이는 변형된 활성을 갖는 재조합 숙주 세포와, 변형된 활성을 갖지 않는 대응하는 야생형 숙주 세포 사이에서 결정된다(예를 들어, 대응하는 야생형 숙주 세포에 대한 재조합 숙주 세포의 배양물의 비교). 예를 들어, 변형된 활성은 [예를 들어, 단백질을 코딩하는 DNA 서열의 증가 또는 감소된 수의 복제, 단백질을 코딩하는 증가 또는 감소된 수의 mRNA 전사체, 및/또는 mRNA로부터의 단백질의 증가 또는 감소된 양의 단백질 번역(protein translation)의 결과로서] 재조합 숙주 세포에 의해 발현되는 변형된 양의 단백질; 단백질의 구조 변화[예를 들어, 기질 특수성의 변화, 관찰되는 운동 파라미터들(kinetic parameters)의 변화를 유도하는 단백질 코딩 서열에 대한 변화와 같은 일차 구조에 대한 변화); 및 단백질 안정성의 변화(예를 들어, 단백질의 증가 또는 감소된 분해)의 결과일 수 있다. 몇몇 구현예들에서, 폴리펩티드는 본 명세서에 설명된 폴리펩티드 중 어느 하나의 돌연변이체 또는 변이체이다. 특정 경우에서, 본 명세서에 설명된 폴리펩티드들에 대한 코딩 서열은 특정 숙주 세포에서의 발현에 최적화된 코돈(codon)이다. 예를 들어, 대장균의 발현을 위해, 하나 이상의 코돈이 최적화될 수 있다(Grosjean 외(1982) Gene 18:199-209).

통상적으로, 본 명세서에서 사용되는 바와 같은 "조절 서열(regulatory sequences)"이라는 용어는 궁극적으로 단백질의 발현을 조절하는 단백질을 코딩하는 DNA 서열들에 작동가능하게-연결된, DNA의 염기 서열을 지칭한다. 조절 서열의 예시들은 RNA 프로모터 서열, 전사 인자 결합 서열(transcription factor binding sequences), 전사 종결 서열, (인핸서 요소와 같은) 전사의 조절인자(modulators), RNA 안정성에 영향을 주는 뉴클레오티드 서열, 및 번역 조절 서열[예컨대, 리보솜 결합 부위(예를 들어, 원핵생물의 샤인-달가노 서열(Shine-Dalgarno sequences) 또는 진핵생물의 코작 서열(Kozak sequences), 개시 코돈, 종결 코돈]을 포함한다(이로 제한되지 않음).

"변경된 수준의 발현" 및 "변형된 수준의 발현"이라는 용어는 교환가능하게 사용되며, 폴리뉴클레오티드, 폴리펩티드, 대사물질 또는 생성물(예컨대, ω-하이드록시 지방산 유도체)가 동일한 조건들 하에서 대응하는 야생형 세포의 농도에 비해 조작된 숙주 세포에서 상이한 농도로 존재함을 의미한다.

본 명세서에서 사용되는 바와 같이, "역가"라는 용어는 숙주 세포 배양물의 단위 부피당 생성된 ω-지방산 유도체의 양(quantity)을 지칭한다. 역가는 특정 ω-지방산 유도체 또는 주어진 재조합 숙주 세포 배양물에 의해 생성된 ω-지방산 유도체들의 조합을 지칭할 수 있다.

본 명세서에서 사용된 바와 같이, "숙주 세포에 의해 생성된 ω-하이드록시 지방산 유도체의 수율"은 투입된 탄소원이 숙주 세포의 생성물(예를 들어, ω-하이드록시 지방산, α,ω-이산 등)로 전환되는 효율을 지칭한다. 수율은 특정 ω-하이드록시 지방산 유도체 또는 주어진 재조합 숙주 세포 배양물에 의해 생성된 ω-하이드록시 지방산 유도체들의 조합을 지칭할 수 있다. ω-하이드록시 지방산 유도체들은 ω-하이드록시 유리 지방산들; ω-하이드록시 지방산 메틸 에스테르들; ω-옥소 지방산들; ω-옥소 지방산 메틸 에스테르들; α,ω-이산들; α,ω-디올들; α,ω-디에스테르들과 같은 이작용성 화합물들; ω-카르복시 지방산 메틸 에스테르들; ω-아미노 지방산들; 및 ω-아미노 지방산 메틸 에스테르들을 포함하는 ω-하이드록시 지방산들을 포함한다(단, 이로 제한되지 않음).

본 명세서에서 사용되는 바와 같이, "생산성"이라는 용어는 단위 시간당 숙주 세포 배양물의 단위 부피당 생성된 ω-하이드록시 지방산 유도체 또는 유도체들의 양을 지칭한다. 생산성은 특정 ω-하이드록시 지방산 유도체 또는 주어진 재조합 숙주 세포 배양물에 의해 생성된 지방산 유도체들의 조합을 지칭할 수 있다.

본 명세서에서 사용되는 바와 같이, "글루코오스 이용률"이라는 용어는 그램/리터/시간(g/L/hr)으로 기록되는 단위 시간당 배양물에 사용되는 글루코오스의 양을 의미한다.

본 명세서에서 사용되는 바와 같이, "탄소원"이라는 용어는 원핵 또는 단순 진핵 세포 성장을 위한 탄소원으로서 사용되는데 적합한 기질 또는 화합물을 지칭한다. 탄소원은 중합체, 탄수화물, 산, 알코올, 알데히드, 케톤, 아미노산, 펩티드 및 기체(예를 들어, CO 및 CO₂)를 포함하는(단, 이로 제한되지 않음) 다양한 형태로 존재할 수 있다. 예시적인 탄소원은 글루코오스, 프럭토오스, 만노오스, 갈락토오스, 자일로오스 및 아라비노오스와 같은 단당류; 프럭토-올리고당 및 갈락토-올리고당과 같은 올리고당류; 녹말, 셀룰로오스, 펙틴 및 자일란과 같은 다당류; 수크로오스, 말토오스, 셀로비오스 및 투라노오스(turanose)와 같은 이당류; 헤미셀룰로오스(hemicellulose), 메틸 셀룰로오스 및 소듐 카르복시메틸 셀룰로오스와 같은 셀룰로오스 물질 및 변이체들; 숙시네이트, 락테이트 및 아세테이트; 에탄올, 메탄올 및 글리세롤과 같은 알코올류, 또는 이의 혼합물들을 포함한다(단, 이로 제한되지 않음). 또한, 탄소원은 글루코오스와 같은 광합성의 산물일 수 있다. 특정 구현예들에서, 탄소원은 바이오매스이다. 다른 구현예들에서, 탄소원은 글루코오스이다. 다른 구현예들에서, 탄소원은 수크로오스이다.

공급원을 참조하여 또는 단독으로 사용될 때 "재생가능한 공급원료로부터의 탄소원"이라는 용어는 유지화학물질(oleochemicals)[즉, 지방산, 지방산 에스테르, TAG, 하이드록시 지방산 등과 같이 식물 및 동물로부터의 정유(refined oils)] 및 석유화학물질(즉, 알칸, 알켄 등과 같이 석유로부터 유도된 화학물질)을 제외하고 탄소가 유래되는 (재생가능한 공급원료 및/또는 바이오매스 및/또는 노폐물을 포함하는) 여하한의 생물학적 물질을 포함한다. 따라서, 본 명세서에서 사용되는 바와 같은 "재생가능한 공급원료로부터의 탄소원"이라는 용어는 유지화학물질 및 석유화학물질로부터 유래된 탄소를 제외한다. 몇몇 구현예들에서, 탄소원은 당류 또는 탄수화물(예를 들어, 단당류, 이당류 또는 다당류)을 포함한다. 몇몇 구현예들에서, 탄소원은 글루코오스 및/또는 수크로오스이다. 다른 구현예들에서, 탄소원은 옥수수, 사탕수수 또는 목질계 바이오매스로부터의 탄수화물; 또는 글리세롤, 플루-가스, 합성-가스와 같은 노폐물; 또는 바이오매스 또는 천연 가스와 같은 유기 재료의 재형성물; 또는 광합성적으로 고정된(fixed photosynthetically) 이산화탄소와 같은 재생가능한 공급원료들로부터 유도된다. 다른 구현예들에서, 바이오매스는 탄소원으로 처리되며, 이는 생물전환에 적합하다. 다른 구현예들에서, 바이오매스는 탄소원으로의 추가적인 처리를 요구하지 않으며, 탄소원으로서 바로 사용될 수 있다. 이러한 바이오매스의 예시적인 탄소원은 스위치그래스와 같은 식물성 물질 또는 식생(vegetation)이다. 또 다른 예시적인 탄소원은 동물성 물질[예를 들어, 우분(cow manure)]과 같은 대사 노폐물을 포함한다. 또 다른 예시적인 탄소원은 조류(algae) 및 다른 해양 식물을 포함한다. 또한, (바이오매스를 포함하는) 또 다른 탄소원은 글리세롤/글리세린, 목초, 짚, 목재, 오수, 쓰레기, 마니플 고체 폐기물(maniple solid waste), 셀룰로오스 도시 폐기물 및 음식 쓰레기를 포함하는(단, 이로 제한되지 않음) 산업, 농업, 임업 및 가정으로부터의 폐기물을 포함한다.

본 명세서에서 사용되는 바와 같이, (ω-하이드록시 지방산 유도체들과 같은) 생성물들에 대하여 "분리된(isolated)"이라는 용어는 세포 성분, 세포 배양 배지, 또는 화학적 또는 합성 전구체로부터 분별된(separated) 생성물들을 지칭한다. 본 명세서에 설명된 방법들에 의해 생성된 ω-하이드록시 지방산 유도체들 및 ω-하이드록시 지방산 유도체 조성물들은 세포질에서뿐만 아니라 발효액에서도 상대적으로 혼합되지 않을 수 있다. 그러므로, ω-하이드록시 지방산 유도체들 및 ω-하이드록시 지방산 유도체 조성물들은 세포내 또는 세포외에서 유기 상(organic phase)으로 수집될 수 있다. 바람직한 일 방법에서, ω-하이드록시 지방산 유도체들 및 ω-하이드록시 지방산 유도체 조성물들은 세포외에서 수집된다.

본 명세서에서 사용되는 바와 같이, "정제한다", "정제된" 또는 "정제"라는 용어는, 예를 들어 분리 또는 분별에 의해 그 환경으로부터 분자의 제거 또는 분리를 의미한다. "실질적으로 정제된" 분자는 연계된 다른 성분들로부터 적어도 약 60 % 유리(예를 들어, 적어도 약 70 % 유리, 적어도 약 75 % 유리, 적어도 약 85 % 유리, 적어도 약 90 % 유리, 적어도 약 95 % 유리, 적어도 약 97 % 유리, 적어도 약 99 % 유리)된다. 본 명세서에서 사용되는 바와 같이, 또한 이러한 용어는 샘플로부터 오염물의 제거를 지칭한다. 예를 들어, 오염물의 제거는 샘플에서의 지방산 유도체의 백분율의 증가를 유도할 수 있다. 예를 들어, ω-하이드록시 지방산 유도체가 재조합 숙주 세포에서 생성될 때, ω-하이드록시 지방산 유도체는 숙주 세포 단백질의 제거에 의해 정제될 수 있다. 정제 후, 샘플에서의 ω-하이드록시 지방산 유도체의 백분율이 증가된다. "정제한다", "정제된" 및 "정제"라는 용어는 절대 순도를 필요로 하지 않는 상대적인 용어이다. 따라서, 예를 들어 ω-하이드록시 지방산 유도체가 재조합 숙주 세포들에서 생성될 때, 정제된 ω-하이드록시 지방산 유도체는 다른 세포 성분(예를 들어, 핵산, 폴리펩티드, 지질, 탄수화물 또는 다른 탄화수소)로부터 실질적으로 분리되는 ω-하이드록시 지방산 유도체이다.

명세서 및 청구항들을 위해 사용되는 바와 같은 "생체 내에서 ω-하이드록시 지방산 유도체를 생성"이라는 용어는 탄수화물 등과 같은 재생가능한 공급원료로부터 생육가능한(viable) 및/또는 유전적으로 변형된 숙주 세포들에서 ω-하이드록시 지방산 유도체를 생성함을 의미하며, 재생가능한 공급원료는 탄소원으로서 발효액에 추가되어, 발효 시 숙주 세포들이 탄소원을 흡수하고(take up) 대사시킬 수 있게 한다. 이는 ω-하이드록시 지방산 유도체들이 시험관 내에서 생성되는 방법들과 상이하고, 정제된 효소들 또는 세포 용해물들이 사용되며, 효소 전환을 위한 직접적 기질, 예를 들어 지방산 또는 지방산 유도체가 정제된 효소에 또는 세포 용해물 용액에 첨가된다. 또한, 이는 ω-하이드록시 지방산 유도체들이 생물형질전환(biotransformation)들로 생성되는 방법들과 상이하고, 휴지 세포(resting cell)들이 사용되며, 효소 전환을 위한 직접적 기질, 예를 들어 지방산 또는 지방산 유도체가 휴지 세포들에 외인성으로 첨가된다.

경로 조작 및 효소 활성

지방산 합성은 박테리아 생합성 기구의 대부분 보존된 시스템들 중 하나이다. 지방산 합성(FAS) 다중-효소 복합체가 모든 박테리아 및 진핵생물에 존재한다. FAS 관련 유전자들의 대부분은 세포 성장 및 생존에 필수적이다. 진핵생물 및 박테리아 FAS는 본질적으로 동일한 타입의 생화학적 형질전환을 구현한다. 진핵생물에서, FAS는 FAS I로 지칭되고, 그 촉매 도메인들의 대부분은 하나의 폴리펩티드 사슬(비-해리성)에 의해 코딩된다. 박테리아와 같은 원핵생물에서, FAS는 FAS II로 지칭되고, 그 개개의 촉매들 및 운반 단백질들은 별개의(해리성) 단백질들을 코딩하는 별도의 유전자들에 의해 코딩된다. 이와 같이, FAS II는 상당한 변동 및 뚜렷한 특이성을 갖는 복합계(complex system)이다.

FAS 경로에서 효소들과 함께 아실기 운반 단백질(ACP)이 원래의(native) 유기체에서 생성된 지방산들의 길이, 포화도 및 분지를 조절한다. 이 경로에서의 단계들이 아세틸-CoA 카르복실라아제(ACC) 유전자 계열들 및 지방산 생합성(FAB)의 효소들에 의해 촉매화된다. 예를 들어, FAS 경로에 포함될 수 있는 효소들은 AccABCD, FabD, FabH, FabG, FabA, FabZ, FabI, FabK, FabL, FabM, FabB 및 FabF를 포함한다. 의도한 생성물에 따라, 이러한 유전자들 중 하나 이상이 감쇠되거나 과발현될 수 있다. 이와 같이, 원핵생물은 글루코오스 또는 다른 탄소원들과 같은 재생가능한 공급원료로부터 지방산 유도체들의 생성을 증가시키도록 조작되었다. 여기서, 주요 목표는, 박테리아 균주를, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE) 및 지방족 알코올(FALC)를 포함하는 지방산 유도체 생성을 위한 미생물 공장(microbial factory)으로 전환시키기 위해, 지방산 유도체들의 생성을 조절하는 핵심 조절 효소들의 활성을 증가시키는 것이다(예를 들어, 본 명세서에 인용 참조되는 미국 특허 8,283,143 참조).

본 발명은 ω-하이드록시 지방산 유도체들과 같은 바람직한 화합물의 생성을 위한 효소 경로들을 변형시키기 위해 효소 기능(enzymatic function)의 폴리펩티드들을 코딩하는 폴리뉴클레오티드들을 식별한다. 본 명세서에서 효소 수탁 번호(EC 번호)에 의해 식별되는 이러한 폴리펩티드들은 ω-하이드록시 지방산 유도체들과 같은 이작용성 분자들의 생성을 유도하는 지방산 경로들을 조작하는데 유용하다. 도 1 내지 도 4는 이러한 화합물들을 생성하도록 조작된 경로들을 도시한다. 도 5는 나일론과 같은 중합체들 및 락탐들을 유도하는 경로를 도시한다.

일 구현예에서, ω-하이드록시 지방산 유도체들을 생성하기 위해 글루코오스와 같은 재생가능한 공급원료를 이용하는 경로들이 도 1 내지 도 4에 도시된다. 글루코오스는 원래의 유기체에 의해 아실-ACP로 전환된다(도 1 내지 도 4의 단계 1 참조). 지방산 분해 효소 활성을 갖는 폴리펩티드들을 코딩하는 폴리뉴클레오티드들은 의도한 생성물에 따라 선택적으로 감쇠될 수 있다(아래의 예시들을 참조). 이러한 폴리펩티드들의 비-제한적인 예시들은 아실-CoA 신테타아제(FadD) 및 아실-CoA 디하이드로게나아제(FadE)이다. 표 1은 해당 기술 분야에 알려진 방법들에 따라 선택적으로 감쇠될 수 있는 다양한 지방산 분해 효소들을 포함하는, 대사 경로 내의 효소 활성의 포괄적인 목록(아래 참조)을 제공한다(예를 들어, 위의 미국 특허 8,283,143 참조).

예를 들어, FadR(아래의 표 1 참조)은 지방산 분해 및 지방산 생합성 경로들에 관련된 핵심 조절 인자이다(Cronan 외, Mol. Microbiol., 29(4):937-943(1998)). 대장균 효소 FadD(아래의 표 1 참조) 및 지방산 수송 단백질 FadL은 지방산 흡수 시스템의 구성요소들이다. FadL는 지방산의 박테리아 세포로의 수송을 매개(mediate)하고, FadD는 아실-CoA 에스테르의 형성을 매개한다. 다른 탄소 공급원이 이용가능하지 않을 때, 외인성 지방산이 박테리아에 의해 흡수되고, 아실-CoA 에스테르로 전환되며, 이는 전사 인자 FadR에 결합할 수 있고, 지방산 수송(FadL), 활성화(FadD) 및 β-산화(FadA, FadB 및 FadE)를 담당하는 단백질들을 코딩하는 fad 유전자들의 발현을 저하(depress)시킬 수 있다. 대안적인 탄소원들이 이용가능할 때, 박테리아는 아실-ACP로서 지방산을 합성하며, 이는 β-산화에 대한 기질이 아니라, 인지질 합성에 사용된다. 따라서, 아실-CoA 및 아실-ACP 둘 모두는 상이한 최종 생성물을 유도할 수 있는 지방산들의 독립적인 공급원들이다(Caviglia 외, J. Biol. Chem., 279(12):1163-1169(2004)).

표 1: 효소 활성

표 2A: ω-하이드록실라아제/ω-옥시게나아제(EC 1.14.15.3)의 예시들

표 2B: ω-하이드록실라아제/ω-옥시게나아제(EC 1.14.15.3)의 산화환원 파트너(Redox Partner)들의 예시들

표 2C: 자족적 ω-1, ω-2, ω-3-하이드록실라아제/옥시게나아제(EC 1.14.15.3) 융합 단백질들의 예시들

표 2D: 자족적 클래스-I P450-융합 PFOR 융합 단백질들의 예시들

표 3A: 알코올 디하이드로게나아제(EC 1.1.1.1/2) 또는 알코올 옥시다아제(EC 1.1.3.13, EC 1.1.3.20)의 예시들

표 3B: 알데히드 디하이드로게나아제(EC 1.2.1.3/4/5/) 또는 알데히드 옥시다아제(EC 1.2.3.1)의 예시들

표 4: 아미노 트랜스퍼라아제/트랜스아미나아제(EC 2.6.1) 및 아민 디하이드로게나아제(EC 1.4.9, EC 1.4.98, EC 1.4.99)의 예시들

표 5: 에스테라아제(EC 3.1.1.1) 및 리파아제(EC 3.1.1.3)의 예시들

표 6: 하이드로라아제(EC 3.5.2.12)의 예시들

표 7: 아실-CoA 신타아제/아실-CoA 리가아제(EC 6.2.1.3)/트랜스퍼라아제(EC 2.8.3.6)의 예시들

표 8: 아미드 신타아제의 예시들

표 9: 에스테르 신타아제(EC 2.3.1.75 또는 EC 2.3.1.20)의 예시들

도 1 및 도 2는, 전구체 중간체(도 1 참조)로서 C12 유리 지방산(FFA)을 이용하거나 중간체(도 2a 및 도 2b 참조)로서 C12 지방산 메틸 에스테르(FAME)를 이용하는, 2 개의 유사한 경로들을 통해 아실-ACP가 α,ω-이산으로 전환될 수 있는 경로들을 각각 나타낸다.

일 구현예에서, 도 1은 ω-하이드록시 지방산들, ω-옥소 지방산들, α,ω-이산들 및 ω-아미노 지방산들을 포함하는 다양한 화학적 화합물들의 생성을 나타낸다. 도 1의 단계 2에서, 티오에스테라아제는 아실-ACP를 FFA로 전환시키는데 이용된다. 특정 구현예들에서, 티오에스테라아제를 코딩하는 유전자는 tesA, 'tesA, tesB, fatB1, fatB2, fatB3, fatA1 또는 fatA이다(또한, 이 단계를 촉매화하는데 사용될 수 있는 티오에스테라아제의 효소 활성을 갖는 폴리펩티드들을 나타내는 위의 표 1 참조). 또한, 단계 3에서, ω-옥시게나아제라고도 칭해지는 ω-하이드록실라아제가 ω-하이드록시 지방산들을 생성하는데 사용된다. 도 1에서 알 수 있는 바와 같이, 지방산의 오메가 위치는 하이드록시이다.

재조합 숙주 세포들에서 발현되는 CYP153A-리덕타아제 혼성 융합 폴리펩티드들

적절한 ω-하이드록실라아제/ω-옥시게나아제(EC 1.14.15.3) 및 이들의 산화환원 파트너의 예시들이 표 2A 및 2B에 목록화되어 있다(위 참조). 이들은 특정 비-헴 이철 옥시게나아제(non-heme di-iron oxygenase)[예를 들어, 슈도모나스 퓨티다(Pseudomonas putida) GPol으로부터의 alkB], 또는 시토크롬 P450들으로도 알려진 특정 헴-타입 P450 옥시게나아제들[예를 들어, 마리노박터 아쿠애올레이(Marinobacter aquaeolei)로부터의 cypl53A]이 존재한다. 시토크롬 P450들은 편재하여 분포된 효소들이며, 이는 높은 복잡성을 갖고, 광범위한 활성 분야를 나타낸다. 이들은 광범위하고 다양한 기질들을 전환시키고 다양한 화학적 반응들을 촉매화하는 유전자들의 상과(superfamily)에 의해 코딩되는 단백질들이다. Cyp153A는 ω-위치에 대해 높은 선택성을 갖는 탄화수소 사슬들을 수산화하는 가용성 박테리아 시토크롬 P450들의 아과(sub-family)이다(van Beilen 외(2006) Appl. Environ. Microbiol. 72:59-65). cyp153A 계열의 요소들은, 알칸, 지방산 또는 지방족 알코올, 예를 들어 미코박테리움 종(Mycobacterium sp.) HXN-1500으로부터의 cyp153A6(Funhoff 외(2006) J. Bacteriol. 188:5220-5227), 미코박테리움 마리눔(Mycobacterium marinum)으로부터의 cyp153A16 그리고 폴라로모나스 종(Polaromonas sp.) JS666으로부터의 cyp153A(Scheps 외(2011) Org. Biomol. Chem. 9:6727-6733), 그리고 마리노박터 아쿠애올레이로부터의 cyp153A(Honda-Malca 외(2012) Chem. Commun. 48:5115-5117)의 ω-위치를 선택적으로 수산화하기 위해, 시험관 내에서(in vitro) 나타내어졌다.

모든 시토크롬 P450들과 마찬가지로, Cyp153A ω-하이드록실라아제들은 그들의 촉매 활성을 위해 전자들을 필요로 하며, 이들은 페레독신 및 페레독신 리덕타아제와 같은 특이적 산화환원 단백질들을 통해 제공된다. 이들은 cyp153A와 상호작용하는 별개의 단백질들이다. 자족적 혼성 [키메라(chimeric)] cyp153A 옥시게나아제(즉, 활성을 위해 페레독신 및 페레독신 리덕타아제 단백질들을 요구하지 않는 옥시게나아제)가, 플라빈 모노뉴클레오티드(FMN) 및 NADPH-결합 부위 및 [2FeS] 페레독신 중심(Hunter 외(2005) FEBS Lett. 579:2215-2220)을 포함하는 P450RhF로부터의 리덕타아제 도메인과 알카니보락스 보르쿠멘시스(Alcanivorax borkumensis) SK2로부터의 cyp153A(Kubota 외(2005) Biosci. Biotechnol. Biochem. 69:2421-2430; Fujita 외(2009) Biosci. Biotechnol. Biochem. 73: 1825-1830)를 융합시킴으로써 이전에 생성되었다. P450RhF는 클래스-I P450-융합 PFOR(DeMot and Parret (2003) Trends Microbiol. 10: 502)에 속한다. 이 혼성 cyp153A-RedRhF 융합 단백질은 ω-위치의 옥탄을 수산화하고 또한 사이클로헥산 또는 부틸벤젠과 같은 다른 화합물들을 수산화하기 위해 시험관 내 생물형질전환으로 나타내어졌다. 천연 P450-리덕타아제 융합 단백질들의 예시들이 표 2C 및 2D에 나타나 있다(위 참조).

탄화수소 사슬들의 ω-위치를 향한 그들의 높은 선택성을 고려한다면, cyp153A 계열 옥시게나아제들은 재생가능한 탄소원으로부터 α,ω-이작용성 지방산 유도체들을 생성하는데 적합한 후보들의 좋은 예시들인 것으로 나타났다. 이는 상업적으로 실현가능한 공정들의 개발이 이러한 귀중한 화합물들을 생성하게 할 것이다. 그럼에도, 다른 시토크롬 P450들과 마찬가지로, cyp153A 계열 단백질들은 정제된 효소들 또는 원 세포 용해물(crude cell lysate)들을 갖는 시험관 내 실험들에 또는 지방산 유도체들 또는 탄화수소들이 외인성으로 추가되는 휴지 세포 생물형질전환들에 지금까지 대부분 적용되었다(Kubota 외, Fujita 외, Honda-Malca 외, 위 참조). 하지만, 혼성 융합-이용 시험관 내 절차들 또는 휴지 세포 생물형질전환들은 ω-하이드록시 지방산 유도체들의 대규모의 비용-효율적인 생성에 좋지 않다. 해당 기술 분야에 널리 수용되어 있는 지식은 다수의 시토크롬 P450 그리고 alkB-타입 ω-하이드록실라아제가 재조합 미생물들에서 기능적으로 발현시키기 쉽지 않다는 점이며, 이는 효소들이 흔히 비활성이고, 그들의 화학작용을 명확히 밝히기가 어려웠기 때문이다. 실제로, 지금까지 시도된 지방산-유도체들 이외의 재생가능한 탄소원을 이용한 생체 내 작용만이 alkB ω-하이드록실라아제를 이용하였고, 높은 세포 밀도 발효에서만 ω-하이드록시 지방산 유도체들의 낮은 역가를 달성했다(WO2013/024114A2).

본 출원인들은 재생가능한 탄소원으로부터 생체 내에서 ω-하이드록시 지방산 유도체들을 효율적으로 생성할 수 있는 CYP153A-리덕타아제 혼성 융합 단백질들 및 이의 변이체들을 생성하였다. 더 구체적으로, CYP153A(G307A) P450 촉매 도메인의 혼성 융합 단백질을 코딩하는 마리노박터 아쿠애올레이로부터의 유전자 - 이때, 글리신(G)은 307 위치에서 알라닌(A)으로 치환됨 - 는 로도코쿠스 종(Rhodococcus sp.) NCIMB9784(아래의 실시예 6 참조)로부터의 P450RhF의 c-말단 FMN- 및 Fe/S-함유 리덕타아제 도메인을 코딩하는 유전자와 융합되었다. 결과적인 폴리펩티드는 대응하는 핵산 서열(SEQ ID NO: 5)을 갖는 CYP153A-RedRhF 혼성 융합 폴리펩티드(SEQ ID NO: 6)이다. 이 CYP153A-리덕타아제 혼성 융합 단백질이 글루코오스와 같은 탄소원을 갖는 대장균 세포들에서 발현되었을 때, 지방산 유도체들이 ω-하이드록시 지방산 유도체들(아래의 예시들 참조)로 효율적으로 전환되었다. 유사한 CYP153A-리덕타아제 혼성 융합 폴리펩티드들을 생성하는데 사용될 수 있는 적합한 ω-하이드록실라아제들(EC 1.14.15.3) 및 이들의 산화환원 파트너들에 대한 다른 예시들이 표 2A 및 표 2B(위 참조)에 목록화되어 있다.

본 발명은 생체 내에서 α,ω-이작용성 지방산 유도체들을 포함하는 ω-하이드록시 지방산 유도체들을 효율적으로 그리고 선택적으로 생성할 수 있는 미생물들을 제공한다. 일 구현예에서, CYP153A-RedRhF 혼성 융합 단백질은 미생물에서 발현되도록 조작되었으며, 이는 도데칸산 또는 도데칸산 메틸 에스테르와 같은 화합물들을, 글루코오스와 같은 탄소원으로부터 생체 내에서 12-하이드록시 도데칸산 또는 12-하이드록시 도데칸산 메틸 에스테르로 효율적으로 전환시킬 수 있다. 글루코오스 대신 여하한의 재생가능한 공급원료가 탄소원으로서 사용될 수 있다. 따라서, 처음으로, 혼성 융합 단백질이 숙주 세포(예를 들어, 대장균)에서 티오에스테라아제로 공동발현되고(co-expressed), 재생가능한 공급원료로부터 탄소원을 공급할 때, P450 효소 활성을 갖는 조작된 혼성 융합 단백질(즉, CYP153A-RedRhF 혼성 융합 단백질을 통해 예시됨)이 생체 내에서 지방산들을 바람직한 특정 ω-수산화 화합물들(예를 들어, ω-하이드록시 지방산들; ω-하이드록시 지방산 메틸 에스테르들; α,ω-하이드록시 이산들; α,ω-하이드록시 디에스테르들; 및 α,ω-디올들)로 효율적으로 전환시킬 수 있음이 나타내어졌다(실시예 6 그리고 도 25 및 도 26 참조). 본 발명에 따라, cyp153A 단백질을 코딩하는 유전자와 같은 P450 유전자를, 예를 들어 클래스-I P450-융합 PFOR 단백질의 c-말단 리덕타아제 도메인 또는 다른 리덕타아제 도메인을 코딩하는 리덕타아제 유전자에 연결시킴으로써, 다른 혼성 융합 단백질들이 조작될 수 있다. 표 2A 및 2D(위 참조)는 각각 cyp153A 및 클래스-I P450-융합 PFOR 단백질들에 대한 예시를 제공한다. 이러한 지침에 따라, 유사한 융합 단백질들이 다른 타입의 ω-하이드록실라아제/ω-옥시게나아제로부터 생성될 수 있다.

ω-하이드록시 지방산 메틸 에스테르를 통한 도 2a에 도시된 바와 같은 α,ω-이산들 또는 ω-아미노 지방산들에 대한 루트(route), 또는 α,ω-지방산 디메틸 에스테르를 통한 도 2b에 도시된 바와 같은 α,ω-이산들에 대한 루트가 유익할 수 있는데, 이는 대규모 생산 및 회수(recovery)에 대한 장점들을 제공하는 메틸 에스테르가 하전(charge)되지 않기 때문이다. 또한, ω-하이드록시 지방산 메틸 에스테르를 통한 루트는 특정 하이드로라아제들에 의한 촉매화를 통한 직접적 효소 락탐화(enzymatic lactamization)를 허용한다. 또한, 도 1 또는 도 2a 및 도 2b의 단계 3에서, 알코올 디하이드로게나아제 또는 옥시다아제는 ω-하이드록시 지방산을 ω-옥소 지방산으로 전환시킬 수 있다(예를 들어, 위의 표 3A는 이 단계를 촉매화하는데 사용될 수 있는 알코올 디하이드로게나아제 또는 옥시다아제의 효소 활성을 갖는 폴리펩티드들을 나타낸다). 예를 들어, 12-하이드록시 도데칸산 또는 12-하이드록시 도데칸산 메틸 에스테르를 12-옥소 도데칸산 또는 12-옥소 도데칸산 메틸 에스테르로 산화시킬 수 있는 적절한 효소들은 알코올 옥시다아제들[플라빈단백질(flavoprotein), 예를 들어 슈도모나스 퓨티다(EC 1.1.3.13, EC 1.1.3.20)로부터의 alkJ(SEQ ID NO: 67 참조)] 또는 NAD(P)-의존성 알코올 디하이드로게나아제들[예를 들어, 로도코쿠스 루버(Rhodococcus ruber)(EC 1.1.1.1)로부터의 cddC(위의 표 3A 참조)]이다. 이 점에서, 경로는 여기서부터 2 개의 상이한 대안적인 경로들을 따를 수 있으며, 다시 말해 ω-옥소 지방산을, 알데히드 디하이드로게나아제 또는 옥시다아제를 통해, α,ω-이산으로 전환시킬 수 있거나(예를 들어, 위의 표 3B는 이 단계를 촉매화하는데 사용될 수 있는 알데히드 디하이드로게나아제 또는 옥시다아제의 효소 활성을 갖는 폴리펩티드들을 나타냄), ω-옥소 지방산을, 아미노트랜스퍼라아제 또는 트랜스아미나아제 또는 아미노산 디하이드로게나아제를 통해, ω-아미노 지방산으로 전환시킬 수 있다(예를 들어, 위의 표 4는 이 단계를 촉매화하는데 사용될 수 있는 아미노트랜스퍼라아제 또는 트랜스아미나아제 또는 아미노산 디하이드로게나아제의 효소 활성을 갖는 폴리펩티드들을 나타냄). 예를 들어, 12-옥소 라우르산 또는 12-옥소 라우르산 메틸 에스테르를 12-아미노 라우르산 또는 12-아미노 메틸 에스테르로 전환시키기에 적절한 트랜스아미나아제들이 표 4(위 참조)에 도시되어 있다. 이러한 효소들은 대응하는 말단 아민을 생성하기 위해 적절한 공여체로부터의 아민기를 ω-옥소산 또는 에스테르로 전달한다. 아민 공여체들(예를 들어, 알라닌 또는 글루탐산)의 가용성(availability)은 각각의 아미노산 디하이드로게나아제(예를 들어, 알라닌 디하이드로게나아제, 글루타메이트 디하이드로게나아제, 위의 표 4 참조)의 공동발현을 통해 생체 내에서 개선될 수 있다. 또한, NADPH 대신 NADH를 이용할 수 있는 글루타메이트 디하이드로게나아제의 동족체 또는 다른 변이체들의 과발현은 생성에 추가적인 개선들을 제공할 수 있다. 또한, 12-옥소 라우르산 또는 12-옥소 라우르산 메틸 에스테르를 12-아미노 라우르산 또는 12-아미노 메틸 에스테르로 전환시키기에 적절한, 메틸아민 디하이드로게나아제 또는 리신 6-디하이드로게나아제와 같은 효소들의 다른 부류들의 예시들이 표 4에 목록화되어 있다.

또 다른 구현예에서, 도 2a 및 도 2b는 중간체들로서 메틸 에스테르들을 통해 α,ω-이산들 및 ω-아미노 지방산들을 포함하는 다양한 화학적 화합물들의 생성을 나타낸다. 도 2b의 단계 6은 (아실-CoA 리가아제/트랜스퍼라아제를 이용하는) α,ω-디에스테르들의 생성을 나타낸다. 도 2a 및 도 2b의 단계 2에서, 아실-ACP를 지방산 메틸 에스테르(FAME)로 전환시키기 위해 에스테르 신타아제가 이용된다. 특정 구현예들에서, 에스테르 신타아제를 코딩하는 유전자는 효소 분류 EC 2.3.1.75 또는 EC 2.3.1.20의 효소를 코딩하는 유전자이며, 이는 호호바(Simmondsia chinensis), 아시네토박터 종(Acinetobacter sp.) ADP1, 알카니보락스 보르쿠멘시스(Alcanivorax borkumensis), 슈도모나스에루지노사(Pseudomonas aeruginosa), 펀디박터 자덴시스(Fundibacter jadensis), 애기장대(Arabidopsis thaliana) 또는 알칼리제네스 유트로푸스(Alkaligenes eutrophus)로부터 왁스/dgat, 이작용성 에스테르 신타아제/아실-CoA:디아실글리세롤 아실트랜스퍼라아제를 코딩하거나, 이는 AtfA1, AtfA2, ES9, 또는 ES8, 또는 이의 변이체를 코딩한다(또한, 이 단계를 촉매화하는데 사용될 수 있는 에스테르 신타아제의 효소 활성을 갖는 폴리펩티드들을 나타내는 위의 표 9를 참조). 단계 3에서, ω-하이드록시 지방산 메틸 에스테르들을 생성하기 위해 ω-하이드록실라아제(또는 ω-옥시게나아제)가 사용된다(예를 들어, 위의 표 2A는 이 단계를 촉매화하는데 사용될 수 있는 효소 활성을 갖는 폴리펩티드들을 나타낸다). 도 2a에서 알 수 있는 바와 같이, 지방산 메틸 에스테르의 오메가 위치는 하이드록시이다. 또한, 도 2a의 단계 3에서, 알코올 디하이드로게나아제 또는 옥시다아제가 ω-하이드록시 지방산 메틸 에스테르를 ω-옥소 지방산 메틸 에스테르로 전환시킬 수 있다(예를 들어, 위의 표 3A는 이 단계를 촉매화하는데 사용될 수 있는 알코올 디하이드로게나아제 또는 옥시다아제의 효소 활성을 갖는 폴리펩티드들을 나타낸다). 유사하게, 경로는 여기서부터 2 개의 상이한 대안적인 경로들을 따를 수 있으며, 다시 말해 일 경로는 ω-옥소 지방산 메틸 에스테르를, 알데히드 디하이드로게나아제 또는 옥시다아제(위의 표 3B 참조) 그리고 최종적으로 에스테라아제 또는 리파아제(위의 표 5 참조)를 통해, 또는 화학적 전환에 의해, α,ω-이산으로 전환시키는 한편; 또 다른 경로는 ω-옥소 지방산 메틸 에스테르를, 아미노트랜스퍼라아제 또는 트랜스아미나아제 또는 아미노산 디하이드로게나아제(위의 표 4 참조) 그리고 최종적으로 에스테라아제 또는 리파아제(위의 표 5 참조)를 통해, ω-아미노 지방산으로 전환시킨다. 최종 단계(즉, 에스테라아제 또는 리파아제가 α,ω-지방산 메틸 에스테르 또는 ω-아미노 지방산 메틸 에스테르의 나타낸 바와 같은 최종 생성물로의 전환을 촉매화함)는 효소적 및 화학적 전환 단계의 결과일 수 있다. 예를 들어, 이 단계를 가수분해할 수 있는 적합한 효소들이 표 5에 목록화되어 있다. 선택된 리파아제(EC 3.1.1.3) 또는 에스테라아제(EC 3.1.1.1)는 주변세포질(periplasm)에 위치되거나 상청액(supernatant)으로 분비된다. 적합한 분비 신호들 또는 고정 서열(anchoring sequence)들이 해당 기술 분야에 알려진 방법들에 따라 조작될 수 있다. 또 다른 구현예에서, 도 2b는 α,ω-지방산 디메틸 에스테르를 통한 α,ω-이산들의 생성을 나타낸다. 이 경로는 도 2a의 좌측 분지와 유사하지만, 이는 추가적인 아실-CoA 신타아제/아실-CoA 리가아제 또는 트랜스퍼라아제를 이용한다(적합한 후보들에 대한 위의 표 7 참조). 또한, 제 1 단계를 촉매화하는 에스테르 신타아제/아실트랜스퍼라아제가 페널티메이트 단계(penultimate step)를 촉매화할 수 있다.

또 다른 구현예에서, 세포에 생성되는 지방족 알코올(FALC)로부터 α,ω-디올들을 생성하기 위해 재생가능한 공급원료(예를 들어, 글루코오스)로부터 탄소원을 이용할 수 있는 경로들이 도 3 및 도 4에 도시된다. 일 구현예에서, 도 3은 티오에스테라아제 및 카르복실산 리덕타아제 활성을 이용함으로써 α,ω-디올들이 만들어지는 경로를 예시한다(이러한 단계들을 촉매화할 수 있는 폴리펩티드들에 대한 위의 표 1을 참조). 여기서, 티오에스테라아제는 단계 2에서 아실-ACP를 유리 지방산(FFA)으로 전환시킬 수 있다. 카르복실산 리덕타아제는 단계 3에서 결과적인 FFA를 지방족 알데히드로 전환시킬 수 있다. 단계 4에서, 알코올 디하이드로게나아제(위의 표 1 참조)는 지방족 알데히드를 지방족 알코올(FALC)로 전환시킬 수 있다. 마지막으로, 단계 5에서, ω-하이드록실라아제 또는 ω-옥시게나아제(위의 표 2A 참조)가 FALC를 α,ω-디올로 전환시킬 수 있다. 대안적으로, 아실-ACP가 도 4에 예시된 바와 같은 아실-ACP 리덕타아제에 의해 지방족 알데히드로 바로 전환될 수 있다. (위의 표 1은 이러한 단계들을 촉매화하기 위해 티오에스테라아제, 카르복실산 리덕타아제, 아실-ACP 리덕타아제 또는 알코올 디하이드로게나아제의 효소 활성을 갖는 폴리펩티드들을 나타낸다.)

또 다른 구현예에서, 중합체들로 화학적으로 전환될 수 있는 락탐을 생성하는 경로가 도시된다. 이는 아실-CoA-트랜스퍼라아제(위의 표 7 참조) 및 아미드 신타아제(위의 표 8 참조)를 통해 락탐으로 전환될 수 있는 12-아미노 라우르산과 같은 ω-아미노 지방산의 예시를 통해 도 5에 예시된다. 이 특정한 예시에서, 결과적인 락탐은 12-아미노도데카노락탐 또는 라우로락탐이다. 이의 유도된 중합체의 일 예시는 도 5에 도시된 바와 같은 나일론 12이다. 12-아미노 라우르산 메틸 에스테르를 대응하는 락탐으로 직접 락탐화하는 적절한 효소들은 라우로락탐의 직접적인 생성에 대해 동일한 생체촉매의 다른 효소들과 조합하여 사용될 수 있거나; 12-아미노 라우르산 메틸 에스테르의 별도의 생물형질전환으로 사용될 수 있는 특정 하이드로라아제들(위의 표 6 참조)이다. 또한, 리파아제 또는 에스테라아제(위의 표 5 참조)가 12-아미노 라우르산 메틸 에스테르를 대응하는 락탐으로 직접 락탐화할 수 있다.

본 발명은 재조합 숙주 세포들 및 생성 방법들에 유용한 효소 활성을 갖는 폴리펩티드들을 코딩하는 폴리뉴클레오티드들을 식별한다. 효소 활성을 갖는 폴리펩티드들은 화합물들을 포함하는 조성물들의 생성에 기여한다. 일반적으로는 이러한 폴리뉴클레오티드들에 대한 절대적 서열 동일성이 필수적인 것이 아님이 이해될 것이다. 예를 들어, 특정 폴리뉴클레오티드(예를 들어, 효소 기능을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드) 서열의 변화들이 이루어질 수 있으며, 코딩된 폴리펩티드가 활성에 대해 스크리닝될(screened) 수 있다. 이러한 변화들은 통상적으로 보존적 돌연변이들 및 잠재적 돌연변이들(예를 들어, 코돈 최적화)을 포함한다. 유전적으로 조작된 또는 변형된 폴리뉴클레오티드들 및 코딩된 변이 폴리펩티드들은, 해당 기술분야에 알려진 방법들을 이용하여, 증가된 촉매 활성, 증가된 안정성 또는 감소된 억제(예를 들어, 감소된 피드백 억제)를 포함하는(단, 이로 제한되지 않음) 의도한 기능에 대해 스크리닝될 수 있다.

또한, 본 발명은 효소 분류(Enzyme Classification: EC) 번호에 따라 본 명세서에 설명된 바와 같은 ω-수산화 지방산 유도체 생성(위 참조)에 관련된 조작된 경로들의 다양한 단계들(즉, 반응들)에 관련된 효소 활성을 식별하며, 이러한 EC 번호에 의해 분류된 예시적인 폴리펩티드들(효소들) 및 이러한 폴리펩티드들을 코딩하는 예시적인 폴리뉴클레오티드들을 제공한다. 수탁 번호들 및/또는 서열 식별 번호(Sequence Identifier Number: SEQ ID NO)들에 의해 본 명세서에서 식별되는 이러한 예시적인 폴리펩티드들 및 폴리뉴클레오티드들은 본 명세서에 설명된 유전적으로 변형된 숙주 세포들을 얻기 위해 모 숙주 세포들의 α,ω-이산과 같은 다른 이작용성 분자들을 포함하는 ω-하이드록시 지방산 유도체들의 생성을 유도하는 지방산 경로들을 조작하는데 유용하다. 본 명세서에 설명된 폴리펩티드들 및 폴리뉴클레오티드들은 예시적이며 비-제한적이다. 본 명세서에 설명된 예시적인 폴리펩티드들의 상동의 서열들은, 다양한 데이터베이스들[예를 들어, 미국 국립 생물공학 정보센터(NCBI)에 의해 제공되는 Entrez 데이터베이스, 스위스 생물정보학 연구소(Swiss Institute of Bioinformatics)에 의해 제공되는 ExPasy 데이터베이스, 브라운슈바이크 기술대학(Technical University of Braunschweig)에 의해 제공되는 BRENDA 데이터베이스, 및 교토대 및 동경대의 생물정보학 센터(Bioinformatics Center of Kyoto University and University of Tokyo)에 의해 제공되는 KEGG 데이터베이스, 이 모두는 월드 와이드 웹에서 이용가능함]을 통해 해당 기술분야의 당업자들이 이용가능하다.

일 구현예에서, 본 명세서에 설명된 바와 같은 재조합 미생물들(위 참조)은 짝수 탄소 사슬을 갖는 ω-하이드록시 지방산 유도체들을 생성한다. 또 다른 구현예에서, 재조합 미생물들은 홀수 탄소 사슬을 갖는 ω-하이드록시 지방산 유도체들을 생성하도록 조작될 수 있다. 예를 들어, ω-하이드록실라아제 경로들은 홀수-사슬 지방산 유도체들을 과잉생성(overproduce)하는 재조합 세포들(예를 들어, 대장균)에서 발현될 수 있다(특정 박테리아 균주들을 통한 홀수-사슬 지방산 유도체들의 과잉생성은 미국 특허 공개공보 US2012/0070868호에 개시되어 있으며, 본 명세서에서 인용 참조된다). 이는 홀수-사슬 ω-수산화 지방산 유도체들의 생성을 허용한다. 일 구현예에서, ω-하이드록실라아제(예를 들어, CYP153A-RedRhF 혼성 융합 단백질) 및 oleT(예를 들어, Rude 외(2011) Appl. Environ. Microbiol. 77: 1718 참조)와 같은 지방산 디카르복실라아제의 발현과 조합될 때 홀수-사슬 지방산을 과잉생성하는 재조합 균주는, 예를 들어, 9-데센-1-올, 11-도데센-1-올, 13-테트라데센-1-올 및 15-헥사데센-1-올과 같은 말단 이중 결합을 갖는 짝수-사슬 지방족 알코올들을 생성한다.

또 다른 구현예에서, 아말단 수산화 지방산 유도체들이 제공된다. 이들은 오메가-1 위치 및/또는 오메가-2 위치 및/또는 오메가-3 위치 및/또는 오메가-4 위치 등(예를 들어, ω-1, ω-2 및/또는 ω-3; 등)에서 적어도 하나의 OH 기를 갖는 화합물들이다. 실시예 8 및 9는 cyp102A 계열(Whitehouse 외(2012) Chem. Soc. Rev. 41: 1218)로부터 시토크롬 P450 옥시게나아제들을 이용함으로써 유전적으로 변형된 숙주 세포들에서의 이러한 화합물들의 생성을 나타낸다. cyp102A 계열의 시토크롬 P450 옥시게나아제들은 아말단 수산화 지방산 유도체들을 생성하기에 적합하다. 하지만, 이러한 효소들은, ω-위치에서 지방산 유도체들을 우세하게 수산화하도록 그들의 기질 특수성이 변경되지 않는 한 - 이는 지금까지 부분적으로만 성공적이었음(Lentz 외(2006) ChemBioChem. 7: 345) -, 재조합 숙주들에서 ω-수산화 지방산 유도체들을 효율적으로 생성하기에 적합하지 않다.

재조합 숙주 세포들에서 발현된 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체들

본 발명은 재조합 숙주 세포들에서 발현될 때 ω-수산화 지방산 유도체 조성물들의 높은 역가, 수율 및/또는 생산성을 유도하는 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체들을 식별한다. 본 발명의 비-제한적인 예시들에서, CYP153A(G307A)-RedRhF 혼성 융합 폴리펩티드(아래의 실시예 6 참조)는 증가된 양의 ω-OH 지방산들 및 ω-OH 지방산 유도체들을 생성하기 위해 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체들(아래의 실시예들 14 내지 10 참조)을 효율적으로 조작하는 주형(template)으로서 사용되었다. 예를 들어, 숙주 세포에서 발현될 때 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 도데칸산과 같은 화합물들을, 글루코오스와 같은 단순한 탄소원으로부터 생체 내에서 12-하이드록시 도데칸산으로 효율적으로 전환시킬 수 있다. (부연하면, 조작된 CYP153A-RedRhF 혼성 융합 폴리펩티드 변이체를 통해 예시된) 조작된 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는, 재생가능한 공급원료로부터 탄소원(예를 들어, 글루코오스)을 이용함으로써 숙주 세포(예를 들어, 대장균)에서 티오에스테라아제로 공동발현될 때 생체 내에서 지방산들을 (ω-OH 지방산들을 포함하는) 바람직한 특정 화합물들로 효율적으로 전환시킬 수 있는 것으로 나타났다(아래의 예시들을 참조). 본 발명에 따라, CYP153A 단백질을 코딩하는 유전자와 같은 돌연변이된 유전자를, c-말단 리덕타아제 도메인을 코딩하는 돌연변이된 유전자에 연결시킴으로써 다른 혼성 융합 폴리펩티드 변이체들이 조작될 수 있다(위의 표 2A 내지 2D 참조). 두 유전자들(P450 및 리덕타아제 도메인)을 돌연변이화하거나 하나의 유전자(P450 또는 리덕타아제 도메인)를 돌연변이화하는 변이체들이 여기에 포함된다. 이러한 지침들에 따라, 유사한 융합 단백질 변이체들이 다른 타입의 ω-하이드록실라아제로부터 생성될 수 있으며, ω-OH 지방산 유도체들을 생성하기 위해 재조합 숙주 세포들에서 발현될 수 있다.

따라서, 본 발명은 탄소원(예를 들어, 글루코오스, 수크로오스 또는 재생가능한 공급원료로부터 유래된 여타의 탄소원)으로 배양될 때 ω-수산화 지방산 유도체 조성물들의 높은 역가, 수율 및/또는 생산성을 가져오는 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체들을 발현시키는 재조합 숙주 세포들에 관한 것이다. CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 CYP153A 도메인 또는 리덕타아제 도메인 또는 둘 모두에서 하나 이상의 돌연변이를 갖는다. 일 구현예에서, 본 발명은 SEQ ID NO: 6에 대해 적어도 약 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 99 %의 서열 동일성을 갖고, 27, 82, 141, 178, 231, 309, 407, 415, 516, 666 및/또는 796 위치를 포함하는 아미노산 위치에서 하나 이상의 돌연변이를 갖는 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체를 제공하며, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 생체 내에서 지방산의 ω-OH 지방산으로의 전환을 촉매화한다. 더 구체적으로, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는, 다음의 돌연변이들 - 예컨대, 아르기닌(R)이 리신(L)으로 치환된 R27L; 아르기닌(R)이 아스파르트산(D)으로 치환된 위치 R82D; 발린이 이소류신(I)으로 치환된 위치 V141I; 발린(V)이 글루타민(Q)으로 치환된 위치 V141Q; 발린(V)이 글리신(G)으로 치환된 V141G; 발린(V)이 메티오닌(M)으로 치환된 V141M; 발린(V)이 류신(L)으로 치환된 위치 V141L; 발린(V)이 트레오닌(T)으로 치환된 위치 V141T; 아르기닌(R)이 아스파라긴(N)으로 치환된 위치 R178N; 알라닌(A)이 트레오닌(T)으로 치환된 위치 A231T; 아스파라긴(N)이 아르기닌(R)으로 치환된 위치 N309R; 아스파라긴(N)이 알라닌(A)으로 치환된 N407A; 발린(V)이 아르기닌(R)으로 치환된 위치 V415R; 트레오닌(T)이 발린(V)으로 치환된 위치 T516V; 프롤린(P)이 알라닌(A)으로 치환된 위치 P666A; 프롤린(P)이 아스파르트산(D)으로 치환된 P666D; 및 알라닌(A)이 발린(V)으로 치환된 위치 A796V를 포함함 - 중 하나 이상을 갖는다. CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체들의 예시들은 SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28 또는 SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44 및 SEQ ID NO: 46을 포함한다. 일 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 혼성 cyp153A-RedRhF-타입 융합 단백질 변이체이다. 또 다른 구현예에서, 재조합 숙주 세포에서의 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 대응하는 숙주 세포에서의 CYP153A-리덕타아제 혼성 융합 폴리펩티드의 발현에 의해 생성된 ω-OH 지방산 조성물의 역가에 비해 ω-OH 지방산 유도체 조성물의 더 높은 역가를 가져온다. 또 다른 구현예에서, 재조합 숙주 세포에서의 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는ω-OH C₁₂, ω-OH C₁₄, ω-OH C₁₆, ω-OH C₁₈, ω-OH C_12:1, ω-OH C_14:1, ω-OH C_16:1 및 ω-OH C_18:1 지방산 유도체 조성물을 포함하는(단, 이로 제한되지 않음) ω-OH 지방산 유도체 조성물의 더 높은 역가를 가져온다.

또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 아미노산 위치 141(V141I 및/또는 V141T를 포함함)에서 돌연변이를 갖는다. 여기서, 재조합 숙주 세포에서 돌연변이들 V141I 또는 V141T를 갖는 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체의 발현은, CYP153A-리덕타아제 혼성 융합 폴리펩티드의 발현에 의해 생성된 ω-OH C₁₂ 또는 C₁₆ 지방산 조성물의 역가에 비해 각각 ω-OH C₁₂ 또는 C₁₆ 지방산 조성물의 더 높은 역가를 가져온다. 일 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 돌연변이들 V141I 및 A231T(SEQ ID NO: 32)를 가지며, 티오에스테라아제의 효소 기능을 갖는 숙주 세포에서 발현될 때 증가된 양의 ω-OH C₁₂ 지방산을 생성한다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 돌연변이들 R27L, R82D, V141M, R178N 및 N407A(SEQ ID NO: 34)를 가지며, 티오에스테라아제의 효소 기능을 갖는 숙주 세포에서 발현될 때 증가된 양의 ω-OH C₁₂ 지방산을 생성한다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 돌연변이 P666A(SEQ ID NO: 36)를 가지며, 티오에스테라아제의 효소 기능을 갖는 숙주 세포에서 발현될 때 증가된 양의 ω-OH C₁₂ 지방산을 생성한다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 돌연변이 A796V(SEQ ID NO: 38)를 가지며, 티오에스테라아제의 효소 기능을 갖는 숙주 세포에서 발현될 때 증가된 양의 ω-OH C₁₂ 지방산을 생성한다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 돌연변이들 A796V, P666D 및 T516V(SEQ ID NO: 40)를 가지며, 티오에스테라아제의 효소 기능을 갖는 숙주 세포에서 발현될 때 증가된 양의 ω-OH C₁₂ 지방산을 생성한다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 돌연변이들 V141I, A231T 및 A796V(SEQ ID NO: 42)를 가지며, 티오에스테라아제의 효소 기능을 갖는 숙주 세포에서 발현될 때 증가된 양의 ω-OH C₁₂ 및 C₁₆ 지방산을 생성한다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 돌연변이들 R27L, R82D, V141M, R178N, N407A 및 A796V(SEQ ID NO: 44)를 가지며, 티오에스테라아제의 효소 기능을 갖는 숙주 세포에서 발현될 때 증가된 양의 ω-OH C₁₂ 지방산을 생성한다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 돌연변이들 V141T, A231T 및 A796V(SEQ ID NO: 46)를 가지며, 티오에스테라아제의 효소 기능을 갖는 숙주 세포에서 발현될 때 증가된 양의 ω-OH C₁₆ 지방산을 생성한다.

본 발명은 CYP153A-리덕타아제 혼성 융합-관련 폴리뉴클레오티드 및 폴리펩티드 변이체들을 식별한다. CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체들은 SEQ ID NOS: 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44 및 46을 포함한다. CYP153A-리덕타아제 혼성 융합 핵산 변이체들(DNA 서열들)은 SEQ ID NOS: 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45 및 47을 포함한다. 하지만, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체들에 대한 절대적인 서열 동일성이 필수적인 것은 아님을 이해할 것이다. 예를 들어, 특정 폴리뉴클레오티드 서열의 변화가 이루어질 수 있으며, 코딩된 폴리펩티드가 활성에 대해 스크리닝될 수 있다. 이러한 변화는 통상적으로, 이를테면 코돈 최적화를 통해 보존적 돌연변이들 및 잠재적 돌연변이들을 포함한다. 변형된 또는 돌연변이된(즉, 돌연변이) 폴리뉴클레오티드들 및 코딩된 변이 폴리펩티드들은, 해당 기술분야에 알려진 방법들을 이용하여, 증가된 촉매 활성, 증가된 안정성 또는 감소된 억제(예를 들어, 감소된 피드백 억제)를 포함하는(단, 이로 제한되지 않음) 야생형 또는 주형 폴리펩티드에 비해 개선된 기능과 같은 의도한 기능에 대해 스크리닝될 수 있다. 본 발명은 효소 분류(Enzyme Classification: EC) 번호에 따라 본 명세서에 설명된 지방산 생합성 경로들의 다양한 단계들(즉, 반응들)과 관련된 효소 활성을 식별하며, 이러한 EC 번호에 의해 분류된 (예를 들어, 특정 효소들로서 기능하고 특정 효소 활성을 나타내는) 예시적인 폴리펩티드들 및 이러한 폴리펩티드들을 코딩하는 예시적인 폴리뉴클레오티드들을 제공한다. 서열 식별 번호(SEQ ID NO; 위 참조)들에 의해 본 명세서에서 식별되는 이러한 예시적인 폴리펩티드들 및 폴리뉴클레오티드들은 도 1에 도시된 것과 같은 숙주 세포들에서 지방산 경로들을 조작하는데 유용하다. 하지만, 본 명세서에 설명된 폴리펩티드들 및 폴리뉴클레오티드들은 예시이며, 따라서 비-제한적임을 이해하여야 한다. 본 명세서에 설명된 예시적인 폴리펩티드들의 상동의 서열들은, 데이터베이스들[예를 들어, 미국 국립 생물공학 정보센터(NCBI)에 의해 제공되는 Entrez 데이터베이스, 스위스 생물정보학 연구소(Swiss Institute of Bioinformatics)에 의해 제공되는 ExPasy 데이터베이스, 브라운슈바이크 기술대학(Technical University of Braunschweig)에 의해 제공되는 BRENDA 데이터베이스, 및 교토대 및 동경대의 생물정보학 센터(Bioinformatics Center of Kyoto University and University of Tokyo)에 의해 제공되는 KEGG 데이터베이스, 이 모두는 월드 와이드 웹에서 이용가능함]을 이용하여 해당 기술분야의 당업자들이 이용가능하다.

일 구현예에서, 본 발명을 구현하는데 사용하기 위한 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28 또는 SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44 및 SEQ ID NO: 46에 대해 적어도 약 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % 또는 100 %의 서열 동일성을 갖는다. 몇몇 구현예들에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 글리신(G)이 알라닌(A)으로 치환된 마리노박터 아쿠애올레이로부터의 CYP153A(G307A) 폴리펩티드로부터 유래되며, 로도코쿠스 종 NCIMB9784로부터의 P450RhF의 리덕타아제 도메인과 융합된다. 시토크롬 P450RhF는 자족적이고, 고도의 기질 무차별성(substrate promiscuity)을 나타내며, 광범위한 작용기들을 촉매화한다. 다른 구현예들에서, 본 발명을 구현하는데 사용하기 위한 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28 또는 SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44 또는 SEQ ID NO: 46에 대해 적어도 약 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 99 %의 서열 동일성을 가지며, 또한 본 명세서에 설명된 바와 같은 유용한 특징들 및/또는 특성들을 유도하는 하나 이상의 치환을 포함할 수 있다. 다른 구현예들에서, 본 발명을 구현하는데 사용하기 위한 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28 또는 SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44 또는 SEQ ID NO: 46에 대해 100 %, 99 %, 98 %, 97 %, 96 %, 95 %, 94 %, 93 %, 92 %, 91 % 또는 90 %의 서열 동일성을 갖는다. 또 다른 구현예들에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체의 P450 촉매 도메인은 마리노박터 아쿠애올레이 이외의 종들로부터 유래된다. 이러한 다른 종들은 아시네토박터 종, 미코박테리움 마리눔(Mycobacterium marinum), 폴라로모나스 종(Polaromonas sp.), 알카니보락스 보르쿠멘시스, 버크홀데리아 펀고룸(Burkholderia fungorum), 카울로박터 크레센투스(Caulobacter crescentus), 하이호모나스 넵투늄(Hyphomonas neptunium), 로도슈도모나스 팔루스트리스(Rhodopseudomonas palustris), 스핀고모나스 종(Sphingomonas sp.), 미코박테리움 종을 포함한다(단, 이로 제한되지 않음). 또 다른 구현예들에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체의 리덕타아제 도메인은 로도코쿠스 종 이외의 종들로부터 유래된다. 이러한 다른 종들은 로도코쿠스 에퀴(Rhodococcus equi), 아시네토박터 라디오레시스텐스(Acinetobacter radioresistens), 버크홀데리아 말레이(Burkholderia mallei), 버크홀데리아 말레이, 랄스토니아 유트로파(Ralstonia eutropha), 쿠프리아비두스 메탈리두란스(Cupriavidus metallidurans)를 포함한다(단, 이로 제한되지 않음).

관련 구현예에서, 본 발명은 SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45 또는 SEQ ID NO: 47에 대해 적어도 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 99 %의 서열 동일성을 갖는 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체를 포함한다. 몇몇 구현예들에서, 핵산 서열은 본 명세서에 설명된 바와 같은 개선된 특징들 및/또는 특성들을 가져오는 하나 이상의 치환을 갖는 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체를 코딩한다. 또 다른 관련 구현예에서, 본 발명을 구현하는데 사용하기 위한 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45 또는 SEQ ID NO: 47에 대해 100 %, 99 %, 98 %, 97 %, 96 %, 95 %, 94 %, 93 %, 92 %, 91 % 또는 90 %의 서열 동일성을 갖는 뉴클레오티드 서열에 의해 코딩된다. 또 다른 실시형태에서, 본 발명은 SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45 또는 SEQ ID NO: 47에 대응하는 핵산 서열의 실질적인 전체 길이에 걸쳐 엄격한 조건들 하에서 혼성화되는 핵산 서열에 의해 코딩되는 아미노산 서열을 포함하는 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체들에 관한 것이다. 몇몇 구현예들에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 마리노박터 아쿠애올레이 종들로부터 유래된다. 다른 구현예들에서, P450 혼성 융합 폴리펩티드는 아시네토박터 종, 미코박테리움 마리눔, 폴라로모나스 종, 알카니보락스 보르쿠멘시스, 버크홀데리아 펀고룸, 카울로박터 크레센투스, 하이호모나스 넵투늄, 로도슈도모나스 팔루스트리스, 스핀고모나스 종, 미코박테리움 종으로부터 유도된다.

변이들 및 돌연변이들

본 명세서에서 사용되는 바와 같은 변이 폴리펩티드는 적어도 하나의 아미노산에 의해 야생형 또는 주형 폴리펩티드와 상이한 아미노산 서열을 갖는 폴리펩티드를 지칭한다. 예를 들어, 변이체(예를 들어, 돌연변이체)는 다음의 보존적 아미노산 치환들 - 지방족 아미노산, 예컨대 알라닌, 발린, 류신, 및 이소류신의 또 다른 지방족 아미노산으로의 대체; 세린의 트레오닌으로의 대체; 트레오닌의 세린으로의 대체; 산성 잔기, 예컨대 아스파르트산 및 글루탐산의 또 다른 산성 잔기로의 대체; 아미드기를 지닌 잔기, 예컨대 아스파라긴 및 글루타민의 또 다른 아미드기를 지닌 잔기로의 대체; 염기성 잔기, 예컨대 리신 및 아르기닌의 또 다른 염기성 잔기로의 교체; 및 방향족 잔기, 예컨대 페닐알라닌 및 티로신의 또 다른 방향족 잔기로의 대체를 포함함 - 중 하나 이상을 포함할 수 있다(단, 이로 제한되지 않음). 몇몇 구현예들에서, 변이 폴리펩티드는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100 또는 그 이상의 아미노산 치환, 첨가, 삽입 또는 결실을 갖는다. 변이체 또는 돌연변이체로서 기능하는 폴리펩티드의 몇몇 바람직한 단편은 대응하는 야생형 폴리펩티드의 생물학적 기능(예를 들어, 효소 활성)의 일부 또는 전부를 보유한다. 몇몇 구현예들에서, 단편은 대응하는 야생형 폴리펩티드의 생물학적 기능의 적어도 75 %, 적어도 80 %, 적어도 90 %, 적어도 95 %, 또는 적어도 98 % 이상을 보유한다. 다른 구현예들에서, 단편 또는 돌연변이체는 대응하는 야생형 폴리펩티드의 생물학적 기능의 약 100 %를 보유한다. 다른 구현예들에서, 몇몇 단편들은 대응하는 야생형 폴리펩티드에 비해 증가된 생물학적 기능을 나타내었다. 어떤 아미노산 잔기들이 생물학적 활성에 영향을 주지 않고 치환, 삽입, 또는 결실될 수 있는지를 결정하는 가이던스(guidance)는 해당 기술분야에 잘 알려진 컴퓨터 프로그램들, 예를 들어 LASERGENE 소프트웨어(DNASTAR, Inc., Madison, WI)를 이용하여 찾을 수 있다. 몇몇 구현예들에서, 단편은 대응하는 야생형 폴리펩티드 또는 주형 폴리펩티드에 비해 증가된 생물학적 기능을 나타낸다. 예를 들어, 단편은 대응하는 야생형 폴리펩티드 또는 주형 폴리펩티드에 비해 효소 활성에 있어서 적어도 10 %, 적어도 25 %, 적어도 50 %, 적어도 75 %, 또는 적어도 90 %의 개선을 나타낼 수 있다. 다른 구현예들에서, 단편은 대응하는 야생형 폴리펩티드 또는 주형 폴리펩티드에 비해 효소 활성에 있어서 적어도 100 % 또는 적어도 200 % 또는 적어도 500 %의 개선을 나타낸다.

본 명세서에 설명된 폴리펩티드들은 추가적인 보존적 또는 비-필수 아미노산 치환들을 가질 수 있으며, 이는 폴리펩티드 기능에 실질적인 영향을 주지 않는다는 것을 이해한다. 특정 치환이 용인되는지(즉, ω-하이드록실라아제 효소 활성과 같은 의도한 생물학적 기능에 부정적인 영향을 주지 않는지)의 여부가 해당 기술분야에 알려진 바와 같이 결정될 수 있다(Bowie 외(1990) Science 247:1306-1310 참조). 보존적 아미노산 치환은 아미노산 잔기가 유사한 곁사슬(side chain)을 갖는 아미노산 잔기로 대체되는 것이다. 유사한 곁사슬들을 갖는 아미노산 잔기들의 계열들이 해당 기술분야에 정의되어 있다. 이 계열들은 염기성 곁사슬(예를 들어, 리신, 아르기닌, 히스티딘), 산성 곁사슬(예를 들어, 아스파르트산, 글루탐산), 비전하 극성 곁사슬(uncharged polar side chain)(예를 들어, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 무극성 곁사슬(예를 들어, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지형 곁사슬(예를 들어, 트레오닌, 발린, 이소류신), 및 방향족 곁사슬(예를 들어, 티로신, 페닐알라닌, 트립토판, 히스티딘)을 갖는 아미노산들을 포함한다.

변이체들은 자연적으로 발생하거나 시험관 내에서 생성될 수 있다. 특히, 이러한 변이체들은 부위 지향 돌연변이(site directed mutagenesis), 무작위 화학적 돌연변이(random chemical mutagenesis), 엑소뉴클레아제 Ⅲ 결실 절차, 또는 표준 클로닝 기술들과 같은 유전자 조작 기술들을 이용하여 생성될 수 있다. 대안적으로, 이러한 변이체, 돌연변이체, 단편, 유사체, 또는 유도체는 화학적 합성 또는 변형 절차들을 이용하여 생성될 수 있다. 변이체를 만드는 방법들이 해당 기술분야에 잘 알려져 있다. 예를 들어, 변이체들은 무작위 및 부위 지향 돌연변이를 이용함으로써 제조(prepare)될 수 있다. 무작위 및 부위 지향 돌연변이는 일반적으로 당업계에 알려져 있다(예를 들어, Arnold(1993) Curr. Opin. Biotech. 4:450-455 참조). 무작위 돌연변이는 오류 유발(error prone) PCR(예를 들어, Leung 외(1989) Technique 1:11-15; 및 Caldwell 외(1992) PCR Methods Applic. 2:28-33 참조)을 이용하여 달성될 수 있다. 오류 유발 PCR에서, 실제 PCR은 DNA 폴리메라아제의 복사 정확도(copying fidelity)가 낮은 조건들 하에서 수행되어, PCR 생성물의 전체 길이를 따라 높은 점 돌연변이율(high rate of point mutations)이 얻어지도록 한다. 간명하게, 이러한 절차들에서, 돌연변이유발될 핵산(예를 들어, P450 단백질 또는 P450 혼성 융합 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열)은 PCR 생성물의 전체 길이를 따라 높은 점 돌연변이율을 달성하기 위하여 PCR 프라이머, 반응 완충제, MgCl₂, MnCl₂, Taq 폴리메라아제, 및 적절한 농도의 dNTP와 혼합된다. 예를 들어, 이러한 반응은 돌연변이유발될 20 fmole의 핵산, 30 pmole의 각 PCR 프라이머, 50 mMKCl, 10 mM Tris HCl(pH 8.3), 0.01 % 젤라틴을 포함하는 반응 완충제, 7 mM MgCl₂, 0.5 mM MnCl₂, 5 단위(unit)의 Taq 폴리메라아제, 0.2 mM dGTP, 0.2 mM dATP, 1 mM dCTP, 그리고 1 mM dTTP를 이용하여 수행될 수 있다. PCR은 94 ℃에서 1 분, 45 ℃에서 1 분, 그리고 72 ℃에서 1 분의 30 회 주기 동안 수행될 수 있다. 하지만, 당업자라면 이러한 파라미터들은 적절하게 변동될 수 있음을 이해할 것이다. 이후, 돌연변이유발된 핵산은 적절한 벡터로 클로닝되며, 돌연변이유발된 핵산에 의해 코딩되는 폴리펩티드들의 활성이 평가된다. 부위 지향 돌연변이가 관심 있는 여하한의 클로닝된 DNA의 부위-특이적 돌연변이를 생성하기 위해 올리고뉴클레오티드-지향 돌연변이유발을 이용하여 달성될 수 있다. 올리고뉴클레오티드 돌연변이유발은 당업계에 기술되어 있다(예를 들어, Reidhaar-Olson 외(1988) Science 241:53-57 참조). 간명하게, 이러한 절차들에서, 클로닝된 DNA 내로 도입될 하나 이상의 돌연변이를 지닌 복수의 이중 가닥 올리고뉴클레오티드가 합성되고, 돌연변이유발될 클로닝된 DNA(예를 들어, P450 폴리펩티드 또는 P450 혼성 융합 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열) 내로 삽입된다. 돌연변이유발된 DNA를 함유한 클론들이 회수되고, 이들이 코딩한 폴리펩티드의 활성이 평가된다.

변이체를 생성하는 또 다른 방법은 조립(assembly) PCR이다. 조립 PCR은 작은 DNA 단편들의 혼합으로부터 PCR 생성물의 조립을 수반한다. 다수의 상이한 PCR 반응이 동일한 바이알(vial)에서 병행하여 일어나며, 일 반응의 생성물이 또 다른 반응의 생성물을 프라이밍한다(priming)(미국 특허 5,965,408 참조). 변이체를 생성하는 또 다른 방법은 유성(sexual) PCR 돌연변이유발이다. 유성 PCR 돌연변이유발에서는, 강제된(forced) 상동성 재조합이 서열 상동성에 기초한 DNA 분자의 무작위 단편화의 결과로서 시험관 내에서 상이하지만 고도로 관련된 DNA 서열들의 DNA 분자들 사이에 일어난다. 이후, PCR 반응의 프라이머 신장법(primer extension)에 의한 크로스오버(crossover)의 고정(fixation)이 후속된다. 유성 PCR 돌연변이유발은 당업계에 알려진 출간물에 기술되어 있다(예를 들어, Stemmer(1994) Proc. Natl. Acad. Sci., U.S.A. 91:10747-10751). 또한, 변이체들은 생체 내 돌연변이유발에 의해 생성될 수 있다. 몇몇 구현예들에서, 핵산 서열에서의 무작위 돌연변이는 DNA 보수 경로(repair pathway) 중 하나 이상에서 돌연변이를 갖는(carries) 박테리아 균주, 예컨대 대장균 균주에서의 서열을 증식시킴으로써 생성된다. 이러한 돌연변이유발 유전자 균주(mutator strain)는 야생형 균주보다 높은 무작위 돌연변이율을 갖는다. 이러한 균주들 중 하나에서의 DNA 서열(예를 들어, P450 혼성 융합 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열)의 증식이 결국 DNA 내에서 무작위 돌연변이를 생성할 것이다. 생체 내 돌연변이유발에 사용하기 적절한 돌연변이유발 유전자 균주는 해당 기술분야의 공보(예를 들어, 국제 특허 출원 공개공보 WO 1991/016427)에 기술되어 있다. 또한, 변이체들은 카세트 돌연변이유발(cassette mutagenesis)을 이용하여 생성될 수 있다. 카세트 돌연변이유발에서는, 이중 가닥 DNA 분자의 작은 영역이 원래의 서열과 상이한 합성 올리고뉴클레오티드 카세트로 대체된다. 올리고뉴클레오티드는 흔히 완전히 및/또는 부분적으로 무작위화된 원래의 서열을 포함한다. 또한, 반복 앙상블 돌연변이유발(recursive ensemble mutagenesis)이 변이체들을 생성하는데 사용될 수 있다. 반복 앙상블 돌연변이유발은 표현형 관련 돌연변이체들(phenotypically related mutants)(이의 요소들은 아미노산 서열이 상이함)의 다양한 개체군들을 생성하기 위해 개발된 단백질 조작(즉, 단백질 돌연변이유발)을 위한 알고리즘이다. 이 방법은 조합 카세트 돌연변이유발의 연속 라운드(successive rounds)를 제어하기 위해 피드백 메커니즘을 이용한다(예를 들어, Arkin 외(1992) Proc. Natl. Acad. Sci., U.S.A. 89:7811-7815 참조). 몇몇 구현예들에서, 변이체들은 지수 앙상블 돌연변이유발(exponential ensemble mutagenesis)을 이용하여 생성된다. 지수 앙상블 돌연변이유발은 높은 백분율의 독특한 기능성 돌연변이체를 갖는 조합 라이브러리들(combinatorial libraries)을 생성하는 프로세스이며, 잔기들의 작은 그룹들이 기능성 단백질들을 야기하는 아미노산을 각각의 변경된 위치에서 식별하기 위해 병행하여 무작위화된다(예를 들어, Delegrave 외(1993) Biotech. Res. 11:1548-1552 참조). 몇몇 구현예들에서, 변이체들은 별개의 폴리펩티드들을 코딩하는 복수의 핵산들의 부분들이 함께 융합되어 키메라 폴리펩티드를 코딩하는 키메라 핵산 서열들을 생성하도록 셔플링 절차(shuffling procedure)들을 이용하여 생성된다(예를 들어, 미국 특허 5,965,408 및 5,939,250에 개시됨).

발현 벡터들

몇몇 구현예들에서, 폴리뉴클레오티드(또는 유전자) 서열이 폴리뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함하는 재조합 벡터에 의해 숙주 세포에 제공된다. 특정 구현예들에서, 프로모터는 발달-조절된, 세포소기관-특이적, 조직-특이적, 유도성, 구성적, 또는 세포-특이적 프로모터이다. 몇몇 구현예들에서, 재조합 벡터는 폴리뉴클레오티드 서열에 작동가능하게 연결된 발현 조절 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; 폴리뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티; 폴리뉴클레오티드 서열에 작동가능하게 연결된 분비 서열; 및 폴리뉴클레오티드 서열에 작동가능하게 연결된 표적화 서열로부터 선택되는 적어도 하나의 서열을 포함한다. 본 명세서에 설명된 발현 벡터들은 숙주 세포 내에서의 폴리뉴클레오티드 서열의 발현에 적절한 형태인 폴리뉴클레오티드 서열을 포함한다. 당업자라면, 발현 벡터의 설계가 형질전환될 숙주 세포의 선택, 의도한 폴리펩티드의 발현 수준 등과 같은 요인들에 의존할 수 있다는 것을 이해할 것이다. 본 명세서에 설명된 발현 벡터들은 앞서 설명된 바와 같은 폴리뉴클레오티드 서열들(위 참조)에 의해 코딩되는, 융합 폴리펩티드들을 포함하는 폴리펩티드들을 생성하도록 숙주 세포들에 도입될 수 있다. 흔히, 원핵생물, 예를 들어 대장균에서 폴리펩티드들을 코딩하는 유전자의 발현은 대부분 융합 또는 비-융합 폴리펩티드들의 발현을 지시하는 구성적 또는 유도성 프로모터를 함유하는 벡터들로 수행된다. 융합 벡터들은 그 안에 코딩된 폴리펩티드에, 보통 재조합 폴리펩티드의 아미노- 또는 카르복시-말단에 다수의 아미노산들을 추가한다. 이러한 융합 벡터들은 통상적으로 다음의 세 가지 목적, 즉 재조합 폴리펩티드의 발현을 증가시키고; 재조합 폴리펩티드의 용해도를 증가시키며; 친화성 정제에서 리간드로서 작용함으로써 재조합 폴리펩티드의 정제를 돕는 것 중 하나 이상을 제공한다. 흔히, 융합 발현 벡터에서, 융합 모이어티와 재조합 폴리펩티드의 접합점에 단백질분해 절단 부위가 도입된다. 이는 융합 폴리펩티드의 정제 이후에 융합 모이어티로부터 재조합 폴리펩티드의 분리를 가능하게 한다. 이러한 효소들 및 이들의 동족 인식 서열(cognate recognition sequence)들의 예시들은 Xa 인자(Factor Xa), 트롬빈 및 엔테로키나아제를 포함한다. 예시적인 융합 발현 벡터는 pGEX 벡터(Pharmacia Biotech, Inc., Piscataway, NJ; Smith 외(1988) Gene 67:31-40), pMAL 벡터(New England Biolabs, Beverly, MA), 및 pRITS 벡터(Pharmacia Biotech, Inc., Piscataway, N.J.)를 포함하고, 이들은 표적 재조합 폴리펩티드에 각각 글루타티온 S-트랜스퍼라아제(GST), 말토스 E 결합 단백질, 또는 단백질 A를 융합시킨다.

유도성, 비-융합 대장균 발현 벡터의 예시들은 pTrc 벡터(Amann 외(1988) Gene 69:301-315) 및 pET 11d 벡터(Studier 외, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, Calif.(1990) 60-89)를 포함한다. pTrc 벡터로부터의 표적 유전자 발현은 혼성 trp-lac 융합 프로모터로부터의 숙주 RNA 폴리메라아제 전사에 의존한다. pET 11d 벡터로부터의 표적 유전자 발현은 공동발현되는 바이러스 RNA 폴리메라아제(T7 gn1)에 의해 매개되는 T7 gn10-lac 융합 프로모터로부터의 전사에 의존한다. 이 바이러스 폴리메라아제는 lacUV 5 프로모터의 전사 조절 하에서 T7 gn1 유전자를 보유하는 내재성 λ 프로파지(resident λ prophage)로부터 BL21(DE3) 또는 HMS174(DE3)와 같은 숙주 균주들에 의해 공급된다. 원핵 세포 및 진핵 세포 모두에 적절한 발현 시스템들이 해당 기술분야에서 잘 알려져 있다(예를 들어, Sambrook 외(1989) Molecular Cloning: A Laboratory Manual, second edition, Cold Spring Harbor Laboratory 참조). 유도성, 비-융합 대장균 발현 벡터의 예시들은 pTrc 벡터(Amann 외(1988) Gene 69:301-315) 및 PET 11d 벡터(Studier 외(1990) Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA, pp. 60-89)를 포함한다. 특정 구현예들에서, 본 발명의 폴리뉴클레오티드 서열은 박테리오파지 T5로부터 유도된 프로모터에 작동가능하게 연결된다. 일 구현예에서, 숙주 세포는 효모 세포이다. 이 구현예에서, 발현 벡터는 효모 발현 벡터이다. 벡터들은 외래(foreign) 핵산(예를 들어, DNA)을 숙주 세포 내로 도입하기 위하여 본 기술분야에서 인정되는 다양한 기술들을 통해 원핵 세포 또는 진핵 세포 내로 도입될 수 있다. 숙주 세포를 형질전환 또는 형질감염(transfecting)시키는 적절한 방법들은, 예를 들어 Sambrook 외에서 찾아볼 수 있다(위 참조). 박테리아 세포들의 안정적인 형질전환을 위하여, (사용되는 발현 벡터 및 형질전환 기술에 따라) 세포들의 특정 부분이 발현 벡터를 흡수하고 복제하는 것으로 알려져 있다. 이 형질전환체들을 식별하고 선택하기 위하여, 선별가능한 마커(예를 들어, 항생제에 대한 내성)를 코딩하는 유전자가 관심 유전자와 함께 숙주 세포 내로 도입될 수 있다. 선별가능한 마커들은 암피실린, 카나마이신, 클로람페니콜, 또는 테트라사이클린과 같은(단, 이로 제한되지 않음) 약물들에 대한 내성을 제공하는 것들을 포함한다. 선택가능한 마커를 코딩하는 핵산들은 본 명세서에서 설명되는 폴리펩티드를 코딩하는 벡터와 동일한 벡터에서 숙주 세포 내로 도입될 수 있거나, 또는 별개의 벡터에서 도입될 수 있다.

선택적인 경로 조작

본 발명의 숙주 세포들 또는 미생물들은, 효소 활성들에 대한 특정 돌연변이들의 효율성을 테스트하기 위해 변경들을 포함하도록 유전적으로 조작되거나 변형된 숙주 균주들 또는 숙주 세포들(즉, 재조합 세포들 또는 미생물들)을 포함한다. 다양한 선택적인 유전적 조정(manipulation) 및 변경이, 어떤 원래의 효소 경로들이 원래 숙주 세포에 존재하는지에 따라 한 숙주 세포로부터 다른 숙주 세포로 교환가능하게 사용될 수 있다. 일 구현예에서, 숙주 균주는 다른 생합성 폴리펩티드들(예를 들어, 효소들)과 조합하여 CYP153A-리덕타아제 혼성 융합 폴리펩티드 또는 이의 변이체의 발현을 테스트하는데 사용될 수 있다. 숙주 균주는, 발효 성분들, 탄소원(예를 들어, 공급원료), 온도, 압력, 감소된 배양 오염 조건들, 및 산소 수준들을 포함한 배양 조건들을 포함하는(단, 이로 제한되지 않음) 특정 변수들을 테스트하기 위해 다수의 유전적 변경들을 포함할 수 있다.

일 구현예에서, 숙주 균주는 선택적인 fadE 및 fhuA 결실을 포함한다. 아실-CoA 디하이드로게나아제(FadE)는 지방산을 대사시키는데 중요한 효소이다. 이는 지방산 이용(베타-산화)의 두번째 단계를 촉매화하며, 이는 지방산(아실-CoA)의 긴 사슬들을 아세틸-CoA 분자들로 쪼개는 공정이다. 더 구체적으로, 박테리아에서 지방산 분해의 β-산화 사이클의 두번째 단계는 아실-CoA의 2-엔오일-CoA로의 산화이며, 이는 FadE에 의해 촉매화된다. 대장균에 FadE가 없는 경우, 이는 탄소원으로서 지방산에서 성장할 수 없지만, 아세테이트에서 성장할 수 있다. 여하한의 사슬 길이의 지방산을 이용하는 불가능성(inability)은 fadE 균주들, 즉 FadE 기능이 파괴되는 fadE 돌연변이 균주들의 보고된 표현형과 일치한다. fadE 유전자는 선택적으로 녹아웃(knock out)되거나 감쇠되어, 지방산 유도체 경로에서 중간체일 수 있는 아실-CoA가 세포에 누적될 수 있도록 보장하여, 모든 아실-CoA가 지방산 유도체들로 효율적으로 전환될 수 있도록 한다. 하지만, fadE 감쇠는 탄소원으로서 당이 사용될 때 선택적인데, 이는 이러한 조건 하에서 FadE의 발현이 억제될 가능성이 있고, 이에 따라 FadE가 소량만 존재할 수 있으며, 아실-CoA 기질에 대해 에스테르 신타아제 또는 다른 효소들과 효율적으로 경쟁할 수 없기 때문이다. FadE는 분해대사물 억제(catabolite repression)로 인해 억제된다. 대장균 및 많은 다른 미생물들은 지방산보다 당의 소모를 선호하므로, 두 공급원들이 이용가능한 경우 fad 레귤론을 억제함으로써 당이 우선적으로 소모된다(D. Clark, J Bacteriol.(1981) 148(2):521-6 참조). 또한, 당의 부재 및 지방산의 존재는 FadE 발현을 유도한다. (FadE를 포함한) fad 레귤론에 의해 발현되는 단백질들이 상향-조절되고(up-regulated) 아실-CoA에 대해 효율적으로 경쟁할 것이기 때문에, 아실-CoA 중간체들이 베타 산화 경로에 대해 손실될 수 있다. 따라서, fadE 유전자가 녹아웃되거나 감쇠되는 것이 유리할 수 있다. 대부분의 탄소원들이 주로 당 기반이기 때문에, FadE를 감쇠시키는 것은 선택적이다. 유전자 fhuA는 TonA 단백질을 코딩하며, 이는 대장균의 외막에서의 에너지-관련 운반체(energy-coupled transporter) 및 수용체이다(V. Braun(2009) J Bacteriol. 191(11):3431-3436 참조). 이것의 결실은 선택적이다. fhuA 결실은 세포로 하여금 특정 발효 조건들에 유리할 수 있는 파지 공격(phage attack)에 대해 더 저항성 있게 한다. 따라서, 발효 진행 시 잠재적 오염을 겪기 쉬운 숙주 세포의 fhuA를 결실시키는 것이 바람직할 수 있다.

또한, 또 다른 구현예에서, 숙주 균주(위 참조)는 다음의 유전자들 - fadR, fabA, fabD, fabG, fabH, fabV, 및/또는 fabF를 포함함 - 중 하나 이상의 선택적인 과발현을 포함한다. 이러한 유전자들의 예시들은 대장균으로부터의 fadR, 쥐티푸스균(Salmonella typhimurium)으로부터의 fabA(NP_460041), 쥐티푸스균으로부터의 fabD(NP_460164), 쥐티푸스균으로부터의 fabG(NP_460165), 쥐티푸스균으로부터의 fabH(NP_460163), 콜레라균(Vibrio cholera)으로부터의 fabV(YP_001217283), 및 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum)으로부터의 fabF(NP_350156)이다. 지방산 생합성에서의 조절제들 및 효소들을 코딩하는 이러한 유전자들 중 하나 이상의 과발현은 다양한 배양 조건들 하에서 ω-OH 지방산들 및 이의 유도체들을 포함하는 지방산 유도체 화합물들의 역가를 증가시키는 역할을 할 수 있다.

또 다른 구현예에서, ω-OH 지방산들 및 이의 유도체들의 생성을 위해 숙주 세포들로서 대장균 균주들이 사용된다. 이와 유사하게, 이러한 숙주 세포들은 fadR, fabA, fabD, fabG, fabH, fabV, 및/또는 fabF를 포함하는(단, 이로 제한되지 않음) 다양한 배양 조건들 하에서 지방산 유도체들(예를 들어, ω-OH 지방산 및 α,ω-이산 등)과 같은 지방산 유도체 화합물들의 역가를 더 증가시키거나 증대(enhance)시킬 수 있는 하나 이상의 생합성 유전자들(즉, 지방산 생합성에서의 조절제들 및 효소들을 코딩하는 유전자들)의 선택적인 과발현을 제공한다. 유전적 변경의 예시들은 대장균으로부터의 fadR, 쥐티푸스균으로부터의 fabA(NP_460041), 쥐티푸스균으로부터의 fabD(NP_460164), 쥐티푸스균으로부터의 fabG(NP_460165), 쥐티푸스균으로부터의 fabH(NP_460163), 콜레라균으로부터의 fabV(YP_001217283), 및 클로스트리디움 아세토부틸리쿰으로부터의 fabF(NP_350156)를 포함한다. 몇몇 구현예들에서, 이러한 생합성 유전자들을 운반하는 합성 오페론들이, 다양한 배양 조건들 하에서 P450 발현을 테스트하고, 및/또는 ω-OH 지방산 및 α,ω-이산 생성을 더 증대시키기 위해 세포들 내에서 조작되고 발현될 수 있다. 이러한 합성 오페론들은 하나 이상의 생합성 유전자를 함유한다. ifab138 오페론은, 예를 들어 특정 배양 조건들을 테스트하기 위해 지방산 유도체들의 과발현을 용이하게 하는데 사용될 수 있는 콜레라균으로부터의 fabV, 쥐티푸스균으로부터의 fabH, 쥐티푸스균으로부터의 fabD, 쥐티푸스균으로부터의 fabG, 쥐티푸스균으로부터의 fabA, 및/또는 클로스트리디움 아세토부틸리쿰으로부터의 fabF를 포함하는 선택적인 지방산 생합성 유전자들을 함유하는 조작된 오페론이다. 이러한 합성 오페론들의 한가지 장점은, ω-OH 지방산 유도체 생성률이 더 증가되거나 증대될 수 있다는 것이다.

몇몇 구현예들에서, ACP 및 생합성 효소들(예를 들어, ω-하이드록실라아제, 티오에스테라아제 등)을 발현시키는데 사용되는 숙주 세포들 또는 미생물들은, ω-OH 지방산, ω-OH 지방산 유도체, α,ω-이산 등과 같은 하나 이상의 특정 지방산 유도체(들)에 대한 생성을 증가시킬 수 있는 특정 효소 활성들을 포함하는 유전자들을 더 발현시킬 것이다. 일 구현예에서, 숙주 세포는 유전자를 과발현시킴으로써 증가될 수 있는 지방산의 생성을 위해 티오에스테라아제 활성(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5)을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 에스테르의 생성을 위해 에스테르 신타아제 활성(E.C. 2.3.1.75)을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 알코올의 생성을 위해 아실-ACP 리덕타아제(AAR)(E.C, 1.2.1.80) 활성 및/또는 알코올 디하이드로게나아제 활성(E.C. 1.1.1.1) 및/또는 지방족 알코올 아실-CoA 리덕타아제(FAR)(E.C. 1.1.1.*) 활성 및/또는 카르복실산 리덕타아제(CAR)(E.C. 1.2.99.6) 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 알데히드의 생성을 위해 아실-ACP 리덕타아제(AAR)(E.C. 1.2.1.80) 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 알칸 및 알켄의 생성을 위해 아실-ACP 리덕타아제(AAR)(E.C. 1.2.1.80) 활성 및 디카르보닐라아제(ADC) 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 알코올의 생성을 위해 아실-CoA 리덕타아제(E.C. 1.2.1.50) 활성, 아실-CoA 신타아제(FadD)(E.C. 2.3.1.86) 활성, 및 티오에스테라아제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 에스테르의 생성을 위해 에스테르 신타아제 활성(E.C. 2.3.1.75), 아실-CoA 신타아제(FadD)(E.C. 2.3.1.86) 활성, 및 티오에스테라아제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 케톤의 생성을 위해 OleA 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 내부 올레핀의 생성을 위해 OleBCD 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 알코올의 생성을 위해 아실-ACP 리덕타아제(AAR)(E.C. 1.2.1.80) 활성 및 알코올 디하이드로게나아제 활성(E.C. 1.1.1.1)을 갖는다. 또 다른 구현예에서, 숙주 세포는 말단 올레핀을 만들기 위해 티오에스테라제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성 및 디카르복실라아제 활성을 갖는다. 미생물 및 미생물 세포에서의 효소 활성들의 발현은 미국 특허 8,097,439; 8,110,093; 8,110,670; 8,183,028; 8,268,559; 8,283,143; 8,232,924; 8,372,610; 및 8,530,221에 개시되어 있으며, 이들은 본 명세서에서 인용 참조된다. 다른 구현예들에서, ACP 및 다른 생합성 효소들을 발현시키는데 사용되는 숙주 세포들 또는 미생물들은 ω-OH 지방산, ω-OH 지방산 유도체, α,ω-이산과 같은 하나 이상의 특정 지방산 유도체(들)를 생성하기 위해 상향조절되거나 과발현되는 특정 원래의 효소 활성들을 포함할 것이다. 일 구현예에서, 숙주 세포는 티오에스테라아제 유전자를 과발현시킴으로써 증가될 수 있는 지방산의 생성을 위해 원래의 티오에스테라아제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성을 갖는다.

본 발명은 CYP153A-리덕타아제 혼성 융합 폴리펩티드들 및 이의 변이체들 그리고 다른 생합성 효소들(위 참조)을 코딩하는 유전자들을 발현시키는 숙주 균주들 또는 미생물들을 포함한다. 재조합 숙주 세포들은, ω-하이드록시 지방산 유도체들(예를 들어, ω-하이드록시 유리 지방산들; ω-하이드록시 지방산 메틸 에스테르들; ω-옥소 지방산들; ω-옥소 지방산 메틸 에스테르들; α,ω-이산들; α,ω-디올들; α,ω-디에스테르들; ω-카르복시 지방산 메틸 에스테르들; ω-아미노 지방산들; 및 ω-아미노 지방산 메틸 에스테르들을 포함하는 ω-하이드록시 지방산들)을 포함하는 지방산 유도체들 및 이들의 조성물들 및 배합물(blend)들을 생성한다. 지방산 유도체들은 통상적으로 배양 배지로부터 회수되고, 및/또는 숙주 세포들로부터 분리된다. 일 구현예에서, 지방산 유도체들은 배양 배지(세포외)로부터 회수된다. 또 다른 구현예에서, 지방산 유도체들은 숙주 세포(세포내)로부터 분리된다. 또 다른 구현예에서, 지방산 유도체들은 배양 배지로부터 회수되고, 숙주 세포들로부터 분리된다. 숙주 세포에 의해 생성되는 지방산 유도체 조성물은, ω-하이드록시 유리 지방산들; ω-하이드록시 지방산 메틸 에스테르들; ω-옥소 지방산들; ω-옥소 지방산 메틸 에스테르들; α,ω-이산들; α,ω-디올들; α,ω-디에스테르들과 같은 이작용성 화합물들; ω-카르복시 지방산 메틸 에스테르들; ω-아미노 지방산들; 및 ω-아미노 지방산 메틸 에스테르들 등을 포함하는 ω-하이드록시 지방산들과 같은 지방산 유도체 조성물들의 성분들의 포화도 및 사슬 길이뿐만 아니라 특정 지방산 유도체들의 분포를 결정하기 위해, 당업계에 알려진 방법들, 예를 들어 GC-FID를 이용하여 분석될 수 있다.

다른 구현예들에서, ACP 및 다른 생합성 효소들을 발현시키는데 사용되는 숙주 세포들 또는 미생물들은, ω-하이드록시 지방산 유도체들(예를 들어, ω-하이드록시 유리 지방산들; ω-하이드록시 지방산 메틸 에스테르들; ω-옥소 지방산들; ω-옥소 지방산 메틸 에스테르들; α,ω-이산들; α,ω-디올들; α,ω-디에스테르들과 같은 이작용성 화합물들; ω-카르복시 지방산 메틸 에스테르들; ω-아미노 지방산들; 및 ω-아미노 지방산 메틸 에스테르들을 포함하는 ω-하이드록시 지방산들)을 포함하는 하나 이상의 특정 지방산 유도체를 생성하기 위해, 상향조절되거나 과발현되는 특정 원래의 효소 활성들을 포함할 것이다. 일 구현예에서, 숙주 세포는 티오에스테라아제 유전자를 과발현시킴으로써 증가될 수 있는 지방산의 생성을 위해 원래의(native) 티오에스테라아제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성을 갖는다.

재조합 숙주 세포들 및 발효

ω-하이드록시 지방산 유도체들을 생성하기 위해, 생성 숙주 세포들(위 참조)에 대한 다수의 변형들이 이루어질 수 있다. 따라서, 본 발명은 비조작된 또는 원래의 숙주 세포들(예를 들어, 대조 세포들로서 기능하는 야생형 세포들)에 대해 ω-지방산 생합성 경로를 제공하도록 조작된 재조합 숙주 세포들을 제공하며, 이는 예를 들어 특정 균주 개선들을 통해 달성된다. 본 발명의 생성 숙주 유기체들은 식물, 동물 또는 미생물 세포들을 포함한다. 박테리아, 시아노박테리아, 효모, 조류 또는 사상균류(filamentous fungi)와 같은 미생물들 또는 미생물 세포들이 생성 숙주들로서 사용될 수 있다. 생성 숙주들로서 사용될 수 있는 미생물들의 비-제한적인 예시들은 대장균, 사카로마이세스 세레비지에 등(아래 참조)을 포함한다. 미생물 균주들은 재생가능한 공급원료로부터의 글루코오스 또는 다른 탄소원들을 지방산들 또는 지방산 에스테르들, 예컨대 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 및 지방족 알코올(FALC)로 효율적으로 전환시킨다. 이를 달성하기 위해, 균주들이 지방산들의 생성을 위해 티오에스테라아제(예를 들어, 대장균으로부터의 TesA)를 포함하거나 FAME의 생성을 위해 에스테르 신타아제[예를 들어, M. 하이드로카보노클라스티쿠스(M. hydrocarbonoclasticus)로부터의 ES9]를 포함하는 핵심 효소들을 발현시키도록 세심하게 조작되었다. 다양한 화합물들의 생성을 위한 고밀도 발효를 위한 프로토콜들 및 절차들이 기술되어 있다(본 명세서에서 인용 참조되는 미국 특허 8,372,610; 8,323,924; 8,313,934; 8,283,143; 8,268,599; 8,183,028; 8,110,670; 8,110,093; 및 8,097,439 참조).

도 1 및 도 2에 도시된 바와 같은 α,ω-이산들 그리고 도 3 및 도 4에 도시된 바와 같은 α,ω-디올들과 같은 이작용성 지방산 유도체들을 생성할 수 있는 능력을 갖는 신규한 미생물들을 생성하기 위해 유전자 조작 기술들을 이용하여 생체촉매로서 기능하는 이러한 미생물들에 본 명세서에 설명된 효소 단계들이 추가될 수 있다. 생성물들이 세포들 밖으로 분비될 것으로 예상되어, 원심분리를 통해 용이한 수득을 허용한다. 도 1 및 도 2에 예시된 바와 같은 12-아미노 라우르산 또는 12-아미노라우르산 메틸 에스테르와 같은 특정 화합물들의 직접적인 생성을 위해 하나의 미생물에서 특정 재조합 효소 단계들이 조합될 수 있다. 대안적으로, 재생가능한 자원들로부터 생성된 중간체들을 이용하는 생물형질전환들이 본 발명의 발효 방법들에 적용될 수 있다. 예를 들어, 티오에스테라아제 또는 에스테르 신타아제와 같은 효소들을 발현시키는 재조합 미생물로부터 얻어지는 라우르산 메틸 에스테르는 알코올 디하이드로게나아제 또는 옥시다아제; 아미노 트랜스퍼라아제 또는 트랜스아미나아제; 및/또는 에스테라아제 또는 라파아제와 같은 효소들을 발현시키는 재조합 미생물로 공급될 수 있다. 이와 같이, 특정 단계들을 촉매화하는 특정 효소들을 발현시키는 재조합 미생물로부터 얻어진 화학적 개체가 다른 단계들을 촉매화하는 효소들을 발현시키는 또 다른 재조합 미생물로 공급될 수 있다. 따라서, 숙주 세포들은 의도한 ω-하이드록시 지방산 유도체들을 생성하기 위해 중간체들이 교환가능하고 발효 절차들이 모든 숙주 세포들에 공급될 수 있는 생성 시스템을 제공한다. 특히, 글루코오스 또는 외인성 지방산들 또는 파라핀들 이외의 다른 재생가능한 공급원료들로부터, 예를 들어 α,ω-이산들; α,ω-디올들; 또는 ω-아미노 지방산들과 같은 ω-하이드록시 지방산 유도체들을 직접적으로 또한 효율적으로 생성하는 방법들이 이제까지 존재하지 않았다. 그럼에도, 이러한 이작용성 지방산 유도체들은 중합체 합성을 위한 중요한 전구체들이다. 본 명세서에 제시된 바와 같은 ω-하이드록시 지방산 유도체들의 생성을 위한 발효 기반 방법은 해당 기술 분야에 이용되는 화학적 방법들에 대해 빠르고 환경 친화적인 대안을 제공한다.

본 발명의 방법은 재생가능한 공급원료들(예를 들어, 옥수수, 사탕수수 또는 목질계 바이오매스로부터의 탄수화물; 또는 글리세롤, 플루-가스, 합성-가스와 같은 노폐물; 또는 바이오매스와 같은 유기 재료의 재형성물)로부터 유래되는 탄소원으로부터 ω-하이드록시 지방산 유도체들의 직접적인 생성을 제공한다. 일 구현예에서, 상기 방법은 이러한 중요한 화학물질들의 생성을 위한 비용 효율적이고 재생가능한 대안적인 공급원들에 의존한다. 상기 방법은, 발효액에서 재조합 미생물(예를 들어, 숙주 세포)을 제공함으로써 ω-하이드록시 지방산 유도체들을 생성하는 단계; 발효액에 재생가능한 공급원료를 첨가하는 단계; 및 발효액으로부터 ω-하이드록시 지방산 유도체를 분리시키는 단계를 포함한다. 특정 미생물의 숙주 세포는 티오에스테라아제 또는 에스테르 신타아제 및 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 포함한다.

본 명세서에서 사용되는 바와 같이, 발효라는 용어는 광범위하게 숙주 세포에 의한 유기 물질의 표적 물질로의 전환, 예를 들어 탄소원을 포함하는 배지에서 재조합 숙주 세포의 배양물을 증식시킴으로써 재조합 숙주 세포에 의한 재생가능한 공급원료로부터 유도된 탄소원의 ω-OH 지방산 유도체 및 이의 조성물들로의 전환을 지칭한다. 생성을 위하여 허용되는 조건들은 숙주 세포로 하여금 의도한 생성물, 예컨대 ω-OH 지방산 유도체들을 생성하게 하는 여하한의 조건들을 지칭한다. 이와 유사하게, 벡터의 폴리뉴클레오티드 서열이 발현되는 조건 또는 조건들은 숙주 세포로 하여금 폴리펩티드를 합성하게 하는 여하한의 조건들을 의미한다. 적절한 조건들은, 예를 들어 발효 조건들을 포함한다. 발효 조건들은 온도 범위, 통기 수준, 공급량(feed rate), 및 배지 조성물을 포함하는(단, 이로 제한되지 않음) 다수 파라미터를 포함할 수 있다. 이러한 조건들의 각각은 개별적으로 그리고 조합하여 숙주 세포가 성장하게 한다. 발효는 호기성, 혐기성, 또는 [미-호기성(micro-aerobic)과 같은] 이의 변이성(variations)일 수 있다. 예시적인 배양 배지는 배양액(broth) 또는 겔(gel)을 포함한다. 일반적으로, 배지는 숙주 세포에 의해 직접적으로 대사될 수 있는 탄소원을 포함한다. 또한, 효소들이 탄소원의 가동화(mobilization)[예를 들어, 전분 또는 셀룰로오스의 발효성 당들로의 해중합(depolymerization)] 및 탄소원의 후속 대사를 용이하게 하도록 배지에서 사용될 수 있다.

소규모 생성을 위해, 조작된 숙주 세포들은 예를 들어 약 100 μL, 200 μL, 300 μL, 400 μL, 500 μL, 1 mL, 5 mL, 10 mL, 15 mL, 25 mL, 50 mL, 75 mL, 100 mL, 500 mL, 1 L, 2 L, 5 L 또는 10 L의 뱃치(batch)에서 성장될 수 있고; 발효될 수 있으며; 의도한 폴리뉴클레오티드 서열, 예컨대 CYP153A-리덕타아제 혼성 융합 폴리펩티드를 단독으로 또는 다른 효소 기능들과 조합하여 코딩하는 폴리뉴클레오티드 서열을 발현시키도록 유도될 수 있다. 대규모 생성을 위해, 조작된 숙주 세포들은 약 10 L, 100 L, 1000 L, 10,000 L, 100,000 L 및 1,000,000 L 또는 그 이상의 뱃치에서 성장될 수 있고; 발효될 수 있으며; 의도한 폴리뉴클레오티드 서열을 발현시키도록 유도될 수 있다. 대안적으로, 대규모 유가배양식 발효(fed-batch fermentation)가 수행될 수 있다. 본 명세서에서 설명되는 ω-OH 지방산 유도체 조성물들은 재조합 숙주 세포 배양물의 세포외 환경에서 발견되고, 배양 배지로부터 쉽게 분리될 수 있다. ω-OH 지방산 또는 이의 유도체는 재조합 숙주 세포에 의해 분비될 수 있고, 세포외 환경으로 수송될 수 있거나 또는 수동적으로 재조합 숙주 세포 배양물의 세포외 환경으로 전달될 수 있다. 이의 ω-OH 지방산 유도체는 해당 기술분야에 알려진 통상의 방법들을 이용하여 재조합 숙주 세포 배양물로부터 분리된다.

몇몇 구현예들에서, 숙주 세포는 약 2 g/L 내지 약 100 g/L의 재생가능한 공급원료와 같은 탄소원의 초기 농도를 포함하는 배양 배지에서 배양된다. 다른 구현예들에서, 배양 배지는 약 2 g/L 내지 약 10 g/L의 탄소원, 약 10 g/L 내지 약 20 g/L의 탄소원, 약 20 g/L 내지 약 30 g/L의 탄소원, 약 30 g/L 내지 약 40 g/L의 탄소원, 또는 약 40 g/L 내지 약 50 g/L의 탄소원의 초기 농도를 포함한다. 몇몇 구현예들에서, 배양 배지에서의 탄소원의 수준에 대해 발효가 모니터링될 수 있다. 몇몇 구현예들에서, 이 방법은 배지에서의 탄소원의 수준이 약 0.5 g/L 미만일 때 배양 배지에 보충 탄소원을 첨가하는 단계를 더 포함한다. 몇몇 구현예들에서, 배지에서의 탄소원의 수준이 약 0.4 g/L 미만, 약 0.3 g/L 미만, 약 0.2 g/L 미만, 또는 약 0.1 g/L 미만일 때, 보충 탄소원이 배양 배지에 첨가된다. 몇몇 구현예들에서, 약 1 g/L 내지 약 25 g/L의 탄소원 수준을 유지하기 위해 보충 탄소원이 첨가된다. 몇몇 구현예들에서, 약 2 g/L 이상(예를 들어, 약 2 g/L 이상, 약 3 g/L 이상, 약 4 g/L 이상)의 탄소원 수준을 유지하기 위해 보충 탄소원이 첨가된다. 특정 구현예들에서, 약 5 g/L 이하(예를 들어, 약 5 g/L 이하, 약 4 g/L 이하, 약 3 g/L 이하)의 탄소원 수준을 유지하기 위해 보충 탄소원이 첨가된다. 몇몇 구현예들에서, 약 2 g/L 내지 약 5 g/L, 약 5 g/L 내지 약 10 g/L, 또는 약 10 g/L 내지 약 25 g/L의 탄소원 수준을 유지하기 위해 보충 탄소원이 첨가된다. 몇몇 구현예들에서, 탄소원은 글루코오스, 또는 글리세롤과 같은 다른 타입의 재생가능한 공급원료이다.

몇몇 구현예들에서, ω-하이드록시 지방산 유도체는 약 1 g/L 내지 약 200 g/L의 농도로 생성된다. 몇몇 구현예들에서, ω-하이드록시 지방산 유도체는 약 1 g/L 이상(예를 들어, 약 1 g/L 이상, 약 10 g/L 이상, 약 20 g/L 이상, 약 50 g/L 이상, 약 100 g/L 이상)의 농도로 생성된다. 몇몇 구현예들에서, ω-하이드록시 지방산 유도체는 약 1 g/L 내지 약 170 g/L, 약 1 g/L 내지 약 10 g/L, 약 40 g/L 내지 약 170 g/L, 약 100 g/L 내지 약 170 g/L, 약 10 g/L 내지 약 100 g/L, 약 1 g/L 내지 약 40 g/L, 약 40 g/L 내지 약 100 g/L, 약 1 g/L 내지 약 100 g/L의 농도에서 생성된다.

몇몇 구현예들에서, ω-하이드록시 지방산 유도체는 약 25 mg/L, 약 50 mg/L, 약 75 mg/L, 약 100 mg/L, 약 125 mg/L, 약 150 mg/L, 약 175 mg/L, 약 200 mg/L, 약 225 mg/L, 약 250 mg/L, 약 275 mg/L, 약 300 mg/L, 약 325 mg/L, 약 350 mg/L, 약 375 mg/L, 약 400 mg/L, 약 425 mg/L, 약 450 mg/L, 약 475 mg/L, 약 500 mg/L, 약 525 mg/L, 약 550 mg/L, 약 575 mg/L, 약 600 mg/L, 약 625 mg/L, 약 650 mg/L, 약 675 mg/L, 약 700 mg/L, 약 725 mg/L, 약 750 mg/L, 약 775 mg/L, 약 800 mg/L, 약 825 mg/L, 약 850 mg/L, 약 875 mg/L, 약 900 mg/L, 약 925 mg/L, 약 950 mg/L, 약 975 mg/L, 약 1000 mg/L, 약 1050 mg/L, 약 1075 mg/L, 약 1100 mg/L, 약 1125 mg/L, 약 1150 mg/L, 약 1175 mg/L, 약 1200 mg/L, 약 1225 mg/L, 약 1250 mg/L, 약 1275 mg/L, 약 1300 mg/L, 약 1325 mg/L, 약 1350 mg/L, 약 1375 mg/L, 약 1400 mg/L, 약 1425 mg/L, 약 1450 mg/L, 약 1475 mg/L, 약 1500 mg/L, 약 1525 mg/L, 약 1550 mg/L, 약 1575 mg/L, 약 1600 mg/L, 약 1625 mg/L, 약 1650 mg/L, 약 1675 mg/L, 약 1700 mg/L, 약 1725 mg/L, 약 1750 mg/L, 약 1775 mg/L, 약 1800 mg/L, 약 1825 mg/L, 약 1850 mg/L, 약 1875 mg/L, 약 1900 mg/L, 약 1925 mg/L, 약 1950 mg/L, 약 1975 mg/L, 약 2000 mg/L(2 g/L), 3 g/L, 5 g/L, 1O g/L, 20 g/L, 30 g/L, 40 g/L, 50 g/L, 60 g/L, 70 g/L, 80 g/L, 90 g/L, 1OO g/L 또는 상기 값들 중 어느 두 개의 값들에 의해 한정되는 범위의 역가로 생성된다. 다른 구현예들에서, ω-지방산 유도체는 1OO g/L 초과, 200 g/L 초과 또는 300 g/L 초과, 또는 500 g/L, 700 g/L, 1000 g/L, 1200 g/L, 1500 g/L 또는 2000 g/L과 같은 더 높은 역가로 생성된다. 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성된 ω-하이드록시 지방산 유도체의 바람직한 역가는 5 g/L 내지 200 g/L, 1O g/L 내지 150 g/L, 20 g/L 내지 120 g/L, 및 30 g/L 내지 1OO g/L이다. 일 구현예에서, 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성된 ω-지방산 유도체의 역가는 약 1 g/L 내지 약 250 g/L, 더 구체적으로는 90 g/L 내지 약 120 g/L이다. 역가는 특정 ω-지방산 유도체 또는 주어진 재조합 숙주 세포 배양물에 의해 생성된 ω-지방산 유도체들의 조합을 지칭할 수 있다.

다른 구현예들에서, 본 발명의 방법들에 따라 ω-하이드록시 지방산 유도체들을 생성하도록 조작된 숙주 세포들은 적어도 1 %, 적어도 2 %, 적어도 3 %, 적어도 4 %, 적어도 5 %, 적어도 6 %, 적어도 7 %, 적어도 8 %, 적어도 9 %, 적어도 10 %, 적어도 11 %, 적어도 12 %, 적어도 13 %, 적어도 14 %, 적어도 15 %, 적어도 16 %, 적어도 17 %, 적어도 18 %, 적어도 19 %, 적어도 20 %, 적어도 21 %, 적어도 22 %, 적어도 23 %, 적어도 24 %, 적어도 25 %, 적어도 26 %, 적어도 27 %, 적어도 28 %, 적어도 29 % 또는 적어도 30 % 또는 적어도 40 %, 또는 상기 값들 중 어느 두 개의 값들에 의해 한정되는 범위의 수율을 갖는다. 다른 구현예들에서, ω-하이드록시 지방산 유도체 또는 유도체들은 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 % 또는 그 이상을 초과하는 수율로 생성된다. 대안적으로 또는 추가적으로, 수율은 약 30 % 이하, 약 27 % 이하, 약 25 % 이하 또는 약 22 % 이하이다. 따라서, 수율은 상기 종단점들 중 어느 두 개의 값들에 의해 한정될 수 있다. 예를 들어, 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성된 ω-하이드록시 지방산 유도체 또는 유도체들의 수율은 5 % 내지 15 %, 10 % 내지 25 %, 10 % 내지 22 %, 15 % 내지 27 %, 18 % 내지 22 %, 20 % 내지 28 %, 또는 20 % 내지 30 %일 수 있다. 특정 구현예에서, 재조합 숙주 세포에 의해 생성된 ω-하이드록시 지방산 유도체 또는 유도체들의 수율은 약 10 % 내지 약 40 %이다. 또 다른 특정 구현예에서, 재조합 숙주 세포에 의해 생성된 ω-하이드록시 지방산 유도체 또는 유도체들의 수율은 약 25 % 내지 약 30 %이다. 수율은 특정 ω-하이드록시 지방산 유도체 또는 주어진 재조합 숙주 세포 배양물에 의해 생성된 ω-하이드록시 지방산 유도체들의 조합을 지칭할 수 있다. 또한, 수율은 사용되는 공급원료에도 의존적일 것이다.

몇몇 구현예들에서, 재조합 숙주 세포에 의해 생성된 ω-하이드록시 지방산 유도체 또는 유도체들의 생산성은 적어도 100 mg/L/시간, 적어도 200 mg/L/시간, 적어도 300 mg/L/시간, 적어도 400 mg/L/시간, 적어도 500 mg/L/시간, 적어도 600 mg/L/시간, 적어도 700 mg/L/시간, 적어도 800 mg/L/시간, 적어도 900 mg/L/시간, 적어도 1000 mg/L/시간, 적어도 1100 mg/L/시간, 적어도 1200 mg/L/시간, 적어도 1300 mg/L/시간, 적어도 1400 mg/L/시간, 적어도 1500 mg/L/시간, 적어도 1600 mg/L/시간, 적어도 1700 mg/L/시간, 적어도 1800 mg/L/시간, 적어도 1900 mg/L/시간, 적어도 2000 mg/L/시간, 적어도 2100 mg/L/시간, 적어도 2200 mg/L/시간, 적어도 2300 mg/L/시간, 적어도 2400 mg/L/시간, 또는 적어도 2500 mg/L/시간이다. 예를 들어, 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성된 ω-하이드록시 지방산 유도체 또는 유도체들의 생산성은 500 mg/L/시간 내지 2500 mg/L/시간, 또는 700 mg/L/시간 내지 2000 mg/L/시간일 수 있다. 특정한 일 구현예에서, 생산성은 약 0.7 g/L/h 내지 약 3 g/L/h이다. 생산성은 특정 ω-하이드록시 지방산 유도체 또는 주어진 재조합 숙주 세포 배양물에 의해 생성된 ω-하이드록시 지방산 유도체들의 조합을 지칭할 수 있다.

재조합 숙주 세포들에 의한 ω-OH 지방산 조성물들의 생성을 증가시키기 위한 전략들은 생성 숙주에 티오에스테라아제 유전자 및 CYP153A-리덕타아제 혼성 융합 유전자를 발현시킴으로써 지방산 생합성 경로를 통한 증가된 플럭스(flux)를 포함한다. 본 명세서에서 사용되는 바와 같이, 재조합 숙주 세포 또는 조작된 숙주 세포라는 용어는 유전적 구성(genetic makeup)이, 예를 들어 새로운 유전적 요소들의 의도적인 도입 및/또는 숙주 세포에 자연적으로 존재하는 유전적 요소들의 의도적인 변형에 의해 대응하는 야생형 숙주 세포에 대해 변경된 숙주 세포를 지칭한다. 또한, 이러한 재조합 숙주 세포들의 자손은 이러한 새로운 및/또는 변형된 유전적 요소들을 함유한다. 본 명세서에 설명된 본 발명의 실시형태들 중 어느 것에서, 숙주 세포는 식물 세포, 곤충 세포, 균류 세포[예를 들어, 칸디다 종(Candida sp.)과 같은 사상균류, 또는 사카로미세스 종(Saccharomyces sp.)과 같은 출아 효모], 조류 세포(algal cell) 및 박테리아 세포로부터 선택될 수 있다. 일 구현예에서, 재조합 숙주 세포들은 재조합 미생물들dl다. 미생물들인 숙주 세포들의 예시들은 에스체리치아(Escherichia), 바실러스(Bacillus), 락토바실러스(Lactobacillus), 자이모모나스(Zymomonas), 로도코쿠스(Rhodococcus), 슈도모나스(Pseudomonas), 아스페르길루스(Aspergillus), 트리코데르마(Trichoderma), 뉴로스포라(Neurospora), 푸사리움(Fusarium), 후미콜라(Humicola), 리조무코르(Rhizomucor), 클루이베로미세스(Kluyveromyces), 피치아(Pichia), 무코르(Mucor), 미셀리오프토라(Myceliophtora), 페니실리움(Penicillium), 파네로카에테(Phanerochaete), 플레우로투스(Pleurotus), 트라메테스(Trametes), 크리소스포리움(Chrysosporium), 사카로미세스(Saccharomyces), 스테노트로파모나스(Stenotrophamonas), 스키조사카로미세스(Schizosaccharomyces), 야로위아(Yarrowia), 또는 스트렙토미세스(Streptomyces)로부터의 세포들을 포함한다(단, 이로 제한되지 않음). 몇몇 구현예들에서, 숙주 세포는 그람-양성(Gram-positive) 박테리아 세포이다. 다른 구현예들에서, 숙주 세포는 그람-음성(Gram-negative) 박테리아 세포이다. 몇몇 구현예들에서, 숙주 세포는 대장균 세포이다. 몇몇 구현예에서, 숙주 세포는 대장균 B 세포, 대장균 C 세포, 대장균 K 세포, 또는 대장균 W 세포이다. 다른 구현예들에서, 숙주 세포는 바실러스 렌투스(Bacillus lentus) 세포, 바실러스 브레비스(Bacillus brevis) 세포, 바실러스 스테아로서모필루스(Bacillus stearothermophilus) 세포, 바실러스 리케니포르미스(Bacillus lichenoformis) 세포, 바실러스 알칼로필루스(Bacillus alkalophilus) 세포, 바실러스 코아굴란스(Bacillus coagulans) 세포, 바실러스 키르쿨란스(Bacillus circulans) 세포, 바실러스 푸밀리스(Bacillus pumilis) 세포, 바실러스 투린지엔시스(Bacillus thuringiensis) 세포, 바실러스 클라우시(Bacillus clausii) 세포, 바실러스 메가테리움(Bacillus megaterium) 세포, 바실러스 서브틸리스(Bacillus subtilis) 세포, 또는 바실러스 아밀로리퀴파시엔스(Bacillus amyloliquefaciens) 세포이다. 다른 구현예들에서, 숙주 세포는 트리코데르마 코닌지(Trichoderma koningii) 세포, 트리코데르마 비리데(Trichoderma viride) 세포, 트리코데르마 르에세이(Trichoderma reesei) 세포, 트리코데르마 롱기브라키아텀(Trichoderma longibrachiatum) 세포, 아스페르길루스 아와모리(Aspergillus awamori) 세포, 아스페르길루스 푸미가테스(Aspergillus fumigates) 세포, 아스페르길루스 포에티두스(Aspergillus foetidus) 세포, 아스페르길루스 니둘란스(Aspergillus nidulans) 세포, 아스페르길루스 니게르(Aspergillus niger) 세포, 아스페르길루스 오리재(Aspergillus oryzae) 세포, 후미콜라 인솔렌스(Humicola insolens) 세포, 후미콜라 라누기노세(Humicola lanuginose) 세포, 로도코쿠스오파쿠스(Rhodococcusopacus) 세포, 리조무코르미에헤이(Rhizomucormiehei) 세포, 또는 무코르미에헤이(Mucormichei) 세포이다. 또 다른 구현예들에서, 숙주 세포는 스트렙토미세스 리비단스(Streptomyces lividans) 세포 또는 스트렙토미세스 무리누스(Streptomyces murinus) 세포이다. 또 다른 구현예들에서, 숙주 세포는 방선균(Actinomycetes) 세포이다. 몇몇 구현예들에서, 숙주 세포는 사카로마이세스 세레비지에(Saccharomyces cerevisiae) 세포이다.

다른 구현예들에서, 숙주 세포는 진핵 식물(eukaryotic plant) 세포, 조류 세포, 남세균(cyanobacterium) 세포, 녹색-황 세균 세포, 녹색 비-황 세균(green non-sulfur bacterium) 세포, 자색 황 세균 세포, 자색 비-황 세균 세포, 극한 생물(extremophile) 세포, 효모 세포, 균류 세포, 본 명세서에 설명된 종들 중 어느 것의 조작된 세포, 또는 합성 유기체이다. 몇몇 구현예들에서, 숙주 세포는 광 의존적이거나 탄소를 고정시킨다. 몇몇 구현예들에서, 숙주 세포는 독립영양적 활성을 갖는다. 몇몇 구현예들에서, 숙주 세포는 빛의 존재 하에서와 같이, 광독립영양적 활성(photoautotrophic activity)을 갖는다. 몇몇 구현예들에서, 숙주 세포는 빛의 부재 하에서 종속영양적 또는 혼합영양적이다. 특정 구현예들에서, 숙주 세포는 애기장대(Arabidopsis thaliana), 파니쿰 비르가툼(Panicum virgatum), 미스칸투스 기간테우스(Miscanthus giganteus), 제아 메이스(Zea mays), 보트리오코쿠스 브라우니(Botryococcuse braunii), 녹조류(Chlamydomonas reinhardtii), 두나리엘라 살리나(Dunaliela salina), 시네코코쿠스 종 PCC 7002, 시네코코쿠스 종 PCC 7942, 시네코시스티스 종(Synechocystis Sp.) PCC 6803, 서모시네코코쿠스 엘롱게이트(Thermosynechococcus elongates) BP-1, 클로로비움 테피둠(Chlorobium tepidum), 클로로프렉수스 아우란티쿠스(Chlorojlexus auranticus), 크로마티움 비노숨(Chromatiumm vinosum), 로도스피릴룸 루브룸(Rhodospirillum rubrum), 로도박터 캡술라투스(Rhodobacter capsulatus), 로도슈도모나스 파루스리스(Rhodopseudomonas palusris), 클로스트리디움 융달리(Clostridium ljungdahlii), 클로스트리디움 서모셀룸(Clostridium thermocellum), 페니실리움 크리소게눔(Penicillium chrysogenum), 피치아파스토리스(Pichiapastoris), 사카로마이세스 세레비지에(Saccharomyces cerevisiae), 스키조사카로미세스 폼베(Schizosaccharomyces pombe), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 또는 자이모모나스 모빌리스(Zymomonas mobilis)로부터의 세포이다. 일 구현예에서, 미생물 세포는 프로클로로코쿠스(Prochlorococcus), 시네코코쿠스, 시네코시스티스, 시아노테세(Cyanothece), 및 노스톡 펑크티포르메(Nostoc Punctiforme)를 포함하는 시아노박테리아로부터의 세포이다(단, 이로 제한되지 않음). 또 다른 구현예에서, 미생물 세포는 시네코코쿠스 엘롱가투스 PCC7942, 시네코시스티스 종 PCC6803, 및 시네코코쿠스 종 PCC7001을 포함하는 특정한 시아노박테리아 종들으로부터의 세포이다(단, 이로 제한되지 않음).

재조합 미생물들로부터 유도된 생성물

본 명세서에서 사용되는 바와 같이, 현대 탄소의 분율 또는 fM은 각각 옥살산 표준 HOxI 및 HOxII로 알려져 있는 미국 국립표준기술연구소(National Institute of Standards and Technology: NIST) 표준 물질(Standard Reference Material: SRM) 4990B 및 4990C에 의해 정의된 것과 동일한 의미를 갖는다. 기본적인 정의는 (AD 1950을 기준으로) 0.95 배의 ¹⁴C/¹²C 동위원소 비율 HOxI에 관한 것이다. 이는 붕괴-보정된 산업혁명-전 목재(decay-corrected pre-Industrial Revolution wood)에 거의 등가이다. 현재 생존 생물권(living biosphere)(식물 재료)에 대하여, fM은 약 1.1이다. 바이오생성물(예를 들어, 본 발명에 따라 생성되는 ω-OH 지방산들 및 유도체들을 포함하는 지방산 유도체들)은 생물학적으로 생성되는 유기 화합물을 포함한다. 특히, 본 명세서의 지방산 생합성 경로를 이용하여 생성되는 지방산 유도체들(예를 들어, ω-OH 지방산들 및 이의 유도체들)은 재생가능한 공급원들로부터 생성되지 않았으며, 이를테면 새로운 물질의 조성물이다. 이러한 새로운 바이오생성물은 이중 탄소-동위원소 핑거프린팅(dual carbon-isotopic fingerprinting) 또는 ¹⁴C 연대측정(dating)에 기초하여 석유화학의 탄소로부터 유도되는 유기 화합물과 구별될 수 있다. 추가적으로, 생물자원 탄소(biosourced carbon)의 특이적 공급원(예를 들어, 글루코오스 대 글리세롤)은 이중 탄소-동위원소 핑거프린팅에 의해 결정될 수 있다(예를 들어, 미국 특허 7,169,588 참조). 석유 기반 유기 화합물들과 바이오생성물들을 구별하는 능력은 상업적으로(in commerce) 이러한 물질들을 추적하는데 유익하다. 예를 들어, 생물학적 기반 및 석유 기반 탄소 동위원소 프로파일 둘 모두를 포함하는 유기 화합물들 또는 화학물질들은 석유 기반 물질들로만 만들어진 유기 화합물들 및 화학물질들과 구별될 수 있다. 따라서, 본 명세서의 바이오생성물은 이들의 특유한 탄소 동위원소 프로파일에 기초하여 상업적으로 후속되거나 추적될 수 있다. 바이오생성물은 각 샘플의 안정적인 탄소 동위원소 비율(¹³C/¹²C)을 비교함으로써 석유 기반 유기 화합물과 구별될 수 있다. 주어진 바이오생성물의 ¹³C/¹²C 비율은, 이산화탄소가 고정된 시간에 대기 중의 이산화탄소에서의 ¹³C/¹²C 비율의 결과이다. 또한, 이는 정확한 대사 경로를 반영한다. 또한, 국부적인 변이들도 일어난다. 석유, C3 식물(활엽), C4 식물(목초), 및 해양 탄산염(marine carbonate)이 모두 ¹³C/¹²C 및 대응하는 δ¹³C 값들에서 상당한 차이를 나타낸다. 또한, C3 및 C4 식물들의 지질 물질은 대사 경로의 결과로서 동일한 식물들의 탄수화물 성분들로부터 유래된 물질들과 상이하게 분석한다. 측정의 정확도 내에서, ¹³C은 동위원소 분별 효과(fractionation effect)들로 인하여 큰 변화들을 나타내며, 바이오생성물들에 대한 이의 가장 중요한 점은 광합성 메카니즘이다. 식물들에서의 탄소 동위원소 비율 차이의 주요한 원인은 식물들에서의 광합성 탄소 대사의 경로, 특히 일차 카르복실화(primary carboxylation)(즉, 대기 중 CO₂의 초기 고정) 동안 발생하는 반응의 차이들과 밀접하게 관련된다. 식생의 크게 두 가지 부류들은 C3[또는 캘빈-벤슨(Calvin-Benson)] 광합성 사이클을 병합하는 것들 및 C4[또는 해치-슬랙(Hatch-Slack)] 광합성 사이클을 병합하는 것들이다. C3 식물들에서, 일차 CO₂ 고정 또는 카르복실화 반응은 효소인 리불로오스-1,5-디포스페이트 카르복실라아제를 수반하며, 첫번째 안정적인 생성물은 3-탄소 화합물이다. 경목(hardwood) 및 침엽수들과 같은 C3 식물들은 온대 기후 지역들에서 우세하다. C4 식물들에서, 또 다른 효소인 포스포엔올-피루베이트 카르복실라아제를 수반하는 부가적인 카르복실화 반응은 일차 카르복실화 반응이다. 첫번째 안정적인 탄소 화합물은 이후에 탈카르복실화되는 4-탄소산(carbon acid)이다. 이에 따라 방출된 CO₂는 C3 사이클에 의해 재고정된다. C4 식물의 예시들은 열대형 목초들, 옥수수, 및 사탕수수이다. C4 및 C3 식물들이 모두 ¹³C/¹²C 동위원소 비율의 범위를 나타내지만, 통상적인 값들은 C4 식물에 대해 약 -7 내지 약 -13 퍼밀(per mil)이고, C3 식물에 대해 약 -19 내지 약 -27 퍼밀이다[예를 들어, Stuiver 외(1977) Radiocarbon 19:355 참조]. 석탄 및 석유는 일반적으로 이 후자의 범위에 속한다. ¹³C 측정 척도는 본래 Pee Dee Belemnite(PDB) 석회암에 의한 제로 세트(zero set)에 의해 정의되며, 여기서 값들은 이 재료로부터 천분율 편차로 주어진다. δ13C 값들은 천분율(퍼밀), 약어로는 ‰로 표현되고, 아래와 같이 계산된다:

PDB 표준 물질(RM)이 고갈되었으므로, 일련의 대안적인 RM들이 IAEA, USGS, NIST 및 다른 선택된 국제 동위원소 실험실들과 협력하여 개발되었다. PDB로부터의 퍼밀 편차에 대한 표기는 δ¹³C이다. 질량 44, 45 및 46의 분자 이온들에 대한 고정밀 안정 비율 질량 분석(high precision stable ratio mass spectrometry)(IRMS)에 의해 CO₂에 대해 측정이 행해진다. 본 명세서에서 설명되는 조성물들은 본 명세서에서 설명되는 방법들 중 어느 하나에 의해 생성되는 바이오생성물을 포함하며, 예를 들어 지방산 유도성 생성물을 포함한다. 구체적으로, 바이오생성물은 약 -28 이상, 약 -27 이상, -20 이상, -18 이상, -15 이상, -13 이상, -10 이상, 또는 -8 이상의 δ¹³C를 가질 수 있다. 예를 들어, 바이오생성물은 약 -30 내지 약 -15, 약 -27 내지 약 -19, 약 -25 내지 약 -21, 약 -15 내지 약 -5, 약 -13 내지 약 -7, 또는 약 -13 내지 약 -10의 δ¹³C를 가질 수 있다. 다른 경우들에서, 바이오생성물은 약 -10, -11, -12 또는 -12.3의 δ¹³C를 가질 수 있다. 또한, 본 명세서의 기재내용에 따라 생성되는 바이오생성물은 각 화합물의 ¹⁴C의 양을 비교함으로써 석유 기반 유기 화합물과 구별될 수 있다. ¹⁴C는 핵 반감기가 5730년이기 때문에, 더 오래된 탄소를 함유한 석유 기반 연료가 더 새로운 탄소를 함유한 바이오생성물과 구별될 수 있다[예를 들어, Currie, Source Apportionment of Atmospheric Particles, Characterization of Environmental Particles, J. Buffle and H. P. van Leeuwen, Eds., 1 of Vol. I of the IUPAC Environmental Analytical Chemistry Series(Lewis Publishers, Inc.) 3-74, (1992) 참조]. 방사성탄소 연대측정법(radiocarbon dating)의 기본적인 가정은 대기 중의 ¹⁴C 농도의 항상성(constancy)이 생물(living organism)의 ¹⁴C의 항상성을 유도한다는 것이다. 하지만, 1950년 이후부터의 대기권 핵실험 및 1850년 이후부터의 화석 연료의 연소로 인하여, ¹⁴C는 제 2의, 지구화학적인 시간 특성을 얻었다. 대기 CO₂ 및 이에 따른 생물권(living biosphere)에서의 그 농도는 1960년대 중반의 핵실험 피크의 거의 두 배였다. 이후, 7년 내지 10년의 근사적 이완 "반-감기"(approximate relaxation "half-life")를 갖는, 약 1.2×10^-12의 정상-상태 우주기원(steady-state cosmogenic) (대기) 기준 동위원소 비율(¹⁴C/¹²C)로 점진적으로 복귀되었다. 이 후자의 반감기가 문자 그대로 받아들여져야 하는 것이 아니라; 그보다는 핵무기 시대의 시작 이후로 대기권 및 생물권의 ¹⁴C의 변이성을 추적하기 위해 상세한 대기 핵 투입/붕괴의 함수(detailed atmospheric nuclear input/decay function)를 사용하여야 한다. 이는 최근 생물권 탄소의 매년 연대측정의 가능성(promise of annual dating)을 지속하는 후자의 생물권 ¹⁴C 시간 특성이다. ¹⁴C는 현대 탄소의 분율(fM)의 단위로 주어지는 결과들을 갖는 가속기 질량 분광 분석(accelerator mass spectrometry: AMS)에 의해 측정될 수 있다. fM은 미국 국립표준기술연구소(NIST) 표준 물질(SRM) 4990B 및 4990C에 의해 정의된다. 본 명세서에서 사용되는 바와 같이, 현대 탄소의 분율 또는 fM은 각각 옥살산 표준 HOxI 및 HOxⅡ로 알려져 있는 미국 국립표준기술연구소(NIST) 표준 물질(SRM) 4990B 및 4990C에 의해 정의되는 것과 동일한 의미를 갖는다. 기본적인 정의는 (AD 1950을 기준으로) 0.95 배의 ¹⁴C/¹²C 동위원소 비율 HOxI에 관한 것이다. 이는 붕괴-보정된 산업혁명-전 목재에 거의 등가이다. 현재 생물권(식물 재료)에 대하여, fM은 약 1.1이다. 본 명세서에서 설명되는 조성물들은 적어도 약 1의 fM ¹⁴C를 가질 수 있는 바이오생성물을 포함한다. 예를 들어, 본 발명의 바이오생성물은 적어도 약 1.01의 fM ¹⁴C, 약 1 내지 약 1.5의 fM ¹⁴C, 약 1.04 내지 약 1.18의 fM ¹⁴C, 또는 약 1.111 내지 약 1.124의 fM ¹⁴C를 가질 수 있다.

¹⁴C의 또 다른 측정은 pMC(percent of modern carbon)로 알려져 있다. ¹⁴C 연대를 이용하는 고고학자 또는 지질학자에 대하여, AD 1950년은 0의 해(zero years old)와 같다. 또한, 이는 100 pMC를 나타낸다. 대기 중의 핵무기 탄소(bomb carbon)는 열(thermo)-핵무기의 피크에서 1963년의 통상 수준의 거의 두 배에 달하였다. 대기권 내의 이의 분포는 이의 출연 이후로 근사화되었으며, AD 1950년 이후로 살아 있는 식물들 및 동물들에 대하여 100 pMC보다 더 큰 값을 나타낸다. 이는 시간이 지나면서 107.5 pMC 부근인 현재의 값으로 점차 감소하였다. 이는 옥수수와 같은 신선한(fresh) 바이오매스 물질이 107.5 pMC 부근의 ¹⁴C 시그너처(signature)를 제공한다는 것을 의미한다. 석유 기반 화합물들은 0의 pMC 값을 가질 것이다. 오늘날의 탄소와 화석 탄소의 조합은 오늘날의 pMC 함량의 희석을 유도할 것이다. 107.5 pMC가 오늘날의 바이오매스 물질의 ¹⁴C 함량을 나타내고 0 pMC가 석유 기반 생성물의 ¹⁴C 함량을 나타낸다고 가정함으로써, 물질에 대해 측정된 pMC 값은 두 성분 유형의 비율을 반영할 것이다. 예를 들어, 오늘날의 콩으로부터 100 % 유도된 물질은 107.5 pMC 부근의 방사성탄소 시그너처를 제공할 것이다. 그 물질이 석유 기반 생성물로 50 % 희석되었다면, 이는 약 54 pMC의 방사성탄소 시그너처를 제공할 것이다. 생물학적 기반 탄소 함량은 107.5 pMC와 같은 100 %, 및 0 pMC와 같은 0 %를 할당함으로써 유도된다. 예를 들어, 99 pMC로 측정된 샘플은 93 %의 등가의 생물학적 기반 탄소 함량을 제공할 것이다. 이 값은 평균 생물학적 기반 탄소 결과로 지칭되며, 오늘날의 생물학적 물질 또는 석유 기반 물질 중 어느 하나로부터 비롯된 분석된 물질 내의 모든 성분을 가정한다. 본 명세서에서 설명되는 바와 같은 하나 이상의 지방산 유도체를 포함하는 바이오생성물은 적어도 약 50, 60, 70, 75, 80, 85, 90, 95, 96, 97, 98, 99 또는 100의 pMC를 가질 수 있다. 다른 경우에, 본 명세서에서 설명되는 지방산 유도체는 약 50 내지 약 100; 약 60 내지 약 100; 약 70 내지 약 100; 약 80 내지 약 100; 약 85 내지 약 100; 약 87 내지 약 98; 또는 약 90 내지 약 95의 pMC를 가질 수 있다. 또 다른 경우에, 본 명세서에서 설명되는 지방산 유도체는 약 90, 91, 92, 93, 94, 또는 94.2의 pMC를 가질 수 있다.

ω-하이드록시 지방산 유도체들 및 조성들(Formulations)

ω-하이드록실 지방산 유도체들과 같은 화합물들은 다수의 산업 적용분야들에서 귀중하고 바람직한 분자들이다. 본 발명은 생체 내에서 재조합 미생물들을 통해 이러한 화합물들을 생성하고, 이에 의해 다양한 범위의 유용한 생성물들을 생성한다. 이러한 생성물들은 ω-하이드록시 지방산 유도체들을 포함한다. ω-하이드록시 지방산 유도체들은 ω-하이드록시 지방산들; ω-하이드록시-지방산 메틸 에스테르들; ω-아미노 지방산들; ω-옥소 지방산들; ω-아미노 지방산 메틸 에스테르들; ω-옥소 지방산 메틸 에스테르들; α,ω-이산들; α,ω-디에스테르들; 및 α,ω-디올들 그리고 이의 화합물들을 포함한다(단, 이로 제한되지 않음). 대부분 짝수 사슬의 ω-하이드록시-지방산 유도체들이 본 명세서에 설명되지만, 7 개, 9 개, 11 개, 13 개, 15 개, 19 개 등의 탄소들과 같이 홀수 사슬의 ω-하이드록시-지방산 유도체들이 또한 포함된다.

ω-하이드록시 지방산의 예시들은 8-하이드록시 옥탄산, 10-하이드록시 데센산, 10-하이드록시 데칸산, 12-하이드록시 도데센산, 12-하이드록시 도데칸산, 14-하이드록시 테트라데센산, 14-하이드록시 테트라데칸산, 16-하이드록시 핵사데센산, 16-하이드록시 헥사데칸산, 18-하이드록시 옥타데센산, 및 18-하이드록시 옥타데칸산을 포함한다(단, 이로 제한되지 않음).

ω-하이드록시-지방산 메틸 에스테르의 예시들은 8-하이드록시 옥탄산 메틸 에스테르, 10-하이드록시 데센산 메틸 에스테르, 10-하이드록시 데칸산 메틸 에스테르, 12-하이드록시 도데센산 메틸 에스테르, 12-하이드록시 도데칸산 메틸 에스테르, 14-하이드록시 테트라데센산 메틸 에스테르, 14-하이드록시 테트라데칸산 메틸 에스테르, 16-하이드록시 헥사데센산 메틸 에스테르, 16-하이드록시 헥사데칸산 메틸 에스테르, 18-하이드록시 옥타데센산 메틸 에스테르, 및 18-하이드록시 옥타데칸산 메틸 에스테르를 포함한다(단, 이로 제한되지 않음).

ω-아미노 지방산의 예시들은 8-아미노 옥탄산, 10-아미노 데센산, 10-아미노 데칸산, 12-아미노 도데센산, 12-아미노 도데칸산, 14-아미노 테트라데센산, 14-아미노 테트라데칸산, 16-아미노 헥사데센산, 16-아미노 헥사데칸산, 18-아미노 옥타데센산, 및 18-아미노 옥타데칸산을 포함한다(단, 이로 제한되지 않음).

ω-아미노 지방산 메틸 에스테르의 예시들은 8-아미노 옥탄산 메틸 에스테르, 10-아미노 데센산 메틸 에스테르, 10-아미노 데칸산 메틸 에스테르, 12-아미노 도데센산 메틸 에스테르, 12-아미노 도데칸산 메틸 에스테르, 14-아미노 테트라데센산 메틸 에스테르, 14-아미노 테트라데칸산 메틸 에스테르, 16-아미노 헥사데센산 메틸 에스테르, 16-아미노 헥사데칸산 메틸 에스테르, 18-아미노 옥타데센산 메틸 에스테르, 및 18-아미노 옥타데칸산 메틸 에스테르를 포함한다(단, 이로 제한되지 않음).

ω-옥소 지방산의 예시들은 8-옥소 옥탄산, 10-옥소 데센산, 10-옥소 데칸산, 12-옥소 도데센산, 12-옥소 도데칸산, 14-옥소 테트라데센산, 14-옥소 테트라데칸산, 16-옥소 헥사데센산, 16-옥소 헥사데칸산, 18-옥소 옥타데센산, 및 18-옥소 옥타데칸산을 포함한다(단, 이로 제한되지 않음).

ω-옥소 지방산 메틸 에스테르의 예시들은 8-옥소 옥탄산 메틸 에스테르, 10-옥소 데센산 메틸 에스테르, 10-옥소 데칸산 메틸 에스테르, 12-옥소 도데센산 메틸 에스테르, 12-옥소 도데칸산 메틸 에스테르, 14-옥소 테트라데센산 메틸 에스테르, 14-옥소 테트라데칸산 메틸 에스테르, 16-옥소 헥사데센산 메틸 에스테르, 16-옥소 헥사데칸산 메틸 에스테르, 18-옥소 옥타데센산 메틸 에스테르, 및 18-옥소 옥타데칸산 메틸 에스테르를 포함한다(단, 이로 제한되지 않음).

α,ω-이산의 예시들은 1,8-옥탄디오익산, 1,10-데센디오익산, 1,10-데칸디오익산, 1,12-도데센디오익산, 1,12-도데칸디오익산, 1,14-테트라데센디오익산, 1,14-테트라데칸디오익산, 1,16-헥사데센디오익산, 1,16-헥사데칸디오익산, 1,18-옥타데센디오익산, 1,18-옥타데칸디오익산을 포함한다(단, 이로 제한되지 않음).

α,ω-디에스테르의 예시들은 1,8-옥탄 디메틸에스테르, 1,10-데센 디메틸에스테르, 1,10-데칸 디메틸에스테르, 1,12-도데센 디메틸에스테르, 1,12-도데칸 디메틸에스테르, 1,14-테트라데센 디메틸에스테르, 1,14-테트라데칸 디메틸에스테르, 1,16-헥사데센 디메틸에스테르, 1,16-헥사데칸 디메틸에스테르, 1,18-옥타데센 디메틸에스테르, 1,18-옥타데칸 디메틸에스테르를 포함한다(단, 이로 제한되지 않음).

α,ω-디올의 예시들은 1,8-옥탄디올, 1,10-데센디올, 1,10-데칸디올, 1,12-도데센디올, 1,12-도데칸디올, 1,14-테트라데센디올, 1,14-테트라데칸디올, 1,16-헥사데센디올, 1,16-헥사데칸디올, 1,18-옥타데센디올 및 1,18-옥타데칸디올을 포함한다(단, 이로 제한되지 않음).

짝수 사슬 ω-하이드록시-지방산 유도체들이 본 명세서에 설명되지만, 7 개, 9 개, 11 개, 13 개, 15 개, 19 개 등의 탄소들과 같이 홀수 사슬 ω-하이드록시-지방산 유도체들이 또한 포함된다. 홀수-사슬 ω-하이드록시 지방산의 예시들은, 예를 들어 11-하이드록시 운데센산(undecenoic acid), 11-하이드록시 운데칸산(undecanoic acid), 13-하이드록시 트리데센산, 13-하이드록시 트리데칸산, 15-하이드록시 펜타데센산, 15-하이드록시 펜타데칸산, 17-하이드록시 헵타데센산 및 17-하이드록시 헵타데칸산을 포함한다(단, 이로 제한되지 않음). 홀수-사슬 α,ω-이산의 예시들은, 예를 들어 1,11-운데센디오익산(undecenedioc acid), 1,11-운데칸디오익산(undecanedioc acid), 1,13-트리데센디오익산, 13-트리데칸디오익산, 1,15-펜타데센디오익산, 1,15-펜타데칸디오익산, 1,17-헵타데센디오익산 및 1,17-헵타데칸디오익산을 포함한다(단, 이로 제한되지 않음). 홀수-사슬 α,ω-디올의 예시들은, 예를 들어 1,11-운데센디올, 1,11-운데칸디올, 1,13-트리데센디올, 13-트리데칸디올, 1,15-펜타데센디올, 1,15-펜타데칸디올, 1,17-헵타데센디올 및 1,17-헵타데칸디올을 포함한다(단, 이로 제한되지 않음).

본 발명의 ω-하이드록시 지방산 유도체들의 화합물들 및 조성들은, 향미제, 향료, 윤활제, 겔, 다양한 중합체, 수지, 산업 유체, 접착제, 부식 억제제, 커패시터 전해질, 섬유, 분체 도료 경화제, 가소제, 폴리에스테르 도료, 에폭시 수지, 폴리아미드 수지, 계면활성제, 세제, 첨가제 등을 포함하는 바람직한 생성물들이 만들어질 수 있도록 배합(formulate)될 수 있다.

실시예들

다음의 예시들은 본 발명을 더욱 예시하며, 어떠한 방식으로도 그 범위를 제한하는 것으로 해석되어서는 안 된다.

실시예 1: ω-하이드록시 지방산 유도체들의 생성을 위한 재조합 대장균 균주들을 배양

균주들은 LB(Luria-Bertani) 배지에서 하룻밤(over night) 성장되었다. 배양물들은 신선한(fresh) LB 배지 내에서 1:10으로 희석되었고, 32 ℃에서 2 내지 3 시간(h) 동안 성장되었으며, 이후 정의된 FA2 배지에서 1:10으로 다시 희석되었다(아래의 도 10 참조). 몇몇 실험들에서, 배지는 0.5 mM δ-아미노레불린산(aminolevulinic acid) 및 미량의 비타민 용액으로 보충되었다. 균주들이 각각의 항생wp 내성 마커(antibiotic resistance marker)들을 갖는 플라스미드들을 함유할 때, 스펙티노마이신(100 ㎍/ml) 또는 카나마이신(50 ㎍/ml)과 같은 항생제들이 추가되었다. 32 ℃에서 4 내지 5 시간 동안 성장 후, 배양물들이 1 mM IPTG로 유도되었고, 동일한 온도에서 또 16 내지 18 시간 동안 배양되었다. 몇몇 실험들에서, 유도 시 1 g/L의 최종 농도에서 도데칸산, 도데칸올 또는 도데칸산 메틸 에스테르가 첨가되었다. 유도 시 지방산 메틸 에스테르들의 유도체들을 생성하기 위한 배양물들이 메탄올(2 %, v/v)로 보충되었다.

표 10: FA2 배지 조성

실시예 2: ω-수산화 지방산 유도체들의 분석

ω-하이드록시 지방산 유도체들을 생성한 배양물들이 수득되었고, 교반기(vortexer)(DVX-2500 멀티-튜브 교반기, VWR)를 이용하여 30 분 동안 2500 rpm으로 부틸 아세테이트로 추출되었다. 추출물은 실온에서 15 분 동안 15000 rpm으로 에펜도르프 원심분리기(Eppendorf centrifuge)(분리기 5424)에서 원심분리되었다. 상청액(100 μL)이 주입구를 갖는 GC 바이알로 피펫팅되었고, 100 μL의 N,O-비스(트리메틸실릴)트리플루오로아세트아미드(BSTFA) 및 1 %의 트리메틸클로로실란(TMCS)을 첨가함으로써 유도되었으며, 30 초 동안 교반기를 이용하여 혼합되었다. 유도화를 갖는 상청액 및 유도화를 갖지 않는 상청액 둘 모두가 화합물 식별을 위한 크로마토그램 및 질량 스펙트럼을 생성하기 위해 별도로 GC-MS에 주입되었다. GC-MS 파라미터들은 다음과 같다:

GC-MS 파라미터들:

분석 컬럼(Analytical Column): cat# J&W 122-1111E의 Agilent로부터 이용가능한 DB-1HT, 15 m × 250 ㎛ × 0.1 ㎛

오븐 온도: 초기에 50 ℃에서 5 분동안 유지, 25 ℃/min으로 300 ℃까지 상승, 24 분의 총 실행 시간에 대해 5.24 분 동안 유지

컬럼 플로우(Column flow): 1.2 mL/분

유입구 온도(Inlet temperature): 300 ℃

샘플 크기: 1μL

분할 비(Split ratio): 20:1

소프트웨어: ChemStation E.02.01.1177

MS 파라미터들

전달 라인 온도(Transfer line temperature): 300 ℃

MS 소스: 230 ℃

MS 쿼드(Quad): 150 ℃

오토샘플러(Autosampler)

LEAP Technologies에 의해 배포된 Combi PAL(CTC 분석)

GC/FID 파라미터들:

FID가 구비된 가스 크로마토그래프 애질런트(Gas Chromatograph Agilent) 7890, 또는 등가물

데이터 시스템 켐스테이션 소프트웨어(Data System ChemStation software) B.04.03, 또는 등가물

분석 컬럼: DB-1 (10 m × 0.18 mm × 0.2 μM), 또는 등가물

오토샘플러: Combi PAL, CTC 분석(LEAP Technologies)

초기 온도: 60 ℃로 0.5 분 동안 유지, 25 ℃/min으로 300 ℃까지 상승, 11 분의 총 실행 시간에 대해 0.9 분 동안 유지

주입기 온도(Injector Temperature): 320 ℃

검출기: FID(Flame ionization detector)

검출기 온도: 350 ℃

수소 플로우: 40 mL/분

공기 플로우: 450 mL/분

메이크-업 플로우(Make-up Flow): 45 mL/분(N₂)

분할 비: 50:1

컬럼 플로우: 0.8 mL/분

샘플 크기: 1 μL

실시예 3: 2 개의 cyp153A P450 옥시게나아제 오페론들을 발현시키는 대장균 균주들에 의한 도데칸산의 12(ω)-하이드록시 도데칸산으로의 전환

본 실시예는 cyp153A P450 옥시게나아제 오페론들을 발현시키는 재조합 대장균 균주들에 의한 외인성으로 첨가된 지방산의 ω-하이드록시 지방산으로의 전환을 나타낸다. 이 실험의 목적은 cyp153A P450 옥시게나아제 오페론들의 효율성을 조사하기 위한 것이었다. cyp153A P450 옥시게나아제들은 지금까지 시험관 내에서만 이용되었으며(예를 들어, Honda-Malca 외(2012) Chem. Commun. 48:5115-5117), 이 실험의 목적은 이러한 오페론들이 생체 내에서 외인성 지방산들이 제공될 때 ω-하이드록시 지방산 유도체를 생성할 수 있는지를 테스트하기 위한 것이었다.

2 개의 박테리아, 마리노박터 아쿠애올레이(수탁 번호 YP_957888; SEQ ID NO: 3) 및 미코박테리움 마리눔(수탁 번호 YP_001851443; SEQ ID NO: 59)으로부터의 cyp153A 오페론들은 이러한 유기체들의 게놈 DNA로부터 PCR 증폭되었다. 오페론들은 페레독신(fd), cyp153A P450 옥시게나아제 및 페레독신 리덕타아제(fdR)(위의 표 2A 및 2B 참조)를 코딩하는 유전자들로 만들어진다. 유전자들 및 유전자간 부위(intergenic region)들의 본래 순서가 보전되었지만, M. 마리움으로부터의 cyp153A16에서의 GTG 개시 코돈은 크로스오버(crossover) PCR에 의해 ATG 개시 코돈으로 대체되었다. PCR 앰플리머(amplimer)들은 pCL1920-유도 벡터[SC101 레플리콘(replicon), 스펙티노마이신 내성 마커]로 클로닝되어, 오페론들의 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되었다. 결과적인 플라스미드들, pAS.017(아래의 표 11 참조) 및 pAS.018은, (아실-CoA 디하이드로게나아제를 코딩하는) fadE 유전자 또는 (아실-CoA 신테타아제를 코딩하는) fadD 유전자 중 어느 하나가 결실된 대장균 MG1655로 형질전환되었다. 이러한 균주들은 지방산들을 분해시킬 수 없음에 따라, 이러한 유전자들 또는 fadA 또는 fadB와 같은 다른 지방산 분해 효소들을 코딩하는 유전자들을 결실시킴으로써, 생성물로의 증가된 전환을 위해 지방산들의 이용성을 증가시키는 것이 달성될 수 있다. 하지만, 이는 선택적이며, 유리 지방산들이 외인성으로 공급되거나 생성 경로의 중간체들인 때에 구현될 수 있다[표 1(위 참조)은 숙주 균주에서의 지방산들의 이용성을 증가시키기 위해 감쇠될 수 있는 다양한 지방산 분해 효소들을 포함하는, 대사 경로들 내의 효소 활성의 종합 목록을 제공한다]. 4 개의 결과적인 균주들이 표 12(아래 참조)에 요약되어 있다. 균주들은 실시예 1 및 2에 설명된 바와 같은 도데칸산의 12-하이드록시 도데칸산으로의 전환에 대해 분석되었다.

cyp153A 오페론을 발현시키지 않는 대조 균주 MG1655 ΔfadD와 비교 시, (BSTFA 유도화 후) RT 12.303 분에서 새로운 피크가 cyp153A 오페론들을 발현시키는 4 개의 모든 균주들의 GC-MS 크로마토그램에서 검출되었다(도 6 참조, 균주들 sAS.320 및 sAS.321만이 여기에 나타나 있다). RT 12.303 분에서 피크인 질량 스펙트럼이 도 7a에 도시되어 있다. 단편화 패턴은 이 피크가 12-하이드록시 도데칸산의 유도된 형태(derivatized form)인 12-트리메틸실릴옥시 도데칸산 트리메틸실릴 에스테르임을 나타내었다. 12-트리메틸실릴옥시 지방산 트리메틸실릴 에스테르들에 대한 특징적인 이온 단편들이 도 8a에 도시되어 있다. (도면에 도시되어 있지는 않지만 존재하는) m/z = 129, 147, 204 및 217의 이온들이 이러한 화합물들에 유용한 진단적 마커들이다. m/z 255의 이온은 이 화합물(도 8a 참조)의 하이드록실 측(side)으로부터의 (CH₃)₃SiOH 및 카르복실 측(m/z = 345)으로부터의 CH₃의 손실 후 사슬 길이를 결정하는데 사용되었다. 또한, 이 피크의 정확한 식별(correct identification)은 그 보유 시간 및 질량 스펙트럼을 도 7b에 도시된 바와 같은 12-트리메틸실릴옥시 도데칸산 트리메틸 실릴 에스테르 진정적 표준과 비교함으로써 확인되었다. 또한, 유도화 전의 이 화합물의 질량 스펙트럼이 기록되었으며, 도 7c에 도시되어 있다. 유도되지 않은 화합물의 특징적인 이온 단편들이 도 8b에 도시되어 있다. (도시된) m/z = 98 및 84의 이온들은 ω-하이드록시 지방산들에 유용한 진단 마커들이다. m/z 186의 이온은 하이드록실 측으로부터의 CH₂O의 손실에 의한 12-하이드록시도데칸산의 특징적 단편이다. 이 화합물의 분자는 m/z 186의 단편 이온에 CH₂O를 추가함으로써 216이도록 결정될 수 있다.

따라서, 마리노박터 아쿠애올레이 및 미코박테리움 마리눔으로부터 cyp153A 오페론들을 발현시키는 대장균은 숙주 세포들 내에서 생체 내에서 외인성 도데칸산을 12-하이드록시 도데칸산으로 전환시켰다. 이와 같이, 효소가 실제적으로 ω-하이드록시 지방산 유도체들을 생성할 수 있음이 확인되었다. 하지만, 이 효소의 전환 효율성은 오히려 낮았다. 따라서, cyp153A 오페론들의 효소 활성은 그들 자체로는 ω-하이드록시 지방산 유도체들의 생성에 이상적이라고 예상되지 않으며, 더 높은 전환 효율성을 갖는 효소를 설계하기 위해서는 추가적인 조작이 요구된다고 판단되었다.

표 11: ω-수산화 지방산 유도체들의 생성을 위한 발현 플라즈마들

표 12: 지방산 유도체들의 ω-수산화 지방산 유도체들로의 전환을 위한 재조합 cyp153A 발현 대장균 균주들

실시예 4: 변형된 cyp153A P450 옥시게나아제 오페론을 발현시키는 대장균 균주에 의한 도데칸산의 12(ω)-하이드록시 도데칸산으로의 전환

본 실시예는 변형된 cyp153A P450 옥시게나아제 오페론을 발현시키는 재조합 대장균 균주에 의한 외인성으로 첨가된 지방산의 ω-하이드록시 지방산으로의 전환을 나타낸다. 유사하게, 이 실험의 목적은 생체 내에서 ω-하이드록시 지방산 유도체들의 생성을 위해 이 변형된 cyp153A P450 옥시게나아제 오페론의 능력 및 효율성을 조사하기 위한 것이었다.

글리신 307이 알라닌으로 대체된 M. 아쿠애올레이로부터의 cyp153A의 돌연변이체가 이전에 설명되었다(Honda-Malca 외(2012) Chem. Commun. 48:5115-5117 참조). 플라스미드 pAS.017(위의 실시예 3 참조)이 다음과 같은 방식으로 변형되었다: cypl53_Maqu의 Gly307을 특정화하는 코돈이 GGC로부터 Ala를 특정화하는 GCC로 변화되었고, 또한 cypl56 오페론의 2 개의 원래의 유전자간 부위(IGR)들이 합성 IGR들(TAAGGAGGAAAACAAA)(SEQ ID NO: 65)로 대체되었다. 결과적인 플라스미드는 pAS.022(위의 표 11 참조)로 명명되었고, 균주 sAS.335(위의 표 12 참조)를 제공하는 대장균 MG1655 ΔfadD로 형질전환되었다. 균주는 실시예 1 및 2(위 참조)에 설명된 바와 같이 도데칸산의 12-하이드록시 도데칸산으로의 전환에 대해 분석되었다. 도 9에서 알 수 있는 바와 같이, sAS.335는 sAS.320보다 더 많은 도데칸산을 12-하이드록시 도데칸산으로 전환시켰으며, 12-하이드록시 도데칸산의 양은 37.4 ± 0.3 mg/L로 정량화되었다.

따라서, 마리노박터 아쿠애올레이로부터의 변형된 cyp153A 오페론들을 발현시키는 대장균은 (실시예 3에 비해) 생체 내에서 외인성 지방산이 공급될 때 외인성 도데칸산의 12-하이드록시 도데칸산으로의 다소 개선된 전환을 나타내었다. 하지만, 이 효소의 효율성 전환은 여전히 너무 낮았다. 따라서, 마리노박터 아쿠애올레이로부터의 변형된 cyp153A 오페론들의 효소 활성은 여전히 그들 자체로는 ω-하이드록시 지방산 유도체들의 생성에 이상적이라고 예상되지 않으며, 더 높은 전환 효율성을 갖는 효소를 설계하기 위해서는 여전히 추가적인 조작이 요구된다고 판단되었다.

실시예 5: 혼성 cyp153A-Red450RhF 융합 단백질을 발현시키는 대장균 균주에 의한 지방산 유도체들의 ω-수산화 지방산 유도체들으로의 전환

본 실시예는, cyp153A P450 옥시게나아제가 리덕타아제 도메인과 융합되는 혼성 단백질을 발현시키는 대장균 균주에 의한, 외인성으로 추가된 지방산들, 지방산 메틸 에스테르들 또는 지방족 알코올들의 각각 ω-하이드록시 지방산들, ω-하이드록시 지방산 메틸 에스테르들 또는 α,ω-디올들로의 전환을 나타낸다. 이 실험의 목적은, ω-하이드록시 지방산 유도체들의 상당히 개선된 생성을 위해 cyp153A P450 옥시게나아제가 리덕타아제 도메인과 융합되는 혼성 융합 단백질을 생성하는 것이었다.

자족적 시토크롬 P450 옥시게나아제들은 리덕타아제 파트너가 시토크롬 P450 촉매 단백질과 융합되는 효소들이다. 자족적 박테리아 시토크롬 P450 옥시게나아제들의 한 부류는 로도코쿠스 종 NCIMB 9784(Roberts 외(2003) J. Biol. Chem. 278: 48914; Hunter 외(2005) FEBS Lett. 579: 2215)로부터의 P450RhF에 의해 나타내어지며, "클래스-I P450-융합 PFOR"(DeMot and Parret(2002) Trends Microbiol. 10: 502)이라고도 지칭된다.

이 실험에서, 로도코쿠스 종 NCIMB9784로부터의 P450RhF의 c-말단 FMN- 및 Fe/S-함유 리덕타아제 도메인 및 마리노박터 아쿠애올레이로부터의 cyp153A(G307A) P450 촉매 단백질로 만들어지는 혼성-융합 단백질을 코딩하는 유전자는 다음과 같이 생성되었다: cyp165A(G307A)_Maqu 유전자는 pAS.022로부터 증폭되었고, 크로스-오버 PCR에 의해 코돈-최적화 합성 P450RhF 리덕타아제 도메인과 융합되었다. 결과적인 융합 유전자(SEQ ID NO: 5)는 pCL1920-유도체[즉, SC101 레플리콘, 스펙티노마이신 내성 마커]로 클로닝되어, 그 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되었다. 플라스미드는 pAS.023(위의 표 11 참조)으로 명명되었고, 균주 sAS.336(위의 표 12 참조)를 제공하는 대장균 MG1655 ΔfadD로 형질전환되었다.

이후, 균주 sAS.336은, 실시예 1 및 2에 설명된 바와 같이, (i) 도데칸산의 12-하이드록시 도데칸산으로의 전환, (ii) 도데칸산 메틸 에스테르의 12-하이드록시 도데칸산으로의 전환, 및 (ⅲ) 도데칸올의 1,12-도데칸디올로의 전환에 대해 분석되었다. 대조 균주 MG1655 ΔfadD(위 참조)와 비교 시, GC/MS 크로마토그래피들의 추가된 3 개의 모든 화합물들에 대해 sAS.336에서 새로운 피크들이 식별되었다(BSTFA 유도화 후, 도 10a 내지 도 10c 참조). 12-하이드록시 도데칸산은 실시예 3(위 참조)에 설명된 바와 같이 식별되었다. (BSTFA 유도화 후) RT 11.946 및 RT 11.668 분에서의 새로운 피크들이 각각 1,12-도데칸디올 및 12-하이드록시 도데칸산 메틸 에스테르로서 식별되었다.

RT 11.948 분에서 피크인 질량 스펙트럼이 도 11a에 도시되어 있다. 이온 단편화 패턴은 이 피크가 1,12-도데칸디올의 유도된 형태인 1,12-비스(트리메틸실록시) 도데칸임을 나타내었다. 1,12-비스(트리메틸실록시)도데칸에 대한 이온 단편 패턴은 도 13a에 도시되어 있다. m/z = 147의 이온은 모든 디올-관련 화합물들에 대한 특징적 단편이고, m/z = 55, 69, 83, 97, 111 및 125의 이온들은 HOSi(CH₃)₃ 모이어티의 손실 후의 특징적 알릴 절단 단편들이었다. m/z = 214의 이온은 도 13a에 도시된 바와 같이 α,ω-디올 화합물들의 사슬 길이를 결정하기 위한 특징적 진단 마커이다. 이 피크의 정확한 식별은 그 보유 시간과 질량 스펙트럼을 BSTFA+1%TMCS로 유도된 1,12-도데칸디올의 진정적 표준의 그것과 비교함으로써 더욱 확인되었다(도 11b). 다른 α,ω-디올들의 사슬 길이가 유사하게 결정될 수 있다. 예를 들어, 피크가 m/z 269에서 단편을 갖고, m/z 147, 149, 111, 97, 83, 69 및 55에서 다른 특징적 이온들을 갖는 경우, 이 피크는 1,14비스(트리메틸실록시)테트라데칸일 것이다. 불포화 α,ω-디올들의 식별을 위해 유사한 규칙들이 적용될 수 있다. 불포화 α,ω-디올들이 그들의 포화 상대방보다 더 적은 2 개의 질량 단위를 갖기 때문에, 특징적 진단 단편은 1,12-비스(트리메틸실록시)도데센에 대해 m/z = 239이다.

RT 11.668 분에서 피크인 질량 스펙트럼이 도 12a에 도시되어 있다. 이 피크는 이 화합물의 이온 단편화 패턴에 기초하여 12-트리메틸실록시도데칸산 메틸 에스테르로서 식별되었다. 도 13b에서 입증된 바와 같이, 분자는 m/z = 287(M-CH₃) 및 255(M-CH₃-HOCH₃)에서 2 개의 지배적 이온들로 단편된다. 또한, 질량 스펙트럼은 m/z = 271(M-OCH₃)에서 특징적 이온을 나타내었으며, 이때 이 분자는 메틸 에스테르 모이어티를 가짐을 암시한다. m/z = 103의 이온은 트리메틸실록시기가 말단 위치에 있음을 암시한다. 또한, m/z = 287 및 255의 이온들은 이 화합물의 사슬 길이를 결정하기 위한 특징적 이온들이다(도 13b 참조). 따라서, 피크가 m/z = 315 및 283에서 단편화 이온들을 갖고, m/z = 55 및 103에서 다른 이온들을 갖는 경우, 피크는 14-트리메틸실록시 테트라데칸산 메틸 에스테르로서 식별될 수 있다. 이 규칙은 균주 stEP677(아래의 실시예 6 참조)에 의해 생성된 상이한 사슬 길이의 ω-하이드록시 지방산 메틸 에스테르들을 식별하는데 사용되었다.

표 13(아래 참조)은 32 ℃에서 18h 이내에 균주 sAS.336에 의해 전환된 ω-수산화 지방산 유도체들의 양을 나타낸다. 표 13에서 알 수 있는 바와 같이, pAS.023으로부터 발현된 혼성 cyp153A-RedRhF 융합 단백질은 테스트되었던 다른 효소들(위 참조)과 비교 시 외인성 지방산 유도체들을 ω-수산화 지방산 유도체들로 효율적으로 전환시켰다. 따라서, 이 조작된 효소는 재생가능한 공급원료를 통한 조작된 생성 숙주들을 통해 생체 내에서 ω-하이드록시 지방산 유도체들의 생성을 위해 선택되었다(아래의 실시예 6 참조).

표 13: sAS.336에 의해 형성된 ω-수산화 지방산 유도체들

실시예 6: CYP153A-Red450RhF 혼성 융합 단백질을 발현시키는 재조합 대장균 균주들에 의한 글루코오스로부터의 ω-수산화 지방산 유도체들의 생성

본 실시예는 CYP153A P450 옥시게나아제가 리덕타아제 도메인과 융합되는 키메라 혼성 단백질을 발현시키는 재조합 대장균 숙주들에 의해, 글루오코스와 같은 재생가능한 탄수화물 공급원료로부터 ω-하이드록시 지방산, ω-하이드록시 지방산 메틸 에스테르 및 α,ω-디올들의 생성을 나타낸다.

CYP153A(G307A)-RedRhF 혼성 융합 유전자를 코딩하는 유전자가 pAS.023 으로부터 증폭되었고, pACYC 유도 벡터(p15a 레플리콘, 카나마이신 내성 마커)로 클로닝되어, 융합 유전자의 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되었다. 결과적인 플라스미드는 pEP.125(위의 표 11 참조)로 명명되었다.

글루코오스와 같은 탄수화물 기질로부터 지방산들 또는 지방산 유도체들을 과잉생성하도록 별도로 조작된 6 개의 재조합 대장균 균주들(아래의 표 14 참조)은 ω-수산화 지방산 유도체-생성 균주들(아래의 표 15 참조)을 생성하기 위해 플라스미드 pAS.023 또는 pEP.125 중 어느 하나로 형질전환되었다. 또한, 과잉생성 지방산- 또는 지방산 유도체 균주들은 ω-수산화 지방산 유도체-생성 균주들의 새로운 화합물들을 용이하게 식별하기 위해 대조 균주들로서 역할하였다. 이러한 지방산- 또는 지방산 유도체-과잉생성 균주들은 여기서 간명하게 설명되지만, 제한하는 것으로 해석되어서는 안 된다. 균주 ALcV334 게놈은 다음과 같이 생성되었다: fadE(아실-CoA 디하이드로게나아제) 유전자가 결실되었고, 티오에스테라아제 tesA의 변이체가 과발현되었다. ALcV334의 유전자 조작에 덧붙여, 균주 XL897의 게놈은 다음의 조작들을 포함하였다: 포스포판테테이닐 트랜스퍼라아제 유전자 및 합성 지방산 생합성 오페론(표 1에 설명된 수 개의 유전자들을 포함함)이 과발현되었고, 카르복실산 리덕타아제(carB)의 변이체; 티오에스테라아제(tesA)의 변이체; 알코올 디하이드로게나아제(AlrA); 3-케토-아실-ACP 신타아제(fabB)의 변이체; 및 전사 조절인자(transcriptional regulator: fadR)를 포함하는 수 개의 오페론들이 통합되었다. 균주 DAM1 게놈은 다음과 같이 조절되었다: 아실-CoA 디하이드로게나아제(fadE) 유전자가 결실되었고, 대장균 티오에스테라아제(tesA) 및 아실-CoA 신타아제(fadD) 유전자들이 과발현되었다.

균주들 stNH1293, KASH286 및 stNT29의 게놈들은 다음과 같이 조작되었다: 아실-CoA 디하이드로게나아제(fadE) 유전자가 결실되었고, 전사 조절인자(fadR) 및 합성 지방산 생합성 오페론이 과발현되었다. 또한, 균주 stNH1293은 식물 티오에스테라아제, 아실기 운반 단백질(acp) 유전자 및 아세틸-CoA 카르복실라아제(acc) 유전자 복합체를 발현시키는 플라스미드를 함유하였다. 균주 KASH286은 에스테르 신타아제의 변이체를 발현시키는 플라스미드를 함유하였다. 균주 stNT29는 아실 ACP 리덕타아제(AAR)의 변이체, 알코올 디하이드로게나아제(AlrA), 아실기 운반 단백질(acp) 및 아세틸-CoA 카르복실라아제(acc) 유전자 복합체를 함유하였다.

표 14: 지방산들 또는 지방산 유도체들을 과잉생성하는 재조합 대장균 균주들

이후, ω-수산화 지방산 유도체들을 생성(생산)하도록 조작된 균주들(위 참조)은 실시예 1 및 2에 설명된 글루코오스와 같은 재생가능한 공급원료로부터 ω-수산화 지방산 유도체들을 생성할 수 있는 능력에 대해 분석되었다. ω-수산화 지방산들, 지방산 메틸 에스테르들 및 지방족 알코올들은 실시예 3 및 5에 설명된 바와 같이 식별되었다.

표 15: 재생가능한 탄수화물 공급원료들로부터의 ω-수산화 지방산 유도체들의 생성을 위한 cyp153A(G307A)-RedRhF 융합 단백질을 발현시키는 재조합 대장균 균주들

표 16: 글루코오스로부터의 재조합 대장균 균주들에 의해 생성된 ω-수산화 지방산 유도체들

대조 균주들(위의 표 14 참조)과 비교 시, (실시예 5에 설명된 바와 같이) ω-하이드록시 지방산들, ω-하이드록시 지방산 메틸 에스테르들 및 α,ω-디올들(도 14a 내지 도 14c 참조)에 대응하는 cyp153A-RedRhF 융합 단백질(위의 표 15 참조)을 발현시키는 모든 균주들에서 새로운 피크들이 식별되었다. 표 16은 20h(시간) 이내에 글루코오스로부터 이러한 재조합 균주들에 의해 생성된 ω-하이드록시 지방산 유도체들의 양을 나타낸다. 표 16으로부터 알 수 있는 바와 같이, 재조합 숙주 세포들에 의해 만들어진 ω-하이드록시 지방산 유도체들의 양은 상당하였다. 특히, ω-하이드록시 지방산 생성은 매우 효율적인 것으로 밝혀졌다. 균주 stEP675에 의해 생성된 ω-하이드록시 지방산들은 상청액에서 거의 독점적으로 발견된 점이 주목할 만하며(도 15 참조), 이는 세포들이 그들의 생성물을 상청액에 방출했음을 나타낸다. 도 16은 균주들 stEP675 및 stEP682에 의해 생성된 ω-하이드록시 지방산의 조성을 나타낸다. 균주 stEP682에 의해 생성된 가장 풍부한 ω-하이드록시 지방산은 12-하이드록시도데칸산(79 %)이었다. 14-하이드록시테트라데칸산(42 %)이 stEP675에 의해 생성된 가장 풍부한 ω-하이드록시 지방산이었다.

전반적으로, 균주들 stEP675는 다음과 같은 ω-하이드록시 지방산들: 12-하이드록시도데센산, 12-하이드록시도데칸산, 14-하이드록시테트라데센산, 14-하이드록시테트라데칸산, 16-하이드록시헥사데센산, 16-하이드록시헥사데칸산 및 18-하이드록시옥타데센산을 생성하였다(도 14a 참조). 균주들 stEP682는 다음과 같은 ω-하이드록시 지방산들: 12-하이드록시도데센산, 12-하이드록시도데칸산, 14-하이드록시테트라데센산, 14-하이드록시테트라데칸산, 16-하이드록시헥사데센산 및 16-하이드록시헥사데칸산을 생성하였다. 균주들 stEP677은, ω-하이드록시 지방산들 이외에도, 다음과 같은 ω-하이드록시 지방산 메틸 에스테르들: 12-하이드록시도데칸산 메틸 에스테르, 14-하이드록시테트라데칸산 메틸 에스테르 및 16-하이드록시헥사데칸산 메틸 에스테르를 생성하였다(도 14b 참조). 균주들 stEP684는, ω-하이드록시 지방산들 이외에도, 다음과 같은 ω-하이드록시 지방산 메틸 에스테르들: 14-하이드록시테트라데칸산 메틸 에스테르, 16-하이드록시헥사데센산 메틸 에스테르 및 16-하이드록시헥사데칸산 메틸 에스테르를 생성하였다. 균주들 stEP676은 다음과 같은 α,ω-디올들: 1,12-도데센디올, 1,12-도데칸디올, 1,14-테트라데칸디올, 1,16-헥사데센디올 및 1,16-헥사데칸디올을 생성하였다(도 14c). 균주들 stEP685는 다음과 같은 α,ω-디올들: 1,14-테트라데칸디올, 1,16-헥사데센디올 및 1,16-헥사데칸디올을 생성하였다.

특히, 이 실시예는 CYP153A-RedRhF 혼성 융합 단백질의 발현과 조합될 때 지방산 유도체들을 과잉생성하도록 조작된 대장균 균주들이 유일한 탄소원으로부터 ω-수산화 지방산 유도체들을 효율적으로 생성했음을 나타내었다. 또한, ω-수산화 지방산들이 발효액 내로 효율적으로 분비되었으며(즉, 생성 세포들 또는 숙주 세포들이 발효액 내로 생성물을 분비함), 이는 본 발명의 바람직한 특성이다.

실시예 7: 재조합 대장균 균주에 의한 글루코오스로부터의 α,ω-이산들의 생성

본 실시예는, cyp153A P450 옥시게나아제가 리덕타아제 도메인 및 알코올 옥시다아제 및 알데히드 디하이드로게나아제와 융합된 키메라 혼성 단백질을 발현시키는 재조합 대장균 균주에 의해, 글루코오스와 같은 재생가능한 탄수화물 공급원료로부터의 α,ω-이산들의 생성을 입증한다.

알코올 옥시다아제 alkJ(수탁 번호 CAB54054)(SEQ ID NO: 66) 및 알데히드 디하이드로게나아제 alkH(수탁 번호 CAB51050)(SEQ ID NO: 68)를 코딩하는 유전자들은 슈도모나스 퓨티다 ATCC 29347의 게놈 DNA로부터 증폭되었고, pACYC 유도 벡터(p15a 레플리콘, 카나마이신 내성 마커)로 클로닝되어, 2 개의 유전자들이 오페론을 형성하고, 오페론의 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되었다. 결과적인 플라스미드가 pEP.126로 명명되었다(위의 표 11 참조). 플라스미드 pEP.126은 균주 sEP690을 산출하는 균주 AlcV334(위의 표 14 참조)에 플라스미드 pAS.023와 동시형질전환(cotransform)되었다. 균주는 실시예 1 및 2에 설명된 바와 같은 글루코오스로부터 α,ω-이산들을 생성할 수 있는 능력에 대해 분석되었다. 대조 균주 AlcV334와 비교 시, 도 17에서 알 수 있는 바와 같이 sEP690에서 수 개의 새로운 피크들이 식별되었다. 이러한 피크들은 α,ω-이산들 및 α,ω-비스(트리메틸실릴) 지방산 에스테르의 유도된 형태들로서 식별되었다. α,ω-비스(트리메틸실릴) 지방산 에스테르들의 이온 단편화 패턴은, α,ω-비스(트리메틸실릴) 지방산 에스테르들이 m/z = 103의 이온을 생성하지 않는 것을 제외하고, α,ω-디올들의 유도된 형태들(실시예 3 참조)인 α,ω-비스(트리메틸실록시) 지방족 알코올들과 매우 유사하다. 그러므로, 이 이온은 α,ω-비스(트리메틸실릴) 지방산 에스테르들(그리고 아래에 설명되는 바와 같은 ω-1, ω-2 및 ω-3 트리메틸실록시 지방족 알코올들)과 α,ω-비스(트리메틸실록시) 지방족 알코올들을 구별하기 위한 중요한 정보이다.

균주들 stEP690에 의해 생성된 주요 화합물들은 1,12-도데칸디오익산, 1,14-테트라데센디오익산, 1,14-테트라데칸디오익산, 1,16-헥사데센디오익산, 1,16-헥사데칸디오익산, 1,18-옥타데센디오익산이었다(도 17 참조). 이 균주에 의해 생성된 가장 풍부한 화합물은 RT 13.367 분에서 1,14-테트라데칸디오익산이었다. BSTFA 유도화 후 이 화합물의 질량 스펙트럼은 도 18a에 도시되어 있다. 이 화합물에 대한 분자 이온은 m/z = 387(M-CH₃)이며, 그 단편화 패턴이 도 19에 도시되어 있다. 1,14-테트라데칸디오익산 비스(트리메틸실릴) 에스테르의 식별은 그 질량 스펙트럼 및 보유 시간을 BSTFA 유도화 후의 진정화 표준 1,14-테트라데칸디오익산의 그것과 비교함으로써 더욱 확인되었다.

표 16은 20h 이내에 글루코오스로부터 균주 sEP690에 의해 생성된 α,ω-이산들의 양을 나타내며, 이는 ~ 550 g/L이었다. 이 실시예는, CYP153A-RedRhF 혼성 융합 단백질의 발현과 조합되고, 알코올 옥시다아제(SEQ ID NO: 67) 및 알데히드 디하이드로게나아제(SEQ ID NO: 69)의 발현과 조합될 때, 지방산 유도체들을 과잉생성하도록 조작된 대장균 균주들이 유일한 탄소원으로서 글루코오스로부터 α,ω-이산들을 효율적으로 생성했음을 나타내었다.

실시예 8: 바실러스 메가테리움 으로부터 cyp102A1을 발현시키는 대장균 균주들에 의한 아말단 수산화 지방산들의 생성

이 실험의 목적은, 바실러스 메가테리움으로부터 시토크롬 P450 cyp102Al (P450-BM3)의 F87A 변이체를 발현시키는 유전적으로 변형된 숙주 균주들을 이용함으로써 생체 내에서 ω-수산화 지방산들 또는 α,ω-이산들을 생성할 수 있는지를 조사하기 위한 것이였다. 소량의 아말단 수산화(ω-1, ω-2, ω-3, ω-4, ω-5) 지방산들의 생성은 이 cyp102Al 변이체를 발현시키는 재조합 대장균 균주들을 이용함으로써 가능하다는 것이 밝혀졌다. 하지만, 동일한 대장균 균주들을 이용하여 ω-하이드록시 지방산들 또는 α,ω-이산들을 생성하는 것이 가능하지 않았다.

87 위치에서 페닐알라닌이 알라닌으로 대체된(F87A) 바실러스 메가테리움(P450-BM3)으로부터 cyp102Al 유전자의 변이체를 코딩하는 유전자는 B. 메가테리움 게놈 DNA(수탁 번호 AAA87602; SEQ ID NO: 61)로부터 크로스-오버 PCR에 의해 생성되었다. 증폭된 DNA는 pCL 유도체(SC101 레플리콘, 스펙티노마이신 내성 마커) 및 pACYC 유도체(p15a 레플리콘, 카나마이신 내성 마커) 벡터들로 클로닝되어, 유전자들의 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되었다. 결과적인 플라스미드들, pSN.012 및 pSN.009(아래의 표 17 참조)는 균주들 sSN.012 및 sSN.013(아래의 표 18 참조)을 제공하는 균주 AlcV334(위의 표 14 및 위의 실시예 6 참조)를 과잉생성하는 지방산으로 형질전환되었다. 이후, 균주들은 실시예 1 및 2에 설명된 바와 같이 글루코오스로부터 ω-수산화 지방산들을 생성할 수 있는 능력에 대해 분석되었다. 대조 균주 AlcV334와 비교 시, (BSTFA 유도화 후 도 20의 sSN.012에 대해 도시된) 두 균주들에서 작은 새로운 피크들이 식별되었다. RT 7.195 내지 7.510 사이 그리고 8.122 내지 8.414 사이의 새로운 피크들의 질량 스펙트럼의 단편화 패턴은 ω-하이드록시 지방산들(위의 실시예 3 참조)과 일치하지 않았지만, 이들은 아말단 ω-1, ω-2, ω-3, ω-4 및 ω-5 위치들에서 수산화된 지방산들의 예산된 단편화 패턴과 일치하였다. 아말단 수산화 지방산들이 ω-하이드록시 지방산들(유도된 12-하이드록시 도데칸산에 대한 도 8a 참조)과 유사한 이온 단편화 패턴들을 나타내지만, 이 화합물들은 유도화 후 m/z = 117(ω-1), 131(ω-2), 145(ω-3), 159(ω-4) 또는 173(ω-5)의 수산화 부위에 의존하는 추가 이온 단편들을 나타낸다(도 21a 내지 도 21e 참조). 사슬 길이에 관하여, m/z = 117 및 345의 이온들의 조합은 유도화 후 11ω-1)-하이드록시도데칸산에 대한 특징적 이온들이다. 유사하게, m/z = 131 및 331, m/z = 145 및 317, m/z = 159 및 303, m/z = 173 및 289의 이온들의 조합 쌍은 ω-2, ω-3, ω-4 및 ω-5 하이드록시도데칸산들에 대한 특징적 이온들이다. 그러므로, RT 7.195로부터 7.510까지의 피크들은 7(ω-5)-, 8(ω-4)-, 9(ω-3)-, 10(ω-2)- 및 11(ω-1)-하이드록시 도데칸산으로서 식별되었고, RT 8.122로부터 8.414까지의 피크들은 9(ω-5)-, 10(ω-4)-, 11(ω-3)-, 12(ω-2)- 및 13(ω-1)-하이드록시 테트라데칸산으로서 식별되었다. 또한, 균주들 sSN.012 및 sSN.013의 GC/MS 크로마토그래프들이 α,ω-이산들의 존재에 대해 세밀하게 검사되었지만, 이러한 이작용성 분자들이 검출되지 않았다.

결론적으로, 이 실시예는 B. 메가테리움으로부터의 cyp102A1의 F87A의 발현과 조합될 때 지방산들을 과잉생성하도록 조작된 대장균 균주들이 ω-수산화 지방산들을 생성하지 않고, 미량의 ω-1, ω-2, ω-3, ω-4 및 ω-5 하이드록시 지방산들을 생성함을 나타낸다. B. 메가테리움으로부터의 cyp102A1의 F87A 점 돌연변이가 시험관 내에서 효소의 기질 특수성을 변화시켜, 효소가 ω-위치에서 도데칸산 또는 테트라데칸산을 거의 독점적으로 수산화하는 것으로 보고되었다(Oliver 외(1997) Biochem. 36: 1567 참조). 또한, B. 서브틸리스(subtilis)로부터의 P450-BM3(cyp102A3) 및 P450-BM3(F87A)(cyp153(F87A))가 14-하이드록시 테트라데콘산 및 1,14, 테트라데칸디오익산을 생성하는 것으로 보고되었다(예를 들어, WO 2012/071439). 하지만, 이는 확인될 수 없으며, 본 연구결과들을 반박하는 것처럼 보인다. 더욱이, cyp102A1의 유사 동족체인 바실러스 서브틸리스의 cyp102A3의 기질 특수성을 변경시키는 것에 관한 최근 보고들은 여기에 제시된 데이터를 지지한다(Lentz 외(2004) J. Biotechnol. 108:41 및 Lentz 외(2006) ChemBioChem. 7:345). 이와 같이, cyp102A3의 등가 페닐알라닌 잔기의 발린으로의 돌연변이(F88V)는 ω-1, ω-2, ω-3 및 ω-4 위치들에서 주로 지방산들을 수산화하였으며, 기질들로서 도데칸산 또는 헥사데칸산을 갖는 ω-수산화 생성물들이 시험관 내에서 관찰되지 않았다. 따라서, B. 메가테리움으로부터의 cyp102A1 및 B. 서브틸리스로부터의 cyp102A3의 앞서 설명된 변이체들은 ω-하이드록시 지방산들 또는 α,ω-이산들을 생성하기에 적합하지 않다는 결론을 내릴 수 있는데, 이는 후자가 중간체들로서 ω-하이드록시 지방산들을 필요로 하기 때문이다.

표 17: 아말단 수산화 지방산 유도체들의 생성을 위해 구성된 발현 플라스미드들

표 18: 재생가능한 탄수화물 공급원료들로부터 아말단 수산화 지방산 유도체들의 생성을 위한 cyp102A 단백질들을 발현시키는 재조합 대장균 균주들

실시예 9: 바실러스 리체니포르미스 ( Bacillus licheniformis )로부터 cyp102A7을 발현시키는 대장균 균주들에 의한 글루코오스로부터의 ω-1, ω-2 및 ω-3-수산화 지방산들의 효율적인 생성

본 실시예의 목적은 아말단 수산화 지방산들의 생성을 위해 바실러스 리체니포르미스로부터의 시토크롬 P450-BM3-타입 옥시게나아제 cyp102A7을 발현시키는 대장균 균주들을 테스트하는 것이다. 데이터는 시토크롬 P450-BM3-타입 옥시게나아제 cyp102A7을 발현시키는 재조합 대장균 균주들에 의한 ω-1, ω-2 및 ω-3-하이드록시 지방산들 및 지방족 알코올들의 효율적인 생성을 입증하였다.

바실러스 리체니포르미스(Dietrich 외(2008) Appl. Microbiol. Biotechnol. 79: 931)로부터의 P450-BM3-타입 옥시게나아제 CYP102A7을 코딩하는 yrhJ 유전자는 바실러스 리체니포르미스 ATCC14580 게놈 DNA(수탁 번호 AAU41718; SEQ ID NO: 63)로부터 증폭되었다. 유전자는 pCL1920-유도체(SC101 레플리콘, 스펙티노마이신 내성 마커)로 클로닝되어, 유도성 Ptrc 프로모터가 그 전사를 조절하였다. 또한, 유전자는 pCL1920-유도체로 클로닝되어, 유도성 Ptrc 프로모터가 (순서대로) yrhJ, 티오에스테라아제(tesA)의 변이체, 알코올 디하이드로게나아제(AlrA), 3-케토-아실-ACP 신타아제(fabB)의 변이체 및 전사 조절인자(fadR)로 만들어진 오페론을 조절한다. 플라스미드들은 각각 pHM105 및 pSL170.02로 명명되었으며, 대장균 균주들 LC972 및 XL959(위의 표 14 참조)로 형질전환되었다. 이 균주들은 여기에 간명하게 설명되어 있다(또한, 표 14 참조). 균주 LC972의 게놈은 다음과 같이 조작되었다: 아실-CoA 디하이드로게나아제(fadE) 유전자가 결실되었다. 포스포판테테이닐 트랜스퍼라아제, 2 카피(copy)의 티오에스테라아제(tesA)의 변이체 및 합성 지방산 생합성 오페론(표 1에 기재된 수 개의 유전자들로 구성된)이 과발현되었다. 균주 XL959는 카르복실산 리덕타아제 carB의 변이체를 발현시키는 pACYC 유도체 플라스미드를 갖는 LC972이었다. 4 개의 새로운 재조합 대장균 균주들 XL960 - XL963(위의 표 18 참조)은, 35 ℃가 배양 온도로서 사용된 것을 제외하고, 실시예 1 및 2에 설명된 바와 같은 글루코오스로부터 수산화 지방산 유도체들을 생성할 수 있는 능력에 대해 분석되었다. 균주들 중 어느 것도 여하한의 ω-수산화 지방산들 또는 지방산 유도체들을 생성하지 않았다. 하지만, 모든 균주들은 실시예 8에 설명된 바와 같은 아말단 수산화 지방산 유도체들을 생성하였다. 도 22a는 균주 XL961로부터 BFTSA 유도화 후의 크로마토그래프를 나타낸다. 실시예 8에 설명된 바와 같이, 피크들은 다음의 ω-1, ω-2 및 ω-3-하이드록시 지방산들: 11-하이드록시 도데칸산(RT=10.563), 10-하이드록시 도데칸산(RT=10.512), 9-하이드록시 도데칸산(RT=10.412), 13-하이드록시 테트라데칸산(RT=11.279), 12-하이드록시 테트라데칸산(RT=11.233), 11-하이드록시 테트라데칸산(RT=11.133), 15-하이드록시 헥사데칸산(RT=11.679), 14-하이드록시 헥사데칸산(RT=11.623) 및 13-하이드록시 헥사데칸산(RT=11.439)로서 식별되었다. 또한, 아마도 불포화 아말단 수산화 지방산들에 가장 대응하는 작은 피크들이 검출되었다.

도 22b는 균주 XL963으로부터 BFTSA 유도화 후의 크로마토그래프를 나타낸다. 피크들은 다음의 ω-1, ω-2 및 ω-3 하이드록시 지방족 알코올들로서 식별되었다: RT 8.303, 8.480 및 8.572 분에서의 피크들은 각각 7, 8 및 9-하이드록시데칸올이었고, RT 9.264, 9.653 및 9.905에서의 피크들은 각각 9, 10 및 11-하이드록시도데칸올이었으며, RT 10.889, 11.044 및 11.124에서의 피크들은 각각 11, 12 및 13-테트라데칸올이었다. 9, 10 및 11-하이드록시도데칸올을 식별하는데 사용된 상세 질량 스펙트럼 및 이온 단편화 패턴이 도 23a, 도 23b 및 도 23c에 도시되어 있다. 실시예 8의 유사 균주들이 미량의 아말단 수산화 지방산들만을 생성했다면, 4 개의 모든 균주들이 상당한 양의 이 생성물들(~1.6 g/L 이하)을 생성했다는 것이 놀라웠고 예기치 못했었다. 도 24a는 균주들 XL960 및 XL961에 의해 생성된 ω-1, ω-2 및 ω-3-하이드록실 지방산들의 양을 나타내고, 도 24b는 균주들 XL962 및 XL963에 의해 생성된 ω-1, ω-2 및 ω-3-하이드록실 지방족 알코올들의 양을 나타낸다. 따라서, 이 실시예는 B. 리체니포르미스로부터의 cyp102A7의 발현과 조합될 때 지방산 유도체들을 과잉생성하도록 조작된 대장균 균주들이 유일한 탄소원으로서 글루코오스로부터 ω-1, ω-2 및 ω-3-하이드록실 지방산 유도체들을 효율적으로 생성하였다.

실시예 10: 재조합 대장균 균주들에 의한 글루코오스로부터의 α,ω-디에스테르들의 생성

아실-CoA 신테타아제/리가아제 또는 트랜스퍼라아제 유전자가 cyp153A-RedRhF 융합 단백질을 코딩하는 유전자의 하류에서 pCL 유도 벡터로 클로닝되어, 2 개의 유전자들이 오페론을 형성하고, 오페론의 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절된다. 적합한 cyp153A 및 RedRhF 융합 파트너들의 예시들은 표 2A 및 표 2D에 제공되어 있다. 적합한 아실-CoA 신테타아제들/리가아제들 또는 트랜스퍼라아제들의 예시들이 표 7에 제공되어 있다. 결과적인 플라스미드는 대장균 균주, 예를 들어 KASH286(위의 실시예 6 및 표 14 참조)을 생성하는 지방산 메틸 에스테르로 형질전환된다. 균주는 실시예 1 및 2에 설명된 바와 같은 글루코오스로부터 ω-수산화 지방산 유도체들을 생성할 수 있는 능력에 대해 분석된다. 균주는 α,ω-디에스테르들을 생성할 것으로 예상된다.

실시예 11: 재조합 대장균 균주들에 의한 글루코오스로부터의 ω-아미노 지방산 유도체들의 생성

cyp153A-RedRhF 융합 단백질을 코딩하는 유전자, 알코올 옥시다아제 또는 디하이드로게나아제를 코딩하는 유전자 및 아미노트랜스퍼라아제 또는 트랜스아미나아제를 코딩하는 유전자가 pCL 유도 벡터로 클로닝되어, 3 개의 유전자들이 오페론을 형성하고, 오페론의 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절된다. 적합한 cyp153A 및 RedRhF 융합 파트너들의 예시들은 표 2A 및 표 2D에 제공되어 있다. 적합한 알코올 옥시다아제들 또는 디하이드로게나아제들의 예시들이 표 3A에 제공되어 있고, 적합한 아미노트랜스퍼라아제들 또는 트랜스아미나아제들의 예시들이 표 4에 제공되어 있다. 결과적인 플라스미드는 대장균 균주, 예를 들어 stNH1293(위의 실시예 6 및 표 14 참조)을 생성하는 지방산으로 형질전환된다. 균주는 실시예 1 및 2에 설명된 바와 같은 글루코오스로부터 ω-수산화 지방산 유도체들을 생성할 수 있는 능력에 대해 분석된다. 균주는 ω-아미노 지방산들을 생성할 것으로 예상된다. 대안적으로, 결과적인 플라스미드는 대장균 균주, 예를 들어 KASH286(위의 실시예 6 및 표 14 참조)을 생성하는 지방산 메틸 에스테르로 형질전환된다. 균주는 실시예 1 및 2에 설명된 바와 같은 글루코오스로부터 ω-수산화 지방산 유도체들을 생성할 수 있는 능력에 대해 분석된다. 균주는 ω-아미노 지방산 메틸 에스테르들을 생성할 것으로 예상된다.

실시예 12: 다양한 공급원료들로부터 ω-수산화 지방산 유도체들의 생성

지방산 생합성은 자연에 편재되어 있으며, 또한 본 명세서에 제공된 실시예들은 본질적으로 탄수화물 이외의 공급원료들을 이용하는 다른 유기체들에서도 구현될 수 있다. 예를 들어, 이러한 경로들은 광합성 미생물에서 발현될 수 있으며, CO₂로부터 ω-수산화 지방산 유도체들의 생성을 허용한다. 특히, 이들은, 광생물반응기(photobioreactor) 또는 개방 폰드(open pond)에서와 같이 적합한 조건들 하에서 성장될 때 이들이 배양물로부터 분리될 수 있는 ω-수산화 지방산 유도체들을 생성할, 시아노박테리아의 세포질에서 발현될 수 있다. 대안적으로, 당업자라면, 이러한 경로들이 클로스트리듐 속(genus Clostridia)으로부터의 것들과 같이 유기체를 이용하는 일산화탄소에서 발현될 수 있음을 알 수 있을 것이다. 예를 들어, 이러한 조작된 미생물들이 적절한 조건들에서[예를 들어, 제강소 플루 가스(steel mill flu gas), 또는 천연 가스나 바이오매스와 같은 유기 재료들의 재형성물로부터 유도된 합성 가스로부터 CO가 공급된 반응기에서] 성장될 때, 이들은 배양물로부터 회수될 수 있는 ω-수산화 지방산 유도체들을 생성할 것이다.

실시예 13: 다양한 CYP153A-리덕타아제 혼성 융합 단백질들을 발현시키는 재조합 대장균 균주들에 의한 글루코오스로부터의 ω-수산화 지방산 유도체들의 생성

본 실시예는 다양한 CYP153A P450 옥시게나아제 도메인들이 다양한 리덕타아제 도메인들과 융합되는 추가 키메라 혼성 단백질들을 발현시키는 재조합 대장균 균주에 의한, 글루코오스와 같은 재생가능한 탄수화물 공급원료로부터의 ω-하이드록시 지방산들의 생성을 나타낸다.

이 실험에서, 3 개의 미생물들로부터의 CYP153A P450 촉매 단백질들 및 4 개의 미생물들로부터의 리덕타아제 도메인 단백질들을 코딩하는 유전자들은 게놈 DNA로부터 증폭되었거나, 코돈-최적화 DNA(아래의 표 19 참조)로 합성되었다. 리덕타아제 도메인 단백질들은 RedRhF-타입 그리고 BM3-타입 단백질들을 포함하였다. 키메라 혼성 단백질들을 코딩하는 유전자들이 조립되었고 실시예 5(위 참조)에 설명된 바와 같은 pCL1920-유도 벡터들로 클로닝되었다. 결과적인 플라스미드들은 균주 AlcV334(표 14 참조)로 형질전환되었다. 이후, ω-수산화 지방산 유도체들을 생성하도록 조작된 이 추가적인 6 개의 균주들은, 실시예 1 및 2에 설명된 글루코오스와 같은 재생가능한 공급원료로부터 ω-수산화 지방산 유도체들을 생성할 수 있는 능력에 대해 분석되었다. 아래의 표 20은 32 ℃에서 18h 이내에 StEP675와 비교 시 이러한 균주에 의해 생성된 ω-수산화 지방산들의 양을 나타낸다. StEP675는 M. 아쿠애올레이로부터의 CYP153A 및 로도코쿠스 종 NCIMB 9784(실시예 6 참조)로부터의 리덕타아제 도메인으로 구성된 키메라 단백질을 발현시키는 균주 AlcV334이다. 아래의 표 20에서 알 수 있는 바와 같이, CYP153A-리덕타아제 혼성 융합 단백질들을 발현시키는 대부분의 균주들은 유일한 탄소원으로서 글루코오스로부터 ω-수산화 지방산 유도체들을 효율적으로 생성하였다. 결론적으로, CYP153A 계열의 상이한 요소들 및 RedRhF-타입 또는 BM3-타입 리덕타아제 계열의 상이한 요소들로부터 단백질들을 구성하는 키메라 CYP153A-리덕타아제 혼성 융합 단백질들은, 대장균에서 발현될 때 유일한 탄소원으로서 글루코오스로부터 ω-수산화 지방산 유도체들을 효율적으로 생성하였다.

표 19: 재생가능한 탄수화물 공급원료들로부터 ω-수산화 지방산 유도체들의 생성을 위한 혼성 cyp153A-리덕타아제 융합 단백질들을 발현시키는 추가적인 재조합 대장균 균주들

표 20: 글루코오스로부터 추가적인 재조합 대장균 균주들에 의해 생성된 ω-수산화 지방산 유도체들

다음의 프로토콜들 및 방법들은 실시예 14 내지 19에 관한 것이다.

프로토콜들 및 방법들

라이브러리 스크리닝

본 명세서에 설명된 모든 프로토콜들은 배양물들을 성장시키기 위한 96 웰 플레이트(96 well plate)-마스터 블록-2mL 시스템(Greiner Bio-One, Monroe, NC 또는 Corning, Amsterdam, The Netherlands), 및 배양액으로부터 지방산 종을 추출하기 위한 플레이트들(Costar, Inc.)에 의존한다. 아래에 제공된 프로토콜들은 발효 조건들의 예시들이다. 지방산 종의 생성을 평가하기 위해 대안적인 프로토콜들이 사용될 수 있다.

32 ℃ Plim 배양 프로토콜:

(96 웰 플레이트에서 성장된 LB 배양물로부터) 30 μL LB 배양물이 290 μL Plim 배지(아래의 표 21)에 접종(inoculate)하는데 사용되었으며, 이는 이후 32 ℃ 진탕으로 약 16 시간 동안 배양되었다. 하룻밤이 지난 씨드(overnight seed)의 40 μL가 360 μL Plim 배지에 접종하는데 사용되었다. 2 시간 동안 32 ℃에서 성장한 후, 배양물들은 IPTG(최종 농도 1 mM)로 유도되었다(아래의 표 21). 이후, 배양물들은, 달리 명시되지 않았다면 20 시간 동안 32 ℃에서 진탕으로 배양되었으며, 이후 배양물들은 아래에 자세히 설명된 표준 추출 프로토콜에 따라 추출되었다.

35 ℃ Nlim 배양 프로토콜:

(96 웰 플레이트에서 성장된 LB 배양물로부터) 40 μL LB 배양물이 360 μL Nlim 배지(아래의 표 21)에 접종하는데 사용되었으며, 이는 이후 32 ℃ 진탕으로 약 4 시간 동안 배양되었다. LB 씨드의 40 μL가 360 μL Nlim 배지에 접종하는데 사용되었다. 32 ℃에서 2 시간 동안 성장한 후, 배양물들은 IPTG(최종 농도 1 mM)로 유도되었다(아래의 표 21). 이후, 배양물들은, 달리 명시되지 않았다면 20 시간 동안 35 ℃에서 진탕으로 배양되었으며, 이후 배양물들은 아래에 자세히 설명된 표준 추출 프로토콜에 따라 추출되었다.

표 21: 배지명 및 조성

지방산 종 표준 추출 프로토콜:

각각의 웰에 80 μL의 1M HCl이 추출되게 하기 위해, 이후 (내부 표준으로서 500 mg/L 펜타데칸올을 갖는) 400 μL의 부틸 아세테이트가 첨가되었다. 96 웰 플레이트들은 이후 플레이트 실러(plate sealer)(ALPS-300 가열기; Abgene, ThermoScientific, Rockford, IL)를 이용하여 열-융착되었고(heat-sealed), MIXMATE 혼합기(Eppendorf, Hamburg, Germany)를 이용하여 2000 rpm으로 15 분 동안 진탕되었다. 진탕 후, 플레이트들은 실온에서 4500 rpm으로 10 분 동안 원심분리되어(Allegra X-15R, rotor SX4750A, Beckman Coulter, Brea, CA), 수성 및 유기 층들을 분리하였다. 100 μL의 유기 층이 96 웰 플레이트(폴리프로필렌, Corning, Amsterdam, The Netherlands)로 전달되었으며, 100 μL의 BSTFA로 유도화되었다. 플레이트는 이후 열-융착되었고, w-OH FFA 방법을 이용하여 GC-FID에 의해 평가될 때까지 -20 ℃로 저장되었으며, 이는 다음과 같이 수행되었다: 1 μL의 샘플이 1 내지 20 스플릿(split)을 갖는 불꽃 이온화 검출기(flame ionization detector: FID)를 갖는 Agilent 7890A GC Ultra 장치(Agilent, Santa Clara, CA)에서 분석 컬럼(DB-1, 10 m x 180 ㎛ x 0.2 μΜ 막 두께, JW 121-101A로부터 이용가능함) 상으로 접종되었다. 장비는 C₁₀ 내지 C₁₈ 지방산들 및 ω-하이드록시 지방산들을 검출 및 정량화하도록 셋업되었다. 앞서 자세히 설명된 프로토콜은 표준 조건들을 나타내며, 이는 분석 결과들을 최적화하기 위해 필요에 따라 변형될 수 있다.

오류 유발 라이브러리 구축

해당 기술분야의 당업자에게 알려진 표준 기술들은 오류 유발 라이브러리들을 제조하는데 사용되었다. 일 예시에서, 벡터 골격(vector backbone)은 벡터의 제한 엔도뉴클레아제(restriction endonuclease)들을 이용함으로써 제조된 한편, DNA 삽입체의 다양성(diversity)의 생성은 미스매치된 뉴클레오티드들의 통합에 우호적인 조건들 하에서 DNA 주형으로부터 PCR 증폭에 의해 생성되었다. 일 접근법에서, 다양성을 갖는 DNA 삽입체 및 벡터 골격의 클로닝은 제조업체의 프로토콜에 따라 INFUSION Cloning System(Clontech Laboratories, Inc., Mountain View, CA)을 이용하여 수행되었다.

포화 라이브러리(Saturation Libraries) 구축

해당 기술분야의 당업자에게 알려진 표준 기술들은 포화 라이브러리들을 제조하는데 사용되었다. 일 예시에서, 벡터 골격은 벡터의 제한 엔도뉴클레아제들을 이용함으로써 제조된 한편, DNA 삽입체의 다양성의 생성은 변성 프라이머(degenerate primer)들을 이용하여 생성되었다. 일 접근법에서, 다양성을 갖는 DNA 삽입체 및 벡터 골격의 클로닝은 제조업체의 프로토콜에 따라 INFUSION Cloning System(Clontech Laboratories, Inc., Mountain View, CA)을 이용하여 수행되었다.

조합 라이브러리 구축

유익한 것으로 식별된 돌연변이들이 ω-OH 지방산 유도체 종의 생성 시 CYP153-리덕타아제 혼성 융합 폴리펩티드 변이체들(예를 들어, CYP153A-RedRhF 혼성 융합 단백질 변이체들)에 추가 개선들을 제공하도록 조합되었다. 해당 기술분야의 당업자에게 알려진 표준 기술들은 조합 라이브러리들을 제조하는데 사용되었다. 일 예시에서, 벡터 골격은 벡터의 제한 엔도뉴클레아제들을 이용함으로써 제조된 한편, DNA 삽입체의 다양성의 생성은 의도한 돌연변이들을 도입하기 위해 프라이머들을 이용하여 생성되었다. 앞서 설명된 바와 같이, 일 접근법에서, 다양성을 갖는 DNA 삽입체 및 벡터 골격의 클로닝은 제조업체의 프로토콜에 따라 INFUSION Cloning System(Clontech Laboratories, Inc., Mountain View, CA)을 이용하여 수행되었다. 조합 라이브러리는 tPCR(transfer PCR) 프로토콜을 이용하여 생성될 수 있다[Erijman 외(2011) J. Structural Bio.175:171-177].

라이브러리 스크리닝

라이브러리 다양성이 오류-유발, 포화 라이브러리 또는 조합 라이브러리에 생성되었으면, 이는 앞서 설명된 방법들 중 하나를 이용하여 스크리닝되었다. 두 가지 타입의 히트(hit)들이 식별되었다: (1) 증가된 양의 ω-하이드록시 지방산들(ωOH FFA 역가); 및/또는 (2) 지방산들의 ω-하이드록시 지방산들로의 증가된 전환. 각 히트 내의 혼성 cyp153A-RedRhF 단백질 변이체들의 돌연변이들은 해당 기술분야의 당업자에 의해 통상적으로 이용되는 표준 기술들을 이용하여 서열화함으로써 식별되었다. 아래의 표 23, 표 24 및 표 25는 포화 라이브러리들에 유익한 것으로 식별된 돌연변이들(히트들)을 목록화한 것이다.

실시예 14: 라이브러리 스크리닝을 위한 균주 및 플라스미드 구성

본 실시예는 포화 또는 조합 돌연변이유발 라이브러리 스크리닝을 위해 구성된 균주들 및 플라스미드들을 설명한다.

마리노박터 아쿠애올레이로부터의 CYP153A(G307A) P450 촉매 단백질로 만들어진 혼성-융합 단백질 및 로도코쿠스 종 NCIMB9784로부터의 P450RhF의 c-말단 FMN- 및 Fe/S-함유 리덕타아제 도메인을 코딩하는 유전자는 다음과 같이 생성되었다: cyp165A(G307A)_Maqu 유전자는 게놈 DNA로부터 증폭되었고, 크로스-오버 PCR에 의해 코돈-최적화 합성 P450RhF 리덕타아제 도메인과 융합되었다. 결과적인 융합 유전자(SEQ ID NO: 5)는 pACYC-유도체(즉, p15A 레플리콘, 카나마이신 내성 마커)로 클로닝되어, 그 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되었다. 플라스미드는 pEP125(아래의 표 22 참조)로 명명되었다. 또한, CYP153A(G307A)-Red450RhF 혼성 융합 단백질을 코딩하는 유전자가 pEP125로부터 증폭되었고, pCL1920-유도 벡터(SC101 레플리콘, 스펙티노마이신 내성 마커)로 클로닝되어, 그 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되었으며, 이는 식물 티오에스테라아제(fatB1), 3-케토-아실-ACP 신타아제(fabB)의 변이체 및 전사 조절인자(fadR)를 코딩하는 유전자들을 갖는 오페론을 형성하였다. 플라스미드는 pLC81(아래의 표 22 참조)로 명명되었다.

추가 플라스미드들이 다음과 같이 생성되었다: 월계수(Umbellularia californica)로부터의 식물 티오에스테라아제(fatB1)를 코딩하는 유전자는 코돈-최적화 DNA로서 합성되었고, pCL1920-유도 벡터(SC101 레플리콘, 스펙티노마이신 내성 마커)로 클로닝되어, 그 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되었으며, 이는 아세틸-CoA 카르복실라아제(accDACB), 비오틴 리가아제(birA) 및 아실기-운반 단백질을 코딩하는 유전자들을 갖는 오페론을 형성하였다. 플라스미드는 pNH305(아래의 표 22 참조)로 명명되었다. 플라스미드 pAS033은 pNH305의 fatB1을, 애기장대로부터의 코돈-최적화 합성 식물 티오에스테라아제(fatA3)로 대체함으로써 생성되었다(아래의 표 22 참조). 플라스미드 pEP146은 pLC81의 fatB1을, 애기장대로부터의 코돈-최적화 합성 식물 티오에스테라아제(fatA3)로 대체함으로써 생성되었다(아래의 표 22 참조). 또한, pEP146은 repA 단백질을 코딩하는 플라스미드 내에 돌연변이를 가졌다.

플라스미드 형질전환을 위해 사용되는 기본 균주들은 GLP077 및 BZ128이었다. 간명하게, 기본 균주 GLPH077의 게놈은 다음과 같이 조작되었다: 아실-CoA 디하이드로게나아제(fadE) 유전자가 결실되었고, 전사 조절인자(fadR) 및 합성 지방산 생합성 오페론이 과발현되었다. 간명하게, 기본 균주 BZ128의 게놈은 다음과 같이 조작되었다: fadE(아실-CoA 디하이드로게나아제) 유전자가 결실되었고, 합성 지방산 생합성 오페론, β-하이드록시 지방족 아실-ACP 탈수효소(fabZ) 및 티오에스테라아제(tesA)의 변이체가 과발현되었다. 또한, 균주는 이전에 전이인자(transposon) 그리고 N-메틸-N'-니트로-N-니트로소구아니딘(NTG) 돌연변이유발 및 스크리닝을 거쳤다.

표 22: 라이브러리 스크리닝에 사용되는 플라스미드들

혼성 cyp153A(G307A)-Red450RhF 융합 단백질은 숙주 세포들에서의 발현이 ω-OH 지방산 유도체들을 생성할 수 있는지를 관찰하기 위해 테스트되었다. SEQ ID NO: 5를 발현시키는 미생물은 글루코오스로부터 1 g/L 이상의 ω-OH 지방산 유도체들을 생성할 수 있었다. 따라서, 이 조작된 효소는 또 다른 진화 연구들을 위해 선택되었다.

실시예 15: cyp153A(G307A)-Red450RhF 융합 단백질의 P450 촉매 도메인의 포화 라이브러리들

CYP153A-Red450RhF 융합 단백질의 P450 촉매 도메인의 전체 포화 라이브러리가 구축되었고, CYP153A(G307A)-Red450RhF(즉, 주형 폴리펩티드)를 넘어선 개선들을 나타낸 변이체들에 대해 스크리닝되었다. G307A(글리신 잔기가 307 위치에서 알라닌으로 대체되었다)는 CYP153A(Honda Malca 외(2012) Chem. Commun. 48:5115)의 ω-하이드록실라아제 활성을 개선하는 유익한 돌연변이이다. 히트들에 대한 선별 기준은, (1) 증가된 양의 ω-하이드록시 지방산들(ωOH FFA 역가); 및/또는 (2) 지방산들의 ω-하이드록시 지방산들로의 증가된 전환이었다.

해당 기술 분야의 당업자에게 알려진 표준 기술들은 포화 라이브러리들을 제조하는데 사용되었다. 플라스미드들 pEP125 및 pLC81(위의 표 22 참조)은 전체 포화 라이브러리들을 만드는데 사용되었다. 3 개의 포화 라이브러리들이 스크리닝되었다: 제 1 라이브러리에 대하여 pEP125는 pNH305와 함께 균주 GLPH077로 형질전환되었고, 제 2 라이브러리에 대하여 pLC81은 BZ128로 형질전환되었으며, 제 3 라이브러리에 대하여 pEP125는 pAS.033과 함께 GLPH077 균주로 형질전환되었다. 제 1 및 제 2 라이브러리는 특히 ω-하이드록시 도데칸산 형성 시 개선된 변이체들에 대해 스크리닝되었고, 제 3 라이브러리는 특히 ω-하이드록시 헥사데센산 형성 시 개선된 변이체들에 대해 스크리닝되었다. 라이브러리들은 앞서 설명된 표준 프로토콜들 중 하나를 이용하여 스크리닝되었다. 개선된 변이체들이 아래의 표 23 내지 표 25(아래 참조)에 나타나 있다. 특히, 141 위치의 변이체들이 여러번 식별되었고, ω-하이드록시 도데칸산 및 ω-하이드록시 헥사데센산 형성 둘 모두에 대해 상당히 개선된 효소들인 것으로 밝혀졌다.

표 23: CYP153A(G307A)-Red450RhF의 촉매 도메인의 제 1 부위 포화 라이브러리로부터의 개선된 변이체들의 개요

표 24: CYP153A(G307A)-Red450RhF의 촉매 도메인의 제 2 부위 포화 라이브러리로부터의 개선된 변이체들의 개요

표 25: CYP153A(G307A)-Red450RhF의 촉매 도메인의 제 3 부위 포화 라이브러리로부터의 개선된 변이체들의 개요

실시예 16: CYP153A(G307A)-Red450RhF 융합 단백질의 리덕타아제 도메인의 부분 부위 포화 라이브러리들

혼성 CYP153A(G307A)-Red450RhF 융합 단백질의 리덕타아제 도메인들의 부분 포화 라이브러리(10 번째 아미노산마다 돌연변이됨)가 구축되었고, 촉매 P450 CYP153A 도메인의 부위 포화 돌연변이유발 라이브러리에서 식별된 변이체인 CYP153A(V141I, A231T, G307A)-Red450RhF(SEQ ID NO: 32)를 넘어서는 개선들을 나타낸 변이체들에 대해 스크리닝되었다. 히트들에 대한 선택 기준은, (1) 증가된 양의 ω-하이드록시 도데칸산(ωOH FFA 역가); 및/또는 (2) 도데칸산의 ω-하이드록시 도데칸산으로의 증가된 전환이었다. 해당 기술 분야의 당업자에게 알려진 표준 기술들은 포화 라이브러리들을 제조하는데 사용되었다. 라이브러리에 대하여, CYP153A(V141I, A231T, G307A)-Red450RhF를 포함하는(harboring) pLC81이 BZ128로 형질전환되었다. 라이브러리는 앞서 설명된 표준 프로토콜들 중 하나를 이용하여 스크리닝되었다. 개선된 변이체들이 아래의 표 26에 나타나 있다. 특히, 변이체들 A796V(SEQ ID: 42) 및 P666A가 상당히 개선된 효소들이었다.

표 26: CYP153A(V141I, A231T, G307A)-Red450RhF의 리덕타아제 도메인의 부분 포화 라이브러리로부터의 개선된 변이체들의 개요

실시예 17: CYP153A(G307A)-Red450RhF 융합 단백질의 리덕타아제 도메인의 조합 라이브러리

리덕타아제 도메인(실시예 17)의 부분 포화 라이브러리에서 식별된 유익한 돌연변이들은 CYP153A(G307A)-Red450RhF 융합 단백질을 더욱 개선하기 위한 조합 라이브러리의 기저(basis)였다. 선별 기준은, (1) 증가된 양의 ω-하이드록시 도데칸산(ωOH FFA 역가); 및/또는 (2) 도데칸산의 ω-하이드록시 도데칸산으로의 증가된 전환이었다.

조합 라이브러리는 CYP153A(V141I, A231T, G307A)-Red450RhF(SEQ ID: 32)를 포함하는 pLC81에서 구축되었고, BZ128로 형질전환되었다. 해당 기술 분야의 당업자에게 알려진 표준 기술들은 조합 라이브러리들을 제조하는데 사용되었다. 라이브러리는 앞서 설명된 표준 프로토콜들 중 하나를 이용하여 스크리닝되었다. 개선된 변이체들이 아래의 표 27에 나타나 있다.

표 27: CYP153A(V141I, A231T, G307A)-Red450RhF의 리덕타아제 도메인의 조합 라이브러리로부터의 개선된 변이체들의 개요

실시예 18: CYP153A(G307A)-Red450RhF 융합 단백질의 촉매 및 리덕타아제 도메인의 조합 라이브러리

포화 라이브러리들(실시예 16 및 17)에서 식별된 유익한 돌연변이들은 CYP153A(G307A)-Red450RhF 융합 단백질을 더욱 개선하기 위한 조합 라이브러리의 기저였다. 선택 기준은, (1) 증가된 양의 ω-하이드록시 도데칸산(ωOH FFA 역가); 및/또는 (2) 도데칸산의 ω-하이드록시 도데칸산으로의 증가된 전환이었다. 조합 라이브러리는 pLC81에서 구축되었고, BZ128로 형질전환되었다. 해당 기술 분야의 당업자에게 알려진 표준 기술들은 조합 라이브러리들을 제조하는데 사용되었다. 라이브러리는 앞서 설명된 표준 프로토콜들 중 하나를 이용하여 스크리닝되었다. 2 개의 개선된 최적 변이체들이 표 28에 나타나 있다.

표 28: CYP153A(G307A)-Red450RhF의 조합 라이브러리로부터의 최상의 개선된 변이체들

실시예 19: CYP153A(G307A, A796V)-Red450RhF의 141 및 309 위치의 부위 포화 돌연변이유발

141 위치의 변화들은 기질 특수성에 영향을 미쳤음을 유의한다. 그러므로, 이 2 개의 위치들의 부위 포화 돌연변이유발이 CYP153A(G307A, A796V)-Red450RhF에서 수행되었다. 히트들에 대한 선별 기준은, (1) 증가된 양의 ω-하이드록시 헥사데센산; 및/또는 (2) 헥사데센산의 ω-하이드록시 헥사데센산으로의 증가된 전환이었다.

라이브러리에 대하여, CYP153A(G307A A796V)-Red450RhF(SEQ ID: 38)를 포함하는 pEP146은 BZ128로 형질전환되었다. 해당 기술 분야의 당업자에게 알려진 표준 기술들은 부위 포화 라이브러리들을 제조하는데 사용되었다. 라이브러리는 앞서 설명된 표준 프로토콜들 중 하나를 이용하여 스크리닝되었다. 특히 V141T(SEQ ID: 46)를 갖는 변이체들이 가장 높은 ω-하이드록시 헥사데센산 역가 및 헥사데센산으로부터의 가장 높은 전환을 나타내었다(도 27).

실시예 20: 개선된 혼성 CYP153A-Red450RhF 융합 단백질을 발현시키는 재조합 대장균 균주들에 의한 글루코오스로부터의 ω-수산화 지방산들의 높은 역가 생성

본 실시예는 개선된 혼성 CYP153A-Red450RhF 융합 단백질을 발현시키는 재조합 대장균 균주들에 의한 글루코오스와 같은 재생가능한 탄수화물 공급원료로부터의 ω-하이드록시 지방산들의 고-수율 생성을 나타낸다.

변이 혼성 CYP153A-Red450RhF 융합 단백질(SEQ ID No: 46)을 코딩하는 유전자는 pCL1920-유도 벡터(변형된 SC101 레플리콘, 스펙티노마이신 내성 마커)로 클로닝되어, 그 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되었으며, 이는 식물 티오에스테라아제(fatA3), 3-케토-아실-ACP 신타아제(fabB)의 변이체 및 전사 조절인자(fadR)를 갖는 오페론을 형성하였다. 플라스미드는 균주 stEP.798을 유도하는 균주 L439로 형질전환되었다. 간명하게, 기본 균주 L439의 게놈은 다음과 같이 조작되었다: fadE(아실-CoA 디하이드로게나아제) 유전자가 결실되었고, 합성 지방산 생합성 오페론 및 티오에스테라아제(tesA)의 변이체가 과발현되었다. 또한, 균주는 이전에 전이인자 그리고 N-메틸-N'-니트로-N-니트로소구아니딘(NTG) 돌연변이유발 및 스크리닝을 거쳤다.

균주는 다음과 같은 생물반응기에서 진행되었다: 1 보다 큰 배양물의 OD 판독이 이루어질 때까지, 32 ℃에서 스펙티노마이신(115 mg/L)을 함유하는 LB 진탕 플라스크에서 균주의 세포 은행 바이알이 배양되었다. 이 배양물의 5 % v/v 전달(transfer)이 FA 시드 배지(seed media)(2 g/L 암모늄 클로라이드, 0.5 g/L 소듐 클로라이드, 0.3 g/L 포타슘 포스페이트 모노베이직, 1 mM 마그네슘 설페이트, 0.1 mM 칼슘 클로라이드, 20 g/L 글루코오스, 1 mL/L의 미량 원소 용액, 10 mg/L의 페릭 시트레이트 트리베이직 모노하이드레이트, 100 mM의 bis tris 완충액, 및 115 mg 스펙티노마이신) 내로 행해졌으며, 32 ℃에서 하룻밤 배양되었다. 이후, 이 시드 배양물은 생성을 위해 제조된 생물반응기에 접종하는데 사용되었다. 이 공정에 대한 초기 생물반응기 배지는: 0.5 g/L 암모늄 클로라이드, 1 g/L 소듐 클로라이드, 4 g/L 포타슘 포스페이트 모노베이직, 2.2 g/L 마그네슘 설페이트 헵타하이드레이트, 140 mg/L 칼슘 클로라이드 디하이드레이트, 10 mL/L의 미량 원소 용액, 80 mg/L의 페릭 시트레이트 트리베이직 모노하이드레이트, 0.6 mL/L의 미량 비타민 용액, 및 5 g/L의 옥수수 침지 분말(corn steep powder)을 함유하였다. 생물반응기에 대한 후-살균 첨가제(post-sterile addition)들은: 0.2 mM 아미노레불린산, 30 g/L의 글루코오스 및 115 mg/L 스펙티노마이신을 포함하였다.

접종 전, 생물반응기 파라미터들이 안정화되었고, 제어 루프들은 - 용해된 산소 설정점: 30 %; 온도 설정점 29 ℃; 포기 설정점(aeration setpoint): 0.5 vvm; pH 설정점: 6.9에서 구현되었다(turned on). 생물반응기에 5 % v/v의 시드 배양물이 접종되었고, 배양물의 밀도가 OD 30보다 클 때 1 mM IPTG로 유도되었다. 복합체 글루코오스 공급 용액(586 g/L 글루코오스, 2.2 g/L 마그네슘 설페이트 헵타하이드레이트, 0.4 g/L 포타슘 포스페이트 모노베이직, 80 mg/L 페릭 시트레이트 트리베이직 모노하이드레이트, 및 10 mL/L의 미량 원소 용액)이, 배지가 글루코오스로 고갈될 때를 제어기에 나타내기 위해 DO 트리거(trigger)를 이용하여, (공칭 배양물 부피에 기초하여) 10 g/L 글루코오스의 최대 속도로 배양물에 공급되었다. 생물반응기는 진행 내내 샘플링되었고, 72 시간 배양 후 수득되었다.

도 25는 30.5 ℃에서 72 h 동안 균주 stEP.798에 의해 생성된 ω-수산화 지방산의 양을 나타내며, 이는 72 h 후 16.0 g/L의 높은 역가에 도달하였다. 생성된 ω-수산화 지방산들은 63.1 % ω-하이드록시 헥사데센산(C16:1), 26.4 % ω-하이드록시 헥사데칸산(C16:0), 7.6 % ω-하이드록시 테트라데칸산(C14:0), 1.9 % ω-하이드록시 테트라데센산(C14:1) 및 소량의 ω-하이드록시 도데센산(C12:0) 및 ω-하이드록시 도데센산(C12:1)(C12는 1 % 미만)으로 구성되었다. 또한, stEP.798은 72h에서 3.0 g/L 지방산들을 생성하였다. 결론적으로, 지방산-과잉생성 대장균 균주에서의 개선된 혼성 CYP153A-Red450RhF 융합 단백질은 재생가능한 탄수화물 공급원료로부터 고-역가 ω-수산화 지방산 생성을 가능하게 했다.

실시예 21: 개선된 혼성 CYP153A-Red450RhF 융합 단백질을 발현시키는 재조합 대장균 균주들에 의한 글루코오스로부터의 α,ω-이산들의 높은 역가 생성

본 실시예는 이종 알코올 옥시다아제(alkJ) 및 알데히드 디하이드로게나아제(alkH) 그리고 개선된 혼성 CYP153A-Red450RhF 융합 단백질을 발현시키는 재조합 대장균 균주들에 의한 글루코오스와 같은 재생가능한 탄수화물 공급원료로부터의 α,ω-이산들의 고-수율 생성을 나타낸다.

변이 혼성 CYP153A-Red450RhF 융합 단백질(SEQ ID NO: 42)을 코딩하는 유전자는 pCL1920-유도 벡터(변형된 SC101 레플리콘, 스펙티노마이신 내성 마커)로 클로닝되어, 그 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되었으며, 이는 식물 티오에스테라아제(fatB1), 알코올 옥시다아제(alkJ), 알데히드 디하이드로게나아제(alkH), 3-케토-아실-ACP 신타아제(fabB)의 변이체 및 전사 조절인자(fadR)를 갖는 오페론을 형성하였다. 플라스미드는 균주 L1017을 유도하는 균주 L1012로 형질전환되었다. 간명하게, 기본 균주 L1012의 게놈은 다음과 같이 조작되었다: fadE(아실-CoA 디하이드로게나아제) 및 adhE(알코올 디하이드로게나아제) 유전자들이 결실되었고, 합성 지방산 생합성 오페론, β-하이드록시 지방족 아실-ACP 탈수효소(fabZ) 및 티오에스테라아제(tesA)의 변이체가 과발현되었다. 또한, 균주는 이전에 전이인자 그리고 N-메틸-N'-니트로-N-니트로소구아니딘(NTG) 돌연변이유발 및 스크리닝을 거쳤다.

균주는 다음과 같은 생물반응기에서 진행되었다: 1 보다 큰 배양물의 OD 판독이 이루어질 때까지, 32 ℃에서 스펙티노마이신(115 mg/L)을 함유하는 LB 진탕 플라스크에서 균주의 세포 은행 바이알이 배양되었다. 이 배양물의 2 % v/v 전달이 FA 시드 배지(2 g/L 암모늄 클로라이드, 0.5 g/L 소듐 클로라이드, 0.3 g/L 포타슘 포스페이트 모노베이직, 1 mM 마그네슘 설페이트, 0.1 mM 칼슘 클로라이드, 20 g/L 글루코오스, 1 mL/L의 미량 원소 용액, 10 mg/L의 페릭 시트레이트 트리베이직 모노하이드레이트, 100 mM의 bis tris 완충액, 및 115 mg 스펙티노마이신) 내로 행해졌으며, 32 ℃에서 하룻밤 배양되었다. 이후, 이 시드 배양물은 생성을 위해 제조된 생물반응기에 접종하는데 사용되었다. 이 공정에 대한 초기 생물반응기 배지는: 0.5 g/L 암모늄 클로라이드, 1 g/L 소듐 클로라이드, 4 g/L 포타슘 포스페이트 모노베이직, 2.2 g/L 마그네슘 설페이트 헵타하이드레이트, 140 mg/L 칼슘 클로라이드 디하이드레이트, 10 mL/L의 미량 원소 용액, 80 mg/L의 페릭 시트레이트 트리베이직 모노하이드레이트, 0.6 mL/L의 미량 비타민 용액, 및 5 g/L의 옥수수 침지 분말을 함유하였다. 생물반응기에 대한 후-살균 첨가제들은: 0.2 mM 아미노레불린산, 30 g/L의 글루코오스 및 115 mg/L 스펙티노마이신을 포함하였다.

접종 전, 생물반응기 파라미터들이 안정화되었고, 제어 루프들은 - 용해된 산소 설정점: 30 %; 온도 설정점 31 ℃; 포기 설정점: 0.5 vvm; pH 설정점: 6.9에서 구현되었다. 생물반응기에 5 % v/v의 시드 배양물이 접종되었고, 배양물의 밀도가 OD 30보다 클 때 1 mM IPTG로 유도되었다. 복합체 글루코오스 공급 용액(586 g/L 글루코오스, 2.2 g/L 마그네슘 설페이트 헵타하이드레이트, 0.4 g/L 포타슘 포스페이트 모노베이직, 80 mg/L 페릭 시트레이트 트리베이직 모노하이드레이트, 및 10 mL/L의 미량 원소 용액)이, 배지가 글루코오스로 고갈될 때를 제어기에 나타내기 위해 pH 트리거를 이용하여, (공칭 배양물 부피에 기초하여) 10 g/L 볼루스(bolus)로서 배양물에 공급되었다. 생물반응기는 진행 내내 샘플링되었고, 48 시간 배양 후 수득되었다.

도 26은 30.5 ℃에서 48 h 동안 균주 L1017에 의해 생성된 α,ω-이산들의 양을 나타낸다. 균주는 31 h에서 21.2 g/L α,ω-이산들을 생성하였고, 48 h 후 23.9 g/L의 높은 역가에 도달하였다. 생성된 α,ω-이산들은 85.9 % α,ω-도데칸산(C12:0), 4.7 % α,ω-도데센산(C12:1), 5.7 % α,ω-테트라데칸산(C14:0), 2.9 % α,ω-테트라데센산(C14:1) 및 소량의 α,ω-헥사데센산(C16:1)(C16은 1 % 미만)으로 구성되었다. 또한, L1017은 48h에 9.3 g/L 지방산들을 생성하였다. ω-하이드록시 지방산들은 미량만 검출되었다. 결론적으로, 알코올 옥시다아제(alkJ) 및 알데히드 디하이드로게나아제(alkH)의 공동발현과 함께 지방산-과잉생성 대장균 균주에서의 개선된 혼성 CYP153A-Red450RhF 융합 단백질의 발현은 재생가능한 탄수화물 공급원료로부터 고-역가 α,ω-이산들의 생성을 가능하게 했다.

당업자라면 이해할 수 있는 바와 같이, 앞선 실시형태들 및 구현예들의 다양한 변형들 및 변경들이 본 발명의 기술사상 및 범위를 벗어나지 않고 행해질 수 있다. 이러한 변형들 및 변경들은 본 발명의 범위 내에 있다.

SEQUENCE LISTING <110> GENOMATICA, INC. <120> METHODS OF PRODUCING OMEGA-HYDROXYLATED FATTY ACID DERIVATIVES <130> FPA12150-D03/C <140> <141> <150> 61/835,464 <151> 2013-06-14 <160> 69 <170> PatentIn version 3.5 <210> 1 <211> 1413 <212> DNA <213> Marinobacter aquaeolei <400> 1 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgg cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt taa 1413 <210> 2 <211> 470 <212> PRT <213> Marinobacter aquaeolei <400> 2 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Gly Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser 465 470 <210> 3 <211> 1413 <212> DNA <213> Marinobacter aquaeolei <400> 3 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt taa 1413 <210> 4 <211> 470 <212> PRT <213> Marinobacter aquaeolei <400> 4 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser 465 470 <210> 5 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 5 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 <210> 6 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 6 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 7 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 7 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagct gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 <210> 8 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 8 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 9 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 9 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tgggacgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 <210> 10 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 10 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Asp Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 11 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 11 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 atcgaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 <210> 12 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 12 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Ile Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 13 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 13 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 caggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 <210> 14 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 14 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Gln Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 15 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 15 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 ggggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 <210> 16 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 16 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Gly Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 17 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 17 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 atggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 <210> 18 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 18 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Met Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 19 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 19 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 ctggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 <210> 20 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 20 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Leu Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 21 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 21 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 <210> 22 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 22 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Thr Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 23 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 23 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc aaacaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 <210> 24 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 24 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Asn Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 25 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 25 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggccgggat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 <210> 26 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 26 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Arg Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 27 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 27 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcggcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 <210> 28 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 28 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 29 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 29 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg ggcgtcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 <210> 30 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 30 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Arg His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 31 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 31 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 atcgaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt acagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 <210> 32 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 32 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Ile Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Thr Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 33 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 33 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagct gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tgggacgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 atggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc aaacaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcgcggat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 <210> 34 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 34 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Asp Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Met Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Asn Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Ala Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 35 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 35 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcggcggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 <210> 36 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 36 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Ala Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 37 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 37 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400 <210> 38 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 38 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu 785 790 795 <210> 39 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 39 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaagtcct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcggacgg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400 <210> 40 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 40 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Val Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Asp Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu 785 790 795 <210> 41 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 41 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 atcgaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt acagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400 <210> 42 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 42 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Ile Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Thr Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu 785 790 795 <210> 43 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 43 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagct gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tgggacgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 atggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc aaacaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcgcggat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400 <210> 44 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 44 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Asp Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Met Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Asn Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Ala Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu 785 790 795 <210> 45 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 45 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt acagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400 <210> 46 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 46 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Thr Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Thr Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu 785 790 795 <210> 47 <211> 2415 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 47 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtgctggcgc cacgtgacgc ggtccgcatc 1440 ggcgaaccga ctggcggcac caccggtcgc acgctcattg tcgagcgcgt cgagacggcc 1500 gcgcagggtg tgtcgcggat ccgcctggtt tcgcccgatg gtcgcgcact accgcgttgg 1560 tcgccgggct cgcatatcga catcgaatgc ggccacaccg gcatctcgcg ccagtattcg 1620 ctgtgcggcg accccgccga taccagcgcc ttcgagatcg cggtgctgcg cgagcccgaa 1680 agccgtggtg gatcggcgtg gattcatgcc agtctgcgcg caggcgacaa gctcaaggtt 1740 cgcggcccgc gcaatcactt ccggctcgac gagacctgcc gtcgcgcgat cttcatcgcc 1800 ggtggcattg gcgtgactcc ggtcagcgcc atggcaaggc gtgcgaaaga actgggcgtc 1860 gactacacct tccactattg cggccgcagc cgtgcctcca tggcgatgat cgatgaactg 1920 cgcgccctgc atggtgatcg cgtgcggatt catgccgcgg atgaaggcca gcgcgccgat 1980 ctcgcgcaag tgctcggcgc acccgatgcg aacacgcaga tctacgcttg tggaccggcc 2040 cggatgatcg aggcgctgga agccctgtgc gcgacatggc ccgaggattc gctgcgcgtc 2100 gaacacttca gttcgaaact tggaacgctc gatccctcca gggaacagcc gtttgcggtc 2160 gaactgaagg actcggggct gacgcttgaa gttcctccgg accagacgct gctcgccacc 2220 ctgcgcgccg cgaacatcga cgtgcaaagc gattgcgagg aaggcctgtg tggatcgtgt 2280 gaagtgcgcg tgctggccgg cgagatcgac caccgcgacg tcgtgctgac gcgcggcgag 2340 cgtgatgcga acaaccggat gatggcctgc tgctcgcgag cggcgaaggg cggaaagatc 2400 gtgctggggc tgtaa 2415 <210> 48 <211> 804 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 48 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu Ala Pro Arg Asp Ala Val Arg Ile 465 470 475 480 Gly Glu Pro Thr Gly Gly Thr Thr Gly Arg Thr Leu Ile Val Glu Arg 485 490 495 Val Glu Thr Ala Ala Gln Gly Val Ser Arg Ile Arg Leu Val Ser Pro 500 505 510 Asp Gly Arg Ala Leu Pro Arg Trp Ser Pro Gly Ser His Ile Asp Ile 515 520 525 Glu Cys Gly His Thr Gly Ile Ser Arg Gln Tyr Ser Leu Cys Gly Asp 530 535 540 Pro Ala Asp Thr Ser Ala Phe Glu Ile Ala Val Leu Arg Glu Pro Glu 545 550 555 560 Ser Arg Gly Gly Ser Ala Trp Ile His Ala Ser Leu Arg Ala Gly Asp 565 570 575 Lys Leu Lys Val Arg Gly Pro Arg Asn His Phe Arg Leu Asp Glu Thr 580 585 590 Cys Arg Arg Ala Ile Phe Ile Ala Gly Gly Ile Gly Val Thr Pro Val 595 600 605 Ser Ala Met Ala Arg Arg Ala Lys Glu Leu Gly Val Asp Tyr Thr Phe 610 615 620 His Tyr Cys Gly Arg Ser Arg Ala Ser Met Ala Met Ile Asp Glu Leu 625 630 635 640 Arg Ala Leu His Gly Asp Arg Val Arg Ile His Ala Ala Asp Glu Gly 645 650 655 Gln Arg Ala Asp Leu Ala Gln Val Leu Gly Ala Pro Asp Ala Asn Thr 660 665 670 Gln Ile Tyr Ala Cys Gly Pro Ala Arg Met Ile Glu Ala Leu Glu Ala 675 680 685 Leu Cys Ala Thr Trp Pro Glu Asp Ser Leu Arg Val Glu His Phe Ser 690 695 700 Ser Lys Leu Gly Thr Leu Asp Pro Ser Arg Glu Gln Pro Phe Ala Val 705 710 715 720 Glu Leu Lys Asp Ser Gly Leu Thr Leu Glu Val Pro Pro Asp Gln Thr 725 730 735 Leu Leu Ala Thr Leu Arg Ala Ala Asn Ile Asp Val Gln Ser Asp Cys 740 745 750 Glu Glu Gly Leu Cys Gly Ser Cys Glu Val Arg Val Leu Ala Gly Glu 755 760 765 Ile Asp His Arg Asp Val Val Leu Thr Arg Gly Glu Arg Asp Ala Asn 770 775 780 Asn Arg Met Met Ala Cys Cys Ser Arg Ala Ala Lys Gly Gly Lys Ile 785 790 795 800 Val Leu Gly Leu <210> 49 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 49 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt actgccagac aaattaccag ttttcctatt 1440 ggagcgcctg atctcaaggc catgacccgc ccggtacgtg tccaggcagt ttatcctgaa 1500 gcagaagata ttatacgtat tgagctggct gctatacacg gtgaagaatt accacgctgg 1560 agtgccggtt cacatattga actggtattg cctaatggcc tgagccgtaa gtactctcta 1620 tgcggtttag cgactgatca attttatacg attgctgtaa agagagagca ggaaagccgg 1680 ggtggttcac aatggattca tcagtattta aaagcaggag aacagatcta cattaaggga 1740 cctaaaaact tttttaaatt aaatttacag gcgagccagt atgtgctgat cgcaggtggg 1800 ataggtatta ctcctattct gagcatggcc agcagcttac gtgaacaggg gcgcccttac 1860 cggctaattt atctttcacg ccagcgggct agtatggcat tacttaagga agttgctgcg 1920 catggtagtg ctgccgaact ctatatttct tctgaaggta aacggataga cctgcaacag 1980 ctcttgtcag cgctgcctgc cggtacacag gtttgtgcct gtggtccgga agcattactt 2040 gataccttga ccaactatac cgaagacttg tcacaggttc agctcacggt cgagcatttt 2100 ggttcaggga agaacctctt tttatatgaa aatgataccg actttgaagt tgaactgctg 2160 gatagcggtt taacgctgac agtagcccgg gatcagacct tattggactg tttgctggac 2220 aaaggaattg atgtcagctt tgactgtacc gagggtttat gtggaagctg tcagcttccg 2280 gttgaagaag gtgaaattga tcatcgcgac aaggtgttga cccgagccga gcgtgacgga 2340 atgaaatcgg taatcagttg ctgttcacga ggaaaaggaa aactcaaact caagctttaa 2400 <210> 50 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 50 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Thr Ala Arg Gln Ile Thr Ser Phe Pro Ile 465 470 475 480 Gly Ala Pro Asp Leu Lys Ala Met Thr Arg Pro Val Arg Val Gln Ala 485 490 495 Val Tyr Pro Glu Ala Glu Asp Ile Ile Arg Ile Glu Leu Ala Ala Ile 500 505 510 His Gly Glu Glu Leu Pro Arg Trp Ser Ala Gly Ser His Ile Glu Leu 515 520 525 Val Leu Pro Asn Gly Leu Ser Arg Lys Tyr Ser Leu Cys Gly Leu Ala 530 535 540 Thr Asp Gln Phe Tyr Thr Ile Ala Val Lys Arg Glu Gln Glu Ser Arg 545 550 555 560 Gly Gly Ser Gln Trp Ile His Gln Tyr Leu Lys Ala Gly Glu Gln Ile 565 570 575 Tyr Ile Lys Gly Pro Lys Asn Phe Phe Lys Leu Asn Leu Gln Ala Ser 580 585 590 Gln Tyr Val Leu Ile Ala Gly Gly Ile Gly Ile Thr Pro Ile Leu Ser 595 600 605 Met Ala Ser Ser Leu Arg Glu Gln Gly Arg Pro Tyr Arg Leu Ile Tyr 610 615 620 Leu Ser Arg Gln Arg Ala Ser Met Ala Leu Leu Lys Glu Val Ala Ala 625 630 635 640 His Gly Ser Ala Ala Glu Leu Tyr Ile Ser Ser Glu Gly Lys Arg Ile 645 650 655 Asp Leu Gln Gln Leu Leu Ser Ala Leu Pro Ala Gly Thr Gln Val Cys 660 665 670 Ala Cys Gly Pro Glu Ala Leu Leu Asp Thr Leu Thr Asn Tyr Thr Glu 675 680 685 Asp Leu Ser Gln Val Gln Leu Thr Val Glu His Phe Gly Ser Gly Lys 690 695 700 Asn Leu Phe Leu Tyr Glu Asn Asp Thr Asp Phe Glu Val Glu Leu Leu 705 710 715 720 Asp Ser Gly Leu Thr Leu Thr Val Ala Arg Asp Gln Thr Leu Leu Asp 725 730 735 Cys Leu Leu Asp Lys Gly Ile Asp Val Ser Phe Asp Cys Thr Glu Gly 740 745 750 Leu Cys Gly Ser Cys Gln Leu Pro Val Glu Glu Gly Glu Ile Asp His 755 760 765 Arg Asp Lys Val Leu Thr Arg Ala Glu Arg Asp Gly Met Lys Ser Val 770 775 780 Ile Ser Cys Cys Ser Arg Gly Lys Gly Lys Leu Lys Leu Lys Leu 785 790 795 <210> 51 <211> 2238 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 51 atggaacata caggacaaag cgcggcggcg acgatgccgc tcgattcgat cgacgtgagt 60 atcccagaac tcttctacaa cgacagtgtt ggcgaatatt tcaagcggct gcgcaaggat 120 gatccagtcc actattgcgc cgacagcgcg tttgggccct actggtccat cacgaaatat 180 aatgacataa tgcacgtcga cacaaatcat gacatcttct cgtccgatgc aggatatggc 240 ggcatcataa tcgatgacgg cattcaaaaa ggtggcgatg gcggactgga tcttcccaat 300 ttcatcgcga tggatcggcc gcgacacgac gaacaaagaa aagctgtaag cccgattgta 360 gcccccgcca atttggccgc gcttgaaggc accattcgcg aacgagttag caaaacgctc 420 gatggtcttc cggtgggtga ggagttcgat tgggtagatc gcgtgtcgat cgaaatcacc 480 actcaaatgc tcgccaccct gttcgacttt ccgtttgaag agcgccgcaa gcttacccgc 540 tggtcggatg tgacaaccgc agcacccggc ggcggagttg tcgaaagctg ggatcagaga 600 aaaaccgaat tgttggaatg tgccgcttat ttccaggtgc tttggaatga gcgtgtcaac 660 aaggaccccg gcaacgatct catttcgatg ctggcacatt cgccagccac gcggaacatg 720 acgcccgaag agtatctggg caatgtactt ctcctgatcg ttgccgggaa cgataccaca 780 cgcaattcga tgaccggtgg cgttttagct ctccacaaga atccggacca gtttgccaag 840 ctaaaagcca accctgcgct ggttgaaacg atggtccctg aaatcattcg ctggcaaaca 900 ccgcttgctc atatgcgccg cacggccatt gcagattccg aactgggtgg gaagaccatc 960 cgcaagggcg acaaggtcgt catgtggtat tattcgggta atcgcgatga cgaagtgatt 1020 gaccgtcccg aagaatttat catcgaccgc ccccggcccc gccagcattt gtcattcggc 1080 tttggcatcc accgttgcgt tggcaatcgg ctagccgaaa tgcagctccg gatattgtgg 1140 gaagaaattc tcacgcgttt cagtcgtatc gaagtgatgg ccgaaccgga acgggtccgt 1200 tcaaattttg tgcgcggtta cgccaagatg atggttcgcg tccacgcggt actccatcgt 1260 catcaacctg tcaccatcgg cgagccggcc gctcgtgctg tgagccgcac ggtgaccgtt 1320 gagcgtcttg atcgcattgc cgacgatgtc cttcgcctgg tccttcgcga tgctggaggt 1380 aaaaccctcc cgacgtggac gcctggcgct cacatcgacc tggatctggg tgctctgagc 1440 cgtcagtatt cgctctgcgg cgctccggat gctccgtcgt acgaaatcgc cgtgcactta 1500 gatccggaaa gccgtggtgg aagccgctat attcatgaac agctggaagt tggaagtccg 1560 ctgcgtatgc gtggcccacg caaccatttc gccctggatc cgggtgcgga acattacgtg 1620 tttgttgccg ggggtatcgg catcacgccg gtgctggcaa tggcggatca tgcccgtgcg 1680 cgtggttggt cgtacgaact gcattattgt ggtcgtaatc gtagcggtat ggcttacctg 1740 gaacgcgtcg cgggacatgg tgaccgcgct gccttgcacg tatctgaaga aggcacccgc 1800 attgatctgg cggcattact tgctgaaccg gcgccgggcg tgcaaatcta cgcctgcggt 1860 ccgggccgtt tattagcggg tcttgaagac gcgtctcgta attggccgga tggcgcgctt 1920 catgtggagc atttcacttc gagtttagcc gctttggatc cggatgtcga acatgccttt 1980 gatttggagc tgcgtgactc tggccttacc gttcgcgtcg agccaactca gaccgtttta 2040 gacgctttgc gtgcgaacaa tatcgacgtc ccgtcggatt gcgaagaggg gctgtgtggt 2100 tcttgcgaag tagccgttct ggatggcgag gttgatcacc gtgataccgt tctgactaag 2160 gccgagcgcg ccgcgaatcg tcagatgatg acttgctgca gtcgtgcatg cggtgatcgt 2220 ctggcgctgc gcctctaa 2238 <210> 52 <211> 745 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 52 Met Glu His Thr Gly Gln Ser Ala Ala Ala Thr Met Pro Leu Asp Ser 1 5 10 15 Ile Asp Val Ser Ile Pro Glu Leu Phe Tyr Asn Asp Ser Val Gly Glu 20 25 30 Tyr Phe Lys Arg Leu Arg Lys Asp Asp Pro Val His Tyr Cys Ala Asp 35 40 45 Ser Ala Phe Gly Pro Tyr Trp Ser Ile Thr Lys Tyr Asn Asp Ile Met 50 55 60 His Val Asp Thr Asn His Asp Ile Phe Ser Ser Asp Ala Gly Tyr Gly 65 70 75 80 Gly Ile Ile Ile Asp Asp Gly Ile Gln Lys Gly Gly Asp Gly Gly Leu 85 90 95 Asp Leu Pro Asn Phe Ile Ala Met Asp Arg Pro Arg His Asp Glu Gln 100 105 110 Arg Lys Ala Val Ser Pro Ile Val Ala Pro Ala Asn Leu Ala Ala Leu 115 120 125 Glu Gly Thr Ile Arg Glu Arg Val Ser Lys Thr Leu Asp Gly Leu Pro 130 135 140 Val Gly Glu Glu Phe Asp Trp Val Asp Arg Val Ser Ile Glu Ile Thr 145 150 155 160 Thr Gln Met Leu Ala Thr Leu Phe Asp Phe Pro Phe Glu Glu Arg Arg 165 170 175 Lys Leu Thr Arg Trp Ser Asp Val Thr Thr Ala Ala Pro Gly Gly Gly 180 185 190 Val Val Glu Ser Trp Asp Gln Arg Lys Thr Glu Leu Leu Glu Cys Ala 195 200 205 Ala Tyr Phe Gln Val Leu Trp Asn Glu Arg Val Asn Lys Asp Pro Gly 210 215 220 Asn Asp Leu Ile Ser Met Leu Ala His Ser Pro Ala Thr Arg Asn Met 225 230 235 240 Thr Pro Glu Glu Tyr Leu Gly Asn Val Leu Leu Leu Ile Val Ala Gly 245 250 255 Asn Asp Thr Thr Arg Asn Ser Met Thr Gly Gly Val Leu Ala Leu His 260 265 270 Lys Asn Pro Asp Gln Phe Ala Lys Leu Lys Ala Asn Pro Ala Leu Val 275 280 285 Glu Thr Met Val Pro Glu Ile Ile Arg Trp Gln Thr Pro Leu Ala His 290 295 300 Met Arg Arg Thr Ala Ile Ala Asp Ser Glu Leu Gly Gly Lys Thr Ile 305 310 315 320 Arg Lys Gly Asp Lys Val Val Met Trp Tyr Tyr Ser Gly Asn Arg Asp 325 330 335 Asp Glu Val Ile Asp Arg Pro Glu Glu Phe Ile Ile Asp Arg Pro Arg 340 345 350 Pro Arg Gln His Leu Ser Phe Gly Phe Gly Ile His Arg Cys Val Gly 355 360 365 Asn Arg Leu Ala Glu Met Gln Leu Arg Ile Leu Trp Glu Glu Ile Leu 370 375 380 Thr Arg Phe Ser Arg Ile Glu Val Met Ala Glu Pro Glu Arg Val Arg 385 390 395 400 Ser Asn Phe Val Arg Gly Tyr Ala Lys Met Met Val Arg Val His Ala 405 410 415 Val Leu His Arg His Gln Pro Val Thr Ile Gly Glu Pro Ala Ala Arg 420 425 430 Ala Val Ser Arg Thr Val Thr Val Glu Arg Leu Asp Arg Ile Ala Asp 435 440 445 Asp Val Leu Arg Leu Val Leu Arg Asp Ala Gly Gly Lys Thr Leu Pro 450 455 460 Thr Trp Thr Pro Gly Ala His Ile Asp Leu Asp Leu Gly Ala Leu Ser 465 470 475 480 Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp Ala Pro Ser Tyr Glu Ile 485 490 495 Ala Val His Leu Asp Pro Glu Ser Arg Gly Gly Ser Arg Tyr Ile His 500 505 510 Glu Gln Leu Glu Val Gly Ser Pro Leu Arg Met Arg Gly Pro Arg Asn 515 520 525 His Phe Ala Leu Asp Pro Gly Ala Glu His Tyr Val Phe Val Ala Gly 530 535 540 Gly Ile Gly Ile Thr Pro Val Leu Ala Met Ala Asp His Ala Arg Ala 545 550 555 560 Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys Gly Arg Asn Arg Ser Gly 565 570 575 Met Ala Tyr Leu Glu Arg Val Ala Gly His Gly Asp Arg Ala Ala Leu 580 585 590 His Val Ser Glu Glu Gly Thr Arg Ile Asp Leu Ala Ala Leu Leu Ala 595 600 605 Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala Cys Gly Pro Gly Arg Leu 610 615 620 Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn Trp Pro Asp Gly Ala Leu 625 630 635 640 His Val Glu His Phe Thr Ser Ser Leu Ala Ala Leu Asp Pro Asp Val 645 650 655 Glu His Ala Phe Asp Leu Glu Leu Arg Asp Ser Gly Leu Thr Val Arg 660 665 670 Val Glu Pro Thr Gln Thr Val Leu Asp Ala Leu Arg Ala Asn Asn Ile 675 680 685 Asp Val Pro Ser Asp Cys Glu Glu Gly Leu Cys Gly Ser Cys Glu Val 690 695 700 Ala Val Leu Asp Gly Glu Val Asp His Arg Asp Thr Val Leu Thr Lys 705 710 715 720 Ala Glu Arg Ala Ala Asn Arg Gln Met Met Thr Cys Cys Ser Arg Ala 725 730 735 Cys Gly Asp Arg Leu Ala Leu Arg Leu 740 745 <210> 53 <211> 3180 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 53 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt tcacctagca ctgaacagtc tgctaaaaaa 1440 gtacgcaaaa aggcagaaaa cgctcataat acgccgctgc ttgtgctata cggttcaaat 1500 atgggaacag ctgaaggaac ggcgcgtgat ttagcagata ttgcaatgag caaaggattt 1560 gcaccgcagg tcgcaacgct tgattcacac gccggaaatc ttccgcgcga aggagctgta 1620 ttaattgtaa cggcgtctta taacggtcat ccgcctgata acgcaaagca atttgtcgac 1680 tggttagacc aagcgtctgc tgatgaagta aaaggcgttc gctactccgt atttggatgc 1740 ggcgataaaa actgggctac tacgtatcaa aaagtgcctg cttttatcga tgaaacgctt 1800 gccgctaaag gggcagaaaa catcgctgac cgcggtgaag cagatgcaag cgacgacttt 1860 gaaggcacat atgaagaatg gcgtgaacat atgtggagtg acgtagcagc ctactttaac 1920 ctcgacattg aaaacagtga agataataaa tctactcttt cacttcaatt tgtcgacagc 1980 gccgcggata tgccgcttgc gaaaatgcac ggtgcgtttt caacgaacgt cgtagcaagc 2040 aaagaacttc aacagccagg cagtgcacga agcacgcgac atcttgaaat tgaacttcca 2100 aaagaagctt cttatcaaga aggagatcat ttaggtgtta ttcctcgcaa ctatgaagga 2160 atagtaaacc gtgtaacagc aaggttcggc ctagatgcat cacagcaaat ccgtctggaa 2220 gcagaagaag aaaaattagc tcatttgcca ctcgctaaaa cagtatccgt agaagagctt 2280 ctgcaatacg tggagcttca agatcctgtt acgcgcacgc agcttcgcgc aatggctgct 2340 aaaacggtct gcccgccgca taaagtagag cttgaagcct tgcttgaaaa gcaagcctac 2400 aaagaacaag tgctggcaaa acgtttaaca atgcttgaac tgcttgaaaa atacccggcg 2460 tgtgaaatga aattcagcga atttatcgcc cttctgccaa gcatacgccc gcgctattac 2520 tcgatttctt catcacctcg tgtcgatgaa aaacaagcaa gcatcacggt cagcgttgtc 2580 tcaggagaag cgtggagcgg atatggagaa tataaaggaa ttgcgtcgaa ctatcttgcc 2640 gagctgcaag aaggagatac gattacgtgc tttatttcca caccgcagtc agaatttacg 2700 ctgccaaaag accctgaaac gccgcttatc atggtcggac cgggaacagg cgtcgcgccg 2760 tttagaggct ttgtgcaggc gcgcaaacag ctaaaagaac aaggacagtc acttggagaa 2820 gcacatttat acttcggctg ccgttcacct catgaagact atctgtatca agaagagctt 2880 gaaaacgccc aaagcgaagg catcattacg cttcataccg ctttttctcg catgccaaat 2940 cagccgaaaa catacgttca gcacgtaatg gaacaagacg gcaagaaatt gattgaactt 3000 cttgatcaag gagcgcactt ctatatttgc ggagacggaa gccaaatggc acctgccgtt 3060 gaagcaacgc ttatgaaaag ctatgctgac gttcaccaag tgagtgaagc agacgctcgc 3120 ttatggctgc agcagctaga agaaaaaggc cgatacgcaa aagacgtgtg ggctgggtaa 3180 <210> 54 <211> 1059 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 54 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Ser Pro Ser Thr Glu Gln Ser Ala Lys Lys 465 470 475 480 Val Arg Lys Lys Ala Glu Asn Ala His Asn Thr Pro Leu Leu Val Leu 485 490 495 Tyr Gly Ser Asn Met Gly Thr Ala Glu Gly Thr Ala Arg Asp Leu Ala 500 505 510 Asp Ile Ala Met Ser Lys Gly Phe Ala Pro Gln Val Ala Thr Leu Asp 515 520 525 Ser His Ala Gly Asn Leu Pro Arg Glu Gly Ala Val Leu Ile Val Thr 530 535 540 Ala Ser Tyr Asn Gly His Pro Pro Asp Asn Ala Lys Gln Phe Val Asp 545 550 555 560 Trp Leu Asp Gln Ala Ser Ala Asp Glu Val Lys Gly Val Arg Tyr Ser 565 570 575 Val Phe Gly Cys Gly Asp Lys Asn Trp Ala Thr Thr Tyr Gln Lys Val 580 585 590 Pro Ala Phe Ile Asp Glu Thr Leu Ala Ala Lys Gly Ala Glu Asn Ile 595 600 605 Ala Asp Arg Gly Glu Ala Asp Ala Ser Asp Asp Phe Glu Gly Thr Tyr 610 615 620 Glu Glu Trp Arg Glu His Met Trp Ser Asp Val Ala Ala Tyr Phe Asn 625 630 635 640 Leu Asp Ile Glu Asn Ser Glu Asp Asn Lys Ser Thr Leu Ser Leu Gln 645 650 655 Phe Val Asp Ser Ala Ala Asp Met Pro Leu Ala Lys Met His Gly Ala 660 665 670 Phe Ser Thr Asn Val Val Ala Ser Lys Glu Leu Gln Gln Pro Gly Ser 675 680 685 Ala Arg Ser Thr Arg His Leu Glu Ile Glu Leu Pro Lys Glu Ala Ser 690 695 700 Tyr Gln Glu Gly Asp His Leu Gly Val Ile Pro Arg Asn Tyr Glu Gly 705 710 715 720 Ile Val Asn Arg Val Thr Ala Arg Phe Gly Leu Asp Ala Ser Gln Gln 725 730 735 Ile Arg Leu Glu Ala Glu Glu Glu Lys Leu Ala His Leu Pro Leu Ala 740 745 750 Lys Thr Val Ser Val Glu Glu Leu Leu Gln Tyr Val Glu Leu Gln Asp 755 760 765 Pro Val Thr Arg Thr Gln Leu Arg Ala Met Ala Ala Lys Thr Val Cys 770 775 780 Pro Pro His Lys Val Glu Leu Glu Ala Leu Leu Glu Lys Gln Ala Tyr 785 790 795 800 Lys Glu Gln Val Leu Ala Lys Arg Leu Thr Met Leu Glu Leu Leu Glu 805 810 815 Lys Tyr Pro Ala Cys Glu Met Lys Phe Ser Glu Phe Ile Ala Leu Leu 820 825 830 Pro Ser Ile Arg Pro Arg Tyr Tyr Ser Ile Ser Ser Ser Pro Arg Val 835 840 845 Asp Glu Lys Gln Ala Ser Ile Thr Val Ser Val Val Ser Gly Glu Ala 850 855 860 Trp Ser Gly Tyr Gly Glu Tyr Lys Gly Ile Ala Ser Asn Tyr Leu Ala 865 870 875 880 Glu Leu Gln Glu Gly Asp Thr Ile Thr Cys Phe Ile Ser Thr Pro Gln 885 890 895 Ser Glu Phe Thr Leu Pro Lys Asp Pro Glu Thr Pro Leu Ile Met Val 900 905 910 Gly Pro Gly Thr Gly Val Ala Pro Phe Arg Gly Phe Val Gln Ala Arg 915 920 925 Lys Gln Leu Lys Glu Gln Gly Gln Ser Leu Gly Glu Ala His Leu Tyr 930 935 940 Phe Gly Cys Arg Ser Pro His Glu Asp Tyr Leu Tyr Gln Glu Glu Leu 945 950 955 960 Glu Asn Ala Gln Ser Glu Gly Ile Ile Thr Leu His Thr Ala Phe Ser 965 970 975 Arg Met Pro Asn Gln Pro Lys Thr Tyr Val Gln His Val Met Glu Gln 980 985 990 Asp Gly Lys Lys Leu Ile Glu Leu Leu Asp Gln Gly Ala His Phe Tyr 995 1000 1005 Ile Cys Gly Asp Gly Ser Gln Met Ala Pro Ala Val Glu Ala Thr 1010 1015 1020 Leu Met Lys Ser Tyr Ala Asp Val His Gln Val Ser Glu Ala Asp 1025 1030 1035 Ala Arg Leu Trp Leu Gln Gln Leu Glu Glu Lys Gly Arg Tyr Ala 1040 1045 1050 Lys Asp Val Trp Ala Gly 1055 <210> 55 <211> 3246 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 55 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt ggcgctcagc ctgaagagaa cggacggcag 1440 gaagaacggc cttccgcacc ggcggcggaa aatacgcacg gaacccctct tcttgtgctc 1500 tacggttcaa atctcggcac agccgaagag attgcgaagg agcttgctga agaagcgcgt 1560 gagcaagggt ttcacagccg gacggcggag cttgatcaat acgcaggcgc catcccggca 1620 gaaggggctg ttatcattgt gacggcttcc tataacggaa acccgcccga ttgcgcaaag 1680 gaatttgtca attggcttga gcatgatcag acagacgatt tgcgtggtgt caaatatgcg 1740 gtattcggct gcggtaaccg cagctgggcc agcacctacc agcggattcc gcgcctgatt 1800 gacagcgtat tggaaaaaaa aggcgcccaa aggctgcaca agcttggaga aggggatgca 1860 ggcgatgatt ttgaaggaca gtttgagtca tggaaatatg atctgtggcc gcttttaaga 1920 accgaatttt cattggccga acccgagccg aatcaaacag aaacagacag gcaagcctta 1980 tctgtcgagt tcgtaaacgc acctgcggct tcgccgctgg ctaaagctta tcaggtgttc 2040 acagcgaaga tatcggcaaa ccgagaactg cagtgtgaaa agagcgggag aagcacaagg 2100 catattgaaa tatcgcttcc tgaaggcgcc gcatatcagg agggagacca tctcggtgtg 2160 ctaccgcaaa acagcgaagt gctgattggc cgcgtttttc agcggtttgg gctgaacgga 2220 aatgaacaaa ttctgattag cggccggaat caagcatcac atttgccttt ggagaggccc 2280 gttcatgtca aagacctttt tcaacattgc gtcgagctcc aggaaccggc cacaagggcc 2340 cagatacgcg agctggcggc tcatactgtt tgtccgcctc atcagcgcga gcttgaagac 2400 ctgctgaaag atgacgtcta taaggatcaa gtgttgaata agcggctgac aatgcttgac 2460 ctgcttgagc aatacccggc ctgtgaactg ccgttcgccc gttttctggc gcttcttcct 2520 ccgctaaaac cgaggtacta ttcgatttcc agttcgccgc agcttaaccc gcggcaaaca 2580 agcatcaccg tctctgtcgt aagtggcccg gcgttgagcg gccgcgggca ttataaggga 2640 gttgcatcga actatctcgc cggccttgag ccgggagacg cgatttcgtg tttcatcaga 2700 gagcctcagt caggcttccg gcttcccgaa gatcctgaaa caccggtgat catggtcggg 2760 ccgggcaccg gaatcgcccc ttaccgcgga tttcttcagg cgcgccgcat ccagcgcgat 2820 gccggtgtga agctcggtga agcgcatttg tacttcggct gccgccgtcc gaacgaagat 2880 tttctgtatc gagacgagtt ggagcaagcg gaaaaggacg gaatcgtcca tctgcataca 2940 gcgttttccc ggcttgaggg ccggccgaaa acatatgtgc aagatttgct cagagaggat 3000 gcagccttgc tgattcactt gttgaacgaa ggcggccgcc tgtatgtgtg cggagacgga 3060 agccgcatgg ctccagctgt tgaacaagct ttgtgcgagg cgtatcgcat agtacagggt 3120 gcgagtcggg aagagtcgca aagctggctg tccgcacttt tagaagaagg gcgctatgca 3180 aaggatgtat gggacggcgg cgtttcccaa cataatgtga aggcggactg cattgcaaga 3240 acgtaa 3246 <210> 56 <211> 1081 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 56 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Gly Ala Gln Pro Glu Glu Asn Gly Arg Gln 465 470 475 480 Glu Glu Arg Pro Ser Ala Pro Ala Ala Glu Asn Thr His Gly Thr Pro 485 490 495 Leu Leu Val Leu Tyr Gly Ser Asn Leu Gly Thr Ala Glu Glu Ile Ala 500 505 510 Lys Glu Leu Ala Glu Glu Ala Arg Glu Gln Gly Phe His Ser Arg Thr 515 520 525 Ala Glu Leu Asp Gln Tyr Ala Gly Ala Ile Pro Ala Glu Gly Ala Val 530 535 540 Ile Ile Val Thr Ala Ser Tyr Asn Gly Asn Pro Pro Asp Cys Ala Lys 545 550 555 560 Glu Phe Val Asn Trp Leu Glu His Asp Gln Thr Asp Asp Leu Arg Gly 565 570 575 Val Lys Tyr Ala Val Phe Gly Cys Gly Asn Arg Ser Trp Ala Ser Thr 580 585 590 Tyr Gln Arg Ile Pro Arg Leu Ile Asp Ser Val Leu Glu Lys Lys Gly 595 600 605 Ala Gln Arg Leu His Lys Leu Gly Glu Gly Asp Ala Gly Asp Asp Phe 610 615 620 Glu Gly Gln Phe Glu Ser Trp Lys Tyr Asp Leu Trp Pro Leu Leu Arg 625 630 635 640 Thr Glu Phe Ser Leu Ala Glu Pro Glu Pro Asn Gln Thr Glu Thr Asp 645 650 655 Arg Gln Ala Leu Ser Val Glu Phe Val Asn Ala Pro Ala Ala Ser Pro 660 665 670 Leu Ala Lys Ala Tyr Gln Val Phe Thr Ala Lys Ile Ser Ala Asn Arg 675 680 685 Glu Leu Gln Cys Glu Lys Ser Gly Arg Ser Thr Arg His Ile Glu Ile 690 695 700 Ser Leu Pro Glu Gly Ala Ala Tyr Gln Glu Gly Asp His Leu Gly Val 705 710 715 720 Leu Pro Gln Asn Ser Glu Val Leu Ile Gly Arg Val Phe Gln Arg Phe 725 730 735 Gly Leu Asn Gly Asn Glu Gln Ile Leu Ile Ser Gly Arg Asn Gln Ala 740 745 750 Ser His Leu Pro Leu Glu Arg Pro Val His Val Lys Asp Leu Phe Gln 755 760 765 His Cys Val Glu Leu Gln Glu Pro Ala Thr Arg Ala Gln Ile Arg Glu 770 775 780 Leu Ala Ala His Thr Val Cys Pro Pro His Gln Arg Glu Leu Glu Asp 785 790 795 800 Leu Leu Lys Asp Asp Val Tyr Lys Asp Gln Val Leu Asn Lys Arg Leu 805 810 815 Thr Met Leu Asp Leu Leu Glu Gln Tyr Pro Ala Cys Glu Leu Pro Phe 820 825 830 Ala Arg Phe Leu Ala Leu Leu Pro Pro Leu Lys Pro Arg Tyr Tyr Ser 835 840 845 Ile Ser Ser Ser Pro Gln Leu Asn Pro Arg Gln Thr Ser Ile Thr Val 850 855 860 Ser Val Val Ser Gly Pro Ala Leu Ser Gly Arg Gly His Tyr Lys Gly 865 870 875 880 Val Ala Ser Asn Tyr Leu Ala Gly Leu Glu Pro Gly Asp Ala Ile Ser 885 890 895 Cys Phe Ile Arg Glu Pro Gln Ser Gly Phe Arg Leu Pro Glu Asp Pro 900 905 910 Glu Thr Pro Val Ile Met Val Gly Pro Gly Thr Gly Ile Ala Pro Tyr 915 920 925 Arg Gly Phe Leu Gln Ala Arg Arg Ile Gln Arg Asp Ala Gly Val Lys 930 935 940 Leu Gly Glu Ala His Leu Tyr Phe Gly Cys Arg Arg Pro Asn Glu Asp 945 950 955 960 Phe Leu Tyr Arg Asp Glu Leu Glu Gln Ala Glu Lys Asp Gly Ile Val 965 970 975 His Leu His Thr Ala Phe Ser Arg Leu Glu Gly Arg Pro Lys Thr Tyr 980 985 990 Val Gln Asp Leu Leu Arg Glu Asp Ala Ala Leu Leu Ile His Leu Leu 995 1000 1005 Asn Glu Gly Gly Arg Leu Tyr Val Cys Gly Asp Gly Ser Arg Met 1010 1015 1020 Ala Pro Ala Val Glu Gln Ala Leu Cys Glu Ala Tyr Arg Ile Val 1025 1030 1035 Gln Gly Ala Ser Arg Glu Glu Ser Gln Ser Trp Leu Ser Ala Leu 1040 1045 1050 Leu Glu Glu Gly Arg Tyr Ala Lys Asp Val Trp Asp Gly Gly Val 1055 1060 1065 Ser Gln His Asn Val Lys Ala Asp Cys Ile Ala Arg Thr 1070 1075 1080 <210> 57 <211> 2400 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 57 atgtcaacga gttcaagtac aagtaatgac atccaggcaa aaataattaa cgccacatcc 60 aaagtcgtgc caatgcatct acagatcaag gcactaaaaa acttgatgaa ggtgaagcgg 120 aagaccattg gcacttcccg ccctcaggtg cactttgttg aaaccgattt gcctgacgtc 180 aatgatttgg cgatagaaga tatcgatacg agtaaccctt ttttataccg acaaggtaag 240 gcgaatgcgt actttaagcg gttgcgtgat gaagcgccgg tgcactatca gaagaacagt 300 gctttcgggc cgttctggtc ggtaacacgc tacgaagata tcgtcttcgt ggacaagagc 360 catgatttgt tttccgccga accccaaatt atcttgggtg atcctccgga aggcctgtcg 420 gttgaaatgt tcatcgctat ggatcctccc aagcacgacg tacagcgtcg ggcagtccag 480 ggtgttgttg cgcccaagaa cctgaaagaa atggaaggac tgatccgcaa gcgcaccggg 540 gacgtactgg atagcctgcc gttggacact ccgttcaact gggtgccggt ggtgtcgaaa 600 gagctgaccg ggcgcatgct agcctcactg ttagatttcc cgtatgacga acgcgaaaaa 660 ctggttggct ggtcggatcg attgtccggc gcgtcctcgg caaccggcgg cgagtttacg 720 aatgaagatg tgttttttga tgacgcggca gatatggcgt gggctttctc caagctttgg 780 cgtgataaag aagcccgtca aaaagcaggt gaagagccgg gtttcgattt gatcagcatg 840 cttcagtcca atgaagacac aaaagatctg atcaatcgtc ctttggaatt cattggtaat 900 ctcgcgttgt tgattgttgg cggtaatgac accacgcgta actcaatgag cgggggggtg 960 ctggctttaa atcagttccc agagcaattc gagaagctaa aggcgaaccc aaagcttatc 1020 cccaatatgg tctctgaaat cattcgctgg caaacgccgc ttgcgtatat gcgccgggtt 1080 gccaagcagg atgtggagct gaacggacag accatcaaga agggtgatcg cgtgctgatg 1140 tggtatgcgt cgggcaacca ggatgagaga aaatttgaga atcctgagca attcatcatc 1200 gaccgcaaag atacgcgtaa ccatgtgtcg tttggttatg gggttcaccg ttgtatgggc 1260 aaccgccttg ccgaactgca gctgcgtatt ctgtgggaag agcttctccc tcgctttgaa 1320 aacatcgaag tgatcggtga gccggagcgc gtgcaatcga actttgtgcg gggctattcc 1380 aagatgatgg ttaagttgac ggctaaaaaa gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 <210> 58 <211> 799 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 58 Met Ser Thr Ser Ser Ser Thr Ser Asn Asp Ile Gln Ala Lys Ile Ile 1 5 10 15 Asn Ala Thr Ser Lys Val Val Pro Met His Leu Gln Ile Lys Ala Leu 20 25 30 Lys Asn Leu Met Lys Val Lys Arg Lys Thr Ile Gly Thr Ser Arg Pro 35 40 45 Gln Val His Phe Val Glu Thr Asp Leu Pro Asp Val Asn Asp Leu Ala 50 55 60 Ile Glu Asp Ile Asp Thr Ser Asn Pro Phe Leu Tyr Arg Gln Gly Lys 65 70 75 80 Ala Asn Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Ala Phe Gly Pro Phe Trp Ser Val Thr Arg Tyr Glu 100 105 110 Asp Ile Val Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Arg Ala Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Lys Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Leu Asp Thr Pro Phe 180 185 190 Asn Trp Val Pro Val Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Ser Leu Leu Asp Phe Pro Tyr Asp Glu Arg Glu Lys Leu Val Gly Trp 210 215 220 Ser Asp Arg Leu Ser Gly Ala Ser Ser Ala Thr Gly Gly Glu Phe Thr 225 230 235 240 Asn Glu Asp Val Phe Phe Asp Asp Ala Ala Asp Met Ala Trp Ala Phe 245 250 255 Ser Lys Leu Trp Arg Asp Lys Glu Ala Arg Gln Lys Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Met Leu Gln Ser Asn Glu Asp Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Leu Glu Phe Ile Gly Asn Leu Ala Leu Leu 290 295 300 Ile Val Gly Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Val 305 310 315 320 Leu Ala Leu Asn Gln Phe Pro Glu Gln Phe Glu Lys Leu Lys Ala Asn 325 330 335 Pro Lys Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Val Ala Lys Gln Asp Val Glu Leu Asn 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Leu Met Trp Tyr Ala Ser 370 375 380 Gly Asn Gln Asp Glu Arg Lys Phe Glu Asn Pro Glu Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Thr Arg Asn His Val Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Leu Leu Pro Arg Phe Glu Asn Ile Glu Val Ile Gly Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Lys Met Met Val 450 455 460 Lys Leu Thr Ala Lys Lys Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 59 <211> 1392 <212> DNA <213> Mycobacterium marinum <400> 59 atgagcaata ttcgcgaggc agtcactgcc aaggctcagg caacaattcc gatggaccga 60 ataatccagg gcgcccacct ctacgacaga acgcggcgct gggtcaccgg caccaacggt 120 gaaaaaatct tcatcgagcg accgatcccg ccggctgacg aggttgaact gaccgacatc 180 gaccttagca atcctttcct ctatcgtcag ggtcgctgga agtcctatta cgagcgccta 240 cgcaacgagg ctcccgtgca ctatcaggcc cacagcgcgt tcggcccgtt ctggtcggtg 300 acgcggcatg ccgacatcgt ggccgtcgac aagaaccacg aggtcttctc ctccgagccg 360 ttcatcgtca tcgggagccc gccgcgcttc ctcgacattg cgatgttcat cgcgatggac 420 cccccaaaac acgaccggca acggcaggct gtccagggtg tggtcgcacc gaagaacctg 480 cgtgagatgg agggcctcat ccgcgagcgg gtggtagacg tgctcgacgc tctgccgctt 540 ggcgaaccgt tcaactgggt gcagcacgtc tcgatcgagc taaccgcgcg catgctggcc 600 acgctgctgg acttcccgtt cgagcagcgg cgcaagctcg tccaatggtc cgatctcgcc 660 acctccatgg agcaagccaa cggtgggccc tcggacaacg acgagatatt tcgcggcatg 720 gtcgatatgg ctagaggtct cagcgctcac tggcgggaca aggcagcccg gacagctgcc 780 ggagagctgc ccggcttcga tctgatcacc atgttgcaga gcgacgagag caccaaggac 840 ctgatcgatc gcccgatgga gttcttgggc aacttggtat tgctgatcgt gggtggcaac 900 gatacgaccc gcaattccat gagcggtggt gttctggcgc tgaacgagtt ccctgaccag 960 tttgagaagc tgaaggcgaa ccccgagctg atccccaaca tggtctcgga gatcatccgg 1020 tggcaaaccc cgctcgcgca tatgcgccgg atcgccaagg ccgacactgt gctcaacggg 1080 cagttcatcc gcaagggcga caaggtcctg atgtggtacg cctcgggcaa ccgcgacgag 1140 cgcgtgttcg atcggcccga tgacctgatt atcgatcggg ccaacgcccg taaccacatc 1200 tccttcggtt tcggcgtgca ccgctgtatg ggtaaccggc tggccgagat gcagttgcgg 1260 atcctgtggg aggagctgct tccgcggttc gagaacatcg aggtcgtcgg tgagcccgag 1320 tacgtgcagt ccaacttcgt gagggggatc agtaagctga tggtccgcct caccccgaaa 1380 ggtggcgcat ga 1392 <210> 60 <211> 463 <212> PRT <213> Mycobacterium marinum <400> 60 Met Ser Asn Ile Arg Glu Ala Val Thr Ala Lys Ala Gln Ala Thr Ile 1 5 10 15 Pro Met Asp Arg Ile Ile Gln Gly Ala His Leu Tyr Asp Arg Thr Arg 20 25 30 Arg Trp Val Thr Gly Thr Asn Gly Glu Lys Ile Phe Ile Glu Arg Pro 35 40 45 Ile Pro Pro Ala Asp Glu Val Glu Leu Thr Asp Ile Asp Leu Ser Asn 50 55 60 Pro Phe Leu Tyr Arg Gln Gly Arg Trp Lys Ser Tyr Tyr Glu Arg Leu 65 70 75 80 Arg Asn Glu Ala Pro Val His Tyr Gln Ala His Ser Ala Phe Gly Pro 85 90 95 Phe Trp Ser Val Thr Arg His Ala Asp Ile Val Ala Val Asp Lys Asn 100 105 110 His Glu Val Phe Ser Ser Glu Pro Phe Ile Val Ile Gly Ser Pro Pro 115 120 125 Arg Phe Leu Asp Ile Ala Met Phe Ile Ala Met Asp Pro Pro Lys His 130 135 140 Asp Arg Gln Arg Gln Ala Val Gln Gly Val Val Ala Pro Lys Asn Leu 145 150 155 160 Arg Glu Met Glu Gly Leu Ile Arg Glu Arg Val Val Asp Val Leu Asp 165 170 175 Ala Leu Pro Leu Gly Glu Pro Phe Asn Trp Val Gln His Val Ser Ile 180 185 190 Glu Leu Thr Ala Arg Met Leu Ala Thr Leu Leu Asp Phe Pro Phe Glu 195 200 205 Gln Arg Arg Lys Leu Val Gln Trp Ser Asp Leu Ala Thr Ser Met Glu 210 215 220 Gln Ala Asn Gly Gly Pro Ser Asp Asn Asp Glu Ile Phe Arg Gly Met 225 230 235 240 Val Asp Met Ala Arg Gly Leu Ser Ala His Trp Arg Asp Lys Ala Ala 245 250 255 Arg Thr Ala Ala Gly Glu Leu Pro Gly Phe Asp Leu Ile Thr Met Leu 260 265 270 Gln Ser Asp Glu Ser Thr Lys Asp Leu Ile Asp Arg Pro Met Glu Phe 275 280 285 Leu Gly Asn Leu Val Leu Leu Ile Val Gly Gly Asn Asp Thr Thr Arg 290 295 300 Asn Ser Met Ser Gly Gly Val Leu Ala Leu Asn Glu Phe Pro Asp Gln 305 310 315 320 Phe Glu Lys Leu Lys Ala Asn Pro Glu Leu Ile Pro Asn Met Val Ser 325 330 335 Glu Ile Ile Arg Trp Gln Thr Pro Leu Ala His Met Arg Arg Ile Ala 340 345 350 Lys Ala Asp Thr Val Leu Asn Gly Gln Phe Ile Arg Lys Gly Asp Lys 355 360 365 Val Leu Met Trp Tyr Ala Ser Gly Asn Arg Asp Glu Arg Val Phe Asp 370 375 380 Arg Pro Asp Asp Leu Ile Ile Asp Arg Ala Asn Ala Arg Asn His Ile 385 390 395 400 Ser Phe Gly Phe Gly Val His Arg Cys Met Gly Asn Arg Leu Ala Glu 405 410 415 Met Gln Leu Arg Ile Leu Trp Glu Glu Leu Leu Pro Arg Phe Glu Asn 420 425 430 Ile Glu Val Val Gly Glu Pro Glu Tyr Val Gln Ser Asn Phe Val Arg 435 440 445 Gly Ile Ser Lys Leu Met Val Arg Leu Thr Pro Lys Gly Gly Ala 450 455 460 <210> 61 <211> 3150 <212> DNA <213> Bacillus megaterium <400> 61 atgacaatta aagaaatgcc tcagccaaaa acgtttggag agcttaaaaa tttaccgtta 60 ttaaacacag ataaaccggt tcaagctttg atgaaaattg cggatgaatt aggagaaatc 120 tttaaattcg aggcgcctgg tcgtgtaacg cgctacttat caagtcagcg tctaattaaa 180 gaagcatgcg atgaatcacg ctttgataaa aacttaagtc aagcgcttaa atttgtacgt 240 gattttgcag gagacgggtt agctacaagc tggacgcatg aaaaaaattg gaaaaaagcg 300 cataatatct tacttccaag cttcagtcag caggcaatga aaggctatca tgcgatgatg 360 gtcgatatcg ccgtgcagct tgttcaaaag tgggagcgtc taaatgcaga tgagcatatt 420 gaagtaccgg aagacatgac acgtttaacg cttgatacaa ttggtctttg cggctttaac 480 tatcgcttta acagctttta ccgagatcag cctcatccat ttattacaag tatggtccgt 540 gcactggatg aagcaatgaa caagctgcag cgagcaaatc cagacgaccc agcttatgat 600 gaaaacaagc gccagtttca agaagatatc aaggtgatga acgacctagt agataaaatt 660 attgcagatc gcaaagcaag cggtgaacaa agcgatgatt tattaacgca tatgctaaac 720 ggaaaagatc cagaaacggg tgagccgctt gatgacgaga acattcgcta tcaaattatt 780 acattcttaa ttgcgggaca cgaaacaaca agtggtcttt tatcatttgc gctgtatttc 840 ttagtgaaaa atccacatgt attacaaaaa gcagcagaag aagcagcacg agttctagta 900 gatcctgttc caagctacaa acaagtcaaa cagcttaaat atgtcggcat ggtcttaaac 960 gaagcgctgc gcttatggcc aactgctcct gcgttttccc tatatgcaaa agaagatacg 1020 gtgcttggag gagaatatcc tttagaaaaa ggcgacgaac taatggttct gattcctcag 1080 cttcaccgtg ataaaacaat ttggggagac gatgtggaag agttccgtcc agagcgtttt 1140 gaaaatccaa gtgcgattcc gcagcatgcg tttaaaccgt ttggaaacgg tcagcgtgcg 1200 tgtatcggtc agcagttcgc tcttcatgaa gcaacgctgg tacttggtat gatgctaaaa 1260 cactttgact ttgaagatca tacaaactac gagctggata ttaaagaaac tttaacgtta 1320 aaacctgaag gctttgtggt aaaagcaaaa tcgaaaaaaa ttccgcttgg cggtattcct 1380 tcacctagca ctgaacagtc tgctaaaaaa gtacgcaaaa aggcagaaaa cgctcataat 1440 acgccgctgc ttgtgctata cggttcaaat atgggaacag ctgaaggaac ggcgcgtgat 1500 ttagcagata ttgcaatgag caaaggattt gcaccgcagg tcgcaacgct tgattcacac 1560 gccggaaatc ttccgcgcga aggagctgta ttaattgtaa cggcgtctta taacggtcat 1620 ccgcctgata acgcaaagca atttgtcgac tggttagacc aagcgtctgc tgatgaagta 1680 aaaggcgttc gctactccgt atttggatgc ggcgataaaa actgggctac tacgtatcaa 1740 aaagtgcctg cttttatcga tgaaacgctt gccgctaaag gggcagaaaa catcgctgac 1800 cgcggtgaag cagatgcaag cgacgacttt gaaggcacat atgaagaatg gcgtgaacat 1860 atgtggagtg acgtagcagc ctactttaac ctcgacattg aaaacagtga agataataaa 1920 tctactcttt cacttcaatt tgtcgacagc gccgcggata tgccgcttgc gaaaatgcac 1980 ggtgcgtttt caacgaacgt cgtagcaagc aaagaacttc aacagccagg cagtgcacga 2040 agcacgcgac atcttgaaat tgaacttcca aaagaagctt cttatcaaga aggagatcat 2100 ttaggtgtta ttcctcgcaa ctatgaagga atagtaaacc gtgtaacagc aaggttcggc 2160 ctagatgcat cacagcaaat ccgtctggaa gcagaagaag aaaaattagc tcatttgcca 2220 ctcgctaaaa cagtatccgt agaagagctt ctgcaatacg tggagcttca agatcctgtt 2280 acgcgcacgc agcttcgcgc aatggctgct aaaacggtct gcccgccgca taaagtagag 2340 cttgaagcct tgcttgaaaa gcaagcctac aaagaacaag tgctggcaaa acgtttaaca 2400 atgcttgaac tgcttgaaaa atacccggcg tgtgaaatga aattcagcga atttatcgcc 2460 cttctgccaa gcatacgccc gcgctattac tcgatttctt catcacctcg tgtcgatgaa 2520 aaacaagcaa gcatcacggt cagcgttgtc tcaggagaag cgtggagcgg atatggagaa 2580 tataaaggaa ttgcgtcgaa ctatcttgcc gagctgcaag aaggagatac gattacgtgc 2640 tttatttcca caccgcagtc agaatttacg ctgccaaaag accctgaaac gccgcttatc 2700 atggtcggac cgggaacagg cgtcgcgccg tttagaggct ttgtgcaggc gcgcaaacag 2760 ctaaaagaac aaggacagtc acttggagaa gcacatttat acttcggctg ccgttcacct 2820 catgaagact atctgtatca agaagagctt gaaaacgccc aaagcgaagg catcattacg 2880 cttcataccg ctttttctcg catgccaaat cagccgaaaa catacgttca gcacgtaatg 2940 gaacaagacg gcaagaaatt gattgaactt cttgatcaag gagcgcactt ctatatttgc 3000 ggagacggaa gccaaatggc acctgccgtt gaagcaacgc ttatgaaaag ctatgctgac 3060 gttcaccaag tgagtgaagc agacgctcgc ttatggctgc agcagctaga agaaaaaggc 3120 cgatacgcaa aagacgtgtg ggctgggtaa 3150 <210> 62 <211> 1049 <212> PRT <213> Bacillus megaterium <400> 62 Met Thr Ile Lys Glu Met Pro Gln Pro Lys Thr Phe Gly Glu Leu Lys 1 5 10 15 Asn Leu Pro Leu Leu Asn Thr Asp Lys Pro Val Gln Ala Leu Met Lys 20 25 30 Ile Ala Asp Glu Leu Gly Glu Ile Phe Lys Phe Glu Ala Pro Gly Arg 35 40 45 Val Thr Arg Tyr Leu Ser Ser Gln Arg Leu Ile Lys Glu Ala Cys Asp 50 55 60 Glu Ser Arg Phe Asp Lys Asn Leu Ser Gln Ala Leu Lys Phe Val Arg 65 70 75 80 Asp Phe Ala Gly Asp Gly Leu Ala Thr Ser Trp Thr His Glu Lys Asn 85 90 95 Trp Lys Lys Ala His Asn Ile Leu Leu Pro Ser Phe Ser Gln Gln Ala 100 105 110 Met Lys Gly Tyr His Ala Met Met Val Asp Ile Ala Val Gln Leu Val 115 120 125 Gln Lys Trp Glu Arg Leu Asn Ala Asp Glu His Ile Glu Val Pro Glu 130 135 140 Asp Met Thr Arg Leu Thr Leu Asp Thr Ile Gly Leu Cys Gly Phe Asn 145 150 155 160 Tyr Arg Phe Asn Ser Phe Tyr Arg Asp Gln Pro His Pro Phe Ile Thr 165 170 175 Ser Met Val Arg Ala Leu Asp Glu Ala Met Asn Lys Leu Gln Arg Ala 180 185 190 Asn Pro Asp Asp Pro Ala Tyr Asp Glu Asn Lys Arg Gln Phe Gln Glu 195 200 205 Asp Ile Lys Val Met Asn Asp Leu Val Asp Lys Ile Ile Ala Asp Arg 210 215 220 Lys Ala Ser Gly Glu Gln Ser Asp Asp Leu Leu Thr His Met Leu Asn 225 230 235 240 Gly Lys Asp Pro Glu Thr Gly Glu Pro Leu Asp Asp Glu Asn Ile Arg 245 250 255 Tyr Gln Ile Ile Thr Phe Leu Ile Ala Gly His Glu Thr Thr Ser Gly 260 265 270 Leu Leu Ser Phe Ala Leu Tyr Phe Leu Val Lys Asn Pro His Val Leu 275 280 285 Gln Lys Ala Ala Glu Glu Ala Ala Arg Val Leu Val Asp Pro Val Pro 290 295 300 Ser Tyr Lys Gln Val Lys Gln Leu Lys Tyr Val Gly Met Val Leu Asn 305 310 315 320 Glu Ala Leu Arg Leu Trp Pro Thr Ala Pro Ala Phe Ser Leu Tyr Ala 325 330 335 Lys Glu Asp Thr Val Leu Gly Gly Glu Tyr Pro Leu Glu Lys Gly Asp 340 345 350 Glu Leu Met Val Leu Ile Pro Gln Leu His Arg Asp Lys Thr Ile Trp 355 360 365 Gly Asp Asp Val Glu Glu Phe Arg Pro Glu Arg Phe Glu Asn Pro Ser 370 375 380 Ala Ile Pro Gln His Ala Phe Lys Pro Phe Gly Asn Gly Gln Arg Ala 385 390 395 400 Cys Ile Gly Gln Gln Phe Ala Leu His Glu Ala Thr Leu Val Leu Gly 405 410 415 Met Met Leu Lys His Phe Asp Phe Glu Asp His Thr Asn Tyr Glu Leu 420 425 430 Asp Ile Lys Glu Thr Leu Thr Leu Lys Pro Glu Gly Phe Val Val Lys 435 440 445 Ala Lys Ser Lys Lys Ile Pro Leu Gly Gly Ile Pro Ser Pro Ser Thr 450 455 460 Glu Gln Ser Ala Lys Lys Val Arg Lys Lys Ala Glu Asn Ala His Asn 465 470 475 480 Thr Pro Leu Leu Val Leu Tyr Gly Ser Asn Met Gly Thr Ala Glu Gly 485 490 495 Thr Ala Arg Asp Leu Ala Asp Ile Ala Met Ser Lys Gly Phe Ala Pro 500 505 510 Gln Val Ala Thr Leu Asp Ser His Ala Gly Asn Leu Pro Arg Glu Gly 515 520 525 Ala Val Leu Ile Val Thr Ala Ser Tyr Asn Gly His Pro Pro Asp Asn 530 535 540 Ala Lys Gln Phe Val Asp Trp Leu Asp Gln Ala Ser Ala Asp Glu Val 545 550 555 560 Lys Gly Val Arg Tyr Ser Val Phe Gly Cys Gly Asp Lys Asn Trp Ala 565 570 575 Thr Thr Tyr Gln Lys Val Pro Ala Phe Ile Asp Glu Thr Leu Ala Ala 580 585 590 Lys Gly Ala Glu Asn Ile Ala Asp Arg Gly Glu Ala Asp Ala Ser Asp 595 600 605 Asp Phe Glu Gly Thr Tyr Glu Glu Trp Arg Glu His Met Trp Ser Asp 610 615 620 Val Ala Ala Tyr Phe Asn Leu Asp Ile Glu Asn Ser Glu Asp Asn Lys 625 630 635 640 Ser Thr Leu Ser Leu Gln Phe Val Asp Ser Ala Ala Asp Met Pro Leu 645 650 655 Ala Lys Met His Gly Ala Phe Ser Thr Asn Val Val Ala Ser Lys Glu 660 665 670 Leu Gln Gln Pro Gly Ser Ala Arg Ser Thr Arg His Leu Glu Ile Glu 675 680 685 Leu Pro Lys Glu Ala Ser Tyr Gln Glu Gly Asp His Leu Gly Val Ile 690 695 700 Pro Arg Asn Tyr Glu Gly Ile Val Asn Arg Val Thr Ala Arg Phe Gly 705 710 715 720 Leu Asp Ala Ser Gln Gln Ile Arg Leu Glu Ala Glu Glu Glu Lys Leu 725 730 735 Ala His Leu Pro Leu Ala Lys Thr Val Ser Val Glu Glu Leu Leu Gln 740 745 750 Tyr Val Glu Leu Gln Asp Pro Val Thr Arg Thr Gln Leu Arg Ala Met 755 760 765 Ala Ala Lys Thr Val Cys Pro Pro His Lys Val Glu Leu Glu Ala Leu 770 775 780 Leu Glu Lys Gln Ala Tyr Lys Glu Gln Val Leu Ala Lys Arg Leu Thr 785 790 795 800 Met Leu Glu Leu Leu Glu Lys Tyr Pro Ala Cys Glu Met Lys Phe Ser 805 810 815 Glu Phe Ile Ala Leu Leu Pro Ser Ile Arg Pro Arg Tyr Tyr Ser Ile 820 825 830 Ser Ser Ser Pro Arg Val Asp Glu Lys Gln Ala Ser Ile Thr Val Ser 835 840 845 Val Val Ser Gly Glu Ala Trp Ser Gly Tyr Gly Glu Tyr Lys Gly Ile 850 855 860 Ala Ser Asn Tyr Leu Ala Glu Leu Gln Glu Gly Asp Thr Ile Thr Cys 865 870 875 880 Phe Ile Ser Thr Pro Gln Ser Glu Phe Thr Leu Pro Lys Asp Pro Glu 885 890 895 Thr Pro Leu Ile Met Val Gly Pro Gly Thr Gly Val Ala Pro Phe Arg 900 905 910 Gly Phe Val Gln Ala Arg Lys Gln Leu Lys Glu Gln Gly Gln Ser Leu 915 920 925 Gly Glu Ala His Leu Tyr Phe Gly Cys Arg Ser Pro His Glu Asp Tyr 930 935 940 Leu Tyr Gln Glu Glu Leu Glu Asn Ala Gln Ser Glu Gly Ile Ile Thr 945 950 955 960 Leu His Thr Ala Phe Ser Arg Met Pro Asn Gln Pro Lys Thr Tyr Val 965 970 975 Gln His Val Met Glu Gln Asp Gly Lys Lys Leu Ile Glu Leu Leu Asp 980 985 990 Gln Gly Ala His Phe Tyr Ile Cys Gly Asp Gly Ser Gln Met Ala Pro 995 1000 1005 Ala Val Glu Ala Thr Leu Met Lys Ser Tyr Ala Asp Val His Gln 1010 1015 1020 Val Ser Glu Ala Asp Ala Arg Leu Trp Leu Gln Gln Leu Glu Glu 1025 1030 1035 Lys Gly Arg Tyr Ala Lys Asp Val Trp Ala Gly 1040 1045 <210> 63 <211> 3225 <212> DNA <213> Bacillus licheniformis <400> 63 atgaacaagt tagatggaat tccaatccct aaaacttacg ggccgctcgg caacctgcct 60 ttgcttgaca aaaacagggt ctcccagtca ctttggaaaa tcgcggatga gatggggcct 120 atctttcaat ttaagtttgc ggatgcgatt ggggtttttg tgtccagcca tgaactggtt 180 aaagaagtct ctgaagaatc ccgttttgac aaaaacatgg ggaaggggct attgaaagtt 240 cgcgagttca gcggagacgg gctctttaca agctggacgg aagaacccaa ttggcggaaa 300 gcccacaaca tccttctgcc gagcttcagc cagaaagcga tgaagggata ccatcccatg 360 atgcaggata tcgccgtcca gctcattcaa aagtggtccc gtctcaatca ggatgaaagc 420 attgatgtgc cggacgatat gacgcggctg acgctggaca cgatcggctt atgcgggttt 480 aactaccgct ttaacagctt ctaccgtgaa gggcagcatc cgtttattga gagcatggtc 540 cggggtttga gcgaagcgat gagacagacg aagcgcttcc cgctgcagga taagctgatg 600 attcaaacga agcgccggtt taacagcgat gtcgagtcga tgttttctct tgttgaccgg 660 atcatcgctg accggaagca ggccgagagt gaaagcggaa atgacctctt gtcgcttatg 720 cttcatgcga aagaccctga gaccggcgaa aaactggatg atgagaatat ccgctatcaa 780 attattacat ttttgattgc cggacacgag acgacgagcg gtttattatc gtttgcaatc 840 tatctgctcc tgaagcatcc ggataagctt aagaaagcgt atgaagaagc agaccgcgtg 900 ctgaccgatc ccgtcccatc ctacaaacag gttcagcagc tgaaatacat ccgaatgatt 960 ttgaatgaat cgataaggct ttggccgacg gcaccggctt tctctcttta tgcaaaagaa 1020 gaaacggtta tcgggggaaa atatttgatt ccaaaaggac agagcgttac agtgctcatc 1080 ccaaaactgc acagagatca aagcgtctgg ggagaagatg ccgaggcatt ccggcctgaa 1140 cggttcgagc agatggacag cattccggcg cacgcataca aaccgtttgg caacggccaa 1200 agggcatgca tcggcatgca gttcgccctt catgaagcga cgcttgtgct cggcatgatt 1260 cttcagtact ttgatcttga agatcatgca aactaccaat tgaagatcaa agaatcgctg 1320 acattaaaac cggatggttt cacaatccgg gtgaggccga ggaaaaaaga agcaatgacg 1380 gcgatgccgg gcgctcagcc tgaagagaac ggacggcagg aagaacggcc ttccgcaccg 1440 gcggcggaaa atacgcacgg aacccctctt cttgtgctct acggttcaaa tctcggcaca 1500 gccgaagaga ttgcgaagga gcttgctgaa gaagcgcgtg agcaagggtt tcacagccgg 1560 acggcggagc ttgatcaata cgcaggcgcc atcccggcag aaggggctgt tatcattgtg 1620 acggcttcct ataacggaaa cccgcccgat tgcgcaaagg aatttgtcaa ttggcttgag 1680 catgatcaga cagacgattt gcgtggtgtc aaatatgcgg tattcggctg cggtaaccgc 1740 agctgggcca gcacctacca gcggattccg cgcctgattg acagcgtatt ggaaaaaaaa 1800 ggcgcccaaa ggctgcacaa gcttggagaa ggggatgcag gcgatgattt tgaaggacag 1860 tttgagtcat ggaaatatga tctgtggccg cttttaagaa ccgaattttc attggccgaa 1920 cccgagccga atcaaacaga aacagacagg caagccttat ctgtcgagtt cgtaaacgca 1980 cctgcggctt cgccgctggc taaagcttat caggtgttca cagcgaagat atcggcaaac 2040 cgagaactgc agtgtgaaaa gagcgggaga agcacaaggc atattgaaat atcgcttcct 2100 gaaggcgccg catatcagga gggagaccat ctcggtgtgc taccgcaaaa cagcgaagtg 2160 ctgattggcc gcgtttttca gcggtttggg ctgaacggaa atgaacaaat tctgattagc 2220 ggccggaatc aagcatcaca tttgcctttg gagaggcccg ttcatgtcaa agaccttttt 2280 caacattgcg tcgagctcca ggaaccggcc acaagggccc agatacgcga gctggcggct 2340 catactgttt gtccgcctca tcagcgcgag cttgaagacc tgctgaaaga tgacgtctat 2400 aaggatcaag tgttgaataa gcggctgaca atgcttgacc tgcttgagca atacccggcc 2460 tgtgaactgc cgttcgcccg ttttctggcg cttcttcctc cgctaaaacc gaggtactat 2520 tcgatttcca gttcgccgca gcttaacccg cggcaaacaa gcatcaccgt ctctgtcgta 2580 agtggcccgg cgttgagcgg ccgcgggcat tataagggag ttgcatcgaa ctatctcgcc 2640 ggccttgagc cgggagacgc gatttcgtgt ttcatcagag agcctcagtc aggcttccgg 2700 cttcccgaag atcctgaaac accggtgatc atggtcgggc cgggcaccgg aatcgcccct 2760 taccgcggat ttcttcaggc gcgccgcatc cagcgcgatg ccggtgtgaa gctcggtgaa 2820 gcgcatttgt acttcggctg ccgccgtccg aacgaagatt ttctgtatcg agacgagttg 2880 gagcaagcgg aaaaggacgg aatcgtccat ctgcatacag cgttttcccg gcttgagggc 2940 cggccgaaaa catatgtgca agatttgctc agagaggatg cagccttgct gattcacttg 3000 ttgaacgaag gcggccgcct gtatgtgtgc ggagacggaa gccgcatggc tccagctgtt 3060 gaacaagctt tgtgcgaggc gtatcgcata gtacagggtg cgagtcggga agagtcgcaa 3120 agctggctgt ccgcactttt agaagaaggg cgctatgcaa aggatgtatg ggacggcggc 3180 gtttcccaac ataatgtgaa ggcggactgc attgcaagaa cgtaa 3225 <210> 64 <211> 1074 <212> PRT <213> Bacillus licheniformis <400> 64 Met Asn Lys Leu Asp Gly Ile Pro Ile Pro Lys Thr Tyr Gly Pro Leu 1 5 10 15 Gly Asn Leu Pro Leu Leu Asp Lys Asn Arg Val Ser Gln Ser Leu Trp 20 25 30 Lys Ile Ala Asp Glu Met Gly Pro Ile Phe Gln Phe Lys Phe Ala Asp 35 40 45 Ala Ile Gly Val Phe Val Ser Ser His Glu Leu Val Lys Glu Val Ser 50 55 60 Glu Glu Ser Arg Phe Asp Lys Asn Met Gly Lys Gly Leu Leu Lys Val 65 70 75 80 Arg Glu Phe Ser Gly Asp Gly Leu Phe Thr Ser Trp Thr Glu Glu Pro 85 90 95 Asn Trp Arg Lys Ala His Asn Ile Leu Leu Pro Ser Phe Ser Gln Lys 100 105 110 Ala Met Lys Gly Tyr His Pro Met Met Gln Asp Ile Ala Val Gln Leu 115 120 125 Ile Gln Lys Trp Ser Arg Leu Asn Gln Asp Glu Ser Ile Asp Val Pro 130 135 140 Asp Asp Met Thr Arg Leu Thr Leu Asp Thr Ile Gly Leu Cys Gly Phe 145 150 155 160 Asn Tyr Arg Phe Asn Ser Phe Tyr Arg Glu Gly Gln His Pro Phe Ile 165 170 175 Glu Ser Met Val Arg Gly Leu Ser Glu Ala Met Arg Gln Thr Lys Arg 180 185 190 Phe Pro Leu Gln Asp Lys Leu Met Ile Gln Thr Lys Arg Arg Phe Asn 195 200 205 Ser Asp Val Glu Ser Met Phe Ser Leu Val Asp Arg Ile Ile Ala Asp 210 215 220 Arg Lys Gln Ala Glu Ser Glu Ser Gly Asn Asp Leu Leu Ser Leu Met 225 230 235 240 Leu His Ala Lys Asp Pro Glu Thr Gly Glu Lys Leu Asp Asp Glu Asn 245 250 255 Ile Arg Tyr Gln Ile Ile Thr Phe Leu Ile Ala Gly His Glu Thr Thr 260 265 270 Ser Gly Leu Leu Ser Phe Ala Ile Tyr Leu Leu Leu Lys His Pro Asp 275 280 285 Lys Leu Lys Lys Ala Tyr Glu Glu Ala Asp Arg Val Leu Thr Asp Pro 290 295 300 Val Pro Ser Tyr Lys Gln Val Gln Gln Leu Lys Tyr Ile Arg Met Ile 305 310 315 320 Leu Asn Glu Ser Ile Arg Leu Trp Pro Thr Ala Pro Ala Phe Ser Leu 325 330 335 Tyr Ala Lys Glu Glu Thr Val Ile Gly Gly Lys Tyr Leu Ile Pro Lys 340 345 350 Gly Gln Ser Val Thr Val Leu Ile Pro Lys Leu His Arg Asp Gln Ser 355 360 365 Val Trp Gly Glu Asp Ala Glu Ala Phe Arg Pro Glu Arg Phe Glu Gln 370 375 380 Met Asp Ser Ile Pro Ala His Ala Tyr Lys Pro Phe Gly Asn Gly Gln 385 390 395 400 Arg Ala Cys Ile Gly Met Gln Phe Ala Leu His Glu Ala Thr Leu Val 405 410 415 Leu Gly Met Ile Leu Gln Tyr Phe Asp Leu Glu Asp His Ala Asn Tyr 420 425 430 Gln Leu Lys Ile Lys Glu Ser Leu Thr Leu Lys Pro Asp Gly Phe Thr 435 440 445 Ile Arg Val Arg Pro Arg Lys Lys Glu Ala Met Thr Ala Met Pro Gly 450 455 460 Ala Gln Pro Glu Glu Asn Gly Arg Gln Glu Glu Arg Pro Ser Ala Pro 465 470 475 480 Ala Ala Glu Asn Thr His Gly Thr Pro Leu Leu Val Leu Tyr Gly Ser 485 490 495 Asn Leu Gly Thr Ala Glu Glu Ile Ala Lys Glu Leu Ala Glu Glu Ala 500 505 510 Arg Glu Gln Gly Phe His Ser Arg Thr Ala Glu Leu Asp Gln Tyr Ala 515 520 525 Gly Ala Ile Pro Ala Glu Gly Ala Val Ile Ile Val Thr Ala Ser Tyr 530 535 540 Asn Gly Asn Pro Pro Asp Cys Ala Lys Glu Phe Val Asn Trp Leu Glu 545 550 555 560 His Asp Gln Thr Asp Asp Leu Arg Gly Val Lys Tyr Ala Val Phe Gly 565 570 575 Cys Gly Asn Arg Ser Trp Ala Ser Thr Tyr Gln Arg Ile Pro Arg Leu 580 585 590 Ile Asp Ser Val Leu Glu Lys Lys Gly Ala Gln Arg Leu His Lys Leu 595 600 605 Gly Glu Gly Asp Ala Gly Asp Asp Phe Glu Gly Gln Phe Glu Ser Trp 610 615 620 Lys Tyr Asp Leu Trp Pro Leu Leu Arg Thr Glu Phe Ser Leu Ala Glu 625 630 635 640 Pro Glu Pro Asn Gln Thr Glu Thr Asp Arg Gln Ala Leu Ser Val Glu 645 650 655 Phe Val Asn Ala Pro Ala Ala Ser Pro Leu Ala Lys Ala Tyr Gln Val 660 665 670 Phe Thr Ala Lys Ile Ser Ala Asn Arg Glu Leu Gln Cys Glu Lys Ser 675 680 685 Gly Arg Ser Thr Arg His Ile Glu Ile Ser Leu Pro Glu Gly Ala Ala 690 695 700 Tyr Gln Glu Gly Asp His Leu Gly Val Leu Pro Gln Asn Ser Glu Val 705 710 715 720 Leu Ile Gly Arg Val Phe Gln Arg Phe Gly Leu Asn Gly Asn Glu Gln 725 730 735 Ile Leu Ile Ser Gly Arg Asn Gln Ala Ser His Leu Pro Leu Glu Arg 740 745 750 Pro Val His Val Lys Asp Leu Phe Gln His Cys Val Glu Leu Gln Glu 755 760 765 Pro Ala Thr Arg Ala Gln Ile Arg Glu Leu Ala Ala His Thr Val Cys 770 775 780 Pro Pro His Gln Arg Glu Leu Glu Asp Leu Leu Lys Asp Asp Val Tyr 785 790 795 800 Lys Asp Gln Val Leu Asn Lys Arg Leu Thr Met Leu Asp Leu Leu Glu 805 810 815 Gln Tyr Pro Ala Cys Glu Leu Pro Phe Ala Arg Phe Leu Ala Leu Leu 820 825 830 Pro Pro Leu Lys Pro Arg Tyr Tyr Ser Ile Ser Ser Ser Pro Gln Leu 835 840 845 Asn Pro Arg Gln Thr Ser Ile Thr Val Ser Val Val Ser Gly Pro Ala 850 855 860 Leu Ser Gly Arg Gly His Tyr Lys Gly Val Ala Ser Asn Tyr Leu Ala 865 870 875 880 Gly Leu Glu Pro Gly Asp Ala Ile Ser Cys Phe Ile Arg Glu Pro Gln 885 890 895 Ser Gly Phe Arg Leu Pro Glu Asp Pro Glu Thr Pro Val Ile Met Val 900 905 910 Gly Pro Gly Thr Gly Ile Ala Pro Tyr Arg Gly Phe Leu Gln Ala Arg 915 920 925 Arg Ile Gln Arg Asp Ala Gly Val Lys Leu Gly Glu Ala His Leu Tyr 930 935 940 Phe Gly Cys Arg Arg Pro Asn Glu Asp Phe Leu Tyr Arg Asp Glu Leu 945 950 955 960 Glu Gln Ala Glu Lys Asp Gly Ile Val His Leu His Thr Ala Phe Ser 965 970 975 Arg Leu Glu Gly Arg Pro Lys Thr Tyr Val Gln Asp Leu Leu Arg Glu 980 985 990 Asp Ala Ala Leu Leu Ile His Leu Leu Asn Glu Gly Gly Arg Leu Tyr 995 1000 1005 Val Cys Gly Asp Gly Ser Arg Met Ala Pro Ala Val Glu Gln Ala 1010 1015 1020 Leu Cys Glu Ala Tyr Arg Ile Val Gln Gly Ala Ser Arg Glu Glu 1025 1030 1035 Ser Gln Ser Trp Leu Ser Ala Leu Leu Glu Glu Gly Arg Tyr Ala 1040 1045 1050 Lys Asp Val Trp Asp Gly Gly Val Ser Gln His Asn Val Lys Ala 1055 1060 1065 Asp Cys Ile Ala Arg Thr 1070 <210> 65 <211> 16 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 65 taaggaggaa aacaaa 16 <210> 66 <211> 1677 <212> DNA <213> Pseudomonas putida <400> 66 atgtacgact atataatcgt tggtgctgga tctgcaggat gtgtgcttgc taatcgtctt 60 tcggccgacc cctctaaaag agtttgttta cttgaagctg ggccgcgaga tacgaatccg 120 ctaattcata tgccgttagg tattgctttg ctttcaaata gtaaaaagtt gaattgggct 180 tttcaaactg cgccacagca aaatctcaac ggccggagcc ttttctggcc acgaggaaaa 240 acgttaggtg gttcaagctc aatcaacgca atggtctata tccgagggca tgaagacgat 300 taccacgcat gggagcaggc ggccggccgc tactggggtt ggtaccgggc tcttgagttg 360 ttcaaaaggc ttgaatgcaa ccagcgattc gataagtccg agcaccatgg ggttgacgga 420 gaattagctg ttagtgattt aaaatatatc aatccgctta gcaaagcatt cgtgcaagcc 480 ggcatggagg ccaatattaa tttcaacgga gatttcaacg gcgagtacca ggacggcgta 540 gggttctatc aagtaaccca aaaaaatgga caacgctgga gctcggcgcg tgcattcttg 600 cacggtgtac tttccagacc aaatctagac atcattactg atgcgcatgc atcaaaaatt 660 ctttttgaag accgtaaggc ggttggtgtt tcttatataa agaaaaatat gcaccatcaa 720 gtcaagacaa cgagtggtgg tgaagtactt cttagtcttg gcgcagtcgg cacgcctcac 780 cttctaatgc tttctggtgt tggggctgca gccgagctta aggaacatgg tgtttctcta 840 gtccatgatc ttcctgaggt ggggaaaaat cttcaagatc atttggacat cacattgatg 900 tgcgcagcaa attcgagaga gccgataggt gttgctcttt ctttcatccc tcgtggtgtc 960 tcgggtttgt tttcatatgt gtttaagcgc gaggggtttc tcactagtaa cgtggcagag 1020 tcgggtggtt ttgtaaaaag ttctcctgat cgtgatcggc ccaatttgca gtttcatttc 1080 cttccaactt atcttaaaga tcacggtcga aaaatagcgg gtggttatgg ttatacgcta 1140 catatatgtg atcttttgcc taagagccga ggcagaattg gcctaaaaag cgccaatcca 1200 ttacagccgc ctttaattga cccgaactat cttagcgatc atgaagatat taaaaccatg 1260 attgcgggta ttaagatagg gcgcgctatt ttgcaggccc catcgatggc gaagcatttt 1320 aagcatgaag tagtaccggg ccaggctgtt aaaactgatg atgaaataat cgaagatatt 1380 cgtaggcgag ctgagactat ataccatccg gtaggtactt gtaggatggg taaagatcca 1440 gcgtcagttg ttgatccgtg cctgaagatc cgtgggttgg caaatattag agtcgttgat 1500 gcgtcaatta tgccgcactt ggtcgcgggt aacacaaacg ctccaactat tatgattgca 1560 gaaaatgcgg cagaaataat tatgcggaat cttgatgtgg aagcattaga ggctagcgct 1620 gagtttgctc gcgagggtgc agagctagag ttggccatga tagctgtctg catgtaa 1677 <210> 67 <211> 558 <212> PRT <213> Pseudomonas putida <400> 67 Met Tyr Asp Tyr Ile Ile Val Gly Ala Gly Ser Ala Gly Cys Val Leu 1 5 10 15 Ala Asn Arg Leu Ser Ala Asp Pro Ser Lys Arg Val Cys Leu Leu Glu 20 25 30 Ala Gly Pro Arg Asp Thr Asn Pro Leu Ile His Met Pro Leu Gly Ile 35 40 45 Ala Leu Leu Ser Asn Ser Lys Lys Leu Asn Trp Ala Phe Gln Thr Ala 50 55 60 Pro Gln Gln Asn Leu Asn Gly Arg Ser Leu Phe Trp Pro Arg Gly Lys 65 70 75 80 Thr Leu Gly Gly Ser Ser Ser Ile Asn Ala Met Val Tyr Ile Arg Gly 85 90 95 His Glu Asp Asp Tyr His Ala Trp Glu Gln Ala Ala Gly Arg Tyr Trp 100 105 110 Gly Trp Tyr Arg Ala Leu Glu Leu Phe Lys Arg Leu Glu Cys Asn Gln 115 120 125 Arg Phe Asp Lys Ser Glu His His Gly Val Asp Gly Glu Leu Ala Val 130 135 140 Ser Asp Leu Lys Tyr Ile Asn Pro Leu Ser Lys Ala Phe Val Gln Ala 145 150 155 160 Gly Met Glu Ala Asn Ile Asn Phe Asn Gly Asp Phe Asn Gly Glu Tyr 165 170 175 Gln Asp Gly Val Gly Phe Tyr Gln Val Thr Gln Lys Asn Gly Gln Arg 180 185 190 Trp Ser Ser Ala Arg Ala Phe Leu His Gly Val Leu Ser Arg Pro Asn 195 200 205 Leu Asp Ile Ile Thr Asp Ala His Ala Ser Lys Ile Leu Phe Glu Asp 210 215 220 Arg Lys Ala Val Gly Val Ser Tyr Ile Lys Lys Asn Met His His Gln 225 230 235 240 Val Lys Thr Thr Ser Gly Gly Glu Val Leu Leu Ser Leu Gly Ala Val 245 250 255 Gly Thr Pro His Leu Leu Met Leu Ser Gly Val Gly Ala Ala Ala Glu 260 265 270 Leu Lys Glu His Gly Val Ser Leu Val His Asp Leu Pro Glu Val Gly 275 280 285 Lys Asn Leu Gln Asp His Leu Asp Ile Thr Leu Met Cys Ala Ala Asn 290 295 300 Ser Arg Glu Pro Ile Gly Val Ala Leu Ser Phe Ile Pro Arg Gly Val 305 310 315 320 Ser Gly Leu Phe Ser Tyr Val Phe Lys Arg Glu Gly Phe Leu Thr Ser 325 330 335 Asn Val Ala Glu Ser Gly Gly Phe Val Lys Ser Ser Pro Asp Arg Asp 340 345 350 Arg Pro Asn Leu Gln Phe His Phe Leu Pro Thr Tyr Leu Lys Asp His 355 360 365 Gly Arg Lys Ile Ala Gly Gly Tyr Gly Tyr Thr Leu His Ile Cys Asp 370 375 380 Leu Leu Pro Lys Ser Arg Gly Arg Ile Gly Leu Lys Ser Ala Asn Pro 385 390 395 400 Leu Gln Pro Pro Leu Ile Asp Pro Asn Tyr Leu Ser Asp His Glu Asp 405 410 415 Ile Lys Thr Met Ile Ala Gly Ile Lys Ile Gly Arg Ala Ile Leu Gln 420 425 430 Ala Pro Ser Met Ala Lys His Phe Lys His Glu Val Val Pro Gly Gln 435 440 445 Ala Val Lys Thr Asp Asp Glu Ile Ile Glu Asp Ile Arg Arg Arg Ala 450 455 460 Glu Thr Ile Tyr His Pro Val Gly Thr Cys Arg Met Gly Lys Asp Pro 465 470 475 480 Ala Ser Val Val Asp Pro Cys Leu Lys Ile Arg Gly Leu Ala Asn Ile 485 490 495 Arg Val Val Asp Ala Ser Ile Met Pro His Leu Val Ala Gly Asn Thr 500 505 510 Asn Ala Pro Thr Ile Met Ile Ala Glu Asn Ala Ala Glu Ile Ile Met 515 520 525 Arg Asn Leu Asp Val Glu Ala Leu Glu Ala Ser Ala Glu Phe Ala Arg 530 535 540 Glu Gly Ala Glu Leu Glu Leu Ala Met Ile Ala Val Cys Met 545 550 555 <210> 68 <211> 1452 <212> DNA <213> Pseudomonas putida <400> 68 atgaccatac caattagcct agccaagtta aactctagtg ccgataccca ttcagcgctt 60 gaagtattta atttgcagaa agttgcaagt agtgcgcgtc gtggtaaatt tggcatagca 120 gagcgcatcg ctgctcttaa tttacttaag gaaactattc agcgtcgtga gcctgaaatt 180 attgctgcac ttgcagcgga ctttcgcaag ccggcaagcg aggtgaagct aacagaaatc 240 tttccggtat tgcaagaaat taatcatgcc aaacggaacc ttaaagattg gatgaagcca 300 cggcgagtga gggcggcact tagtgtagcg ggcacgcggg caggacttcg ttacgagcct 360 aagggtgtct gtttgataat tgcgccgtgg aactatccat tcaaccttag tttcggtcct 420 cttgtatctg cgttagcggc aggaaatagc gttgttataa agccgtctga attgacacca 480 cacactgcaa cactgatcgg atctatagtc agggaggcat tctctgtcga cctagtcgct 540 gtggtggagg gtgatgccgc agtttcccag gagctgttgg ctctgccatt tgaccatatt 600 ttttttactg gtagtcctag ggtcggcaag ttagtgatgg aagcggcgtc aaaaacactc 660 gcttcggtta ctttggagtt aggcggaaaa tctccaacca ttattggacc aacagcaaat 720 ttgccgaaag ctgcgcgcaa catagtgtgg ggaaagtttt caaacaacgg ccagacgtgc 780 atagcgcctg atcacgtatt tgttcatcgg tgtatagccc agaaattcaa tgaaattctt 840 gtgaaagaga ttgtgcgagt ttatgggaag gattttgctg cgcagcgtag atcggcagac 900 tattgcagga tcgtcaatga tcaacatttc aatcgaatta ataaactcct gactgacgcg 960 aaagctaaag gtgcaaaaat tctgcaaggg ggtcaagttg acgcgactga gaggcttgtg 1020 gtgccaacgg ttttatctaa cgtcactgct gctatggata ttaaccatga ggaaatattc 1080 gggccgctac ttcctataat tgaatacgat gatatagatt ctgtaattaa gcgtgtgaat 1140 gacggtgaca agcccctggc gctgtatgtc ttttctgaag ataaacaatt tgtaaataac 1200 atcgtggctc gtacaagctc tggttcggtc ggagttaatc tgagtgtcgt gcactttttg 1260 caccctaatc tcccatttgg cggtgtcaat aatagtggta tcggcagtgc tcatggagtt 1320 tacgggttca gggcgttttc tcacgaaaaa ccagttctta tagataagtt ctcaatcacg 1380 cattggttgt ttccgcctta taccaagaag gtgaagcagt tgattggtat cacagttaag 1440 tatttgagct ga 1452 <210> 69 <211> 483 <212> PRT <213> Pseudomonas putida <400> 69 Met Thr Ile Pro Ile Ser Leu Ala Lys Leu Asn Ser Ser Ala Asp Thr 1 5 10 15 His Ser Ala Leu Glu Val Phe Asn Leu Gln Lys Val Ala Ser Ser Ala 20 25 30 Arg Arg Gly Lys Phe Gly Ile Ala Glu Arg Ile Ala Ala Leu Asn Leu 35 40 45 Leu Lys Glu Thr Ile Gln Arg Arg Glu Pro Glu Ile Ile Ala Ala Leu 50 55 60 Ala Ala Asp Phe Arg Lys Pro Ala Ser Glu Val Lys Leu Thr Glu Ile 65 70 75 80 Phe Pro Val Leu Gln Glu Ile Asn His Ala Lys Arg Asn Leu Lys Asp 85 90 95 Trp Met Lys Pro Arg Arg Val Arg Ala Ala Leu Ser Val Ala Gly Thr 100 105 110 Arg Ala Gly Leu Arg Tyr Glu Pro Lys Gly Val Cys Leu Ile Ile Ala 115 120 125 Pro Trp Asn Tyr Pro Phe Asn Leu Ser Phe Gly Pro Leu Val Ser Ala 130 135 140 Leu Ala Ala Gly Asn Ser Val Val Ile Lys Pro Ser Glu Leu Thr Pro 145 150 155 160 His Thr Ala Thr Leu Ile Gly Ser Ile Val Arg Glu Ala Phe Ser Val 165 170 175 Asp Leu Val Ala Val Val Glu Gly Asp Ala Ala Val Ser Gln Glu Leu 180 185 190 Leu Ala Leu Pro Phe Asp His Ile Phe Phe Thr Gly Ser Pro Arg Val 195 200 205 Gly Lys Leu Val Met Glu Ala Ala Ser Lys Thr Leu Ala Ser Val Thr 210 215 220 Leu Glu Leu Gly Gly Lys Ser Pro Thr Ile Ile Gly Pro Thr Ala Asn 225 230 235 240 Leu Pro Lys Ala Ala Arg Asn Ile Val Trp Gly Lys Phe Ser Asn Asn 245 250 255 Gly Gln Thr Cys Ile Ala Pro Asp His Val Phe Val His Arg Cys Ile 260 265 270 Ala Gln Lys Phe Asn Glu Ile Leu Val Lys Glu Ile Val Arg Val Tyr 275 280 285 Gly Lys Asp Phe Ala Ala Gln Arg Arg Ser Ala Asp Tyr Cys Arg Ile 290 295 300 Val Asn Asp Gln His Phe Asn Arg Ile Asn Lys Leu Leu Thr Asp Ala 305 310 315 320 Lys Ala Lys Gly Ala Lys Ile Leu Gln Gly Gly Gln Val Asp Ala Thr 325 330 335 Glu Arg Leu Val Val Pro Thr Val Leu Ser Asn Val Thr Ala Ala Met 340 345 350 Asp Ile Asn His Glu Glu Ile Phe Gly Pro Leu Leu Pro Ile Ile Glu 355 360 365 Tyr Asp Asp Ile Asp Ser Val Ile Lys Arg Val Asn Asp Gly Asp Lys 370 375 380 Pro Leu Ala Leu Tyr Val Phe Ser Glu Asp Lys Gln Phe Val Asn Asn 385 390 395 400 Ile Val Ala Arg Thr Ser Ser Gly Ser Val Gly Val Asn Leu Ser Val 405 410 415 Val His Phe Leu His Pro Asn Leu Pro Phe Gly Gly Val Asn Asn Ser 420 425 430 Gly Ile Gly Ser Ala His Gly Val Tyr Gly Phe Arg Ala Phe Ser His 435 440 445 Glu Lys Pro Val Leu Ile Asp Lys Phe Ser Ile Thr His Trp Leu Phe 450 455 460 Pro Pro Tyr Thr Lys Lys Val Lys Gln Leu Ile Gly Ile Thr Val Lys 465 470 475 480 Tyr Leu Ser

Claims

재생가능한 공급원료로부터 탄소원의 존재 시 발효액에서 성장될 때 생체 내에서 ω-하이드록시 지방산 유도체를 생성하는 재조합 미생물에 있어서,
상기 미생물은:
(a) EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및
(b) EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는,
폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 포함하는 재조합 미생물.
제 1 항에 있어서,
상기 변형된 ω-하이드록실라아제는 변형된 시토크롬 P450 모노옥시게나아제 효소 활성을 갖고, 생체 내에서 탄화수소 사슬들의 ω-위치를 효율적으로 촉매화하는 재조합 미생물.
제 2 항에 있어서,
상기 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드인 재조합 미생물.
제 3 항에 있어서,
상기 CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적(self-sufficient) CYP153A-RedRhF 혼성 융합 단백질인 재조합 미생물.
제 1 항에 있어서,
상기 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체인 재조합 미생물.
제 5 항에 있어서,
상기 ω-하이드록실라아제 혼성 융합 단백질 변이체는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성(sequence identity)을 갖고, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및 A796V로 구성된 그룹으로부터 선택되는 하나 이상의 돌연변이를 갖는 재조합 미생물.
제 1 항에 있어서,
상기 재조합 미생물은 ω-하이드록시 지방산들 및 ω-하이드록시 지방산 메틸 에스테르들로 구성된 그룹으로부터 선택되는 ω-하이드록시 지방산 유도체들을 생성하는 재조합 미생물.
제 1 항에 있어서,
상기 재조합 미생물은 EC 1.1.1.1/2의 알코올 디하이드로게나아제 또는 EC 1.1.3.13 또는 EC 1.1.3.20의 알코올 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작되는 재조합 미생물.
제 8 항에 있어서,
상기 재조합 미생물은 ω-옥소 지방산들 및 ω-옥소 지방산 메틸 에스테르들로 구성된 그룹으로부터 선택되는 ω-하이드록시 지방산 유도체들을 생성하는 재조합 미생물.
제 8 항에 있어서,
상기 재조합 미생물은 EC 1.2.1.3/4/5의 알데히드 디하이드로게나아제 또는 EC 1.2.3.1의 알데히드 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작되는 재조합 미생물.
제 10 항에 있어서,
상기 재조합 미생물은 α,ω-이산들 또는 ω-카르복시 지방산 메틸 에스테르들인 ω-하이드록시 지방산 유도체들을 생성하는 재조합 미생물.
제 10 항에 있어서,
상기 재조합 미생물은 EC 6.2.1.3의 아실-CoA 리가아제 또는 EC 2.8.3.6의 아실-CoA 트랜스퍼라아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작되는 재조합 미생물.
제 12 항에 있어서,
상기 재조합 미생물은 α,ω-디에스테르들인 ω-하이드록시 지방산 유도체들을 생성하는 재조합 미생물.
제 8 항에 있어서,
상기 재조합 미생물은 EC 2.6.1의 아미노 트랜스퍼라아제 또는 EC 1.4.9, EC 1.4.98 또는 EC 1.4.99의 아민 디하이드로게나아제들을 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작되는 재조합 미생물.
제 14 항에 있어서,
상기 재조합 미생물은 ω-아미노 지방산들 및 ω-아미노 지방산 메틸 에스테르들로 구성된 그룹으로부터 선택되는 ω-하이드록시 지방산 유도체들을 생성하는 재조합 미생물.
제 1 항에 있어서,
상기 재조합 미생물은 EC 1.1.-.-의 알코올 디하이드로게나아제 및 1.2.99의 카르복실산 리덕타아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작되는 재조합 미생물.
제 16 항에 있어서,
ω-하이드록시 지방산 유도체는 α,ω-디올인 재조합 미생물.
제 1 항 내지 제 17 항 중 어느 한 항에 따른 미생물을 포함하는 세포 배양물(cell culture).
제 18 항에 있어서,
상기 세포 배양물은, ω-하이드록시 유리 지방산들; ω-하이드록시 지방산 메틸 에스테르들; ω-옥소 지방산들; ω-옥소 지방산 메틸 에스테르들; α,ω-이산들; α,ω-디올들; ω-아미노 지방산들; 및 ω-아미노 지방산 메틸 에스테르들로 구성된 그룹으로부터 선택되는 ω-하이드록시 지방산 유도체들을 생성하는 세포 배양물.
ω-하이드록시 지방산 유도체를 생성하는 방법에 있어서,
(a) 발효액에 재조합 미생물을 제공하는 단계로, 상기 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 포함하는 단계;
(b) 탄소원을 함유한 재생가능한 공급원료를 발효액에 첨가하는 단계; 및
(c) 상기 발효액으로부터 ω-하이드록시 지방산 유도체를 분리시키는 단계를 포함하는 지방산 유도체 생성 방법.
제 20 항에 있어서,
상기 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드인 지방산 유도체 생성 방법.
제 21 항에 있어서,
상기 CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질인 지방산 유도체 생성 방법.
제 20 항에 있어서,
상기 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체인 지방산 유도체 생성 방법.
제 23 항에 있어서,
상기 ω-하이드록실라아제 혼성 융합 단백질 변이체는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 갖고, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및 A796V로 구성된 그룹으로부터 선택되는 하나 이상의 돌연변이를 갖는 지방산 유도체 생성 방법.
제 20 항에 있어서,
상기 ω-하이드록시 지방산 유도체는 ω-하이드록시 유리 지방산 또는 ω-하이드록시 지방산 메틸 에스테르인 지방산 유도체 생성 방법.
제 20 항에 있어서,
상기 재조합 미생물은 EC 1.1.1.1/2의 알코올 디하이드로게나아제 또는 EC 1.1.3.13 또는 EC 1.1.3.20의 알코올 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작되는 지방산 유도체 생성 방법.
제 26 항에 있어서,
상기 ω-하이드록시 지방산 유도체는 ω-옥소 지방산 또는 ω-옥소 지방산 메틸 에스테르인 지방산 유도체 생성 방법.
제 26 항에 있어서,
상기 재조합 미생물은 EC 1.2.1.3/4/5의 알데히드 디하이드로게나아제 또는 EC 1.2.3.1의 알데히드 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작되는 지방산 유도체 생성 방법.
제 28 항에 있어서,
상기 ω-하이드록시 지방산 유도체는 α,ω-이산 또는 α,ω-지방산 디메틸 에스테르인 지방산 유도체 생성 방법.
제 26 항에 있어서,
상기 재조합 미생물은 EC 2.6.1의 아미노 트랜스퍼라아제 또는 EC 1.4.9, EC 1.4.98 또는 EC 1.4.99의 아민 디하이드로게나아제들을 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작되는 지방산 유도체 생성 방법.
제 30 항에 있어서,
상기 ω-하이드록시 지방산 유도체는 ω-아미노 지방산 또는 ω-아미노 지방산 메틸 에스테르인 지방산 유도체 생성 방법.
제 20 항에 있어서,
상기 재조합 미생물은 EC 1.2.99.6의 카르복실산 리덕타아제 및 EC 1.1.-.-의 알코올 디하이드로게나아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작되는 지방산 유도체 생성 방법.
제 32 항에 있어서,
상기 ω-하이드록시 지방산 유도체는 α,ω-디올인 지방산 유도체 생성 방법.
제 1 항 내지 제 33 항 중 어느 하나의 방법에 있어서,
상기 재생가능한 공급원료는 탄소계인 지방산 유도체 생성 방법.
제 34 항에 있어서,
상기 탄소계 재생가능한 공급원료는 옥수수, 사탕수수, 수수, 사탕무, 스위치그래스(switchgrass), 목초, 짚, 목재, 펄프, 오수, 쓰레기, 셀룰로오스 도시 폐기물(cellulosic urban waste), 플루-가스(flu-gas), 합성-가스, 바이오매스 가수분해물, 및 이산화탄소로 구성된 그룹으로부터 선택되는 지방산 유도체 생성 방법.
제 1 항에 있어서,
상기 탄소원은 글루코오스, 프럭토오스, 만노오스, 갈락토오스, 자일로오스, 아라비노오스, 프럭토-올리고당, 갈락토-올리고당, 녹말, 셀룰로오스, 펙틴, 자일란, 수크로오스, 말토오스, 셀로비오스, 투라노오스(turanose), 헤미셀룰로오스(hemicellulose), 메틸 셀룰로오스, 소듐 카르복시메틸 셀룰로오스, 숙시네이트, 락테이트, 아세테이트, 에탄올, 메탄올, 글리세롤, 노폐물 지방산(waste fatty acid), 및 이의 혼합물들로 구성된 그룹으로부터 선택되는 지방산 유도체 생성 방법.
제 1 항에 있어서,
상기 탄소원은 글루코오스, 글리세롤 또는 수크로오스인 지방산 유도체 생성 방법.
제 20 항의 방법에 의해 생성된 중합체 조성물에 있어서,
상기 중합체 조성물은 폴리우레탄, 폴리에스테르 폴리올, 폴리에스테르 수지, 알킬 코팅 수지, 유리섬유 수지, 겔 코팅 수지 및 폴리에스테르 열가소성 수지로 구성된 그룹으로부터 선택되는 중합체 조성물.
재생가능한 공급원료로부터의 탄소원의 존재 시 발효액에서 성장될 때 생체 내에서 ω-하이드록시 지방산 유도체를 생성하는 재조합 미생물에 있어서,
상기 미생물은:
(a) EC 1.2.1.42의 아실-ACP 리덕타아제;
(b) EC 1.1.-.-의 알코올 디하이드로게나아제; 및
(c) EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는,
폴리펩티드를 코딩하는 적어도 3 개의 핵산 서열들을 발현시키도록 조작된 경로를 포함하는 재조합 미생물.
제 39 항에 있어서,
상기 변형된 ω-하이드록실라아제는 변형된 시토크롬 P450 효소 활성을 갖고, 생체 내에서 탄화수소 사슬들의 ω-위치를 효율적으로 촉매화하는 재조합 미생물.
제 40 항에 있어서,
상기 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드인 재조합 미생물.
제 41 항에 있어서,
상기 CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질인 재조합 미생물.
제 39 항에 있어서,
상기 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체인 재조합 미생물.
제 43 항에 있어서,
상기 ω-하이드록실라아제 혼성 융합 단백질 변이체는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 갖고, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및 A796V로 구성된 그룹으로부터 선택되는 하나 이상의 돌연변이를 갖는 재조합 미생물.
제 39 항에 있어서,
상기 ω-하이드록시 지방산 유도체는 α,ω-디올인 재조합 미생물.
제 39 항 내지 제 45 항 중 어느 하나에 따른 미생물을 포함하는 세포 배양물.
ω-하이드록시 지방산 유도체를 생성하는 방법에 있어서,
(a) 발효액에 재조합 미생물을 제공하는 단계로, 상기 미생물은 EC 1.2.1.42의 아실-ACP 리덕타아제, EC 1.1.-.-의 알코올 디하이드로게나아제, 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 3 개의 핵산 서열들을 발현시키도록 조작된 경로를 포함하는 단계;
(b) 탄소원을 함유한 재생가능한 공급원료를 상기 발효액에 첨가하는 단계; 및
(c) 상기 발효액으로부터 ω-하이드록시 지방산 유도체를 분리시키는 단계를 포함하는 지방산 유도체 생성 방법.
제 47 항에 있어서,
상기 ω-하이드록시 지방산 유도체는 α,ω-디올인 지방산 유도체 생성 방법.
제 47 항 또는 제 48 항에 있어서,
상기 재생가능한 공급원료는 탄소계인 지방산 유도체 생성 방법.
제 49 항에 있어서,
상기 탄소계 재생가능한 공급원료는 옥수수, 사탕수수, 스위치그래스, 목초, 짚, 목재, 오수, 쓰레기, 셀룰로오스 도시 폐기물, 플루-가스, 합성-가스, 및 이산화탄소로 구성된 그룹으로부터 선택되는 지방산 유도체 생성 방법.
제 47 항에 있어서,
상기 탄소원은 글루코오스, 프럭토오스, 만노오스, 갈락토오스, 자일로오스, 아라비노오스, 프럭토-올리고당, 갈락토-올리고당, 녹말, 셀룰로오스, 펙틴, 자일란, 수크로오스, 말토오스, 셀로비오스, 투라노오스, 헤미셀룰로오스, 메틸 셀룰로오스, 소듐 카르복시메틸 셀룰로오스, 숙시네이트, 락테이트, 아세테이트, 에탄올, 메탄올, 글리세롤, 및 이의 혼합물들로 구성된 그룹으로부터 선택되는 지방산 유도체 생성 방법.
제 47 항에 있어서,
상기 탄소원은 글루코오스, 글리세롤 또는 수크로오스인 지방산 유도체 생성 방법.