KR20110020234A

KR20110020234A - 이소프렌의 미생물에 의한 개선된 생성을 위한 이소프렌 신타아제 변이체

Info

Publication number: KR20110020234A
Application number: KR1020107026164A
Authority: KR
Inventors: 마게리트 에이 서빈; 그레고리 엠 화이티드; 안드레이 미아스니코브; 카롤린 엠 페레스; 월터 웨일러; 데릭 에이치 웰스; 리차드 알 보트; 크리스토퍼 리 라이프; 조셉 씨 맥컬리프; 제임스 캘리스
Original assignee: 다니스코 유에스 인크.; 더 굿이어 타이어 앤드 러버 캄파니
Priority date: 2008-04-23
Filing date: 2009-04-23
Publication date: 2011-03-02
Also published as: AU2009240505B2; RU2516343C2; SG165884A1; CN102171335A; RU2014108776A; EP2279251A2; US20130260432A1; US20100003716A1; WO2009132220A2; SG192545A1; RU2010147659A; US20150191712A1; WO2009132220A9; AU2009240505A1; BRPI0911667A2; CA2722440A1; WO2009132220A3; JP2014158489A; ZA201108569B; JP2011518564A

Abstract

본 발명은 개선된 촉매 활성 및/또는 용해성을 갖는 하나 이상의 이소프렌 신타아제를 포함하는 조성물 및 방법을 제공한다. 특히, 본 발명은 미생물 숙주 세포 내 이소프렌 생성 증가를 위한 변이체 식물 이소프렌 신타아제를 제공한다. 생합성적으로 생성된 본 발명의 이소프렌은 고무 및 엘라스토머 제조에서 유용하다.

Description

이소프렌의 미생물에 의한 개선된 생성을 위한 이소프렌 신타아제 변이체 {ISOPRENE SYNTHASE VARIANTS FOR IMPROVED MICROBIAL PRODUCTION OF ISOPRENE}

관련 출원에 대한 교차 인용

본 출원은 2008 년 4 월 23 일에 제출된 U.S. 가출원 시리즈 제 61/125,336 호에 대한 우선권을 주장하며, 이로써 그 전문은 본원에 참조 인용된다.

본 발명의 분야

본 발명은 개선된 촉매 활성 및/또는 용해성을 지닌 하나 이상의 이소프렌 신타아제 (synthase) 를 포함하는 조성물 및 방법을 제공한다. 특히, 본 발명은 미생물의 숙주 세포에서 증가된 이소프렌 생성을 위한 변이체 식물 이소프렌 신타아제를 제공한다. 본 발명의 생합성으로 생성된 이소프렌은 고무 및 엘라스토머 제조에서 유용하다는 점이 발견된다.

본 발명의 배경

이소프레노이드 (Isoprenoid) 는 의약품, 기능 식품, 향신료, 향료 및 고무 제품에서 유용한 것으로 여겨지는 이소프렌 중합체이다. 그러나, 천연의 이소프레노이드 공급은 생태계에 대한 염려로 제한되고 있다. 이러한 이유로, 불순물이 적고 더 균일성이 큰 이소프레노이드 조성물을 제공하기 위해서, 종종 고무 등의 이소프레노이드를 합성으로 생산한다.

이소프렌 (2-메틸-1,3-부타디엔) 은 수중에서 불용성이고 알코올에서는 가용성인 휘발성 탄화수소이다. 상업적으로 실행가능한 양의 이소프렌을 석유 C5 크래킹 분획분으로부터의 직접적 단리, 또는 C5 이소알칸 또는 이소알켄의 탈수로 수득할 수 있다 (Weissermel 및 Arpe, Industrial Organic Chemistry, 4^th ed., Wiley-VCH, pp. 117-122, 2003). C5 골격은 또한 더 작은 하부단위로부터 합성될 수도 있다. 그러나 비재생성 자원과는 관계 없는 이소프렌의 상업적으로 실행가능한 생성 방법을 갖는 것이 바람직할 것이다.

이소프렌의 생합성에 의한 생성은 두 가지 별개의 대사 경로에 의해 발생한다 (Julsing 등., Appl Microbiol Biotechnol, 75:1377-1384, 2007). 진핵생물 및 원시생물에서, 이소프렌은 메발로네이트 (MVA) 경로를 통해 형성되는 한편 일부의 유박테리아 및 더 고등한 식물에서는 메틸에리트리톨 포스페이트 (MEP) 경로를 통해 이소프렌을 생성한다. 식물에서의 이소프렌 배출은 빛과 온도에 의존적이어서, 잎 발생과 연계되어 증가한다. 이소프렌-생성 효소인, 이소프렌 신타아제는 사시나무 (Aspen) 에서 동정되었고 (Silver 및 Fall, Plant Physiol, 97:1588-1591, 1991; 및 Silver 및 Fall, J Biol Chem, 270:13010-13016, 1995), 전체 잎에서부터 이소프렌의 생체 내 생성을 담당하고 있다고 여겨진다. 이소프렌의 박테리아 생성도 또한 기술되어 있는데 (Kuzma 등., Curr Microbiol, 30:97-103, 1995; 및 Wilkins, Chemosphere, 32:1427-1434, 1996), 그 생성량은 배양 배지의 영양분 및 박테리아 성장 단계에 따라 다양하다 (U.S. 특허 제. 5,849,970 호, Fall 등.; 및 Wagner 등., J Bacteriol, 181:4700-4703, 1999, 이 두 문헌은 본원에서 그 전문이 참조 인용되고 있음). 그러나, 선행 기술의 박테리아 시스템을 통해 수득가능한 이소프렌의 수준은 상업적으로 이용하기에는 불충분하다.

따라서, 당 기술은 이소프레노이드 제조의 공급 원료를 제공하는, 유효한 대규모의 박테리아에 의한 이소프렌 생성 방법이 요구된다.

본원에서 언급되는 모든 특허, 특허 출원, 논문 및 공보는 본원에서 명백하게 참조 인용되고 있다.

본 발명의 개요

본 발명은 개선된 촉매 활성 및/또는 용해성을 지닌 하나 이상의 이소프렌 신타아제 효소를 포함하는 조성물 및 방법을 제공한다. 특히, 본 발명은 미생물 숙주 세포에서 증가된 이소프렌 생성을 위한 변이체 식물 이소프렌 신타아제를 제공한다. 생합성으로 생성된 본 발명의 이소프렌은 고무 및 엘라스토머 제조에서 유용하다.

구체적으로, 본 발명은 단리된 이소프렌 신타아제 변이체를 제공하는데, 이때 상기 변이체는, SEQ ID NO: 2 에서 제시된 아미노산 서열을 포함하는 쿠주 (kudzu; 칡) 이소프렌 신타아제의 하나 이상의 잔기 (1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10) 에 상응하는 위치에서 치환을 포함한다. 일부 구현예에서, 이소프렌 신타아제 변이체는 쿠주 (Pueraria sp.) 이소프렌 신타아제 변이체 또는 포플러 (poplar) (Populus sp.) 이소프렌 신타아제 변이체이다. 일부 구현예에서, 하나 이상의 잔기는 하기로 이루어진 군으로부터 선택되나, 이로 제한되지는 않는다: L26, E30, F31, Q33, L35, E36, N37, L39, K40, V41, K43, L44, R61, V62, D63, Q65, K87, E94, N95, L99, D100, N105, K137, E138, G143, E144, N182, L184, K185, G187, N189, T190, P225, H226, K247, T257, E258, M259, D266, N334, D353, S357, I358I, E361, N389, I392, I393, K398, E401, C421, Q423, Q424, E425, D426, H430, L432, R433, S434, D437, R443, L462, E463, H476, N478, D479, Q485, D508, P513, A515, Q532, Y533, L537, G538, R539, Y542, A543, 및 P557. 일부 구현예에서, 하나 이상의 잔기는 하기로 이루어진 군으로부터 선택되나, 이로 제한되지는 않는다: P24, N25, Y309, D310, L377, F381, E384, Y399, N402, A403, S406, S407, G409, A411, L413, F449, A456, T457, S458, A459, A460, E461, L462, E463, R464, G465, E466, T467, T468, N469, M523, S527, 및 Y531. 일부 구현예에서, 하나 이상의 잔기는 하기로 이루어진 군으로부터 선택되나, 이로 제한되지는 않는다: A20, N21, Y22, Q23, R271, W278, F299, V302, 및 S408. 본 발명은 또한 SEQ ID NO: 2 에 제시된 아미노산 서열을 갖는 쿠주 이소프렌 신타아제에서 A20G 치환을 갖는 단리된 이소프렌 신타아제 변이체를 제공한다. 이들 구현예의 서브세트에서, 변이체는 2 개 이상의 치환 (2, 3, 4, 5, 6, 7, 8, 9 또는 10) 을 포함하며, 이때 상기 치환 중 하나는 SEQ ID NO: 2 에서 제시된 아미노산 서열을 갖는 쿠주 이소프렌 신타아제 내 A20G 치환이다. 본 발명은 또한 SEQ ID NO: 2 에 제시된 아미노산 서열을 갖는 쿠주 이소프렌 신타아제에서 S408D 치환을 갖는 단리된 이소프렌 신타아제 변이체를 제공한다. 이들 구현예의 서브세트에서, 변이체는 2 개 이상 (2, 3, 4, 5, 6, 7, 8, 9 또는 10) 의 치환을 포함하며, 이때 상기 치환의 하나는 SEQ ID NO: 2 에 제시된 아미노산 서열을 갖는 쿠주 이소프렌 신타아제 내 S408D 치환이다. 일부 바람직한 구현예에서, 이소프렌 신타아제 변이체는 야생형 이소프렌 신타아제와 비교시 하나 이상의 개선된 특성을 갖는다. 일부의 특히 바람직한 구현예에서, 하나 이상의 개선된 특성은 특이 활성 (디메틸알릴 디포스페이트로부터의 이소프렌 생성), 및 용해성으로 이루어진 군으로부터 선택되나, 이로 제한되지는 않는다.

게다가, 본 발명은 추가로 이소프렌 신타아제 변이체를 인코딩하는 (encoding) 폴리뉴클레오티드 서열을 제공한다. 또한, 프로모터와 작동가능하게 조합된 이소프렌 신타아제 변이체를 인코딩하는 폴리뉴클레오티드 서열을 포함하는 발현 벡터도 제공된다. 추가 구현예에서, 본 발명은 발현 벡터를 포함하는 숙주 세포를 제공한다. 또한, 숙주 세포의 분해물 (lysate) 이 제공되는데, 이때 상기 분해물은 추가로 리소자임을 포함한다. 일부 구현예에서, 분해물은 중성의 pH (6.5 내지 7.5) 이며, 기타 구현예에서는 분해물은 염기성 pH (7.5 초과 및 9.5 미만) 이다. 본 발명은 또한 하기를 포함하는 이소프렌 생성 방법을 제공한다: (a) 발현 벡터를 포함하는 숙주 세포를 제공함; 및 (b) 이소프렌 생성에 적합한 조건 하에서 숙주 세포를 배양함. 일부 구현예에서, 상기 방법은 추가로 (c) 상기 이소프렌을 회수함을 포함한다. 또한 추가의 구현예에서, 상기 방법은 추가로 (d) 상기 이소프렌을 중합화함을 포함한다. 본 발명은 나아가 하기를 포함하는 이소프렌 신타아제 활성의 검출 방법을 제공한다: (a) 이소프렌 신타아제 변이체 제공에 적합한 조건 하에서 발현 벡터를 포함하는 숙주 세포를 배양함; (b) 리소자임을 포함하는 분해 버퍼로 숙주 세포를 분해하여 세포 분해물을 생성함; 및 (c) 디메틸알릴 디포스페이트 (DMAPP)로부터 이소프렌 생성을 측정함으로써 상기 세포 분해물 내 이소프렌 신타아제 활성을 검출함. 일부 구현예에서, 숙주는 그람-양성 박테리아 세포, 그람-음성 박테리아 세포, 사상 진균 세포, 및 효모 세포로 이루어진 군으로부터 선택되나, 이로 제한되지는 않는다. 일부 바람직한 구현예에서, 숙주는 하기로 이루어진 군으로부터 선택되나, 이로 제한되지는 않는다: 에스케리키아 종 ( Escherichia sp .) (E. coli ; 대장균), 판테오아 종 (Panteoa sp .) (P. citrea (P. 시트레아 )), 바실러스 종 (Bacillus sp .) (B. subtilis; B. 서브틸리스 ), 야로위아 종 ( Yarrowia sp .) (Y. lipolytica ; Y. 리포리 티카), 및 트리코데르마 ( Trichoderma ) (T. reesei (T. 리세이 )). 일부 구현예에서, 숙주 세포는 글루코오스, 글리세롤, 글리세린, 디히드록시아세톤, 효모 추출물, 바이오매스 (biomass), 당질, 수크로오스, 및 오일로 이루어진 군으로부터 선택되나, 이로 제한되지 않는 탄소원을 포함하는 배지에서 배양된다.

더욱이, 본 발명은 하기를 포함하는 다수의 샘플 (고-처리량 스크리닝) 에서 이소프렌의 검출 방법을 제공한다: (a) i) 각각 이소프렌 신타아제를 포함하는 다수의 샘플; (ii) 다수의 웰을 포함하는 유리 플레이트; 및 iii) 유리 플레이트용 밀봉제 (seal) 를 제공함; (b) 유리 플레이트의 다수의 웰에 상기 다수의 샘플을 넣음; (c) 유리 플레이트를 밀봉제로 밀봉하여, 다수의 웰 각각 내 샘플과 연관있는 상부 공간을 갖는 밀봉된 유리 플레이트를 만듦; (d) 이소프렌 신타아제가 활성인 조건 하에서 유리 플레이트를 인큐베이션함; 및 (e) 상부공간 내 이소프렌을 검출함. 일부 구현예에서, 이소프렌은 기체 크로마토그래피-질량 분석 (GC-MS) 로 검출한다. 일부 구현예에서, 다수의 샘플은 프로모터와 작동가능하게 조합되어 있는 이소프렌 신타아제 변이체를 인코딩하는 폴리뉴클레오티드 서열을 포함하는 발현 벡터를 포함하는 숙주 세포를 포함한다. 일부 구현예에서, 다수의 샘플은 숙주 세포의 분해물, 리소자임, 및 디메틸알릴 디포스페이트 (DMAPP) 를 포함한다. 일부 바람직한 구현예에서, 유리 플레이트는 딥(deep)웰 유리 블록이다. 일부 바람직한 구현예에서, 다수의 웰은 24 개 이상의 웰 (바람직하게는 48 개 이상의 웰, 더욱 바람직하게는 96 개 이상의 웰, 보다 더욱 바람직하게는 192 개 이상의 웰, 및 가장 바람직하게는 384 개 이상의 웰) 을 포함한다. 특히 바람직한 구현예에서, 다수의 웰 각각은 부피가 2 ml 이하 (바람직하게는 2 ml ~ 0.2 ml) 이다.

아울러, 본 발명은 프로모터와 작동가능하게 조합된 이소프렌 신타아제 변이체를 인코딩하는 이종 폴리뉴클레오티드 서열을 포함하는 숙주 세포를 제공하는데, 이때 상기 이소프렌 신타아제 변이체는, SEQ ID NO: 2 에 제시된 아미노산 서열을 포함하는 쿠주 이소프렌 신타아제의 하나 이상의 잔기 (1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10) 에 상응하는 위치에서 치환을 포함한다. 일부 구현예에서, 상기 하나 이상의 잔기는 하기로 이루어진 군으로부터 선택되나 이로 제한되지는 않는다: L26, E30, F31, Q33, L35, E36, N37, L39, K40, V41, K43, L44, R61, V62, D63, Q65, K87, E94, N95, L99, D100, N105, K137, E138, G143, E144, N182, L184, K185, G187, N189, T190, P225, H226, K247, T257, E258, M259, D266, N334, D353, S357, I358I, E361, N389, I392, I393, K398, E401, C421, Q423, Q424, E425, D426, H430, L432, R433, S434, D437, R443, L462, E463, H476, N478, D479, Q485, D508, P513, A515, Q532, Y533, L537, G538, R539, Y542, A543, 및 P557. 일부 구현예에서, 상기 하나 이상의 잔기는 하기로 이루어진 군으로부터 선택되나 이로 제한되지는 않는다: P24, N25, Y309, D310, L377, F381, E384, Y399, N402, A403, S406, S407, G409, A411, L413, F449, A456, T457, S458, A459, A460, E461, L462, E463, R464, G465, E466, T467, T468, N469, M523, S527, 및 Y531. 일부 구현예에서, 상기 하나 이상의 잔기는 하기로 이루어진 군으로부터 선택되나 이로 제한되지는 않는다: A20, N21, Y22, Q23, R271, W278, F299, V302, 및 S408. 본 발명은 또한 SEQ ID NO: 2 에 제시된 아미노산 서열을 갖는 쿠주 이소프렌 신타아제 내 A20G 치환 및/또는 S408D 치환을 가진 단리된 이소프렌 신타아제 변이체를 제공한다. 일부 바람직한 구현예에서, 이소프렌 신타아제 변이체는 야생형 이소프렌 신타아제와 비교시 하나 이상의 개선된 특성을 지닌다. 일부의 특히 바람직한 구현예에서, 상기 하나 이상의 개선된 특성은 특이 활성 (디메틸알릴 디포스페이트로부터의 이소프렌 생성), 및 용해성으로 이루어진 군으로부터 선택되나 이로 제한되지는 않는다. 일부 바람직한 구현예에서, 폴리뉴클레오티드 서열은 플라스미드 내에 함유된다. 기타 바람직한 구현예에서, 폴리뉴클레오티드 서열은 숙주 세포의 염색체에 혼입된다. 일부 구현예에서, 숙주는 그람-양성 박테리아 세포, 그람-음성 박테리아 세포, 사상 진균 세포, 및 효모 세포로 이루어진 군으로부터 선택되나 이로 제한되지는 않는다. 일부 바람직한 구현예에서, 숙주는 에스케리키아 종 (E. coli ; 대장균), 판테오아 종 (P. 시트레아 ), 바실러스 종 (B. 서브틸리스), 야로위아 종 (Y. 리포리티카 ), 및 트리코데르마 (T. 리세이 ) 으로부터 선택되나 이로 제한되지는 않는다. 일부 구현예에서, 숙주 세포는 글루코오스, 글리세롤, 글리세린, 디히드록시아세톤, 효모 추출물, 바이오매스, 당질, 수크로오스, 및 오일로 이루어진 군으로부터 선택되나 이로 제한되지 않는 탄소원을 포함하는 배지에서 배양된다. 일부 구현예에서, 숙주 세포는 종종 천연형 DXP 경로와 조합되는, IDI 폴리펩티드를 인코딩하는 이종 또는 천연형 핵산 및/또는 DXS 폴리펩티드를 인코딩하는 이종 또는 천연형 핵산 (예를 들어, 천연형 DXP 경로와 더불어 E. coli 내에서의 dxs 및 idi 의 발현) 을 추가로 포함한다. 다르게는, 전체 DXP 경로 (도 15) 는 발현을 제어하는 단일의 프로모터 또는 개별 유전자들 중 하나 이상을 제어하는 여러 강도의 프로모터 (예를 들어 GI 1.20, GI 1.5, 또는 GI 1.6) 와 염색체 상에서 오페론으로서 혼입될 수 있거나, 또는 플라스미드 상에서 발현될 수 있다. 일부 구현예에서, 숙주 세포는 IDI 폴리펩티드 및 DXS 폴리펩티드를 인코딩하는 하나 이상의 핵산을 추가로 포함하고, 일부 바람직한 구현예에서, 하나의 벡터는 이소프렌 신타아제 변이체, IDI 폴리펩티드, 및 DXS 폴리펩티드를 인코딩한다. 일부 구현예에서, 숙주 세포는 MVA 경로 폴리펩티드 (예, 사카로마이세스 세레비시아 (Saccharomyces cerevisia) 또는 엔테로코커스 패칼리스 (Enterococcus faecalis) 로부터의 MVA 경로 폴리펩티드) 를 인코딩하는 이종 핵산을 추가로 포함한다. 일부 구현예에서, 숙주 세포는 MVA 경로 폴리펩티드 및 DXS 폴리펩티드를 인코딩하는 하나 이상의 핵산을 추가로 포함하고, 일부 바람직한 구현예에서, 하나의 벡터가 이소프렌 신타아제 변이체, MVA 경로 폴리펩티드, 및 DXS 폴리펩티드를 인코딩한다. 일부 바람직한 구현예에서, 숙주 세포는 DXS 폴리펩티드, IDI 폴리펩티드, 또는 DXP 경로 폴리펩티드의 나머지 중 하나 이상, 및 MVA 경로 폴리펩티드를 인코딩하는 하나 이상의 핵산을 추가로 포함한다. 일부 구현예에서, 벡터는 선별가능 마커 (예, 항생제 내성 핵산) 을 추가로 포함한다. 또한, 하기를 포함하는 이소프렌 생성 방법이 제공된다: (a) 이소프렌의 생성에 적합한 배양 조건 하에서, 숙주 세포를 배양함; 및 (b) 상기 이소프렌을 생성함. 일부 구현예에서, 상기 방법은 추가로 (c) 상기 이소프렌을 회수함을 포함한다. 일부 바람직한 구현예에서, 상기 방법은 추가로 (d) 이소프렌을 중합화함을 포함한다. 본 발명은 또한 하기를 포함하는 이소프렌 신타아제의 생성 방법을 제공한다: (a) (i) 숙주 세포; 및 (ii) 프로모터와 작동가능하게 조합된 이소프렌 신타아제 변이체를 인코딩하는 핵산 (이때, 상기 이소프렌 신타아제 변이체는 SEQ ID NO: 2 에 제시된 아미노산 서열을 포함하는 쿠주 이소프렌 신타아제의 하나 이상의 잔기 (1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10) 에 상응하는 위치에서 치환을 포함함) 를 제공함;

(b) 상기 숙주 세포를 상기 핵산과 접촉시켜 형질전환된 숙주 세포를 생성함; 및 (c) 형질전환된 숙주 세포를 이소프렌 신타아제의 생성에 적합한 배양 조건 하에서 배양함.

또 다른 측면에서, 본 발명은 단리된 포플러 이소프렌 신타아제 변이체를 제공한다. 한 구현예에서, 상기 변이체는 이소프렌 신타아제의 N-말단부에 절단 (truncation) 을 포함한다. 또 다른 구현예에서, 이소프렌 신타아제 변이체는 전장 (Full length) 이소프렌 신타아제와 비교시 특이 활성이 증가된다. 또 다른 구현예에서, 상기 이소프렌 신타아제는 SEQ ID NO:120 의 P. alba 이소프렌 신타아제이다. 또 다른 구현예에서, 상기 변이체는 하기로 이루어진 군으로부터 선택된다: MEA 변이체 (SEQ ID NO:122), MSV 변이체 (SEQ ID NO:124), MVS 변이체 (SEQ ID NO:126), MTE 변이체 (SEQ ID NO:128), MNV 변이체 (SEQ ID NO:130). 또 다른 구현예에서, 상기 변이체는 MEA 변이체이다 (SEQ ID NO:122). 또 다른 구현예에서, 상기 변이체는 하기로 이루어진 군으로부터 선택된다: TRC (-3) 변이체 (SEQ ID NO:136), TRC (-4) 변이체 (SEQ ID NO:138), TRC (-5) 변이체 (SEQ ID NO:140), TRC (-6) 변이체 (SEQ ID NO:142) 및 TRC (-7) 변이체 (SEQ ID NO:144). 또 다른 구현예에서, 상기 변이체는 P. tremuloides 이소프렌 신타아제의 MET 변이체이다 (SEQ ID NO:146). 또 다른 구현예에서, 상기 변이체는 P. trichocharpa 이소프렌 신타아제의 MET 변이체이다 (SEQ ID NO:148).

또 다른 측면에서, 본 발명은 단리된 포플러 이소프렌 신타아제 변이체를 제공하는데, 이때 상기 변이체는 야생형 이소프렌 신타아제의 하나 이상의 아미노산 잔기에서 치환을 포함하며; 및 이때 상기 이소프렌 신타아제 변이체는 야생형 이소프렌 신타아제와 비교시 증가된 이소프렌 신타아제 활성을 갖는다. 한 구현예에서, 증가된 이소프렌 신타아제 활성은, 모체 이소프렌 신타아제를 포함하는 숙주 세포와 비교시 디메틸알릴 피로포스페이트 (DMAPP)의 존재하에서 더 신속한 속도로 성장하는 이소프렌 변이체를 포함하는 숙주 세포로 표시된다. 또 다른 구현예에서, 상기 이소프렌 신타아제는 SEQ ID NO:120 의 P. alba 이소프렌 신타아제이다. 또 다른 구현예에서, 상기 변이체는 하기로 이루어진 군으로부터 선택되는 하나 이상의 아미노산 치환을 포함한다: V10M, F12S, T15A, E18G, V58I, V58F, L70Q, L70V, L70T, T71P, V79L, E89D, G94A, S119F, F120L, G127R, E175V, T212I, S257A, R262G, A266G, F280L, N297K, F305L, L319M, E323K, A328T, D342E, A359T, K366N, E368D, L374M, S396T, V418S, K438N, H440R, T442I, T442A, I449V, A469S, K500R, K505Q, G507S, S509N, F511Y, 및 N532K. 또 다른 구현예에서, 하나 이상의 아미노산 치환은 L70R 치환이다. 또 다른 구현예에서, 상기 변이체는 하기로 이루어진 군으로부터 선택되는 하나 이상의 아미노산 치환을 포함한다: G127R/F511Y, L70Q/G94A/R262G/F305L, F12S/ T15A/E18G/N297K, S396T/T442I, V10M/E323K, F120L/A266G, K438N/K500R, V79L/S509N, E175V/S257A/E368D/A469S, T71P/L374M, F280L/H440R, E89D/H440R, V58F/A328T/N532K, S119F/D342E/I449V, 및 K366N/G507S.

또 다른 측면에서, 본 발명은 SEQ ID NO:120 의 아미노산 잔기를 포함하는 폴리펩티드의 결정질 형태를 제공한다 (도 19).

또 다른 측면에서, 본 발명은 하기를 포함하는 이소프렌의 생성 방법을 제공한다: (a) 이소프렌 신타아제 변이체를 인코딩하는 폴리뉴클레오티드 서열을 포함하는 발현 벡터를 포함하는 숙주 세포를 제공함; 및 (b) 상기 숙주 세포를 이소프렌 생성에 적합한 조건 하에서 배양함. 한 구현예에서, 상기 방법은 (c) 상기 이소프렌을 회수함을 추가로 포함한다. 또 다른 구현예에서, 상기 방법은 (d) 상기 이소프렌을 중합화함을 추가로 포함한다.

또 다른 측면에서, 본 발명은 하기를 포함하는 이소프렌 신타아제 활성의 검출 방법을 제공한다: (a) 이소프렌 신타아제 변이체를 생성하기에 적합한 조건 하에서 발현 벡터를 포함하는 숙주 세포를 배양함; (b) 상기 숙주 세포를, 리소자임을 포함하는 분해 버퍼로 분해하여, 세포 분해물을 생성함; 및 (c) 디메틸알릴 디포스페이트 (DMAPP) 로부터 이소프렌 생성을 측정하여, 상기 세포 분해물 내 이소프렌 신타아제 활성을 검출함. 한 구현예에서, 숙주 세포는 그람-양성 박테리아 세포, 그람-음성 박테리아 세포, 사상 진균 세포, 및 효모 세포로 이루어진 군으로부터 선택된다. 또 다른 구현예에서, 숙주 세포는 에스케리키아 종 (E. coli; 대장균), 판테오아 종 (P. 시트레아 ), 바실러스 종 (B. 서브틸리스 ), 야로위 아 종 (Y. 리포리티카 ), 및 트리코데르마 (T. 리세이 ) 로 이루어진 군으로부터 선택된다. 또 다른 구현예에서, 상기 숙주 세포는 글루코오스, 글리세롤, 글리세린, 디히드록시아세톤, 효모 추출물, 바이오매스, 당질, 수크로오스, 및 오일로 이루어진 군으로부터 선택되는 탄소원을 포함하는 배지에서 배양된다.

또 다른 측면에서, 본 발명은 프로모터와 작동가능하게 조합된 이소프렌 신타아제 변이체를 인코딩하는 이종 폴리뉴클레오티드 서열을 포함하는 숙주 세포를 제공하는데, 이때 상기 이소프렌 신타아제 변이체는 포플러 이소프렌 신타아제의 하나 이상의 잔기 (1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10) 에 상응하는 위치에서 치환을 포함한다. 한 구현예에서, 이소프렌 신타아제는 SEQ ID NO:120 의 P. alba 이소프렌 신타아제이다. 또 다른 구현예에서, 상기 변이체는 하기로 이루어진 군으로부터 선택된다: MEA 변이체 (SEQ ID NO:122), MSV 변이체 (SEQ ID NO:124), MVS 변이체 (SEQ ID NO:126), MTE 변이체 (SEQ ID NO:128), MNV 변이체 (SEQ ID NO:130). 또 다른 구현예에서, 상기 변이체는 하기로 이루어진 군으로부터 선택된다: TRC (-3) 변이체 (SEQ ID NO:136), TRC (-4) 변이체 (SEQ ID NO:138), TRC (-5) 변이체 (SEQ ID NO:140), TRC (-6) 변이체 (SEQ ID NO:142) 및 TRC (-7) 변이체 (SEQ ID NO:144). 또 다른 구현예에서, 상기 변이체는 P. tremuloides 이소프렌 신타아제의 MET 변이체 (SEQ ID NO:146) 이다. 또 다른 구현예에서, 상기 변이체는 P. trichocharpa 이소프렌 신타아제의 MET 변이체이다 (SEQ ID NO:148). 또 다른 구현예에서, 상기 변이체는 하기로 이루어진 군으로부터 선택되는 하나 이상의 아미노산 치환을 포함한다: V10M, F12S, T15A, E18G, V58I, V58F, L70Q, L70V, L70T, T71P, V79L, E89D, G94A, S119F, F120L, G127R, E175V, T212I, S257A, R262G, A266G, F280L, N297K, F305L, L319M, E323K, A328T, D342E, A359T, K366N, E368D, L374M, S396T, V418S, K438N, H440R, T442I, T442A, I449V, A469S, K500R, K505Q, G507S, S509N, F511Y, 및 N532K. 또 다른 구현예에서, 하나 이상의 아미노산 치환은 L70R 치환이다. 또 다른 구현예에서, 상기 변이체는 하기로 이루어진 군으로부터 선택되는 하나 이상의 아미노산 치환을 포함한다: G127R/F511Y, L70Q/G94A/R262G/F305L, F12S/ T15A/E18G/N297K, S396T/T442I, V10M/E323K, F120L/A266G, K438N/K500R, V79L/S509N, E175V/S257A/E368D/A469S, T71P/L374M, F280L/H440R, E89D/H440R, V58F/A328T/N532K, S119F/D342E/I449V, 및 K366N/G507S. 또 다른 구현예에서, 상기 폴리뉴클레오티드 서열은 플라스미드 내에 함유된다. 또 다른 구현예에서, 상기 폴리뉴클레오티드 서열은 숙주 세포의 염색체에 혼입된다.

또 다른 구현예에서, 상기 숙주 세포는 그람-양성 박테리아 세포, 그람-음성 박테리아 세포, 사상 진균 세포, 및 효모 세포로 이루어진 군으로부터 선택된다. 또 다른 구현예에서, 상기 숙주는 에스케리키아 종 (E. coli ; 대장균), 판테오아 종 (P. 시트레아 ), 바실러스 종 (B. 서브틸리스 ), 야로위아 종 (Y. 리포리티카 ), 및 트리코데르마 (T. 리세이 ) 로 이루어진 군으로부터 선택된다. 또 다른 구현예에서, 숙주 세포는 글루코오스, 글리세롤, 글리세린, 디히드록시아세톤, 효모 추출물, 바이오매스, 당질, 수크로오스, 및 오일로 이루어진 군으로부터 선택되는 탄소원을 포함하는 배지에서 배양된다. 또 다른 구현예에서, 상기 숙주 세포는 추가로 천연형 DXP 경로와 임의 조합되는, IDI 폴리펩티드를 인코딩하는 이종 또는 천연형 핵산 및/또는 DXS 폴리펩티드를 인코딩하는 이종 또는 천연형 핵산을 포함한다. 또 다른 구현예에서, 숙주 세포는 추가로 IDI 폴리펩티드 및 DXS 폴리펩티드를 인코딩하는 하나 이상의 핵산을 포함한다. 또 다른 구현예에서, 숙주 세포는 이소프렌 신타아제 변이체, IDI 폴리펩티드, 및 DXS 폴리펩티드를 인코딩하는 하나의 벡터를 포함한다. 또 다른 구현예에서, 숙주 세포는 사카로마이세스 세 레비시아 또는 엔테로코커스 패칼리스로부터의 MVA 경로 폴리펩티드로 이루어진 군으로부터 선택되는 MVA 경로 폴리펩티드를 인코딩하는 이종 핵산을 추가로 포함한다. 또 다른 구현예에서, 숙주 세포는 MVA 경로 폴리펩티드 및 DXS 폴리펩티드를 인코딩하는 하나 이상의 핵산을 추가로 포함하고, 하나의 벡터는 이소프렌 신타아제 변이체, MVA 경로 폴리펩티드, 및 DXS 폴리펩티드를 인코딩한다. 또 다른 구현예에서, 숙주 세포는 DXS 폴리펩티드, IDI 폴리펩티드, 또는 DXP 경로 폴리펩티드의 나머지 중 하나 이상, 및 MVA 경로 폴리펩티드를 인코딩하는 하나 이상의 핵산을 추가로 포함한다.

또 다른 측면에서, 본 발명은 하기를 포함하는 이소프렌의 생성 방법을 제공한다: (a) 프로모터와 작동가능하게 조합된 이소프렌 신타아제 변이체를 인코딩하는 이종 폴리뉴클레오티드 서열을 포함하는 숙주 세포를 배양하는 것으로서, 이때 상기 이소프렌 신타아제 변이체는 이소프렌 생성에 적합한 배양 조건 하에서 포플러 이소프렌 신타아제의 하나 이상의 잔기 (1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10) 에 상응하는 위치에서 치환을 포함함; 및 (b) 상기 이소프렌을 생성함. 한 구현예에서, 상기 방법은 추가로 (c) 이소프렌을 회수함을 포함한다. 또 다른 구현예에서, 상기 방법은 추가로 (d) 이소프렌을 중합화함을 포함한다.

또 다른 측면에서, 본 발명은 하기를 포함하는 이소프렌 신타아제의 생성 방법을 제공한다: (a) (i) 숙주 세포; 및 (ii) 프로모터와 작동가능하게 조합된 이소프렌 신타아제 변이체를 인코딩하는 핵산 (이때, 이소프렌 신타아제 변이체는 SEQ ID NO:120 의 P. alba 이소프렌 신타아제의 하나 이상의 잔기 (1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10) 에 상응하는 위치에서 치환을 포함함) 을 제공함; (b) 상기 숙주 세포를 상기 핵산과 접촉하여 형질전환된 숙주 세포를 생성함; 및 (c) 이소프렌 신타아제의 생성에 적합한 배양 조건 하에서 상기 형질전환된 숙주 세포를 배양함.

도 1 은 에스케리키아 콜리 (대장균) 에서 발현을 위해 코돈-최적화된, 쿠주 (Pueraria montana) 이소프렌 신타아제의 코딩 서열 (SEQ ID NO:1)을 제공한다.
도 2 는 쿠주 이소프렌 신타아제의 아미노산 서열 (SEQ ID NO:2) 을 제공한다.
도 3 은 에스케리키아 콜리에서 발현을 위해 코돈-최적화된 포플러 (Populus alba x tremula) 이소프렌 신타아제의 코딩 서열 (SEQ ID NO:6) 을 제공한다.
도 4 는 포플러 (Populus alba x tremula) 이소프렌 신타아제의 아미노산 서열 (SEQ ID NO:7) 을 제공한다.
도 5 는 공간을 채운 분자로서 하이라이트한 시스테인 잔기를 갖는 쿠주 이소프렌 신타아제 상동성 모델을 제공한다.
도 6 은 공간을 채운 분자로서 하이라이트한 시스테인 잔기(암회색)를 갖는 포플러 이소프렌 신타아제 상동성 모델 을제공한다. 덧붙여, 상기 도 5 의 쿠주 모델에서의 시스테인 잔기가, 포플러 모델 상에서 공간을 채우는 분자로서 겹쳐진다 (담회색).
도 7 은 실시예 5 의 쿠주 IspS 시스테인 돌연변이체의 성장 곡선을 보이는 그래프를 제공한다.
도 8 은 분해 세포로부터의 쿠주 IspS 시스테인 돌연변이체의 SDS-PAGE 분석을 나타낸다. 펠릿 (Pellet) 및 상청액 분획물을 원심분리로 제조하였다.
도 9 는 플라스미드 MCM93 (pCR2.1-Kudzu) 의 맵을 제공한다.
도 10 은 플라스미드 MCM93 의 뉴클레오티드 서열 (SEQ ID NO:22) 을 제공한다.
도 11 은 pET24D-Kudzu 의 맵을 제공한다.
도 12 는 pET24D-Kudzu 의 뉴클레오티드 서열 (SEQ ID NO:23) 을 제공한다.
도 13 은 쿠주 이소프렌 신타아제-함유 봉입체의 SDS-PAGE 분석을 나타낸다. M 레인은 분자량 마커를 포함하며, 다른 레인들은 증가한 함량의 정제된 봉입체 제제를 포함한다. 쿠주 이소프렌 신타아제는 순도가 >90% 로 추산되었다.
도 14 는 위치 Y22, A20 및 S408 에 있어서 쿠주 부위 평가 라이브러리 (SEL) 멤버의 이소프렌 신타아제 활성을 나타내는 그래프이다. 대부분의 멤버는 매우 감소된 활성을 보이나, 보존성 치환은 활성에서 덜한 감소를 보인다. 패널 A 는 독립된 야생형 샘플 (동그라미한 WT) 과 비교한 Y22 라이브러리 멤버에 대한 검정 결과를 나타낸다. 패널 B 는 야생형 샘플 (동그라미한 WT) 와 비교한 A20 라이브러리 멤버에 대한 검정 결과를 나타낸다. 패널 C 는 S408 라이브러리 멤버에 대한 검정 결과를 나타내는데, 이는 멤버 S408D 가 야생형 대조군의 평균보다 1.5 내지 2-배 더 높은 활성을 갖는다는 점을 시사한다.
도 15 는 이소프렌에 대한 MVA 및 DXP 대사 경로를 나타낸다 (문헌 [F. Bouvier 등., Progress in Lipid Res. 44: 357-429, 2005] 를 기초로 함). 하기의 설명은 상기 경로에서 각각의 폴리펩티드에 대한 대안적인 명칭과 지시된 폴리펩티드의 활성 측정을 위한 검정을 개시하는 문헌 (이들 문헌 각각은 그 전문을, 특히 MVA 및 DXP 경로에서의 폴리펩티드에 있어서 폴리펩티드 활성 검정과 관련해서 본원에서 참조 인용되고 있음) 을 포함한다. 메발로네이트 경로: AACT; 아세틸-CoA 아세틸트랜스퍼라아제, MvaE, EC 2.3.1.9. Assay: J. Bacteriol., 184: 2116-2122, 2002; HMGS; 히드록시메틸글루타릴-CoA 신타아제, MvaS, EC 2.3.3.10. Assay: J. Bacteriol., 184: 4065-4070, 2002; HMGR; 3-히드록시-3-메틸글루타릴-CoA 리덕타아제, MvaE, EC 1.1.1.34. Assay: J. Bacteriol., 184: 2116-2122, 2002; MVK; 메발로네이트 키나아제, ERG12, EC 2.7.1.36. Assay: Curr Genet 19:9-14, 1991. PMK; 포스포메발로네이트 키나아제, ERG8, EC 2.7.4.2, Assay: Mol Cell Biol., 11:620-631, 1991; DPMDC; 디포스포메발로네이트 데카르복실라아제, MVD1, EC 4.1.1.33. Assay: Biochemistry, 33:13355-13362, 1994; IDI; 이소펜테닐-디포스페이트 델타-이소머라아제, IDI1, EC 5.3.3.2. Assay: J. Biol. Chem. 264:19169-19175, 1989. DXP 경로: DXS; 1-데옥시자일룰로오즈-5-포스페이트 신타아제, dxs, EC 2.2.1.7. Assay: PNAS, 94:12857-62, 1997; DXR; 1-데옥시-D-자일룰로오즈 5-포스페이트 리덕토이소머라아제, dxr, EC 2.2.1.7. Assay: Eur. J. Biochem. 269:4446-4457, 2002; MCT; 4-디포스포시티딜-2C-메틸-D-에리트리톨 신타아제, IspD, EC 2.7.7.60. Assay: PNAS, 97: 6451-6456, 2000; CMK; 4-디포스포시티딜-2-C-메틸-D-에리트리톨 키나아제, IspE, EC 2.7.1.148. Assay: PNAS, 97:1062-1067, 2000; MCS; 2C-메틸-D-에리트리톨 2,4-시클로디포스페이트 신타아제, IspF, EC 4.6.1.12. Assay: PNAS, 96:11758-11763, 1999; HDS; 1-히드록시-2-메틸-2-(E)-부테닐 4-디포스페이트 신타아제, ispG, EC 1.17.4.3. Assay: J. Org. Chem., 70:9168 -9174, 2005; HDR; 1-히드록시-2-메틸-2-(E)-부테닐 4-디포스페이트 리덕타아제, IspH, EC 1.17.1.2. Assay: JACS, 126:12847-12855, 2004.
도 16 은 pDu27 의 맵을 제공한다.
도 17 은 pDu27 에서 6Xhis N-말단 태깅된 (tagged) P. alba IspS 의 아미노산 서열 (SEQ ID NO:118) 을 제공한다.
도 18 은 플라스미드 pDu27 의 뉴클레오티드 서열 (SEQ ID NO:119) 을 제공한다.
도 19 는 pET24a 에서 전장 P. alba IspS 의 아미노산 서열 (SEQ ID NO:120) 을 제공한다. 밑줄진 잔기는 플라스미드 pDu39 내지 pDu43 내 IspS 에서 N-말단 절단의 위치를 나타낸다.
도 20 은 플라스미드 P. alba pET24a 의 뉴클레오티드 서열 (SEQ ID NO:121) 을 제공한다.
도 21 은 정제된 IspS 가 SDS-PAGE 분석에서 저분자량 "더블릿 (doublet)" 을 나타냄을 보인다.
도 22 는 질량 분석으로 동정된 트립신분해 펩티드를 나타낸다.
도 23 은 P. alba IspS 의 N-말단 절단물을 갖는 pDu40, pDu41, pDu42 및 pDu43 의 맵을 제공한다.
도 24 은 (균주 MD09-173 에서) pET24a-P. alba MEA 비태깅된 (untagged; 태깅되지 않은) Pdu39 의 맵을 제공한다.
도 25 는 pDu39 에서 P. alba IspS 의 절단된 "MEA" 변이체의 아미노산 서열 (SEQ ID NO:122) 을 제공한다.
도 26 은 플라스미드 pDu39 의 뉴클레오티드 서열 (SEQ ID NO:123) 을 제공한다.
도 27 은 pDu41 에서 절단된 "MSV" 변이체 P. alba IspS 의 아미노산 서열 (SEQ ID NO:124) 을 제공한다.
도 28 은 플라스미드 pDu41 (pET24a-P.alba(MSV) 비태깅됨) 의 뉴클레오티드 서열 (SEQ ID NO:125) 을 제공한다.
도 29 는 pDu43 에서 절단된 "MVS" 변이체 P. alba IspS 의 아미노산 서열 (SEQ ID NO:126) 을 제공한다.
도 30 은 플라스미드 pDu43 (pET24a-P.alba(MVS) 비태깅됨) 의 뉴클레오티드 서열 (SEQ ID NO:127) 을 제공한다.
도 31 은 pDu42 에서 P. alba IspS 의 절단된 "MTE" 변이체의 아미노산 서열 (SEQ ID NO:128) 을 제공한다.
도 32 는 플라스미드 pDu42 (pET24a-P.alba(MTE) 비태깅됨) 의 뉴클레오티드 서열 (SEQ ID NO:129) 을 제공한다.
도 33 은 pDu40 에서 절단된 "MNV" P. alba IspS 의 아미노산 서열 (SEQ ID NO:130) 을 제공한다.
도 34 는 플라스미드 pDu40 (pET24a-P.alba(MNV) 비태깅됨) 의 뉴클레오티드 서열 (SEQ ID NO:131) 를 제공한다.
도 35 는 MD09-161 및 MD09-163, C-말단 TEV, 6XHis-태깅된 IspS 변이체의 맵을 제공한다.
도 36 은 MD09-163 에서, P. alba MEA(+)TEV 의 아미노산 서열 (SEQ ID NO:132) 을 제공한다.
도 37 은 플라스미드 MD09-163 (pET24a-P.alba MEA(+)TEV 의 뉴클레오티드 서열 (SEQ ID NO:133) 를 제공한다. CDS 는 밑줄긋고, TEV 프로테아제 부위는 볼드체로 표시한다.
도 38 은 MD09-161 에서 P. alba FL(+)TEV 의 아미노산 서열 (SEQ ID NO:134) 을 제공한다.
도 39 는 플라스미드 MD09-161 (pET24a-P.alba FL(+)TEV 의 뉴클레오티드 서열 (SEQ ID NO:135) 를 제공한다. CDS 는 밑줄긋고, TEV 프로테아제 부위는 볼드체로 표시한다.
도 40 은 MD09-167, 전장 (FL; full-length), MD09-165, 및 절단된 이소프렌 신타아제 (MD09-173) 의 특이 활성을 나타내는 그래프를 보인다. 반응을 100 mM Tris, 100 mM NaCl, 50 mM MgCl₂, 5 mM DMAPP, 및 전 세포 분해물의 상청액 내 2.5-4.5 ㎍ 이소프렌 신타아제를 함유하는 용액 중 15 분 동안 30 ℃ 에서 수행하였다.
도 41 은 속도/[E] 대 [DMAPP] 를 보여주는 그래프를 나타낸다. X 는 MD09-173 를 나타내고, 동그라미는 MD09-167 를 나타내고, 다이아몬드는 MD09-165 를 나타내며, 사각형은 전장 IspS 을 나타낸다.
도 42 는 [DMAPP] 에 대한 이소프렌 신타아제 활성을 보여주는 그래프를 나타낸다. X 는 MD09-173 절단된 이소프렌 신타아제로 산출된 데이타를 나타낸다. 동그라미는 MD09-167 이소프렌 신타아제로 산출된 데이타를 나타낸다. 다이아몬드는 MD09-165 이소프렌 신타아제로 산출된 데이타를 나타낸다. 사각형은 전장 이소프렌 신타아제로 산출된 데이타를 나타낸다. 각각의 데이타 세트는 독립적으로 성장하는 배양물로부터 3세트로 실시했다.
도 43 는 반응 속도에 대한 다양한 k_cat 및 K_M 및 K_i 의 효과를 나타내는 그래프를 나타낸다. 패널 A 에서, 라인 1 은 각종 DMAPP 농도에서 제도 (plotting) 된 전장 이소프렌 신타아제의 속도 방정식으로 나눈 절단된 이소프렌 신타아제 활성의 속도 방정식을 나타낸다. 라인 2 는 전장 이소프렌 신타아제의 속도 방정식을 나타내며, 이때 k_cat 는 전장 이소프렌 신타아제의 속도 방정식으로 나눈 절단된 이소프렌 신타아제의 k_cat 로 대체되어 있다. 라인 3 은 전장 이소프렌 신타아제의 속도 방정식을 나타내며, 이때 K_M 는 전장 이소프렌 신타아제의 속도 방정식으로 나눈 절단된 이소프렌 신타아제의 K_M 로 대체되어 있다. 라인 4 는 전장 이소프렌 신타아제의 속도 방정식을 나타내며, 이때 K_i 는 전장 이소프렌 신타아제의 속도 방정식으로 나눈 절단된 이소프렌 신타아제의 K_i 로 대체되어 있다. 패널 B 는 [DMAPP] 에 대해서, 절단된 이소프렌 신타아제 대 전장 이소프렌 신타아제의 속도 방정식 비율에 적합시킨 데이타를 나타내는 그래프를 나타낸다.
도 44 는 메발론산 (MVA) 에 의한 MCM531 의 성장 억제를 증명하는 그래프를 나타낸다. 세포는 상이한 농도의 MVA 를 갖는 마이크로타이터 플레이트 내 TM3 배지에서 성장시켰다. 4세트 웰의 OD₆₀₀ 를 지시된 시간에서 측정했다.
도 45 는 L70 SSL 플레이트의 DMAPP 검정을 나타내는 그래프를 보인다. 짙은 바 (bar) 는 전장 (P. alba pET24a) 또는 pDU39 (절단된) 대조군을 나타낸다. 추가 분석을 위해 웰 C3 (27), D3 (39), 또는 E3 (51) 에서의 변이체를 선택했다.
도 46 는 단백질 측정을 이용한 DMAPP 검정에 있어서 선택된 모든 변이체의 평균 특이 활성을 나타내는 그래프를 보인다. 오차 바 (error bar)는 하나의 표준 편차를 보인다. 모든 3 개의 L70R 변이체는 대조군 (WT) 보다 더 높은 활성을 보인다.
도 47 는 "MEA" 절단된 P. alba IspS 효소와 비교되는 모든 3 개의 L70R 변이체의 평균 특이 활성을 나타내는 그래프를 나타낸다. 오차 바는 하나의 표준 편차를 나타낸다.
도 48 는 플라스미드 pDu47-3, pDu47-4, 및 pDu47-5 의 맵을 제공한다.
도 49 는 플라스미드 pDu47-6, pDu47-7, 및 pDu48 의 맵을 제공한다.
도 50 은 플라스미드 pDu49, pDu50 및 pDu50-4 의 맵을 제공한다.
도 51 은 pDu47-3 내 P. alba TRC (-3) 의 아미노산 서열 (SEQ ID NO:136) 을 제공한다
도 52 는 플라스미드 pDu47-3 의 뉴클레오티드 서열 (SEQ ID NO:137) 을 제공한다.
도 53 은 pDu47-4 내 P. alba TRC (-4) 의 아미노산 서열 (SEQ ID NO:138) 을 제공한다.
도 54 는 플라스미드 pDu47-4 의 뉴클레오티드 서열 (SEQ ID NO:139) 을 제공한다.
도 55 는 pDu47-5 내 P. alba TRC (-5) 의 아미노산 서열 (SEQ ID NO:140) 을 제공한다.
도 56 은 플라스미드 pDu47-5 의 뉴클레오티드 서열 (SEQ ID NO:141) 을 제공한다.
도 57 는 pDu47-6 내 P. alba TRC (-6) 의 아미노산 서열 (SEQ ID NO:142) 을 제공한다.
도 58 은 플라스미드 pDu47-6 의 뉴클레오티드 서열 (SEQ ID NO:143) 을 제공한다.
도 59 는 pDu47-7 내 P. alba TRC (-7) 의 아미노산 서열 (SEQ ID NO:144) 을 제공한다.
도 60 은 플라스미드 pDu47-7 의 뉴클레오티드 서열 (SEQ ID NO:145) 을 제공한다.
도 61 은 pDu48 내 P. tremuloides TRC (MET) 의 아미노산 서열 (SEQ ID NO:146) 을 제공한다.
도 62 는 플라스미드 pDu48 의 뉴클레오티드 서열 (SEQ ID NO:147) 을 제공한다.
도 63 은 pDu49 내 P. trichocarpa (TRC) 의 아미노산 서열 (SEQ ID NO:148) 을 제공한다.
도 64 는 플라스미드 pDu49 의 뉴클레오티드 서열 (SEQ ID NO:149) 을 제공한다.
도 65 는 pDu50 내 Kudzu TRC (MEA) 의 아미노산 서열 (SEQ ID NO:150) 을 제공한다.
도 66 는 플라스미드 pDu50 의 뉴클레오티드 서열 (SEQ ID NO:151) 을 제공한다.
도 67 는 pDu50-4 내 KudzuTRC (-4) 의 아미노산 서열 (SEQ ID NO:152) 을 제공한다.
도 68 은 플라스미드 pDu50-4 의 뉴클레오티드 서열 (SEQ ID NO:153) 을 제공한다.
도 69 는 IspS 의 절단된 변이체의 ,DMAPP 검정으로부터의 원래 및 OD-정규화 데이타를 나타내는 그래프를 보인다.
도 70 은 IspS 절단물의 특이 활성을 나타내는 그래프를 보인다. P. alba, P. tremuloides 및 P. trichocharpa 절단물을 P. alba "전장" 변이체와 비교하여 특이 활성에 대해서 대조했다.
도 71 은 플라스미드 p9795 의 맵을 제공한다.
도 72 은 플라스미드 p9795 의 뉴클레오티드 서열 (SEQ ID NO:154) 을 제공한다.
도 73 은 플라스미드 pTrcKudzu 의 맵을 제공한다.
도 74 는 플라스미드 pTrcKudzu 의 뉴클레오티드 서열 (SEQ ID NO:155) 을 제공한다.
도 75 는 플라스미드 pMAL-C4X 의 맵을 제공한다.
도 76 은 플라스미드 pMAL-C4X 의 뉴클레오티드 서열 (SEQ ID NO:156) 을 제공한다.
도 77 는 플라스미드 pMAL-C4X-Kudzu 의 맵을 제공한다.
도 78 은 플라스미드 pMAL-C4X-Kudzu 의 뉴클레오티드 서열 (SEQ ID NO:157) 을 제공한다.
도 79 는 플라스미드 pET24 P. tremuloides pET24a 및 P. trichocharpa pET24a 의 맵을 제공한다.
도 80 은 P. trichocharpa pET24a 내 P. tremuloides IspS 의 아미노산 서열 (SEQ ID NO:158) 을 제공한다.
도 81 은 플라스미드 P. tremuloides pET24a 의 뉴클레오티드 서열 (SEQ ID NO:159) 을 제공한다.
도 82 는 P. trichocharpa pET24a 내 P. trichocharpa IspS 의 아미노산 서열 (SEQ ID NO:160) 을 제공한다.
도 83 은 플라스미드 P. trichocharpa pET24a 의 뉴클레오티드 서열 (SEQ ID NO:161) 을 제공한다.
도 84 는 플라스미드 pDu30, pDu31, 및 pDu32 의 맵을 제공한다.
도 85 는 pDu30 에서 IspS 변이체 P.albaTRC-pET200 의 아미노산 서열 (SEQ ID NO:162) 을 제공한다.
도 86 은 pDu30 의 뉴클레오티드 서열 (SEQ ID NO:163) 을 제공한다.
도 87 은 pDu31 에서 IspS 변이체 P.tremTRC-pET200 의 아미노산 서열 (SEQ ID NO:164) 을 제공한다.
도 88 은 pDu31 의 뉴클레오티드 서열 (SEQ ID NO:165) 을 제공한다.
도 89 는 pDu32 내 IspS 변이체 P.trichTRC-pET200 의 아미노산 서열 (SEQ ID NO:166) 을 제공한다.
도 90 는 pDu32 의 뉴클레오티드 서열 (SEQ ID NO:167) 을 제공한다.
도 91 은 이량체로서 나타낸 P. tremuloides IspS 의 3차원 구조를 제공한다. 사슬 A 는 암회색으로 표시하고, 사슬 B 는 중간의 회색으로 표시하고, 각 활성 부위의 단일 마그네슘 이온은 담회색으로 표시한다.
도 92 은 P. tremuloides IspS 의 구조의 단량체 단면을 제공한다. 마그네슘을 담회색 구 (sphere) 로 나타내고, N- 및 C-말단을 표시했다.
도 93 은 (A) BdpS 및 LS, (B) BdpS 및 포플러 IspS, (C) LS 및 포플러 IspS, 및 (D) TEAS 및 포플러 IspS 사이의 구조 정렬을 나타낸다. 각 경우에, 제 1 의 구조는 담회색으로, 제 2 의 구조는 암회색으로 표시한다. 2가 양이온을 구로서 나타낸다.
도 94 는 BdpS 및 LS 내 루프의 3차 구조를 나타낸다. 패널 A 는 담회색으로 Ls 의 N-말단 루프를 나타내고, 암회색으로 BdpS 의 N-말단 루프를 나타낸다. 패널 B 는 루프 I 및 루프 II 가 구조적으로 상동인 것을 보여준다.
도 95 는 BdpS 의 N-말단 루프 (암회색) 및 포플러 IspS (담 회색) 이 구조적으로 방사형임을 보여준다. 패널 A 는 N-말단 루프를 보여주고, 패널 B 는 루프 I 및 루프 II 를 나타낸다.
도 96 은 LS (담회색) 의 N-말단 루프 및 포플러 IspS (암회색) 가 구조적으로 방사형임을 보여준다. 패널 A 는 N-말단 루프를 나타내고, 패널 B 는 루프 I 및 루프 II 를 나타낸다.
도 97 은 TEAS (담회색)의 N-말단 루프 및 포플러 IspS (암회색) 이 구조적으로 방사형임을 보여준다. 패널 A 는 N-말단 루프를 나타내고, 패널 B 는 루프 I 및 루프 II 를 나타낸다. 루프 I 는 TEAS 에서 혼란스럽다.

본 발명의 일반적인 설명

본 발명은 개선된 촉매 활성 및/또는 용해성을 지닌 하나 이상의 이소프렌 신타아제 효소를 포함하는 조성물 및 방법을 제공한다. 특히, 본 발명은 미생물 숙주 세포내 증가된 이소프렌 생성을 위한 변이체 식물 이소프렌 신타아제를 제공한다. 생합성으로 생성된 본 발명의 이소프렌은 고무 및 엘라스토머 제조에서 유용하다는 점이 발견되었다.

달리 지시하지 않는 한, 본 발명의 실시는 당기술 범위에 있는, 생물학, 미생물학 및 재조합 DNA 에서 통상 사용되는 종래 기술을 포함한다. 이러한 기술은 당업자에게 공지되어 있으며, 수많은 문헌 및 참조문헌들에 기술되어 있다 (참고로, 예를 들면: Sambrook 등., "Molecular Cloning: A Laboratory Manual," Second Edition, Cold Spring Harbor, 1989; 및 Ausubel 등., "Current Protocols in Molecular Biology," 1987).

달리 본원에서 정의하지 않는 한 모든 기술적 및 과학적 용어는 본 발명이 적용되는 당기술의 당업자에게 통상 이해되는 바와 동일한 의미를 지닌다. 예를 들어, [Singleton 및 Sainsbury, Dictionary of Microbiology and Molecular Biology, 2d Ed., John Wiley and Sons, NY (1994); 및 Hale 및 Marham, The Harper Collins Dictionary of Biology, Harper Perennial, NY (1991)] 은 당업자에게 본원에서 사용되는 용어 대부분의 일반적인 사전의미를 제공한다. 본원에서 기술된 것과 유사하거나 또는 동등한 임의의 방법 및 물질들이 본 발명의 현장에서 유용하다는 점이 발견되었으나, 바람직한 방법 및 기술을 본원에서는 기술한다. 따라서, 바로 직후에 정의한 용어들은 본 명세서를 전체적으로 참조할 때 훨씬 더 충분히 기술된다.

게다가, 본원에서 제공된 제목은 본 발명의 각종 측면 또는 구현예를 제한하는 것이 아니며, 이는 총괄하여 본 명세서에 참조될 수 있다. 따라서, 바로 직후에 정의되는 용어들은 본 명세서를 전체적으로 참조할 때 훨씬 더 충분히 정의된다. 그러나, 본 발명의 이해가 용이하도록, 다수의 용어를 하기에 정의하였다.

정의

달리 본원에서 정의되지 않는 한, 본원에서 사용되는 모든 기술 및 과학적 용어는 본원이 속한 당 기술의 당업자에게 통상 이해되는 바와 동일한 의미를 지닌다. 본원에서 기술된 것과 유사하거나 또는 동등한 임의의 방법 및 물질들이 본 발명의 현장에서 유용하다는 점이 발견되었으나, 바람직한 방법 및 기술을 본원에서는 기술한다. 따라서, 바로 하기에 정의한 용어들은 본 명세서를 전체적으로 참조할 때 훨씬 더 충분히 기술된다.

본원에 사용된 바, 단수 형태에는 문맥상 명백히 다르게 제시되지 않는 경우 복수의 대응물이 포함된다. 달리 지시되지 않는 한, 핵산은 5' 에서 3' 방향으로 왼쪽에서 오른쪽으로 표기하며; 아미노산 서열은 아미노에서 카르복시 방향으로 왼쪽에서 오른쪽으로 각각 표기한다. 본 발명이 기재된 특정 방법론, 프로토콜 및 시약에 제한되지 않는 것은 자명한데, 그 이유는 이들은 당업자에 의해 사용되는 문맥에 따라 다양할 수 있기 때문이다.

본 명세서에 걸쳐서 나타낸 모든 최대 수치 한도는, 그 수치의 하한이 명백히 본원에 기재되어 있는 것처럼 모든 하한 수치를 포함하는 것으로 사용된다. 본 명세서에 걸쳐 나타낸 모든 최소 수치 한도는, 그 수치의 상한이 명백히 본원에 기재되어 있는 것처럼, 모든 상한 수치를 포함할 것이다. 본 명세서에 나타낸 모든 수치 범위는, 더 좁은 상기 수치 범위가 모두 본원에 기재되어 있는 것처럼, 더 넓은 상기 수치 범위 내에 존재하는 더 좁은 수치 범위 모두를 포함할 것이다.

인용된 모든 문헌은 관련 부분에서 본원에 참조되어 인용된다. 그러나, 임의의 문헌의 인용이 본 발명에 있어서 이것이 종래기술이라는 것을 인정하는 것으로 해석해서는 안된다.

본원에서 사용되는 바, 용어 2-메틸-1,3-부타디엔 (CAS# 78-79-5) ("이소프렌") 은 3,3-디메틸알릴 피로포스페이트 (DMAPP) 로부터의 피로포스페이트의 제거로 인한 직접 및 최종적인 휘발성 C5 탄화수소 생성물을 지칭하며, 이는 [하나의] IPP 분자(들) 의 [하나의] DMAPP 분자(들)로의 결합 또는 중합화를 포함하지는 않는다. 본원에서 사용되는 바, 용어 "이소프렌 신타아제" 및 "IspS" 는 디메틸알릴 디포스페이트 (DMAPP) 로부터 피로포스페이트의 제거를 촉매작용하여 이소프렌을 형성하는 효소를 지칭한다. 일부 바람직한 구현예에서, IspS 는 칡, 포플러 또는 북가시나무 등의 식물로부터 수득되는 효소이다. 일부 구현예에서, 용어 "IspS" 는 천연 발생하는 성숙한 효소 또는 그의 일부를 지칭한다.

관련 (및 유도체) 단백질은 "변이체 단백질" 을 포함한다. 일부 바람직한 구현예에서, 변이체 단백질은 모체 단백질 (예, SEQ ID NO:2 에 제시한 쿠주 IspS 또는 포플러 IspS) 과 소수의 아미노산 잔기에서 서로 상이하다. 상이한 아미노산 잔기의 개수는 하나 이상, 바람직하게는 1, 2, 3, 4, 5, 10, 15, 20, 30, 40, 50, 또는 이를 초과하는 아미노산 개수의 잔기이다. 일부 바람직한 구현예에서, 변이체간 상이한 아미노산의 개수는 1 내지 10 이다. 일부의 특히 바람직한 구현예에서, 관련 단백질 및 특히 변이체 단백질은 적어도 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 또는 99% 의 아미노산 서열 동일성을 포함한다. 게다가, 본원에서 사용되는 바와 같은 관련 단백질 또는 변이체 단백질은 또 다른 관련 단백질 또는 모체 단백질과 돌출 영역의 개수에서 차이나는 단백질을 지칭한다. 예를 들어, 일부 구현예에서, 변이체 단백질은 모체 단백질과 상이한 1, 2, 3, 4, 5, 또는 10 개의 상응하는 돌출 영역을 갖는다.

부위-포화 돌연변이 유발 (site-saturation mutagenesis), 스캐닝 돌연변이유발, 삽입 돌연변이유발, 랜덤 돌연변이유발, 부위-특이적 (site-directed) 돌연변이유발 및 방향적 진화 (directed-evolution) 및 각종 기타 재조합 접근법을 포함하나 이로 제한되지 않는 본 발명의 효소의 변이체 제조에 적합한 여러 방법이 당업계에 공지되어 있다

야생형 및 돌연변이 단백질의 특성화 (characterization) 를 적합한 임의의 수단 또는 "시험"으로 수행하는데, 이는 관심 특성들의 평가를 기초로 하는 것이 바람직하다. 예를 들어, 하기의 특성들 중 하나 이상을 본 발명의 일부 구현예에서 평가한다: pH 안정성; 온도 안정성; 산화 안정성; 단백질분해 안정성; 용해성; 시험관 내 DMAPP 의 이소프렌으로의 전환의 Km 및/또는 특이 활성; 숙주 유기체 (예, E.coli) 의 상황에서 생체 내 DMAPP에서 이소프렌으로의 전환의 Km 및/또는 특이 활성; 및 DXP 경로 및/또는 MVA 경로의 효소(들) 의 발현. 실제로, 시험 조건 중 하나 이상에서 안정성, 용해성, 활성 및/또는 발현 수준이 다양한 효소가 본 발명에서 유용할 수 있다는 점이 고려된다.

본원에서 사용되는 바와 같이, 용어 "유전자"란 폴리펩티드를 인코딩하는 폴리뉴클레오티드 (예, DNA 분절) 을 지칭하며, 이에는 코딩 영역 전 및 후의 영역뿐 아니라 개별 코딩 분절 (엑손) 사이의 개재 서열 (인트론) 도 포함된다.

본원에서 사용되는 바와 같이, "상동성 유전자" 는 상이한, 그러나 통상 관련있는 종들에서 유래된 한 쌍의 유전자로, 이는 서로 상응하고, 상기 유전자는 서로 동일하거나 또는 매우 유사한 유전자를 지칭한다. 상기 용어는 종분화 (즉, 새로운 종의 발달) 에 의해 분리된 유전자 (예를 들어 오르토로그 유전자 (orthologous gene)) 및 유전자 복제로 분리되어진 유전자 (예를 들어, 파라로그 유전자 (paralogous gene)) 를 포함한다.

본원에서 사용되는 바와 같이, "오르토로그" 및 "오르토로그 유전자" 는, 종분화에 의한 공통의 조상 유전자 (즉, 상동성 유전자) 로부터 진화된 상이한 종들의 유전자를 지칭한다. 전형적으로, 오르토로그는 진화 과정 동안 동일한 기능을 보유한다. 오르토로그의 동정은 새롭게 서열화 (sequencing)된 게놈에서 유전자 기능의 신뢰할만한 예견시에 유용함이 발견된다.

본원에서 사용되는 바와 같이, "파라로그" 및 "파라로그 유전자" 는, 게놈 내 복제에 의해 연관된 유전자를 지칭한다. 오르토로그가 진화 과정을 통해 동일한 기능을 보유하는 반면에, 파라로그에서는 비록 일부 기능은 종종 원 기능과 연계되어 있지만, 새로운 기능이 진화된다.

본원에서 사용되는 바와 같이, "상동성" 이란, 서열의 유사성 또는 동일성을 지칭하며, 동일성이 바람직하다. 이러한 상동성은 당업계에 공지된 표준 기술을 이용해 측정된다 (참고, 예, Smith 및 Waterman, Adv Appl Math, 2:482, 1981; Needleman 및 Wunsch, J Mol Biol, 48:443, 1970; Pearson 및 Lipman, Proc Natl Acad Sci USA, 85:2444, 1988; Wisconsin Genetics Software Package, Genetics Computer Group, Madison, WI 에서 GAP, BESTFIT, FASTA, 및 TFASTA 와 같은 프로그램; 및 Devereux 등., Nucl Acid Res, 12:387-395, 1984).

본원에서 사용되는 바와 같이, "유사 서열" 이란 유전자의 기능이 본질적으로 쿠주 이소프렌 신타아제 (IspS) 또는 포플러 IspS (IspS) 을 기준으로 하는 유전자와 동일한 것이다. 추가적으로, 유사 유전자는 쿠주 이소프렌 신타아제의 서열과 적어도 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 서열 동일성을 포함한다. 추가 구현예에서, 상기 특징들 중 하나 초과가 이 서열에 적용된다. 유사 서열은 서열 정렬의 공지된 방법으로 측정된다. 통상 사용되는 정렬 방법은 BLAST 이나, 상하에 지시된 바와 같이 서열 정렬화에서 유용한 기타 방법들도 존재한다.

유용한 알고리즘의 한 예가 PILEUP 이다. PILEUP 는 전진하는 쌍으로 있는 정렬을 이용해, 관련 서열군으로부터 다수의 서열 정렬을 만든다. 이것은 또한 정렬을 만드는데 사용되는 무리지어진 관계들을 나타내는 나무 (tree) 를 제도할 수 있다. PILEUP 는 Feng 및 Doolittle (Feng 및 Doolittle, J Mol Evol, 35:351-360, 1987) 의 전진의 정렬법의 간소화를 사용한다. 이 방법은 Higgins 및 Sharp (Higgins 및 Sharp, CABIOS 5:151-153, 1989) 에 의해 기술된 것과 유사하다. 유용한 PILEUP 파라미터는 3.00 의 디폴트 갭 가중치 (weight), 0.10 의 디폴트 갭 길이 가중치 및 가중치 말단 갭이 포함된다.

유용한 알고리즘의 또 다른 예는 [Altschul 등., (Altschul 등., J Mol Biol, 215:403-410, 1990; 및 Karlin 등., Proc Natl Acad Sci USA, 90:5873-5787, 1993)] 에 기술된 BLAST 알고리즘이다. 특히 유용한 BLAST 프로그램은 WU-BLAST-2 프로그램 (Altschul 등., Meth Enzymol, 266:460-480, 1996 참고) 이다. WU-BLAST-2 는 몇몇의 검색 파라미터를 사용하는데, 이의 대부분은 디폴트 값에 맞춰진다. 조정가능한 파라미터는 하기 값을 사용해 맞춰진다 : 오버랩 범위 (span) = 1, 오버랩 분획 (fraction) = 0.125, 단어 임계값 (word threshold) (T) = 11. HSP S 및 HSP S2 파라미터는 동적 (dynamic) 값이고, 관심있는 서열이 검색되는 특정 데이타베이스의 조성 및 특정 서열의 조성에 의존하여 프로그램 자체에 의해 성립된다. 그러나, 상기 값은 민감도를 증가시키도록 조정될 수 있다. % 아미노산 서열 동일성 값은 매칭하는 동일한 잔기의 수를 정렬된 영역 내 "더 긴" 서열의 잔기의 총 수로 나누어서 결정된다. "더 긴" 서열은 정렬된 영역에서 실제 잔기의 수가 가장 많은 것이다 (정렬 스코어를 최대화하기 위해 WU-Blast-2 에 의해 도입되는 갭은 무시함).

따라서, "핵산 서열 동일성 퍼센트 (%)" 는 출발 서열 (즉, 관심있는 서열) 의 뉴클레오티드 잔기와 동일한 후보 서열 내 뉴클레오티드 잔기의 % 로서 정의된다. 바람직한 방법은 WU-BLAST-2 의 BLASTN 모듈을 디폴트 파라미터에 맞추는데 사용되고, 오버랩 범위 및 오버랩 분획은 각각 1 및 0.125 로 맞추어진다.

본원에서 사용되는 바와 같이, 용어 "혼성화" 는 당업계에 공지된 바와 같이, 핵산 중 한 가닥이 염기쌍을 통해 상보성 가닥과 결합하는 방법을 말한다.

핵산 서열과 대조군 핵산 서열, 즉 이 2 개의 서열이 높은 엄격한 혼성화 및 세정 조건 하에 서로 특이적으로 혼성화된다면, 핵산 서열은 대조군 핵산 서열에 "선택적으로 혼성화가능한" 것으로 간주된다. 혼성화 조건은 핵산 결합 복합체 또는 프로브 (probe) 의 용융 온도 (Tm) 를 바탕으로 한다. 예를 들어, "최대의 엄격성" 은 전형적으로 약 Tm - 5℃ (프로브의 Tm 보다 5℃ 낮음) 에서 발생하고 ; "높은 엄격성" 은 Tm 보다 약 5 ~ 10℃ 낮은 온도에서 발생하고 ; "중간 정도의 엄격성" 은 프로브의 Tm 보다 약 10 ~ 20℃ 낮은 온도에서 발생하고 ; "낮은 엄격성" 은 Tm 보다 약 20 ~ 25℃ 낮은 온도에서 발생한다. 기능적으로, 혼성화 프로브를 사용해 엄격한 동일성 또는 거의 엄격한 동일성을 갖는 서열을 규명하기 위해서는 최대의 엄격한 조건이 사용될 수 있으며 ; 한편, 중간 또는 낮은 엄격한 혼성화는 폴리뉴클레오티드 서열 상동체를 규명 또는 검출하는데 사용될 수 있다.

중간 및 높은 엄격한 혼성화 조건은 당업계에 익히 공지되어 있다. 높은 엄격한 조건의 예는 50% 포름아미드, 5X SSC, 5X Denhardt 용액, 0.5% SDS 및 100 μg/ml 변성된 운반체 DNA 내, 약 42℃ 에서 혼성화하고, 이어서 2X SSC 및 0.5% SDS 내, 실온에서 2 회 세정하고, 0.1X SSC 및 0.5% SDS 내, 42℃ 에서 추가로 2 회 세정하는 것을 포함한다. 중간정도의 엄격한 조건의 예는 20% 포름아미드, 5X SSC (15O mM NaCl, 15 mM 트리나트륨 시트레이트), 50 mM 나트륨 포스페이트 (pH 7.6), 5X Denhardt 용액, 10% 덱스트란 술페이트 및 20 mg/ml 변성된 쉐어드 연어 정자 DNA (denatured sheared salmon sperm DNA) 를 포함하는 용액 내, 37℃ 에서 밤새 인큐베이션하고, 이어서 약 37 ~ 50℃, 1X SSC 에서 필터를 세정하는 것을 포함한다. 당업자는 프로브 길이 등과 같은 요소를 조절하는데 필요한 온도, 이온 세기 등을 조정하는 방법을 알고 있다.

본원에 사용되는 바와 같은, "재조합체"는 이종 핵산 서열의 도입에 의해 개질된 세포 또는 벡터, 또는 그렇게 해서 개질된 세포로부터 유래된 세포를 말하는 것을 포함한다. 따라서, 예를 들어, 재조합 세포는 세포의 본래의 (비-재조합) 형태 내에서 동일한 형태로 발견되지 않는 유전자를 발현하거나, 또는 고의적인 인간 개입의 결과로서 발현되거나 또는 전혀 발현되지 않는, 즉, 다르게 비정상적으로 발현되는 본래의 유전자를 발현한다. "재조합," "재조합화," 및 "재조합된" 핵산의 발생은 일반적으로 2 개 이상의 핵산 절편의 어셈블리로서, 이러한 어셈블리는 키메라 유전자를 산출한다.

바람직한 구현예에서, 돌연변이체 DNA 서열은 하나 이상의 코돈에서의 부위 포화 돌연변이유발로 발생된다. 또다른 바람직한 구현예에서, 부위 포화 돌연변이유발은 2 개 이상의 코돈에 대해 수행된다. 추가의 구현예에서, 돌연변이체 DNA 서열은 야생형 서열과 50% 초과, 55% 초과, 60% 초과, 65% 초과, 70% 초과, 75% 초과, 80% 초과, 85% 초과, 90% 초과, 95% 초과, 또는 98% 초과의 상동성을 갖는다. 대안적인 구현예에서, 돌연변이체 DNA 는 임의의 공지된 돌연변이유발 절차 예컨대, 방사선조사, 니트로소구아니딘 등을 사용하여 생체 내에서 발생한다. 이어서, 목적하는 DNA 서열을 단리하고 본원에 제공된 방법에 사용한다.

본원에 사용된 바와 같이, 용어 "표적 서열" 은 유입 서열을 숙주 세포 게놈에 삽입하는 것이 바람직한 경우, 서열을 인코딩하는 숙주 세포 내 DNA 서열을 말한다. 일부 구현예에서, 표적 서열은 기능성 야생형 유전자 또는 오페론을 인코딩하는 한편, 다른 구현예에서, 표적 서열은 기능성 돌연변이 유전자 또는 오페론, 또는 비-기능성 유전자 또는 오페론을 인코딩한다.

본원에서 사용되는 바와 같이, "측면 서열 (flanking sequence)" 은 논의되는 서열의 상류 또는 하류에 있는 임의의 서열을 말한다 (예를 들어, 유전자 A-B-C 에 대해서, 유전자 B 는 A 및 C 유전자 서열의 측면에 있음). 바람직한 구현예에서, 유입 서열은 각 면 상에 있는 상동성 박스의 측면에 있다. 또 다른 구현예에서, 유입 서열 및 상동성 박스는 각 면 상의 스터퍼 (stuffer) 서열의 측면에 있는 단위 (unit) 를 포함한다. 일부 구현예에서, 측면 서열은 단지 단일 면 (3' 또는 5') 상에만 존재하나, 바람직한 구현예에서, 상기 서열은 측면에 있는 서열의 각 면 상에 존재한다. 일부 구현예에서, 측면 서열은 단지 단일 면 (3' 또는 5') 상에만 존재하나, 한편, 바람직한 구현예에서, 상기 서열은 측면에 있는 서열의 각 면 상에 존재한다.

본원에 사용된 바와 같이, 용어 "스터퍼 서열" 은 상동성 박스의 측면에 있는 임의의 추가의 DNA (전형적으로 벡터 서열) 를 말한다. 그러나, 상기 용어는 임의의 비상동성 DNA 서열을 포함한다. 이론에 제한되지 않으면서, 스터퍼 서열은 세포가 DNA 취득을 개시하도록, 중요하지 않은 표적을 제공한다.

본원에 사용된 바와 같이, 용어 "증폭" 및 "유전자 증폭" 은, 증폭된 유전자가 게놈에 처음에 존재하던 것보다 높은 복사수로 존재하게 되는 식으로 특정 DNA 서열이 불균형되게 복제되는 방법을 말한다. 일부 구현예에서, 약물 (예를 들어, 억제가능 효소의 억제제) 의 존재하에서의 성장에 의한 세포의 선별은, 상기 약물의 존재하의 성장에 필요한 유전자 생성물을 인코딩하는 내인성 유전자의 증폭, 또는 상기 유전자 생성물을 인코딩하는 외인성 (즉, 투입됨) 서열의 증폭, 또는 둘 다를 도모한다.

"증폭" 은 주형 특이성과 관련된 핵산 복제의 특별한 경우이다. 이것은 비(非)-특이적 주형 복제 (즉, 주형-의존적이나 특이적 주형에는 의존하지 않는 복제) 와는 대조적인 것이다. 여기서 주형 특이성은 복제 충성도 (즉, 적합한 폴리뉴클레오티드 서열의 합성) 및 뉴클레오티드 (리보- 또는 데옥시리보-) 특이성과는 구별된다. 주형 특이성은 "표적" 특이성의 관점에서 빈번히 기술된다. 표적 서열은 다른 핵산으로부터 선별해 내기 위해 탐색된다는 의미에서 "표적들"이다. 증폭 기술은 일차적으로는 이 선별을 위해 고안되어 왔다.

본원에 사용된 바와 같이, 용어 "공동-증폭" 은 단일 세포 내로의 다른 유전자 서열과 함께 증폭가능 마커의 도입 (즉, 발현 벡터 내에 함유된 유전자들과 같은 하나 이상의 비-선별적 유전자를 포함함) 및 세포가 증폭가능 마커 및 기타, 비-선별적 유전자 서열 모두를 증폭시키도록 하는 적합한 선택적 압력의 적용을 말ㅎ한다. 증폭가능 마커는 다른 유전자 서열에 물리적으로 연결될 수 있거나, 다르게는 하나는 증폭가능 마커를 함유하고 다른 하나는 비-선별적 마커를 함유하는 2 개의 분리된 DNA 절편이 동일 세포 내에 도입될 수 있다.

본원에 사용된 바와 같이, 용어 "증폭가능 마커," "증폭가능 유전자" 및 "증폭 벡터" 는 적합한 성장 조건하에서 유전자의 증폭을 가능하게 하는 유전자를 인코딩하는 유전자 또는 벡터를 말한다.

"주형 특이성" 은 대부분 효소 선택에 의한 증폭 기술로 달성된다. 증폭 효소는 사용되는 조건 하에서 핵산의 불균질 혼합물 중의 오직 특이적 서열의 핵산만을 조작할 효소이다. 예를 들어, Qβ 복제효소의 경우, MDV-1 RNA 가 복제효소에 대한 특이적 주형이고 (예를 들어, Kacian 등., Proc Natl Acad Sci USA 69:3038, 1972 참조), 다른 핵산은 상기 증폭 효소에 의해 복제되지 않는다. 마찬가지로, T7 RNA 폴리머라아제의 경우, 상기 증폭 효소는 그 자신의 프로모터에 대해 엄격한 특이성을 갖는다 (Chamberlin 등., Nature 228:227, 1970 참조). T4 DNA 리가아제의 경우, 상기 효소는 라이게이션 (ligation; 결찰) 접합점에서 올리고뉴클레오티드 또는 폴리뉴클레오티드 기질과 주형 사이의 미스매치가 있는 경우, 2 개의 올리고뉴클레오티드 또는 폴리뉴클레오티드를 라이게이션하지 않을 것이다 (Wu and Wallace, Genomics 4:560, 1989 참조). 마지막으로, Taq 및 Pfu 폴리머라아제는 고온에서 작용하는 그들의 능력에 비추어, 결합된 서열에 대해 높은 특이성을 나타내는 것으로 발견되므로, 프라이머에 의해 정의되며; 고온은 표적 서열과의 프라이머 혼성화를 선호하고 비-표적 서열과의 혼성화를 선호하지 않는 열역학적 상태를 야기한다.

본원에 사용된 바와 같이, 용어 "증폭가능 핵산" 은 임의의 증폭 방법에 의해 증폭될 수 있는 핵산을 말한다. "증폭가능 핵산" 은 통상 "샘플 주형" 을 포함할 것으로 생각된다.

본원에 사용된 바와 같이, 용어 "샘플 주형" 은 "표적" (하기 정의됨) 의 존재를 분석하는 샘플로부터 기원하는 핵산을 말한다. 대조적으로, "배경 주형" 은 샘플에 존재할 수 있거나 존재할 수 없는, 샘플 주형 이외의 핵산을 말할 때 사용된다. 배경 주형은 대부분 종종 부주의에 의한 것이다. 이것은 잔류 결과일 수 있거나, 샘플로부터 정제해서 제거되어야 할 핵산 오염물의 존재로 인한 것일 수 있다. 예를 들어, 검출되는 것 이외의 개체로부터의 핵산은 테스트 샘플 중의 배경으로 존재할 수 있다.

본원에 사용된 바와 같이, 용어 "프라이머" 는 정제된 제한 분쇄물 (digest) 에서와 같이 자연 발생하거나 또는 합성적으로 생성되든지 간에, 핵산 가닥에 상보적인 프라이머 신장 생성물의 합성이 유도되는 조건하에 놓인 경우 (즉, 뉴클레오티드 및 DNA 폴리머라아제와 같은 유도제의 존재 하에서 및 적합한 온도 및 pH 에서) 합성 개시점으로 작용할 수 있는 올리고뉴클레오티드를 말한다. 프라이머는 증폭시 최대 효율을 위해 바람직하게는 단일 가닥이지만, 대안적으로는 이중 가닥일 수 있다. 이중 가닥인 경우, 프라이머는 먼저 가닥을 분리시키기 위해 처리된 후, 신장 생성물을 생성하는데 사용된다. 바람직하게는, 프라이머는 올리고데옥시리보뉴클레오티드이다. 프라이머는 유도제의 존재하에서 신장 생성물의 합성을 시작하기에 충분히 길어야만 한다. 프라이머의 정확한 길이는 온도, 프라이머의 공급원 및 방법의 용도를 포함하는 많은 요소에 따라 다를 것이다.

본원에 사용된 바와 같이, 용어 "프로브" 는 정제된 제한 분쇄물과 같이 자연 발생하거나 또는 합성적으로, 재조합적으로 또는 PCR 증폭에 의해 생성되든지간에, 또다른 관심있는 올리고뉴클레오티드에 혼성화할 수 있는 올리고뉴클레오티드 (즉, 일련의 뉴클레오티드) 를 말한다. 프로브는 단일 가닥 또는 이중 가닥일 수 있다. 프로브는 특정 유전자 서열의 검출, 확인 및 단리에 유용하다. 본 발명에서 사용되는 임의의 프로브는, 효소 (예를 들어, ELISA 뿐만 아니라, 효소-기반 조직화학적 검정), 형광, 방사능 및 발광 시스템을 포함하나 이에 제한되지 않는 임의의 검출 시스템으로 검출가능하도록, 임의의 "리포터 분자" 로 표지될 것으로 생각된다. 본 발명이 임의의 특정 검출 시스템 또는 표지에 제한되는 것으로 의도되지는 않는다.

본원에 사용된 바와 같이, 폴리머라아제 연쇄 반응과 관련하여 사용되는 경우 용어 "표적" 은, 폴리머라아제 연쇄 반응에 사용되는 프라이머에 의해 결합된 핵산의 영역을 말한다. 그러므로, "표적" 은 다른 핵산 서열로부터 색출된다. "분절" 은 표적 서열 내의 핵산의 영역으로서 정의된다.

본원에 사용된 바와 같이, 한 구현예에서, 용어 "폴리머라아제 연쇄 반응" ("PCR") 은 본원에 참조로서 인용된 미국 특허 제 4,683,195 호, 제 4,683,202 호 및 제 4,965,188 호의 방법들을 지칭하는데, 이들에는 클로닝 또는 정제 없이 게놈 DNA 의 혼합물 중의 표적 서열의 분절의 농도를 증가시키는 방법들이 있다. 표적 서열을 증폭시키는 이 방법은 목적하는 표적 서열을 함유한 DNA 혼합물에 과량의 2 개의 올리고뉴클레오티드 프라이머를 도입시킨 후, DNA 폴리머라아제의 존재하에서 정확한 순서의 열 사이클링 (cycling) 을 수행하는 것으로 이루어진다. 상기 2 개의 프라이머들은 상기 이중 가닥 표적 서열의 각 가닥들에 상보적이다. 증폭을 실행하기 위하여, 상기 혼합물을 변성시키고 그 후 프라이머를 표적 분자 내의 이들의 상보 서열들에 어닐링 (annealing) 시킨다. 어닐링 후, 상기 프라이머들은 폴리머라아제에 의해 신장되어 새로운 상보 가닥들의 쌍이 형성된다. 변성, 프라이머 어닐링 및 폴리머라아제 신장의 단계들을 수 회 (즉, 변성, 어닐링 및 신장이 하나의 "사이클" 을 구성하며; 다수의 "사이클들"이 있다) 반복하여 고농도의 목적 표적 서열의 증폭된 분절을 수득할 수 있다. 상기 목적 표적 서열의 증폭된 분절의 길이는 서로에 대한 프라이머들의 상대적 위치로 결정되며, 따라서, 이 길이는 제어가능한 파라미터이다. 상기 방법의 반복 양상 때문에, 상기 방법은 "폴리머라아제 연쇄 반응" (이하 "PCR") 으로 지칭된다. 목적하는 표적 서열의 증폭 분절들이 상기 혼합물 중 주된 서열 (농도의 면에서) 이 되기 때문에, 이들은 "PCR 증폭된" 것으로 불린다.

본원에서 사용되는 바와 같이, 용어 "증폭 시약"은, 프라이머, 핵산 주형 및 증폭 효소를 제외한 증폭에 필요한 시약들 (데옥시리보뉴클레오티드 트리포스페이트, 버퍼 등) 을 지칭한다. 전형적으로, 기타 반응 구성요소들과 함께 증폭 시약을 반응 용기 (시험관, 마이크로웰 등) 에 위치시키고 담는다.

PCR 로, 게놈 DNA 중의 특이적 표적 서열의 단일 카피를 여러 상이한 방법론 (예를 들어, 표지된 프로브로의 혼성화; 비오티닐화 프라이머의 혼입 후 아비딘-효소 컨쥬게이트 검출; 증폭된 분절 내로 ³²P-표지된 데옥시뉴클레오티드 트리포스페이트, 예컨대 dCTP 또는 dATP 의 혼입) 에 의해 검출가능한 수준으로 증폭시키는 것이 가능하다. 게놈 DNA 외에도, 임의의 올리고뉴클레오티드 또는 폴리뉴클레오티드 서열은 적합한 세트의 프라이머 분자로 증폭될 수 있다. 특히, PCR 과정 그 자체에 의해 제작된 증폭된 분절 그 자체는 수반되는 PCR 증폭에 대한 효과적인 주형이다.

본원에 사용된 바와 같이, 용어 "PCR 생성물," "PCR 절편," 및 "증폭 생성물" 은 변성, 어닐링 및 신장의 PCR 단계의 2 회 이상의 사이클이 완료된 후 화합물의 수득된 혼합물을 말한다. 이러한 용어는 하나 이상의 표적 서열의 하나 이상의 분절의 증폭이 있는 경우를 포함한다.

본원에서 사용되는 바와 같이, 용어 "RT-PCR" 은 RNA 서열들의 복제 및 증폭을 지칭한다. 이 방법에서는, 역전사가 PCR 에 연결되어 있는데, 가장 흔히는 미국 특허 제 5,322,770 호 (참조로서 본원에 포함됨) 에 기술된 바의, 열안정 폴리머라아제를 이용하는 1 가지 효소 방법을 사용한다. RT-PCR 에서, RNA 주형은 상기 폴리머라아제의 역전사효소 활성에 기인하여 cDNA 로 전환되며, 그 후, 상기 폴리머라아제의 중합활성 (즉, 기타 PCR 방법들에서와 같이) 으로 증폭된다.

본원에서 사용되는 바와 같이, 용어 "제한 엔도뉴클레아제" 및 "제한효소" 는 특정 뉴클레오티드 서열 또는 그 부근의 이중가닥 DNA 를 절단하는 박테리아 효소를 지칭한다.

"제한 부위" 는 주어진 제한 엔도뉴클레아제에 의해 인식 및 절단되는 뉴클레오티드 서열을 말하며, 흔히 DNA 절편의 삽입 부위이다. 본 발명의 특정 구현예에서, 제한 부위는 선별 마커 및 상기 DNA 구축물의 5' 및 3' 말단 내로 조작된다.

본원에 사용된 바와 같이, 용어 "염색체 혼입" 은 유입 서열이 숙주 세포의 염색체 내로 도입되는 방법을 말한다. 형질전환 DNA 의 상동 영역은 염색체의 상동 영역 내에 정렬된다. 이어서, 상동 박스 사이의 서열이 이중 교차 (즉, 상동 재조합) 내의 유입 서열에 의해 대체된다. 본 발명의 일부 구현예에서, DNA 구축물의 염색체 분절을 불활성화시키는 상동 섹션이 에스테리키아 염색체의 토착 염색체 영역의 측면 상동 영역에 정렬된다. 이어서, 토착 염색체 영역이 이중 교차 (즉, 상동 재조합) 내의 DNA 구축물에 의해 결실된다.

"상동 재조합" 은 동일한 또는 거의 동일한 뉴클레오티드 서열의 부위에서의 2 개의 DNA 분자 또는 쌍을 이룬 염색체들 사이의 DNA 절편의 교환을 의미한다. 바람직한 구현예에서, 염색체 혼입은 상동 재조합이다. 본원에서 사용되는 바와 같은 "상동 서열" 은 비교를 위해 최적으로 정렬되었을 때 또 다른 핵산 또는 폴리펩티드 서열과 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 88%, 85%, 80%, 75%, 또는 70% 서열 동일성을 갖는 핵산 또는 폴리펩티드 서열을 의미한다. 일부 구현예에서, 상동 서열은 85% 내지 100% 서열 동일성을 갖고, 다른 구현예에서 90% 내지 100% 서열 동일성이 있으며, 더욱 바람직한 구현예에서는, 95% 내지 100% 서열 동일성이 있다.

본원에서 사용된 바와 같은, "아미노산" 은 펩티드 또는 단백질 서열 또는 이들의 일부를 말한다. 용어 "단백질", "펩티드" 및 "폴리펩티드" 는 상호교환적으로 사용된다.

본원에서 사용된 바와 같은, 용어 "이종 단백질" 은 숙주 세포에서 자연 발생하지 않는 단백질 또는 폴리펩티드를 말한다. 이종 단백질의 예에는 이소프렌 신타아제와 같은 효소가 포함된다. 일부 구현예에서, 상기 단백질을 인코딩하는 유전자는 자연 발생적인 유전자인 반면, 다른 구현예에서는 돌연변이된 및/또는 합성의 유전자가 사용된다.

본원에서 사용되는 바와 같이, "상동 단백질" 은 천연형 또는 세포에서 자연적으로 발생하는 단백질 또는 폴리펩티드를 말한다. 바람직한 구현예에서, 세포는 그람-음성 세포이고, 특히 바람직한 구현예에서, 세포는 에스케리키아 숙주 세포이다.

효소는, 상기 효소가 세포 내에서 대응 야생형 세포에서 발현되는 수준보다 더 높은 수준으로 발현될 경우 숙주 세포 내에서 "과발현"이다.

용어 "단백질" 및 "폴리펩티드" 는 본원에서 상호교환적으로 사용된다. [IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN)] 에 따라 정의된 아미노산에 대한 3 자리 코드가 본 명세서 전체에 걸쳐 사용된다. 또한 유전적 코드의 축퇴성으로 인해 폴리펩티드가 하나 초과의 뉴클레오티드 서열에 의해 코딩될 수 있다는 것은 자명하다.

단백질 또는 펩티드의 용어 "성숙한" 형태란, 단백질 또는 펩티드의 최종 기능적 형태를 지칭한다. 예시로, 쿠주 이소프렌 신타아제의 성숙한 형태는 SEQ ID NO:2 의 아미노산 서열을 포함한다.

단백질 또는 펩티드의 용어 "전구체" 형태란, 단백질의 아미노 또는 카르보닐 말단에 작동가능하게 연결된 전구서열 (prosequence) 을 갖는 단백질의 성숙한 형태를 지칭한다. 전구체는 또한 전구서열의 아미노 말단에 작동가능하게 연결된 "신호 서열" 을 가질 수도 있다. 상기 전구체는 또한 번역 후 활성에 관여하는 부가적인 폴리뉴클레오티드 (예를 들어, 이로부터 절단되어 단백질 또는 펩티드의 성숙한 형태를 남기는 폴리뉴클레오티드) 를 가질 수 있다.

"자연 발생 효소"는 자연에서 발견되는 것과 동일한 변형되지 않은 아미노산 서열을 가진 효소를 지칭한다. 자연 발생 효소들은 본래적 효소들, 특정 미생물에서 자연적으로 발현되거나 발견되는 효소들을 포함한다.

2 개의 핵산 또는 폴리펩티드 서열의 맥락에서 용어 "동일한"은, 하기 서열 비교 또는 분석 알고리즘 중 하나를 사용하여 측정할 때, 이 2 개 서열 내 최대 대응으로 정렬시 동일한 잔기를 지칭한다.

용어 "최적 정렬"은 가장 높은 퍼센트 동일성 점수를 주는 정렬을 지칭한다.

2 개의 아미노산, 폴리뉴클레오티드 및/또는 유전자 서열들 (적절한 경우) 에 대하여 "퍼센트 서열 동일성", "퍼센트 아미노산 서열 동일성", "퍼센트 유전자 서열 동일성" 및/또는 "퍼센트 핵산/폴리뉴클레오티드 서열 동일성"은, 상기 서열들이 최적으로 정렬시 2 개 서열들 내의 동일한 잔기들의 백분율을 지칭한다. 따라서, 80% 아미노산 서열 동일성은 최적으로 정렬된 2 개의 폴리펩티드 서열 내에서 80% 의 아미노산들이 동일하다는 것을 의미한다.

2 개의 핵산 또는 폴리펩티드들의 맥락에서 "실질적으로 동일한" 이라는 어구는, 따라서, 표준 파라미터를 사용하는 프로그램 또는 알고리즘 (예컨대, BLAST, ALIGN, CLUSTAL) 을 사용하여 기준 서열과 비교시 서열 동일성이 70% 이상, 바람직하게는 75% 이상, 바람직하게는 80% 이상, 바람직하게는 85% 이상, 바람직하게는 90% 이상, 바람직하게는 95% 이상, 바람직하게는 97% 이상, 바람직하게는 98% 이상 및 바람직하게는 99% 이상인 폴리뉴클레오티드 또는 폴리펩티드를 지칭한다. 2 개의 폴리펩티드들이 실질적으로 동일하다는 한가지 표시는, 첫번째 폴리펩티드가 두번째 폴리펩티드에 대하여 면역학적으로 교차-반응성이 있는 것이다. 전형적으로, 보존적 아미노산 치환에 의해 다른 폴리펩티드들은 면역학적 교차-반응성이 있다. 따라서, 폴리펩티드는, 예를 들어, 2 개 펩티드들이 보존적 치환에 의해서만 다른 경우, 두번째 폴리펩티드와 실질적으로 동일하다. 2 개의 핵산 서열들이 실질적으로 동일한 또 다른 표시는, 상기 두 분자들이 엄격한 조건들 (예컨대, 중간 내지 높은 엄격성의 범위 내) 하에서 서로 혼성화하는 것이다.

용어 "단리된" 또는 "정제된"은 그의 본래 환경 (예컨대, 이것이 자연 발생적인 것일 경우 그의 천연적 환경) 으로부터 제거된 물질을 지칭한다. 예를 들어, 상기 물질은, 자연 발생 또는 야생형 유기체 (예, 쿠주) 중에, 또는 자연 발생 또는 야생형 유기체로부터 발현시에 정상적으로는 존재하지 않는 성분과 조합되어 존재하는 것보다 더 높거나 더 낮은 농도로 특정 조성물 중에 존재할 때 "정제된" 것으로 말해진다. 예를 들어, 살아있는 동물에 존재하는 자연 발생 폴리뉴클레오티드 또는 폴리펩티드는 단리된 것이 아니나, 자연계에서 공존하는 물질들의 일부 또는 전부로부터 분리된 동일한 폴리뉴클레오티드 또는 폴리펩티드는 단리된 것이다. 이러한 폴리뉴클레오티드는 벡터의 일부일 수 있고/있거나 이러한 폴리뉴클레오티드 또는 폴리펩티드는 조성물의 일부일 수 있고, 또한 이러한 벡터 또는 조성물이 그의 천연 환경의 일부가 아니라는 점에서 단리된 것일 수 있다. 바람직한 구현예들에서, 핵산 또는 단백질은, 예를 들어 전기영동 겔 또는 블럿 (blot) 내에서 본질적으로 하나의 밴드를 나타내는 경우, 정제된 것으로 불린다.

DNA 서열과 관련하여 사용될 때 용어 "단리된" 은, 그의 천연 유전적 환경에서 제거되어 기타의 이질적인 또는 원치 않는 코딩 서열들이 없고, 유전적으로 조작된 단백질 생산 시스템 내에 사용하기에 적당한 형태인 DNA 서열을 지칭한다. 마찬가지로, 재조합 DNA 서열과 관련하여 사용될 때 용어 "단리된" 은 숙주 세포의 유전적 환경에서 제거되어 기타의 이질적 또는 원치 않는 코딩 서열들이 없는 DNA 서열을 지칭한다 (예를 들어, E.coli 에서 번식시킨 쿠주 IspS 발현 벡터). 이러한 단리된 분자들은 이들의 천연 환경으로부터 분리된 것들이며, cDNA 및 게놈 클론들이 있다. 본 발명의 단리된 DNA 분자들에는, 이들이 통상적으로는 결합되어 있는 다른 유전자들은 없으나, 프로모터 및 터미네이터 (terminator; 종결자) 등의 자연 발생적 5' 및 3' 비번역 영역이 포함되어 있을 수 있다. 결합 영역들의 동정은 당업계의 통상의 지식을 가진 자에게 자명하다 (예컨대, Dynan 및 Tijan, Nature 316:774-78 [1985] 참조). 용어 "단리된 DNA 서열"은 다르게는 "클로닝된 DNA 서열"로 지칭된다.

단백질과 관련하여 사용될 때 용어 "단리된"은 그의 본래적 환경과 다른 조건에서 발견되는 단백질을 지칭한다. 바람직한 형태에서, 단리된 단백질에는, 다른 단백질, 특히 기타 상동 단백질들이 실질적으로 부재하다. 마찬가지로, 재조합으로 생성된 단백질과 관련하여 사용될 때 용어 "단리된" 은 숙주 유기체의 단백질 환경에서 제거되어 기타 이질적이거나 또는 원치 않는 단백질이 부재한 단백질을 지칭한다 (예를 들어, E.coli 에서 생성된 재조합 쿠주 IspS). 단리된 단백질은, SDS-PAGE 로 측정시, 10% 초과로 순수하고, 바람직하게는 20% 초과로 순수하며, 더욱 더 바람직하게는 30% 초과로 순수하다. 본 발명의 또 다른 면은, SDS-PAGE 로 측정된 바, 고도로 정제된 형태 (즉, 40% 초과, 60% 초과, 80% 초과, 90% 초과, 95% 초과, 97% 초과, 및 심지어 99% 초과로 순수) 의 단백질을 포괄한다.

하기의 카세트 돌연변이유발법이 본 발명의 효소 변이체의 구축을 용이하게 하기 위해 사용될 수 있으나, 기타 방법들이 사용될 수도 있다. 먼저, 본원에서 기술되는 바와 같이, 효소를 인코딩하는 자연-발생 유전자를 수득하고 그 전체 또는 일부를 서열화한다. 그 후, 인코딩된 효소의 하나 이상의 아미노산의 돌연변이화 (결실, 삽입 또는 치환) 를 만들기를 원하는 지점에서 상기 서열을 스캐닝한다. 이 지점과 측면에 있는 서열을, 발현시 각종 돌연변이체를 인코딩하는 올리고뉴클레오티드 풀 (pool) 로, 유전자의 짧은 분절을 대체하기 위한 제한 부위의 존재에 대해 평가한다. 이러한 제한 부위는 바람직하게도 유전자 분절 대체를 촉진시키기 위한 단백질 유전자 내에서의 독특한 부위이다. 그러나, 효소 유전자 내에서 매우 중복되는 것이 아닌 임의의 가까운 제한 부위가 사용될 수 있으나, 단 제한 분쇄에 의해 생성된 유전자 절편이 적절한 서열과 재결합될 수 있어야 한다. 제한 부위가 선택된 지점 (10 내지 15 개의 뉴클레오티드) 에서 가까운 거리 내 위치에 존재하지 않는 경우에는, 이러한 부위는 리딩 프레임도 인코딩된 아미노산도 모두 최종 구축물에서 변경되지 않는 방식으로 유전자 내 뉴클레오티드를 치환함으로써 형성한다. 이의 서열을 변경시켜 원하는 서열에 일치시키기 위해 유전자를 돌연변이화하는 것은 일반적으로 공지된 방법에 따라 M13 프라이머 신장으로 수행한다. 적합한 측면 영역의 위치를 찾아내어, 두 가까운 제한 부위 서열에 도달하게 하는 요구되는 변경을 평가하는 일은 유전자 코드의 중복성, 유전자의 제한 효소 맵 및 상당수의 상이한 제한 효소에 의해 일상적이다. 가까운 측면 제한 부위가 이용가능한 경우, 상술한 방법은 부위를 포함하지 않는 측면 영역과 연결될 때에만 사용하면 된다는 점에 주의한다.

일단 자연-발생 DNA 및/또는 합성 DNA 가 클로닝되면, 돌연변이될 위치와 측면에 있는 제한 부위는 관련 제한 효소로 분쇄되어 다수의 말단 종점-상보 올리고뉴클레오티드 카세트가 유전자에 라이게이션된다. 돌연변이유발은 이러한 방법으로 간략화되는데, 그 이유는 상기 올리고뉴클레오티드 전부가 동일한 제한 부위를 갖도록 합성될 수 있어 어떠한 합성 결합제도 제한 부위를 만드는데 필요하지 않기 때문이다.

본원에서 사용되는 바와 같이, "~ 와 상응하는" 이란, 단백질 또는 펩티드 내 열거된 위치에서의 잔기, 또는 단백질 또는 펩티드 내 열거된 잔기와 유사, 상동 또는 등가인 잔기를 지칭한다. 본원에서 사용되는 바와 같이, "상응 영역" 이란, 일반적으로 관련단백질 또는 모체 단백질에서 유사 위치를 지칭한다.

본원에 사용되는 바와 같은, 용어 "조합 돌연변이유발" 은 출발 서열의 변이체의 라이브러리가 생성되는 방법을 말한다. 상기 라이브러리에서, 변이체는 미리 정의된 일련의 돌연변이로부터 선택된 하나 또는 여러 돌연변이를 함유한다. 또한, 상기 방법은 미리 정의된 일련의 돌연변이의 일원이 아닌 랜덤 돌연변이를 도입하기 위한 수단을 제공한다. 일부 구현예에서, 상기 방법에는 본원에 참조로서 인용된, 미국 출원 제 09/699,250 호에 언급된 것들이 포함된다. 대안적인 구현예에서, 조합 돌연변이화 방법은 시판되는 키트 (예를 들어, QUIKCHANGE 다중 부위 특이적 돌연변이유발 키트, Stratagene, San Diego, CA) 를 포함한다.

본원에 사용되는 바와 같은, 용어 "돌연변이체의 라이브러리" 는 게놈의 대부분이 일치하나, 하나 이상의 유전자의 상이한 상동이 포함되는 세포의 집단을 말한다. 이러한 라이브러리는 예를 들어, 향상된 형질을 갖는 유전자 또는 오페론을 동정하는데 사용될 수 있다.

본원에서 사용된 바와 같이, 용어 "출발 유전자" 및 "모체 유전자" 는 본 발명을 사용하여 개선 및/또는 변화될 관심 대상 단백질을 인코딩하는 관심 대상 유전자를 지칭한다.

본원에 사용되는 바와 같은, 용어 "다중 서열 정렬" 및 "MSA" 은 알고리즘 (예를 들어, Clustal W) 을 사용하여 정렬된 출발 유전자의 다수의 상동체 서열을 말한다.

본원에서 사용되는 바와 같이, 용어 "보존 서열" 및 "정준 서열"은 관심 대상 특정 단백질 또는 서열의 모든 변이체들이 비교되는 전형적인 아미노산 서열을 지칭한다. 상기 용어는 또한 관심 대상 DNA 서열 내에 가장 흔히 존재하는 뉴클레오티드들을 나타내는 서열을 지칭한다. 유전자의 각 위치에 있어서, 상기 보존 서열은 MSA 내 상기 위치에서 가장 풍부한 아미노산을 제공한다.

본원에 사용되는 바와 같은, 용어 "보존 돌연변이화" 는 출발 유전자 및 보존 서열의 서열간 차이를 말한다. 보존 돌연변이는 MSA 로부터 수득된 출발 유전자 및 보존 서열의 서열을 비교하여 동정된다. 일부 구현예에서, 보존 돌연변이가 출발 유전자 내에 도입되어, 보존 서열과 더욱 유사하게 된다. 보존 돌연변이에는 또한 출발 유전자 중의 아미노산의 빈도와 관련된 위치에서 출발 유전자 중의 아미노산이 MSA 에서 더욱 종종 발견되는 아미노산으로 변경되는 아미노산 변경이 포함된다. 그러므로, 용어 보존 돌연변이는 출발 유전자의 아미노산을 MSA 중의 아미노산보다 더욱 풍부한 아미노산으로 대체하는 모든 단일 아미노산 변경을 포함한다.

용어 "개질된 서열" 및 "개질된 유전자"는 자연 발생적 핵산 서열의 결실, 삽입 또는 개입을 포함하는 서열을 나타내는 것으로 본원에서 상호교환적으로 사용된다. 일부 바람직한 구현예에서, 개질 서열의 발현 생성물은 절단된 단백질이다 (예를 들어, 개질이 서열의 결실 또는 개입인 경우). 일부 특히 바람직한 구현예에서, 절단된 단백질은 생물학적 활성을 유지한다. 대안적인 구현예에서, 개질 서열의 발현 생성물은 신장된 단백질이다 (예를 들어, 핵산 서열 내의 삽입을 포함하는 개질). 일부 구현예에서, 삽입은 절단된 단백질을 야기한다 (예를 들어, 삽입이 정지 코돈을 형성하는 경우). 따라서, 삽입은 발현 생성물로서 절단된 단백질 또는 신장된 단백질을 야기할 수 있다.

본원에 사용되는 바와 같은 용어 "돌연변이 서열" 및 "돌연변이 유전자"는 상호교환적으로 사용되고, 숙주 세포의 야생형 서열에서 발생하는 하나 이상의 코돈에서 변경이 이루어진 서열을 나타낸다. 돌연변이 서열의 발현 생성물은 야생형과 비교해 변경된 아미노산 서열을 갖는 단백질이다. 발현 생성물은 변경된 기능적 역량을 가질 수 있다 (예를 들어, 향상된 효소적 활성).

용어 "돌연변이유발 프라이머" 또는 "돌연변이유발 올리고뉴클레오티드" (본원에서 상호교환적으로 사용됨)는 주형 서열의 일부에 상응하고 그곳에 혼성화될 수 있는 올리고뉴클레오티드 조성물을 나타내는 것으로 의도된다. 돌연변이유발 프라이머에 있어서, 프라이머는 주형 핵산에 정확하게 부합하지 않을 것이고, 프라이머에서의 미스매치 또는 미스매치들은 핵산 라이브러리 내에 원하는 돌연변이를 도입하는데 사용된다. 본원에 사용되는 바와 같은 "비-돌연변이유발 프라이머" 또는 "비-돌연변이유발 올리고뉴클레오티드"는 주형 핵산에 정확하게 부합하는 올리고뉴클레오티드 조성물을 나타낸다. 본 발명의 하나의 구현예에서, 오직 돌연변이유발 프라이머만이 사용된다. 본 발명의 또 다른 바람직한 구현예에서, 프라이머는 하나 이상의 부위에 돌연변이유발 프라이머가 포함되고, 올리고뉴클레오티드 혼합물에 포함된 비-돌연변이유발 프라이머가 또한 있도록 디자인된다. 돌연변이유발 프라이머 중 하나 이상에 상응하는 돌연변이유발 프라이머 및 비-돌연변이유발 프라이머의 혼합물을 첨가하여, 다양한 조합 돌연변이 패턴이 제시된 생성된 핵산 라이브러리를 생성하는 것이 가능하다. 예를 들어, 돌연변이 핵산 라이브러리의 구성원 중 일부는 특정 위치에서 그의 전구체 서열을 유지하는 반면 다른 구성원은 상기 위치에서 돌연변이되는 것이 바람직한 경우, 비-돌연변이유발 프라이머는 제시된 잔기에 대한 핵산 라이브러리 내 비-돌연변이 구성원의 특정 수준을 수득하는 능력을 제공한다. 본 발명의 방법은 일반적으로 길이가 10~50개 염기인, 보다 바람직하게는 길이가 약 15~45개 염기인 돌연변이유발 및 비-돌연변이유발 올리고뉴클레오티드를 사용한다. 그러나, 원하는 돌연변이유발 결과를 얻기 위해 10개 염기보다는 짧거나 50개 염기보다는 긴 길이의 프라이머를 사용하는 것이 필요할 수 있다. 상응하는 돌연변이유발 및 비-돌연변이유발 프라이머에 있어서, 상응하는 올리고뉴클레오티드의 길이가 일치해야할 필요는 없으나, 첨가되는 돌연변이에 상응하는 부위 중에 오버랩은 있다.

일부 구현예에서, 프라이머는 소정의 비율로 첨가된다. 예를 들어, 생성된 라이브러리가 특정한 특이적 돌연변이의 유의한 수준을 가지며, 동일 또는 상이한 위치에서 상이한 돌연변이의 양이 더 적은 것이 바람직한 경우, 첨가되는 프라이머의 양을 조절하여, 원하는 방향의 라이브러리를 생성하는 것이 가능하다. 대안적으로는, 비-돌연변이유발 프라이머를 더 적게 또는 더 많이 첨가함으로써, 상응하는 돌연변이(들)가 돌연변이 핵산 라이브러리에서 생성되는 빈도를 조정하는 것이 가능하다.

용어 "야생형 서열," 또는 "야생형 유전자"는 숙주 세포에서 천연 또는 자연 발생하는 서열을 나타내는 것으로 본원에서 상호교환적으로 사용된다. 일부 구현예에서, 야생형 서열은 단백질 공학 프로젝트의 출발점인 관심 서열을 나타낸다. 야생형 서열은 상동 또는 이종 단백질을 인코딩할 수 있다. 상동 단백질은 숙주 세포 개입 없이 생성될 단백질이다. 이종 단백질은 숙주 세포 개입이 없다면 생성되지 않을 단백질이다.

본원에서 사용되는 바와 같이 용어 "분해물" 이란, 분해된 세포의 내용물을 함유하는 용액을 지칭한다. 일부 구현예에서, 분해물은 박테리아 세포 분해물 (예, Epicentre 로부터의 ReadyLyse^TM 리소자임 용액을 이용해 분해된 E. coli 세포; 또는 세포파쇄기 (French Pressure cell) 을 이용해 분해된 E. coli 세포) 이다.

본원에서 사용되는 바와 같이, 용어 "리소자임" 은 N-아세틸 뮤람산과 N-아세틸 글루코사민간 결합을 가수분해하여, 다수의 박테리아의 세포벽에서 중요한 중합체를 절단하는 글리코시다아제를 지칭한다. 본 발명에서 사용하기에 적합한 리소자임에는 이에 제한되는 것은 아니나, 암탉 백색 달걀 리소자임 (Sigma), T4 리소자임, 재조합 비(非)포유류, 비(非)-조류 리소자임 (ReadyLyse^TM), 또는 진균류 리소자임이 포함된다.

본원에서 사용되는 바와 같이, 용어 "상부공간" 이란, 밀봉된 용기 내 고체 또는 액체 샘플 위에 가두어진 증기/공기 혼합물을 지칭한다.

본원에서 사용되는 바와 같이, 용어 "고처리량 스크리닝" 및 "HTS (high throughput screening)" 은 4 시간 이내에 96 개 이상의 샘플에서 이소프렌을 측정하는 것이다. 바람직한 구현예에서, 샘플 부피는 2 mL 미만이다.

달리 언급되지 않는 한, 모든 성분 또는 조성물 수준은 그 성분 또는 조성물의 활성 수준과 관련되며, 불순물, 예를 들면 시판중 공급원으로 존재할 수 있는 잔류 용매 또는 부산물은 제외된다.

효소 성분 중량은 총 활성 단백질을 기준으로 한다. 모든 백분율 및 비율은 달리 지시되지 않는 한 중량으로 산출된다. 모든 백분율 및 비율은 다르게 언급되지 않는 한 총 조성물을 기준으로 산출된다.

본 발명의 상세한 설명

이소프렌 단량체는 폴리이소프렌 및 (이소부틸렌, 부타디엔, 스티렌, 또는 기타 단량체와의) 다양한 공중합체 제조에서 사용된다. 상업적으로 실행가능한 수준의 이소프렌을 생성가능하게 하는 균주 (원핵 또는 진핵) 를 만드는 것은 MVA 에서 이소프렌, 또는 DXP 에서 이소프렌인 전체 경로에서의 최적화를 요구한다. 이 경로에서의 주요 효소는 이소프렌 신타아제 (IspS) 로, 이는 전구체 DMAPP 를 이소프렌으로 전환시킨다. 현재까지 동정된 유일한 이소프렌 신타아제 (IspS) 은 포플러, 영국산 오크 및 칡 등과 같은 식물 유래의 것이다. 일부 박테리아, 예컨대 바실러스 서브틸러스 (Bacillus subtilis ) 가 또한 이소프렌을 생성하지만, 원핵 IspS 가 아직 동정되어있지 않고, 바실러스 내 고유의 IspS 활성은 상업적인 공정에서 충분하지 않다. 현재까지 동정된 식물 IspS 효소는 E. coli 에서의 발현에 의해 불완전하게 일부 특성화되어 있고, 이들 효소의 동적 파라미터 중 일부가 정제된 단백질을 이용하여 시험관 내에서 측정된다. 그러나, 천연형 IspS 효소의 동적 파라미터 (Km, 속도 등) 는 생물 숙주에서 이소프렌의 상업적 생산에 불충분하다.

본원에서 기술된 이러한 문제점을 해결하기 위해, 식물 IspS 를 박테리아 숙주에서 발현시킨다. 아울러, 관심 특성을 변경하도록 IspS 를 조작한다. 야생형 및 돌연변이체 IspS 의 특성화는 적합한 임의의 수단 또는 "시험" 을 통해 달성되며, 바람직하게는 관심 특성 평가를 기초로 한다. 관심 특성에는 이에 제한되는 것은 아니나 하기가 포함된다: pH 최적, 온도 안정성 (예, T_m 값), 세포내 및 세포외 용해성, K_m 값, k_cat 값, 또는 특이 활성뿐 아니라, 기질을 비롯한 잠재 억제제 또는 생성물 억제제에 대한 민감성. 산화 및 단백질 분해 안정성이 또한 관심대상이다. 게다가, 금속 이온 작용 및 이온 강도로 인한 활성화 또는 억제가 관심 대상이다. 이들 특성 및 파라미터는 정제된 또는 부분적으로 정제된 이소프렌 신타아제를 통해 시험관 내에서, 또는 DXP 경로, MVA 경로 또는 둘 다를 발현하는 E.coli 와 같은 숙주 유기체의 맥락에서 생체 내에서 DMAPP 에서 이소프렌으로의 전환에 의해 평가될 수 있다. 시험 조건 중 하나 이상에서 다양한 정도의 안정성, 용해성, 활성, 및/또는 발현 수준을 갖는 효소가 다양한 숙주에서 이소프렌을 생성하기 위한 본 발명에서 유용할 것이라는 점이 고려된다. 고처리량 방법, 예컨대 실시예 10 에 기술된 것이 경제적인 방식으로 이들 특성을 조사하는데 요구된다.

본 발명은 증가된 양의 이소프렌을 생산하기 위한 조성물 및 방법을 특징으로 삼다. 특히, 이들 조성물 및 방법은 이소프렌의 생성 속도를 증가시키고 생성된 이소프렌의 총 함량을 증가시킨다. 본원에서 기술된 이소프렌 생성의 생합성적 공정은 천연 고무 이용의 바람직한 대안법이다. 하기에 더 논의되는 바와 같이 세포에 의해 생성된 이소프렌의 양은, 이소프렌 신타아제 (IspS) 폴리펩티드를 인코딩하는 이종 핵산을, 세포에 도입함으로써 크게 증가될 수 있다. 이소프렌 신타아제 폴리펩티드는 디메틸알릴 디포스페이트 (DMAPP) 를 이소프렌으로 전환시킨다. 실시예에 나타내듯이, 이종 Pueraria montana (쿠주) 이소프렌 신타아제 폴리펩티드 및 이의 변이체는 그람-음성 박테리아 세포 (예, 대장균) 에서 발현되었다. 또한 실시예에 나타내고 본 발명의 범위 내에서 고려되는 것은 포플러 이소프렌 신타아제 폴리펩티드 및 이의 변이체로, 이는 그람-음성 박테리아 세포 (예, Escherichia coli) 에서 발현된 것이다.

박테리아 숙주 세포 내 식물 IspS 의 이종 발현으로 식물 IspS 가 없는 상응하는 세포보다 더 많은 이소프렌의 생성이 도모되었다.

프로테아제 효소의 표면 상 아미노-산 잔기의 돌연변이화가 이의 활성, 발현 및 안정성을 개선할 수 있다는 점이 보고되어 있다 (WO2008/153925, WO2008/153934, WO2008/153935). 놀랍게도, 우리는 완전이 상이한 효소, 즉 이소프렌 신타아제의 표면 상 아미노산 잔기를 돌연변이화하여, 이의 발현, 용해성 및 활성을 강화시킬 수 있다는 점을 발견했다. L70R 이 이러한 유익한 표면 돌연변이화의 예이다.

효소의 3차원 구조의 설명이 이의 표면 상 아미노산 잔기를 정확하게 동정하는데 본질적이다. 이소프렌 신타아제와 약 40% 동일한 서열을 갖는 구조를 이용하는 상동체 모델링 (예, 보르닐 신타아제 및 리모넨 신타아제, 이소프렌 신타아제와 가장흡사한 동일성을 갖는 공지된 구조의 효소임) 으로 모델링된 효소 구조의 전반적인 면을 나타낼 수 있으나, 표면-노출된 잔기를 정확하게 동정하고 이의 표면 노출정도를 수량화하기에는 불충분하다. 아미노산 잔기의 표면 노출은 이의 측쇄의 용매-접근가능 표면적 퍼센트로 정량된다.

하기의 이소프렌 신타아제 내 돌연변이 부류는, >50% 용매-노출, 바람직하게는 >65% 용매-노출, 및 가장 바람직하게는 >85% 용매-노출된 아미노산 잔기를 표적화함으로써 효소의 용해성을 개선할 수 있다:

소수성 → 양전하, 및 반대의 경우

소수성 → 음전하, 및 반대의 경우

소수성 → 중성의 극성, 및 반대의 경우

중성의 극성 → 양전하, 및 반대의 경우

중성의 극성 → 음전하, 및 반대의 경우

양전하 → 음전하, 및 반대의 경우

게다가, 이종 이소프렌 신타아제 핵산을 함유하는 세포에 의한 이소프렌 생성은, 이 세포에 의해 발현되는, 1-데옥시-D-자일룰로오즈-5-포스페이트 신타아제 (DXS) 폴리펩티드, 및/또는 이소펜테닐 디포스페이트 이소머라아제 (IDI) 폴리펩티드의 양을 증가시킴으로써 강화될 수 있다. 예를 들어, DXS 핵산 및/또는 IDI 핵산이 세포로 도입될 수 있다. DXS 핵산은 이종 핵산 또는 내인성 핵산의 복제 카피일 수 있다. 마찬가지로, IDI 핵산은 이종 핵산 또는 내인성 핵산의 복제 카피일 수 있다. 일부 구현예에서, DXS 및/또는 IDI 폴리펩티드의 양은, 내인성 DXS 및/또는 IDI 프로모터 또는 조절 영역을, DXS 및/또는 IDI 핵산의 더 큰 전사를 도모하는 기타 프로모터 및/또는 조절 영역으로 대체함으로써 증가된다. 일부 구현예에서, 세포는 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산 (예, 식물 이소프렌 신타아제 핵산) 및 이소프렌 신타아제 폴리펩티드를 인코딩하는 내인성 핵산의 복제 카피 양자 모두를 포함한다.

인코딩된 DXS 및 IDI 폴리펩티드는 이소프렌의 생합성을 위한 DXP 경로의 일부이다 (도 15). DXS 폴리펩티드는 피루베이트 및 D-글리세르알데히드-3-포스페이트를 1-데옥시-D-자일룰로오즈-5-포스페이트로 전환시킨다. 임의의 특정 이론에 얽매이도록 의도된 것은 아니나, DXS 폴리펩티드의 양을 증가시키는 것은 DXP 경로를 통한 탄소의 유동을 증가시켜 더 많은 이소프렌 생성을 도모한다고 여겨진다. IDI 폴리펩티드는 이소펜테닐 디포스페이트 (IPP) 및 디메틸알릴 디포스페이트 (DMAPP) 의 상호전환을 촉매작용한다. 임의의 특정 이론에 얽매이도록 의도된 것은 아니나, 세포 내 IDI 폴리펩티드의 양을 증가시키면, DMAPP 로 전환되고 차례로 이소프렌으로 전환되는, IPP 의 양을 증가시키는 것으로 여겨진다.

일부 구현예에서, 세포에서 MVA 폴리펩티드의 발현을 증가시킴으로써 이종 이소프렌 신타아제 핵산을 함유하는 세포에 의한 이소프렌의 생성이 늘어날 수 있다 (도 15). 예시적 MVA 경로 폴리펩티드에는, 하기의 폴리펩티드들 중 어느 것이든지 포함된다: 아세틸-CoA 아세틸트랜스퍼라아제 (AA-CoA 티올라아제) 폴리펩티드, 3-히드록시-3-메틸글루타릴-CoA 신타아제 (HMG-CoA 신타아제) 폴리펩티드, 3-히드록시-3-메틸글루타릴-CoA 리덕타아제 (HMG-CoA 리덕타아제) 폴리펩티드, 메발로네이트 키나아제 (MVK) 폴리펩티드, 포스포메발로네이트 키나아제 (PMK) 폴리펩티드, 디포스포메발로네이트 데카르복실라아제 (MVD) 폴리펩티드, IDI 폴리펩티드, 및 둘 이상의 MVA 경로 폴리펩티드의 활성을 갖는 폴리펩티드 (예, 융합 폴리펩티드). 예를 들면, 하나 이상의 MVA 경로 핵산이 세포내로 도입될 수 있다. 일부 구현예에서, 세포는 AA-CoA 티올라아제, HMG-CoA 신타아제, 및 HMG-CoA 리덕타아제 핵산을 포함하는 상부 (upper) MVA 경로를 포함한다. 일부 구현예에서, 세포는 MVK, PMK, MVD, 및 IDI 핵산을 포함하는 하부 (lower) MVA 경로를 포함한다. 일부 구현예에서, 세포는 AA-CoA 티올라아제, HMG-CoA 신타아제, HMG-CoA 리덕타아제, MVK, PMK, MVD, 및 IDI 핵산을 포함하는 전 MVA 경로를 포함한다. MVA 경로 핵산은 이종 핵산 또는 내인성 핵산의 복제 카피일 수 있다. 일부 구현예에서, 하나 이상의 MVA 경로 폴리펩티드의 양은 MVA 경로 핵산에 대한 내인성 프로모터 또는 조절 영역을, MVA 경로 핵산의 더 큰 전사를 도모하는 기타 프로모터 및/또는 조절 영역으로 대체하여 증가된다. 일부 구현예에서, 세포는 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산 (예, 식물 이소프렌 신타아제 핵산) 및 이소프렌 신타아제 폴리펩티드를 인코딩하는 내인성 핵산의 복제 카피 양자 모두를 포함한다.

일부 구현예에서, 상기 세포의 적어도 일부는, 연속 배양 (예컨대, 희석 없는 연속 배양) 에서 적어도 약 5, 10, 20, 50, 75, 100, 200, 300 회, 또는 이를 초과하는 회수의 세포 분열 동안 이종 이소프렌 신타아제, DXS, IDI, 및/또는 MVA 경로 핵산을 유지한다. 본 발명의 임의의 측면 중 일부 구현예에서, 이종 또는 내인성 이소프렌 신타아제의 복제 카피를 포함하는 핵산, DXS, IDI, 및/또는 MVA 경로 핵산은 또한 선별 마커, 예컨대 카나마이신, 암피실린, 카르베니실린, 겐타마이신, 하이그라마이신, 플레오마이신, 블레오마이신, 네오마이신 또는 클로람페니콜 항생제 내성 핵산을 포함한다.

I. 예시적 폴리펩티드 및 핵산

다양한 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드 및 핵산이 본 발명의 조성물 및 방법에 사용될 수 있다.

본원에서 사용되는 바와 같이, "폴리펩티드"는 폴리펩티드, 단백질, 펩티드, 폴리펩티드의 절편, 및 제 1 폴리펩티드의 일부 또는 전부 (예를 들어 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드) 및 제 2 폴리펩티드의 일부 또는 전부 (예를 들어 His-태그 (tag) 와 같은, 융합 폴리펩티드의 정제 또는 검출을 촉진하는 펩티드)를 포함하는 융합 폴리펩티드를 포함한다. 일부 구현예에서는, 융합 폴리펩티드는 둘 이상의 MVA 경로 폴리펩티드 (예, AA-CoA 티올라아제 및 HMG-CoA 환원효소 폴리펩티드)의 활성을 갖는다. 일부 구현예에서는, 폴리펩티드는 둘 이상의 MVA 경로 폴리펩티드의 활성을 갖는 자연 발생적 폴리펩티드 (예를 들어 엔테로코커스 패칼리스 mvaE 핵산에 의해 인코딩되는 폴리펩티드)이다.

각종 구현예에서, 폴리펩티드는 적어도 또는 약 50, 100, 150, 175, 200, 250, 300, 350, 400개 이상의 아미노산을 갖는다. 일부 구현예에서는, 폴리펩티드 절편은 전장 폴리펩티드로부터 적어도 또는 약 25, 50, 75, 100, 150, 200, 300개 이상의 연속 아미노산을 함유하며, 상응하는 전장 폴리펩티드의 활성의 적어도 또는 약 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 100%를 갖는다. 특정 구현예에서, 폴리펩티드는 임의 자연 발생적 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드의 전체 아미노산 서열 또는 분절을 포함한다. 일부 구현예에서는, 폴리펩티드는 야생형 이소프렌 신타아제의 서열 (즉, 자연 발생하는 서열), DXS, IDI 또는 MVA 경로 폴리펩티드와 비교하여 하나 이상의 돌연변이를 갖는다.

일부 구현예에서는, 폴리펩티드는 단리된 폴리펩티드이다. 본원에서 사용되는 바와 같이, "단리된 폴리펩티드"는 2, 5, 10, 20, 50개 이상의 상이한 폴리펩티드의 라이브러리와 같은 폴리펩티드의 라이브러리의 일부가 아니며, 자연적으로 발생하는 하나 이상의 성분으로부터 분리된다. 단리된 폴리펩티드는, 예를 들어 폴리펩티드를 인코딩하는 재조합 핵산의 발현에 의해 수득될 수 있다.

일부 구현예에서는, 폴리펩티드는 이종 폴리펩티드이다. "이종 폴리펩티드"는 동일한 숙주 세포에서 자연적으로 발현되는 또 다른 폴리펩티드의 서열과 아미노산 서열이 동일하지 않은 폴리펩티드를 의미한다.

본원에서 사용되는 바와 같이, "핵산"은 단일 또는 이중 가닥 형태인 둘 이상의 데옥시리보뉴클레오티드 및/또는 리보뉴클레오티드를 나타낸다. 일부 구현예에서는, 핵산은 재조합 핵산이다. "재조합 핵산"은 관심 핵산을 유도하는 유기체의 자연 발생적 게놈에서, 관심 핵산의 측면에 위치하는 하나 이상의 핵산 (예를 들어 유전자)이 없는 관심 핵산을 의미한다. 그러므로 상기 용어는 예를 들어 벡터, 자체 복제 플라스미드 또는 바이러스, 또는 원핵생물 또는 진핵생물의 게놈 DNA 내에 혼입되어 있거나, 또는 다른 서열과는 독립적인, 별개의 분자 (예를 들어 cDNA, 게놈 DNA 절편, 또는 PCR 또는 제한 엔도뉴클레아제 분쇄에 의해 생성되는 cDNA 절편) 로서 존재하는, 재조합 DNA를 포함한다.

각종 구현예에서 핵산은 재조합 핵산이다. 예를 들어, 일부 구현예에서, 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은, 또 다른 폴리펩티드의 전부 또는 일부를 인코딩하는 또 다른 핵산에 작동가능하게 연결되어, 재조합 핵산이 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드를 포함하는 융합 폴리펩티드, 및 또 다른 폴리펩티드 (예를 들어 His-태그와 같은, 융합 폴리펩티드의 정제 또는 검출을 촉진하는 펩티드) 의 전부 또는 일부를 인코딩한다. 일부 구현예에서는, 재조합 핵산의 일부 또는 전부가 화학적으로 합성된다. "이종 핵산"이란, 동일한 숙주 세포에서 핵산 서열이 자연적으로 발견되는 또 다른 핵산의 서열과 동일하지 않은 핵산을 의미한다.

특정 구현예에서는, 핵산은 임의의 자연 발생적 이소프렌 신타아제의 전체 핵산 서열 또는 분절, DXS, IDI 또는 MVA 경로 핵산을 포함한다. 일부 구현예에서는, 핵산은 자연 발생적 이소프렌 신타아제 핵산 DXS, IDI 또는 MVA 경로 핵산으로부터 적어도 또는 약 50, 100, 150, 200, 300, 400, 500, 600, 700, 800개 이상의 근접한 뉴클레오티드를 포함한다. 일부 구현예에서는, 핵산은 야생형 이소프렌 신타아제 서열 (즉, 자연 발생하는 서열), DXS, IDI 또는 MVA 경로 핵산과 비교하여 하나 이상의 돌연변이를 갖는다. 일부 구현예에서는, 핵산은 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산의 전사 또는 번역을 증가시키는 하나 이상의 돌연변이 (예를 들어 침묵 돌연변이)를 갖는다. 일부 구현예에서는, 핵산은 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드를 인코딩하는 임의 핵산의 축퇴성 변이체이다.

"코돈 축퇴성"은 인코딩된 폴리펩티드의 아미노산 서열에 영향을 주지 않고 뉴클레오티드 서열의 변이를 허용하는 유전적 코드에서의 분산 (divergence) 을 나타낸다. 숙련된 기술자는 주어진 아미노산을 구체화하기 위한 뉴클레오티드 코돈 사용 방식에서 특정 숙주 세포에 의해 나타나는 "코돈-바이어스 (codon-bias)"를 잘 인지한다. 그러므로, 숙주 세포 내의 개선된 발현을 위해 핵산을 합성하는 경우 핵산을 설계하기 위한 일부 구현예에서 코돈 이용의 빈도가 숙주 세포의 바람직한 코돈 이용의 빈도에 도달하는 것이 바람직하다.

예시적 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드 및 핵산의 기탁 번호를 U.S. 특허 제 61/013,574 의 부록 1 에 열거되어 있다 (특히 이소프렌 신타아제의 아미노산 핵산 서열, DXS, IDI 및/또는 MVA 경로 폴리펩티드 및 핵산과 관련해서, 상기 문헌의 전문이 본원에서 참고인용됨). Kegg 데이터베이스도 또한 수많은 예시적 이소프렌 신타아제의 아미노산 및 핵산 서열, DXS, IDI 및/또는 MVA 경로 폴리펩티드 및 핵산을 포함한다 (예를 들어 "www.genome.jp/kegg/pathway/map/map00100.html" 및 이 온라인에서의 서열들 참조; 이들 각각은 그 전체가 본원에서 참조 인용되며, 특히 이소프렌 신타아제의 아미노산 및 핵산 서열, DXS, IDI 및/또는 MVA 경로 폴리펩티드 및 핵산에 대해서 참조 인용되고 있음). 일부 구현예에서는, 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드 및/또는 핵산 중 하나 이상은 U.S. 특허 제 61/013,574 의 부록 1에서의 임의 기탁 번호 또는 상기 출원의 날짜로 Kegg 데이터베이스에 존재하는 임의 서열에 상응하는 임의의 서열과 같은, 2007년 12월 12일에 공식적으로 활용가능한 서열과 동일한 서열을 갖는다. 추가적인 예시적 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드 및 핵산은 하기에서 추가로 기재한다.

예시적 이소프렌 신타아제 폴리펩티드 및 핵산

상기 언급된 바와 같이, 이소프렌 신타아제 폴리펩티드는 디메틸알릴 디포스페이트 (DMAPP)를 이소프렌으로 전환시킨다. 예시적 이소프렌 신타아제 폴리펩티드는 이소프렌 신타아제 폴리펩티드의 하나 이상의 활성을 갖는, 폴리펩티드, 폴리펩티드의 절편, 펩티드, 및 융합 폴리펩티드를 포함한다. 문헌 [Silver 등., J. Biol. Chem. 270:13010-13016, 1995] 및 이 문헌 내 참조문헌 (각각 그 전문을 본원에서 참조인용함) 에서, 특히 이소프렌 신타아제 폴리펩티드 활성에 대한 검정과 관련하여 기술된 바와 같이, 세포 추출물 내 시험관 내, 또는 생체 내에서 DMAPP를 이소프렌으로 전환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법을 사용하여 폴리펩티드가 이소프렌 신타아제 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다. DMAPP (Sigma)를 질소 흐름 하에 건조되도록 증발시키고, 100 mM 인산 칼륨 버퍼 (pH 8.2) 중 100 mM의 농도로 재수화하고 -20℃에서 보관한다. 검정을 수행하기 위해, 5 ㎕의 1M MgCl₂, 1 mM (250 ㎍/㎖) DMAPP, 65 ㎕의 식물 추출 버퍼 (PEB) (50 mM Tris-HCl, pH 8.0, 20 mM MgCl₂, 5% 글리세롤 및 2 mM DTT)의 용액을 금속 나사 덮개 및 테플론 코팅된 규소 격막 (Agilent Technologies)을 갖는 20 ㎖ 상부공간 바이알 내의 25 ㎕의 세포 추출물에 첨가하고 37℃에서 15분 동안 진탕하면서 배양한다. 200 ㎕의 250 mM EDTA를 첨가하거나 또는 열 비활성화에 의해 반응을 켄칭하고, 이소프렌을 GC/MS로 정량한다.

예시적 이소프렌 신타아제 핵산은, 이소프렌 신타아제 폴리펩티드의 하나 이상의 활성을 갖는, 폴리펩티드, 폴리펩티드의 절편, 펩티드, 또는 융합 폴리펩티드를 인코딩하는 핵산을 포함한다. 예시적 이소프렌 신타아제 폴리펩티드 및 핵산은 본원에 기재된 임의의 공급원 유기체로부터의 자연 발생적 폴리펩티드 및 핵산 뿐 아니라 본원에 기재된 임의의 공급원 유기체에서 유래한 돌연변이체 폴리펩티드 및 핵산을 포함한다.

일부 구현예에서, 이소프렌 신타아제 폴리펩티드 또는 핵산은 콩과, 버드나무과 또는 참나무과로부터 유래된다. 일부 구현예에서, 이소프렌 신타아제 폴리펩티드 또는 핵산은 Pueraria montana (쿠주) 로부터 (Sharkey 등., Plant Physiology 137: 700-712, 2005), 포플러 (예컨대 Populus alba x tremula CAC35696) Miller 등., Planta 213: 483-487, 2001), 사시나무 (예컨대 Populus tremuloides) Silver 등., JBC 270(22): 13010-1316, 1995) 또는 영국 오크나무 (Quercus robur) (Zimmer 등., WO 98/02550) 의 자연-발생 폴리펩티드 또는 핵산인데, 상기 문헌 각각은 그 전문이, 특히 이소프렌 신타아제 핵산, 및 이소프렌 신타아제 폴리펩티드의 발현과 관련하여 본원에서 참조 인용되고 있다. 적합한 이소프렌 신타아제는, 이에 제한되는 것은 아니나, GenBank 기탁 번호 AY341431, AY316691, AY279379, AJ457070, 및 AY182241 (이들 각각은 그 전체가, 특히 이소프렌 신타아제 핵산 및 폴리펩티드의 서열과 관련하여 본원에서 참조인용됨) 에 의해 동정된 것이 포함된다. 일부 구현예에서, 이소프렌 신타아제 폴리펩티드 또는 핵산은 Quercus robur 로부터의 자연-발생적 폴리펩티드 또는 핵산이 아니다 (즉, 이소프렌 신타아제 폴리펩티드 또는 핵산은 Quercus robur 로부터의 자연-발생적 폴리펩티드 또는 핵산 이외의 이소프렌 신타아제 폴리펩티드 또는 핵산이다). 일부 구현예에서, 이소프렌 신타아제 핵산 또는 폴리펩티드는 포플러 (예컨대 Populus alba x tremula CAC35696) 로부터의 자연-발생적 폴리펩티드 또는 핵산이 아니다.

예시적 DXS 폴리펩티드 및 핵산

상기에 나타낸 바와 같이, 1-데옥시-D-자일룰로오즈-5-포스페이트 신타아제 (DXS) 폴리펩티드는 피루베이트 및 D-글리세르알데히드-3-포스페이트를 1-데옥시-D-자일룰로오즈-5-포스페이트로 전환한다. 예시적 DXS 폴리펩티드는, DXS 폴리펩티드의 하나 이상의 활성을 갖는, 폴리펩티드, 폴리펩티드의 절편, 펩티드, 및 융합 폴리펩티드를 포함한다. 세포 추출물 내에서 시험관내, 또는 생체내에서 피루베이트 및 D-글리세르알데히드-3-포스페이트를 1-데옥시-D-자일룰로오즈-5-포스페이트로 전환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (예, 본원에 기재된 것들)을 사용하여 폴리펩티드가 DXS 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다. 예시적 DXS 핵산은 DXS 폴리펩티드의 하나 이상의 활성을 갖는, 폴리펩티드, 폴리펩티드의 절편, 펩티드, 또는 융합 폴리펩티드를 인코딩하는 핵산을 포함한다. 예시적 DXS 폴리펩티드 및 핵산은 본원에 기재된 임의의 공급원 유기체로부터의 자연 발생적 폴리펩티드 및 핵산뿐 아니라 본원에 기재된 임의의 공급원 유기체에서 유래한 돌연변이체 폴리펩티드 및 핵산을 포함한다.

예시적 IDI 폴리펩티드 및 핵산

이소펜테닐 디포스페이트 이소머라아제 폴리펩티드 (이소펜테닐-디포스페이트 델타- 이소머라아제 또는 IDI)는 이소펜테닐 디포스페이트 (IPP) 및 디메틸알릴 디포스페이트 (DMAPP)의 상호전환 (예를 들어, IPP를 DMAPP로 전환시키고/시키거나 DMAPP를 IPP로 전환시킴)을 촉진한다. 예시적 IDI 폴리펩티드는 IDI 폴리펩티드의 하나 이상의 활성을 갖는, 폴리펩티드, 폴리펩티드의 절편, 펩티드, 및 융합 폴리펩티드를 포함한다. 세포 추출물 내에서 시험관내, 또는 생체내에서 IPP 및 DMAPP를 상호전환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (예, 본원에 기재된 것들)을 사용하여 폴리펩티드가 IDI 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다. 예시적 IDI 핵산은 IDI 폴리펩티드의 하나 이상의 활성을 갖는, 폴리펩티드, 폴리펩티드의 절편, 펩티드, 또는 융합 폴리펩티드를 인코딩하는 핵산을 포함한다. 예시적 IDI 폴리펩티드 및 핵산은 본원에 기재된 임의의 공급원 유기체로부터의 자연 발생적 폴리펩티드 및 핵산 뿐 아니라 본원에 기재된 임의의 공급원 유기체에서 유래한 돌연변이체 폴리펩티드 및 핵산을 포함한다.

예시적 MVA 경로 폴리펩티드 및 핵산

예시적 MVA 경로 폴리펩티드는 아세틸-CoA 아세틸트랜스퍼라아제 (AA-CoA 티올라아제) 폴리펩티드, 3-히드록시-3-메틸글루타릴-CoA 신타아제 (HMG-CoA 신타아제) 폴리펩티드, 3-히드록시-3-메틸글루타릴-CoA 리덕타아제 (HMG-CoA 리덕타아제) 폴리펩티드, 메발로네이트 키나아제 (MVK) 폴리펩티드, 포스포메발로네이트 키나아제 (PMK) 폴리펩티드, 디포스포메발로네이트 데카르복실라아제 (MVD) 폴리펩티드, IDI 폴리펩티드, 및 둘 이상의 MVA 경로 폴리펩티드의 활성을 갖는 폴리펩티드 (예를 들어 융합 폴리펩티드)를 포함한다. 특히, MVA 경로 폴리펩티드는 폴리펩티드, 폴리펩티드의 절편, 펩티드, 및 MVA 경로 폴리펩티드의 하나 이상의 활성을 갖는 융합 폴리펩티드를 포함한다. 예시적 MVA 경로 핵산은 MVA 경로 폴리펩티드의 하나 이상의 활성을 갖는 폴리펩티드, 폴리펩티드의 절편, 펩티드, 또는 융합 폴리펩티드를 인코딩하는 핵산을 포함한다. 예시적 MVA 경로 폴리펩티드 및 핵산은 본원에 기재된 임의의 공급원 유기체로부터의 자연 발생적 폴리펩티드 및 핵산 뿐 아니라 본원에 기재된 임의의 공급원 유기체에서 유래한 돌연변이체 폴리펩티드 및 핵산을 포함한다.

특히, 아세틸-CoA 아세틸트랜스퍼라아제 폴리펩티드 (AA-CoA 티올라아제 또는 AACT)는 두 분자의 아세틸-CoA를 아세토아세틸-CoA로 전환시킨다. 세포 추출물 내에서 시험관내, 또는 생체내에서 두 분자의 아세틸-CoA를 아세토아세틸-CoA로 전환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (예, 본원에 기재된 것들)을 사용하여 폴리펩티드가 AA-CoA 티올라아제 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다.

3-히드록시-3-메틸글루타릴-CoA 신타아제 (HMG-CoA 신타아제 또는 HMGS) 폴리펩티드는 아세토아세틸-CoA를 3-히드록시-3-메틸글루타릴-CoA로 전환시킨다. 세포 추출물 내에서 시험관내, 또는 생체내에서 아세토아세틸-CoA를 3-히드록시-3-메틸글루타릴-CoA로 전환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (예, 본원에 기재된 것들)을 사용하여 폴리펩티드가 HMG-CoA 신타아제 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다.

3-히드록시-3-메틸글루타릴-CoA 리덕타아제 (HMG-CoA 리덕타아제 또는 HMGR) 폴리펩티드는 3-히드록시-3-메틸글루타릴-CoA를 메발로네이트로 전환시킨다. 세포 추출물 내에서 시험관내, 또는 생체내에서 3-히드록시-3-메틸글루타릴-CoA를 메발로네이트로 전환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (예, 본원에 기재된 것들)을 사용하여 폴리펩티드가 HMG-CoA 리덕타아제 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다.

메발로네이트 키나아제 (MVK) 폴리펩티드는 메발로네이트를 인산화하여 메발로네이트-5-포스페이트를 형성시킨다. 세포 추출물 내에서 시험관내, 또는 생 체내에서 메발로네이트를 메발로네이트-5-포스페이트로 전환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (예, 본원에 기재된 것들)을 사용하여 폴리펩티드가 MVK 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다.

포스포메발로네이트 키나아제 (PMK) 폴리펩티드는 메발로네이트-5-포스페이트를 인산화하여 메발로네이트-5-디포스페이트를 형성시킨다. 세포 추출물 내에서 시험관내, 또는 생체내에서 메발로네이트-5-포스페이트를 메발로네이트-5-디포스페이트로 전환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (예, 본원에 기재된 것들)을 사용하여 폴리펩티드가 PMK 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다.

디포스포메발로네이트 데카르복실라아제 (MVD 또는 DPMDC) 폴리펩티드는 메발로네이트-5-디포스페이트를 이소펜테닐 디포스페이트 (IPP)로 전환시킨다. 세포 추출물 내에서 시험관내, 또는 생체내에서 메발로네이트-5-디포스페이트를 IPP로 전환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (예, 본원에 기재된 것들)을 사용하여 폴리펩티드가 MVD 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다.

핵산을 단리하기 위한 예시적 방법

이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산은 표준 방법을 사용하여 단리될 수 있다. 관심 공급원 유기체 (예를 들어 박테리아 게놈)으로부터 원하는 핵산을 수득하는 방법은 통상적인 것이며 분자 생물학계에 잘 알려져 있다 (예를 들어, WO 2004/033646 및 여기에서 인용된 참고문헌들 참조하는데, 이들 각각은 특히 관심 핵산의 단리에 대해 그 전문이 참고문헌으로 포함됨). 예를 들어, 핵산의 서열이 공지되어 있다면 (예를 들어 본원에 기재된 임의의 공지된 핵산), 제한 엔도뉴클레아제 분쇄에 의해 적합한 게놈 라이브러리가 생성될 수 있으며, 원하는 핵산 서열에 상보적인 프로브로 스크리닝될 수 있다. 서열이 단리되고 나면, 적절한 벡터를 사용하는 형질전환에 적합한 양의 DNA가 수득되도록 폴리머라아제 연쇄 반응 (PCR)과 같은 표준 프라이머 지정 증폭 방법을 사용하여 DNA를 증폭할 수 있다 (미국 특허 제 4,683,202 호; 특히 PCR 방법에 대해 그 전문이 참고문헌으로 포함됨). 대안적으로는, 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산 (예를 들어 공지된 핵산 서열을 갖는, 임의 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산)은 표준 방법을 사용하여 화학적으로 합성될 수 있다.

본원에서 기술된 조성물 및 방법에서 사용되기에 적합할 수 있는 추가적인 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드 및 핵산은 표준 방법을 이용해 동정될 수 있다. 예를 들어, 이소프렌을 자연적으로 생성하는 것으로 공지된 유기체의 염색체 DNA의 코스미드 (cosmid) 라이브러리는 대장균과 같은 유기체에서 구축된 후 이소프렌 생성에 대해 스크리닝될 수 있다. 이소프렌 신타아제, DXS, IDI, 및/또는 MVA 경로 핵산을 수득하는 추가 방법에는, 검정 (예컨대, 본원에 기술한 상부공간 검정) 또는 보존된 길이의 아미노산 (예를 들어 3 이상의 보존된 아미노산)을 인코딩하는 뉴클레오티드에 대해 지정된 프라이머를 사용하는 PCR에 의한 메타게놈 라이브러리 스크리닝을 포함한다. 보존된 아미노산은 공지된 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드의 아미노산 서열을 정렬함으로써 확인될 수 있다. 이소프렌 신타아제 폴리펩티드에 대한 보존된 아미노산은 공지된 이소프렌 신타아제 폴리펩티드의 정렬된 서열을 기초로 하여 확인될 수 있다. 이소프렌을 자연적으로 생성하는 것으로 발견된 유기체는 표준 단백질 정제 방법 (당업계에 익히 공지됨)에 적용될 수 있으며, 생성된 정제 폴리펩티드는 표준 방법을 사용하여 서열화될 수 있다. 다른 방법이 문헌에서 발견된다 (예를 들어, Julsing 등, Applied. Microbiol. Biotechnol. 75: 1377-84, 2007; Withers 등, Appl Environ Microbiol. 73(19):6277-83, 2007 참조; 특히 이 문헌 각각은 이소프렌의 합성에 관여하는 핵산의 동정에 대해서 그 전문이 참고문헌으로 포함됨).

추가적으로, 표준 서열 정렬 및/또는 구조 예측 프로그램을 사용하여, 제 1차 및/또는 예측된 폴리펩티드 제 2차 구조와 공지된 DXS, IDI, 또는 MVA 경로 폴리펩티드 및 핵산의 구조와의 유사성을 기초로 하여 추가적인 DXS, IDI, 또는 MVA 경로 폴리펩티드 및 핵산을 확인할 수 있다. swissprot-trembl 데이터베이스 ("www.expasy.org", Swiss Institute of Bioinformatics Swiss-Prot group CMU - 1 rue Michel Servet CH- 1211 Geneva 4, Switzerland)와 같은 표준 데이터베이스를 또한 사용하여 이소프렌 신타아제, DXS, IDI, 또는 MVA 경로 폴리펩티드 및 핵산을 동정할 수 있다. PredictProtein (Rost et al., The PredictProtein Server. Nucleic Acids Research 32(Web Server issue):W321-W326, 2004)과 같은 표준 구조 예측 프로그램의 디폴트 설정을 사용하여 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드의 제 2차 및/또는 제 3차 구조를 예측할 수 있다. 대안적으로, 표준 방법을 사용하여 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드의 실제적인 제 2차 및/또는 제 3차 구조가 측정될 수 있다. 공지된 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산으로부터 생성된 프로브에 대한 혼성화에 의해 추가적인 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산이 또한 동정될 수 있다.

예시적 프로모터 및 벡터

본원에 기재된 임의의 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 하나 이상의 벡터에 포함될 수 있다. 따라서, 본원에서 기재된, 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드 중 임의의 것을 인코딩하는 하나 이상의 핵산을 갖는 벡터를 나타낸다. 본원에서 사용되는 바와 같이, "벡터"는 숙주 세포에서 하나 이상의 관심 핵산을 전달하고 바람직하게는 발현시킬 수 있는 구축물을 의미한다. 벡터의 예에는 비제한적으로, 플라스미드, 바이러스 벡터, DNA 또는 RNA 발현 벡터, 코스미드 및 파지 벡터가 포함된다. 일부 구현예에서는, 벡터는 발현 조절 서열의 조절 하에 핵산을 함유한다.

본원에서 사용되는 바와 같이, "발현 조절 서열"은 관심 핵산의 전사를 지시하는 핵산 서열을 의미한다. 발현 조절 서열은 구성성 또는 유도성 프로모터와 같은 프로모터, 또는 인핸서일 수 있다. "유도성 프로모터"는 환경 또는 발달 조절 하에 활성인 프로모터이다. 발현 조절 서열은 전사될 핵산 분절에 작동가능하게 연결된다.

일부 구현예에서는, 벡터는 선별 마커를 포함한다. 용어 "선별 마커"는 도입된 핵산 또는 벡터를 포함하는 이들 숙주 세포의 선별을 용이하게 하는 숙주 세포에서 발현될 수 있는 핵산을 나타낸다. 선별가능한 마커의 예에는 비제한적으로, 항생제 내성 핵산 (예를 들어 카나마이신, 암피실린, 카르베니실린, 겐타마이신, 하이그로마이신, 플레오마이신, 블레오마이신, 네오마이신 또는 클로람페니콜) 및/또는 숙주 세포에 영양 이득과 같은 대사작용 이득을 부여하는 핵산이 포함된다. 일부 구현예에서는, 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 선별 마커 없이 세포의 염색체에 혼입된다.

적합한 벡터는 사용되는 숙주 세포와 호환 가능한 것들이다. 적합한 벡터는, 예를 들어 박테리아, 바이러스 (예를 들어 박테리오파지 T7 또는 M-13 유래 파지), 코스미드, 효모 또는 식물에서 유래할 수 있다. 이러한 벡터를 수득하고 사용하기 위한 프로토콜은 당업자에게 공지되어 있다 (예를 들어 Sambrook 등, Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor, 1989 참조; 특히 벡터의 사용에 대해 그 전문이 참고문헌으로 포함됨).

프로모터는 당업계에 익히 공지되어 있다. 숙주 세포에서 기능하는 임의의 프로모터는 숙주 세포 내의 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산의 발현에 사용될 수 있다. 다양한 숙주 세포에서 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산의 발현을 유발하는데 유용한 개시 조절 영역 또는 프로모터가 많이 존재하며 이는 당업자에게 익숙한 것이다 (예를 들어, WO 2004/033646 및 그의 참고문헌들 참조; 특히 관심 핵산의 발현을 위한 벡터에 대해 그 전문이 참고문헌으로 각각 포함됨). 비제한적으로 lac, trp, λP_L, λP_R, T7, tac, 및 trc (E. coli 내 발현에 유용함) 를 비롯한, 이들 핵산을 유발할 수 있는 사실상 임의의 프로모터가 본 발명에 적합하다.

일부 구현예에서는, 글루코오스 이소머라아제 프로모터가 사용된다 (예를 들어 미국 특허 제 7,132,527 호 및 그에 인용된 참고문헌들 참조; 특히 관심 폴리펩티드를 발현시키기 위한 플라스미드 시스템 및 프로모터에 대해 그 전문이 참고문헌으로 각각 포함됨). 보고된 글루코오스 이소머라아제 프로모터 돌연변이체는 글루코오스 이소머라아제 프로모터에 작동가능하게 연결된 핵산에 의해 인코딩되는 폴리펩티드의 발현 수준을 다양하게 하는데 사용될 수 있다 (미국 특허 제 7,132,527 호). 각종 구현예에서는 글루코오스 이소머라아제 프로모터가 저, 중 또는 고 카피 플라스미드 내에 포함된다 (미국 특허 제 7,132,527 호).

각종 구현예에서는 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산이 저 카피 플라스미드 (예를 들어, 세포 당 약 1 내지 약 4 카피로 유지되는 플라스미드), 중 카피 플라스미드 (예를 들어, 세포 당 약 10 내지 약 15 카피로 유지되는 플라스미드) 또는 고 카피 플라스미드 (예를 들어, 세포 당 약 50 이상의 카피로 유지되는 플라스미드) 내에 포함된다. 일부 구현예에서는, 이종 또는 가외 (extra) 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 T7 프로모터에 작동가능하게 연결된다. 일부 구현예에서는, T7 프로모터에 작동가능하게 연결되는 이종 또는 가외 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 중 또는 고 카피 플라스미드 내에 포함된다. 일부 구현예에서는, 이종 또는 가외 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 Trc 프로모터에 작동가능하게 연결된다. 일부 구현예에서는, Trc 프로모터에 작동가능하게 연결되는 이종 또는 가외 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 중 또는 고 카피 플라스미드 내에 포함된다. 일부 구현예에서는, 이종 또는 가외 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 Lac 프로모터에 작동가능하게 연결된다. 일부 구현예에서는, Lac 프로모터에 작동가능하게 연결되는 이종 또는 가외 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 저 카피 플라스미드 내에 포함된다. 일부 구현예에서는, 이종 또는 가외 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 내인성 에스케리키아, 판토에아 , 바실러스 , 야로위야 , 스트렙토마이세스 또는 트리코데르마 프로모터, 또는 내인성 알칼리 세린 프로테아제, 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 프로모터와 같은 내인성 프로모터에 작동가능하게 연결된다. 일부 구현예에서는, 내인성 프로모터에 작동가능하게 연결되는 이종 또는 가외 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 고 카피 플라스미드 내에 포함된다. 일부 구현예에서는, 벡터는 세포 내의 염색체에 혼입되지 않는 복제 플라스미드이다. 일부 구현예에서는, 벡터의 일부 또는 전부가 세포 내의 염색체에 혼입된다.

일부 구현예에서는, 발현 벡터는 또한 종결 서열을 포함한다. 종결 조절 영역은 또한 숙주 세포에 대해 천연적인 다양한 유전자에서 유래할 수 있다. 일부 구현예에서는, 종결 서열 및 프로모터 서열은 동일한 근원에서 유래한다. 또 다른 구현예에서는, 종결 서열은 숙주 세포에 대해 내인성이다.

일부 구현예에서는, 프로모터, 코딩 영역, 및 터미네이터는 모두 발현될 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산으로부터 기원한다. 일부 구현예에서는, 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산에 대한 코딩 영역은 발현 구축 프로모터 및 터미네이터 서열의 전사적 조절 하에 있도록 범용 발현 벡터에 삽입된다. 일부 구현예에서는, 유전자 또는 이의 부분은 강력한 cbh1 프로모터의 삽입된 하류이다.

이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 표준 기술을 사용하여 발현 벡터와 같은 벡터에 혼입될 수 있다 (Sambrook 등, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, 1982; 특히 적절한 DNA 서열의 스크리닝 및 벡터 구축에 대해 그 전문이 참고문헌으로 포함됨). 관심 핵산 (예를 들어 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산), 프로모터, 터미네이터 및 기타 서열을 포함하는 DNA 구축물을 라이게이션하고 이들을 적합한 벡터에 삽입하는 방법은 당업계에 익히 공지되어 있다. 예를 들어, 제한 효소는 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산 및 벡터를 절단하는데 사용될 수 있다. 이후, 절단된 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산, 및 절단된 벡터의 양립성 말단이 라이게이션될 수 있다. 일반적으로, 편리한 제한 부위에서의 라이게이션에 의해 연결이 일어난다. 이러한 부위가 존재하지 않는다면, 통상적인 실행에 따라 합성 올리고뉴클레오티드 링커를 사용한다 (Sambrook 등, Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor, 1989, 및 Bennett and Lasure, More Gene Manipulations in Fungi, Academic Press, San Diego, pp 70-76, 1991; 특히 올리고뉴클레오티드 링커에 대해 그 전문이 참고문헌으로 각각 포함됨). 추가적으로, 벡터는 공지된 재조합 기술을 사용하여 구축될 수 있다 (예를 들어, Invitrogen Life Technologies, Gateway Technology).

일부 구현예에서는, 자연 발생적 세포에서 현재 발견되는 것보다 훨씬 더 높은 수준으로 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산을 과발현시키는 것이 바람직할 수 있다. 이러한 결과는 이들 폴리펩티드를 인코딩하는 핵산을 멀티카피 플라스미드 내로 선택적으로 클로닝하거나 이들 핵산을 강력한 유도성 또는 구성성 프로모터 하에 둠으로써 성취될 수 있다. 바람직한 폴리펩티드를 과발현시키는 방법은 통상적이고 분자 생물학계에 익히 공지되어 있으며, 그 예를 [Sambrook 등, Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor, 1989] (특히 클로닝 기술에 대해 그 전문이 참고문헌으로 포함됨)에서 발견할 수 있다.

하기의 방책은 본 발명에 따른 유용한 추가적인 일반적 방법론의 설명을 포함한다: Kreigler, Gene Transfer and Expression; A Laboratory Manual, 1990; 및 Ausubel 등., Eds. Current Protocols in Molecular Biology, 1994 (이들 각각은 그 전문을, 특히 분자 생물학 및 클로닝 기술에 대해 본원에서 참조 인용됨).

예시적 공급원 유기체

이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산 (및 이의 인코딩된 폴리펩티드)는 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산을 자연적으로 함유하는 임의 유기체로부터 수득될 수 있다. 상기 나타낸 바와 같이, 이소프렌은 박테리아, 효모, 식물 및 동물과 같은 다양한 유기체에 의해 자연적으로 형성된다. 유기체는 이소프렌을 생성하기 위해 MVA 경로, DXP 경로, 또는 MVA 및 DXP 경로 모두를 포함한다 (도 15). 따라서 DXS 핵산은 예를 들어, DXP 경로를 포함하거나 MVA 및 DXP 경로를 모두 포함하는 임의 유기체로부터 수득될 수 있다. IDI 및 이소프렌 신타아제 핵산은 예를 들어, MVA 경로, DXP 경로, 또는 MVA 및 DXP 경로 모두를 포함하는 임의 유기체로부터 수득될 수 있다. MVA 경로 핵산은 예를 들어, MVA 경로를 포함하거나 MVA 및 DXP 경로를 모두 포함하는 임의의 유기체로부터 수득될 수 있다.

일부 구현예에서는, 이소프렌 신타아제의 핵산 서열, DXS, IDI 또는 MVA 경로 핵산 서열은 자연에서의 하기 임의의 유기체에 의해 생성되는 핵산의 서열과 동일하다. 일부 구현예에서는, 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드의 아미노산 서열은 자연에서의 하기 임의의 유기체에 의해 생성되는 폴리펩티드의 서열과 동일하다. 일부 구현예에서는, 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산 또는 폴리펩티드는 본원에서 기재된 임의 유기체에서 유래하는 돌연변이체 핵산 또는 폴리펩티드이다. 본원에서 사용되는 바와 같이, "~에서 유래하는"은 하나 이상의 돌연변이가 도입되는 핵산 또는 폴리펩티드의 공급원을 나타낸다. 예를 들어, "식물 폴리펩티드에서 유래하는" 폴리펩티드는 하나 이상의 돌연변이가 야생형 식물 폴리펩티드의 서열 (즉 자연적으로 발생하는 서열)에 도입되어 야기되는 관심 폴리펩티드를 나타낸다.

일부 구현예에서, 공급원 유기체는 박테리아, 예컨대 균주 에스케리키아 (Escherichia; 예, E. coli), 또는 균주 바실러스 (Bacillus ; 예, B. 서브틸리스) 이다.

본원에서 사용되는 바와 같이, "에스케리키아 속" 이란, E. coli (대장균), E. 아데카르복실라타 (E. adecarboxylata ), E. 알베르티이 (E. albertii ), E. 블라태 (E. blattae ), E. 페르구소닐 (E. fergusonii ), E. 헤르만니이 (E. hermannii ), E. 세네갈렌시스 (E. senegalensis ), 및 E. 불네리스 (E. vulneris ) 을 포함하나 이로 제한되는 것은 아닌 당업자에게 공지된 바와 같은 속 "에스케리키아" 내 모든 종을 포괄한다. 속 "에스케리키아" 는 그람-음성, 포자를 형성하지 않는, 조건 혐기성, 막대형 박테리아로 정의되며, 이는 엔테로박테리아세애 (Enterobacteriaceae) 과, 엔테로박테리아레스 ( Enterobacteriales ) 목, 감마 프로테오박테리아 ( Gamma Proteobacteria ) 강의 구성원으로서 분류된다.

본원에서 사용되는 바와 같이, "바실러스 속" 이란, B. 서브틸리스 (B. subtilis), B. 리체니포르미스 (B. licheniformis ), B. 렌투스 (B. lentus ), B. 브 레비스 (B. brevis ), B. 스테아로써모필루스 (B. stearothermophilus ), B. 알칼로필루스 (B. alkalophilus ), B. 아밀로리쿠에파시엔스 (B. amyloliquefaciens ), B. 클라우시 (B. clausii ), B. 할로두란스 (B. halodurans ), B. 메가테리움 (B. megaterium), B. 코아굴란스 (B. coagulans ), B. 써쿨란스 (B. circulans ), B. 라우투스 (B. lautus ) 및 B. 투링기엔시스 (B. thuringiensis )를 포함하나 이로 제한되는 것은 아닌 당업자에게 공지된 바와 같은 속 "바실러스" 내의 모든 종들을 포함한다. 바실러스 속이 분류학적 개편을 계속하여 거치고 있다는 것이 인지된다. 따라서, 속에는 현재 "지오바실러스 스테아로써모필루스 ( Geobacillus stearothermophilus)"로 명명되는 B. 스테아로써모필루스와 같은 유기체를 비제한적으로 포함하는 재분류된 종이 포함되는 것으로 의도된다. 산소의 존재 하에 내성 내생포자가 생성되는 것은 바실러스 속의 특징을 정의하는 것으로 고려되지만, 이러한 특징은 또한 최근 명명된 알리시클로바실러스 ( Alicyclobacillus ), 암 피바실러스 ( Amphibacillus ), 아뉴리니바실러스 ( Aneurinibacillus ), 아녹시바실러스 ( Anoxybacillus ), 브레비바실러스 ( Brevibacillus ), 필로바실러스 (Filobacillus), 그라실리바실러스 ( Gracilibacillus ), 할로바실러스 (Halobacillus), 파에니바실러스 ( Paenibacillus ), 살리바실러스 ( Salibacillus ), 써모바실러스 ( Thermobacillus ), 우레이바실러스 ( Ureibacillus ) 및 비르기바실러스 ( Virgibacillus )에 적용된다.

예시적 숙주 세포

다양한 숙주 세포가 사용되어 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드를 발현시키고 발명에 청구된 방법으로 이소프렌을 생성시킬 수 있다. 예시적 숙주 세포는 제목 "예시적 공급원 유기체" 하의 이전 부분에 열거된 임의의 유기체로부터의 세포를 포함한다. 숙주 세포는 자연적으로 이소프렌을 생성하는 세포 또는 자연적으로 이소프렌을 생성하지 않는 세포일 수 있다. 일부 구현예에서는, 숙주 세포는 DXP 경로를 사용하여 자연적으로 이소프렌을 생성하고, 이러한 경로를 사용하는 이소프렌의 생성이 강화되도록 이소프렌 신타아제, DXS 및/또는 IDI 핵산이 첨가된다. 일부 구현예에서는, 숙주 세포는 MVA 경로를 사용하여 자연적으로 이소프렌을 생성하고, 이러한 경로를 사용하는 이소프렌의 생성이 강화되도록 이소프렌 신타아제 및/또는 하나 이상의 MVA 경로 핵산이 첨가된다. 일부 구현예에서는, 숙주 세포는 DXP 경로를 사용하여 자연적으로 이소프렌을 생성하고, MVA 경로 뿐 아니라 DXP 경로의 일부 또는 전부를 사용하여 이소프렌이 생성되도록 하나 이상의 MVA 경로 핵산이 첨가된다. 일부 구현예에서는, 숙주 세포는 DXP 및 MVA 경로 모두를 사용하여 자연적으로 이소프렌을 생성하고, 이들 경로 중 하나 또는 둘 모두에 의한 이소프렌의 생성이 강화되도록 하나 이상의 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산이 첨가된다.

예시적 형질전환 방법

이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산 또는 이를 함유하는 벡터는 인코딩된 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드의 발현을 위한 표준 기술을 사용하여 숙주 세포 (예를 들어 박테리아 세포)에 삽입될 수 있다. DNA 구축물 또는 벡터를 숙주 세포에 도입하는 것은 형질전환, 전기천공, 핵 미량주사, 형질도입, 트랜스펙션 (예를 들어, 리포펙틴 매개 또는 DEAE-덱스트린 매개 트랜스펙션 또는 재조합 파지 바이러스를 사용하는 트랜스펙션), 인산칼슘 DNA 침전물로의 인큐베이션, DNA-코팅된 미세사출물로의 고속 충격 및 원형질체 융합과 같은 기술을 사용하여 수행될 수 있다. 일반적인 형질전환 기술은 당업계에 공지되어 있다 (예를 들어, Current Protocols in Molecular Biology (F. M. Ausubel 등. (eds) Chapter 9, 1987; Sambrook 등, Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor, 1989; 및 Campbell 등, Curr. Genet. 16:53-56, 1989 참조; 특히 형질전환 방법에 대해 그 전문이 참고문헌으로 각각 포함됨). 도입된 핵산은 염색체 DNA에 혼입되거나 염색체외 복제 서열로서 유지될 수 있다.

예시적 세포 배양 배지

본 발명은 또한 이소프렌을 생성하는 배양물 내의 세포 집단 또는 세포를 포함한다. "배양물 내의 세포"는 세포가 하나 이상의 세포 분열을 거치도록 하는 용액 (예를 들어 세포 배지) 내의 둘 이상의 세포를 의미한다. "배양물 내의 세포"에는 식물 조직으로 분화된 세포를 함유하는 살아있는 다세포성 식물의 일부인 식물 세포가 포함되지 않는다. 각종 구현예에서, 세포 배양물에는 적어도 또는 약 10, 20, 50, 100, 200, 500, 1,000, 5,000, 10,000개 이상의 세포가 포함된다.

임의의 탄소원이 숙주 세포를 배양하는데 사용될 수 있다. 용어 "탄소원"은 숙주 세포 또는 유기체에 의해 신진 대사될 수 있는 하나 이상의 탄소-함유 화합물을 나타낸다. 예를 들어, 숙주 세포를 배양하는데 사용되는 세포 배지는 숙주 세포의 생존성 또는 성장을 유지시키기에 적합한 임의의 탄소원을 포함할 수 있다.

일부 구현예에서는, 탄소원은 탄수화물 (예를 들어 단당류, 이당류, 올리고당류 또는 다당류), 반전당 (예를 들어 효소적으로 처리된 수크로오스 시럽), 글리세롤, 글리세린 (예를 들어 바이오디젤 또는 비누-제조 공정의 글리세린 부산물), 디히드록시아세톤, 1-탄소원, 지방산 (예를 들어 포화 지방산, 불포화 지방산 또는 다중불포화 지방산), 지질, 인지질, 글리세롤지질, 모노글리세리드, 디글리세리드, 트리글리세리드, 폴리펩티드 (예를 들어 미생물 또는 식물 단백질 또는 펩티드), 재생가능 탄소원 (예를 들어 가수분해된 바이오매스 탄소원과 같은 바이오매스 탄소원), 효모 추출물, 효모 추출물로부터의 성분, 중합체, 산, 알코올, 알데히드, 케톤, 아미노산, 숙시네이트, 락테이트, 아세테이트, 에탄올 또는 전술한 것 중 둘 이상의 임의 조합이다. 일부 구현예에서는, 탄소원은 비제한적으로 글루코오스를 포함하는 광합성의 산물이다.

예시적 단당류는 글루코오스 및 프룩토오스를 포함한다; 예시적 올리고당류는 락토오스 및 수크로오스를 포함하고, 예시적 다당류는 녹말 및 셀룰로오스를 포함한다. 예시적 탄수화물은 C6 당 (예를 들어 프룩토오스, 만노오스, 갈락토오스 또는 글루코오스) 및 C5 당 (예를 들어 자일로오스 또는 아라비노오스)을 포함한다. 일부 구현예에서는, 세포 배지는 탄수화물 뿐 아니라 탄수화물 외의 탄소원 (예를 들어 글리세롤, 글리세린, 디히드록시아세톤, 1-탄소원, 지방산, 지질, 인지질, 글리세롤지질, 모노글리세리드, 디글리세리드, 트리글리세리드, 재생가능 탄소원, 또는 효모 추출물로부터의 성분)을 포함한다. 일부 구현예에서는, 세포 배지는 탄수화물 뿐 아니라 폴리펩티드 (예를 들어 미생물 또는 식물 단백질 또는 펩티드)를 포함한다. 일부 구현예에서는, 미생물 폴리펩티드는 효모 또는 박테리아로부터의 폴리펩티드이다. 일부 구현예에서는, 식물 폴리펩티드는 콩, 옥수수, 카놀라, 자트로파, 야자, 땅콩, 해바라기, 코코넛, 겨자, 평지씨, 목화씨, 야자 핵, 올리브, 잇꽃, 참깨 또는 아마인으로부터의 폴리펩티드이다.

일부 구현예에서는, 탄수화물의 농도는 적어도 또는 약 10, 15, 20, 30, 40, 50, 60, 80, 100, 150, 200, 300, 400 g/L 이상과 같은 브로쓰 (broth) ℓ 당 적어도 또는 약 5 g 이상이다 (g/L, 브로쓰의 부피에는 세포 배지의 부피 및 세포의 부피가 모두 포함됨). 일부 구현예에서는, 탄수화물의 농도는 약 50 내지 약 400 g/L, 예를 들어 약 100 내지 약 360 g/L, 약 120 내지 약 360 g/L, 또는 약 200 내지 약 300 g/L이다. 일부 구현예에서는, 탄수화물의 농도는 숙주 세포의 배양 전 및/또는 배양 동안에 첨가되는 탄수화물 총량을 포함한다.

예시적 지질은 포화, 불포화 또는 분지된 C4 및 초과의 지방산인 하나 이상의 지방산을 함유하는 임의의 물질이다.

예시적 지방산은 "R"이 탄화수소인 화학식 RCOOH의 화합물을 포함한다. 예시적 불포화 지방산은 "R"이 하나 이상의 탄소-탄소 이중 결합을 포함하는 화합물을 포함한다. 예시적 불포화 지방산은 비제한적으로, 올레산, 박센산, 리놀렌산, 팔미텔라이딘산 및 아라키돈산을 포함한다. 예시적 다중불포화 지방산은 "R"이 다수의 탄소-탄소 이중 결합을 포함하는 화합물을 포함한다. 예시적 포화 지방산은 "R"이 포화 지방족기인 화합물을 포함한다. 일부 구현예에서는, 탄소원은 하나 이상의 C₁₂-C₂₂ 지방산, 예를 들어 C₁₂ 포화 지방산, C₁₄ 포화 지방산, C₁₆ 포화 지방산, C₁₈ 포화 지방산, C₂₀ 포화 지방산 또는 C₂₂ 포화 지방산을 포함한다. 예시적 구현예에서는 지방산이 팔미트산이다. 일부 구현예에서는, 탄소원은 지방산 (예를 들어 불포화 지방산)의 염, 지방산 (예를 들어 불포화 지방산)의 유도체 또는 지방산 (예를 들어 불포화 지방산)의 유도체의 염이다. 적합한 염은 비제한적으로 리튬 염, 칼륨 염, 나트륨 염 등을 포함한다. 디- 및 트리글리세롤은 글리세롤의 지방산 에스테르이다.

일부 구현예에서는, 지질, 지방산, 모노글리세리드, 디글리세리드 또는 트리글리세리드의 농도는 적어도 또는 약 5, 10, 15, 20, 30, 40, 50, 60, 80, 100, 150, 200, 300, 400 g/L 이상과 같은 브로쓰 ℓ 당 적어도 또는 약 1 g (g/L, 브로쓰의 부피에는 세포 배지의 부피 및 세포의 부피가 모두 포함됨)이다. 일부 구현예에서는, 지질, 지방산, 모노글리세리드, 디글리세리드 또는 트리글리세리드의 농도는 약 10 내지 약 400 g/L, 예를 들어 약 25 내지 약 300 g/L, 약 60 내지 약 180 g/L, 또는 약 75 내지 약 150 g/L이다. 일부 구현예에서는, 농도는 숙주 세포 배양 전 및/또는 배양 동안 첨가되는 지질, 지방산, 모노글리세리드, 디글리세리드 또는 트리글리세리드 총량을 포함한다. 일부 구현예에서는, 탄소원은 (i) 지질, 지방산, 모노글리세리드, 디글리세리드 또는 트리글리세리드 및 (ii) 글루코오스와 같은 탄수화물을 모두 포함한다. 일부 구현예에서는, 지질, 지방산, 모노글리세리드, 디글리세리드 또는 트리글리세리드 대 탄수화물의 비율은 탄소 기준으로 약 1:1이다 (즉, 탄수화물 탄소 당 지질, 지방산, 모노글리세리드, 디글리세리드 또는 트리글리세리드 내의 하나의 탄소). 특정 구현예에서, 지질, 지방산, 모노글리세리드, 디글리세리드 또는 트리글리세리드의 양은 약 60 내지 180 g/L이고, 탄수화물의 양은 약 120 내지 360 g/L이다.

예시적 미생물 폴리펩티드 탄소원은 효모 또는 박테리아로부터의 하나 이상의 폴리펩티드를 포함한다. 예시적 식물 폴리펩티드 탄소원은 콩, 옥수수, 카놀라, 자트로파, 야자, 땅콩, 해바라기, 코코넛, 겨자, 평지씨, 목화씨, 야자 핵, 올리브, 잇꽃, 참깨 또는 아마인으로부터의 하나 이상의 폴리펩티드를 포함한다.

예시적 재생가능 탄소원은 치즈 유장 투과물, 옥수수 침지수, 사탕무 당밀, 보리 맥아, 및 전술한 임의의 것으로부터의 성분을 포함한다. 예시적 재생가능 탄소원은 또한 옥수수, 지팽이풀 (switchgrass), 사탕수수, 발효 공정의 세포 폐기물, 및 콩, 옥수수 또는 밀의 제분으로부터의 단백질 부산물과 같은 바이오매스 내에 존재하는 아세테이트, 글루코오스, 헥소오스, 펜토오스 및 자일로오스를 포함한다. 일부 구현예에서는, 바이오매스 탄소원은 비제한적으로 풀, 밀, 밀짚, 바가스, 사탕수수 바가스, 침엽수 펄프, 옥수수, 옥수수 속대 또는 껍질 (husk), 옥수수 핵 (corn kernel), 옥수수 핵으로부터의 섬유, 옥수수대, 지팽이풀, 벼 외피 산물, 또는 곡물 (예를 들어 옥수수, 수수, 호밀, 트리티케이트 (triticate), 보리, 밀, 및/또는 증류 곡물)의 습식 또는 건식 제분으로부터의 부산물과 같은 리그노셀룰로오스, 헤미셀룰로오스 또는 셀룰로오스 물질이다. 예시적 셀룰로오스 물질은 목재, 종이 및 펄프 폐기물, 초본 식물 및 과일 펄프를 포함한다. 일부 구현예에서는, 탄소원은 줄기, 낟알, 뿌리 또는 덩이줄기와 같은 임의 식물 부분을 포함한다. 일부 구현예에서는, 임의의 하기 식물의 전부 또는 일부가 탄소원으로서 사용된다: 옥수수, 밀, 호밀, 수수, 트리티테케이트, 쌀, 기장, 보리, 카사바, 콩, 완두와 같은 콩류, 감자, 고구마, 바나나, 사탕수수 및/또는 타피오카. 일부 구현예에서는, 탄소원은 자일로오스 및 글루코오스를 모두 포함하거나 수크로오스 및 글루코오스를 모두 포함하는 바이오매스 가수분해물과 같은 바이오매스 가수분해물이다.

일부 구현예에서는, 재생가능 탄소원 (예를 들어 바이오매스)은 세포 배양 배지에 첨가되기 전 사전처리된다. 일부 구현예에서는, 사전처리는 효소적 사전처리, 화학적 사전처리 또는 효소적 및 화학적 사전처리 모두의 조합을 포함한다 (예를 들어 Farzaneh 등, Bioresource Technology 96 (18): 2014-2018, 2005; 미국 특허 제 6,176,176 호; 미국 특허 제 6,106,888 호; 특히 재생가능 탄소원의 사전처리에 대해 그 전문이 참고문헌으로 각각 포함됨). 일부 구현예에서는, 재생가능 탄소원은 세포 배양 배지에 첨가되기 전 부분적으로 또는 완전히 가수분해된다.

일부 구현예에서는, 재생가능 탄소원 (예를 들어 옥수수대)은 세포 배양 배지에 첨가되기 전 암모니아 섬유 팽창 (AFEX) 사전처리를 거친다 (예를 들어 Farzaneh 등, Bioresource Technology 96 (18): 2014-2018, 2005). AFEX 사전처리 동안, 재생가능 탄소원은 온건한 온도 (예를 들어 약 60 내지 약 100℃) 및 고압 (예를 들어 약 250 내지 약 300 psi)에서 약 5분 동안 액체 무수 암모니아로 처리된다. 이후, 압력을 빠르게 해제시킨다. 이러한 방법에서, 리그닌 용해화, 헤미셀룰로오스 가수분해, 셀룰로오스 탈결정화 및 증가된 표면적의 조합된 화학적 및 물리적 효과는 셀룰로오스 및 헤미셀룰로오스가 발효가능 당으로 거의 완전하게 효소적으로 전환되게 한다. AFEX 사전처리는 거의 모든 암모니아가 회수되고 재사용될 수 있는 한편, 하류 방법에서 미생물에 대한 질소원으로서 역할하는 것으로 남아있다는 이점을 갖는다. 또한, 세정 흐름은 AFEX 사전처리에 필요하지 않다. 따라서, AFEX 처리 이후 건조 물질 회수는 본질적으로 100%이다. AFEX는 기본적으로 건조 대 건조 방법이다. 처리된 재생가능 탄소원은 장기간에 적합하며, 효소적 가수분해 또는 발효 방법에서 매우 높은 고체 적재로 공급될 수 있다. 셀룰로오스 및 헤미셀룰로오스는 분해가 없거나 거의 없이 AFEX 방법에서 잘 보존된다. AFEX 사전처리를 거친 재생가능 탄소원의 효소적 가수분해 전에 중화할 필요는 없다. AFEX-처리된 탄소원의 효소적 가수분해는 후속 발효 사용을 위한 깨끗한 당 흐름을 만들어낸다.

일부 구현예에서는, 탄소원 (예를 들어 재생가능 탄소원)의 농도는 적어도 또는 약 0.1, 0.5, 1, 1.5, 2, 3, 4, 5, 10, 15, 20, 30, 40 또는 50% 글루코오스 (w/v)와 동등하다. 탄소원으로부터 생성된 글루코오스의 양을 측정하기 위해 참조로서 글루코오스를 사용하는 표준 HPLC 방법을 사용하여 동량의 글루코오스를 측정할 수 있다. 일부 구현예에서는, 탄소원 (예를 들어 재생가능 탄소원)의 농도는 약 0.1 내지 약 20% 글루코오스, 예를 들어 약 0.1 내지 약 10% 글루코오스, 약 0.5 내지 약 10% 글루코오스, 약 1 내지 약 10% 글루코오스, 약 1 내지 약 5% 글루코오스, 또는 약 1 내지 약 2% 글루코오스와 동등하다.

일부 구현예에서는, 탄소원은 효모 추출물 또는 효모 추출물의 하나 이상의 성분을 포함한다. 일부 구현예에서는, 효모 추출물의 농도는 적어도 또는 약 5, 10, 15, 20, 30, 40, 50, 60, 80, 100, 150, 200, 300 g/L 이상과 같은 브로쓰의 ℓ 당 효모 추출물 1 g 이상 (g/L, 브로쓰의 부피에는 세포 배지의 부피 및 세포의 부피가 모두 포함됨)이다. 일부 구현예에서는, 효모 추출물의 농도는 약 1 내지 약 300 g/L, 예를 들어 약 1 내지 약 200 g/L, 약 5 내지 약 200 g/L, 약 5 내지 약 100 g/L, 또는 약 5 내지 약 60 g/L이다. 일부 구현예에서는, 농도는 숙주 세포의 배양 전 및/또는 배양 동안에 첨가되는 효모 추출물 총량을 포함한다. 일부 구현예에서는, 탄소원은 효모 추출물 (또는 이의 하나 이상의 성분) 및 글루코오스와 같은 또 다른 탄소원을 모두 포함한다. 일부 구현예에서는, 효모 추출물 대 다른 탄소원의 비율은 약 1:5, 약 1:10 또는 약 1:20 (w/w)이다.

추가적으로 탄소원은 또한 이산화탄소 또는 메탄올과 같은 1-탄소원 기질일 수 있다. 단일 탄소원 (예를 들어 메탄올, 포름알데히드 또는 포르메이트)로부터 글리세롤을 생성하는 것은 메탄올자화 (methylotrophic) 효모 (Yamada 등, Agric. Biol. Chem., 53(2) 541-543, 1989; 특히 탄소원에 대해 그 전문이 참고문헌으로 포함됨) 및 박테리아 (Hunter 등, Biochemistry, 24, 4148-4155, 1985; 특히 탄소원에 대해 그 전문이 참고문헌으로 포함됨)에서 보고된 바 있다. 이들 유기체는 메탄에서 포르메이트로의 산화 상태 범위에 있는 단일 탄소 화합물을 동화시키고 글리세롤을 생성시킬 수 있다. 탄소 동화의 경로는 리불로오스 모노포스페이트, 세린, 또는 자일룰로오즈-모노포스페이트를 통한 것일 수 있다 (Gottschalk, Bacterial Metabolism, Second Edition, Springer-Verlag: New York, 1986; 특히 탄소원에 대해 그 전문이 참고문헌으로 포함됨). 리불로오스 모노포스페이트 경로는 포르메이트와 리불로오스-5-포스페이트와의 축합으로 6개 탄소 당이 형성되어 이것이 프룩토오스가 되고 마침내 3탄소 산물 글리세르알데히드-3-포스페이트가 되는 것을 포함한다. 마찬가지로, 세린 경로는 메틸렌테트라하이드로폴레이트를 통해 1-탄소 화합물을 당분해 경로에 동화시킨다.

1 또는 2개의 탄소 기질에 추가로, 메탄올자화 유기체는 메틸아민, 글루코사민 및 대사작용 활성을 위한 다양한 아미노산과 같은 화합물을 함유하는 많은 다른 탄소를 이용하는 것으로 또한 알려져 있다. 예를 들어, 메탄올자화 효모는 메틸아민으로부터의 탄소를 이용하여 트레할로오스 또는 글리세롤을 형성시키는 것으로 알려져 있다 (Bellion 등, Microb. Growth Cl Compd, [Int. Symp.], 7th ed., 415-32. Editors: Murrell 등, Publisher: Intercept, Andover, UK, 1993; 특히 탄소원에 대해 그 전문이 참고문헌으로 포함됨). 유사하게, 다양한 칸디다 종은 알라닌 또는 올레산을 신진 대사시킨다 (Suiter 등, Arch. Microbiol. 153(5), 485-9, 1990; 특히 탄소원에 대해 그 전문이 참고문헌으로 포함됨).

일부 구현예에서는, 세포는 생리적 염 및 영양을 함유하는 표준 배지에서 배양된다 (예를 들어 [Pourquie, J. 등, Biochemistry and Genetics of Cellulose Degradation, eds. Aubert 등, Academic Press, pp. 71-86, 1988] 및 [Ilmen 등, Appl. Environ. Microbiol. 63: 1298-1306, 1997]; 특히 세포 배지에 대해 그 전문이 참고문헌으로 각각 포함됨). 예시적 성장 배지는 루리아 베르타니 (Luria Bertani, LB) 브로쓰, 사브로 덱스트로오스 (Sabouraud Dextrose, SD) 브로쓰, 또는 효모 배지 (Yeast medium, YM) 브로쓰와 같은 상업적으로 제조된 통상적 배지이다. 다른 한정 또는 합성 성장 배지가 또한 사용될 수 있고, 특정 숙주 세포의 성장을 위한 적절한 배지는 미생물 또는 발효 과학계의 당업자에게 알려져 있다.

적절한 탄소원에 추가로, 세포 배지는 바람직하게는 적합한 미네랄, 염, 공동 인자, 버퍼, 및 배양물의 성장 또는 이소프렌 생성의 증진에 적합한 당업자에게 알려져 있는 기타 성분을 함유한다 (예를 들어 WO 2004/033646 및 그에 인용된 참고문헌, 및 WO 96/35796 및 그에 인용된 참고문헌; 특히 세포 배지 및 세포 배양 조건에 대해 그 전문이 참고문헌으로 각각 포함됨). 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산이 유도성 프로모터의 조절 하에 있는 일부 구현예에서는 유도제 (예를 들어 당, 금속 염 또는 살균제)를 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드의 발현을 유도하기에 효과적인 농도로 배지에 첨가하는 것이 바람직하다. 일부 구현예에서는, 세포 배지는 하나 이상의 DXS, IDI 또는 MVA 경로 핵산을 갖는 벡터 상의 항생제 내성 핵산 (예를 들어 카나마이신 내성 핵산)에 상응하는 항생제 (예를 들어 카나마이신)를 갖는다.

이소프렌의 예시적 생성

일부 구현예에서, 세포는 이 세포에 의한 이소프렌 생성을 허용하는 조건 하 배양 배지에서 배양된다. 일부 구현예에서, 배지 내 세포는, 1, 10, 25, 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1,000, 1,250, 1,500, 1,750, 2,000, 2,500, 3,000, 4,000, 5,000 이상의 정도 또는 이를 초과하는 이소프렌 nmole/세포의 습식 중량에 대한 세포 g/시간 (nmol/g_wcm/hr) 으로 이소프렌을 생성한다. 일부 구현예에서, 이소프렌의 양은 약 2 내지 약 5,000 nmole/g_wcm/hr, 예컨대 약 2 내지 약 100 nmole/g_wcm/hr, 약 100 내지 약 500 nmole/g_wcm/hr, 약 150 내지 약 500 nmole/g_wcm /hr, 약 500 내지 약 1,000 nmole/g_wcm/hr, 약 1,000 내지 약 2,000 nmole/g_wcm/hr, 또는 약 2,000 내지 약 5,000 nmole/g_wcm/hr 이다. nmole/g_wcm/hr 단위의 이소프렌 양은, 그 전문, 특히 이소프렌 생성 측정에 있어서 본원에서 참조 인용되고 있는 U.S. 특허 제 5,849, 970 호 에 개시된 바와 같이 측정될 수 있다. 예를 들어, 2 ㎖의 상부공간 (예를 들어, 밀봉된 바이알에서 32℃에서 200 rpm에서 진탕하면서 약 3시간 동안 배양된 2 ㎖의 배양물과 같은 배양물로부터의 상부공간)은, n-옥탄/포라실 C 컬럼 (Alltech Associates, Inc., Deerfield, IL)을 가지며 RGD2 산화수은 환원 기체 검출기 (Trace Analytical, Menlo Park, CA)와 결합된 등온선상 (85℃) 작동 시스템과 같은 표준 기체 크로마토그래피 시스템을 사용하여 이소프렌에 대해 분석된다 (예를 들어 Greenberg 등, Atmos. Environ. 27A: 2689-2692, 1993; Silver 등, Plant Physiol. 97:1588-1591, 1991 참조; 그 전문, 특히 이소프렌 생성의 측정에 대해 참고문헌으로 각각 포함됨). 기체 크로마토그래피 영역 단위는 표준 이소프렌 농도 보정 곡선을 통해 nmol 이소프렌으로 전환된다. 일부 구현예에서는, 세포의 습식 중량에 대한 세포의 g 에 대한 값은 세포 배양물의 샘플에 대한 A₆₀₀ 값을 수득한 후, 공지된 A₆₀₀ 값을 갖는 세포 배양물에 대한 습식 중량의 보정 곡선을 기준으로 하여 상기 A₆₀₀ 값을 세포의 g으로 전환함으로써 계산된다. 일부 구현예에서는, 세포의 g은 1의 A₆₀₀값을 갖는 1 ℓ의 브로쓰 (세포 배지 및 세포를 포함)가 1 g의 습식 세포 중량을 갖는다고 가정함으로써 추정된다. 상기 값은 또한 인큐베이션된 배양물의 시간 수 (예를 들어 3시간)로 나누어진다.

일부 구현예에서, 배양물 내 세포는 1, 10, 25, 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1,000, 1,250, 1,500, 1,750, 2,000, 2,500, 3,000, 4,000, 5,000, 10,000, 100,000 이상의 정도 또는 이를 초과하는 ng 의 이소프렌/세포의 습식 중량에 대한 세포의 g/시간 (ng/g_wcm/hr)으로 이소프렌을 생성한다. 일부 구현예에서, 이소프렌의 양은, 약 2 내지 약 5,000 ng/g_wcm/h, 예컨대 약 2 내지 약 100 ng/g_wcm/h, 약 100 내지 약 500 ng/g_wcm/h, 약 500 내지 약 1,000 ng/g_wcm/h, 약 1,000 내지 약 2,000 ng/g_wcm/h, 또는 약 2,000 내지 약 5,000 ng/g_wcm/h 이다. ng/g_wcm/hr으로의 이소프렌 양은 상기 토의된 nmol/g_wcm/시간 단위에서의 이소프렌 생성에 대한 값을 68.1로 곱하여 계산될 수 있다 (하기 방정식 5에서 기재된 바와 같음).

일부 구현예에서, 배양물 내 세포는 1, 10, 25, 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1,000, 1,250, 1,500, 1,750, 2,000, 2,500, 3,000, 4,000, 5,000, 10,000, 50,000, 100,000 이상의 정도로 또는 이를 초과하는 mg 의 이소프렌/L 의 브로쓰 (mg/L_브로쓰, 이때, 브로쓰의 부피에는 세포 및 세포 배지의 부피가 포함됨) 으로 누적 역가 (총량) 의 이소프렌을 생성한다. 일부 구현예에서, 이소프렌의 양은, 약 2 내지 약 5,000 mg/L_브로쓰, 예컨대 약 2 내지 약 100 mg/L_브로쓰, 약 100 내지 약 500 mg/L_브로쓰, 약 500 내지 약 1,000 mg/L_브로쓰, 약 1,000 내지 약 2,000 mg/L_브로쓰, 또는 약 2,000 내지 약 5,000 mg/L_브로쓰 이다. 진탕 플라스크 또는 유사한 배양물로부터의 이소프렌 mg/상부공간 L로의 이소프렌의 특이적 생산성은 약 1.0의 OD₆₀₀ 값의 세포 배양물로부터 1 ㎖ 샘플을 취하고 이를 20 ml 바이알에 넣고, 30분 동안 인큐베이션한 후 상부공간 내의 이소프렌의 양을 측정함으로써 측정될 수 있다. OD₆₀₀ 값이 1.0이 아니라면, OD₆₀₀ 값으로 나누어 1.0의 OD₆₀₀ 값에 대해 측정을 정규화시킬 수 있다. 이소프렌 mg/상부공간 L의 값은 38 배만큼 곱하여 배양물 브로쓰의 mg/L_브로쓰/시간/OD₆₀₀으로 전환될 수 있다. mg/L_브로쓰/시간/OD₆₀₀ 단위의 값을 시간 수 및 OD₆₀₀ 값으로 곱하여 이소프렌 mg/브로쓰 L 단위의 누적 역가를 수득할 수 있다.

발효기 내 mg/L_브로쓰/hr 로 표기되는 예시의 이소프렌 생산 속도는, 발효기 배출 기체의 샘플을 취하고, 이소프렌의 양에 대해 이를 분석하고 (L_기체 당 이소프렌 mg 과 같은 단위로 함), 상기 값을 배출 기체가 브로쓰 각각의 ℓ를 통해 지나가는 속도 (예를 들어, 1 vvm (공기 부피/브로쓰 부피/분) 에서 이는 시간 당 60 L_기체임)로 곱하여 측정될 수 있다. 따라서, 1 mg/L_기체의 배출 기체 수준은 1 vvm의 공기 흐름에서 60 mg/L_브로쓰/시간의 순간 생성 속도에 상응한다. 필요하다면, mg/L_브로쓰/시간 단위의 값을 OD₆₀₀ 값으로 나누어 mg/L_브로쓰/시간/OD 단위의 특이적 속도를 수득할 수 있다. 이소프렌 mg/L_기체의 평균 값은 상기 평균 배출 기체 이소프렌 농도에 발효 동안의 발효 브로쓰의 ℓ 당 살포된 배출 기체의 총량을 곱하여 총 생성물 생산성 (발효 브로쓰 ℓ 당 이소프렌 g, mg/L_브로쓰)으로 전환될 수 있다. 따라서, 1 vvm에서 10시간에 걸친 0.5 mg/L_브로쓰/시간의 평균 배출 기체 이소프렌 농도는 300 mg 이소프렌/L_브로쓰의 총 생성물 농도에 상응한다.

일부 구현예에서, 배양물 내 세포는 0.0015, 0.002, 0.005, 0.01, 0.02, 0.05, 0.1, 0.12, 0.14, 0.16, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0, 1.2, 1.4, 또는 1.6% 정도 또는 이를 초과하는 세포 배양 배지 내 탄소를 이소프렌으로 전환한다. 일부 구현예에서, 탄소의 이소프렌으로의 전환% 는 약 0.002 내지 약 1.6%, 예컨대 약 0.002 내지 약 0.005%, 약 0.005 내지 약 0.01%, 약 0.01 내지 약 0.05%, 약 0.05 내지 약 0.15%, 0.15 내지 약 0.2%, 약 0.2 내지 약 0.3%, 약 0.3 내지 약 0.5%, 약 0.5 내지 약 0.8%, 약 0.8 내지 약 1.0%, 또는 약 1.0 내지 약 1.6% 이다. 탄소의 이소프렌으로의 전환% (또한, "탄소 수율 %"로서 나타냄)는 생성된 이소프렌 내의 탄소 mol을 탄소원 내 탄소 mol (예를 들어 회분식 및 공급된 글루코오스 및 효모 추출물에서의 탄소 mol)로 나누어 측정될 수 있다. 이러한 수를 100%로 곱하여 % 값을 수득한다 (방정식 1에 나타낸 바와 같음).

방정식 1

탄소 수율% = (생성된 이소프렌 내의 탄소 mol)/(탄소원 내의 탄소 mol) * 100

상기 계산에 있어서, 효모 추출물은 50% w/w 탄소를 함유하는 것으로 추정될 수 있다.

방정식 2

탄소 수율% = (39.1 g 이소프렌 * 1/68.1 mol/g * 5 C/mol)/[(181221 g 글루코오스 * 1/180 mol/g * 6 C/mol) + (17780 g 효모 추출물 * 0.5 * 1/12 mol/g)] * 100 = 0.042%

당업자는 이소프렌 생성 속도 또는 생성된 이소프렌의 양을 어떠한 다른 단위로도 용이하게 전환할 수 있다. 단위들간의 상호전환에 대한 예시적 방정식을 하기에 열거한다.

이소프렌 생성 속도에 대한 단위 (총 및 특이적)

방정식 3

1 g 이소프렌/L_브로쓰/시간 = 14.7 mmol 이소프렌/L_브로쓰/시간 (총 체적 속도)

방정식 4

1 nmol 이소프렌/g_wcm/시간 = 1 nmol 이소프렌/L_브로쓰/시간/OD₆₀₀ (이러한 전환은 1의 OD₆₀₀ 값을 갖는 1ℓ의 브로쓰가 1 g의 습식 세포 중량을 갖는다고 가정함)

방정식 5

1 nmol 이소프렌/g_wcm/시간 = 68.1 ng 이소프렌/g_wcm/시간 (이소프렌 분자량이 주어짐)

방정식 6

1 nmol 이소프렌/L_기체 0₂/시간 = 90 nmol 이소프렌/L_브로쓰/시간 (배양물 브로쓰 L 당 90 L/시간의 0₂ 유속에서)

방정식 7

1 ug 이소프렌/배출 기체 중 L_기체 이소프렌 = L_브로쓰 당 60 L_기체의 유속에서 60 ug 이소프렌/L_브로쓰/시간 (1 vvm)

역가에 대한 단위 (총 및 특이적)

방정식 8

1 nmol 이소프렌/mg 세포 단백질 = 150 nmol 이소프렌/L_브로쓰/OD₆₀₀ (이러한 전환은 1의 OD₆₀₀ 값을 갖는 1ℓ의 브로쓰가 약 150 mg의 총 세포 단백질을 갖는다고 가정함) (특이적 생산성)

방정식 9

1 g 이소프렌/L_브로쓰 = 14.7 mmol 이소프렌/L_브로쓰 (총 역가)

필요하다면, 방정식 10을 사용하여 세포의 습식 중량을 포함하는 임의의 단위를 세포의 건식 중량을 포함하는 상응하는 단위로 전환할 수 있다.

방정식 10

세포의 건식 중량 = (세포의 습식 중량)/3.3

본 발명에 의해 포함되는 일부 구현예에서는 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산을 포함하는 세포가, 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산을 갖지 않는 본질적으로 동일한 조건 하에 성장한 상응하는 세포에서 생성된 이소프렌의 양보다 적어도 또는 약 2배, 3배, 5배, 10배, 25배, 50배, 100배, 150배, 200배, 400배 이상의 이소프렌 양을 생성한다.

본 발명에 포함되는 일부 구현예에서는 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산, 및 DXS, IDI 및/또는 MVA 경로 폴리펩티드를 인코딩하는 하나 이상의 이종 핵산을 포함하는 세포가, 이종 핵산을 갖지 않는 본질적으로 동일한 조건 하에 성장한 상응하는 세포에서 생성된 이소프렌의 양보다 적어도 또는 약 2-배, 3-배, 5-배, 10-배, 25-배, 50-배, 100-배, 150-배, 200-배, 400-배 이상의 이소프렌의 양을 생성한다.

예시적 이소프렌 정제 방법

일부 구현예에서는, 본원에 기재된 임의의 방법은 이소프렌을 회수하는 것을 추가로 포함한다. 예를 들어, 본 발명의 조성물 및 방법을 사용하여 생성된 이소프렌은 기체 스트리핑, 분획화, 흡수/탈착, 투과증발, 고체상으로부터의 이소프렌의 열 또는 진공 탈착, 또는 고정 또는 흡수된 이소프렌을 용매를 사용하여 고체상으로 추출하는 것과 같은 표준 기술을 사용하여 회수될 수 있다 (예를 들어 미국 특허 제 4,703,007 호 및 제 4,570,029 호 참조; 특히 이소프렌 회수 및 정제 방법에 대해 그 전문이 참고문헌으로 각각 포함됨). 일부 구현예에서는, 이소프렌의 회수는 액체 형태의 이소프렌 (예를 들어 용매 중 이소프렌의 용액 또는 이소프렌의 순 용액)의 단리를 포함한다. 기체 스트리핑은 연속 방식으로 발효 배출 기체 흐름으로부터 이소프렌 증기를 제거하는 것을 포함한다. 이러한 제거는 고체상으로의 흡수, 액체상으로의 분할, 또는 직접 축합을 비제한적으로 포함하는 여러 상이한 방법으로 달성될 수 있다. 일부 구현예에서는, 희석 이소프렌 증기 흐름의 막 풍부함은 액체 이소프렌의 축합을 야기하는 증기의 이슬점을 초과한다.

이소프렌의 회수는 한 단계 또는 다수 단계를 포함할 수 있다. 일부 구현예에서는, 발효 배출 기체로부터의 이소프렌 증기의 제거 및 이소프렌의 액체상으로의 전환은 동시에 수행된다. 예를 들어, 이소프렌은 배출 기체 흐름으로부터 직접적으로 축합되어 액체를 형성할 수 있다. 일부 구현예에서는, 발효 배출 기체로부터의 이소프렌 증기의 제거 및 이소프렌의 액체상으로의 전환은 순차적으로 수행된다. 예를 들어, 이소프렌은 고체상으로 흡수된 후 용매로 고체상으로부터 추출될 수 있다.

일부 구현예에서는, 본원에 기재된 임의의 방법은 이소프렌을 정제하는 것을 추가로 포함한다. 예를 들어, 본 발명의 조성물 및 방법을 사용하여 생성된 이소프렌은 표준 기술을 사용하여 정제될 수 있다. 정제는, 이소프렌이 생성되는 경우 존재하는 하나 이상의 성분으로부터 이소프렌이 분리되는 과정을 나타낸다. 일부 구현예에서는, 이소프렌은 실제적으로 순수한 액체로서 수득된다. 정제 방법의 예에는 (i) 액체 추출용 용제 중의 용액으로부터의 증류 및 (ii) 크로마토그래피가 포함된다. 본원에서 사용되는 바와 같이, "정제된 이소프렌"은 이소프렌이 생성되는 경우 존재하는 하나 이상의 성분으로부터 분리된 이소프렌을 의미한다. 일부 구현예에서 이소프렌은, 이소프렌이 생성되는 경우 존재하는 다른 성분 없이, 적어도 약 20 중량%이다. 각종 구현예에서는, 이소프렌은 적어도 또는 약 25, 30, 40, 50, 60, 70, 75, 80, 90, 95 또는 99 중량% 순수하다. 순도는 적절한 방법, 예를 들어 컬럼 크로마토그래피, HPLC 분석 또는 GC- MS 분석에 의해 검정될 수 있다.

이소프렌 신타아제의 결정 구조

본 발명은 또한 상기에서 기술하고 하기 실시예에 기술한 바와 같은, 식물 이소프렌 신타아제 (예를 들어, 포플러 및 쿠주) 의 결정질 형태 및 이의 변이체에 대한 것이기도 하다. 한 구현예에서, 본 발명은 표 16-7 에 개시한 포플러 이소프렌 신타아제의 결정 구조를 갖는 임의의 폴리펩티드를 포함한다.

실험

본 발명의 특정 바람직한 구현예 및 측면을 설명하고 추가로 예시하기 위해 하기 실시예를 제공하나, 이것이 본 범위를 제한하는 것으로 해석해서는 안된다.

하기의 실험 개시에서, 하기의 약자가 적용된다: ℃ (섭씨 온도); rpm (분당 회전수); H₂O (물); diH₂O (탈이온수); aa 및 AA (아미노산); bp (염기쌍); kb (킬로염기쌍); kD　(킬로달톤); gm (그람); ㎍ 및 ug (마이크로그람); mg (밀리그람); ng (나노그람); ㎕　및 ul (마이크로리터); ml (밀리리터); mm (밀리미터); qs (충분량); nm (나노미터); ㎛ 및 um (마이크로미터); M (몰); mM (밀리몰); μM　및 uM (마이크로몰); pM (피코몰); U (유닛); MW (분자량); sec (초); min (분/분들); hr (시간/시간들); OD₆₀₀ (600 nm 에서의 광학 밀도); BSA (소혈청알부민); DMAPP (디메틸알릴 디포스페이트); DTT (디티오트레이톨); EtOH (에탄올); IPTG (이소프로필-베타-D-티오갈락토피라노시드); 이소프렌 (2-메틸-1,3-부타디엔); IspS (이소프렌 신타아제); PAGE (폴리아크릴아미드 겔 전기영동); PBS (인산염완충식염수 [150 mM NaCl, 10 mM 나트륨 포스페이트 버퍼, pH 7.2]); 및 SDS (나트륨 도데실 술페이트).

하기의 약자가 실험 실시예에서 지칭되는 회사 제품 또는 서비스에 적용된다: Agilent (Agilent Technologies, Santa Clara, CA); Becton Coulter (Becton Coulter, Inc., Fullerton, CA); Bio-Rad (Bio-Rad Laboratories, Hercules, CA); Cayman Chemical (Cayman Chemical Co., Ann Arbor, MI); CTC Analytics (CTC Analytics A.G., Zwingen, Switzerland); EMS (Electron Microscopy Supply, Hatfield, PA); Epicentre (Epicentre Biotechnologies, Madison, WI); Integrated DNA Technologies (Integrated DNA Technologies, Coralville, IA); Invitrogen (Invitrogen Corp., Carlsbad, CA); Molecular Dynamics (Molecular Dynamics, Sunnyvale, CA); Novagen (Novagen, Inc., Madison, WI); Perkin Elmer (Perkin Elmer, Waltham, MA); Roche (Roche Applied Science, Indianopolis, IN); Sigma (Sigma-Aldrich, St. Louis, MO); Stratagene (Stratagene Cloning Systems, La Jolla, CA); Qiagen (Qiagen, Inc., Valencia, CA); Takara (Takara Bio USA, Madison, WI); Thomson Instrument (Thomson Instrument Co., Oceanside, CA); V&P Scientific (V&P Scientific, Inc., San Diego, CA); 및 Zinsser (Zinsser North America, Northridge, CA).

실시예 1

재조합 박테리아 내 발현을 위한 쿠주 이소프렌 신타아제의 클로닝

이 실시예에서는 E. coli 내 쿠주 이소프렌 신타아제 (IspS) 를 생성하는데 사용되는 방법을 설명한다. 쿠주 (Pueraria montana) 이소프렌 신타아제 유전자 (IspS) 에 대한 단백질 서열을 GenBank (AAQ84170) 로부터 입수했다. E. coli 코돈 사용 방식 (codon usage) 에 최적화된 쿠주 이소프렌 신타아제 유전자를 DNA2.0 (Menlo Park, CA) 로부터 구입하였고, 이를 SEQ ID NO:1 (도 1) 로 제시하였다. 이소프렌 신타아제 유전자를 BspLU11I /PstI 로 제한 엔도뉴클레아제 분쇄시켜 공급된 플라스미드로부터 제거하고, 겔-정제하고, NcoI/PstI 로 분쇄되어진 pTrcHis2B (Invitrogen) 로 라이게이션시켰다. 이소프렌 신타아제 유전자 내의 정지 코돈이 PstI 부위에 대해 5' 가 되도록 구축물을 설계하였다. 그 결과, 구축물이 발현되는 경우, His-태그가 이소프렌 신타아제 단백질에 결합하지 않는다. 생성된 플라스미드, pTrcKudzu 를 서열화로 확인하였다.

이소프렌 신타아제 유전자를 pET16b (Novagen) 에 클로닝하였다. 이 경우, 재조합 이소프렌 신타아제 단백질이 N-말단 His 태그를 함유하도록 이소프렌 신타아제 유전자를 pET16b 에 삽입하였다. 프라이머 세트 pET-His-Kudzu-2F: 5'-CGTGAGATCA TATGTGTGCG ACCTCTTCTC AATTTAC (SEQ ID NO:3) 및 pET-His-Kudzu-R: 5'-CGGTCGACGG ATCCCTGCAG TTAGACATAC ATCAGCTG (SEQ ID NO:4) 를 사용하여 PCR로 pTrcKudzu 로부터 이소프렌 신타아제 유전자를 증폭하였다. 이들 프라이머는 각각 유전자의 5'-말단에는 NdeI 부위, 및 3'-말단에는 BamH1 부위를 첨가하였다. 상기 기재된 플라스미드 pTrcKudzu 를 주형 DNA 로서 사용하고, Herculase DNA 폴리머라아제 (Stratagene) 를 제조자의 지침에 따라 사용하고, 프라이머를 10 pM 의 농도로 첨가하였다. PCR를 25 ㎕ 의 총 부피로 실행하였다. PCR 생성물을 NdeI/BamHI으로 분쇄시키고, 동일한 효소로 분쇄된 pET16b 에 클로닝하였다. 라이게이션 믹스를 E. coli Top 10 (Invitrogen) 에 형질전환하고 서열화로 올바른 클론을 선별하였다. 그 후, pETNHisKudzu 로 지명된 생성된 플라스미드를 T7 프로모터로부터 발현하기 위해 BL21(λDE3)pLysS (Novagen) 세포로 형질전환하였다.

또한 쿠주 이소프렌 신타아제 유전자를 저 카피 수 플라스미드 pCL1920에 클로닝하였다 (Lerner 및 Inouye, Nucl Acids Res, 18:4631, 1990). 프라이머를 사용하여 상기 기재된 pTrcKudzu 로부터 쿠주 이소프렌 신타아제 유전자를 증폭하였다. 정방향 (forward) 프라이머는 HindIII 부위 및 E. coli 공통 (consensus) RBS 를 5' 말단에 첨가하였다. PstI 클로닝 부위는 이미 pTrcKudzu 정지 코돈의 바로 3'에 존재하여, 따라서 역방향 프라이머를 최종 PCR 생성물이 PstI 부위를 포함하도록 구축하였다. 프라이머의 서열은 하기와 같았다: HindIII-rbs-Kudzu F: 5'-CATATGAAAG CTTGTATCGA TTAAATAAGG AGGAATAAAC C (SEQ ID NO:5) 및 BamH1-Kudzu R: 5'-CGGTCGACGG ATCCCTGCAG TTAGACATAC ATCAGCTG (SEQ ID NO:4) 10 pM 농도의 프라이머 및 1 ng 의 주형 DNA (pTrcKudzu) 와 함께 Herculase DNA 폴리머라아제 (Stratagene) 를 사용하여 PCR 생성물을 증폭하였다. 증폭 프로토콜에는 [95℃에서 1분, 60℃에서 1분, 72℃에서 2분] 의 30 사이클이 포함되었다. 생성물을 HindIII 및 PstI 으로 분쇄하고, 이를 HindIII 및 PstI 으로 또한 분쇄되어있는 pCL1920에 라이게이션시켰다. 라이게이션 믹스를 E. coli Top 10에 형질전환하였다. 여러 형질전환체를 서열화로 확인하였다. 생성된 플라스미드를 pCL-lac-Kudzu 로 지정하였다.

베타-락타마아제 유전자를 제거하기 위해, pTrcKudzu 를 BspHI 로 분쇄하고, 쉬림프 알칼리 포스파타아제 (SAP) 로 처리하고, 65℃ 에서 10 분 인큐베이션하여 SAP 를 열 사멸한 후, Klenow 절편 (New England BioLabs) 및 dNTP의 2 개의 단위로 인큐베이션함으로써 말단을 충전시켰다. 5 kb 절편을 아가로오스 겔로부터 정제하고 Kan(R) 유전자에 라이게이션하였다. Kan(R) 유전자를, 제조자 지침에 따라 프라이머 MCM22 및 MCM23 및 Taq DNA 폴리머라아제를 이용하여 pCR-Blunt-II-TOPO (Invitrogen) 로부터 PCR 증폭으로 제조하였다. PCR 절편을 HindIII 및 PvuI 로 분쇄하고, Klenow 절편 및 dNTP 을 이용하여 말단을 충전하였다. 라이게이션 혼합물을 E. coli Top 10 화학적 적격 세포에 형질전환하고, 카나마이신 내성을 부여하는 플라스미드 pTrcKudzu(kan) 를 갖는 형질전환체를 카나마이신 (50㎍/ml) 함유 Luria 아가 상에서 선별하였다. 프라이머의 서열은 하기였다: MCM22 5'- gatcaagctt AACCGGAATTGCCAGCTG (SEQ ID NO:15); 및 MCM23 5'- gatccgatcgTCAGAAGAACTCGTCAAGAAGGC (SEQ ID NO:16).

실시예 2

재조합 박테리아 내 발현을 위한 포플러 이소프렌 신타아제의 클로닝

이 실시예에서는 E. coli 내 poplar 이소프렌 신타아제 (IspS) 를 생성하는데 사용되는 방법을 기술한다. poplar (Populus alba x Populus tremula) 이소프렌 신타아제의 단백질 서열 (Schnitzler 등., Planta 222:777-786, 2005) 을 GenBank (CAC35696) 로부터 입수하였다. E. coli 에 대해 코돈 최적화된 유전자를 DNA2.0 로부터 구입하고, SEQ ID NO:6 (도 3) 에 제시하였다. 이소프렌 신타아제 유전자를 BspLU11I /PstI 로 제한 엔도뉴클라아제 분쇄시켜 공급된 플라스미드 (p9796-poplar) 로부터 제거하고, 겔-정제하고 NcoI/PstI 로 분쇄되어져 있는 pTrcHis2B 에 라이게이션하였다. 삽입물 내 정지 코돈이 PstI 부위 앞에 있도록 구축물을 클로닝하여, His-Tag 가 이소프렌 신타아제 단백질에 결합하지 않는 구축물을 도모하였다. 생성 플라스미드인 pTrcPoplar 를, 벡터 서열 내에서 혼성화하는 시판중인 프라이머 (정방향 및 역방향) 뿐 아니라 프라이머 Poplar InSeq

(SEQ ID NO:8) 를 이용해 서열화하여 확인했다.

실시예 3

재조합 박테리아 내 이소프렌 생성

이 실시예에서, 재조합 E. coli 에서의 이소프렌의 생성 및 측정에 사용되는 방법을 기술한다.

I 이소프렌 생성의 측정

진탕 플라스크 배양물에 대해, 1 ㎖ 의 배양물을 진탕 플라스크로부터 20 ㎖ CTC 상부공간 바이알 (Agilent 바이알 카탈로그 번호 5188 2753; 마개 카탈로그 번호 5188 2759) 로 옮겼다. 마개를 단단히 조이고, 바이알을 250 rpm 에서 진탕하면서 동등한 온도에서 인큐베이션하였다. 30 분 후 바이알을 인큐베이터에서 꺼내 하기 기재한 바와 같이 분석하였다. 발효기 내의 이소프렌 생성을 측정한 경우, 발효기의 배출 기체로부터 샘플을 취하고 직접적으로 분석하였다.

상부공간 방식으로 작동하는 CTC Analytics CombiPAL 오토샘플러가 접속된 Agilent 6890 GC/MS 시스템을 사용하여 분석을 수행하였다. Agilent HP-5MS GC/MS 컬럼 (30 m x 0.25 mm; 0.25 ㎛ 필름 두께) 을 분석물을 분리하는데 사용하였다. 샘플러를 500 ㎕ 의 상부공간 기체가 주입되도록 설정하였다. GC/MS 방법은 1 ㎖/분의 흐름으로 담체 기체로서 헬륨을 이용하였다. 주입 포트를 50:1의 살포 비율로 250℃ 에서 고정하였다. 분석하는 동안 오븐 온도를 37℃ 에서 2분 동안 고정하였다. Agilent 5793N 질량 선택 검출기를 m/z 67 상 단일 이온 모니터링 (SIM) 방식으로 실행시켰다. 검출기를 1.4 내지 1.7분에서 스위치를 꺼서 영구 기체가 용리되게 하였다. 이들 조건 하에 이소프렌 (2-메틸-1,3-부타디엔) 을 1.78분에서 용리하도록 관찰하였다. 보정 표를 사용하여 이소프렌의 절대량을 정량하였고, 1 ㎍/L 내지 200 ㎍/L 에서 선형인 것을 발견하였다. 검출 한계는 이러한 방법을 사용하여 50 내지 100 ng/L 인 것으로 추정하였다.

II. 진탕 플라스크 내 이소프렌의 생성

상기 벡터를 E. coli 균주 BL21(λDE3)pLysS (Novagen) 에 도입하여, 균주 BL21/ptrcKudzu, BL21/pCL-lac-Kudzu 및 BL21/pETHisKudzu 를 생성했다. 단리를 위해 상기 균주를, 적절한 항생제 (BL21/ptrcKudzu 및 BL21/pETHisKudzu 에 대해서는 50 ㎍/㎖ 카르베니실린, 및 BL21/pCL-lac-Kudzu 에 대해서는 50 ㎍/㎖ 스펙티노마이신) 을 함유하는 LA (Luria 아가; Luria agar) 상에 퍼뜨리고 (spread), 37℃에서 하룻밤 동안 인큐베이션하였다. 단일 콜로니를 20 ㎖ Luria Bertani 브로쓰: LB) 및 적절한 항생제를 함유하는 250 ㎖ 배플 (baffled) 진탕 플라스크에 접종하였다. 배양물을 200 rpm 에서 진탕하면서 20℃ 에서 하룻밤 동안 성장시켰다. 하룻밤 배양물의 OD₆₀₀ 을 측정하고 배양물을, 적절한 항생제를 함유하는 30 ㎖ MagicMedia 발현 배지 (Invitrogen) 를 포함하는 250 ㎖ 배플 진탕 플라스크 내로 OD₆₀₀ 이 ~ 0.05 가 되도록 희석하였다. 배양물을 200 rpm에서 진탕하면서 30℃에서 인큐베이션하였다. OD_60O 가 ~ 0.5 내지 0.8일 때 400 μM IPTG를 첨가하고 세포를 추가 6 시간 동안 200 rpm 에서 진탕하면서 30℃ 에서 인큐베이션하였다. IPTG로 유도 후 0, 2, 4 및 6 시간에, 배양물의 1 ㎖ 분취물을 수집하고, OD₆₀₀ 을 측정하고 생성된 이소프렌의 양을 상기 기재된 바와 같이 측정하였다.

III. 14ℓ 발효에서 BL21/ptrcKudzu 로부터 이소프렌의 생성

재조합 쿠주 이소프렌 신타아제 유전자를 함유하는 E. coli 로부터의 이소프렌의 대규모 생성을 유가식 배양물에서 측정하였다. 발효 배지의 ℓ 당 발효 배지 (TM2) 의 제조 방법은 하기와 같다: K₂HPO₄ 13.6 g, KH₂PO₄ 13.6 g, MgSO₄ * 7H₂O 2 g, 시트르산 모노히드레이트 2 g, 시트르산 철 암모늄 0.3 g, (NH₄)₂SO₄ 3.2 g, 효모 추출물 5 g, 1000X 개질 미량 금속 용액 1 ml. 모든 성분을 함께 첨가하고 diH₂O 중에 용해하였다. 수산화칼륨 (KOH) 으로 pH 를 6.8 로 조정하고 부피에 대해 충분량이 되게 하였다. 최종 생성물을 0.22 μM 필터로 여과 멸균하였으나, 오토클레이브 (autoclave) 하지 않았다.

1000X 개질 미량 금속 용액에 대한 제조 방법은 하기와 같다: 시트르산 * H₂O 40 g, MnSO₄ * H₂O 30 g, NaCl 10 g, FeSO₄ * 7H₂O 1 g, CoCl₂ * 6H₂O 1 g, ZnSO * 7H₂O 1 g, CuSO₄ * 5H₂O 100 mg, H₃BO₃ 100 mg, NaMoO₄ * 2H₂O 100 mg. 각각의 성분을 diH₂O 에 한번에 하나씩 용해하고, HCl/NaOH로 pH를 3.0 로 조절하고, 부피에 대해 충분량이 되게 하고 0.22 μ 필터로 여과 멸균하였다.

이러한 실험을 14ℓ 생물반응기 (bioreactor) 에서 실행하여 원하는 발효, pH 6.7 및 온도 34℃ 에서 글루코오스로부터 이소프렌이 형성되는 것을 모니터링하였다. 동결 바이알에서 취한 E. coli 균주 L21/ptrcKudzu 의 접종물을 2 개의 600 ml 플라스크 내 소이톤 (soytone)-효모 추출물-글루코오스 배지에서 제조하였다. 접종물이 OD₅₅₀ = 0.6 으로 성장한 후, 두 개의 600 ㎖ 플라스크를 원심분리하고, 세포 펠릿 (pellet) 을 생물반응기에 옮기기 위해 상기의 내용물을 70 ㎖ 상청액에 재현탁하였다 (70 ㎖의 OD 3.1 물질). 접종 후 다양한 시간 지점에서, 샘플을 꺼내고 생성된 이소프렌의 양을 상기 기재한 바와 같이 측정하였다.

실시예 4

식물 이소프렌 신타아제의 개선을 위한 부위 선별

식물의 이소프렌 신타아제는 테르펜 신타아제와 상동인 것으로 예상하였다. 2 개의 상동 테르펜 신타아제의 3차 구조를 보르닐 디포스페이트 신타아제 (pdb 엔트리 1N1B) 및 5-에피-아리스토로첸 신타아제 (pdb 엔트리 5EAU) 으로부터 측정하였다. 이들 효소는 단지 32% 의 상동성을 공유하나, 이의 3차 구조는 보존된다. 게다가, 이 둘의 효소와의 중간체 복합체의 구조는, 3 차 폴딩 (folding) 뿐 아니라 이들 효소의 활성 부위에서 세부 상호작용도 고도로 보존된다는 점을 보였다.

쿠주 및 포플러 이소프렌 신타아제는 하기 표 4-1 에 나타낸 바와 같이 보르닐 디포스페이트 신타아제와 5-에피-아리스토로첸 신타아제 간에 보여지는 것보다 더 큰 서열 동일성을 지닌다.

표 4-1 각종 효소의 % 동일성

포플러 이소프렌 신타아제의 상동성 모델을 보르닐 디포스페이트 (BDP-신타아제) pdb 엔트리 1N24 (~40% 서열 동일성) 을 기준으로 하여 제작하였다. 상기 상동성 모델은, Chemical Computing Group, Inc 에 의해 작성되고 지지된 프로그램 MOE 를 이용해 만든 10 개의 시범 모델의 밀접 유사성을 기준으로 하면 개연성이 있을 것으로 보인다. 개연성의 기준은 BDP-신타아제 구조에서 촉매작용에 관련된 것으로 밝혀진 부위에서 공통된 아미노산 잔기의 보존이다.

포플러 IspS 의 상동성 모델 및 BDP-신타아제의 구조에서 활성 부위의 비교로, 금속 이온 결합 및 포스페이트 인지에 관여하는 활성 부위가 보존된다는 것이 나타났다. 특히, 포플러 IspS 의 Lys 272, Asp 309, Asp 313, Glu 387, Arg 450 및 Asn 453 이 BDP-신타아제 내에서 동 잔기와 오버랩한다는 점이 관찰되었다. 이 예에서, 포플러 IspS 에서의 아미노산 잔기 위치는 SEQ ID NO: 7 로부터 유래한다. BDP-신타아제의 중간체의 포지셔닝도 또한 포플러 IspS 상동성 모델과 비교하였다. 이를 기준으로, 포플러 IspS 효소와 결합하고 반응하기 위해 이소펜테닐 디포스페이트가 요구할 수 있는 유사한 결합 영역 및 접근 방향을 동정할 수 있었다.

쿠주 이소프렌 신타아제의 상동성 모델은 (~40% 서열 동일성) 을 갖는 보르닐 디포스페이트 신타아제 pdb 엔트리 1N24 를 기준으로 제작하였다. 쿠주 IspS 의 상동성 모델과 BDP-신타아제의 구조에서의 활성 부위의 비교로 금속 이온 결합 및 포스페이트 인지에 관여하는 수 많은 활성 부위 잔기가 보존된다는 것이 나타났다. 특히, 쿠주 IspS 의 Arg 269, Asp 306, Asp 310, Glu 384, Arg 450 및 Asn 453 가 BDP-신타아제 내에서 동 잔기와 오버랩한다는 점이 관찰되었다.

포플러 및 쿠주 IspS 의 상동성 모델에서 동정된 활성 부위 잔기의 비교로, 한 상동성 모델에서의 잔기는 또한 나머지 다른 상동성 모델 내에서 유사 잔기들과 상당한 상동성을 지니고, 잔기 중 일부 관련 위치 넘버는 단지 사소하게 변화하면서 나타난다는 점이 드러났다. 상동성 모델을 기초로, 개선된 성능을 갖는 변이체 IspS 효소를 생성하는 돌연변이유발 후보로서 포플러 및 쿠주 IspS 내 부위를 동정하였다. 요약하면, 금속 결합의 상호작용, 디포스페이트 인지, IPP 사슬 결합 및/또는 활성 부위로의 접근을 변경할 수 있는 IspS 에서 부위를 선별하였다.

I. 디포스페이트/ 금속 결합 부위

금속 및 디포스페이트 (DPP) 결합 측쇄와 근접해 있는 것으로 발견된 포플러 IspS 내 아미노산 잔기의 측쇄를 동정하였다. 이들 잔기에는 Phe 384, Tyr 402, Ala 406, Ser 409, Ala 460 및 Asn 469 이 포함된다. 본 발명자들은 Lys 272 가 다른 공지된 포플러 IspS 서열과의 상동성을 기준으로 하면 부정확하여, 이 위치에서 Arg 를 갖는다는 점에 주의했다.

II. 기질 접근 루프 (access loop)

포플러 IspS 의 기질 접근 루프는 BDP-신타아제 구조로부터 벗어난 영역 내에 존재한다. BDP-신타아제 구조에서, 잔기는 커버를 만드는 분절을 형성한다. 이론에 얽매이지 않고, 본 발명자들은 포플러 IspS 의 실제 3 차 구조 내 상기 분절이 유사 구조를 형성할 것으로 예상했다. 그리하여 잔기 455-466 를 비롯한 상기 루프 내 잔기는 포플러 IspS 효소의 활성을 변경하는 위치에 있을 것이다. 포플러 IspS 효소 잔기 454-466 는 하기의 서열을 갖는다: LASASAEIARGET (SEQ ID NO:9).

III. 이소프레닐 결합 부위

BDP-신타아제 및 반응 생성물, 보르닐 디포스페이트의 복합체 (pdb 엔트리 1N24) 를 기질 특이성 및/또는 반응 속도 (기질과 생성물의 변경된 온 (on) 및 오프 (off) 속도) 를 조절할 수 있는 포플러 모델 내에서 잔기를 동정하는데 사용하였다. 이들 잔기에는 Arg 274, Trp 281 Phe 302, Val 305, Ser 411, Gln 415, Phe 449, Ser 537 및 Glu 540 이 포함된다.

표 4-2 돌연변이유발 부위 후보자

실시예 5

쿠주 이소프렌 신타아제내 비(非)보존성 시스테인의 돌연변이화

보르닐 디포스페이트 신타아제 결정 구조를 기초로하는 쿠주 및 포플러 이소프렌 신타아제 (IspS) 상동성 모델을, 시스테인 잔기의 위치에 대해서 비교하였다. 시스테인은 디술파이드 결합을 형성해 구조를 안정화시키는 잠재성이 있다. 용해성 및/또는 활성에 영향을 미치는 것으로 생각되는 비(非)보존성 시스테인을, 부위-특이적 돌연변이유발로 변경하였다. 모델링에 사용되는 쿠주 IspS 아미노산 서열은 도 2 (SEQ ID NO:2) 에 나타낸다. 도 5 의 상동성 모델에서 나타낸 바와 같이, 쿠주 IspS 내 위치 57, 291, 343, 378, 421, 446, 451 및 529 (단백질의 성숙 형태 기준) 에, 8 개의 시스테인이 존재한다. 대조적으로, 도 6 의 상동성 모델에 나타낸 바와 같이, 포플러 IspS 아미노산 서열에서는 쿠주 시스테인이 중첩되는 5 개의 시스테인이 존재한다. 상기 시스테인 중 수 개는 분명하게도 포플러와 쿠주 IspS 서열 사이에서 보존되는데, 이는 이들 위치가 구조의 안정화, 활성 및/또는 기타 단백질 기능에 있어서 중요하다는 점을 보여준다. 쿠주 에서 나머지 시스테인 (비보존성 잔기 57, 291, 421 및 446) 은 본원에서 기술한 바와 같이 세린으로 돌연변이된다.

I. 돌연변이유발

QuikChange®다중 부위 돌연변이유발 키트 (Stratagene) 을 제조자 지침에 따라 사용하였다. 하기 프라이머를 돌연변이유발을 위해 활용했다:

실시예 1 에서 기술한 플라스미드 pTrcKudzu(kan) 를 주형 DNA 로 사용했다. 프라이머 C57S-F, C291S-F, C421S-F, 및 C446-F 를 단일 반응으로 조합했다 (100 pmol). 주형 DNA 를 첨가하고 (~200 나노그람) 및 0.5 ㎕ 의 Quiksolution 를 권고되는 부피의 효소 및 버퍼로 첨가하였다. PCR 반응을 30 사이클로 55℃의 어닐링 온도 및 12 분의 신장 시간을 이용하여 Eppendorf PCR 기계 중에서 실시했다. 사이클의 기타 파라미터는 지침에 나타낸 바와 같다. PCR 믹스를 4 시간 동안 37℃ 에서 (각 2 시간 동안 2 x 1 ㎕) DpnI 로 처리한 다음, 5 ㎕ 의 반응물을 E. coli Top10 (Invitrogen) 화학적 적격 세포로 형질전환하고, 카나마이신 (50 ㎍/ml) 를 함유하는 Luria 아가 상에 플레이트하였다. 하룻밤 37℃ 에서 인큐베이션 후, 수 개의 콜로니를 고르고 카나마이신 (50 ㎍/ml) 를 함유하는 5 ml 의 Luria 브로쓰에 접종했다. 플라스미드를 QIAprep Spin Miniprep 키트 (Qiagen) 를 이용해 단리하고, IspS 유전자 전부를 서열화하였다. 다양한, 단일의 및 조합의 돌연변이들을 하기 표 5-1 에 나타낸 대로 만들었다.

표 5-1. 돌연변이화 pTrcKudzu 플라스미드로 형질전환된 BL21 (λ DE3 ) 세포*

모든 변이체 플라스미드를 화학적 적격 BL21(λDE3) 세포 (Novagen) 에 형질전환시켰다. 제 2 의 반응에서 C6 으로부터 단리된 플라스미드 DNA 및 pTrcKudzu(kan) 를 QUIKCHANGE® 부위 특이적 돌연변이유발 키트 (Stratagene) 에서 주형으로 사용하고, C421S-F 및 C421S-R프라이머와 단일 부위 반응시켰다. 서열화로 확인한 후 2 개의 추가 균주를 수득했다.

II. 세포 성장 및 이소프렌 생성

세포를, 교반하면서 하룻밤 30℃에서 50 mg/L 카나마이신으로 보충된 Luria 브로쓰를 함유하는 5 ml 튜브에서 성장시켰다. 이들 배양물을 10 g/L 글루코오스 및 50 mg/L 카나마이신으로 보충된 TM3 브로쓰 중에서 희석했다. 배양물 부피는 250 ml 배플 Bellco Delong 플라스크에서 25 ml 인데, 여기서 세포를 30℃ 에서 교반하면서 (225 rpm) 성장시켰다. 샘플을 지시된 바와 같이 A₆₀₀ 에서의 광학 밀도 측정를 위해 무균상태로 취하였다. 그 결과를 도 7 에 나타낸다. 배양물을 200 μM IPTG 로 3.33 hr 에서 유도하여 7.8 hr 에서 수확할 때까지 성장을 지속되게 하였다. 배양물을 10,000 X g 에서 10 분간 원심분리하고, 상청액을 디캔팅 (decant) 하고, 세포 펠릿을 하룻밤 -80℃ 에서 동결시켰다.

동결된 세포 펠릿을 융해하고 2 ml PEB (50 mM Tris-HCl, pH 8.0, 20 mM MgCl, 2 mM 디티오트레이톨, 및 50% [v/v] 글리세롤) 에서 재현탁하였다. 세포를 1 패스, 20,000 psi 에서 세포 파쇄기 (French pressure cell disruption) 로 분해하였다. 분해물을 10,000 X g 에서 15 분 원심분리하였다. 상청액을 디캔팅하고 펠릿을 2 ml PEB 중에서 재현탁하였다. 펠릿 및 상청액을 환원 조건 하 MES 버퍼 중에서 실시하는 SDS-PAGE, 4-12% NuPage 겔 (Invitrogen) 로 분석하였다. 분자량 표준은 SeeBlue2 (Invitrogen) 였다. 그 결과를 도 8 에 나타낸다. IspS 단백질 농도는 표준으로서 BSA 를 이용하는 BCA 검정 (Pierce) 을 이용해 추산했다 (표 5-2).

III. 이소프렌 신타아제 활성 및 용해성에 대한 검정

요약컨대, 상청액의 활성을 DMAPP 와의 반응으로 측정하고, 발생 이소프렌을 GC/MS 로 정량화하였다.

상부공간 검정. 200 ㎕ 의 원하는 배양물의 샘플을 2 ml CTC 상부공간 바이알 (Agilent 바이알 카탈로그 No. 5188 2753, 및 마개 Catalog No. 5188 2759) 에 접종한다. 마개를 단단히 조이고, 바이알을 37℃에서 250 rpm 에서 진탕하면서 인큐베이션하였다. 30 분 후 바이알을 인큐베이터에서 꺼내고, 주변의 수돗물로 잠시 냉각하였다. 바이알을 GC-MS 로 분석하기 위해 CombiPal Headspace 오토 샘플러에 넣었다. 분석을 상부공간 방식으로 작동하는 CTC Analytics CombiPAL 오토샘플러와 접속된 Agilent 6890 GC/MS 시스템을 이용하여 수행했다. Agilent HP-5MS GC/MS 컬럼 (30 m x 0.25 mm; 0.25 ㎛ 필름 두께) 을 분석물을 분리하는데 사용하였다. 샘플러를 500 ㎕의 상부공간 기체가 주입되도록 설정하였다. GC/MS 방법은 1 ㎖/분의 흐름으로 담체 기체로서 헬륨을 이용하였다. 주입 포트를 50:1의 살포 비율로 250℃에서 고정하였다. 분석하는 동안 오븐 온도를 37℃에서 2분 동안 고정하였다. Agilent 5793N 질량 선택 검출기를 m/z 67 상 단일 이온 모니터링 (SIM) 방식으로 실행시켰다. 검출기를 1.4 내지 1.7분에서 스위치를 꺼서 영구 기체가 용리되게 하였다. 이들 조건 하에 이소프렌 (2-메틸-1,3-부타디엔)을 1.78분에서 용리하도록 관찰하였다. 보정 표를 사용하여 이소프렌의 절대량을 정량하였고, 1 ㎍/L 내지 200 ㎍/L 에서 선형인 것을 발견하였다. 검출 한계는 이러한 방법을 사용하여 50 - 100 ng/L인 것으로 추정되었다.

DMAPP 검정. 원심분리된 세포파쇄기 (French Pressure cell) 분해물 유래의 상청액 분획물의 95 ㎕ 의 분취량을 상부공간 바이알에 첨가하였다. 100 mM 칼륨 포스페이트 버퍼, pH 8.2 중 8 mM DMAPP 의 5 ㎕ 분취량을 첨가하고, 바이알을 밀봉하고, 실온에서 30 분 인큐베이션되게 하였다. 생성된 이소프렌의 양을 상기에 기술한 바와 같이 GC/MS 로 측정하고 표 5-2 에 나타낸다.

표 5-2. 시스테인 돌연변이체의 미정제 추출물로부터의 이소프렌 신타아제 활성

표 5-2 에 나타낸 값은 두 개의 상이한 농도의 추출물과의 반응 평균이다. 임의의 시스테인 돌연변이를 포함하는 모든 단백질은, 불용성 (펠릿) 분획물 내 단백질 비율의 상대적인 증가로 판단하건대, 효소 활성이 심각하게 축소되었고, 가용성 단백질의 명백한 감소를 야기시켰다.

실시예 6

포플러 이소프렌 신타아제 내 잔기의 돌연변이화

쿠주 및 포플러 이소프렌 신타아제와 기타 신타아제의 아미노산 서열 정렬을 벡터 Nti (Invitrogen) 를 이용해 수행했다. 정렬된 서열은 하기를 포함한다: 베타-오시멘(ocimene) 신타아제 Lotus corniculatus (AAT86042); 추정 테르펜 신테타아제 Medficago trunculata (AAV36465); 가상 단백질 Vitis vinifera (can65805); 가상 단백질 Vitis vinifera (CAN62729); 피넨 (pinene) 신타아제 Quercus ilex (CAK55186); IspS Pueraria montana (kudzu) Sharkey (AAQ84170); 모노테르펜 신타아제 Eucaliptus globulus (BAF02832); IspS Populus nigra Fortunati (CAL69918); IspS Populus tremuloides Sharkey (AAQ16588); IspS Populus alba (BAD98243); 및 IspS Populus alba x tremula Zimmer (CAC35696). Populus alba x tremula (CAC35696) 의 데이타베이스로부터의 서열은 위치 272 및 497 에서 상이한 아미노산을 보이는데, 다른 위치에서는 고 보존된다. 추가적으로 포플러 IspS 의 상동성 모델 분석을 기초로 할 때, 위치 453 이 돌연변이유발에 대한 제 3 의 후보로서 동정되었다.

I. 돌연변이유발

QuikChange®다중-부위 특이적 돌연변이유발 키트 (Stratagene) 를 제조자의 지침에 따라 이용하여, 하기의 돌연변이를 단독 또는 조합하여 Populus alba x tremula IspS 서열 (SEQ ID NO:7): K272R; C497W; 및 N453D 에 도입하였다. 하기의 프라이머를 돌연변이유발을 위해 활용하였다:

Poplar K272R 5’-ccaaactgcacttcg ctcgtgaccgcctgattgag (SEQ ID NO:17);

Poplar N453D 5’-atctttcgcctgtgcgacgacctggcaagc (SEQ ID NO:18); 및

Poplar C497W 5’-tgaatctgatcgacgaaacctggaagaaaatgaacaaagaaaaac (SEQ ID NO:19).

하기의 프라이머, Poplar InSeq, 5’-gagaaaatcggtaaggaactgg (SEQ ID NO:8) 를 서열화를 위해 사용했다.

돌연변이유발을 제조자 지침에 따라 수행하고, 모든 3 가지 돌연변이유발 프라이머를 주형 DNA (100 ng) 로서 pTrcPoplar 와의 단일 반응 믹스 (각각 100 ng) 에 첨가했다. 0.5 ㎕ 의 Quik Solution 첨가로 돌연변이유발 반응을 보조하였다. 제안된 PCR 사이클을 55℃ 의 어닐링 온도 및 12 분의 신장 시간으로 해 수행했다. 기타 파라미터는 지침에 지적된 바와 같다. PCR 믹스를 DpnI 로 4 hrs 동안 37℃ 에서 (1 ㎕ 각각 x 2 h) 분쇄한 다음, 5 ㎕ 의 반응물을 E. coli Top10 화학적 적격 세포 (Invitrogen) 로 형질전환하였다. 수 개의 콜로니를 선택하고 카르베니실린 (50 ㎍/ml) 을 함유하는 5 ml 의 Luria 브로쓰 (LB) 중에서 성장시켰다. 플라스미드를 Qiagen QIAprep spin mini-prep kit 를 이용해 단리하고, Poplar InSeq 프라이머뿐 아니라, 벡터로 혼성화되는 정방향 및 역방향 프라이머를 이용하는 서열화를 의뢰했다.

pTrcPoplar 의 생성 변이체를 수득했다: pTrcPoplar K272R, pTrcPoplar K272R/N453D; pTrcPoplar K272R/N453D/C497W; 및 pTrcPoplar 272R/497W. 이들 플라스미드를, 분석을 위해 BL21(λDE3)pLysS 화학적 적격 세포 (Novagen) 로 형질전환하였다. 변이체를 상부공간 활성 (전 세포로부터의 이소프렌 생성), 용해성, 및 특이 활성에 대해 분석했다.

II. 세포 성장 및 이소프렌 생성

변이체, 모체 Poplar 균주, 및 pTrcKudzu 함유 균주를 카르베니실린 (50 mg/ml-Poplar 균주) 또는 카나마이신 (50 mg/ml-Kudzu 균주) 를 함유하는 5 ml 의 Luria Bertani 배지 중 37℃ 에서 하룻밤 성장시켰다. 이들 배양물을 10g/L 글루코오스와 50 ㎍/ml 카르베니실린 (Poplar 돌연변이체 및 야생형) 또는 50 mg/L 카나마이신 (BL21/pTrcKudzu) 로 보충된 TM3 브로쓰 내로 OD₆₀₀ 가 0.05 가 되도록 희석하였다. TM3 브로쓰에 대한 제조방법은 하기와 같다: K₂HPO₄ (13.6 g/l) KH₂PO₄ (13.6 g/l), MgSO₄ * 7H₂O (2 g/l) 시트르산 모노히드레이트 (2 g/L) 시트르산 철 암모늄 (0.3 g/L) (NH₄)₂SO₄ (3.2 g/L) 효모 추출물 (0.2 g/L) 1 ml 의 1000x 미량 원소 용액 (수산화암모늄으로 6.8 로 조절된 pH, 멸균 diH₂O 로 부피에 대해 충분량, 및 0.22 마이크론 필터로 여과 멸균함). 1000X 미량 원소 용액에 대한 제조방법은 하기와 같다: 시트르산 * H₂O (40 g/L), MnSO₄ * H₂O (30 g/L), NaCl (10 g/L), FeSO₄ * 7 H₂O (1 g/L), CoCl₂ * 6 H₂O (1 g/L), ZnSO * 7 H₂O (1 g/L), CuSO₄ * 5 H₂O (100 mg/L), H₃BO₃ (100 mg/L), NaMoO₄ * 2 H₂O (100 mg/L). 각 성분을 diH₂O에 한번에 하나씩 용해하고, HCl/NaOH로 pH를 3.0이 되게 하고, 부피에 대해 충분량이 되게 하고 0.22 μ 필터로 여과 멸균하였다.

희석된 배양물 부피는, 30℃ 에서 교반하면서 (225 rpm) 성장하도록 250 ml 배플 Bellco Delong 플라스크에서 25 ml 였다. 샘플을 지시된 바와 같이 A₆₀₀ 에서의 광학 밀도 측정을 위해 무균상태로 취하였다. 두 배양물 세트를 설정하였는데, 그 중 하나는 0.2 mM IPTG 으로 유도하기 위해, 하나는 유도하지 않은 채로 잔류하기 위해 설정하였다. 30℃ 에서 200 rpm 로 진탕하면서 성장 3 시간 후 (OD₆₀₀~0.5), 배양물의 한 세트는 0.2 mM IPTG 로 유도하고, 추가 3 시간 동안 30℃ 에서 200 rpm 으로 진탕하면서 인큐베이션하였고, 유도되지 않은 세트는 동일한 시간 동안 추가로 인큐베이션하였다. OD₆₀₀ 을 유도 시간 전 (접종 후 3 시간) 에 및 이소프렌 측정 때에 모든 배양물에 대해서 상부공간 검정에 의해 (3 h 유도 후, 총 6 시간의 성장) 측정했다. 세포 배양물을 7000 x g 에서 15 분 동안 Sorvall 초스피드 원심분리기에서 원심분리하여, 세포를 펠릿화하였다. 상청액을 제거하고, 이소프렌 신타아제 활성에 대해 시험관 내 검정에서 사용하기 위해 세포 펠릿을 동결하였다. 성장 및 상부공간 검정의 결과를 하기 표에 나타낸다.

표 6-1. 포플러 IspS 변이체를 발현하는 E. coli 균주의 성장 ( OD ₆₀₀ 값)

표 6-2 포플러 IspS 변이체를 발현하는 E. coli 균주에 의한 이소프렌 생성 (㎍/L)

놀랍게도, 쿠주 IspS 를 발현하는 균주가 임의의 측정가능한 이소프렌 생성을 드러내었다. 이는, 포플러 효소의 동적 특성들이 쿠주 효소의 것보다 우수하다고 문헌에서 보고한 것을 고려해볼 때 예상 밖이다. 특히, 종래 기술은 재조합 쿠주 IspS 의 특이 활성 (U/mg) 및 K_m (μM) 이 각각 0.075 및 7,700 이고,천연형 aspen IspS 에 대해서는 각각 0.5 및 8,000 이고, 재조합 포플러 IspS 에 대해서는 각각 0.16 및 9,000 이라고 기술하고 있다 (Silver 및 Fall, J Biol Chem, 270:13010-1316, 1995; Miller 등., Planta, 213:483-487, 2001; 및 Sharkey 등., Plant Physiology, 137:700-712, 2005). 3 개의 효소에 대해 게재된 K_m 값은 모두 꽤 높으며 서로의 범위 내에 존재하나, 쿠주 이소프렌 신타아제의 특이 활성은 다른 두 가지 이소프렌 신타아제의 것보다 현저하게 더 나쁘다.

III.이소프렌 신타아제 활성 및 용해성에 대한 검정

DMAPP 가 이소프렌 신타아제 효소에 대한 직접적인 기질이기 때문에, DMAPP 검정을 이용함으로써, 이소프렌 신타아제의 활성을 직접 측정할 수 있다. 야생형 쿠주 뿐 아니라, 포플러 모체 및 돌연변이체 균주의 세포 펠릿를 융해하고, 2 ml PEB (50 mM Tris-HCl, pH 8.0, 20 mM MgCl, 2 mM 디티오트레이톨, 및 50% [v/v] 글리세롤) 에 재현탁하였다. 세포를 세포파쇄기 (French pressure cell disruption) 로, 1 패스, 20,000 psi 에서 분해하였다. 이어서, 분해물 (1 ml) 을 마이크로퓨즈 (microfuge) 에서 20 분 동안 20,000 rpm 으로 4℃ 에서 원심분리하였다. 상청액을 제거하고, 펠릿을 1 ml 의 PEB 중에 재현탁하였다. 상청액 및 펠릿 샘플을 SDS-PAGE 및 DMAPP 검정으로 분석하고, 총 단백질 함량을 BCA 로 측정하였다.

표 6-3. 원심분리된 세포 분해물의 상청액으로부터 이소프렌 생성의 DMAPP 검정

생성을 총 세포 분해물 상청액 단백질로 정규화하였다.

표 6-4. 원심분리된 세포 분해물의 펠릿으로부터 이소프렌 생성의 DMAPP 검정

생성을 총 세포 분해물 펠릿 단백질로 정규화하였다.

포플러 변이체 K272R/C497W 는 유도된 배양물의 상청액 분획분에서 야생형과 비교하였을 때 활성 면에서 1.8x 증가를 보였다. 마찬가지로, 포플러 변이체 K272R 및 K272R/C497W 는 유도하지 않은 배양물의 상청액 분획분에서 야생형과 비교하였을 때, 활성 면에서 5.2x 및 3.4x 증가를 보였다. 게다가, 포플러 변이체 K272R 는, 유도된 배양물의 펠릿에서 야생형과 비교하였을 때 활성 면에서 2x 증가를 보였다. 그러나, 가장 두드러진 결과는 쿠주 IspS 이 본원에서 활용된 포플러 IspS 보다 더 큰 활성이라는 점이었다 (185x). 상기 표에서, H2 는 pTrcPoplar K272R/C497W H2 로 지명되는 클론의 명칭이다.

실시예 7

쿠주 이소프렌 신타아제의 서브클로닝 ( subcloning )

이 실시예에서는, 쿠주 이소프렌 신타아제 (IspS) SEL 구축에 사용되는 방법을 기술한다. 부위 평가 라이브러리 (SEL) 의 구축을 위한 발현 벡터를 제조하기 위해서, 쿠주 이소프렌 신타아제 유전자를 pCR2.1 벡터 (Invitrogen) 에서 pET24d 벡터 (Novagen) 로 서브클로닝 (subcloning) 하였다. 쿠주 IspS 유전자를 프라이머 MCM50 5’-GATCATGCAT TCGCCCTTAG GAGGTAAAAA AACATGTGTG CGACCTCTTC TCAATTTACT (SEQ ID NO:20); 및 MCM53 5’-CGGTCGACGG ATCCCTGCAG TTAGACATAC ATCAGCTG (SEQ ID NO:21) 를 이용하여 pTrcKudzu 주형 DNA 로부터 증폭하였다. PCR 반응을 Taq DNA 폴리머라아제 (Invitrogen) 를 이용하여 실시하고, 수득한 PCR 생성물을 pCR2.1-TOPO TA 클로닝 벡터 (Invitrogen) 로 클로닝하고, E. coli Top10 화학적 적격 세포 (Invitrogen) 로 형질전환시켰다. 형질전환체를 카르베니실린 (50 ㎍/ml) 를 함유하는 L 아가 상에 플레이팅하고, 하룻밤 37℃ 에서 인큐베이션하였다. 카르베니실린 50 ㎍/ml 을 함유하는 5 ml 의 Luria 브로쓰 배양물을 단일의 형질전환체와 접종시키고 하룻밤 37℃ 에서 성장시켰다. 5 개의 콜로니를, 1 ml 의 액체 배지 (Luria 브로쓰) 로부터 단리된 플라스미드 DNA 의 서열화로써 올바른 삽입을 위해 스크리닝하고, QIAprep Spin Mini-prep Kit (Qiagen) 를 이용해 정제하였다. 수득한 플라스미드 (MCM93 으로 지명됨) 은 pCR2.1 주쇄 (backbone) 에 쿠주 IspS 코딩 서열을 함유한다 (도 9). MCM93 (SEQ ID NO:22) 의 서열은 도 10 에 나타낸다.

쿠주 코딩 서열을 PciI 및 BamH1 (Roche) 를 이용하는 제한 엔도뉴클레아제 분쇄로 제거하였고, QIAquick Gel Extraction kit (Qiagen) 을 이용해 겔 정제하였다. pET24d 벡터 DNA 를 NcoI 및 BamHI (Roche) 로 분쇄하고, 쉬림프 알칼리 포스파타아제 (Roche) 로 처리하고, QIAprep Spin Mini-prep Kit (Qiagen) 를 이용해 정제하였다. 쿠주 IspS 절편을, Rapid DNA Ligation Kit (Roche) 을 이용해, NcoI/BamH1 분쇄된 pET24d 에 5: 1 의 절편 대 벡터 비율로 총 부피 20 ㎕ 로 하여 라이게이션하였다. 라이게이션 혼합물의 일부 (5 ㎕) 를 E. coli Top 10 화학적 적격 세포로 형질전환시키고, 카나마이신 (50 ㎍/ml) 을 함유하는 L 아가 상에 플레이팅하였다. 올바른 형질전환체를 서열화로 확인하고, 화학적 적격 BL21(λDE3)pLysS 세포 (Novagen) 로 형질전환하였다. 단일의 콜로니를 카나마이신 (50 ㎍/ml) 함유 L 아가 상 37℃ 에서 하룻밤 성장 후 선택하였다. pET24D-Kudzu 로서 지명되는 생성 플라스미드의 맵을 도 11 에 나타낸다. pET24D-Kudzu 의 서열 (SEQ ID NO:23) 은 도 12 에 나타낸다. IspS 활성을 실시예 5) 에 기술된 상부공간 검정을 이용하여 확인하였다.

실시예 8

이소프렌 신타아제 부위 평가 라이브러리 ( SEL ) 의 구축

식물 IspS 의 동적 파라미터를 개선하기 위해, SEL 을 쿠주 및 포플러 IspS 효소 모두의 상동성 모델로부터 선택되는 부위에서 제조하였다. 상기 상동성 모델로부터 지시된 부위에서의 조작으로 두 효소를 개선할 수 있다는 점이 예상되나, 이번 구현예에서는 쿠주 SEL 을 기술한다. 관심 쿠주 IspS 표면 부위에는, 하기가 포함되나 이로 제한되지는 않는다: 26 L, 30 E, 31 F, 33 Q, 35 L, 36 E, 37 N, 39 L, 40 K, 41 V, 43 K, 44 L, 61 R, 62 V, 63 D, 65 Q, 87 K, 94 E, 95 N, 99 L, 100 D, 105 N, 137 K, 138 E, 143 G, 144 E, 182 N, 184 L, 185 K, 187 G, 189 N, 190 T, 225 P, 226 H, 247 K, 257 T, 258 E, 259 M, 266 D, 334 N, 353 D, 357 S, 358 I, 361 E, 389 N, 392 I, 393 I, 398 K, 401 E, 421 C, 423 Q, 424 Q, 425 E, 426 D, 430 H, 432 L, 433 R, 434 S, 437 D, 443 R, 462 L, 463 E, 476 H, 478 N, 479 D, 485 Q, 508 D, 513 P, 515 A, 532 Q, 533 Y, 537 L, 538 G, 539 R, 542 Y, 543 A, 및 557 P, 관심 쿠주 IspS 활성 부위 위치에는 하기가 포함되나 이로 제한되지는 않는다: 24 P, 25 N, 309 Y, 310 D, 377 L, 381 F, 384 E, 399 Y, 402 N, 403 A, 406 S, 407 S, 409 G, 411 A, 413 L, 449 F, 456 A, 457 T, 458 S, 458 S, 459 A, 460 A, 461 E, 462 L, 463 E, 464 R, 465 G, 466 E, 467 T, 468 T, 469 N, 523 M, 527 S, 및 531 Y. 추가의 관심 쿠주 IspS 활성 부위 위치에는 하기가 포함되나, 이로 제한되지는 않는다: 20 A, 21 N, 22 Y, 23 Q, 271 R, 278 W, 299 F, 302 V, 및 408 S. 각각의 라이브러리 SEL 은 최대로 20 개의 상이한 변이체를 포함하는 클론을 함유한다. 예를 들면, 쿠주 이소프렌 신타아제 SEL 531 은, 성숙한 쿠주 효소의 위치 531 에서 티로신을 코딩하는 DNA 삼중자 (triplet) 가 하기를 인코딩하는 또 다른 DNA 삼중자로 대체된 변이체를 포함한다: 알라닌, 아스파르트산, 시스테인, 글루탐산, 페닐알라닌, 글리신, 히스티딘, 이소류신, 리신, 류신, 메티오닌, 아스파라긴, 프롤린, 글루타민, 아르기닌, 세린, 트레오닌, 발린, 또는 트립토판. 요약하면, 성숙한 IspS 의 DNA 코딩 가닥에서 특이적 위치의 DNA 삼중자가 대체된다. 돌연변이화 IspS 핵산은 후속해서 적합한 발현 벡터에 라이게이션되어 적합한 숙주 세포를 형질전환하는데 사용된다.

부위 평가 라이브러리는, 돌연변이될 코돈 대신에 "nns" 서열을 갖는 프라이머를 순서화하거나, 또는 합성 구축물 (예, DNA2.0) 을 순서화함으로써 제조된다. 이어서, 상기 프라이머는, 기술된 바와 같이 (예, WO0507682A2), 시판중인 돌연변이유발 키트 (예, Stratagene) 를 이용해 지시된 부위에서 SEL 을 생성하는 유전자를 돌연변이화시키는데 사용된다. 돌연변이된 코돈은 서열 분석으로 동정한다. 부위 라이브러리를 96 웰 마스터 플레이트에서 배열하고, 나중에 사용하도록 동결한다. 배양물을 상기 마스터 플레이트로부터 성장시키고 스크리닝을 위해 준비한다.

원하는 최종 생성물은 IspS 를 통해 탄소 유동을 최대화하도록 대사적으로 조작된 숙주에서 최적으로 기능하는 IspS 효소이다. 이를 위해, 몇몇의 스크리닝 단계를 사용해, 올바른 파라미터가 제시되는 것을 보장한다. 예시적 스크린에는 하기가 포함되나 이로 제한되는 것은 아니다: 발현, HG 생성을 위한 DMAPP 공급, 마이크로반응기, 단백질 측정 및 상부공간 검정. 발현 스크린: 단백질 발현의 수준을 분석하는 방법의 한 가지 예는 하기와 같다. 세포 분해물의 가용성 및 불용성 분획분 (용해된 세포 배양물로부터 수득함) 을 원심분리로 준비한다. 생성된 상청액 및 펠릿을 SDS-PAGE 로 분석한다. % 가용성 단백질은 상청액 대 펠릿 내 존재하는 단백질의 밀도계측 분석으로 측정한다.

예시적 구현예에서, 쿠주 부위 평가 라이브러리를 pET24D 발현 벡터에서 구축한다. pET24D-Kudzu 벡터 (쿠주 이소프렌 신타아제 유전자 함유) 는 주형 DNA 로서 역할한다.

재료:

pET24D-Kudzu 벡터 (~50 ng/㎕)

Kudzu IS 부위-특이적 돌연변이유발 프라이머 (Integrated DNA Technologies)

QuikChange®다중 부위-특이적 돌연변이유발 키트 (Stratagene)

MJ Research PTC-200 Peltier Thermal Cylcer (Bio-Rad Laboratories)

One Shot TOP10 적격 세포 (Invitrogen)

QIAprep Spin Miniprep Kit (Qiagen)

BL21(λDE3) pLysS 적격 세포 (Invitrogen)

Luria Broth (LB) 아가 플레이트

방법:

돌연변이유발 방법은, 돌연변이될 코돈 서열과 상응하는 특이적으로 설계된 3중의 DNA 서열 NNS (N = A, C, T 또는 G 및 S = C 또는 G) 를 비롯한 25 내지 45 개의 뉴클레오티드 길이인 단일의 정방향 프라이머를 이용해, 특이적 DNA 삼중자에서 모든 가능한 돌연변이화의 제조를 수행하는 코돈-특이적 돌연변이화 접근법을 기초로 하였다. 이 방법으로 관심 대상의 특이적 pET24D-kudzu 코돈에서 뉴클레오티드의 랜덤 혼입을 도모한다. 표 8-1 은 돌연변이유발에 사용되는 올리고뉴클레오티드 프라이머를 열거하는데, 이 프라이머 명칭 내 숫자는 성숙한 쿠주 이소프렌 신타아제 효소 서열에서의 코돈 위치와 대응한다. 모든 올리고뉴클레오티드 프라이머를 100 nmole 규모로 합성하였고 (Integrated DNA Technologies) 및 PAGE 정제하였다.

표 8-1. 쿠주 IspS 코든-특이적 돌연변이화 프라이머

PCR 반응을 0.5ml 얇은-벽으로 된 PCR 튜브에서 QuikChange®다중 부위-특이적 돌연변이유발 키트 (Stratagene) 에 대한 제조자의 프로토콜에 따라 설정하여: 1㎕ pET24 Kudzu 벡터 (50ng/㎕); 1㎕ Kudzu IS 부위-특이적 정방향 돌연변이유발 프라이머 (10㎕M); 2.5㎕ 10X QuikChange®다중 반응 버퍼; 1㎕ dNTP 믹스, 1㎕ QuikChange®다중 효소 블렌드 (2.5U/㎕); 및 18.5㎕ 증류된 오토클레이브 물로 25㎕ 의 총 반응 믹스를 제공했다. pET24 Kudzu SEL 을 하기의 조건을 이용하여 증폭하였다: 95℃ 에서 1 분 (첫 번째 사이클에서만) 후, 95℃ 에서 1 분, 55℃ 에서 1 분, 65℃ 에서 12 분 (29 사이클 반복). 이어서, 반응 혼합물을, 각 튜브에 1.5㎕ DpnI 제한 효소 첨가에 의해 DpnI 분쇄 (QuikChange®다중 부위-특이적 돌연변이유발 키트로 공급됨) 에 적용하였고, 37℃ 에서 2 시간 동안 인큐베이션하여, 모체 pET24D-kudzu 벡터를 분쇄시켰다. 이어서, DpnI-처리된 PCR 반응물을 One Shot TOP10 적격 세포 (Invitrogen) 로 형질전환시키고, 50㎍/ml 카나마이신을 함유하는 LB 아가 플레이트에 플레이팅하고, 37℃ 에서 하룻밤 인큐베이션하였다. 익일, 96 랜덤 콜로니를 고르고 서열화하여 가능한 19 개의 아미노산 변이체 중 최소 15 개를 동정하였다. 부위-특이적 변이체를 동정하자마자, 각각의 변이체 클론을 이어서 (LB + 50㎍/ml 카나마이신)의 5 ml 튜브에 접종하고, 37℃ 에서 진탕하면서 (250 rpm) 하룻밤 성장시켰다. 다음날, 플라스미드 DNA 를 QIAprep Spin Miniprep Kit (Qiagen) 을 이용해 정제하였다. 그 후, 변이체를 One Shot BL21(λDE3) pLysS 적격 세포 (Invitrogen) 에 단백질 발현 스크리닝을 위해서 형질전환시키고, 50㎍/ml 카나마이신 및 30㎍/ml 클로람페니콜을 함유하는 LB 아가 플레이트 상에서 플레이팅하고 하룻밤 37℃ 에서 인큐베이션하였다.

E. coli BL21(λDE3) pLysS 세포에서 pET24D-Kudzu SEL 을 생성하는 대안 방법을 또한 성공적으로 활용했다. 상술된 DpnI-처리 PCR 반응으로부터 수득된 TOP10 적격 세포 형질전환체는, 3ml 의 LB 배지를 상기 아가의 상부에 적용하고, 멸균 플레이트 스프레더 (spreader) 로 스크레이핑 (scraping) 하여 세포를 재현탁시킴으로써 수확하였다. 이어서, 3ml 의 모은 (pooling) 재현탁된 세포를 LB + 50㎍/ml 카나마이신을 함유하는 25 ml 진탕 플레이크에 접종하는데 사용했다. 그 후 모은 배양물을 하룻밤 37℃ 에서 진탕하면서 (250rpm) 성장시켰다. 다음날, 플라스미드 DNA 를 모아진 배양물로부터 QIAprep Spin Miniprep Kit (Qiagen) 을 이용하여 정제하였다. 이어서, 모은 플라스미드 DNA 를 상술한 바와 같은 단백질 발현 스크리닝을 위해 One Shot BL21(λDE3) pLysS 적격 세포에 형질전환시켰다.

마스터 플레이트를 제작하기 위해, 96 웰 플레이트에서 올바른 구축물을 4 세트로 배열한다. 올바른 서열의 한 콜로니를 사용하여 4 개의 웰에 접종하고, 플레이트를 수 시간 내지 하룻밤 동안 37℃ 에서 50 ㎍/ml 카나마이신 함유 LB 중 진탕하면서 (200 rpm) 성장시켰다. 멸균 글리세롤을 배양물에 첨가하여 최종 농도가 15% (최종 총 부피: 150-200 ㎕/웰) 가 되게 한다. 이어서, 플레이트를 Breathe-EASIER (EMS Catalog No. 70536-20) 막을 이용하여 밀봉하고 -80℃ 에서 보관하였다.

실시예 9

이소프렌 신타아제 봉입체 ( inclusion body ) 의 생성 및 정제

쿠주 이소프렌 신타아제를 함유하는 봉입체를, 효소가 균주 BL21(λDE3) 내 샤페론 GroELS 의 존재시 과발현할 때 형성시켰다. 간략하게, pETNHisKudzu (U.S. 출원 No. 61/013,574, 본원에서 참조 인용됨) 를 제조자의 지침에 따라 pGro7 (Takara Catalog No. 3340) 로 서브클로닝하였다. 500 mL 의 배양물을 본질적으로 기술된 바와 같이 성장시켰다 (Whittington 등., Proc Natl Acad Sci USA, 99:15375-15380, 2002). 샤페론의 존재 및 저온 배양에도 불구하고, 배양물은 대개 봉입체를 양산하고 오로지 낮은 수준만으로 가용성 활성 단백질을 양산하였다. 봉입체를 제조자의 지침에 따라 IFOLD Protein Refolding System (Novagen Catalog No. 71552-3) 를 이용하여 수확하였다. 이러한 절차로 고 수율 (>50 mg) 의 재조합 쿠주 이소프렌 신타아제를 도모하였다. 봉입체의 순도는 도 13 에 나타낸다. 이 제조법을 래빗 폴리크로날 항-이소프렌 신타아제 항혈청 (Invitrogen) 생산에 사용했다.

실시예 10

이소프렌 신타아제 변이체의 고처리량 생화학 스크린

이 실시예는 이소프렌 신타아제 활성의 측정에 있어서 고처리량 방법을 기술한다. 이소프렌 신타아제 변이체를 발현할 수 있는 BL21(λDE3)pLysS E. coli 숙주 세포의 라이브러리를 96-웰 플레이트에 배열하고 -80℃ 에서 실시예 8, 상기에서 기술한 바와 같이 15% 글리세롤 스톡으로서 동결 보관했다. 96 개 이하의 변이체의 플레이트를 분석하기 위해, 글리세롤 스톡 마스터 플레이트의 복제 스탬프 (replica stamp) 를 96-pin Multi-Blot floating pin (부유 핀) 도구 (V&P Scientific Catalog No. VP 408AF) 로 적절한 항생제(들) (예, 30 ㎍/mL 클로람페니콜, 50 ㎍/mL 카나마이신) 를 함유하는 Luria 브로쓰 아가 상에서 만들었다. 복제 플레이트를 하룻밤 30℃ 에서 인큐베이션하여 박테리아 패치 (patch) 가 성장하게 하였다. 동일한 부유 핀 복제자를 이용하여, 0.08% Biospringer 효모 추출물 및 1% 글루코오스 + 항생제들 (30 ㎍/mL 클로람페니콜, 50 ㎍/mL 카나마이신) 로 보충된 250 ㎕ 의 TM3 배지를 함유하는 96-사각형의 딥웰 플레이트를 아가 플레이트로부터 접종하고 하룻밤 30℃ 에서 인큐베이션하였다. TM3 브로쓰의 제조방법은 하기와 같다: K₂HPO₄ (13.6 g/l) KH₂PO₄ (13.6 g/l), MgSO₄ * 7H₂O (2 g/l) 시트르산 모노히드레이트 (2 g/L) 시트르산 철 암모늄 (0.3 g/L) (NH₄)₂SO₄ (3.2 g/L) 효모 추출물 (0.2 g/L) 1 ml 의 1000x 미량 원소 용액 (수산화암모늄으로 pH 를 6.8 로 조절, 멸균 diH₂O 으로 부피는 충분량 및 0.22 마이크론 필터로 여과 멸균됨). 1000X 미량 원소 용액의 제조 방법은 하기와 같다: 시트르산 * H₂O (40 g/L), MnSO₄ * H₂O (30 g/L), NaCl (10 g/L), FeSO₄ * 7 H₂O (1 g/L), CoCl₂ * 6 H₂O (1 g/L), ZnSO * 7 H₂O (1 g/L), CuSO₄ * 5 H₂O (100 mg/L), H₃BO₃ (100 mg/L), NaMoO₄ * 2 H₂O (100 mg/L). 각각의 성분을 diH₂O 중에 한번에 하나씩 용해하고, pH 는 HCl/NaOH 로 3.0 으로 조절하고, 부피는 충분량이 되게 하고 0.22 마이크론 필터로 여과 멸균하였다. 하룻밤 배양물을 동일한 배지로 OD₆₀₀ 이 0.05 가 되도록 희석하고, 또 다른 96-사각형의 딥웰 플레이트 (Thomson Instrument, Catalog No. 951652C; 이때 각각의 웰은 600 ㎕ 의 희석물을 함유함) 에서 성장시켰다. 희석물을 30℃ 에서 0.8 의 OD₆₀₀ 으로 진탕하면서 성장시킨 다음, IPTG 를 400 μM 농도로 첨가하여 유도하였다. 플레이트를 5 시간 동안 성장시키고, OD₆₀₀ 를 품질 대조 및 정규화를 위해 측정한다.

400 ㎕ 의 부피의 배양물을 새로운 96-웰 플레이트 (Perkin Elmer, Catalog No. 6008290) 로 옮기고, 세포를 Beckman Coulter Allegra 6R 원심분리기에서 2500 x g 로 원심분리하여 수확하였다. 펠릿을 200 ㎕ 의 저장성 (hypotonic) 버퍼 (5mM MgCL₂, 5mM Tris HCl, 5mM DTT pH 8.0) 중에서 재현탁하고, 플레이트를 -80℃ 에서 최소 60 분의 시간 동안 동결한다. 세포 분해물을, 플레이트를 융해하고 32 ㎕ 의 이소프렌 신타아제 DMAPP 검정 버퍼 (57mM Tris HCl, 19 mM MgCl₂, 74 ㎍/mL DNase I (Sigma Catalog No. DN-25), 2.63x10⁵ U/mL 의 ReadyLyse 리소자임 용액 (Epicentre Catalog No. R1802M), 및 5 mg/mL 의 분자 생물 등급 BSA 를 첨가함으로써 제조한다. 플레이트를 25℃ 에서 30 분 동안 진탕하면서 인큐베이션한 다음 얼음 위에 놓는다. 이소프렌 생성을 위해, 80 ㎕ 분취량의 분해물을 96-딥웰 유리 플레이트 (Zinsser Catalog No. 3600600) 으로 옮기고, 20 ㎕ 의 100mM KHPO₄ 중 10 mM DMAPP 용액, pH 8.2 (Cayman Chemical Catalog No. 63180) 을 첨가한다. 플레이트를 알루미늄 플레이트 밀봉제로 밀봉하고 (Beckman Coultor Catalog No. 538619) 60 분 동안 30℃ 에서 진탕하여 인큐베이션한다. 효소 반응은, 유리 블록을 가열함으로써 (70℃로 5 분 동안) 종결한다. 각각의 웰의 상부공간은 실시예 5 에서 기술한 바와 같이 정량적으로 분석한다.

단백질 농도를 측정하기 위해, 5㎕ 이상의 분해물을, 니트로셀룰로오스 막 (Invitrogen Catalog No. LC2000) 으로 옮긴 후 웨스턴 블롯 분석을 위한 프리캐스트 (precast) 겔 (Invitrogen Catalog No. NP0301BOX) 상에서 작동시켰다. 사용된 일차 항체는 실시예 9 의 항-이소프렌 신타아제 항체이다. 일차 항체 결합 후 Alexa Fluor 488 (Invitrogen Catalog No. A-11008) 로 표지된 이차 항체 발생으로 정량적 신호 측정을 가능하게 한다. 웨스턴 블롯 절차는 Invitrogen 에 의해 기술된 바와 같이 실시했다. 형광 신호는 블루 필터 설정을 이용하는 Molecular Dynamics Storm 기기로 기록하였고, Molecular Dynamics ImageQuant 이미지 분석 소프트웨어 패키지로 정량적으로 분석하였다. 라이브러리 멤버의 특이 활성은, 유도 배양물의 A₆₀₀ 또는 웨스턴 블롯으로 측정된 이소프렌 신타아제 단백질 농도로 나눈 이소프렌 생성량 비율로부터 산출하였다. 이소프렌 신타아제 단백질 표준은, 일차 표준으로서 역할하는 Coomassie brilliant blue (쿠마시 브릴리언트 블루) R250 로 염색된 BSA 로 표준 겔 밀도계측에 의해 보정되었다. 전체 라이브러리의 특이 활성 면에서 증가, 감소 또는 변화 없음을 추가 분석을 위해 표로 만들었다. 도 14 는 위치 Y22, A20, 및 S408 에 대한 쿠주 부위 평가 라이브러리 (SEL) 멤버의 이소프렌 신타아제 활성을 나타내는 그래프를 제공한다. 대부분의 멤버는 야생형과 비교했을 때 매우 감소된 활성을 나타내나, 보존성 치환들은 활성면에서 더 적은 감소를 보인다. 변이체 A20G 의 활성은 야생형 쿠주 효소의 것과 비슷한데, 이는 이 변이체가 조합 돌연변이에 대한 후보 파트너 인 것을 나타낸다. 흥미롭게도, 라이브러리 S408 의 변이체 S408D 는 야생형과 비교시 활성이 증가하였음을 보이기 때문에, 조합 돌연변이의 또 다른 후보 파트너가 된다.

실시예 11

이소프렌 신타아제 절단물

이 실시예는 정제된 포플러 IspS 제조물에서 보이는 저 (low) 밴드의 더블릿 (doublet) 에서 단백질의 아미노산 서열의 동정을 기술한다 (도 21 참고). 질량 분석으로 동정한 추정 절단 부위를 기준으로 하여 일련의 N-말단 절단된 IspS 분자들을 또한 만들었다. IspS 의 더 짧은 N-말단 절단물 (pDu39 내 "MEA" 절단물, 하기 참고) 를 또한 만들어서, 추가의 절단의 IspS 활성에 대한 효과를 조사했다 (Williams DC, McGarvey DJ, Katahira EJ, Croteau R (1998) Biochemistry 37:12213-12220).

I. 단백질 정제를 위한 N-말단 6XHis-태깅된 IspS (pDu27 내) 의 구축:

주형 P. alba pET24a 로부터의 전장 P. alba IspS (도 19 및 20) 를 PCR 로 제조하였다. 하기의 PCR 반응물을 제조하였다: 1㎕ (주형)-P. alba pET24a, 5 ㎕ 10X PfuUltraII 융합 버퍼, 1 ㎕ dNTP (10 mM), 1㎕ 프라이머 (50 μM) 프라이머 F-(MCM219), 1 ㎕ 프라이머 (50 μM) 프라이머 R-(MCM182), 41 ㎕ diH₂O 및 1 ㎕ 의 PfuUltra II 융합 DNA 폴리머라아제 (Stratagene). PCR 사이클 파라미터는 하기와 같다: 95 ℃ 1 분, 95 ℃ 1 분, 55 ℃ 20 초, 72 ℃ 27 초 (29 사이클) 후, 72 ℃ 3 분 및 냉각될 때까지 4 ℃ (Eppendorf Mastercycler 를 이용함). PCR 생성물을 0.8% E-겔 (Invitrogen) 및 Qiagen QIAquick Gel Extraction 및 QIAprep Spin Miniprep 키트를 이용하여 제조자의 권고되는 프로토콜에 따라 겔 추출하고 정제하였다. 3 ㎕ 분취량의 정제된 생성물을 제조자의 프로토콜에 따라 pET200D/TOPO 벡터 (Invitrogen) 에 라이게이션하였다. 반응물을 5 분 동안 실온에서 인큐베이션한 다음, 6 ㎕ 토포이소머라아제 혼합물을 제조자의 프로토콜에 따라 E. coli Top10 화학적 적격 세포 (Invitrogen) 로 형질전환시켰다. 형질전환체를, 카나마이신 (50 ㎍/ml) (Kan50) 을 함유하는 KB 플레이트 상에서 선별하고, 37 ℃ 에서 하룻밤 인큐베이션하였다. 5 개의 콜로니를 고르고, T7 정방향 및 MCM182 프라이머를 이용하는 PuReTaq Ready-To-Go PCR Beads (Amersham) 를 이용해 스크리닝하였다. 올바른 크기의 삽입물을 갖는 클론을, T7 정방향 및 T7 역방향 프라이머 (Quintara Biosciences) 를 이용하여 서열화하여 추가로 확인했다. 한 구축물인 pDu27 (도 16-18) 를 추가 연구를 위해 선택했다. 1 ㎕ 분취량의 플라스미드 제조물을, 제조자의 프로토콜에 따라 BL21(λDE3)pLysS (Invitrogen) 에 형질전환하였다. 형질전환체를 Kan50+ 및 클로람페니콜 (35 ㎍/ml) (Cm35) 를 함유하는 LB 플레이트 상에서 선별하고, 37 ℃ 에서 하룻밤 인큐베이션하였다. 수득한 균주를 N-말단 6XHis-태깅된 P. alba IspS 의 발현 및 정제에 사용했다.

II. 6XHis-태깅된 IspS 의 정제

6XHis-태깅된 IspS 의 발현

N-말단 6XHis-태깅된 IspS 를 균주 MD08-99 로부터 발현 및 정제하였다. 성장 절차는 BL21(λDE3)pLysS 세포에서 발현된 히스티딘 태깅된 효소에 적합하다. 10 ml 의 하룻밤 배양물을, 각 1 L 의 계획된 성장을 위해 제조했다. 적절한 항생제 (50 mg/ml 카나마이신, 50 mg/ml 클로람페니콜, 및/또는 50 mg/ml 카르벤실린) 를, 25 ml 플라스크 내 10 ml 의 LB 배지에 첨가하고, 신선한 플레이트의 세포에서 또는 글리세롤 동결된 세포 스톡에서 직접적으로 취한 1 개의 콜로니에 접종했다. 배양물을 30 ℃ 에서 하룻밤 ~220 rpm 으로 진탕하면서 성장시켰다. 명 (day) 배양물을, 각각의 배양물에 대해 적절한 항생제를 갖는 LB 배지 1 리터 중에서 제조했다. 각 1 L 의 명 배양물을 10 ml 의 하룻밤 배양물과 접종시키고 OD₆₀₀ 가 ~0.4-0.6 에 도달할 때까지 ~220 rpm 에서 진탕하면서 30-37 ℃ 에서 성장시켰다. 명 배양물을 이어서 400 μM IPTG 로 유도시키고 ~5-6 시간 동안 220 rpm 에서 진탕하면서 30℃ 에서 성장 지속을 가능하게 했다. 이어서, 세포를 10 분 동안 4 ℃ 에서 10,000 x g 로 원심분리하여 수확했다. 수확 후, 세포를 직접 사용하거나 또는 공정 대기 상태까지 (ready to process) -80℃ 에서 보관했다.

6XHis-태깅된 IspS 의 정제

BL21(λDE3)pLysS 세포로부터 히스티딘 태깅된 효소를 정제하기 위해, 세포를 조심스레 신선한 분해 버퍼 (분해 버퍼: Ni 세정 (wash) 버퍼 + 0.5 mM PMSF, 0.01% Tween-20, 1 mg/ml 리소자임, 0.2 mg/ml DNaseI; Ni 세정 버퍼: 50 mM NaH₂PO₄, 300 mM NaCl, 20 mM 이미다졸, pH 8.0) 에서 재현탁하였다. 1L 의 세포 펠릿 당 대략 40-50 ml 의 분해 버퍼를 사용했다. 이어서, 세포를 약 30 분 동안 얼음 상에서 인큐베이션하였다. 이어서, 세포 현탁액을 세포파쇄기 (대(大) 세포파쇄기; 1200 psi/고 셋팅) 를 통해 분해물이 투명하게 보이기 시작할 때까지 2-3 회 통과시켜 완전히 분해시켰다. 분해물의 샘플을 활성 검정 및 겔 분석 (~100 ㎕) 을 위해 저장했다. 이어서, Sorvall Discovery 90SE 초원심분리기에서 30 분, 4℃, 30,000xg 로 분해물을 원심분리하여, 상기 분해물을 투명하게 만들었다. 상청액을 제거 및 보유했다. "투명하게 된 분해물" 의 샘플을 활성 검정 및 겔 분석 (~100 ㎕) 을 위해 저장했다.

투명해진 분해물을 0-100% Ni 버퍼 B 구배를 이용하여 HisTrap HP 컬럼 (GE Healthcare) 상에서 실시했다. 이어서, 샘플을 제조자의 지침에 따라 SDS-PAGE 겔 (4-12% 겔 NUPAGE, Invitrogen) 로 분석했다. 원하는 분획분을 스핀 필터 (Vivaspin-20, Sartoris,) 상에서 농축한 다음 Sephadex G25 수지로 패킹된 HiPrep 26/10 Desalting 컬럼 (GE heathcare) 을 걸쳐 탈염시켰다. G-25 버퍼는 50 mM HEPES, 50 mM NaCl, 및 1 mM DTT, pH 7.4 로 이루어졌다. 이어서, 원하는 샘플을 0% Q seph 버퍼 A 에서 100% Q seph 버퍼 B (Q seph 버퍼 A: 50 mM Tris, 0.05 M NaCl, 1 mM DTT, pH 7.6, 및 Q seph 버퍼 B: 50 mM Tris, 1.0 M NaCl, 1 mM DTT, pH 7.6) 로의 구배 용리를 이용하는 HiTrap Q HP 컬럼 (GE) 을 통해 정제하였다. 원하는 단백질을 함유하는 분획분을 분석하고 농축했다. 이어서, 샘플 버퍼를, Sephadex G25 수지로 패킹된 Hi Prep 26/10 Desalting 컬럼 (GE heathcare) 에 상기 샘플을 통과시켜 50 mM HEPES, 50 mM NaCL, pH 7.4 및 1 mM DTT 로 교환시켰다. 겔 여과의 최종 연마 (polishing) 단계를, 필요할 경우에 사용했다. 샘플을, 겔 여과 버퍼 (50 mM HEPES, 150 mM NaCl, 1mM DTT, pH 7.4) 중 Hi Load 26/60 Superdex 200 prep grade (GE) 를 통해 통과시켰다. 이어서, 분획분을 분석하고 농축했다. 이어서, 샘플을 -80 ℃ 에서 보관했다. 밴드 분석을 위한 제조에 있어서, 샘플을 SDS-PAGE 겔 (4-12% NUPAGE 겔, Invitrogen) 상에서 수행하고, 염색하고, 원하는 밴드를 잘라내고 하기와 같이 처리했다.

III. 이소프렌 신타아제의 질량 분석

샘플 제조

겔 내부 분쇄 (In-Gel Digestion) 및 LCQ-Deca 질량 분석 절차를 이용했다 (Modified Rosenfeld in-gel Digest Protocol) (Rosenfeld 등, Anal. Biochem. (1992) 203, 173-179; Hellman 등, Anal Biochem, (1995) 224, 451-455). 정제된 샘플의 이소프렌 신타아제를 4-12% SDS-PAGE (NUPAGE, Invitrogen) 상에 작동시키고, Coomassie Brilliant Blue R-250 (Thermo Scientific) 또는 SimplyBlue Safe Stain (Invitrogen) 로 염색하였다. 관심 밴드(들)을 겔에서 오려내어 탈염색하였다. 각각의 겔 조각 (slice) 를 ~1 mm x 1mm 의 작은 조각으로 깍둑썰기하고, 0.65 mL "번들번들한" (실리콘 처리된) 튜브 (PGC Scientific) 에 넣었다. 약 100㎕ 의 25mM NH₄HCO₃/50% ACN/H₂O 를 각 튜브에 첨가하고, 10 분간 보르텍스 (vortex) 하였다. 상청액을 추출 및 폐기했다. 이러한 단계들을 2 회 반복했다. 이어서, 겔 조각들을 Savant SpeedVac 중에 작동시켜 건조했다 (~ 20 내지 30 분).

이어서, 샘플을 환원 및 알킬화시켰다. 환원을 위해서는, 25 mM NH₄HCO₃ 중 10 mM DTT (신선한 것으로 제조) 25 ㎕ (또는 커버하기에 충분량) 를 건조된 겔에 첨가했다. 이어서, 튜브를 보르텍스하고 잠시 회전시켰다. 반응물을 50 ℃ 에서 1 시간 동안 인큐베이션하였다. 알킬화를 위해서는, 상청액을 제거하고, 25 mM NH₄HCO₃ 중 25 ㎕ 이상의 55 mM 요오도아세트아미드 (IAA) 를 겔에 첨가했다. 반응 튜브를 다시 보르텍스하고, 잠깐 회전시켰다. 반응물을 1 시간 동안 실온에서 암실에 두었다. 상청액을 제거하고 겔을 ~ 100 ㎕ 의 25mM NH₄HCO₃/50% ACN/H₂O 로, 10 분 동안 보르텍스 및 잠시 회전시켜 세정했다. 상청액을 제거하고, 세정 단계를 1 회 반복했다. 겔 조각들을 이어서 SpeedVac (~ 15 -30 분) 중에서 건조시켰다.

400 ㎕ 의 0.1% n-옥틸 B-D-글루코피라노시다아제 수를, 100 uL 의 8M 우레아에 첨가하여, 분쇄 버퍼를 제조하였다. 400 uL 의 상기 분쇄 버퍼를 20 ug 의 신선하게 제조된 트립신에 첨가했다. 0.05 ㎍/㎕ 의 서열화-등급 (sequencing-grade) 트립신을 400 uL 의 1.6 M 우레아 용액에 용해시킨 20 ㎍ 서열화 등급 트립신 (Promega) 의 1 개의 바이알로부터 제조하였다. 트립신 효소 용액을 겔 조각을 커버하기에 충분하도록 첨가했다. 튜브를 파라필름으로 커버하고 37 ℃ 에서 하룻밤 (16-20 시간) 인큐베이션하였다. 겔 보다 약간의 여분의 버퍼가 존재함을 보장했다

겔로부터 잠시 분쇄물을 보르텍스 및 회전시켜 펩티드를 추출했다. 분쇄 용액을 겔 로딩 팁을 이용해 0.65 mL 실리콘처리된 튜브로 옮겼다. 50 ㎕ (커버하기에 충분량) 의 50% ACN/0.1% FA/H₂O 를 겔 조각에 첨가하고, 샘플을 10 분 동안 보르텍스한 다음, 회전하고, 5 분 동안 초음파처리했다. 추출된 펩티드를 하나의 튜브에 모았다. 겔 조각이 겉보기에 흰색으로 되고 크기가 줄어들 때까지 추출 단계를 2 내지 3 회 이상 반복했다. 추출된 분쇄물을 보르텍스, 회전하고 Speed Vac 에서 건조하여 부피가 55 ㎕ 되게 했다. 부피가 55 ㎕ 미만이었을 경우에는, 충분한 0.1% FA 를 첨가하여, 최종 부피가 55 ㎕ 가 되게 했다.

질량 분광법

샘플을 Thermofinnigan (San Jose, CA) LCQ-Deca 전기분무 이온화 (electrospray ionization;ESI) 이온-트랩 질량 분광기에 주입하였다. Vydac C18 컬럼 (5μ, 300A, 0.2 x 150 mm, Michrom Bioresources, Auburn, CA) 를 200 ㎕/min 유속으로 이용했다. 주입 부피는 50 uL 이었고, 온-라인 트래핑 카트리지 (Peptide CapTrap, Michrom Bioresources, Auburn, CA) 를 통해 여과한 후, 컬럼에 로딩했다. 겔-내 분쇄물의 분리를, 하기 구배로 수행했다: (용매 A: H2O 중 0.1% 트리플루오로아세트산 (J.T. Baker, Phillipsburg, NJ), 용매 B: 아세토니트릴 중 0.08% 트리플루오로아세트산 (J.T. Baker, Phillipsburg, NJ)):

표 11-1. 구배 표

질량 분광 결과

단백질의 6.4 ㎍ 분취물을 5 개의 레인으로 4-12% bis-tris NUPAGE 겔 (Invitrogen) 상, MOPS 버퍼에 로딩하고, 50 분 작동하였다. 상술한 바와 같이, 겔을 2 분 동안 염색한 다음 15 분 동안 탈염색하였다. 겔을 H₂O 중에 세정한 다음, 모든 밴드를 오려내, 작은 조각으로 컷팅하고 탈염색하였다. 겔 조각을 DTT/IAA 각각으로, 1 시간 동안, 각각 52 ℃ 및 RT 에서, 환원 및 알킬화하였다. 트립신을 하룻밤 분쇄를 위해 첨가했다. 추출된 펩티드를 LCQ-Deca 상에서 작동시켰다. 도 21 및 22 는, 질량 분광 분석 결과를 보여준다. 저 (lower) 더블릿 밴드 (도 21) 는 IspS 로 동정된다. 도 22 는, (pDu27 내 N-말단 His-태깅된 IspS 단백질의 펩티드 서열에 의하면) 아미노산 39, 40, 42, 및 44 뒤에 N-말단 절단물이 발견되었음을 나타낸다. IspS 의 C-말단은 온전하다.

IV. N-말단 절단된 IspS 변이체의 구축:

친화 태그 (affinity tag) 가 없는 모든 절단된 구축물을, PCR 증폭으로부터 주형 P.alba pET24a 를 이용하는 QuickChange 부위-특이적 돌연변이유발 키트 (Stratagene) 를 이용하여 제조했다. 약 50 ng 의 주형 DNA 을, 각 관련 절단물에 상응하는 정방향 (For) 및 역방향 (Rev) 프라이머 쌍 (QC MSV For 및 QC MSV Rev, 예를 들어 표 11-2 참조) 으로 돌연변이유발된 PCR 생성물의 증폭에 사용했다 (Eppendorf Mastercycler Gradient PCR 기기 사용). 하기의 PCR 반응 혼합물을 이용했다: 1 ㎕ P. alba pET24a, 5 ㎕ 10X PfuUltra HF 버퍼, 1 ㎕ dNTP, 1 ul (50 μM) 프라이머-For (예 QC MSV For), 1 ㎕ (50 μM) 프라이머-Rev (예 QC MSV Rev), 2 ㎕ DMSO, 39 ㎕ diH₂O, 1 ㎕ PfuUltra HF 폴리머라아제 (Stratagene). 하기의 PCR 사이클 파라미터를 사용했다: 95 ℃ 1 분, 95 ℃ 30 초, 55 ℃ 1 분, 68 ℃ 7.3 분 (1 사이클) 후, 95 ℃ 30 초, 55 ℃ 1 분, 68 ℃ 7.3 분 (총 18 사이클) 다음 4 ℃. PCR 생성물을 1-2 ㎕ 의 DpnI (Roche) 로 1-3 시간 동안 37 ℃ 에서 처리했다. 5 ㎕ 분취량의 DpnI 처리된 생성물을 0.8% E-겔 (Invitrogen) 상에서 시각화하였다. 1 ㎕ 분취량의 각 생성물을 화학적 적격 E. coli Top10 세포 (Invitrogen) 에 제조자 프로토콜에 따라 형질전환시켰다. 형질전환체를, 카나마이신을 50 ㎍/ml 농도로 함유하는 (Kan50) LB 배지에 있어서 선별하고, 37 ℃ 에서 하룻밤 인큐베이션하였다. 각 형질전환체의 5 개의 콜로니를 선별하고 정지상까지 3 ml 액체 LB Kan50 에서 성장시켰다. 플라스미드를 제조자가 추천하는 프로토콜에 따라 Qiagen miniprep 키트를 이용해 정제했다. 정제된 플라스미드를 T7 정방향 및 역방향 프라이머로 서열화 (Quintara Biosciences 에 의함) 하고, 이의 각 절단물에 대해서 확인했다. 생성된 플라스미드 (pDU39 내지 pDU43, 표 11-4, 도 23-34 참고) 를 화학적 적격 E. coli BL21(λDE3) pLysS (Invitrogen) 로 제조자의 추천되는 프로토콜에 따라 형질전환시켰다. 표 X 는 절단된 IspS 효소의 발현에 사용된 균주를 기술한다.

친화성 (6XHis) 및 단백질분해 (TEV, Tobacco Etch Virus) 태그를 갖는 구축물을, PCR 반응용 주형으로서 P. alba pET24a 를 이용해 제조했다. PCR 반응 혼합물을 하기와 같이 제조했다: 1ul (P. alba pET24a), 5ul 10X PfuUltraII 융합 버퍼, 1ul dNTP (10 mM), 1ul 프라이머 (50 μM) Alba FL-NdeI-For 또는 Alba TRC (MEA)-NdeI-F, 1ul 프라이머 (50uM) Alba FLTRC (+) TEV-R, 41 ul diH₂O 및 1ul 의 PfuUltra II 융합 DNA 폴리머라아제 (Stratagene). PCR 사이클 파라미터는 하기와 같았다: 95 ℃ 1 분, 95 ℃ 30 초, 55 ℃ 20 초, 72 ℃ 25 초 (1 사이클) 다음, 95℃ 30 초, 55 ℃ 20 초, 72 ℃ 25 초 반복 (추가의 28 사이클) 후, 72℃ 3분 다음 4 ℃. 증폭 및 생성물의 정확한 분자량의 0.8% E-겔 (Invitrogen) 상에서의 시각화에 의한 확인 후, PCR 생성물을 제한 효소 NdeI 및 XhoI (Roche) 로 2 시간 동안 37 ℃ 에서 분쇄한 다음, 제조자의 추천되는 프로토콜에 따라 Qiaquick Gel Purification system (Qiagen) 을 이용해 겔 정제하였다. 3 ㎕ 의 정제된 생성물을 NdeI 및 XhoI (Roche) 로 분쇄된 pET-24a (Invitrogen) 에 라이게이션하고, 겔 정제하고 제조자의 추천되는 프로토콜에 따라 인산기이탈 반응 (SAP, 쉬림프 알칼리 포스파타아제 이용) (Promega) 하였다. T4 리가아제 (NEB) 를 라이게이션 반응에 사용하고, 이를 16 ℃ 에서 하룻밤 인큐베이션하였다. 라이게이션 반응물을 수중으로 30 분 동안 투석하였고, 2 ㎕ 의 반응물을 사용하여, MCM331 (하기 참고) 적격 세포를 전기천공하였다. 세포를 30 ℃ 에서 2 시간 동안 회수되게 한 후, 플레이트에 퍼뜨린 5 mM (R)-(-)-메발로노락톤 (MVA) (Sigma) 과 Kan50 상에서 선별하였다. 양성의 형질전환체를 3 ml 의 액체 LB Kan50 에 접종하고, 플라스미드를 QIAPrep Spin miniprep 키트 (Qiagen) 를 이용해 단리하였다. 삽입물을 NdeI 및 XhoI(Roche) 를 이용한 제한 분쇄로 확인하였고, 양성의 클론을 T7 프로모터 및 T7 터미네이터 서열화 프라이머를 이용해 서열화하였다 (Quintara Biosciences). 1 ㎕ 의 각 플라스미드 (플라스미드 설명에 대한 표 11-4 및 도 35-39 참고) 를 화학적 적격 E. coli BL21(λDE3) pLysS (Invitrogen) 로 제조자가 권고하는 프로토콜에 따라 형질전환시켰다. 형질전환체를 LB Kan50 + Cm35 (클로람페니콜 35 ug/ml) 플레이트 상에서 선별하였고, 37 ℃ 에서 인큐베이션하였다. 모든 발현 균주의 설명에 대해서는 표 11-5 를 참조한다.

균주 MCM331 을 하기와 같이 제조하였다. 메발로네이트 키나아제, 메발로네이트 포스페이트 키나아제, 메발로네이트 피로포스페이트 데카르복실라아제, 및 IPP 이소머라아제를 포함하는 합성 오페론을 E. coli 의 염색체에 혼입시켰다. 바람직하다면, 오페론의 5' 에 상이한 프로모터를 혼입함으로써 발현물을 변경할 수 있다.

i) 표적 벡터 구축

attTn7 부위를 혼입을 위해 선택했다. 상동성 상류 (upstream) 영역 (attTn7 up) (프라이머 MCM78 및 MCM79) 및 하류 (downstream) (attTn7 down) (프라이머 MCM88 및 MCM89) 를, MG1655 세포로부터 PCR 로써 증폭하였다. 1 ㎕ 10 μM 프라이머, 3 ㎕ ddH₂O, 45 ㎕ Invitrogen Platinum PCR Supermix High Fidelity, 및 스크래핑된 MG1655 의 콜로니를 갖는 50 ㎕ 반응물을 2:00 동안 94 ℃ 에서 변성시키고, 25 회 사이클 (94 ℃ 에서 2:00, 50 ℃ 에서 0:30, 및 68 ℃ 에서 1:00) 하고, 7:00 동안 72 ℃ 에서 신장시키고, 4 ℃ 로 냉각하였다. 이렇게 수득한 DNA 를 제조자 지침에 따라 pCR2.1 (Invitrogen) 로 클로닝하여, 플라스미드 MCM278 (attTn7 up) 및 MCM252 (attTn7 down) 을 도모하였다. MCM252 로부터 분쇄 및 겔 정제된 832 bp ApaI-PvuI 절편을 ApaI-PvuI 분쇄되고 겔 정제된 플라스미드 pR6K 에 클로닝하여, 플라스미드 MCM276 를 제조했다. MCM278 로부터 분쇄 및 겔 정제된 825bp PstI-NotI 절편을, PstI-NotI 분쇄되고 겔 정제된 MCM276 에 클로닝하여, 플라스미드 MCM281 를 제조했다.

ii) 하위 경로 및 프로모터의 클로닝

MVK-PMK-MVD-IDI 유전자를, 제조자 지침에 따라 Roche Expand Long PCR 시스템을 이용해 프라이머 MCM104 및 MCM105 로 pTrcKKDyIkIS 로부터 증폭하였다. 이러한 생성물을 NotI 및 ApaI 로 분쇄하고, NotI 및 ApaI 로 분쇄되어진 MCM281 로 클로닝하고, 겔 정제하였다. 프라이머 MCM120 및 MCM127 를 Stratagene Pfu Ultra II 를 이용해 GeneBridges FRT-gb2-Cm-FRT 주형 DNA 로부터 CMR 카세트를 증폭하는데 사용했다. 4:00 동안 95 ℃ 에서 변성하고, 0:20 동안 95 ℃, 0:20 동안 55 ℃, 2:00 동안 72 ℃ 의 5 사이클, 0:20 동안 95 ℃, 0:20 동안 58 ℃, 2:00 동안 72 ℃, 10:00 동안 72 ℃ 의 25 사이클 후 4 ℃ 로 냉각하는 PCR 프로그램을, 1uL ~10ng/㎕ 주형, 1 ㎕ 각 프라이머, 1.25 ㎕ 10mM dNTPs, 5 ㎕ 10x 버퍼, 1 ㎕ 효소, 및 39.75 ㎕ ddH₂0 를 함유하는 네 가지의 50 uL PCR 반응물로 해서 이용했다. 반응물을 모으고, Qiagen PCR cleanup 컬럼 상에서 정제하여, 물로-세정된 Pir1 세포 (플라스미드 MCM296 를 포함함) 을 전기천공하는데 사용했다. 전기천공은 2.5V 및 200 ohms 에서 2 mM 큐벳 내에서 실시했다. 전기천공 반응물을 3 시간 동안 30 ℃ 에서 LB 중에서 회수하였다. 형질전환체 MCM330 를 CMP5, Kan50 을 지닌 LA 상에서 선별했다.

iii) E. coli 염색체로의 혼입

MCM330 로부터의 Miniprepped DNA (Qiaquick Spin 키트) 를, SnaBI 로 분쇄하고, GeneBridges 플라스미드 pRedET Carb 을 포함하는 MG1655 또는 BL21(DE3) (Novagen) 를 전기천공하는데 사용했다. 세포를 30 ℃ 에서 ~OD1 까지 성장시키고, 0.4% L-아라비노오스로 37 ℃ 에서 1.5 시간 동안 유도했다. 이들 세포를 3 회 4 C ddH₂O 중에서 세정한 후, 2 ㎕ 의 DNA 로 전기 천공하였다. 혼입체를 클로람페니콜 (5 ㎍/ml) 를 함유하는 L 아가 상에서 선별하고, 후속해서 L 아가 + 카나마이신 (50 ㎍/ml) 상에서 성장하지 않음을 확인했다. BL21 혼입 MCM331, 및 MG1655 혼입 MCM333 를 동결하였다.

표 11-2. 프라이머

표 11-3 균주 MCM331 의 구축을 위한 프라이머

표 11-4 IspS 변이체 발현을 위한 플라스미드

표 11-5 IspS 변이체의 발현을 위한 균주

V. IspS 절단물의 생화학적 분석

각종 N-말단 절단된 IspS 효소의 상대 활성을 DMAPP 검정으로 측정했다. 상술한 균주를 96-웰 플레이트에서 DMAPP 검정을 통해 분석하였다. 모든 균주를 4세트로 하여 검정하였다. "전장" 변이체란, P. alba pET24a 플라스미드로부터 BL21(λDE3) pLysS (Invitrogen) 에서 발현되는 IspS 효소를 지칭한다.

표 11-6. N-말단 절단물의 DMAPP 검정

결과: 표 X 는 OD₆₀₀ 에 대해 정규화하였을 때, 균주 MD09-173 (플라스미드 pDu39 포함), MD09-175 (pDu41), MD09-176 (pDu42), 및 MD09-177 (pDu43) 모두가 (P. alba pET24a 를 갖는 균주 BL21(λDE3) pLysS 에서) "전장" 야생형 IspS 효소보다 DMAPP 활성이 더 높다는 것을 나타낸다.

VI. IspS 에서 "MEA" 절단물의 상세한 동적 분석

상대적 특이 활성을 측정하고, "N-말단 절단된" P. alba 이소프렌 신타아제의 동역학을 "전장" P. alba 이소프렌 신타아제와 비교하여 조사했다. 4 개의 상이한 구축물을 발현하는 4 가지의 균주를 이 분석에서 사용했다: P. alba pET24a 함유 BL21(λDE3) pLysS; MD09-173; MD09-165; 및 MD09-167 (상세하게 상기에서 상술한 균주) 이들 균주는 "전장" P. alba IspS, "절단된" P. alba IspS (MEA 절단), "전장" C-말단 TEV 및 His-태깅된 P. alba IspS, 및 "절단된" C-말단 TEV 및 His-태깅된 P. alba IspS 각각을 발현한다. 하기에 기술되는 실험에서, "절단된" 이란, 구체적으로 P. alba IspS 의 MEA 변이체를 지칭한다.

모든 균주를 30 mg/L 클로람페니콜(Cm) 및 50 mg/L 카나마이신을 함유하는 LB 에 접종하고, 하룻밤 2 mL 배양물 튜브에서 37 ℃ 에서 성장시켰다. 다음날 아침에 하룻밤 배양물을 30 mg/L 클로람페니콜(Cm) 및 50 mg/L 카나마이신을 함유하는 LB 브로쓰 25 mL 에서, 1:100 희석하고, 37 ℃ 에서 OD~0.5 까지 성장시켰다. 각 균주를 3 세트로 성장시켰다. 이어서, 배양물을 400 uM IPTG 로 유도하고, 30 ℃ 에서 4 시간 동안 인큐베이션하였다. 20 mL 의 각 배양물을 20 분 동안 3000 x g 에서 원심분리하고, 상청액을 폐기하였다. 펠릿을 하룻밤 -80 ℃ 에서 동결시켰다. 펠릿을 100 mM Tris, 100 mM NaCl, 0.25 mg/mL 리소자임 및 0.25 mg/mL DNAase, pH 8 를 함유하는 버퍼 2 mL 중에서 재현탁하였다. 세포 현탁액을 20,000 psi 에서 2 회 세포파쇄 (french pressed) 하였고, 그 다음 분해물을 20 분 동안 14000 x g 에서 원심분리하여, 동역학 연구 및 단백질 농도 측정에서 사용되는 무세포 추출물을 수득하였다.

특이 활성을 측정하기 위해, 각 균주로부터의 5 ㎕ 의 무세포 추출물을, 기밀 2 mL 바이알 내 30 ℃ 에서 15 분 동안 100 ㎕ 최종 부피로 100 mM Tris 및 100 mM NaCl (pH 8) 을 함유하는 버퍼 중 5 mM DMAPP, 50 mM MgCl₂ 와 함께 인큐베이션하였다. 반응을, 100 ㎕ 의 500 uM EDTA, pH 8 첨가로 종결시켰다. 샘플을 GC-MS 로 분석하여, 바이알의 상부공간 내 이소프렌의 농도를 측정했다.

k_cat 및K_M 을 측정하기 위해서, 각 균주로부터의 5 uL 의 무세포 추출물을, 기밀 2mL 바이알 내에서 30 ℃ 에서 15 분 동안 100 ㎕ 의 최종 부피로 100 mM Tris, 50 mM MgCl₂ 및 100 mM NaCl (pH 8)를 함유하는 버퍼 중 0.625 ~ 40 mM DMAPP 범위의 농도로 하는 DMAPP 와 인큐베이션하였다. 반응을 100 ㎕ 의 500 mM EDTA, pH 8 를 첨가하여 종결하였다. 샘플을 GC-MS 로 분석하여, 바이알 상부공간 내 이소프렌의 농도를 측정하였다. Kaleidagraph 및 하기 비경쟁 기질 억제에 대한 적합을 이용하여 데이타를 분석하였다: 속도/E = k_cat*S/(K_M+S*(1+S/K_i)). 2.5 mM DMAPP 와의 MD09-167 를 2 세트로 수행한 것을 제외하고는 모든 데이타를 3 세트로 수행하였다.

무세포 추출물을 Caliper 미세유체성 (microfluidic) 전기영동 기기 (Caliper Life Sciences, Hopkinton, MA, USA) 상에서 작동시켜, 각 샘플 내 이소프렌 신타아제의 양을 수량화하였다. 미세유체성 칩 및 단백질 샘플을 제작자 지침에 따라 제조했다 (LabChip®HT Protein Express, P/N 760301). 배양 분해물을, 30 분 동안 실온에서 0.1% Tween 20, 0.1 mg/ml 리소자임, 1.0 ug/ml DNAse 함유하는 50 mM Tris pH 8.0 를 첨가함으로써 96-웰 마이크로타이터에서 제조한 후, 원심분리하였다. 이어서, 상청액을 또 다른 96 웰 플레이트에 옮기고, -20 ℃ 에서 사용할 때까지 보관했는데, 사용시에는 상청액을 실온에서 30 분 동안 융해하였다. 잠시 진탕한 후, 2 ㎕ 의 각 배양물 샘플을, 7 ㎕ 샘플 버퍼 (Caliper)을 함유하는 96-웰 PCR 플레이트 (Bio-Rad, Hercules, CA,USA) 에 옮긴 후, 이 플레이트를 자동온도조절 플레이트 가열기 상에서 90 ℃ 로 5 분 동안 가열하였다. 플레이트를 냉각되게 한 후, 35 ㎕ 물을 각 샘플에 첨가하였다. 이어서, 플레이트를 제작자에 의해 공급되고 보정된 단백질 표준에 따라 기기 상에 놓았다. 이 기기는 샘플을 단백질에 비공유 결합하는 형광 염료와 혼합한 후 겔 매트릭스를 통해 전기영동함으로써 기능한다. 단백질이 칩 내 초점을 지남에 따라, 형광 신호가 기록되고, 단백질 농도가 이 신호를 단백질 표준의 보정 세트에 의해 만들어진 신호와 비교하여 수량 평가함으로써 측정된다.

표 11-7. 이소프렌 신타아제의 k _cat 및 K _M 및 특이 활성값

파라미터는, 하기의 비경쟁 기질 억제 방식식을 속도/[E] 대 [DMAPP] 에 대해 수득된 데이타에 적합시켜 결정하였다:

특이 활성 (S.A.) 은, 전체의 세포 분해물의 상청액으로부터 5 mM DMAPP, 50 mM MgCl₂, 100 mM Tris, 100 mM NaCl, 및 2.5-4.5 ㎍ 이소프렌 신타아제를 함유하는 반응물에 대해서 산출하였다. 반응을 30 ℃ 에서 15 분 동안 3 세트로 독립적으로 성장하는 배양물을 이용하여 수행했다.

결과/논의:

각 단백질의 특이 활성을 측정했다 (도 40 및 표 11-7). 절단된 이소프렌 신타아제의 특이 활성은, 전장 이소프렌 신타아제의 특이 활성보다 약 2 배 더 컸다. C-말단 His-태깅된 전장 이소프렌 신타아제는 전장 이소프렌 신타아제와 대략적으로 동일한 특이 활성을 도출하였다. C-말단 His-태깅된 절단된 이소프렌 신타아제는 태깅되지 않은 절단된 이소프렌 신타아제보다 덜한 특이 활성을 보이나, 두 전장 이소프렌 신타아제의 특이 활성 보다는 더 컸다.

DMAPP 에서의 이소프렌으로의 전환 속도를 DMAPP 농도 범위에 걸쳐 분석하여, 효소의 k_cat 및 K_M 파라미터를 측정하였다(도 41 및 42 및 표 11-7). 효소 모두 DMAPP 에 의한 비경쟁적 기질 억제와 부합하는 속도 프로파일을 보였다. 전장 구축물에 대한 K_i 는, K_i를 변경하고 데이타의 최대 적합 (R-값) 을 관찰함으로써 결정된 바와 같이, 절단된 구축물에 대한 K_i 보다 더 컸다 (상기 데이타는 나타내지 않음). 이 문헌에서의 도면에서 모든 데이타는 10 mM 의 K_i 에 적합되어 있다. 절단된 이소프렌 신타아제의 K_M 은 전장 이소프렌 신타아제에 비해 감소한다. 따라서, 기질 농도가 감소함에 따라, 절단된 이소프렌 신타아제 대 전장 이소프렌 신타아제의 이소프렌 신타아제 활성간 비율은 증가할 것이다 (도 43). 절단된 이소프렌 신타아제의 k_cats 는 전장 이소프렌 신타아제에 비해 증가하였다. 이로써, 모든 기질 농도에서 전장 이소프렌 신타아제보다 절단된 이소프렌 신타아제에 대한 이소프렌 신타아제 활성이 더 크다는 결론을 얻는다 (도 43). 다양한 DMAPP 농도에서, 전장 이소프렌 신타아제에 대한 절단된 이소프렌 신타아제의 활성 비율을 측정하였다 (도 43).

결론: "절단된" 이소프렌 신타아제는, "전장" 이소프렌 신타에제와 비교할 때 DMAPP 에서의 이소프렌으로의 전환의 촉매작용에 관해서 증가된 k_cat 값 및 감소된 K_M 값을 보인다. "절단된" 이소프렌 신타아제의 특이 활성은, "전장" 이소프렌 신타아제의 특이 활성에 비해 증가된다. 가장 활성인 이소프렌 신타아제는 비태깅 절단된 이소프렌 신타아제 "MEA" 변이체 (균주 MD09-173) 였다. 절단된 이소프렌 신타아제는, 전장 이소프렌 신타아제와 비교시, 이소프렌을 생성하는데 사용되는 유기체에서 이소프렌 신타아제 활성을 증가시킬 수 있다.

실시예 12

이소프렌 신타아제 풍부 - DMAPP 독성의 경감

이 실시예는 동적 개선, 증가된 발현, 증가된 용해성, 또는 DMAPP 가 이소프렌 신타아제에 의해 더 효과적으로 이소프렌으로 전환시키는 임의의 기타 수단을 통해, 효소에 더 나은 활성을 부여하는 IspS 내 잔기 변화를 동정한다. 이러한 절차는 개선된 IspS 변이체의 발현에 의해 DMAPP 의 세포독성 세포내 수준의 경감을 가능하게 한다. IspS 변이체의 이종 혼합물을 발현하는 세포군에서, 최고의 효소는 이의 숙주 균주의 더 나은 성장을 가능하게 할 것이고, 혼합 집단에서 풍부할 것이다.

I. 균주 구축

람다 프로모터가 혼입된 mKKDyI 를 추진하는 균주 MCM518-521 및 528-531 의 구축물은 하기와 같다. 프라이머 MCM120 및 MCM224 (표 12-1) 을, 제작자 프로토콜에 따라 Stratagene Herculase II Fusion 키트를 이용해, GeneBridges FRT-gb2-Cm-FRT 주형으로부터 내성 카세트를 증폭시키는데 사용했다. 4 가지의 50 ㎕ 반응물을 하기와 같이 사이클을 돌렸다: 95℃, 2 분; 30 사이클 동안 (95 ℃, 20 초, 55 ℃, 20 초, 72 ℃, 1 분); 72 ℃, 3 분; 및 냉각하기까지 4℃. 4 가지의 반응물을 모으고, 제작자 프로토콜에 따라 Qiagen PCR 컬럼 상에서 정제하고 60 ㎕ EB 로 55 ℃ 에서 용리하였다.

플라스미드 pRedET-carb (GeneBridges) 을 MCM446 로 전기천공하였다. 형질전환체를 1 시간 동안 SOC (Invitrogen) 중 30 ℃ 에서 진탕함으로써 회수한 후, 카르베니실린 (50 ㎍/ml) (carb50) 를 함유하는 LB 플레이트 상에서 30 ℃ 에서 하룻밤 선별하였다. 카르베니실린 내성 콜로니를 MCM508 로서 동결했다 (표 12-2).

5mL LB/carb50 중 신선한 스트리크 (streak) 로부터 균주 MCM508 를 30 ℃ 에서 ~ 0.5 의 OD₆₀₀ 로 성장시켰다. 40mM L-아라비노오스를 첨가하고, 배양물을 37 ℃ 에서 1.5 시간 동안 인큐베이션하였다. 세포를 수확하고, 3 ㎕ 의 정제된 앰프리콘으로 상기에서와 같이 전기천공한 후 500 ㎕ SOC 중 37 ℃ 에서 1.5-3 시간 동안 회수하였다. 형질전환체를 LB/kan10 플레이트 상 37 ℃ 에서 선별하였다.

표적 유전자자리에서의 앰프리콘의 재조합을 프라이머 GB-DW 및 MCM208 로 PCR 을 통해 확인했다. 생성 앰프리콘을 서열화하여 하기 서열을 갖는 4 가지의 클론을 동정하였다. 카르베니실린-민감성 클론을 균주 MCM518-52 로서 동결하였다.

MCM518-521 를, LB kan10 플레이트 상에서 다시 스트리킹하고 37 ℃ 에서 하룻밤 성장시켰다.

균주 MCM518-521 를 LB/kan10 중 37 ℃ 에서 배양한 다음, 플라스미드 pCP20 로 전기형질전환 (electrotransformation) 하였다 (Datsenko KA, Wanner BL. One-step inactivation of chromosomal genes in Escherichia coli K-12 using PCR products. Proc Natl Acad Sci U S A. 2000 Jun 6;97(12):6640-5). 세포를 30 ℃ 에서 1 시간 동안 진탕하면서 500 ㎕ SOC 중에서 회수하였다. 형질전환체를 LB/carb50 플레이트 상 30 ℃ 에서 하룻밤 선별하였다. 다음날 아침 각 형질전환체로부터의 콜로니를 30 ℃ 에서 액체 LB/carb50 중에서 육안으로 봤을 때 탁할 때까지 성장시켰다. 이어서, 배양물을 37 ℃ 로 적어도 3 시간 동안 바꿨다. 세포를 상기 배양물로부터 LB 플레이트 상으로 스트리킹하고 하룻밤 37 ℃ 에서 성장시켰다.

다음날, 콜로니를 LB, LB/carb50 및 LB/kan10 상에 패칭 (patching) 했다. carb50 도 kan10 에서도 성장하지 않고 LB 상 상기 패치로부터 액체 LB 중에서 배양된 클론을 MCM528-531 로서 동결했다.

DNA 서열

이들 어셈블리에는 균주 MCM518-521 내 염색체 상에 삽입된 새로운 프로모터뿐 아니라 맨 처음의 mMVK ORF 를 포함한다. 이들 어셈블리의 상류는 GeneBridges FRT-gb2-Cm-FRT 카세트로부터의 서열이다. 하류는 mMVK ORF 의 나머지 다음 균주 MCM508 로부터의 하위 MVA 경로 인테론의 나머지이다.

네오-PL.2-mKKDyI (MCM521 유래) 를 BL21(λDE3) 로 형질도입하여, 균주 MD09-171 를 제조했다. MCM521 의 P1 분해물을 만들고, 표준 분자 생물학 기법 (Miller, A Short Course in Bacterial Genetics) 에 따라 BL21(λDE3) 로 형질도입하였다. 형질전환체를 Kan20 LB 배지 플레이트 상에서 선별하였다. 양성의 콜로니를 PCR 로 추가 확인하여, BL21(λDE3) 균주 내 PL.2-mKKDyI 의 존재를 확인했다. 이어서, 1 ㎕ 의 pCP20 플라스미드를 상기 균주 내로 형질전환시키고, LB + Carb50 상에서 선별 및 30 ℃ 에서 인큐베이션하였다. 양성의 형질전환체를 후속해서 LB 플레이트 상에서 스트리킹하고, 37 ℃ 에서 pCP20 플라스미드의 소실을 위해 인큐베이션하였다. 네오마이신 (카나마이신) 내성 마커의 소실을 확인하기 위해, 37 ℃ 에서 성장시킨 콜로니를 LB Kan20, LB Carb50, 및 단순 (plain) LB 플레이트 상으로 패치하였다. pCP20 를 소실한, 카나마이신 내성 마커 없는 혼입 PL.2 mKKDyI 를 갖는 균주는 카나마이신 및 카르베니실린에 민감적일 것이다. 4 KanS CarbS 를 이용하여, BL21(λDE3) 내 mKKDyI 의 존재에 대해, 모체 BL21(λDE3) 균주를 대조군으로 하여 PCR 을 통해 체크하였다. 일단 PCR 로 mKKDyI 의 존재가 확인되면, 생성 균주를 1 ㎕ 의 pLysS 플라스미드 (Invitrogen) 로 형질전환시켰다. 생성 균주인 MD09-171 는 하기에 기술된 풍부 실험에 사용하였다.

표 12-1. 균주 구축에 사용된 프라이머

표 12-2. 균주

II. 메발론산에 의한 MCM531 의 성장 억제

MCM531 (균주 설명 참고) 의 하룻밤 배양물을 0.05 의 OD₆₀₀ (이는 96-웰 플레이트 판독기에서 약 0.005 의 OD₆₀₀ 에 해당함) 로 다시 희석하였다 (SpectraMax M2, Molecular Devices). 이어서, 희석한 배양물을, 0, 1, 5, 10, 15 또는 20 mM MVA 가 첨가된, 표준 TM3 배지 ((13.6 g K₂PO₄, 13.6 g KH₂PO₄, 2.0 g MgSO₄*7H₂O), 1% 글루코오스 및 0.8 g/L Biospringer 효모 추출물 (1% 효모 추출물 최종) 로 보충되어 있음) 중 96-웰 딥 웰 플레이트 내 개별 웰에서 분획하였다. 도 44 는 각종 농도의 MVA 에서 MCM531 의 성장 곡선을 나타낸다. MVA 농도를 4세트로 검정하고, 오차 바는 무시해도 될 정도였다. 도 44 는 MCM531 이 5 mM MVA 의 농도 이상에서 성장을 심하게 억제함을 보였다.

III. IspS 의 돌연변이유발 및 선별/풍부 검정

무작위로 돌연변이유발시킨 IspS 오픈 리딩 프레임 (해독틀) 을 제조하기 위해, GeneMorph II EZ 클론 도메인 돌연변이유발 키트 (Stratagene) 를 제작자가 권고하는 프로토콜에 따라 사용했다. 주형 (Pdu39 (pET24a-P. alba (MEA))) 을 증폭하는 특이적 프라이머는 하기에 기술한다 (표 12-3, pET24 메가프라임 정방향 및 역방향). 원하는 돌연변이 빈도를 달성하기 위해, GeneMorph II 키트에 개괄된 프로토콜을 따랐다. 분자 당 2 내지 3 개의 잔기 변경을 만들기 위해, 약 150 ng 의 출발 주형 DNA 를 초기 PCR 반응에서 사용했다. 더 크거나 더 작은 주형을 더 적거나 더 많은 잔기 변경을 각각 갖는 IspS 효소를 제조하는데 사용했다. 이어서, 생성된 돌연변이체 "메가프라이머" 를 제작자가 권고하는 프로토콜에 따라 플라스미드의 나머지를 증폭하는데 사용했다.

GeneMorph II 키트로부터의 최종 PCR 생성물을 제작자가 권고하는 프로토콜에 따라 DpnI 로 처리했다. E. coli 로의 형질전환 이전에, 미세투석 (microdialysis) 에 의한 PCR 반응물을 탈염시키는 것이 필수적이었다. 전형적으로는 약 20 ㎕ 의 PCR 반응물을 미세투석에 적용하고, 이를 표준 분자 생물학 절차로써 균주 MD09-171 (표 12-2) 로의 전기천공에 사용하였다. 전기천공 후, 세포를 2 시간 동안 30 ℃ 에서 회수한 다음, LB 배지 Kan50 Cm35 로 플레이팅했다. 전체 부피의 형질전환물을 플레이팅하여 돌연변이유발 절차에 의해 생성된 모든 돌연변이들을 회수하였다.

풍부를 위해, 모든 형질전환체를 스크레이핑하고 함께 모았다. 각 풀에서의 분취물을 보관을 위해 -80 에서 동결하였다. 풍부 이전, 균주 (대조군 또는 실험 풀) 을 Kan50 을 갖는 LB 에 직접 접종하고 몇 시간 동안 성장시켜 풀 이종성 소실을 최소하였다. 이러한 회수 기간 후에, 세포를 Kan50, 5 mM MVA, 및 200 μM IPTG 를 포함하는 액체 TM3 배지 (상술하였음) 로 희석하였다 (정확한 희석도는 배지/대조군 반응물의 각 풀/공급원에 대해 실험하여 결정하였다). 이어서, 배양물을 진탕 인큐베이터 내 34℃ 에서 OD₆₀₀ 가 5 이하일 때 까지 두었다. 이때, 플라스미드를 1 ml 의 "풍부" 배양물로부터 miniprep protocol (Qiagen) 을 통해 정제하였다. 그 후, 상기 플라스미드 제조물을 상술한 바와 같은 전기적격 (electrocompetent) MD09-171 세포 내로 형질전환시켰다. 형질전환된 세포를 2 시간 동안 항생제가 없는 LB 배지에서 회수한 다음, 상술한 바와 같이 Kan50, 5 mM MVA 및 200 μM IPTG 를 갖는 TM3 로의 희석에 의한 풍부의 후속 라운드에 적용시켰다. 이러한 배양물을 진탕 인큐베이터내로 34℃ 에서 이것이 상술한 바와 같이 5 이하의 OD₆₀₀ 에 도달할 때까지 두었다. 이어서, 플라스미드를 정제하고, 재형질전환하고 및 "풍부"의 추가 라운드에 적용했다. 풍부 프로세스는 5 또는 6 라운드의 선별, 플라스미드 정제 및 재형질전환동안 지속되었다. 상기 프로세스는 배양물이 균질해질 때까지, 즉 이것이 서열 분석에 의하면 IspS 의 오직 한 변이체 만을 함유할 때까지 지속하였다.

풍부의 마지막 라운드 후에, 플라스미드 풀을 화학 적격 E. coli Top10 세포 (Invitrogen) 내로 제작자가 권고하는 프로토콜에 따라 형질전환하였고, 회수하고, Kan50 을 갖는 LB 배지에 플레이팅하고, P. alba IspS 의 야생형 서열과의 비교하기 위해 완벽한 서열화 (Quintara Biosciences) 를 의뢰했다. 서열화에 사용된 프라이머는 하기에 기술한다.

표 12-3. IspS 돌연변이유발 및 서열화에 사용된 프라이머

IV. 풍부/DMAPP 독성 경감에 의해 동정된 각 잔기 변경:

선별/풍부로부터 단리된 플라스미드를 완전히 서열화하였다. 하기 잔기 변경을 서열화 (Quintara Biosciences) 에 의해 확인했다. 잔기 넘버링은 P. alba "전장" 서열에 상응하고 (P. alba pET24a; SEQ ID NO:120), 여기서, 출발 메티오닌이 아미노산 넘버 1 이다. 동정된 잔기 변경에는 하기가 포함된다: V10M, F12S, T15A, E18G, V58I, V58F, L70Q, L70V, L70T, T71P, V79L, E89D, G94A, S119F, F120L, G127R, E175V, T212I, S257A, R262G, A266G, F280L, N297K, F305L, L319M, E323K, A328T, D342E, A359T, K366N, E368D, L374M, S396T, V418S, K438N, H440R, T442I, T442A, I449V, A469S, K500R, K505Q, G507S, S509N, F511Y, 및 N532K.

(단일 IspS 효소에서) 잔기 변경의 조합을 풍부/DMAPP 독성 경감으로 동정했다: G127R/F511Y, L70Q/G94A/R262G/F305L, F12S/T15A/E18G/N297K, S396T/T442I, V10M/E323K, F120L/A266G, K438N/K500R, V79L/S509N, E175V/S257A/E368D/A469S, T71P/L374M, F280L/H440R, E89D/H440R, V58F/A328T/N532K, S119F/D342E/I449V, 및 K366N/G507S.

실시예 13

부위 포화 라이브러리 ( SSL ) 의 구축 및 L70R 변이체의 생화학 분석

이 실시예에는 상술한 선별/풍부 절차에 의해 동정된 부위, 및 IspS 의 용해성, 발현 및 활성에 대한 이의 효과와 관련해 잠재적으로 관심대상인 기타 부위 (활성 부위, 포플러 종 간 보존됨) 에서 가능한 아미노산 치환의 조사를 포함한다.

I. 균주 구축

상술된 선별/풍부 절차로 동정된 잔기 (L70, G94, R262, F305) 를 분석을 위해 선택했다. 나아가, 추정상 기질 결합에 관여하는 잔기 (F303, V3065, F385, S412, Q416, F450) 및 각종 포플러 종 간 상이한 잔기 (예 V418, T442) 를 추가 분석을 위해 선택했다 (넘버링은 P. alba IspS 의 "전장" 아미노산 서열에 상응한다). 아미노산 치환들의 무작위 풀 (Site Saturation Library, SSL) 을 만들기 위해, pDu39 (상기 설명 참고) 을, 하기에 나타낸 QC 프라이머 (표 13-1) 로 QuickChange (Stratagene) 돌연변이유발에 제작자가 권고하는 프로토콜에 따라 적용했다. PCR 반응물은 하기와 같이 제조되었다: 1 ㎕ pDu39, 5 ㎕ 10X PfuUltra HF 버퍼, 1 ㎕ dNTP, 1 ㎕ (50 μM) 프라이머-For (예 QC L69 F), 1 ㎕ (50uM) 프라이머-Rev (예 QC L69 R), 2 ㎕ DMSO, 39 ㎕ diH2O, 및 1 ㎕ PfuUltra HF 폴리머라아제 (Stratagene). QuickChange 에서 PCR 사이클링 파라미터는 하기와 같다: 95℃ 1 분, 95℃ 30 초, 55℃ 1 분, 68℃ 7.3 분 (1 사이클) 다음 95℃ 30 초, 55℃ 1 분, 68℃ 7.3 분 (17 이상 사이클 동안). 이어서, 온도를 4℃ 로 감소시켰다. 상술한 잔기에 대한 코돈에서 염기 NNK 의 혼입은 주어진 부위에서 모든 20 가지의 가능한 아미노산을 나타내는 코돈의 삽입을 가능하게 한다. 1 ㎕ 의 생성된 풀의 돌연변이유발된 PCR 생성물을 DpnI 처리하고 (상술됨), 제작자가 권고하는 프로토콜에 따라 화학적 적격 E. coli Top10 세포 (Invitrogen) 로 형질전환시켰다. 전체의 형질전환 반응물을 항생제가 없는 1 ml LB 배지에서 37 ℃ 에서 1 시간 동안 회수하여 LB Kan50 로 플레이팅하였다. 다음날, 모든 형질전환체를 LB 플레이트에서 스크레이핑해내고, 철저하게 혼합하고 플라스미드를 miniprep (Qiagen) 통해 정제하였다. 이어서, 플라스미드 풀을 제작자의 프로토콜에 따라 화학적 적격 BL21(λDE3)pLysS 세포 (Invitrogen) 내로 형질전환시켰다. 형질전환 반응물을 37 ℃ 에서 1 시간 동안 1 ml LB 배지에서 회수한 다음, 양성 콜로니를 분리하기에 충분한 희석으로 LB Kan50 Cm35 상으로 플레이팅하였다. 37 ℃ 에서 하룻밤 인큐베이션한 후, 각 콜로니를 500 ul 의 액체 LB Kan50 Cm35 각각을 함유하는 96-웰 딥-웹 마이크로타이터 플레이트 (VWR) 내 각 웰에 접종하였다. 8 개의 웰 (전형적으로는 컬럼 12, A 내지 H) 내, 균주 MD09-173 (상기 참고) 또는 BL21(λDE3)pLysS (P. alba pET24a (전장) 을 가짐) 을 DMAPP 검정 대조군으로서 접종했다. 이어서, 마이크로타이터 플레이트를 반투과 막(Breathe-Easier, Diversified Biotech) 으로 밀봉하고, 30 ℃ 에서 진탕 인큐베이터 (Vertiga) 내 하룻밤 인큐베이션했다. 다음날, 96-웰 플레이트 내 각 웰로부터의 100 ㎕ 샘플을, 새 200 ul 96-웰 플레이트 내 50 ㎕ 의 50% 글리세롤과 혼합하고, -80 ℃ 에서 추가 분석할 때까지 동결했다. 이어서, 이 플레이트를 하기에 기술한 DMAPP 검정에 사용했다.

표 13-1. 돌연변이유발에 사용된 프라이머

II. 2 차 검정을 위한 "우승자" 플레이트의 제조 및 증가된 특이 활성을 지닌 변이체로서 L70R 의 동정

야생형과 비교했을 때 증가된 특이적 이소프렌 생성을 보이는 변이체를 추가 분석을 위해 선택했다. 도 45 는 개별 잔기, 이 경우에는 L70 에 대한 SSL 플레이트의 전형적인 데이타 세트를 보인다. 이 특정 플레이트로부터, 웰 C3 (27), D3 (39), 및 E3 (51) 내 샘플을 추가 분석을 위해 선택했다. DMAPP 분석에 적용했을 때 증가된 이소프렌 생산성을 보이는 상이한 잔기에서 (상술함) 기타 변이체를, -80 ℃ 에서 보관된 이의 원 SSL 플레이트 (상술함) 로부터 단리하고, 2차 스크리닝을 위해 새로운 "우승자" 플레이트로 재배열하였다. MD09-173 를 함유하는 2 개의 웰을 대조군으로서 포함하였다. 모든 변이체를 서열화하였고 (Quintara Biosciences), 상술한 DMAPP 검정에 적용했다. 서열화 결과에 대해서는 표 13-2 를 참고한다. DMAPP 검정에 있어서, 각 변이체의 단일 성장을 검정하여, 단일의 분해물을 수득하였으나, 통계적으로 유의한 데이타를 작성하기 위해 4 세트로 하였다. 샘플을 표 13-2 에서 지시된 OD₆₀₀ 에서 검정하였다. 단백질 분석을, Western Breeze Western 블롯 키트 (Invitrogen) 를 이용해 모든 분해물에 대해서 수행한 후, Storm860 (하기 참고) 상에서 형광 검출하였다.

III. DMAPP 검정 - 성장, 분해 및 이소프렌 측정

하룻밤 글리세롤 스톡 플레이트로부터 VP-Scientific Replication Tool patch LB Agar CM35/Kan50 대형 패치 플레이트를 이용해 글리세롤 스톡 플레이트로부터 패치 플레이트를 제조했다. 배양물을 30℃ 에서 하룻밤 (20 내지 24 시간) 인큐베이션했다. 플레이트를 4℃ 에서 1 주일 이하 동안 보관했다.

하룻밤 성장 플레이트를 500 mL 의 LB CM35/Kan50 배지로부터 제조했다. 300 ㎕/웰의 LB CM35/Kan50 배지를 딥 96 웰 플레이트로 분배 (dispensing) 했다. V&S Replication Tool 을 이용해여, 패치 접종원을 딥 96 웰 플레이트로 옮겼다. 상기 도구를 디핑 (dipping) 한 다음 핀을 웰 내에서 진탕함으로써 배지를 접종시켰다. 하룻밤 성장 플레이트를 Breathe-Easier Sealing Membrane 으로 밀봉했다. 플레이트를 16 내지 18 시간 동안 800 rpm 으로 Vertiga 진탕 인큐베이터내에서 30 ℃ 에서 하룻밤 인큐베이션했다.

딥 96 웰 하루 성장 플레이트를, 588 ㎕/웰의 LB CM35/Kan50 배지를 분배하여 제조하였다. 하룻밤 성장 플레이트를 인큐베이터에서 제거하고, 배양물을 50-배 희석했다. 12 ㎕ 의 하룻밤 배양물을 588 ㎕/웰의 보충된 LB 배지를 함유하는 하루 성장 플레이트로 옮겼다. 하룻밤 성장 플레이트를 새로운 Breathe-Easier Sealing Membrane 으로 밀봉하고, 34 ℃ 에서 및 800 rpm 로 2.25 시간 동안 Vertiga 진탕 인큐베이터 내에서 인큐베이션하였다.

IspS 의 발현을 유도하기 위해, 융해된 12 mM IPTG 을 50 mL 또는 100 mL 멸균 저장소에 붓고, 및 20 ㎕/웰을 각 600 ㎕/웰 배양물로 분배했다. 하룻밤 성장 플레이트를 Breathe-Easier Sealing Membrane 로 재밀봉하고, 34℃ 및 800 rpm 에서 4 시간 동안 Vertiga 진탕 인큐베이터에서 인큐베이션했다.

세포를 수확하기 위해, 200 ㎕ 의 유도된 배양물을 450 ㎕ Nunc 보관 플레이트로 옮겼다. 플레이트를 3300 rpm 에서 20 분 동안 4 ℃ 에서 저속도 벤치탑 원심분리기 내에서 원심분리하였다. 180 ㎕ 상청액을 피펫으로 제거 및 폐기했다. 플레이트를 알루미늄 호일막으로 밀봉하고, 플라스틱 플레이트 뚜껑으로 덮어씌우고 -80 ℃ 에서 동결 보관했다.

플레이트의 OD₆₀₀ 를 판독했다. 150 ㎕ 1x PBS 를 96 웰 Costar Read Plate (#9017) 로 분배했다. 50 ㎕ 의 배양물 샘플을 이어서 판독 플레이트로 옮겼다. 이후, OD₆₀₀ 판독은 Spectramax 플레이트 판독기로 실시했다.

분해: 수확 플레이트를 실온 수조에서 4 분간 해동한 다음 25℃ 에서 1200 rpm, 1 분 동안 Thermomixer 에서 인큐베이션하였다. 분해 버퍼를 80 ㎕/웰 내지 20 ㎕/웰의 수확 세포로 분배했다. 1.25X 분해 작용 스톡 버퍼 (Lysis Working Stock Buffer) 를 6.25 ml 1M Tris pH 8, 625 ㎕ 10% Tween 20, 312.5 ㎕ 0.2 M PMSF, 462.5 ㎕ 10 mg/ml DNAse I (Sigma), 1.25 ml 1 M MgCl₂, 132.5 ㎕ 25000 U/㎕ 리소자임 (Epicentre Technologies) 및 40.968 ml dIH₂0 로부터 제조했다. 플레이트를 Thermomixer 상 25℃ 및 1200 rpm 에서 30 분 동안 인큐베이션하였다. 19 ml 의 1.25x 분해 작용 스톡을 4.75 ml dIH₂O 로 희석하여, 1x 분해 버퍼 스톡을 제조했다.

DMAPP 작용 스톡을 하기와 같이 제조했다.

희석제는 0.1 M 칼륨 포스페이트였다. 200 uL/웰을 샘플 웰로의 이동을 위해 분배하고 얼음 상에서 보관했다.

DMAPP 반응: 1x 분해 버퍼를 65 ㎕/웰로 분배했다. 15 ㎕/웰의 분해물을 96 딥 웰 Zinsser 유리 블록 내 각각의 샘플 웰에 옮겼다. DMAPP 시약을 20 ㎕/웰로 분배했다. 이 유리 블록을 알루미늄 호일막으로 밀봉하고 25 ℃ 에서 450 rpm 로 45 분간 인큐베이션했다. 유리 블록을 70 ℃ 수조로 옮기고 6 분 동안 인큐베이션하여 반응을 정지했다. GC 분석을 상기에 기술한 대로 수행했다.

IV. 형광 표지된 2차 항체를 갖는 이소프렌 신타아제의 Western 블롯

샘플을 제조하고, 제조자의 프로토콜에 따라 NativePAGE™Novex®Bis-Tris Gels (Invitrogen) 상에서 시행했다. 상기 시행을 마친 후, 겔을 제조자가 권고하는 프로토콜에 따라 XCell II™Blot Module (Invitrogen) 을 이용해 즉시 니트로셀룰로오스 막으로 이동시켰다. 이동 후, 막을, 키트에 제공된 커버가 있는 플라스틱 접시 내 15 ml 의 적절한 블로킹 용액 (초여과 수 31.5 ml, 차단제/희석제 (Part A) 9 ml, 차단제/희석제 (Part B) 4.5 ml) 에 넣고, 1 회전/초로 세팅된 회전 진탕기 상에서 30 분 동안 인큐베이션하였다. 블로킹 용액을 디캔팅하고 막을 2 회 20 ml 의 물로 5 분 동안 헹구었다. 막을 15 ml 의 일차 항체(Ab) 용액 (5 ml 블로킹 용액 내 24 ㎕ 의 일차 Ab) 으로 1 시간 인큐베이션한 후, 3 회 5 분 동안 25 ml 의 1x 항체 세정 용액으로 세정했다. 이어서, 막을 15 ml 의 2차 항체 용액 (15 의 블로킹 용액 중 15ul 이차 Ab (Alexa Fluor 488 goat anti-rabbit IgG (H+L, Invitrogen)) 중에서 30 분 동안 인큐베이션했다. 막을 3 회 5 분 20 ml 의 항체 세정물 (Antibody Wash) 로 세정하고, 2 회 2 분 20 ml 의 물로 헹구었다. 막을 페이퍼 타월 사이로 건조하고 실온에서 추가 검출을 위해 보관했다. 형광 밴드를 검출하고 Storm 860 Molecular Imager (GMI, Inc) 를 이용해 정량하였다.

V. 결과:

표 13-2 는 검정된 각 변이체에 대한 관련 데이타 모두를 나타낸다: (4 개의 모든 복제물의) 서열화 결과, 잔기 변경, 평균 이소프렌 생성, 단백질 농도 및 평균 특이 활성. 도 46 은 표 13-2 에 나타낸 데이타의 그래프 표현을 나타낸다. 특이 활성은 생성된 이소프렌 (㎍/l) 을 0.0414 로 곱한 다음 단백질 농도 (mg/ml) 로 나눠 산출하였다. 이러한 전환 인자 (0.0414) 는 밀봉된 2 ml GC 바이알 중 총 상부공간 부피 (1.9 ml), 분해물 부피 (15 ul), DMAPP 검정 기간 (45 분), 및 이소프렌의 분자량을 설명하다. 따라서, 특이 활성 값은 nmol 이소프렌/mg Isps/min 으로 표기한다.

표 13-2 의 데이타 및 도 46 에서의 그래프는, 모든 분석된 변이체 중에서, 모든 3 개의 L70R 변이체가 야생형보다 더 높은 특이 활성을 나타냄을 보인다. L70R 변이체를 추가로 분석하기 위해, 모든 3 개의 단리체 (각각의 4 개의 복제본) 에 대한 특이 활성 값을 평균 내고 대조군 (2 개의 단리체, 각각 4 개의 복제본) 과 비교했다. 따라서, L70R 변이체에 대해서는 12 회 측정을, 야생형에 대해서는 8 회 측정하였다. 이들 데이타는 하기 표 13-3 에 나타낸다. 단백질에 있어서 정정시, L70R 변이체는 MD09-173 (MEA 절단물) 보다 25% 활성 증가를 보였다. 도 47 은 MEA 와 비교시 모든 L70R 변이체에 대한 평균 특이 활성을 나타낸다. 오차 바는 하나의 표준편차를 나타낸다. L70R 및 MEA 대조군에 대한 2 개의 데이타를 Student T-Test 에 통계분석을 위해 적용하여, 6.0011 x 10^- ⁵의 P-값을 얻었다.

표 13-2. 서열화 결과, 이소프렌 생성, 단백질 농도 및 우승자 플레이트 내 모든 잔기에 대한 특이 활성

모든 플라스미드의 서열이 지시된 코돈을 제외하고는 Pdu39 (상기 참고) 와 동일하다는 점에 주의한다. L70R 변이체는 회색으로 하이라이트하였다.

표 13-3. MEA 대조군에 대한 모든 L70R 변이체의 평균 특이 활성

막대 그래프에 대한 도 47 을 참고한다.

실시예 14

P. alba , P. tremuloides , P. trichocharpa , 및 쿠주 이소프렌 신타아제의 절단물

이 실시예는 P. alba, P. tremuloides, P. trichocharpa, 및 쿠주의 IspS 효소에서 일련의 절단물의 생성 및 이의 활성에 대한 효과 측정을 기술한다.

I. 균주 구축

모든 이소프렌 신타아제 유전자를 DNA2.0 (Menlo Park, CA) 에 의해 E. coli 에 대해 코돈 최적화하고, 합성 및 pET24a 로 클로닝하였다. 모든 절단된 구축물을, PCR 증폭을 위해 상술한 주형 P. alba pET24a (플라스미드 pDu47-3 내지 -7 에 대해서, 도 48, 49, 51-60), P. tremuloides pET24a (플라스미드 pDu48, 도 49C, 61 및 62), P. trichocharpa pET24a (pDu49, 도 50A, 63, 64), 또는 pET24d-Kudzu (pDu50 및 50-4, 도 50B, 50C, 65-68) 를 이용하는 QuickChange 부위-특이적 돌연변이유발 키트 (Stratagene) 를 이용해 제조했다. 약 50 ng 의 주형 DNA 를, 각 관련 절단물 (QC Trunc -3 F 및 QC Trunc -3 R, 예를 들어 표 14-1 참고) 에 상응하는 정방향 (For) 및 역방향 (Rev) 프라이머 쌍으로 PCR 생성물의 증폭 (Eppendorf Mastercycler Gradient PCR Machine 사용) 에 이용했다. PCR 반응 혼합물은 하기와 같았다: 1 ㎕ P. alba pET24a (또는 기타 주형), 5 ㎕ 10X PfuUltra HF 버퍼, 1 ㎕ dNTP (10 mM), 1 ㎕ (50uM) 프라이머-For, 1 ㎕ (50 μM) 프라이머-Rev, 1.5 ㎕ DMSO, 39.5 ㎕ diH₂O 및 1 ㎕ PfuUltra HF 폴리머라아제. PCR 사이클 파라미터는 하기와 같았다: 18 사이클 동안 (95 ℃ 1 분, 95 ℃ 1 분, 55 ℃ 1 분, 68 ℃ 7.30 분) 이후 냉각될 때까지 4℃ 로, Eppendorf Mastercycler Gradient Machine 를 이용함. PCR 생성물을 1-2 ㎕ 의 DpnI (Roche) 로 1~ 3 시간 동안 37 ℃ 에서 처리했다. 5 ㎕ 의 DpnI 처리 생성물을 0.8% E-겔 (Invitrogen) 상에서 시각화하였다. 1 ㎕ 의 각 생성물을 화학적 적격 E. coli Top10 세포 (Invitrogen) 내로 형질전환시켰다 (제작자의 프로토콜에 따름). 카나마이신을 50 ㎍/ml (Kan50) 로 함유하는 LB 배지 상에서 선별하고 하룻밤 37 ℃ 에서 인큐베이션했다. 각 형질전환물의 5 개의 콜로니를 선별하고, 3 ml 액체 LB Kan50 중 정지상까지 성장시켰다. 플라스미드를 제작자가 권고하는 프로토콜에 따라 QIAPrep Spin miniprep kit (Qiagen) 를 이용해 정제하였다. 정제된 플라스미드를 T7 정방향 및 역방향 프라이머로 서열화하고 (Quintara Biosciences), 모체 서열과 비교하고, 이의 각 절단물에 대해서 확인했다. 생성된 플라스미드 (pDu47-3 내지 pDu50-4, 표 14-2 참고) 를 제작자가 권고하는 프로토콜에 따라 화학적 적격 E. coli BL21(DE3) pLysS (Invitrogen) 내로 형질전환시켰다. 표 14-3 은 절단된 IspS 효소의 발현에 사용된 균주를 기술한다.

37 ℃ 에서 하룻밤 인큐베이션한 후, 각각의 콜로니를, 500 ㎕ 의 액체 LB Kan50 CM35 각각을 함유하는 96-웰 딥-웰 마이크로타이터 플레이트 (VWR) 내의 각 웰에 접종하였다. 이어서, 마이크로타이터 플레이트를 반투과막 (Breathe-Easier, Diversified Biotech) 으로 밀봉하고, 하룻밤 30 ℃ 에서 진탕 인큐베이터 (Vertiga) 중에서 인큐베이션하였다. 다음날, 96-웰 플레이트 내 각 웰로부터의 100 ㎕ 샘플을, 새로운 200 ㎕ 96-웰 플레이트 중 50 ㎕ 의 50% 글리세롤과 혼합하고, 추가 분석할 때까지 -80 ℃ 에서 동결했다. 이어서, 이 플레이트를 실시예 13 에서 기술한 바와 같이 DMAPP 검정에 사용했다. 표 14-4 는 모든 샘플의 평균 특이 생산성을 나타내고, 도 69 는 동일한 데이타의 그래프 표현을 나타낸다.

DMAPP 활성 및 단백질 정량을 실시예 13 에 기술한 바와 같이 측정했다.

특이 활성은 생성된 이소프렌 (㎍/l) 을 0.00776 로 곱한 다음 단백질 농도 (mg/ml) 로 나눠 산출하였다. 이러한 전환 인자 (0.00776) 는 밀봉된 2 ml GC 바이알 중 총 상부공간 부피 (1.9 ml), 분해물 부피 (80 ㎕), DMAPP 검정 기간 (45 분), 및 이소프렌의 분자량을 설명한다. 따라서, 특이 활성 값은 nmol 이소프렌/mg Isps/min 으로 표기한다.

표 14-1. 프라이머

표 14-2 플라스미드

표 14-3 균주

표 14-4 상술된 변이체의 특이 생산성

제 2 의 실험을 표 14-5 에 개괄한 균주로 수행했다. 대조군은 P. alba pET24a 포함 BL21 DE3 pLysS 이었다 (전장 P. alba IspS).

표 14-5. 균주

결과

P. alba IspS 의 모든 절단물 및 P. tremuloides 및 P. trichocharpa 로부터 2 개를 동시에 DMAPP 검정 및 정량적 Western 블롯을 통해 검정하여 이의 관련 특이 활성을 비교했다. 변이체 당 적어도 2 개의 샘플을 이소프렌 생성 및 IspS 의 양 (mg/ml) 에 대해서 검정하였다. 변이체 MD09-174 는 이소프렌을 거의 생성하지 않고 거의 단백질을 발현하지 않았으나, 고 특이 활성을 보였다. 고 특이 활성은 또한 MD09-173, MD09-176, 및 MD09-197-3 에 의해서도 나타났다 (표 14-6 및 도 70 참고). 3 ㎍ 총 단백질 중 가장 높은 수준의 단백질 (㎍) 은 MD09-176 및 MD09-197-3 에서 나타났는데, 이는 이들 변이체가 E. coli BL21 DE3 숙주 균주에서 더 효과적으로 발현되었음을 나타낸다.

표 14-6. 절단물의 특이 활성

실시예 15

3-차 구조 측정을 위한 구축물

I. pMAL-C4X Kudzu 의 구축

칡 (Pueraria lobata) 의 이소프렌 신타아제 (IspS) 를 코딩하고 E.coli 에 대해 코돈-최적화된 합성 유전자를 DNdA2.0 (Menlo Park, CA) 에서 구입하고 플라스미드 p9795 (도 71 및 72) 로서 제공하였다. 삽입물을 BspLU11I/PstI 로 분쇄하여 제거하고 겔-정제하고 NcoI/PstI-분쇄된 pTrcHis2B (Invitrogen, Carlsbad, California) 로 다시 라이게이션하였다. 생성된 플라스미드는 pTrcKudzu 로 지정하였다 (도 73: pTrcKudzu 의 맵). 삽입물 내 정지 코돈이 PstI 부위 앞에 있어, His-태그가 IspS 단백질에 결합되지 않은 구축물을 도모하였다.

E. coli 코돈-최적화된 Kudzu 유전자를, DNA 주형으로서 플라스미드 pTrcKudzu 를 이용하고, 프라이머 EL-959 및 EL-960, 10mM dNTP (Roche, Indianapolis, IN), 및 Pfu Ultra II Fusion DNA 폴리머라아제 (Stratagene, La Jolla, CA) 를 제작자의 프로토콜에 따라 이용하여 PCR 반응을 수행해 증폭하였다. PCR 조건은 하기와 같았다: 95 ℃ 2 분 (제 1 의 사이클에서만 임), 95 ℃ 25 초, 60 ℃ 25 초, 72 ℃ 30 초 (28 사이클 동안 반복), 및 72 ℃ 엥서 1 분간 최종 신장. 이어서, PCR 생성물을 QIAquick PCR Purification Kit (Qiagen Inc, Valencia, CA) 을 이용해 정제하였다.

Kudzu PCR 생성물 (1 ㎍) 을, 제작자의 프로토콜에 따라 EcoRI 및 HindIII 제한 엔도뉴클레아제 (Roche) 를 이용해 분쇄하였다. 분쇄물을 37 ℃ 에서 30 분 동안 인큐베이션하여 쿠주 유전자에 존재하는 내부 EcoRI 부위의 분쇄를 최소화하였다. 이어서, 분쇄된 PCR 절편을 QIAquick PCR Purification 키트를 이용해 정제하였다. 벡터 pMAL-C4X (0.5 ㎍) (New England Biolabs, Ipswich, MA; 도 75 및 76) 를 제작자의 프로토콜에 따라 EcoRI 및 HindIII 제한 엔도뉴클레아제 (Roche) 을 이용해 분쇄하였다. 이어서, 분쇄된 벡터를 QIAquick Gel Extraction Kit (Qiagen Inc) 을 이용해 겔 정제하였다. DNA 라이게이션 반응을 T4 DNA 리가아제 (New England Biolabs) 를 이용해 5:1 비율의 분쇄된 쿠주 PCR 생성물 대 분쇄된 pMAL-C4X 벡터로 제작자의 프로토콜에 따라 수행했다. 이어서, 라이게이션 반응의 분취물을 TOP10 화학적 적격 세포 (Invitrogen Corp) 내로 형질전환하였다. 형질전환체를 LA + 50 ㎍/㎕ 카르베니실린 플레이트 상에서 선별했다.

쿠주 유전자를 함유하는 형질전환체의 스크리닝은, 콜로니를 고르고, 제작자의 프로토콜에 따라 PuReTaq Ready-To-Go PCR beads (GE Healthcare, Piscataway, NJ) 를 이용해 프라이머 EL-957 및 EL-966 로 PCR 수행하여 실시하였다. PCR 조건은 하기와 같다: 95 ℃ 2 분 (제 1 의 사이클에서만), 95 ℃ 30 초, 50 ℃ 30 초, 72 ℃ 40 초 (28 사이클 동안 반복) 및 72 ℃ 에서 1 분 최종 신장. PCR 생성물을 600 bp 절편을 구하는 2% E-겔 (Invitrogen Corp) 상에서 분석하였다. 올바른 크기의 PCR 생성 삽입물을 함유하는 콜로니를 프라이머 EL-950, EL-951, EL-953, 및 EL-957 를 이용하여 DNA 서열화를 위해 기탁하였다. DNA 서열화로 플라스미드 pMAL-C4X Kudzu 의 구축물을 확인하였다 (도 77 - 79).

표 15-1 프라이머 서열

플라스미드 pMAL-C4X Kudzu 를 OneShot BL21(λDE3) 화학적 적격 세포 (Invitrogen Corp) 내로 형질전환하였다. 발현 균주 형질전환체를 LA + 50 mg/ml 카르베니실린 플레이트 상에서 선별하였다.

II. 결정 구조 시험을 위한 IspS 변이체

이 실시예는 발현, 정제 및 결정화를 위한 친화 태깅된 이소프렌 신타아제 (IspS) 효소 제조 방법을 기술한다.

균주 구축

pET200D-TOPO 벡터 (Invitrogen) 내 구축물에 있어서, P. alba, P. tremuloides, 및 P. trichocharpa 로부터의 IspS 효소의 PCR 생성물을, 0.8% E-겔 (Invitrogen) 을 이용해 제작자가 권고하는 프로토콜에 따라 겔 추출하고 정제했다. pET200 구축물을 위한 PCR 반응은 하기와 같다: 반응 혼합물은 1㎕ (주형)-pET24a-P.alba, 5 ㎕ 10X PfuUltraII 융합 버퍼, 1 ㎕ dNTP (10 mM), 1 ㎕ 프라이머 (50uM) 프라이머 F-(MCM219 또는 218), 1 ㎕ 프라이머 (50uM) 프라이머 R-(MCM182), 41 ㎕ diH2O 및 1 ㎕ 의 PfuUltra II 융합 DNA 폴리머라아제 (Stratagene) 이었다; 사이클 파라미터는 95℃ 1 분, 95℃ 1 분, 55℃ 20 초, 72℃ 27 초 (29 사이클 동안) 후 72℃ 에서 3 분 다음 냉각까지 4℃ (Eppendorf Mastercycler 이용). 유사 반응을 P. tremuloides, P. trichocarpa, 및 쿠주 에 대해서 수행했다. 이어서, 3 ㎕ 의 정제된 생성물을 제작자의 프로토콜에 따라 pET200D/TOPO 벡터 (Invitrogen) 에 라이게이션하였다. 반응물을 5 분 동안 실온에서 인큐베이션한 다음 6 ㎕ 토포이소머라아제 혼합물을 제조자의 프로토콜에 따라 E. coli Top10 화학적 적격 세포 (Invitrogen) 내로 형질전환시켰다. 형질전환체를 LB Kan50 상에서 선별하고, 37 ℃ 에서 하룻밤 인큐베이션하였다. 구축물 당 5 개의 콜로니를 선별하고, T7 정방향 및 MCM182 프라이머 (표 15-2) 를 이용하는 PuReTaq Ready-To-Go PCR Beads (Amersham) 를 이용해 스크리닝하였다. 올바른 크기의 삽입물을 갖는 클론을, QIAPrep Spin Miniprep kit (Qiagen) 를 이용하는 플라스미드 miniprep 에 의해 추가로 확인한 후, T7 정방향 및 T7 역방향 프라이머 (Quintara Biosciences) 를 이용하여 서열화하였다. 각 IspS 변이체에 대한 하나의 완전히 서열된 구축물(자세사항 및 서열에 대해서는 하기 참고/ 도 79-90) 을 추가 연구를 위해 선택했다. 1 ㎕ 의 각 플라스미드를 BL21(λDE3) pLysS (Invitrogen) 내로 제작자의 프로토콜에 따라 형질전환시켰다. 형질전환체를 Kan50 + Cm35 를 갖는 LB 배지 상에서 선별하고 37℃ 에서 하룻밤 인큐베이션하였다. 결정학 연구를 위해 각종 IspS 효소의 발현 및 정제에 생성된 균주를 사용했다.

N-말단 6His-태깅된 IspS 플라스미드의 구축, 균주 및 정제를 실시예 11 에 기술한다.

표 15-2. 프라이머

표 15-3 플라스미드

표 15-4

III. TEV (Tobacco Etch Virus) 또는 EK (Enterokinase; 엔테로키나아제)-태깅된 효소의 분쇄

TEV 절단 (균주 MD09 -165 및 MD09 - 167 로 부터의 IspS )

균주 MD09-165 및 MD09-167 는 실시예 11 에 기술되어 있다. 분쇄를 위해, 효소를 Ni 전하를 띤 세파로오스 (GE Healthcare) 를 통해 정제하고, 1 mM DTT 를 함유하는 50 mM HEPES, 50 mM NaCl pH 7.4 버퍼로 탈염시켰다. 분쇄를 Eton Bioscience Inc 의 TurboTEV 프로테아제로 수행했다. 10 ㎍ 의 정제된 단백질 당 1 단위의 TurboTEV 를 사용했다. 분쇄를 4℃ 에서 하룻밤 수행했다. 샘플을 Ni 버퍼 중에 평형화된 또 다른 Ni 컬럼을 통과시켜 절단되지 않은 효소, 태그, TurboTEV 프로테아제 (역시 태깅되어 있음) 및 불순물을 제거했다. Ni 컬럼 통과물 및 세정물을 SDS-PAGE 겔 (NUPAGE, Invitrogen) 및 DMAPP 활성 검정을 이용해 분석했다. 순수 효소를 함유하는 샘플을 모으고, 1 mM DTT 를 함유하는 50 mM NaCl pH 7.4 버퍼로 탈염시키고, -80℃ 에서 보관했다.

EK 절단 (균주 MD08 -102 및 MD08 - 104 로부터의 IspS )

분쇄를 위해, 효소를 Ni 전하를 띤 세파로오스 (GE Healthcare) 를 통해 정제하고, 1 mM DTT 를 함유하는 50 mM HEPES, 50 mM NaCl pH 7.4 버퍼로 탈염시켰다.

분쇄를 20 ㎍ 의 정제된 단백질 당 1 단위의 EKMax 를 이용해 EKMax (E180-02) (Invitrogen) 로 4 ℃ 에서 하룻밤 수행했다. 샘플을 EK Away resin (Invitrogen) 통과시켜 여분의 엔테로키나아제를 제거했다. 샘플을 Ni 전하를 띤 세파로오스 수지 (Ni 세정 버퍼 중 평형화됨) 상으로 뱃치 (batch) 시키고 가끔 뒤짚으면서 30 분 동안 4 ℃ 에서 인큐베이션했다. 이로 절단되지 않은 효소, 태그 및 불순물이 제거되었다. Ni 컬럼 통과물 및 세정물을 SDS-PAGE 겔 (4-12% NUPAGE, Invitrogen) 및 DMAPP 활성 검정을 이용해 분석했다. 순수 효소를 함유하는 샘플을 모으고, 1 mM DTT 를 함유하는 50 mM HEPES, 50 mM NaCl pH 7.4 버퍼 중으로 탈염시켜 -80℃ 에서 보관했다.

IV. MBP-IspS 의 정제

MBP-Kudzu 이소프렌 신타아제 발현을 위한 pMAL-C4X Kudzu 의 구축은 상술되어 있다. 15-L 스케일로 배치 배양물에서 성장시킨 E. coli 로부터 MBP-Kudzu 이소프렌 신타아제 생성.

배지 제조법 (발효 배지 리터 당)

K₂HPO₄ 7.5 g, MgSO₄ * 7H₂O 2 g, 시트르산 모노히드레이트 2 g, 시트르산 철 암모늄 0.3 g, 효모 추출물 0.5 g, 1000X 개질된 미량 금속 용액 1 ml. 성분 모두를 함께 첨가하고 diH₂O 중에 용해했다. 이 용액을 오토클레이브하였다. pH 를 수산화암모늄 (30%) 으로 7.0 으로 조절하고 부피에 있어서는 충분량으로 했다. 글루코오스 10 g, 티아민 * HCl 0.1 g, 및 항생제를, 멸균 및 pH 조절 후 첨가했다.

1000X 개질된 미량 금속 용액

시트르산 * H₂O 40 g, MnSO₄ * H₂O 30 g, NaCl 10 g, FeSO₄ * 7H₂O 1 g, CoCl₂ * 6H₂O 1 g, ZnSO * 7H₂O 1 g, CuSO₄ * 5H₂O 100 mg, H₃BO₃ 100 mg, NaMoO₄ * 2H₂O 100 mg. 각각의 성분을 diH₂O 중 한번에 하나씩 용해하고, HCl/NaOH 로 pH 를 3.0 으로 한 다음 부피에 대해 충분량이 되게 하고, 0.22 마이크론 필터로 여과 멸균하였다.

말토오스 결합 단백질 (MBP)-Kudzu 이소프렌 신타아제 융합 분자를 발현하는 pMAL-C4X 플라스미드를 함유하는 BL21 (DE3) E. coli 세포로 15-L 생물반응기 중에서 발효를 수행했다. 이러한 실험을 실행하여, 원하는 발효 pH 7.0 및 온도 30 ℃ 에서 이소프렌 신타아제를 생성하였다. E. coli 균주의 동결된 바이알을 융해하고 트립톤-효모 추출물 배지에 접종했다. 접종원이 550 nm 에서 측정된 OD (OD₅₅₀) 가 1.0 일 때까지 성장시킨 후, 120 mL 를 15-L 생물반응기에 접종하는데 사용하여 초기 부피를 9-L 로 하였다.

원하는 분자의 발현은, 이소프로필-베타-D-1-티오갈락토피라노시드 (IPTG) 를 첨가함으로써 달성했다. IPTG 농도를, OD₅₅₀ 가 10 값에 도달했을 때 1 mM 으로 만들었다. 원하는 생성물을 함유하는 세포를 IPTG 첨가 후 3 시간 후 수확했다.

MBP - IspS 정제

브로쓰를 15 분 동안 10000 x g 에서 원심분리하였다. 펠릿을 수집하고 추가 정제할 때까지 -80 ℃ 에서 동결하였다. 세포를 MBP-결합 버퍼 (5% 글리세롤, 20 mM Tris pH 7.4, 200 mM NaCl, 2 mM DTT, 1mg/ml 리소자임) 중에서 재현탁하고, 3 회 20000 psi 에서 세포파쇄기를 통과시켰다. 이어서, 분해물을 1 시간 동안 100000 x g 로 초원심분리하여, 비교적 맑은 용액을 수득했다. 상청액을 원심분리 튜브 바닥의 겔라틴성 물질을 교란시키지 않으면서 이 튜브 상부에서 피펫팅하였다. 겔 여과를 Superdex-200 26/60 컬럼 (GE healthcare) 을 이용해 상청액 상에서 수행했다. 컬럼을 3 mL/min 의 유속으로 23 ℃ 에서 MBP-결합 버퍼를 이용해 전개하였다. 분획분을 하기에 기술된 DMAPP 활성에 대해서 시험하였다. 활성 분획분을 모으고 25 mL 아밀로오스 수지 (New England Biolabs) 상으로 로딩하였다. 컬럼을 10 컬럼부피 MBP-결합 버퍼로 세정한 다음, 단백질을 10 mM 말토오스를 함유하는 2 컬럼 부피의 MBP-결합 버퍼로 용리하여 >90% 순수 MBP-IspS 를 수득했다.

V. DMAPP 검정

하기의 반응 혼합물을 DMAPP 검정에 사용했다: 25 ㎕ 분해물 혼합물, 5 ㎕ MgCl₂ (1 M), 5 ㎕ DMAPP (100mM), 및 65 ㎕ 100 mM Tris pH 8, 100 mM NaCl (총 부피가 100 ㎕ 이 되게 하는 양으로 함). 반응을 30 ℃ 에서 15 분 동안 기밀의 1.8 mL GC 튜브 중에서 수행했다. 반응을 100 ㎕ 500 mM EDTA (pH 8) 의 첨가로 종결했다. 생성된 이소프렌의 양을 상기에 기술한 바와 같이 GC/MS 로 측정했다.

실시예 16

IspS 의 3차원 구조

식물 이소프렌 신타아제 (IspS) 의 7 가지 구축물을 X-선 회절에 적합한 결정을 생성하도록 제조하였다. 이들은 다음이다: N-말단 히스티딘-태깅된 말토오스 결합 단백질 및 쿠주 IspS 를 함유하는 구축물 (MBP-kudzu), N-말단 히스티딘-태그를 가진 전장 P. alba IspS (MD08-99), 첫 19 개의 N-말단 잔기가 제거된 P. alba IspS (MD08-100) (이 구축물은 또한 정제 후 N-말단 his-태그가 제거됨), 전장, 비태깅된 P. alba IspS (균주 RM11608-2), 트윈-아르기닌 motif 앞 2 개의 추가 잔기를 특징으로 하는 절단된 P. alba IspS 구축물을 제조함 (MD09-167), N-말단 his-태그 및 N-말단 절단물 둘 모두를 함유하는 P. tricharpa IspS (MD08-104) 를 제조함, 및 N-말단 his-태그 및 N-말단 절단물을 갖는 P. tremuloides 유래의 IspS 로 이루어진 또 다른 구축물 (MD08-102) 을 제조함. 다양한 이소프렌 신타아제를 발현하는 균주의 구축은 하기에 기술한다.

각 구축물을 정제한 다음 농축된 단백질 용액을 가능한 결정화 조건을 조사하기 위해 제조하였다. 각각의 구축물을 독립적으로 정제하고 하기와 같이 조사했다. 모든 내부 결정화 (in-house crystallization) 스크린을, 부유 방울 증기 확산법 (hanging drop vapor diffusion method) 을 이용하여 설정하였다. 최소한 각 구축물을 하기의 시판 스크린을 이용해 조사했다: Cystal Screen, Hampton Research (Aliso Viejo, CA) 및 JCSG+ Suite, Qiagen (Valencia, CA).

정제된 MBP-kudzu 를 하기의 시판 스크린을 이용하여 설정하였다: Crystal Screen, Hampton Research 및 JCSG+ Suite. 게다가, 정제된 MBP-kudzu 를 Hauptman-Woodward Institute (Buffalo, NY) 에 고처리량 스크리닝을 위해 의뢰하였고, 여기서 최소한 1536 가지의 조건을 조사하였다. 정제된 MBP-kudzu 융합물은 다수의 조건 하에서 용액 중에 침전되었고, 어떠한 단백질 결정도 관찰되지 않았다.

결정화 스크리닝에 사용된 다음 구축물은 MD08-99 (N-말단 히스티딘-태그를 갖는 전장 P. alba IspS) 였다. MD08-99 를 정제하고, 히스티딘-태그를 제거했다. MBP-kudzu 에 대해서와 동일한 3 가지의 초기 결정화 스크린을 수행했다. Hampton Research Crystal Screen 및 Qiagen JCSG+ Suite 를 다수의 단백질 농도로 각각 수행했다. 소형의 침상 (needle-like) 결정을 일부의 Hampton Research Crystal Screen 조건에서 관찰했다. 결정을 개선하기 위한 추가의 노력에는 IspS 억제제 나트륨 이반드로네이트 (Sigma-Aldrich, St Louis, MO) 로 공동-결정화를 포함하였다. 종합해 보면, 추가의 288 가지의 결정화 조건을 pH, 농도 및 결정화 시약을 변동시키면서 시도했다. 이어서, 9 가지의 최고 결정을 데이타 수집을 위해 제조하고, Rigaku RU200 회전 애노드 생성기 및 R-AXIS IV++ 에서 내부 실험하였는데, 이들은 x-선을 회절하지 않았거나 염 결정이었다.

P. alba IspS 의 첫 19 개의 N-말단 잔기를 제거하여 MD08-100 를 구축했다. 이 구축물은 정제 후에 N-말단 히스티딘-태그가 제거되었다. 내부의 결정화 스크린을, Hampton Research Crystal Screen 및 Qiagen JCSG+ Suite 을 각각 다수의 단백질 농도로 함으로써 이용해 수행했다. 최초의 결정 히트는, 내부의 x-선 생성기를 이용해 16 Å 해상도 (resolution) 로 회절하는 6방정계 플레이트 및 5 Å 해상도로 회절하는 소형의 막대기를 포함한다. 결정을 개선하기 위해, MD08-100 를 나트륨 이반드로네이트 또는 나트륨 피로포스페이트 (Sigma-Aldrich, St Louis, MO) (둘 모두 IspS 활성의 억제제임) 으로 공동-결정화하였다. 어느 억제제도 개선된 결정 또는 개선된 회절을 도모하지 않았다. 추가 168 가지 결정화 조건을, pH, 농도 및 결정화 시약 변동으로 시도했다. 21 개의 가장 유망한 MD08-100 결정을 회절을 위해 스크리닝하였고, 수득된 최고의 해상도는 5Å 였다.

발효 작업으로부터의 전장, 비태깅된 P. alba IspS (균주 RM11608-2) 를 정제하였다. 최초의 스크린은 Hampton Research Crystal Screen 을 이용하여 설정하고, 결정을 4 가지의 상이한 조건에서 관찰하였다. 4 개 모두의 결정을 내부 회절로 실험하였는데, 3 개는 염 결정이었고 1 개는 회절하지 않았다.

트윈-아르기닌 motif 앞 2 개의 추가 잔기를 특징으로 하는 절단된 P. alba IspS 구축물을 제조했다 (MD09-167). 이 구축물은 C-말단 히스티딘-태그를 포함하였고, 결정화 실험은 절단되거나 절단되지 않은 태그로 단백질 농도를 다양하게 하고 나트륨 피로포스페이트 존재 또는 부재하에서 설정하였다. 최초의 결정화 스크린을 MBP-kudzu 에 따라 수행했다. 이 구축물로부터의 결정을 다양한 조건에서 관찰하였다: 최적화로 pH, 침전제, 농도 및 억제제의 528 가지 변동이 포함된다. 최적화 실험으로부터, 15 가지의 상이한 MD09-167 결정을 회절을 위해 내부 스크리닝했다. 해상도를 개선하기 위해, 다양한 결정 동결 조건을 실험하고, 회절 한계의 개선 효과는 10Å 내지 6.5Å 이었다.

P. tricharpa IspS 를 함유하는 새로운 구축물을 제조하였는데, 이는 N-말단 히스티딘-태그 및 N-말단 절단물을 모두 포함한다 (MD08-104). 히스티딘-태그가 절단된 정제된 MD08-104 를 Hampton Research Crystal Screen 및 the Qiagen JCSG+ suite 을 이용하여 조사하였다. 이 구축물은 P. alba IspS 구축물보다 더 무거운 침전물을 생성하였다. 매우 작은 침상들이 관찰되었는데, 결정 중 어느 것도 회절에 적합하지 않았다.

N-말단 히스티딘-태그 및 N-말단 절단물을 갖는 P. tremuloides 로부터의 IspS 로 이루어진 또 다른 구축물을 제조하였다 (MD08-102). 절단된 히스티딘-태그의 존재 또는 부재하 정제된 MD08-102 를 다양한 단백질 농도로 Hampton Research Crystal Screen 및 Qiagen JCSG+ Suite 을 이용해 설정하였다. 막대기 및 판형 결정을 동일한 조건에서 관찰하였고, 추가 120 가지 실험을 결정을 개선하도록 pH, 농도 및 결정화 시약을 변동함으로써 수행했다. 최적화 실험으로부터, 10 개의 결정을 내부 실험하여, 초기 최고 회절은 5Å에 다달았다. 결정의 동결 조건의 추가 개질시, 절단되지 않은 히스티딘-태깅된 단백질로부터 3.3 Å으로 회절되는 결정이 발견되었다. 이 결정을, 2 ㎕ 의 단백질 (10 mg/ml, 30mM MgCl₂ 와 함께) 을 2 ㎕ 의 침전 용액 [10% (wt/vol) 폴리에틸렌 글리콜 8000, 0.1 M HEPES, pH 7.5, 8% 에틸렌 글리콜] 과 혼합하여 성장시키고 500 ㎕ 침전제에 대해 평형화시켰다. 막대형 결정 무리가 3 주 후에 나타났다. 이 결정은 정방정계 공간군 (space group) P43212 에 속하고, 단위 격자 크기 a = 154.2, b = 154.2, c = 142.7 를 갖는다.

내부 x-선 회절 데이타를 Rigaku RU200 생성기 및 R-AXIS IV++ 검출기를 이용해 100 K 에서 질소 흐름 하 수집했다. 액체 질소에서 결정을 급속동결하기 전에, 10% (wt/vol) 폴리에틸렌 글리콜 8000, 0.1 M HEPES, pH 7.5, 및 25% 에틸렌 글리콜을 함유하는 용액을 통해 강타시켜 부동시켰다. 데이타를 Mosflm (Leslie, A. (1998) J. of Appl. Crystallography 30, 1036-1040) 를 이용하여 통합하고, SCALA (Collaborative Computational Project, N. (1994) Acta Crystallographica Section D 50, 760-763) 를 이용하 척도화하였다. 이어서, 데이타를 출발 모델로서 리모넨 신타아제의 단량체로 (Protein Data Bank ID 2ONH)(Berman, H., 등. (2007) Nucl. Acids Res. 35, D301-303), MrBUMP (Keegan, R. M., 및 Winn, M. D. (2007) Acta Crystallographica Section D 63, 447-457; Vagin, A., 및 Teplyakov, A. (1997) J. of Appl. Crystallography 30, 1022-1025) 를 이용하여 분자 대체함으로써 단계적으로 진행했다. 결정은 비대칭 단위에서 1 개의 이량체를 포함하고 용매 함량은 66% 이다.

동일한 결정으로부터 설정된 3.05Å 데이타를 이어서 Stanford Synchrotron Radiation Laboratory 의 빔라인 (beamline) 11-1 을 이용해 수집했다. 이들 데이타를 또한 Mosflm 및 SCALA 를 이용해 처리하였다. 데이타 수집 및 정밀화 통계를 표 16-1 에 나타낸다.

Refmac5 (Collaborative Computational Project, N. (1994) Acta Crystallographica Section D 50, 760-763) 로의 정밀화를, 시각화 프로그램 Coot (Emsley, P., 및 Cowtan, K. (2004) Acta Crystallographica Section D 60, 2126-2132) 를 이용해 반복적 수동 개조 단계로 이용했다. 정밀화 동안, 단백질의 기하계측은 Molprobity (Davis, I. W., 등. (2007) Nucl. Acids Res., gkm216) 를 이용해 체크했다.

포플러 IspS 의 폴딩은 보르닐 디포스페이트 신타아제 (Whittington, D. A., 등. (2002) Proc. Natl Acad. Sci. USA 99, 15375-15380), 리모넨 신타아제 (Hyatt, D. C., 등. (2007) Proc. Natl Acad. Sci. USA 104, 5360-5365), 및 담배 5-에피-아리스토로첸 신타아제 (Starks, C. M., 등. (1997) Science 277, 1815-1820) 와 유사하다. 구조는 2 개의 나선형 도메인, 활성 부위를 포함하는 C-말단 도메인, 및 N-말단 도메인으로 이루어진다 (도 90 및 91). 좌표는 표 16-7 에 제공한다.

표 16-1. 데이타 수집 및 정밀화 통계

유연성 루프

이소프렌 신타아제의 3차원 구조의 결정에서 얻은 독특하면서 뜻밖인 발견은, 활성 부위를 형성하는 수 개의 결정적인 루프가 유연하다는 점이다. 이 발견은 기타 테르펜 신타아제의 공지된 구조를 이소프렌 신타아제의 구조와 비교할 때 즉시 알 수 있다 (도 94). 대체로, 구조는 2차 구조 및 연결 루프의 형태 (conformation) 에서 고 보존된다 (구축물 P.tremTRC-pET200 로부터의 Poplar tremuloides IspS 의 이 실시예에서, 넘버링하는 통상의 방식은 태그를 함유하는 완전한 서열의 첫번째 넘버가 -35 이고, IspS 의 첫번째 잔기는 1 인 방식임). 그러나, 상당 부분의 기질 결합 포켓, 특히 절단된 N-말단을 형성하는 3 개의 분절은 잔기 438-453 로 이루어진 루프 (루프 I) 및 잔기 512-527 로 이루어진 루프 (루프 II)의 2 개의 루프와 함께 방사형으로 보인다 (도 95 내지 97). 이는 본 기질 결정에서 효소와 복합되는 기질의 부재로 인한 것이다.

예를 들어, 효소와 BdpS 를 비교하는 경우에서, 우리는 잔기 498-513 및 573-587 에 해당하는 루프가 동일 개수의 잔기로 이루어지고 이들 영역에서 상동성의, 그러나 동일하지 않은 아미노산을 갖는다는 점을 발견했다. 우리는 이들 구조를 철저하게 연구할수록, 관련 테르펜 신타아제에는 분절 내 유사한 유연성을 보일 것이라고 예상한다. 이들 가변성 루프 영역에 상응하는 테르펜 신타아제의 잔기를 표 16-2 에 열거한다.

표 16-2. 테르펜 신타아제 내 가변성 루프에 상응하는 잔기

이 중요한 발견은, 간단한 방식으로 개선된 신타아제의 조작에 활용될 수 있다. 이러한 분절들을 형성하는 아미노산 내에서 치환을 만들어 효소가 반드시 기질 결합 단계에서 겪는 전이 (transition) 를 용이하게 하고, DMAPP 에서 이소프렌으로의 전자 이동 및 효소의 인산기이탈반응 동안 발생될 것으로 상정되는 상이한 역학 단계에서 기질의 재배열을 가능하게 함으로써 효소 성능을 강화시키는데 유연성을 활용하는 것이 바람직할 수 있다.

상기 구조는 이들 루프가 적어도 2 가지 형태로 존재할 수 있다는 새로운 시각을 제공한다: 우리가 이소프렌 신타아제의 비(非)복합화 구조에서 본 바와 같이, 기질의 부재 하에서는 "개방" 형태, 및 기질이 결합하는 경우에는 "폐쇄" 또는 활성 형태. 따라서, 표 16-3 에 기술된 바와 같은 활성 형태로 루프와 접촉하게 되는 잔기를 개질하는 것이 유익할 것이다.

표 16-3. 유연성 요소의 5 옹스트롬 내 오는 잔기

식물 이소프렌 신타아제의 개선을 위한 부위의 선별

식물의 이소프렌 신타아제는 테르펜 신타아제와 상동인 것으로 예상했다. 3 개의 상동성 테르펜 신타아제의 3차원 구조가 결정되어 있다: Salvia officinalis 보르닐 디포스페이트 신타아제 (BdpS; pdb 엔트리 1N1B), Mentha spicata 리모넨 신타아제 (LS; pdb 엔트리 2ONG), 및 담배 5-에피-아리스토로첸 신타아제 (TEAS; pdb 엔트리 5EAS). 이들 효소는 단지 33% 상동성을 공유하나 이의 3차 구조는 보존된다. 서열 동일성은 표 16-4 에 나타내고 구조 간 구조적 상동성은 표 16-5 에 나타낸다. 게다가, 3 개의 관련 효소 모두와의 중간 복합체의 구조는 3 차 폴딩뿐 아니라 이들 효소의 활성 부위 내 세부 상호작용이 고 보존된다는 점이 밝혀져 있다.

표 16-4. 테르펜 사이클라아제의 % 동일성

^aPolar alba 이소프렌 신타아제

^b Polar tremuloides 이소프렌 신타아제

^c 보르닐 디포스페이트 신타아제

^d 리모넨 신타아제

^e 5-에피-아리스토로첸 신타아제

표 16-5. 테르펜 신타아제의 구조적 정렬

^a Polar tremuloides 이소프렌 신타아제

^b 보르닐 디포스페이트 신타아제

^c 리모넨 신타아제

^d 5-에피-아리스토로첸 신타아제

^e Ca 원자에 대해서 Å 로 표기된 평균평방근편차 및 괄호에는 정렬된 잔기의 넘버임

구축물 P.tremTRC-pET200 으로부터의 Poplar tremuloides IspS 의 상기 실시예에서, 넘버링의 통상 방식은 태그를 포함하는 완전한 서열의 제 1 의 넘버를 -35 으로 하고, IspS 의 제 1 의 잔기를 1 로 하는 방식이다.

BdpS 구조 및 포플러 IspS 구조로부터의 활성 부위의 비교로, 금속 이온 결합 및 포스페이트 인지와 관여하는 활성 부위가 보존된다는 것을 나타낸다. 특히, 포플러 IspS 의 Arg 255, Asp 292, Asp 296, Glu 370, Arg 433 및 Asn 436 는 BdpS 내 동 잔기와 오버랩되는 것으로 관찰되었다. BdpS 의 중간체의 위치결정을 또한 포플러 IspS 구조와 비교하였다. 상기를 기준으로 하면, 포플러 IspS 효소와 결합하고 반응하기 위해 디메틸알릴 피로포스테이트가 요구할 수 있는 유사한 결합 영역 및 접근 방향을 동정할 수 있었다.

포플러 IspS 의 구조를 기준으로, 개선된 성능을 지닌 변이체 IspS 효소를 생성하는 돌연변이유발 후보로서 포플러 IspS 의 부위를 동정하였다. 요약하면, 금속 결합의 상호작용, 디포스페이트 인지, DMAPP 사슬 결합 및/또는 활성 부위로의 접근을 변경할 수 있는 부위를 IspS 내에서 선별하였다.

I. 디포스페이트/ 금속 결합 부위

금속 및 디포스페이트 결합 측쇄 근처에서 발견되는 포플러 IspS 내 아미노산 잔기의 측쇄를 동정하였다. 이들 잔기에는 Asp 293, Tyr 385, Ser 392, 및 Asp 437 이 포함된다. 이들 부위의 조작으로 효소 활성 증가를 도모할 수 있다.

II. 기질 접근 루프

포플러 IspS 의 기질 접근 루프는 BdpS 구조로부터 벗어난 영역 내에 존재한다. BdpS 구조에서, 잔기는 활성 부위 위 커버를 만든다. 기질 결합시 포플러 IspS 의 구조는 유사한 구조를 형성하기 쉽다. 그리하여 잔기 440-453 및 512-524 를 비롯한 이들 루프 내 잔기는 포플러 IspS 효소의 활성을 변경하는 위치에 올 것이다. 포플러 IspS 효소에서, 잔기 440-453 는 서열 SASAEIARGETANS 를 갖고, 잔기 512-526 는 서열 YHNGDAHTSPDEL 을 갖는다.

III. 이소프레닐 결합 부위

BdpS 와 반응 생성물, 보르닐 디포스페이트의 복합체를 (PDB 엔트리 1N24), 단백질 공학으로 기질 특이성 및/또는 반응 속도 (기질과 생성물의 변경된 온 (on) 및 오프 (off) 속도) 를 조절할 수 있는 포플러 IspS 내 잔기를 동정하는데 사용될 수 있다. 이들 잔기에는 Ser 261, Trp 264, Phe 285, Thr 289, Ser 393, Ser 394, Phe 432, 및 Try 512 이 포함된다.

표 16-6. 후보 돌연변이유발 부위

표 16-7. P. tremuloides IspS 의 좌표

본 발명의 기술된 방법 및 시스템의 각종 변경 및 변형은 본 발명의 영역 및 취지로부터 벗어나지 않은 채 당업자에게는 자명할 것이다. 비록 본 발명을 특정 바람직한 구현예와 연관지어 설명하였더라도, 청구되는 바와 같이 본 발명이 그러한 특정한 실시예로 과도하게 한정되어지지 않아야 된다는 점은 분명하다. 정말로, 당업자에게 분명한 본 발명을 실시하기 위해 기술되어 있는 형식들의 각종 변형은 하기 청구항 범위 내에 존재하는 것으로 의도된다.

<110> GENENCOR INTERNATIONAL, INC. THE GOODYEAR TIRE & RUBBER COMPANY Marguerite A. CERVIN Gregory M. WHITED Ansrei MIASNIKOV Caroline PERES Walter WEYLER Derek WELLS <120> ISOPRENE SYNTHASE VARIANTS FOR IMPROVED MICROBIAL PRODUCTION OF ISOPRENE <130> 643842000540 <140> Not Yet Assigned <141> 2009-04-23 <150> US 61/125,336 <151> 2008-04-23 <160> 167 <170> FastSEQ for Windows Version 4.0 <210> 1 <211> 1695 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 1 atgtgtgcga cctcttctca atttactcag attaccgagc ataattcccg tcgttccgca 60 aactatcagc caaacctgtg gaatttcgaa ttcctgcaat ccctggagaa cgacctgaaa 120 gtggaaaagc tggaggagaa agcgaccaaa ctggaggaag aagttcgctg catgatcaac 180 cgtgtagaca cccagccgct gtccctgctg gagctgatcg acgatgtgca gcgcctgggt 240 ctgacctaca aatttgaaaa agacatcatt aaagccctgg aaaacatcgt actgctggac 300 gaaaacaaaa agaacaaatc tgacctgcac gcaaccgctc tgtctttccg tctgctgcgt 360 cagcacggtt tcgaggtttc tcaggatgtt tttgagcgtt tcaaggataa agaaggtggt 420 ttcagcggtg aactgaaagg tgacgtccaa ggcctgctga gcctgtatga agcgtcttac 480 ctgggtttcg agggtgagaa cctgctggag gaggcgcgta ccttttccat cacccacctg 540 aagaacaacc tgaaagaagg cattaatacc aaggttgcag aacaagtgag ccacgccctg 600 gaactgccat atcaccagcg tctgcaccgt ctggaggcac gttggttcct ggataaatac 660 gaaccgaaag aaccgcatca ccagctgctg ctggagctgg cgaagctgga ttttaacatg 720 gtacagaccc tgcaccagaa agagctgcaa gatctgtccc gctggtggac cgagatgggc 780 ctggctagca aactggattt tgtacgcgac cgcctgatgg aagtttattt ctgggcactg 840 ggtatggcgc cagacccgca gtttggtgaa tgtcgcaaag ctgttactaa aatgtttggt 900 ctggtgacga tcatcgatga cgtgtatgac gtttatggca ctctggacga actgcaactg 960 ttcaccgatg ctgtagagcg ctgggacgtt aacgctatta acaccctgcc ggactatatg 1020 aaactgtgtt tcctggcact gtacaacacc gttaacgaca cgtcctattc tattctgaaa 1080 gagaaaggtc ataacaacct gtcctatctg acgaaaagct ggcgtgaact gtgcaaagcc 1140 tttctgcaag aggcgaaatg gtccaacaac aaaattatcc cggctttctc caagtacctg 1200 gaaaacgcca gcgtttcctc ctccggtgta gcgctgctgg cgccgtctta cttttccgta 1260 tgccagcagc aggaagacat ctccgaccac gcgctgcgtt ccctgaccga cttccatggt 1320 ctggtgcgtt ctagctgcgt tatcttccgc ctgtgcaacg atctggccac ctctgcggcg 1380 gagctggaac gtggcgagac taccaattct atcattagct acatgcacga aaacgatggt 1440 accagcgagg aacaggcccg cgaagaactg cgtaaactga tcgacgccga atggaaaaag 1500 atgaatcgtg aacgcgttag cgactccacc ctgctgccta aagcgttcat ggaaatcgca 1560 gttaacatgg cacgtgtttc ccactgcacc taccagtatg gcgatggtct gggtcgccca 1620 gactacgcga ctgaaaaccg catcaaactg ctgctgattg accctttccc gattaaccag 1680 ctgatgtatg tctaa 1695 <210> 2 <211> 564 <212> PRT <213> Peuraria sp. <400> 2 Met Cys Ala Thr Ser Ser Gln Phe Thr Gln Ile Thr Glu His Asn Ser 1 5 10 15 Arg Arg Ser Ala Asn Tyr Gln Pro Asn Leu Trp Asn Phe Glu Phe Leu 20 25 30 Gln Ser Leu Glu Asn Asp Leu Lys Val Glu Lys Leu Glu Glu Lys Ala 35 40 45 Thr Lys Leu Glu Glu Glu Val Arg Cys Met Ile Asn Arg Val Asp Thr 50 55 60 Gln Pro Leu Ser Leu Leu Glu Leu Ile Asp Asp Val Gln Arg Leu Gly 65 70 75 80 Leu Thr Tyr Lys Phe Glu Lys Asp Ile Ile Lys Ala Leu Glu Asn Ile 85 90 95 Val Leu Leu Asp Glu Asn Lys Lys Asn Lys Ser Asp Leu His Ala Thr 100 105 110 Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe Glu Val Ser Gln 115 120 125 Asp Val Phe Glu Arg Phe Lys Asp Lys Glu Gly Gly Phe Ser Gly Glu 130 135 140 Leu Lys Gly Asp Val Gln Gly Leu Leu Ser Leu Tyr Glu Ala Ser Tyr 145 150 155 160 Leu Gly Phe Glu Gly Glu Asn Leu Leu Glu Glu Ala Arg Thr Phe Ser 165 170 175 Ile Thr His Leu Lys Asn Asn Leu Lys Glu Gly Ile Asn Thr Lys Val 180 185 190 Ala Glu Gln Val Ser His Ala Leu Glu Leu Pro Tyr His Gln Arg Leu 195 200 205 His Arg Leu Glu Ala Arg Trp Phe Leu Asp Lys Tyr Glu Pro Lys Glu 210 215 220 Pro His His Gln Leu Leu Leu Glu Leu Ala Lys Leu Asp Phe Asn Met 225 230 235 240 Val Gln Thr Leu His Gln Lys Glu Leu Gln Asp Leu Ser Arg Trp Trp 245 250 255 Thr Glu Met Gly Leu Ala Ser Lys Leu Asp Phe Val Arg Asp Arg Leu 260 265 270 Met Glu Val Tyr Phe Trp Ala Leu Gly Met Ala Pro Asp Pro Gln Phe 275 280 285 Gly Glu Cys Arg Lys Ala Val Thr Lys Met Phe Gly Leu Val Thr Ile 290 295 300 Ile Asp Asp Val Tyr Asp Val Tyr Gly Thr Leu Asp Glu Leu Gln Leu 305 310 315 320 Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala Ile Asn Thr Leu 325 330 335 Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr Asn Thr Val Asn 340 345 350 Asp Thr Ser Tyr Ser Ile Leu Lys Glu Lys Gly His Asn Asn Leu Ser 355 360 365 Tyr Leu Thr Lys Ser Trp Arg Glu Leu Cys Lys Ala Phe Leu Gln Glu 370 375 380 Ala Lys Trp Ser Asn Asn Lys Ile Ile Pro Ala Phe Ser Lys Tyr Leu 385 390 395 400 Glu Asn Ala Ser Val Ser Ser Ser Gly Val Ala Leu Leu Ala Pro Ser 405 410 415 Tyr Phe Ser Val Cys Gln Gln Gln Glu Asp Ile Ser Asp His Ala Leu 420 425 430 Arg Ser Leu Thr Asp Phe His Gly Leu Val Arg Ser Ser Cys Val Ile 435 440 445 Phe Arg Leu Cys Asn Asp Leu Ala Thr Ser Ala Ala Glu Leu Glu Arg 450 455 460 Gly Glu Thr Thr Asn Ser Ile Ile Ser Tyr Met His Glu Asn Asp Gly 465 470 475 480 Thr Ser Glu Glu Gln Ala Arg Glu Glu Leu Arg Lys Leu Ile Asp Ala 485 490 495 Glu Trp Lys Lys Met Asn Arg Glu Arg Val Ser Asp Ser Thr Leu Leu 500 505 510 Pro Lys Ala Phe Met Glu Ile Ala Val Asn Met Ala Arg Val Ser His 515 520 525 Cys Thr Tyr Gln Tyr Gly Asp Gly Leu Gly Arg Pro Asp Tyr Ala Thr 530 535 540 Glu Asn Arg Ile Lys Leu Leu Leu Ile Asp Pro Phe Pro Ile Asn Gln 545 550 555 560 Leu Met Tyr Val <210> 3 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 3 cgtgagatca tatgtgtgcg acctcttctc aatttac 37 <210> 4 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 4 cggtcgacgg atccctgcag ttagacatac atcagctg 38 <210> 5 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 5 catatgaaag cttgtatcga ttaaataagg aggaataaac c 41 <210> 6 <211> 1680 <212> DNA <213> Poplus alba x tremula <400> 6 atgtgctctg tttctaccga gaacgtttcc ttcactgaga cggaaaccga ggcacgtcgt 60 agcgcgaact acgagccgaa tagctgggac tacgatttcc tgctgtcttc cgatactgac 120 gaatctattg aggtgtacaa agacaaagca aagaaactgg aggctgaagt gcgccgcgaa 180 attaacaacg agaaagctga attcctgact ctgctggagc tgatcgataa cgtacagcgc 240 ctgggtctgg gttaccgctt cgaatctgat atccgtcgcg cactggatcg tttcgtaagc 300 agcggcggtt tcgatggcgt gaccaaaacg agcctgcacg ctaccgcgct gtccttccgt 360 ctgctgcgtc agcacggctt cgaagtttct caggaagcat tctccggttt caaagatcaa 420 aacggtaact tcctggaaaa cctgaaagaa gacactaagg cgatcctgag cctgtatgag 480 gcaagctttc tggccctgga gggtgagaac atcctggatg aggcgcgcgt attcgccatc 540 tcccatctga aagagctgtc tgaagagaaa atcggtaagg aactggcaga gcaggttaat 600 cacgcactgg aactgccgct gcatcgtcgt acccagcgtc tggaggcggt ttggtccatc 660 gaagcgtacc gcaaaaagga ggatgctaac caggttctgc tggaactggc catcctggac 720 tacaacatga tccagtccgt ttaccagcgt gatctgcgtg aaacctcccg ttggtggcgc 780 cgtgtgggcc tggcgaccaa actgcacttc gctaaggacc gcctgattga gtctttttac 840 tgggcagtcg gcgttgcgtt cgaacctcag tattctgact gccgtaacag cgttgcgaaa 900 atgttcagct tcgttactat tatcgacgac atctacgacg tttacggtac tctggacgag 960 ctggaactgt ttaccgacgc tgtcgaacgt tgggatgtta acgccatcaa cgatctgcct 1020 gactacatga aactgtgctt cctggcactg tataacacga tcaacgaaat tgcatacgac 1080 aacctgaaag acaaaggtga aaacatcctg ccgtacctga ctaaagcgtg ggcggatctg 1140 tgtaacgctt ttctgcaaga agcgaaatgg ctgtataaca aatccactcc gacctttgac 1200 gattatttcg gcaatgcctg gaaatccagc tctggcccgc tgcaactgat cttcgcttat 1260 tttgcggttg tccaaaacat caaaaaggag gaaattgaaa acctgcaaaa ataccacgat 1320 atcattagcc gtccttctca tatctttcgc ctgtgcaacg acctggcaag cgcgtccgca 1380 gagatcgcac gtggcgaaac cgctaactct gtttcctgct acatgcgcac caagggcatt 1440 tccgaagagc tggcaaccga gagcgtaatg aatctgatcg acgaaacctg taagaaaatg 1500 aacaaagaaa aactgggtgg ctccctgttc gctaaaccgt tcgtagagac tgctattaac 1560 ctggcacgtc agagccactg cacctaccac aatggtgacg cacatactag cccggatgaa 1620 ctgactcgta aacgtgtact gtctgttatc accgaaccga ttctgccgtt cgaacgttaa 1680 1680 <210> 7 <211> 559 <212> PRT <213> Poplus alba x tremula <400> 7 Met Cys Ser Val Ser Thr Glu Asn Val Ser Phe Thr Glu Thr Glu Thr 1 5 10 15 Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr Asp 20 25 30 Phe Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val Tyr Lys Asp 35 40 45 Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn Glu 50 55 60 Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln Arg 65 70 75 80 Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Arg Ala Leu Asp 85 90 95 Arg Phe Val Ser Ser Gly Gly Phe Asp Gly Val Thr Lys Thr Ser Leu 100 105 110 His Ala Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe Glu 115 120 125 Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn Phe 130 135 140 Leu Glu Asn Leu Lys Glu Asp Thr Lys Ala Ile Leu Ser Leu Tyr Glu 145 150 155 160 Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala Arg 165 170 175 Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile Gly 180 185 190 Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu Pro Leu His 195 200 205 Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu Ala Tyr Arg 210 215 220 Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala Ile Leu Asp 225 230 235 240 Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr Ser 245 250 255 Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala Lys 260 265 270 Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe Glu 275 280 285 Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser Phe 290 295 300 Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp Glu 305 310 315 320 Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala Ile 325 330 335 Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr Asn 340 345 350 Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys Gly Glu Asn 355 360 365 Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala Phe 370 375 380 Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe Asp 385 390 395 400 Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln Leu 405 410 415 Ile Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu Ile 420 425 430 Glu Asn Leu Gln Lys Tyr His Asp Ile Ile Ser Arg Pro Ser His Ile 435 440 445 Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala Arg 450 455 460 Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly Ile 465 470 475 480 Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu Thr 485 490 495 Cys Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala Lys 500 505 510 Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys Thr 515 520 525 Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg Lys 530 535 540 Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg 545 550 555 <210> 8 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 8 gagaaaatcg gtaaggaact gg 22 <210> 9 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 9 Leu Ala Ser Ala Ser Ala Glu Ile Ala Arg Gly Glu Thr 1 5 10 <210> 10 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 10 ctggaggaag aagttcgctc catgatcaac cgtgtagac 39 <210> 11 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 11 cgccagaccc gcagtttggt gaatctcgca aagctgttac taaaatg 47 <210> 12 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 12 cgccgtctta cttttccgta tcccagcagc aggaagacat c 41 <210> 13 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 13 catggtctgg tgcgttctag ctccgttatc ttccgcctgt gc 42 <210> 14 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 14 gatgtcttcc tgctgctggg atacggaaaa gtaagacggc g 41 <210> 15 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 15 gatcaagctt aaccggaatt gccagctg 28 <210> 16 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 16 gatccgatcg tcagaagaac tcgtcaagaa ggc 33 <210> 17 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 17 ccaaactgca cttcgctcgt gaccgcctga ttgag 35 <210> 18 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 18 atctttcgcc tgtgcgacga cctggcaagc 30 <210> 19 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 19 tgaatctgat cgacgaaacc tggaagaaaa tgaacaaaga aaaac 45 <210> 20 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 20 gatcatgcat tcgcccttag gaggtaaaaa aacatgtgtg cgacctcttc tcaatttact 60 60 <210> 21 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 21 cggtcgacgg atccctgcag ttagacatac atcagctg 38 <210> 22 <211> 5679 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (3895) <223> n = A,T,C or G <400> 22 aagggcgaat tctgcagata tccatcacac tggcggccgc tcgagcatgc atctagaggg 60 cccaattcgc cctatagtga gtcgtattac aattcactgg ccgtcgtttt acaacgtcgt 120 gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc 180 agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg 240 aatggcgaat ggacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc 300 gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt 360 cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag 420 ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt 480 cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt 540 tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt 600 cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt 660 aacaaaaatt taacgcgaat tttaacaaaa ttcagggcgc aagggctgct aaaggaagcg 720 gaacacgtag aaagccagtc cgcagaaacg gtgctgaccc cggatgaatg tcagctactg 780 ggctatctgg acaagggaaa acgcaagcgc aaagagaaag caggtagctt gcagtgggct 840 tacatggcga tagctagact gggcggtttt atggacagca agcgaaccgg aattgccagc 900 tggggcgccc tctggtaagg ttgggaagcc ctgcaaagta aactggatgg ctttcttgcc 960 gccaaggatc tgatggcgca ggggatcaag atctgatcaa gagacaggat gaggatcgtt 1020 tcgcatgatt gaacaagatg gattgcacgc aggttctccg gccgcttggg tggagaggct 1080 attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg tgttccggct 1140 gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg ccctgaatga 1200 actgcaggac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc cttgcgcagc 1260 tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg aagtgccggg 1320 gcaggatctc ctgtcatccc accttgctcc tgccgagaaa gtatccatca tggctgatgc 1380 aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc aagcgaaaca 1440 tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg atgatctgga 1500 cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg cgcgcatgcc 1560 cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata tcatggtgga 1620 aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg accgctatca 1680 ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat gggctgaccg 1740 cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct tctatcgcct 1800 tcttgacgag ttcttctgaa ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc 1860 gcccttattc ccttttttgc ggcattttgc cttcctgttt ttgctcaccc agaaacgctg 1920 gtgaaagtaa aagatgctga agatcagttg ggtgcacgag tgggttacat cgaactggat 1980 ctcaacagcg gtaagatcct tgagagtttt cgccccgaag aacgttttcc aatgatgagc 2040 acttttaaag ttctgctatg tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa 2100 ctcggtcgcc gcatacacta ttctcagaat gacttggttg agtactcacc agtcacagaa 2160 aagcatctta cggatggcat gacagtaaga gaattatgca gtgctgccat aaccatgagt 2220 gataacactg cggccaactt acttctgaca acgatcggag gaccgaagga gctaaccgct 2280 tttttgcaca acatggggga tcatgtaact cgccttgatc gttgggaacc ggagctgaat 2340 gaagccatac caaacgacga gcgtgacacc acgatgcctg tagcaatggc aacaacgttg 2400 cgcaaactat taactggcga actacttact ctagcttccc ggcaacaatt aatagactgg 2460 atggaggcgg ataaagttgc aggaccactt ctgcgctcgg cccttccggc tggctggttt 2520 attgctgata aatctggagc cggtgagcgt gggtctcgcg gtatcattgc agcactgggg 2580 ccagatggta agccctcccg tatcgtagtt atctacacga cggggagtca ggcaactatg 2640 gatgaacgaa atagacagat cgctgagata ggtgcctcac tgattaagca ttggtaactg 2700 tcagaccaag tttactcata tatactttag attgatttaa aacttcattt ttaatttaaa 2760 aggatctagg tgaagatcct ttttgataat ctcatgacca aaatccctta acgtgagttt 2820 tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt 2880 tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 2940 ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag 3000 ataccaaata ctgttcttct agtgtagccg tagttaggcc accacttcaa gaactctgta 3060 gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat 3120 aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg 3180 ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg 3240 agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac 3300 aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga 3360 aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt 3420 ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta 3480 cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat 3540 tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg cagccgaacg 3600 accgagcgca gcgagtcagt gagcgaggaa gcggaagagc gcccaatacg caaaccgcct 3660 ctccccgcgc gttggccgat tcattaatgc agctggcacg acaggtttcc cgactggaaa 3720 gcgggcagtg agcgcaacgc aattaatgtg agttagctca ctcattaggc accccaggct 3780 ttacacttta tgcttccggc tcgtatgttg tgtggaattg tgagcggata acaatttcac 3840 acaggaaaca gctatgacca tgattacgcc aagcttggta ccgagctcgg atccnctagt 3900 aacggccgcc agtgtgctgg aattcgccct tgatcatgca ttcgccctta ggaggtaaaa 3960 aaacatgtgt gcgacctctt ctcaatttac tcagattacc gagcataatt cccgtcgttc 4020 cgcaaactat cagccaaacc tgtggaattt cgaattcctg caatccctgg agaacgacct 4080 gaaagtggaa aagctggagg agaaagcgac caaactggag gaagaagttc gctgcatgat 4140 caaccgtgta gacacccagc cgctgtccct gctggagctg atcgacgatg tgcagcgcct 4200 gggtctgacc tacaaatttg aaaaagacat cattaaagcc ctggaaaaca tcgtactgct 4260 ggacgaaaac aaaaagaaca aatctgacct gcacgcaacc gctctgtctt tccgtctgct 4320 gcgtcagcac ggtttcgagg tttctcagga tgtttttgag cgtttcaagg ataaagaagg 4380 tggtttcagc ggtgaactga aaggtgacgt ccaaggcctg ctgagcctgt atgaagcgtc 4440 ttacctgggt ttcgagggtg agaacctgct ggaggaggcg cgtacctttt ccatcaccca 4500 cctgaagaac aacctgaaag aaggcattaa taccaaggtt gcagaacaag tgagccacgc 4560 cctggaactg ccatatcacc agcgtctgca ccgtctggag gcacgttggt tcctggataa 4620 atacgaaccg aaagaaccgc atcaccagct gctgctggag ctggcgaagc tggattttaa 4680 catggtacag accctgcacc agaaagagct gcaagatctg tcccgctggt ggaccgagat 4740 gggcctggct agcaaactgg attttgtacg cgaccgcctg atggaagttt atttctgggc 4800 actgggtatg gcgccagacc cgcagtttgg tgaatgtcgc aaagctgtta ctaaaatgtt 4860 tggtctggtg acgatcatcg atgacgtgta tgacgtttat ggcactctgg acgaactgca 4920 actgttcacc gatgctgtag agcgctggga cgttaacgct attaacaccc tgccggacta 4980 tatgaaactg tgtttcctgg cactgtacaa caccgttaac gacacgtcct attctattct 5040 gaaagagaaa ggtcataaca acctgtccta tctgacgaaa agctggcgtg aactgtgcaa 5100 agcctttctg caagaggcga aatggtccaa caacaaaatt atcccggctt tctccaagta 5160 cctggaaaac gccagcgttt cctcctccgg tgtagcgctg ctggcgccgt cttacttttc 5220 cgtatgccag cagcaggaag acatctccga ccacgcgctg cgttccctga ccgacttcca 5280 tggtctggtg cgttctagct gcgttatctt ccgcctgtgc aacgatctgg ccacctctgc 5340 ggcggagctg gaacgtggcg agactaccaa ttctatcatt agctacatgc acgaaaacga 5400 tggtaccagc gaggaacagg cccgcgaaga actgcgtaaa ctgatcgacg ccgaatggaa 5460 aaagatgaat cgtgaacgcg ttagcgactc caccctgctg cctaaagcgt tcatggaaat 5520 cgcagttaac atggcacgtg tttcccactg cacctaccag tatggcgatg gtctgggtcg 5580 cccagactac gcgactgaaa accgcatcaa actgctgctg attgaccctt tcccgattaa 5640 ccagctgatg tatgtctaac tgcagggatc cgtcgaccg 5679 <210> 23 <211> 6974 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 23 gtgcggccgc aagcttgtcg acggagctcg aattcggatc cctgcagtta gacatacatc 60 agctggttaa tcgggaaagg gtcaatcagc agcagtttga tgcggttttc agtcgcgtag 120 tctgggcgac ccagaccatc gccatactgg taggtgcagt gggaaacacg tgccatgtta 180 actgcgattt ccatgaacgc tttaggcagc agggtggagt cgctaacgcg ttcacgattc 240 atctttttcc attcggcgtc gatcagttta cgcagttctt cgcgggcctg ttcctcgctg 300 gtaccatcgt tttcgtgcat gtagctaatg atagaattgg tagtctcgcc acgttccagc 360 tccgccgcag aggtggccag atcgttgcac aggcggaaga taacgcagct agaacgcacc 420 agaccatgga agtcggtcag ggaacgcagc gcgtggtcgg agatgtcttc ctgctgctgg 480 catacggaaa agtaagacgg cgccagcagc gctacaccgg aggaggaaac gctggcgttt 540 tccaggtact tggagaaagc cgggataatt ttgttgttgg accatttcgc ctcttgcaga 600 aaggctttgc acagttcacg ccagcttttc gtcagatagg acaggttgtt atgacctttc 660 tctttcagaa tagaatagga cgtgtcgtta acggtgttgt acagtgccag gaaacacagt 720 ttcatatagt ccggcagggt gttaatagcg ttaacgtccc agcgctctac agcatcggtg 780 aacagttgca gttcgtccag agtgccataa acgtcataca cgtcatcgat gatcgtcacc 840 agaccaaaca ttttagtaac agctttgcga cattcaccaa actgcgggtc tggcgccata 900 cccagtgccc agaaataaac ttccatcagg cggtcgcgta caaaatccag tttgctagcc 960 aggcccatct cggtccacca gcgggacaga tcttgcagct ctttctggtg cagggtctgt 1020 accatgttaa aatccagctt cgccagctcc agcagcagct ggtgatgcgg ttctttcggt 1080 tcgtatttat ccaggaacca acgtgcctcc agacggtgca gacgctggtg atatggcagt 1140 tccagggcgt ggctcacttg ttctgcaacc ttggtattaa tgccttcttt caggttgttc 1200 ttcaggtggg tgatggaaaa ggtacgcgcc tcctccagca ggttctcacc ctcgaaaccc 1260 aggtaagacg cttcatacag gctcagcagg ccttggacgt cacctttcag ttcaccgctg 1320 aaaccacctt ctttatcctt gaaacgctca aaaacatcct gagaaacctc gaaaccgtgc 1380 tgacgcagca gacggaaaga cagagcggtt gcgtgcaggt cagatttgtt ctttttgttt 1440 tcgtccagca gtacgatgtt ttccagggct ttaatgatgt ctttttcaaa tttgtaggtc 1500 agacccaggc gctgcacatc gtcgatcagc tccagcaggg acagcggctg ggtgtctaca 1560 cggttgatca tgcagcgaac ttcttcctcc agtttggtcg ctttctcctc cagcttttcc 1620 actttcaggt cgttctccag ggattgcagg aattcgaaat tccacaggtt tggctgatag 1680 tttgcggaac gacgggaatt atgctcggta atctgagtaa attgagaaga ggtcgcacac 1740 atggtatatc tccttcttaa agttaaacaa aattatttct agaggggaat tgttatccgc 1800 tcacaattcc cctatagtga gtcgtattaa tttcgcggga tcgagatctc gatcctctac 1860 gccggacgca tcgtggccgg catcaccggc gccacaggtg cggttgctgg cgcctatatc 1920 gccgacatca ccgatgggga agatcgggct cgccacttcg ggctcatgag cgcttgtttc 1980 ggcgtgggta tggtggcagg ccccgtggcc gggggactgt tgggcgccat ctccttgcat 2040 gcaccattcc ttgcggcggc ggtgctcaac ggcctcaacc tactactggg ctgcttccta 2100 atgcaggagt cgcataaggg agagcgtcga gatcccggac accatcgaat ggcgcaaaac 2160 ctttcgcggt atggcatgat agcgcccgga agagagtcaa ttcagggtgg tgaatgtgaa 2220 accagtaacg ttatacgatg tcgcagagta tgccggtgtc tcttatcaga ccgtttcccg 2280 cgtggtgaac caggccagcc acgtttctgc gaaaacgcgg gaaaaagtgg aagcggcgat 2340 ggcggagctg aattacattc ccaaccgcgt ggcacaacaa ctggcgggca aacagtcgtt 2400 gctgattggc gttgccacct ccagtctggc cctgcacgcg ccgtcgcaaa ttgtcgcggc 2460 gattaaatct cgcgccgatc aactgggtgc cagcgtggtg gtgtcgatgg tagaacgaag 2520 cggcgtcgaa gcctgtaaag cggcggtgca caatcttctc gcgcaacgcg tcagtgggct 2580 gatcattaac tatccgctgg atgaccagga tgccattgct gtggaagctg cctgcactaa 2640 tgttccggcg ttatttcttg atgtctctga ccagacaccc atcaacagta ttattttctc 2700 ccatgaagac ggtacgcgac tgggcgtgga gcatctggtc gcattgggtc accagcaaat 2760 cgcgctgtta gcgggcccat taagttctgt ctcggcgcgt ctgcgtctgg ctggctggca 2820 taaatatctc actcgcaatc aaattcagcc gatagcggaa cgggaaggcg actggagtgc 2880 catgtccggt tttcaacaaa ccatgcaaat gctgaatgag ggcatcgttc ccactgcgat 2940 gctggttgcc aacgatcaga tggcgctggg cgcaatgcgc gccattaccg agtccgggct 3000 gcgcgttggt gcggatatct cggtagtggg atacgacgat accgaagaca gctcatgtta 3060 tatcccgccg ttaaccacca tcaaacagga ttttcgcctg ctggggcaaa ccagcgtgga 3120 ccgcttgctg caactctctc agggccaggc ggtgaagggc aatcagctgt tgcccgtctc 3180 actggtgaaa agaaaaacca ccctggcgcc caatacgcaa accgcctctc cccgcgcgtt 3240 ggccgattca ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc 3300 gcaacgcaat taatgtaagt tagctcactc attaggcacc gggatctcga ccgatgccct 3360 tgagagcctt caacccagtc agctccttcc ggtgggcgcg gggcatgact atcgtcgccg 3420 cacttatgac tgtcttcttt atcatgcaac tcgtaggaca ggtgccggca gcgctctggg 3480 tcattttcgg cgaggaccgc tttcgctgga gcgcgacgat gatcggcctg tcgcttgcgg 3540 tattcggaat cttgcacgcc ctcgctcaag ccttcgtcac tggtcccgcc accaaacgtt 3600 tcggcgagaa gcaggccatt atcgccggca tggcggcccc acgggtgcgc atgatcgtgc 3660 tcctgtcgtt gaggacccgg ctaggctggc ggggttgcct tactggttag cagaatgaat 3720 caccgatacg cgagcgaacg tgaagcgact gctgctgcaa aacgtctgcg acctgagcaa 3780 caacatgaat ggtcttcggt ttccgtgttt cgtaaagtct ggaaacgcgg aagtcagcgc 3840 cctgcaccat tatgttccgg atctgcatcg caggatgctg ctggctaccc tgtggaacac 3900 ctacatctgt attaacgaag cgctggcatt gaccctgagt gatttttctc tggtcccgcc 3960 gcatccatac cgccagttgt ttaccctcac aacgttccag taaccgggca tgttcatcat 4020 cagtaacccg tatcgtgagc atcctctctc gtttcatcgg tatcattacc cccatgaaca 4080 gaaatccccc ttacacggag gcatcagtga ccaaacagga aaaaaccgcc cttaacatgg 4140 cccgctttat cagaagccag acattaacgc ttctggagaa actcaacgag ctggacgcgg 4200 atgaacaggc agacatctgt gaatcgcttc acgaccacgc tgatgagctt taccgcagct 4260 gcctcgcgcg tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg 4320 tcacagcttg tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg 4380 gtgttggcgg gtgtcggggc gcagccatga cccagtcacg tagcgatagc ggagtgtata 4440 ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata tatgcggtgt 4500 gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgctcttc cgcttcctcg 4560 ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag 4620 gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa 4680 ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 4740 cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 4800 ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 4860 accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 4920 catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 4980 gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 5040 tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 5100 agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 5160 actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga 5220 gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 5280 aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 5340 gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gaacaataaa 5400 actgtctgct tacataaaca gtaatacaag gggtgttatg agccatattc aacgggaaac 5460 gtcttgctct aggccgcgat taaattccaa catggatgct gatttatatg ggtataaatg 5520 ggctcgcgat aatgtcgggc aatcaggtgc gacaatctat cgattgtatg ggaagcccga 5580 tgcgccagag ttgtttctga aacatggcaa aggtagcgtt gccaatgatg ttacagatga 5640 gatggtcaga ctaaactggc tgacggaatt tatgcctctt ccgaccatca agcattttat 5700 ccgtactcct gatgatgcat ggttactcac cactgcgatc cccgggaaaa cagcattcca 5760 ggtattagaa gaatatcctg attcaggtga aaatattgtt gatgcgctgg cagtgttcct 5820 gcgccggttg cattcgattc ctgtttgtaa ttgtcctttt aacagcgatc gcgtatttcg 5880 tctcgctcag gcgcaatcac gaatgaataa cggtttggtt gatgcgagtg attttgatga 5940 cgagcgtaat ggctggcctg ttgaacaagt ctggaaagaa atgcataaac ttttgccatt 6000 ctcaccggat tcagtcgtca ctcatggtga tttctcactt gataacctta tttttgacga 6060 ggggaaatta ataggttgta ttgatgttgg acgagtcgga atcgcagacc gataccagga 6120 tcttgccatc ctatggaact gcctcggtga gttttctcct tcattacaga aacggctttt 6180 tcaaaaatat ggtattgata atcctgatat gaataaattg cagtttcatt tgatgctcga 6240 tgagtttttc taagaattaa ttcatgagcg gatacatatt tgaatgtatt tagaaaaata 6300 aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgaaatt gtaaacgtta 6360 atattttgtt aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg 6420 ccgaaatcgg caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtgttg 6480 ttccagtttg gaacaagagt ccactattaa agaacgtgga ctccaacgtc aaagggcgaa 6540 aaaccgtcta tcagggcgat ggcccactac gtgaaccatc accctaatca agttttttgg 6600 ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg gagcccccga tttagagctt 6660 gacggggaaa gccggcgaac gtggcgagaa aggaagggaa gaaagcgaaa ggagcgggcg 6720 ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc gccgcgctta 6780 atgcgccgct acagggcgcg tcccattcgc caatccggat atagttcctc ctttcagcaa 6840 aaaacccctc aagacccgtt tagaggcccc aaggggttat gctagttatt gctcagcggt 6900 ggcagcagcc aactcagctt cctttcgggc tttgttagca gccggatctc agtggtggtg 6960 gtggtggtgc tcga 6974 <210> 24 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (19)..(20) <223> n = A,T,C or G <400> 24 cataattccc gtcgttccnn saactatcag ccaaacctg 39 <210> 25 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (22)..(23) <223> n = A,T,C or G <400> 25 cataattccc gtcgttccgc annstatcag ccaaacctgt g 41 <210> 26 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (18)..(19) <223> n = A,T,C or G <400> 26 cccgtcgttc cgcaaacnns cagccaaacc tgtggaattt c 41 <210> 27 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (18)..(19) <223> n = A,T,C or G <400> 27 gtcgttccgc aaactatnns ccaaacctgt ggaatttc 38 <210> 28 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (19)..(20) <223> n = A,T,C or G <400> 28 ctggattttg tacgcgacnn sctgatggaa gtttatttc 39 <210> 29 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (19)..(20) <223> n = A,T,C or G <400> 29 ctgatggaag tttatttcnn sgcactgggt atggcgcc 38 <210> 30 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (20)..(21) <223> n = A,T,C or G <400> 30 caaagctgtt actaaaatgn nsggtctggt gacgatcatc 40 <210> 31 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (18)..(19) <223> n = A,T,C or G <400> 31 ctaaaatgtt tggtctgnns acgatcatcg atgacgtg 38 <210> 32 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (22)..(23) <223> n = A,T,C or G <400> 32 gaaaacgcca gcgtttcctc cnnsggtgta gcgctgctgg c 41 <210> 33 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 33 caccatgcgt tgtagcgtgt cca 23 <210> 34 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 34 gggcccgttt aaactttaac tagactctgc agttagcgtt caaacggcag aa 52 <210> 35 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 35 gaaggagata tacatatgag cgtgtccacc gaaaatg 37 <210> 36 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 36 cattttcggt ggacacgctc atatgtatat ctccttc 37 <210> 37 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 37 gaaggagata tacatatggt gtccaccgaa aatgtgtc 38 <210> 38 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 38 gacacatttt cggtggacac catatgtata tctccttc 38 <210> 39 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 39 gaaggagata tacatatgac cgaaaatgtg tctttcac 38 <210> 40 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 40 gtgaaagaca cattttcggt catatgtata tctccttc 38 <210> 41 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 41 gaaggagata tacatatgaa tgtgtctttc accgaaac 38 <210> 42 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 42 gtttcggtga aagacacatt catatgtata tctccttc 38 <210> 43 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 43 gaaggagata tacatatgga agctcgtcgt tctgcg 36 <210> 44 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 44 cgcagaacga cgagcttcca tatgtatatc tccttc 36 <210> 45 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 45 gaaggagata tacatatgcg ttgtagcgtg 30 <210> 46 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 46 cccgcgctta ctcgaggccc tgaaaataca ggttttcgcg ttcaaacggc agaatcggtt 60 60 <210> 47 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 47 gaaactgaaa cccatatgga agctcgtcgt tctgc 35 <210> 48 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 48 gcatgctcga gcggccgctt ttaatcaaac atcctgccaa ctc 43 <210> 49 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 49 gatcgaaggg cgatcgtgtc acagtctggc gaaaccg 37 <210> 50 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 50 ctgaattctg cagatatctg tttttccact cttcgttcac ttt 43 <210> 51 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 51 tctagagggc ccaagaaaaa tgccccgctt acg 33 <210> 52 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 52 gatcgcggcc gcgcccttga cgatgccaca tcctgagcaa ataattcaac cactaattgt 60 gagcggataa cacaaggagg aaacagctat gtcattaccg ttcttaactt c 111 <210> 53 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 53 gatcgggccc caagaaaaaa ggcacgtcat ctgacgtgcc ttttttattt gtagacgcgt 60 tgttatagca ttcta 75 <210> 54 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 54 aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaagcaa 60 ttaaccctca ctaaagggcg g 81 <210> 55 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 55 agagtgttca ccaaaaataa taacctttcc cggtgcagaa gttaagaacg gtaatgacat 60 agctgtttcc tccttgtgtt atccgctcac aattagtggt tgaattattt gctcaggatg 120 tggcatcgtc aagggctaat acgactcact atagggctcg 160 <210> 56 <211> 445 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 56 aaagaccgac caagcgacgt ctgagagctc cctggcgaat tcggtaccaa taaaagagct 60 ttattttcat gatctgtgtg ttggtttttg tgtgcggcgc ggaagttcct attctctaga 120 aagtatagga acttcctcga gccctatagt gagtcgtatt aaattcatat aaaaaacata 180 cagataacca tctgcggtga taaattatct ctggcggtgt tgacataaat accactggcg 240 gtgatactga gcacatcagc aggacgcact gaccaccatg aaggtgcaaa ggaggtaaaa 300 aaacatggta tcctgttctg cgccgggtaa gatttacctg ttcggtgaac acgccgtagt 360 ttatggcgaa actgcaattg cgtgtgcggt ggaactgcgt acccgtgttc gcgcggaact 420 caatgactct atcactattc agagc 445 <210> 57 <211> 445 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 57 aaagaccgac caagcgacgt ctgagagctc cctggcgaat tcggtaccaa taaaagagct 60 ttattttcat gatctgtgtg ttggtttttg tgtgcggcgc ggaagttcct attctctaga 120 aagtatagga acttcctcga gccctatagt gagtcgtatt aaattcatat aaaaaacata 180 cagataacca tctgcggtga taaattatct ctggcggtgt tgacctaaat accactggcg 240 gtgatactga gcacatcagc aggacgcact gaccaccatg aaggtgcaaa ggaggtaaaa 300 aaacatggta tcctgttctg cgccgggtaa gatttacctg ttcggtgaac acgccgtagt 360 ttatggcgaa actgcaattg cgtgtgcggt ggaactgcgt acccgtgttc gcgcggaact 420 caatgactct atcactattc agagc 445 <210> 58 <211> 442 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 58 aaagaccgac caagcgacgt ctgagagctc cctggcgaat tcggtaccaa taaaagagct 60 ttattttcat gatctgtgtg ttggtttttg tgtgcggcgc ggaagttcct attctctaga 120 aagtatagga acttcctcga gccctatagt gagtcgtatt aaattcatat aaaaaacata 180 cagataacca tctgcggtga taaattatct ctggcggtgt tgacctaaat accactggcg 240 gtgatactga gcacatcagc aggacgcact gaccaccatg aaggtgcaaa ggtaaaaaaa 300 catggtatcc tgttctgcgc cgggtaagat ttacctgttc ggtgaacacg ccgtagttta 360 tggcgaaact gcaattgcgt gtgcggtgga actgcgtacc cgtgttcgcg cggaactcaa 420 tgactctatc actattcaga gc 442 <210> 59 <211> 445 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 59 aaagaccgac caagcgacgt ctgagagctc cctggcgaat tcggtaccaa taaaagagct 60 ttattttcat gatctgtgtg ttggtttttg tgtgcggcgc ggaagttcct attctctaga 120 aagtatagga acttcctcga gccctatagt gagtcgtatt aaattcatat aaaaaacata 180 cagataacca tctgcggtga taaattatct ctggcggtgt tgacgtaaat accactggcg 240 gtgatactga gcacatcagc aggacgcact gaccaccatg aaggtgcaaa ggaggtaaaa 300 aaacatggta tcctgttctg cgccgggtaa gatttacctg ttcggtgaac acgccgtagt 360 ttatggcgaa actgcaattg cgtgtgcggt ggaactgcgt acccgtgttc gcgcggaact 420 caatgactct atcactattc agagc 445 <210> 60 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 60 aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaagcaa 60 ttaaccctca ctaaagggcg g 81 <210> 61 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 61 gctctgaata gtgatagagt ca 22 <210> 62 <211> 199 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (112) <223> n = A,T,C or G <400> 62 taaatcttac ccggcgcaga acaggatacc atgttttttt acctcctttg caccttcatg 60 gtggtcagtg cgtcctgctg atgtgctcag tatcaccgcc agtggtattt angtcaacac 120 cgccagagat aatttatcac cgcagatggt tatctgtatg ttttttatat gaatttaata 180 cgactcacta tagggctcg 199 <210> 63 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 63 aaagaccgac caagcgacgt ctga 24 <210> 64 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 64 caccatggta tcctgttctg cg 22 <210> 65 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 65 ttaatctact ttcagacctt gc 22 <210> 66 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 66 aggaggtggt ctcaaatgac tgccgacaac aatagta 37 <210> 67 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 67 aggaggtggt ctcagcgctc tgcagttata gcattctatg aatttgcctg 50 <210> 68 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (16)..(17) <223> n = A,T,C or G <400> 68 gaaaaagcag aatttnnkac cctgctggaa ctg 33 <210> 69 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (17)..(18) <223> n = A,T,C or G <400> 69 cagttccagc agggtmnnaa attctgcttt ttc 33 <210> 70 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (16)..(17) <223> n = A,T,C or G <400> 70 gagtctgata tccgtnnkgc gctggatcgc ttc 33 <210> 71 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (17)..(18) <223> n = A,T,C or G <400> 71 gaagcgatcc agcgcmnnac ggatatcaga ctc 33 <210> 72 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (16)..(17) <223> n = A,T,C or G <400> 72 tcccgttggt ggcgtnnkgt gggtctggcg acc 33 <210> 73 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (17)..(18) <223> n = A,T,C or G <400> 73 ggtcgccaga cccacmnnac gccaccaacg gga 33 <210> 74 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (16)..(17) <223> n = A,T,C or G <400> 74 tccgtcgcaa aaatgnnktc tttcgtaacc att 33 <210> 75 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (17)..(18) <223> n = A,T,C or G <400> 75 aatggttacg aaagamnnca tttttgcgac gga 33 <210> 76 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (16)..(17) <223> n = A,T,C or G <400> 76 gcaaaaatgt tttctnnkgt aaccattatc gac 33 <210> 77 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (17)..(18) <223> n = A,T,C or G <400> 77 gtcgataatg gttacmnnag aaaacatttt tgc 33 <210> 78 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (16)..(17) <223> n = A,T,C or G <400> 78 aaaatgtttt ctttcnnkac cattatcgac gat 33 <210> 79 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (17)..(18) <223> n = A,T,C or G <400> 79 atcgtcgata atggtmnnga aagaaaacat ttt 33 <210> 80 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (16)..(17) <223> n = A,T,C or G <400> 80 gacctgtgca acgctnnkct gcaagaagcc aag 33 <210> 81 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (17)..(18) <223> n = A,T,C or G <400> 81 cttggcttct tgcagmnnag cgttgcacag gtc 33 <210> 82 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (16)..(17) <223> n = A,T,C or G <400> 82 gcatggaaat cctctnnkgg cccgctgcaa ctg 33 <210> 83 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (17)..(18) <223> n = A,T,C or G <400> 83 cagttgcagc gggccmnnag aggatttcca tgc 33 <210> 84 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (16)..(17) <223> n = A,T,C or G <400> 84 tcttctggcc cgctgnnkct ggtgttcgct tac 33 <210> 85 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (17)..(18) <223> n = A,T,C or G <400> 85 gtaagcgaac accagmnnca gcgggccaga aga 33 <210> 86 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (16)..(17) <223> n = A,T,C or G <400> 86 ggcccgctgc aactgnnktt cgcttacttc gct 33 <210> 87 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (17)..(18) <223> n = A,T,C or G <400> 87 agcgaagtaa gcgaamnnca gttgcagcgg gcc 33 <210> 88 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (16)..(17) <223> n = A,T,C or G <400> 88 caaaaatacc atgacnnkat ctctcgtcct tcc 33 <210> 89 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (17)..(18) <223> n = A,T,C or G <400> 89 ggaaggacga gagatmnngt catggtattt ttg 33 <210> 90 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (16)..(17) <223> n = A,T,C or G <400> 90 cgtccttccc atatcnnkcg tctgtgcaat gac 33 <210> 91 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (17)..(18) <223> n = A,T,C or G <400> 91 gtcattgcac agacgmnnga tatgggaagg acg 33 <210> 92 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 92 gaaggagata tacatatgac cgaagctcgt cgt 33 <210> 93 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 93 acgacgagct tcggtcatat gtatatctcc ttc 33 <210> 94 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 94 gaaggagata tacatatgga aaccgaagct cgt 33 <210> 95 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 95 acgagcttcg gtttccatat gtatatctcc ttc 33 <210> 96 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 96 gaaggagata tacatatgac tgaaaccgaa gct 33 <210> 97 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 97 agcttcggtt tcagtcatat gtatatctcc ttc 33 <210> 98 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 98 gaaggagata tacatatgga aactgaaacc gaa 33 <210> 99 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 99 ttcggtttca gtttccatat gtatatctcc ttc 33 <210> 100 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 100 gaaggagata tacatatgac cgaaactgaa acc 33 <210> 101 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 101 ggtttcagtt tcggtcatat gtatatctcc ttc 33 <210> 102 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 102 agaaggagat ataccatgga agctcgtcgt tccgcaaac 39 <210> 103 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 103 gtttgcggaa cgacgagctt ccatggtata tctccttct 39 <210> 104 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 104 agaaggagat ataccatgga gcataattcc cgt 33 <210> 105 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 105 acgggaatta tgctccatgg tatatctcct tct 33 <210> 106 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 106 gaaggagata tacatatgga aacgcgtcgt tct 33 <210> 107 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 107 agaacgacgc gtttccatat gtatatctcc ttc 33 <210> 108 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 108 cggtgaactg aaaggtgacg tcc 23 <210> 109 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 109 ggacgttaac gctattaaca ccctg 25 <210> 110 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 110 cacatcgtcg atcagctcca gc 22 <210> 111 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 111 ggtcgtcaga ctgtcgatga agcc 24 <210> 112 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 112 gcttatgaat tctgtgcgac ctcttctcaa tttactcag 39 <210> 113 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 113 gcttataagc ttagacatac atcagctggt taatcggg 38 <210> 114 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 114 ctcctccagc aggttctcac c 21 <210> 115 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 115 gggcccgttt aaactttaac tagactctgc agttagcgtt caaacggcag aa 52 <210> 116 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 116 caccatgcgt cgttctgcga actac 25 <210> 117 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 117 caccatgcgt cgttctgcga actac 25 <210> 118 <211> 596 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 118 Met Arg Gly Ser His His His His His His Gly Met Ala Ser Met Thr 1 5 10 15 Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys Asp 20 25 30 His Pro Phe Thr Met Arg Cys Ser Val Ser Thr Glu Asn Val Ser Phe 35 40 45 Thr Glu Thr Glu Thr Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn 50 55 60 Ser Trp Asp Tyr Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile 65 70 75 80 Glu Val Tyr Lys Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg 85 90 95 Glu Ile Asn Asn Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile 100 105 110 Asp Asn Val Gln Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile 115 120 125 Arg Gly Ala Leu Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val 130 135 140 Thr Lys Thr Ser Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg 145 150 155 160 Gln His Gly Phe Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp 165 170 175 Gln Asn Gly Asn Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile 180 185 190 Leu Ser Leu Tyr Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile 195 200 205 Leu Asp Glu Ala Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser 210 215 220 Glu Glu Lys Ile Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu 225 230 235 240 Glu Leu Pro Leu His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser 245 250 255 Ile Glu Ala Tyr Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu 260 265 270 Leu Ala Ile Leu Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp 275 280 285 Leu Arg Glu Thr Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys 290 295 300 Leu His Phe Ala Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val 305 310 315 320 Gly Val Ala Phe Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala 325 330 335 Lys Met Phe Ser Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr 340 345 350 Gly Thr Leu Asp Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp 355 360 365 Asp Val Asn Ala Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe 370 375 380 Leu Ala Leu Tyr Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys 385 390 395 400 Asp Lys Gly Glu Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp 405 410 415 Leu Cys Asn Ala Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser 420 425 430 Thr Pro Thr Phe Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser 435 440 445 Gly Pro Leu Gln Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile 450 455 460 Lys Lys Glu Glu Ile Glu Asn Leu Gln Lys Tyr His Asp Thr Ile Ser 465 470 475 480 Arg Pro Ser His Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser 485 490 495 Ala Glu Ile Ala Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met 500 505 510 Arg Thr Lys Gly Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn 515 520 525 Leu Ile Asp Glu Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly 530 535 540 Ser Leu Phe Ala Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg 545 550 555 560 Gln Ser His Cys Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp 565 570 575 Glu Leu Thr Arg Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu 580 585 590 Pro Phe Glu Arg 595 <210> 119 <211> 7424 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 119 aagggcgagc tcaacgatcc ggctgctaac aaagcccgaa aggaagctga gttggctgct 60 gccaccgctg agcaataact agcataaccc cttggggcct ctaaacgggt cttgaggagt 120 tttttgctga aaggaggaac tatatccgga tatcccgcaa gaggcccggc agtaccggca 180 taaccaagcc tatgcctaca gcatccaggg tgacggtgcc gaggatgacg atgagcgcat 240 tgttagattt catacacggt gcctgactgc gttagcaatt taactgtgat aaactaccgc 300 attaaagctt atcgatgata agctgtcaaa catgagaatt aattcttgaa gacgaaaggg 360 cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 420 aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 480 ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 540 aaggaagagt atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga 600 gaggctattc ggctatgact gggcacaact gacaatcggc tgctctgatg ccgccgtgtt 660 ccggctgtca gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct 720 gaatgaactg caggacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg 780 cgcagctgtg ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt 840 gccggggcag gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc 900 tgatgcaatg cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc 960 gaaacatcgc atcgagcggg cacgtactcg gatggaagcc ggtcttgtcg atcaggatga 1020 tctggacgaa gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg 1080 catgcccgac ggcgaggatc tcgtcgtgac acatggcgat gcctgcttgc cgaatatcat 1140 ggtggaaaat ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg 1200 ctatcaggac atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc 1260 tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta 1320 tcgccttctt gacgagttct tctgagcggg actctggggt tcgaaatgac cgaccaagcg 1380 acgcctaact gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt 1440 tttaatttaa aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt 1500 aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt 1560 gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag 1620 cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta actggcttca 1680 gcagagcgca gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca 1740 agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg 1800 ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg 1860 cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct 1920 acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga 1980 gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc 2040 ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg 2100 agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg 2160 cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt 2220 tatcccctga ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc 2280 gcagccgaac gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcctgatgc 2340 ggtattttct ccttacgcat ctgtgcggta tttcacaccg caatggtgca ctctcagtac 2400 aatctgctct gatgccgcat agttaagcca gtatacactc cgctatcgct acgtgactgg 2460 gtcatggctg cgccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 2520 ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 2580 ttttcaccgt catcaccgaa acgcgcgagg cagctgcggt aaagctcatc agcgtggtcg 2640 tgaagcgatt cacagatgtc tgcctgttca tccgcgtcca gctcgttgag tttctccaga 2700 agcgttaatg tctggcttct gataaagcgg gccatgttaa gggcggtttt ttcctgtttg 2760 gtcactgatg cctccgtgta agggggattt ctgttcatgg gggtaatgat accgatgaaa 2820 cgagagagga tgctcacgat acgggttact gatgatgaac atgcccggtt actggaacgt 2880 tgtgagggta aacaactggc ggtatggatg cggcgggacc agagaaaaat cactcagggt 2940 caatgccagc gcttcgttaa tacagatgta ggtgttccac agggtagcca gcagcatcct 3000 gcgatgcaga tccggaacat aatggtgcag ggcgctgact tccgcgtttc cagactttac 3060 gaaacacgga aaccgaagac cattcatgtt gttgctcagg tcgcagacgt tttgcagcag 3120 cagtcgcttc acgttcgctc gcgtatcggt gattcattct gctaaccagt aaggcaaccc 3180 cgccagccta gccgggtcct caacgacagg agcacgatca tgcgcacccg tggccaggac 3240 ccaacgctgc ccgagatgcg ccgcgtgcgg ctgctggaga tggcggacgc gatggatatg 3300 ttctgccaag ggttggtttg cgcattcaca gttctccgca agaattgatt ggctccaatt 3360 cttggagtgg tgaatccgtt agcgaggtgc cgccggcttc cattcaggtc gaggtggccc 3420 ggctccatgc accgcgacgc aacgcgggga ggcagacaag gtatagggcg gcgcctacaa 3480 tccatgccaa cccgttccat gtgctcgccg aggcggcata aatcgccgtg acgatcagcg 3540 gtccaatgat cgaagttagg ctggtaagag ccgcgagcga tccttgaagc tgtccctgat 3600 ggtcgtcatc tacctgcctg gacagcatgg cctgcaacgc gggcatcccg atgccgccgg 3660 aagcgagaag aatcataatg gggaaggcca tccagcctcg cgtcgcgaac gccagcaaga 3720 cgtagcccag cgcgtcggcc gccatgccgg cgataatggc ctgcttctcg ccgaaacgtt 3780 tggtggcggg accagtgacg aaggcttgag cgagggcgtg caagattccg aataccgcaa 3840 gcgacaggcc gatcatcgtc gcgctccagc gaaagcggtc ctcgccgaaa atgacccaga 3900 gcgctgccgg cacctgtcct acgagttgca tgataaagaa gacagtcata agtgcggcga 3960 cgatagtcat gccccgcgcc caccggaagg agctgactgg gttgaaggct ctcaagggca 4020 tcggtcgaga tcccggtgcc taatgagtga gctaacttac attaattgcg ttgcgctcac 4080 tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 4140 cggggagagg cggtttgcgt attgggcgcc agggtggttt ttcttttcac cagtgagacg 4200 ggcaacagct gattgccctt caccgcctgg ccctgagaga gttgcagcaa gcggtccacg 4260 ctggtttgcc ccagcaggcg aaaatcctgt ttgatggtgg ttaacggcgg gatataacat 4320 gagctgtctt cggtatcgtc gtatcccact accgagatat ccgcaccaac gcgcagcccg 4380 gactcggtaa tggcgcgcat tgcgcccagc gccatctgat cgttggcaac cagcatcgca 4440 gtgggaacga tgccctcatt cagcatttgc atggtttgtt gaaaaccgga catggcactc 4500 cagtcgcctt cccgttccgc tatcggctga atttgattgc gagtgagata tttatgccag 4560 ccagccagac gcagacgcgc cgagacagaa cttaatgggc ccgctaacag cgcgatttgc 4620 tggtgaccca atgcgaccag atgctccacg cccagtcgcg taccgtcttc atgggagaaa 4680 ataatactgt tgatgggtgt ctggtcagag acatcaagaa ataacgccgg aacattagtg 4740 caggcagctt ccacagcaat ggcatcctgg tcatccagcg gatagttaat gatcagccca 4800 ctgacgcgtt gcgcgagaag attgtgcacc gccgctttac aggcttcgac gccgcttcgt 4860 tctaccatcg acaccaccac gctggcaccc agttgatcgg cgcgagattt aatcgccgcg 4920 acaatttgcg acggcgcgtg cagggccaga ctggaggtgg caacgccaat cagcaacgac 4980 tgtttgcccg ccagttgttg tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc 5040 gcttccactt tttcccgcgt tttcgcagaa acgtggctgg cctggttcac cacgcgggaa 5100 acggtctgat aagagacacc ggcatactct gcgacatcgt ataacgttac tggtttcaca 5160 ttcaccaccc tgaattgact ctcttccggg cgctatcatg ccataccgcg aaaggttttg 5220 cgccattcga tggtgtccgg gatctcgacg ctctccctta tgcgactcct gcattaggaa 5280 gcagcccagt agtaggttga ggccgttgag caccgccgcc gcaaggaatg gtgcatgcaa 5340 ggagatggcg cccaacagtc ccccggccac ggggcctgcc accataccca cgccgaaaca 5400 agcgctcatg agcccgaagt ggcgagcccg atcttcccca tcggtgatgt cggcgatata 5460 ggcgccagca accgcacctg tggcgccggt gatgccggcc acgatgcgtc cggcgtagag 5520 gatcgagatc tcgatcccgc gaaattaata cgactcacta taggggaatt gtgagcggat 5580 aacaattccc ctctagaaat aattttgttt aactttaaga aggagatata catatgcggg 5640 gttctcatca tcatcatcat catggtatgg ctagcatgac tggtggacag caaatgggtc 5700 gggatctgta cgacgatgac gataaggatc atcccttcac catgcgttgt agcgtgtcca 5760 ccgaaaatgt gtctttcacc gaaactgaaa ccgaagctcg tcgttctgcg aactacgaac 5820 ctaacagctg ggactatgat tacctgctgt cctccgacac ggacgagtcc atcgaagtat 5880 acaaagacaa agcgaaaaag ctggaagccg aagttcgtcg cgagattaat aacgaaaaag 5940 cagaatttct gaccctgctg gaactgattg acaacgtcca gcgcctgggc ctgggttacc 6000 gtttcgagtc tgatatccgt ggtgcgctgg atcgcttcgt ttcctccggc ggcttcgatg 6060 cggtaaccaa gacttccctg cacggtacgg cactgtcttt ccgtctgctg cgtcaacacg 6120 gttttgaggt ttctcaggaa gcgttcagcg gcttcaaaga ccaaaacggc aacttcctgg 6180 agaacctgaa ggaagatatc aaagctatcc tgagcctgta cgaggccagc ttcctggctc 6240 tggaaggcga aaacatcctg gacgaggcga aggttttcgc aatctctcat ctgaaagaac 6300 tgtctgaaga aaagatcggt aaagagctgg cagaacaggt gaaccatgca ctggaactgc 6360 cactgcatcg ccgtactcag cgtctggaag cagtatggtc tatcgaggcc taccgtaaaa 6420 aggaggacgc gaatcaggtt ctgctggagc tggcaattct ggattacaac atgatccagt 6480 ctgtatacca gcgtgatctg cgtgaaacgt cccgttggtg gcgtcgtgtg ggtctggcga 6540 ccaaactgca ctttgctcgt gaccgcctga ttgagagctt ctactgggcc gtgggtgtag 6600 cattcgaacc gcaatactcc gactgccgta actccgtcgc aaaaatgttt tctttcgtaa 6660 ccattatcga cgatatctac gatgtatacg gcaccctgga cgaactggag ctgtttactg 6720 atgcagttga gcgttgggac gtaaacgcca tcaacgacct gccggattac atgaaactgt 6780 gctttctggc tctgtataac actattaacg aaatcgccta cgacaacctg aaagataaag 6840 gtgagaacat cctgccgtat ctgaccaaag cctgggctga cctgtgcaac gctttcctgc 6900 aagaagccaa gtggctgtac aacaaatcta ctccgacctt tgacgactac ttcggcaacg 6960 catggaaatc ctcttctggc ccgctgcaac tggtgttcgc ttacttcgct gtcgtgcaga 7020 acattaaaaa ggaagagatc gaaaacctgc aaaaatacca tgacaccatc tctcgtcctt 7080 cccatatctt ccgtctgtgc aatgacctgg ctagcgcgtc tgcggaaatt gcgcgtggtg 7140 aaaccgcaaa tagcgtttct tgttacatgc gcactaaagg tatctccgaa gaactggcta 7200 ccgaaagcgt gatgaatctg atcgatgaaa cctggaaaaa gatgaacaag gaaaaactgg 7260 gtggtagcct gttcgcgaaa ccgttcgtgg aaaccgcgat caacctggca cgtcaatctc 7320 actgcactta tcataacggc gacgcgcata cctctccgga tgagctgacc cgcaaacgcg 7380 ttctgtctgt aatcactgaa ccgattctgc cgtttgaacg ctaa 7424 <210> 120 <211> 560 <212> PRT <213> Poplus alba v tremula <400> 120 Met Arg Cys Ser Val Ser Thr Glu Asn Val Ser Phe Thr Glu Thr Glu 1 5 10 15 Thr Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr 20 25 30 Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val Tyr Lys 35 40 45 Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn 50 55 60 Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln 65 70 75 80 Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Gly Ala Leu 85 90 95 Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys Thr Ser 100 105 110 Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe 115 120 125 Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn 130 135 140 Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu Tyr 145 150 155 160 Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala 165 170 175 Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile 180 185 190 Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu Pro Leu 195 200 205 His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu Ala Tyr 210 215 220 Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala Ile Leu 225 230 235 240 Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr 245 250 255 Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala 260 265 270 Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe 275 280 285 Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser 290 295 300 Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp 305 310 315 320 Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala 325 330 335 Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr 340 345 350 Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys Gly Glu 355 360 365 Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala 370 375 380 Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe 385 390 395 400 Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln 405 410 415 Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu 420 425 430 Ile Glu Asn Leu Gln Lys Tyr His Asp Thr Ile Ser Arg Pro Ser His 435 440 445 Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala 450 455 460 Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly 465 470 475 480 Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu 485 490 495 Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala 500 505 510 Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys 515 520 525 Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg 530 535 540 Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg 545 550 555 560 <210> 121 <211> 6957 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 121 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980 aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040 ttttgtttaa ctttaagaag gagatataca tatgcgttgt agcgtgtcca ccgaaaatgt 5100 gtctttcacc gaaactgaaa ccgaagctcg tcgttctgcg aactacgaac ctaacagctg 5160 ggactatgat tacctgctgt cctccgacac ggacgagtcc atcgaagtat acaaagacaa 5220 agcgaaaaag ctggaagccg aagttcgtcg cgagattaat aacgaaaaag cagaatttct 5280 gaccctgctg gaactgattg acaacgtcca gcgcctgggc ctgggttacc gtttcgagtc 5340 tgatatccgt ggtgcgctgg atcgcttcgt ttcctccggc ggcttcgatg cggtaaccaa 5400 gacttccctg cacggtacgg cactgtcttt ccgtctgctg cgtcaacacg gttttgaggt 5460 ttctcaggaa gcgttcagcg gcttcaaaga ccaaaacggc aacttcctgg agaacctgaa 5520 ggaagatatc aaagctatcc tgagcctgta cgaggccagc ttcctggctc tggaaggcga 5580 aaacatcctg gacgaggcga aggttttcgc aatctctcat ctgaaagaac tgtctgaaga 5640 aaagatcggt aaagagctgg cagaacaggt gaaccatgca ctggaactgc cactgcatcg 5700 ccgtactcag cgtctggaag cagtatggtc tatcgaggcc taccgtaaaa aggaggacgc 5760 gaatcaggtt ctgctggagc tggcaattct ggattacaac atgatccagt ctgtatacca 5820 gcgtgatctg cgtgaaacgt cccgttggtg gcgtcgtgtg ggtctggcga ccaaactgca 5880 ctttgctcgt gaccgcctga ttgagagctt ctactgggcc gtgggtgtag cattcgaacc 5940 gcaatactcc gactgccgta actccgtcgc aaaaatgttt tctttcgtaa ccattatcga 6000 cgatatctac gatgtatacg gcaccctgga cgaactggag ctgtttactg atgcagttga 6060 gcgttgggac gtaaacgcca tcaacgacct gccggattac atgaaactgt gctttctggc 6120 tctgtataac actattaacg aaatcgccta cgacaacctg aaagataaag gtgagaacat 6180 cctgccgtat ctgaccaaag cctgggctga cctgtgcaac gctttcctgc aagaagccaa 6240 gtggctgtac aacaaatcta ctccgacctt tgacgactac ttcggcaacg catggaaatc 6300 ctcttctggc ccgctgcaac tggtgttcgc ttacttcgct gtcgtgcaga acattaaaaa 6360 ggaagagatc gaaaacctgc aaaaatacca tgacaccatc tctcgtcctt cccatatctt 6420 ccgtctgtgc aatgacctgg ctagcgcgtc tgcggaaatt gcgcgtggtg aaaccgcaaa 6480 tagcgtttct tgttacatgc gcactaaagg tatctccgaa gaactggcta ccgaaagcgt 6540 gatgaatctg atcgatgaaa cctggaaaaa gatgaacaag gaaaaactgg gtggtagcct 6600 gttcgcgaaa ccgttcgtgg aaaccgcgat caacctggca cgtcaatctc actgcactta 6660 tcataacggc gacgcgcata cctctccgga tgagctgacc cgcaaacgcg ttctgtctgt 6720 aatcactgaa ccgattctgc cgtttgaacg ctaaggatcc gaattcgagc tccgtcgaca 6780 agcttgcggc cgcactcgag caccaccacc accaccactg agatccggct gctaacaaag 6840 cccgaaagga agctgagttg gctgctgcca ccgctgagca ataactagca taaccccttg 6900 gggcctctaa acgggtcttg aggggttttt tgctgaaagg aggaactata tccggat 6957 <210> 122 <211> 544 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 122 Met Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr 1 5 10 15 Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val Tyr Lys 20 25 30 Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn 35 40 45 Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln 50 55 60 Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Gly Ala Leu 65 70 75 80 Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys Thr Ser 85 90 95 Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe 100 105 110 Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn 115 120 125 Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu Tyr 130 135 140 Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala 145 150 155 160 Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile 165 170 175 Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu Pro Leu 180 185 190 His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu Ala Tyr 195 200 205 Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala Ile Leu 210 215 220 Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr 225 230 235 240 Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala 245 250 255 Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe 260 265 270 Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser 275 280 285 Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp 290 295 300 Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala 305 310 315 320 Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr 325 330 335 Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys Gly Glu 340 345 350 Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala 355 360 365 Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe 370 375 380 Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln 385 390 395 400 Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu 405 410 415 Ile Glu Asn Leu Gln Lys Tyr His Asp Thr Ile Ser Arg Pro Ser His 420 425 430 Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala 435 440 445 Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly 450 455 460 Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu 465 470 475 480 Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala 485 490 495 Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys 500 505 510 Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg 515 520 525 Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg 530 535 540 <210> 123 <211> 6909 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 123 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980 aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040 ttttgtttaa ctttaagaag gagatataca tatggaagct cgtcgttctg cgaactacga 5100 acctaacagc tgggactatg attacctgct gtcctccgac acggacgagt ccatcgaagt 5160 atacaaagac aaagcgaaaa agctggaagc cgaagttcgt cgcgagatta ataacgaaaa 5220 agcagaattt ctgaccctgc tggaactgat tgacaacgtc cagcgcctgg gcctgggtta 5280 ccgtttcgag tctgatatcc gtggtgcgct ggatcgcttc gtttcctccg gcggcttcga 5340 tgcggtaacc aagacttccc tgcacggtac ggcactgtct ttccgtctgc tgcgtcaaca 5400 cggttttgag gtttctcagg aagcgttcag cggcttcaaa gaccaaaacg gcaacttcct 5460 ggagaacctg aaggaagata tcaaagctat cctgagcctg tacgaggcca gcttcctggc 5520 tctggaaggc gaaaacatcc tggacgaggc gaaggttttc gcaatctctc atctgaaaga 5580 actgtctgaa gaaaagatcg gtaaagagct ggcagaacag gtgaaccatg cactggaact 5640 gccactgcat cgccgtactc agcgtctgga agcagtatgg tctatcgagg cctaccgtaa 5700 aaaggaggac gcgaatcagg ttctgctgga gctggcaatt ctggattaca acatgatcca 5760 gtctgtatac cagcgtgatc tgcgtgaaac gtcccgttgg tggcgtcgtg tgggtctggc 5820 gaccaaactg cactttgctc gtgaccgcct gattgagagc ttctactggg ccgtgggtgt 5880 agcattcgaa ccgcaatact ccgactgccg taactccgtc gcaaaaatgt tttctttcgt 5940 aaccattatc gacgatatct acgatgtata cggcaccctg gacgaactgg agctgtttac 6000 tgatgcagtt gagcgttggg acgtaaacgc catcaacgac ctgccggatt acatgaaact 6060 gtgctttctg gctctgtata acactattaa cgaaatcgcc tacgacaacc tgaaagataa 6120 aggtgagaac atcctgccgt atctgaccaa agcctgggct gacctgtgca acgctttcct 6180 gcaagaagcc aagtggctgt acaacaaatc tactccgacc tttgacgact acttcggcaa 6240 cgcatggaaa tcctcttctg gcccgctgca actggtgttc gcttacttcg ctgtcgtgca 6300 gaacattaaa aaggaagaga tcgaaaacct gcaaaaatac catgacacca tctctcgtcc 6360 ttcccatatc ttccgtctgt gcaatgacct ggctagcgcg tctgcggaaa ttgcgcgtgg 6420 tgaaaccgca aatagcgttt cttgttacat gcgcactaaa ggtatctccg aagaactggc 6480 taccgaaagc gtgatgaatc tgatcgatga aacctggaaa aagatgaaca aggaaaaact 6540 gggtggtagc ctgttcgcga aaccgttcgt ggaaaccgcg atcaacctgg cacgtcaatc 6600 tcactgcact tatcataacg gcgacgcgca tacctctccg gatgagctga cccgcaaacg 6660 cgttctgtct gtaatcactg aaccgattct gccgtttgaa cgctaaggat ccgaattcga 6720 gctccgtcga caagcttgcg gccgcactcg agcaccacca ccaccaccac tgagatccgg 6780 ctgctaacaa agcccgaaag gaagctgagt tggctgctgc caccgctgag caataactag 6840 cataacccct tggggcctct aaacgggtct tgaggggttt tttgctgaaa ggaggaacta 6900 tatccggat 6909 <210> 124 <211> 558 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 124 Met Ser Val Ser Thr Glu Asn Val Ser Phe Thr Glu Thr Glu Thr Glu 1 5 10 15 Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr Asp Tyr 20 25 30 Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val Tyr Lys Asp Lys 35 40 45 Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn Glu Lys 50 55 60 Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln Arg Leu 65 70 75 80 Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Gly Ala Leu Asp Arg 85 90 95 Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys Thr Ser Leu His 100 105 110 Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe Glu Val 115 120 125 Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn Phe Leu 130 135 140 Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu Tyr Glu Ala 145 150 155 160 Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala Lys Val 165 170 175 Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile Gly Lys 180 185 190 Glu Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu Pro Leu His Arg 195 200 205 Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu Ala Tyr Arg Lys 210 215 220 Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala Ile Leu Asp Tyr 225 230 235 240 Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr Ser Arg 245 250 255 Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala Arg Asp 260 265 270 Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe Glu Pro 275 280 285 Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser Phe Val 290 295 300 Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp Glu Leu 305 310 315 320 Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala Ile Asn 325 330 335 Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr Asn Thr 340 345 350 Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys Gly Glu Asn Ile 355 360 365 Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala Phe Leu 370 375 380 Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe Asp Asp 385 390 395 400 Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln Leu Val 405 410 415 Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu Ile Glu 420 425 430 Asn Leu Gln Lys Tyr His Asp Thr Ile Ser Arg Pro Ser His Ile Phe 435 440 445 Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala Arg Gly 450 455 460 Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly Ile Ser 465 470 475 480 Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu Thr Trp 485 490 495 Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala Lys Pro 500 505 510 Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys Thr Tyr 515 520 525 His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg Lys Arg 530 535 540 Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg 545 550 555 <210> 125 <211> 6951 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 125 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980 aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040 ttttgtttaa ctttaagaag gagatataca tatgagcgtg tccaccgaaa atgtgtcttt 5100 caccgaaact gaaaccgaag ctcgtcgttc tgcgaactac gaacctaaca gctgggacta 5160 tgattacctg ctgtcctccg acacggacga gtccatcgaa gtatacaaag acaaagcgaa 5220 aaagctggaa gccgaagttc gtcgcgagat taataacgaa aaagcagaat ttctgaccct 5280 gctggaactg attgacaacg tccagcgcct gggcctgggt taccgtttcg agtctgatat 5340 ccgtggtgcg ctggatcgct tcgtttcctc cggcggcttc gatgcggtaa ccaagacttc 5400 cctgcacggt acggcactgt ctttccgtct gctgcgtcaa cacggttttg aggtttctca 5460 ggaagcgttc agcggcttca aagaccaaaa cggcaacttc ctggagaacc tgaaggaaga 5520 tatcaaagct atcctgagcc tgtacgaggc cagcttcctg gctctggaag gcgaaaacat 5580 cctggacgag gcgaaggttt tcgcaatctc tcatctgaaa gaactgtctg aagaaaagat 5640 cggtaaagag ctggcagaac aggtgaacca tgcactggaa ctgccactgc atcgccgtac 5700 tcagcgtctg gaagcagtat ggtctatcga ggcctaccgt aaaaaggagg acgcgaatca 5760 ggttctgctg gagctggcaa ttctggatta caacatgatc cagtctgtat accagcgtga 5820 tctgcgtgaa acgtcccgtt ggtggcgtcg tgtgggtctg gcgaccaaac tgcactttgc 5880 tcgtgaccgc ctgattgaga gcttctactg ggccgtgggt gtagcattcg aaccgcaata 5940 ctccgactgc cgtaactccg tcgcaaaaat gttttctttc gtaaccatta tcgacgatat 6000 ctacgatgta tacggcaccc tggacgaact ggagctgttt actgatgcag ttgagcgttg 6060 ggacgtaaac gccatcaacg acctgccgga ttacatgaaa ctgtgctttc tggctctgta 6120 taacactatt aacgaaatcg cctacgacaa cctgaaagat aaaggtgaga acatcctgcc 6180 gtatctgacc aaagcctggg ctgacctgtg caacgctttc ctgcaagaag ccaagtggct 6240 gtacaacaaa tctactccga cctttgacga ctacttcggc aacgcatgga aatcctcttc 6300 tggcccgctg caactggtgt tcgcttactt cgctgtcgtg cagaacatta aaaaggaaga 6360 gatcgaaaac ctgcaaaaat accatgacac catctctcgt ccttcccata tcttccgtct 6420 gtgcaatgac ctggctagcg cgtctgcgga aattgcgcgt ggtgaaaccg caaatagcgt 6480 ttcttgttac atgcgcacta aaggtatctc cgaagaactg gctaccgaaa gcgtgatgaa 6540 tctgatcgat gaaacctgga aaaagatgaa caaggaaaaa ctgggtggta gcctgttcgc 6600 gaaaccgttc gtggaaaccg cgatcaacct ggcacgtcaa tctcactgca cttatcataa 6660 cggcgacgcg catacctctc cggatgagct gacccgcaaa cgcgttctgt ctgtaatcac 6720 tgaaccgatt ctgccgtttg aacgctaagg atccgaattc gagctccgtc gacaagcttg 6780 cggccgcact cgagcaccac caccaccacc actgagatcc ggctgctaac aaagcccgaa 6840 aggaagctga gttggctgct gccaccgctg agcaataact agcataaccc cttggggcct 6900 ctaaacgggt cttgaggggt tttttgctga aaggaggaac tatatccgga t 6951 <210> 126 <211> 557 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 126 Met Val Ser Thr Glu Asn Val Ser Phe Thr Glu Thr Glu Thr Glu Ala 1 5 10 15 Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr Asp Tyr Leu 20 25 30 Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val Tyr Lys Asp Lys Ala 35 40 45 Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn Glu Lys Ala 50 55 60 Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln Arg Leu Gly 65 70 75 80 Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Gly Ala Leu Asp Arg Phe 85 90 95 Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys Thr Ser Leu His Gly 100 105 110 Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe Glu Val Ser 115 120 125 Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn Phe Leu Glu 130 135 140 Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu Tyr Glu Ala Ser 145 150 155 160 Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala Lys Val Phe 165 170 175 Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile Gly Lys Glu 180 185 190 Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu Pro Leu His Arg Arg 195 200 205 Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu Ala Tyr Arg Lys Lys 210 215 220 Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala Ile Leu Asp Tyr Asn 225 230 235 240 Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr Ser Arg Trp 245 250 255 Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala Arg Asp Arg 260 265 270 Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe Glu Pro Gln 275 280 285 Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser Phe Val Thr 290 295 300 Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp Glu Leu Glu 305 310 315 320 Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala Ile Asn Asp 325 330 335 Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr Asn Thr Ile 340 345 350 Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys Gly Glu Asn Ile Leu 355 360 365 Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala Phe Leu Gln 370 375 380 Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe Asp Asp Tyr 385 390 395 400 Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln Leu Val Phe 405 410 415 Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu Ile Glu Asn 420 425 430 Leu Gln Lys Tyr His Asp Thr Ile Ser Arg Pro Ser His Ile Phe Arg 435 440 445 Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala Arg Gly Glu 450 455 460 Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly Ile Ser Glu 465 470 475 480 Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu Thr Trp Lys 485 490 495 Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala Lys Pro Phe 500 505 510 Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys Thr Tyr His 515 520 525 Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg Lys Arg Val 530 535 540 Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg 545 550 555 <210> 127 <211> 6948 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 127 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980 aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040 ttttgtttaa ctttaagaag gagatataca tatggtgtcc accgaaaatg tgtctttcac 5100 cgaaactgaa accgaagctc gtcgttctgc gaactacgaa cctaacagct gggactatga 5160 ttacctgctg tcctccgaca cggacgagtc catcgaagta tacaaagaca aagcgaaaaa 5220 gctggaagcc gaagttcgtc gcgagattaa taacgaaaaa gcagaatttc tgaccctgct 5280 ggaactgatt gacaacgtcc agcgcctggg cctgggttac cgtttcgagt ctgatatccg 5340 tggtgcgctg gatcgcttcg tttcctccgg cggcttcgat gcggtaacca agacttccct 5400 gcacggtacg gcactgtctt tccgtctgct gcgtcaacac ggttttgagg tttctcagga 5460 agcgttcagc ggcttcaaag accaaaacgg caacttcctg gagaacctga aggaagatat 5520 caaagctatc ctgagcctgt acgaggccag cttcctggct ctggaaggcg aaaacatcct 5580 ggacgaggcg aaggttttcg caatctctca tctgaaagaa ctgtctgaag aaaagatcgg 5640 taaagagctg gcagaacagg tgaaccatgc actggaactg ccactgcatc gccgtactca 5700 gcgtctggaa gcagtatggt ctatcgaggc ctaccgtaaa aaggaggacg cgaatcaggt 5760 tctgctggag ctggcaattc tggattacaa catgatccag tctgtatacc agcgtgatct 5820 gcgtgaaacg tcccgttggt ggcgtcgtgt gggtctggcg accaaactgc actttgctcg 5880 tgaccgcctg attgagagct tctactgggc cgtgggtgta gcattcgaac cgcaatactc 5940 cgactgccgt aactccgtcg caaaaatgtt ttctttcgta accattatcg acgatatcta 6000 cgatgtatac ggcaccctgg acgaactgga gctgtttact gatgcagttg agcgttggga 6060 cgtaaacgcc atcaacgacc tgccggatta catgaaactg tgctttctgg ctctgtataa 6120 cactattaac gaaatcgcct acgacaacct gaaagataaa ggtgagaaca tcctgccgta 6180 tctgaccaaa gcctgggctg acctgtgcaa cgctttcctg caagaagcca agtggctgta 6240 caacaaatct actccgacct ttgacgacta cttcggcaac gcatggaaat cctcttctgg 6300 cccgctgcaa ctggtgttcg cttacttcgc tgtcgtgcag aacattaaaa aggaagagat 6360 cgaaaacctg caaaaatacc atgacaccat ctctcgtcct tcccatatct tccgtctgtg 6420 caatgacctg gctagcgcgt ctgcggaaat tgcgcgtggt gaaaccgcaa atagcgtttc 6480 ttgttacatg cgcactaaag gtatctccga agaactggct accgaaagcg tgatgaatct 6540 gatcgatgaa acctggaaaa agatgaacaa ggaaaaactg ggtggtagcc tgttcgcgaa 6600 accgttcgtg gaaaccgcga tcaacctggc acgtcaatct cactgcactt atcataacgg 6660 cgacgcgcat acctctccgg atgagctgac ccgcaaacgc gttctgtctg taatcactga 6720 accgattctg ccgtttgaac gctaaggatc cgaattcgag ctccgtcgac aagcttgcgg 6780 ccgcactcga gcaccaccac caccaccact gagatccggc tgctaacaaa gcccgaaagg 6840 aagctgagtt ggctgctgcc accgctgagc aataactagc ataacccctt ggggcctcta 6900 aacgggtctt gaggggtttt ttgctgaaag gaggaactat atccggat 6948 <210> 128 <211> 555 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 128 Met Thr Glu Asn Val Ser Phe Thr Glu Thr Glu Thr Glu Ala Arg Arg 1 5 10 15 Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr Asp Tyr Leu Leu Ser 20 25 30 Ser Asp Thr Asp Glu Ser Ile Glu Val Tyr Lys Asp Lys Ala Lys Lys 35 40 45 Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn Glu Lys Ala Glu Phe 50 55 60 Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln Arg Leu Gly Leu Gly 65 70 75 80 Tyr Arg Phe Glu Ser Asp Ile Arg Gly Ala Leu Asp Arg Phe Val Ser 85 90 95 Ser Gly Gly Phe Asp Ala Val Thr Lys Thr Ser Leu His Gly Thr Ala 100 105 110 Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe Glu Val Ser Gln Glu 115 120 125 Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn Phe Leu Glu Asn Leu 130 135 140 Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu Tyr Glu Ala Ser Phe Leu 145 150 155 160 Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala Lys Val Phe Ala Ile 165 170 175 Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile Gly Lys Glu Leu Ala 180 185 190 Glu Gln Val Asn His Ala Leu Glu Leu Pro Leu His Arg Arg Thr Gln 195 200 205 Arg Leu Glu Ala Val Trp Ser Ile Glu Ala Tyr Arg Lys Lys Glu Asp 210 215 220 Ala Asn Gln Val Leu Leu Glu Leu Ala Ile Leu Asp Tyr Asn Met Ile 225 230 235 240 Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr Ser Arg Trp Trp Arg 245 250 255 Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala Arg Asp Arg Leu Ile 260 265 270 Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe Glu Pro Gln Tyr Ser 275 280 285 Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser Phe Val Thr Ile Ile 290 295 300 Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp Glu Leu Glu Leu Phe 305 310 315 320 Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala Ile Asn Asp Leu Pro 325 330 335 Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr Asn Thr Ile Asn Glu 340 345 350 Ile Ala Tyr Asp Asn Leu Lys Asp Lys Gly Glu Asn Ile Leu Pro Tyr 355 360 365 Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala Phe Leu Gln Glu Ala 370 375 380 Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe Asp Asp Tyr Phe Gly 385 390 395 400 Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln Leu Val Phe Ala Tyr 405 410 415 Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu Ile Glu Asn Leu Gln 420 425 430 Lys Tyr His Asp Thr Ile Ser Arg Pro Ser His Ile Phe Arg Leu Cys 435 440 445 Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala Arg Gly Glu Thr Ala 450 455 460 Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly Ile Ser Glu Glu Leu 465 470 475 480 Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu Thr Trp Lys Lys Met 485 490 495 Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala Lys Pro Phe Val Glu 500 505 510 Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys Thr Tyr His Asn Gly 515 520 525 Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg Lys Arg Val Leu Ser 530 535 540 Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg 545 550 555 <210> 129 <211> 6942 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 129 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980 aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040 ttttgtttaa ctttaagaag gagatataca tatgaccgaa aatgtgtctt tcaccgaaac 5100 tgaaaccgaa gctcgtcgtt ctgcgaacta cgaacctaac agctgggact atgattacct 5160 gctgtcctcc gacacggacg agtccatcga agtatacaaa gacaaagcga aaaagctgga 5220 agccgaagtt cgtcgcgaga ttaataacga aaaagcagaa tttctgaccc tgctggaact 5280 gattgacaac gtccagcgcc tgggcctggg ttaccgtttc gagtctgata tccgtggtgc 5340 gctggatcgc ttcgtttcct ccggcggctt cgatgcggta accaagactt ccctgcacgg 5400 tacggcactg tctttccgtc tgctgcgtca acacggtttt gaggtttctc aggaagcgtt 5460 cagcggcttc aaagaccaaa acggcaactt cctggagaac ctgaaggaag atatcaaagc 5520 tatcctgagc ctgtacgagg ccagcttcct ggctctggaa ggcgaaaaca tcctggacga 5580 ggcgaaggtt ttcgcaatct ctcatctgaa agaactgtct gaagaaaaga tcggtaaaga 5640 gctggcagaa caggtgaacc atgcactgga actgccactg catcgccgta ctcagcgtct 5700 ggaagcagta tggtctatcg aggcctaccg taaaaaggag gacgcgaatc aggttctgct 5760 ggagctggca attctggatt acaacatgat ccagtctgta taccagcgtg atctgcgtga 5820 aacgtcccgt tggtggcgtc gtgtgggtct ggcgaccaaa ctgcactttg ctcgtgaccg 5880 cctgattgag agcttctact gggccgtggg tgtagcattc gaaccgcaat actccgactg 5940 ccgtaactcc gtcgcaaaaa tgttttcttt cgtaaccatt atcgacgata tctacgatgt 6000 atacggcacc ctggacgaac tggagctgtt tactgatgca gttgagcgtt gggacgtaaa 6060 cgccatcaac gacctgccgg attacatgaa actgtgcttt ctggctctgt ataacactat 6120 taacgaaatc gcctacgaca acctgaaaga taaaggtgag aacatcctgc cgtatctgac 6180 caaagcctgg gctgacctgt gcaacgcttt cctgcaagaa gccaagtggc tgtacaacaa 6240 atctactccg acctttgacg actacttcgg caacgcatgg aaatcctctt ctggcccgct 6300 gcaactggtg ttcgcttact tcgctgtcgt gcagaacatt aaaaaggaag agatcgaaaa 6360 cctgcaaaaa taccatgaca ccatctctcg tccttcccat atcttccgtc tgtgcaatga 6420 cctggctagc gcgtctgcgg aaattgcgcg tggtgaaacc gcaaatagcg tttcttgtta 6480 catgcgcact aaaggtatct ccgaagaact ggctaccgaa agcgtgatga atctgatcga 6540 tgaaacctgg aaaaagatga acaaggaaaa actgggtggt agcctgttcg cgaaaccgtt 6600 cgtggaaacc gcgatcaacc tggcacgtca atctcactgc acttatcata acggcgacgc 6660 gcatacctct ccggatgagc tgacccgcaa acgcgttctg tctgtaatca ctgaaccgat 6720 tctgccgttt gaacgctaag gatccgaatt cgagctccgt cgacaagctt gcggccgcac 6780 tcgagcacca ccaccaccac cactgagatc cggctgctaa caaagcccga aaggaagctg 6840 agttggctgc tgccaccgct gagcaataac tagcataacc ccttggggcc tctaaacggg 6900 tcttgagggg ttttttgctg aaaggaggaa ctatatccgg at 6942 <210> 130 <211> 553 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 130 Met Asn Val Ser Phe Thr Glu Thr Glu Thr Glu Ala Arg Arg Ser Ala 1 5 10 15 Asn Tyr Glu Pro Asn Ser Trp Asp Tyr Asp Tyr Leu Leu Ser Ser Asp 20 25 30 Thr Asp Glu Ser Ile Glu Val Tyr Lys Asp Lys Ala Lys Lys Leu Glu 35 40 45 Ala Glu Val Arg Arg Glu Ile Asn Asn Glu Lys Ala Glu Phe Leu Thr 50 55 60 Leu Leu Glu Leu Ile Asp Asn Val Gln Arg Leu Gly Leu Gly Tyr Arg 65 70 75 80 Phe Glu Ser Asp Ile Arg Gly Ala Leu Asp Arg Phe Val Ser Ser Gly 85 90 95 Gly Phe Asp Ala Val Thr Lys Thr Ser Leu His Gly Thr Ala Leu Ser 100 105 110 Phe Arg Leu Leu Arg Gln His Gly Phe Glu Val Ser Gln Glu Ala Phe 115 120 125 Ser Gly Phe Lys Asp Gln Asn Gly Asn Phe Leu Glu Asn Leu Lys Glu 130 135 140 Asp Ile Lys Ala Ile Leu Ser Leu Tyr Glu Ala Ser Phe Leu Ala Leu 145 150 155 160 Glu Gly Glu Asn Ile Leu Asp Glu Ala Lys Val Phe Ala Ile Ser His 165 170 175 Leu Lys Glu Leu Ser Glu Glu Lys Ile Gly Lys Glu Leu Ala Glu Gln 180 185 190 Val Asn His Ala Leu Glu Leu Pro Leu His Arg Arg Thr Gln Arg Leu 195 200 205 Glu Ala Val Trp Ser Ile Glu Ala Tyr Arg Lys Lys Glu Asp Ala Asn 210 215 220 Gln Val Leu Leu Glu Leu Ala Ile Leu Asp Tyr Asn Met Ile Gln Ser 225 230 235 240 Val Tyr Gln Arg Asp Leu Arg Glu Thr Ser Arg Trp Trp Arg Arg Val 245 250 255 Gly Leu Ala Thr Lys Leu His Phe Ala Arg Asp Arg Leu Ile Glu Ser 260 265 270 Phe Tyr Trp Ala Val Gly Val Ala Phe Glu Pro Gln Tyr Ser Asp Cys 275 280 285 Arg Asn Ser Val Ala Lys Met Phe Ser Phe Val Thr Ile Ile Asp Asp 290 295 300 Ile Tyr Asp Val Tyr Gly Thr Leu Asp Glu Leu Glu Leu Phe Thr Asp 305 310 315 320 Ala Val Glu Arg Trp Asp Val Asn Ala Ile Asn Asp Leu Pro Asp Tyr 325 330 335 Met Lys Leu Cys Phe Leu Ala Leu Tyr Asn Thr Ile Asn Glu Ile Ala 340 345 350 Tyr Asp Asn Leu Lys Asp Lys Gly Glu Asn Ile Leu Pro Tyr Leu Thr 355 360 365 Lys Ala Trp Ala Asp Leu Cys Asn Ala Phe Leu Gln Glu Ala Lys Trp 370 375 380 Leu Tyr Asn Lys Ser Thr Pro Thr Phe Asp Asp Tyr Phe Gly Asn Ala 385 390 395 400 Trp Lys Ser Ser Ser Gly Pro Leu Gln Leu Val Phe Ala Tyr Phe Ala 405 410 415 Val Val Gln Asn Ile Lys Lys Glu Glu Ile Glu Asn Leu Gln Lys Tyr 420 425 430 His Asp Thr Ile Ser Arg Pro Ser His Ile Phe Arg Leu Cys Asn Asp 435 440 445 Leu Ala Ser Ala Ser Ala Glu Ile Ala Arg Gly Glu Thr Ala Asn Ser 450 455 460 Val Ser Cys Tyr Met Arg Thr Lys Gly Ile Ser Glu Glu Leu Ala Thr 465 470 475 480 Glu Ser Val Met Asn Leu Ile Asp Glu Thr Trp Lys Lys Met Asn Lys 485 490 495 Glu Lys Leu Gly Gly Ser Leu Phe Ala Lys Pro Phe Val Glu Thr Ala 500 505 510 Ile Asn Leu Ala Arg Gln Ser His Cys Thr Tyr His Asn Gly Asp Ala 515 520 525 His Thr Ser Pro Asp Glu Leu Thr Arg Lys Arg Val Leu Ser Val Ile 530 535 540 Thr Glu Pro Ile Leu Pro Phe Glu Arg 545 550 <210> 131 <211> 6936 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 131 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980 aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040 ttttgtttaa ctttaagaag gagatataca tatgaatgtg tctttcaccg aaactgaaac 5100 cgaagctcgt cgttctgcga actacgaacc taacagctgg gactatgatt acctgctgtc 5160 ctccgacacg gacgagtcca tcgaagtata caaagacaaa gcgaaaaagc tggaagccga 5220 agttcgtcgc gagattaata acgaaaaagc agaatttctg accctgctgg aactgattga 5280 caacgtccag cgcctgggcc tgggttaccg tttcgagtct gatatccgtg gtgcgctgga 5340 tcgcttcgtt tcctccggcg gcttcgatgc ggtaaccaag acttccctgc acggtacggc 5400 actgtctttc cgtctgctgc gtcaacacgg ttttgaggtt tctcaggaag cgttcagcgg 5460 cttcaaagac caaaacggca acttcctgga gaacctgaag gaagatatca aagctatcct 5520 gagcctgtac gaggccagct tcctggctct ggaaggcgaa aacatcctgg acgaggcgaa 5580 ggttttcgca atctctcatc tgaaagaact gtctgaagaa aagatcggta aagagctggc 5640 agaacaggtg aaccatgcac tggaactgcc actgcatcgc cgtactcagc gtctggaagc 5700 agtatggtct atcgaggcct accgtaaaaa ggaggacgcg aatcaggttc tgctggagct 5760 ggcaattctg gattacaaca tgatccagtc tgtataccag cgtgatctgc gtgaaacgtc 5820 ccgttggtgg cgtcgtgtgg gtctggcgac caaactgcac tttgctcgtg accgcctgat 5880 tgagagcttc tactgggccg tgggtgtagc attcgaaccg caatactccg actgccgtaa 5940 ctccgtcgca aaaatgtttt ctttcgtaac cattatcgac gatatctacg atgtatacgg 6000 caccctggac gaactggagc tgtttactga tgcagttgag cgttgggacg taaacgccat 6060 caacgacctg ccggattaca tgaaactgtg ctttctggct ctgtataaca ctattaacga 6120 aatcgcctac gacaacctga aagataaagg tgagaacatc ctgccgtatc tgaccaaagc 6180 ctgggctgac ctgtgcaacg ctttcctgca agaagccaag tggctgtaca acaaatctac 6240 tccgaccttt gacgactact tcggcaacgc atggaaatcc tcttctggcc cgctgcaact 6300 ggtgttcgct tacttcgctg tcgtgcagaa cattaaaaag gaagagatcg aaaacctgca 6360 aaaataccat gacaccatct ctcgtccttc ccatatcttc cgtctgtgca atgacctggc 6420 tagcgcgtct gcggaaattg cgcgtggtga aaccgcaaat agcgtttctt gttacatgcg 6480 cactaaaggt atctccgaag aactggctac cgaaagcgtg atgaatctga tcgatgaaac 6540 ctggaaaaag atgaacaagg aaaaactggg tggtagcctg ttcgcgaaac cgttcgtgga 6600 aaccgcgatc aacctggcac gtcaatctca ctgcacttat cataacggcg acgcgcatac 6660 ctctccggat gagctgaccc gcaaacgcgt tctgtctgta atcactgaac cgattctgcc 6720 gtttgaacgc taaggatccg aattcgagct ccgtcgacaa gcttgcggcc gcactcgagc 6780 accaccacca ccaccactga gatccggctg ctaacaaagc ccgaaaggaa gctgagttgg 6840 ctgctgccac cgctgagcaa taactagcat aaccccttgg ggcctctaaa cgggtcttga 6900 ggggtttttt gctgaaagga ggaactatat ccggat 6936 <210> 132 <211> 559 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 132 Met Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr 1 5 10 15 Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val Tyr Lys 20 25 30 Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn 35 40 45 Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln 50 55 60 Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Gly Ala Leu 65 70 75 80 Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys Thr Ser 85 90 95 Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe 100 105 110 Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn 115 120 125 Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu Tyr 130 135 140 Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala 145 150 155 160 Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile 165 170 175 Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu Pro Leu 180 185 190 His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu Ala Tyr 195 200 205 Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala Ile Leu 210 215 220 Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr 225 230 235 240 Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala 245 250 255 Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe 260 265 270 Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser 275 280 285 Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp 290 295 300 Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala 305 310 315 320 Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr 325 330 335 Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys Gly Glu 340 345 350 Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala 355 360 365 Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe 370 375 380 Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln 385 390 395 400 Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu 405 410 415 Ile Glu Asn Leu Gln Lys Tyr His Asp Thr Ile Ser Arg Pro Ser His 420 425 430 Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala 435 440 445 Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly 450 455 460 Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu 465 470 475 480 Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala 485 490 495 Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys 500 505 510 Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg 515 520 525 Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg 530 535 540 Glu Asn Leu Tyr Phe Gln Gly Leu Glu His His His His His His 545 550 555 <210> 133 <211> 6887 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 133 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980 aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040 ttttgtttaa ctttaagaag gagatataca tatggaagct cgtcgttctg cgaactacga 5100 acctaacagc tgggactatg attacctgct gtcctccgac acggacgagt ccatcgaagt 5160 atacaaagac aaagcgaaaa agctggaagc cgaagttcgt cgcgagatta ataacgaaaa 5220 agcagaattt ctgaccctgc tggaactgat tgacaacgtc cagcgcctgg gcctgggtta 5280 ccgtttcgag tctgatatcc gtggtgcgct ggatcgcttc gtttcctccg gcggcttcga 5340 tgcggtaacc aagacttccc tgcacggtac ggcactgtct ttccgtctgc tgcgtcaaca 5400 cggttttgag gtttctcagg aagcgttcag cggcttcaaa gaccaaaacg gcaacttcct 5460 ggagaacctg aaggaagata tcaaagctat cctgagcctg tacgaggcca gcttcctggc 5520 tctggaaggc gaaaacatcc tggacgaggc gaaggttttc gcaatctctc atctgaaaga 5580 actgtctgaa gaaaagatcg gtaaagagct ggcagaacag gtgaaccatg cactggaact 5640 gccactgcat cgccgtactc agcgtctgga agcagtatgg tctatcgagg cctaccgtaa 5700 aaaggaggac gcgaatcagg ttctgctgga gctggcaatt ctggattaca acatgatcca 5760 gtctgtatac cagcgtgatc tgcgtgaaac gtcccgttgg tggcgtcgtg tgggtctggc 5820 gaccaaactg cactttgctc gtgaccgcct gattgagagc ttctactggg ccgtgggtgt 5880 agcattcgaa ccgcaatact ccgactgccg taactccgtc gcaaaaatgt tttctttcgt 5940 aaccattatc gacgatatct acgatgtata cggcaccctg gacgaactgg agctgtttac 6000 tgatgcagtt gagcgttggg acgtaaacgc catcaacgac ctgccggatt acatgaaact 6060 gtgctttctg gctctgtata acactattaa cgaaatcgcc tacgacaacc tgaaagataa 6120 aggtgagaac atcctgccgt atctgaccaa agcctgggct gacctgtgca acgctttcct 6180 gcaagaagcc aagtggctgt acaacaaatc tactccgacc tttgacgact acttcggcaa 6240 cgcatggaaa tcctcttctg gcccgctgca actggtgttc gcttacttcg ctgtcgtgca 6300 gaacattaaa aaggaagaga tcgaaaacct gcaaaaatac catgacacca tctctcgtcc 6360 ttcccatatc ttccgtctgt gcaatgacct ggctagcgcg tctgcggaaa ttgcgcgtgg 6420 tgaaaccgca aatagcgttt cttgttacat gcgcactaaa ggtatctccg aagaactggc 6480 taccgaaagc gtgatgaatc tgatcgatga aacctggaaa aagatgaaca aggaaaaact 6540 gggtggtagc ctgttcgcga aaccgttcgt ggaaaccgcg atcaacctgg cacgtcaatc 6600 tcactgcact tatcataacg gcgacgcgca tacctctccg gatgagctga cccgcaaacg 6660 cgttctgtct gtaatcactg aaccgattct gccgtttgaa cgcgaaaacc tgtattttca 6720 gggcctcgag caccaccacc accaccactg agatccggct gctaacaaag cccgaaagga 6780 agctgagttg gctgctgcca ccgctgagca ataactagca taaccccttg gggcctctaa 6840 acgggtcttg aggggttttt tgctgaaagg aggaactata tccggat 6887 <210> 134 <211> 575 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 134 Met Arg Cys Ser Val Ser Thr Glu Asn Val Ser Phe Thr Glu Thr Glu 1 5 10 15 Thr Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr 20 25 30 Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val Tyr Lys 35 40 45 Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn 50 55 60 Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln 65 70 75 80 Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Gly Ala Leu 85 90 95 Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys Thr Ser 100 105 110 Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe 115 120 125 Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn 130 135 140 Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu Tyr 145 150 155 160 Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala 165 170 175 Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile 180 185 190 Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu Pro Leu 195 200 205 His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu Ala Tyr 210 215 220 Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala Ile Leu 225 230 235 240 Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr 245 250 255 Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala 260 265 270 Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe 275 280 285 Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser 290 295 300 Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp 305 310 315 320 Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala 325 330 335 Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr 340 345 350 Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys Gly Glu 355 360 365 Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala 370 375 380 Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe 385 390 395 400 Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln 405 410 415 Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu 420 425 430 Ile Glu Asn Leu Gln Lys Tyr His Asp Thr Ile Ser Arg Pro Ser His 435 440 445 Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala 450 455 460 Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly 465 470 475 480 Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu 485 490 495 Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala 500 505 510 Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys 515 520 525 Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg 530 535 540 Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg 545 550 555 560 Glu Asn Leu Tyr Phe Gln Gly Leu Glu His His His His His His 565 570 575 <210> 135 <211> 6935 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 135 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980 aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040 ttttgtttaa ctttaagaag gagatataca tatgcgttgt agcgtgtcca ccgaaaatgt 5100 gtctttcacc gaaactgaaa ccgaagctcg tcgttctgcg aactacgaac ctaacagctg 5160 ggactatgat tacctgctgt cctccgacac ggacgagtcc atcgaagtat acaaagacaa 5220 agcgaaaaag ctggaagccg aagttcgtcg cgagattaat aacgaaaaag cagaatttct 5280 gaccctgctg gaactgattg acaacgtcca gcgcctgggc ctgggttacc gtttcgagtc 5340 tgatatccgt ggtgcgctgg atcgcttcgt ttcctccggc ggcttcgatg cggtaaccaa 5400 gacttccctg cacggtacgg cactgtcttt ccgtctgctg cgtcaacacg gttttgaggt 5460 ttctcaggaa gcgttcagcg gcttcaaaga ccaaaacggc aacttcctgg agaacctgaa 5520 ggaagatatc aaagctatcc tgagcctgta cgaggccagc ttcctggctc tggaaggcga 5580 aaacatcctg gacgaggcga aggttttcgc aatctctcat ctgaaagaac tgtctgaaga 5640 aaagatcggt aaagagctgg cagaacaggt gaaccatgca ctggaactgc cactgcatcg 5700 ccgtactcag cgtctggaag cagtatggtc tatcgaggcc taccgtaaaa aggaggacgc 5760 gaatcaggtt ctgctggagc tggcaattct ggattacaac atgatccagt ctgtatacca 5820 gcgtgatctg cgtgaaacgt cccgttggtg gcgtcgtgtg ggtctggcga ccaaactgca 5880 ctttgctcgt gaccgcctga ttgagagctt ctactgggcc gtgggtgtag cattcgaacc 5940 gcaatactcc gactgccgta actccgtcgc aaaaatgttt tctttcgtaa ccattatcga 6000 cgatatctac gatgtatacg gcaccctgga cgaactggag ctgtttactg atgcagttga 6060 gcgttgggac gtaaacgcca tcaacgacct gccggattac atgaaactgt gctttctggc 6120 tctgtataac actattaacg aaatcgccta cgacaacctg aaagataaag gtgagaacat 6180 cctgccgtat ctgaccaaag cctgggctga cctgtgcaac gctttcctgc aagaagccaa 6240 gtggctgtac aacaaatcta ctccgacctt tgacgactac ttcggcaacg catggaaatc 6300 ctcttctggc ccgctgcaac tggtgttcgc ttacttcgct gtcgtgcaga acattaaaaa 6360 ggaagagatc gaaaacctgc aaaaatacca tgacaccatc tctcgtcctt cccatatctt 6420 ccgtctgtgc aatgacctgg ctagcgcgtc tgcggaaatt gcgcgtggtg aaaccgcaaa 6480 tagcgtttct tgttacatgc gcactaaagg tatctccgaa gaactggcta ccgaaagcgt 6540 gatgaatctg atcgatgaaa cctggaaaaa gatgaacaag gaaaaactgg gtggtagcct 6600 gttcgcgaaa ccgttcgtgg aaaccgcgat caacctggca cgtcaatctc actgcactta 6660 tcataacggc gacgcgcata cctctccgga tgagctgacc cgcaaacgcg ttctgtctgt 6720 aatcactgaa ccgattctgc cgtttgaacg cgaaaacctg tattttcagg gcctcgagca 6780 ccaccaccac caccactgag atccggctgc taacaaagcc cgaaaggaag ctgagttggc 6840 tgctgccacc gctgagcaat aactagcata accccttggg gcctctaaac gggtcttgag 6900 gggttttttg ctgaaaggag gaactatatc cggat 6935 <210> 136 <211> 545 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 136 Met Thr Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp 1 5 10 15 Tyr Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val Tyr 20 25 30 Lys Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn 35 40 45 Asn Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val 50 55 60 Gln Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Gly Ala 65 70 75 80 Leu Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys Thr 85 90 95 Ser Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly 100 105 110 Phe Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly 115 120 125 Asn Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu 130 135 140 Tyr Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu 145 150 155 160 Ala Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys 165 170 175 Ile Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu Pro 180 185 190 Leu His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu Ala 195 200 205 Tyr Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala Ile 210 215 220 Leu Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu 225 230 235 240 Thr Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe 245 250 255 Ala Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala 260 265 270 Phe Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe 275 280 285 Ser Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu 290 295 300 Asp Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn 305 310 315 320 Ala Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu 325 330 335 Tyr Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys Gly 340 345 350 Glu Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn 355 360 365 Ala Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr 370 375 380 Phe Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu 385 390 395 400 Gln Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu 405 410 415 Glu Ile Glu Asn Leu Gln Lys Tyr His Asp Thr Ile Ser Arg Pro Ser 420 425 430 His Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile 435 440 445 Ala Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys 450 455 460 Gly Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp 465 470 475 480 Glu Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe 485 490 495 Ala Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His 500 505 510 Cys Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr 515 520 525 Arg Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu 530 535 540 Arg 545 <210> 137 <211> 6912 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 137 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980 aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040 ttttgtttaa ctttaagaag gagatataca tatgaccgaa gctcgtcgtt ctgcgaacta 5100 cgaacctaac agctgggact atgattacct gctgtcctcc gacacggacg agtccatcga 5160 agtatacaaa gacaaagcga aaaagctgga agccgaagtt cgtcgcgaga ttaataacga 5220 aaaagcagaa tttctgaccc tgctggaact gattgacaac gtccagcgcc tgggcctggg 5280 ttaccgtttc gagtctgata tccgtggtgc gctggatcgc ttcgtttcct ccggcggctt 5340 cgatgcggta accaagactt ccctgcacgg tacggcactg tctttccgtc tgctgcgtca 5400 acacggtttt gaggtttctc aggaagcgtt cagcggcttc aaagaccaaa acggcaactt 5460 cctggagaac ctgaaggaag atatcaaagc tatcctgagc ctgtacgagg ccagcttcct 5520 ggctctggaa ggcgaaaaca tcctggacga ggcgaaggtt ttcgcaatct ctcatctgaa 5580 agaactgtct gaagaaaaga tcggtaaaga gctggcagaa caggtgaacc atgcactgga 5640 actgccactg catcgccgta ctcagcgtct ggaagcagta tggtctatcg aggcctaccg 5700 taaaaaggag gacgcgaatc aggttctgct ggagctggca attctggatt acaacatgat 5760 ccagtctgta taccagcgtg atctgcgtga aacgtcccgt tggtggcgtc gtgtgggtct 5820 ggcgaccaaa ctgcactttg ctcgtgaccg cctgattgag agcttctact gggccgtggg 5880 tgtagcattc gaaccgcaat actccgactg ccgtaactcc gtcgcaaaaa tgttttcttt 5940 cgtaaccatt atcgacgata tctacgatgt atacggcacc ctggacgaac tggagctgtt 6000 tactgatgca gttgagcgtt gggacgtaaa cgccatcaac gacctgccgg attacatgaa 6060 actgtgcttt ctggctctgt ataacactat taacgaaatc gcctacgaca acctgaaaga 6120 taaaggtgag aacatcctgc cgtatctgac caaagcctgg gctgacctgt gcaacgcttt 6180 cctgcaagaa gccaagtggc tgtacaacaa atctactccg acctttgacg actacttcgg 6240 caacgcatgg aaatcctctt ctggcccgct gcaactggtg ttcgcttact tcgctgtcgt 6300 gcagaacatt aaaaaggaag agatcgaaaa cctgcaaaaa taccatgaca ccatctctcg 6360 tccttcccat atcttccgtc tgtgcaatga cctggctagc gcgtctgcgg aaattgcgcg 6420 tggtgaaacc gcaaatagcg tttcttgtta catgcgcact aaaggtatct ccgaagaact 6480 ggctaccgaa agcgtgatga atctgatcga tgaaacctgg aaaaagatga acaaggaaaa 6540 actgggtggt agcctgttcg cgaaaccgtt cgtggaaacc gcgatcaacc tggcacgtca 6600 atctcactgc acttatcata acggcgacgc gcatacctct ccggatgagc tgacccgcaa 6660 acgcgttctg tctgtaatca ctgaaccgat tctgccgttt gaacgctaag gatccgaatt 6720 cgagctccgt cgacaagctt gcggccgcac tcgagcacca ccaccaccac cactgagatc 6780 cggctgctaa caaagcccga aaggaagctg agttggctgc tgccaccgct gagcaataac 6840 tagcataacc ccttggggcc tctaaacggg tcttgagggg ttttttgctg aaaggaggaa 6900 ctatatccgg at 6912 <210> 138 <211> 546 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 138 Met Glu Thr Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp 1 5 10 15 Asp Tyr Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val 20 25 30 Tyr Lys Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile 35 40 45 Asn Asn Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn 50 55 60 Val Gln Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Gly 65 70 75 80 Ala Leu Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys 85 90 95 Thr Ser Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His 100 105 110 Gly Phe Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn 115 120 125 Gly Asn Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser 130 135 140 Leu Tyr Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp 145 150 155 160 Glu Ala Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu 165 170 175 Lys Ile Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu 180 185 190 Pro Leu His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu 195 200 205 Ala Tyr Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala 210 215 220 Ile Leu Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg 225 230 235 240 Glu Thr Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His 245 250 255 Phe Ala Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val 260 265 270 Ala Phe Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met 275 280 285 Phe Ser Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr 290 295 300 Leu Asp Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val 305 310 315 320 Asn Ala Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala 325 330 335 Leu Tyr Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys 340 345 350 Gly Glu Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys 355 360 365 Asn Ala Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro 370 375 380 Thr Phe Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro 385 390 395 400 Leu Gln Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys 405 410 415 Glu Glu Ile Glu Asn Leu Gln Lys Tyr His Asp Thr Ile Ser Arg Pro 420 425 430 Ser His Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu 435 440 445 Ile Ala Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr 450 455 460 Lys Gly Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile 465 470 475 480 Asp Glu Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu 485 490 495 Phe Ala Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser 500 505 510 His Cys Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu 515 520 525 Thr Arg Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe 530 535 540 Glu Arg 545 <210> 139 <211> 6915 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 139 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980 aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040 ttttgtttaa ctttaagaag gagatataca tatggaaacc gaagctcgtc gttctgcgaa 5100 ctacgaacct aacagctggg actatgatta cctgctgtcc tccgacacgg acgagtccat 5160 cgaagtatac aaagacaaag cgaaaaagct ggaagccgaa gttcgtcgcg agattaataa 5220 cgaaaaagca gaatttctga ccctgctgga actgattgac aacgtccagc gcctgggcct 5280 gggttaccgt ttcgagtctg atatccgtgg tgcgctggat cgcttcgttt cctccggcgg 5340 cttcgatgcg gtaaccaaga cttccctgca cggtacggca ctgtctttcc gtctgctgcg 5400 tcaacacggt tttgaggttt ctcaggaagc gttcagcggc ttcaaagacc aaaacggcaa 5460 cttcctggag aacctgaagg aagatatcaa agctatcctg agcctgtacg aggccagctt 5520 cctggctctg gaaggcgaaa acatcctgga cgaggcgaag gttttcgcaa tctctcatct 5580 gaaagaactg tctgaagaaa agatcggtaa agagctggca gaacaggtga accatgcact 5640 ggaactgcca ctgcatcgcc gtactcagcg tctggaagca gtatggtcta tcgaggccta 5700 ccgtaaaaag gaggacgcga atcaggttct gctggagctg gcaattctgg attacaacat 5760 gatccagtct gtataccagc gtgatctgcg tgaaacgtcc cgttggtggc gtcgtgtggg 5820 tctggcgacc aaactgcact ttgctcgtga ccgcctgatt gagagcttct actgggccgt 5880 gggtgtagca ttcgaaccgc aatactccga ctgccgtaac tccgtcgcaa aaatgttttc 5940 tttcgtaacc attatcgacg atatctacga tgtatacggc accctggacg aactggagct 6000 gtttactgat gcagttgagc gttgggacgt aaacgccatc aacgacctgc cggattacat 6060 gaaactgtgc tttctggctc tgtataacac tattaacgaa atcgcctacg acaacctgaa 6120 agataaaggt gagaacatcc tgccgtatct gaccaaagcc tgggctgacc tgtgcaacgc 6180 tttcctgcaa gaagccaagt ggctgtacaa caaatctact ccgacctttg acgactactt 6240 cggcaacgca tggaaatcct cttctggccc gctgcaactg gtgttcgctt acttcgctgt 6300 cgtgcagaac attaaaaagg aagagatcga aaacctgcaa aaataccatg acaccatctc 6360 tcgtccttcc catatcttcc gtctgtgcaa tgacctggct agcgcgtctg cggaaattgc 6420 gcgtggtgaa accgcaaata gcgtttcttg ttacatgcgc actaaaggta tctccgaaga 6480 actggctacc gaaagcgtga tgaatctgat cgatgaaacc tggaaaaaga tgaacaagga 6540 aaaactgggt ggtagcctgt tcgcgaaacc gttcgtggaa accgcgatca acctggcacg 6600 tcaatctcac tgcacttatc ataacggcga cgcgcatacc tctccggatg agctgacccg 6660 caaacgcgtt ctgtctgtaa tcactgaacc gattctgccg tttgaacgct aaggatccga 6720 attcgagctc cgtcgacaag cttgcggccg cactcgagca ccaccaccac caccactgag 6780 atccggctgc taacaaagcc cgaaaggaag ctgagttggc tgctgccacc gctgagcaat 6840 aactagcata accccttggg gcctctaaac gggtcttgag gggttttttg ctgaaaggag 6900 gaactatatc cggat 6915 <210> 140 <211> 547 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 140 Met Thr Glu Thr Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser 1 5 10 15 Trp Asp Tyr Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu 20 25 30 Val Tyr Lys Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu 35 40 45 Ile Asn Asn Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp 50 55 60 Asn Val Gln Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg 65 70 75 80 Gly Ala Leu Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr 85 90 95 Lys Thr Ser Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln 100 105 110 His Gly Phe Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln 115 120 125 Asn Gly Asn Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu 130 135 140 Ser Leu Tyr Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu 145 150 155 160 Asp Glu Ala Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu 165 170 175 Glu Lys Ile Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu Glu 180 185 190 Leu Pro Leu His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile 195 200 205 Glu Ala Tyr Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu 210 215 220 Ala Ile Leu Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu 225 230 235 240 Arg Glu Thr Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu 245 250 255 His Phe Ala Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly 260 265 270 Val Ala Phe Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys 275 280 285 Met Phe Ser Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly 290 295 300 Thr Leu Asp Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp 305 310 315 320 Val Asn Ala Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu 325 330 335 Ala Leu Tyr Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp 340 345 350 Lys Gly Glu Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu 355 360 365 Cys Asn Ala Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr 370 375 380 Pro Thr Phe Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly 385 390 395 400 Pro Leu Gln Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys 405 410 415 Lys Glu Glu Ile Glu Asn Leu Gln Lys Tyr His Asp Thr Ile Ser Arg 420 425 430 Pro Ser His Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala 435 440 445 Glu Ile Ala Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg 450 455 460 Thr Lys Gly Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu 465 470 475 480 Ile Asp Glu Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser 485 490 495 Leu Phe Ala Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln 500 505 510 Ser His Cys Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu 515 520 525 Leu Thr Arg Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro 530 535 540 Phe Glu Arg 545 <210> 141 <211> 6918 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 141 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980 aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040 ttttgtttaa ctttaagaag gagatataca tatgactgaa accgaagctc gtcgttctgc 5100 gaactacgaa cctaacagct gggactatga ttacctgctg tcctccgaca cggacgagtc 5160 catcgaagta tacaaagaca aagcgaaaaa gctggaagcc gaagttcgtc gcgagattaa 5220 taacgaaaaa gcagaatttc tgaccctgct ggaactgatt gacaacgtcc agcgcctggg 5280 cctgggttac cgtttcgagt ctgatatccg tggtgcgctg gatcgcttcg tttcctccgg 5340 cggcttcgat gcggtaacca agacttccct gcacggtacg gcactgtctt tccgtctgct 5400 gcgtcaacac ggttttgagg tttctcagga agcgttcagc ggcttcaaag accaaaacgg 5460 caacttcctg gagaacctga aggaagatat caaagctatc ctgagcctgt acgaggccag 5520 cttcctggct ctggaaggcg aaaacatcct ggacgaggcg aaggttttcg caatctctca 5580 tctgaaagaa ctgtctgaag aaaagatcgg taaagagctg gcagaacagg tgaaccatgc 5640 actggaactg ccactgcatc gccgtactca gcgtctggaa gcagtatggt ctatcgaggc 5700 ctaccgtaaa aaggaggacg cgaatcaggt tctgctggag ctggcaattc tggattacaa 5760 catgatccag tctgtatacc agcgtgatct gcgtgaaacg tcccgttggt ggcgtcgtgt 5820 gggtctggcg accaaactgc actttgctcg tgaccgcctg attgagagct tctactgggc 5880 cgtgggtgta gcattcgaac cgcaatactc cgactgccgt aactccgtcg caaaaatgtt 5940 ttctttcgta accattatcg acgatatcta cgatgtatac ggcaccctgg acgaactgga 6000 gctgtttact gatgcagttg agcgttggga cgtaaacgcc atcaacgacc tgccggatta 6060 catgaaactg tgctttctgg ctctgtataa cactattaac gaaatcgcct acgacaacct 6120 gaaagataaa ggtgagaaca tcctgccgta tctgaccaaa gcctgggctg acctgtgcaa 6180 cgctttcctg caagaagcca agtggctgta caacaaatct actccgacct ttgacgacta 6240 cttcggcaac gcatggaaat cctcttctgg cccgctgcaa ctggtgttcg cttacttcgc 6300 tgtcgtgcag aacattaaaa aggaagagat cgaaaacctg caaaaatacc atgacaccat 6360 ctctcgtcct tcccatatct tccgtctgtg caatgacctg gctagcgcgt ctgcggaaat 6420 tgcgcgtggt gaaaccgcaa atagcgtttc ttgttacatg cgcactaaag gtatctccga 6480 agaactggct accgaaagcg tgatgaatct gatcgatgaa acctggaaaa agatgaacaa 6540 ggaaaaactg ggtggtagcc tgttcgcgaa accgttcgtg gaaaccgcga tcaacctggc 6600 acgtcaatct cactgcactt atcataacgg cgacgcgcat acctctccgg atgagctgac 6660 ccgcaaacgc gttctgtctg taatcactga accgattctg ccgtttgaac gctaaggatc 6720 cgaattcgag ctccgtcgac aagcttgcgg ccgcactcga gcaccaccac caccaccact 6780 gagatccggc tgctaacaaa gcccgaaagg aagctgagtt ggctgctgcc accgctgagc 6840 aataactagc ataacccctt ggggcctcta aacgggtctt gaggggtttt ttgctgaaag 6900 gaggaactat atccggat 6918 <210> 142 <211> 548 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 142 Met Glu Thr Glu Thr Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn 1 5 10 15 Ser Trp Asp Tyr Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile 20 25 30 Glu Val Tyr Lys Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg 35 40 45 Glu Ile Asn Asn Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile 50 55 60 Asp Asn Val Gln Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile 65 70 75 80 Arg Gly Ala Leu Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val 85 90 95 Thr Lys Thr Ser Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg 100 105 110 Gln His Gly Phe Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp 115 120 125 Gln Asn Gly Asn Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile 130 135 140 Leu Ser Leu Tyr Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile 145 150 155 160 Leu Asp Glu Ala Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser 165 170 175 Glu Glu Lys Ile Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu 180 185 190 Glu Leu Pro Leu His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser 195 200 205 Ile Glu Ala Tyr Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu 210 215 220 Leu Ala Ile Leu Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp 225 230 235 240 Leu Arg Glu Thr Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys 245 250 255 Leu His Phe Ala Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val 260 265 270 Gly Val Ala Phe Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala 275 280 285 Lys Met Phe Ser Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr 290 295 300 Gly Thr Leu Asp Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp 305 310 315 320 Asp Val Asn Ala Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe 325 330 335 Leu Ala Leu Tyr Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys 340 345 350 Asp Lys Gly Glu Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp 355 360 365 Leu Cys Asn Ala Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser 370 375 380 Thr Pro Thr Phe Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser 385 390 395 400 Gly Pro Leu Gln Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile 405 410 415 Lys Lys Glu Glu Ile Glu Asn Leu Gln Lys Tyr His Asp Thr Ile Ser 420 425 430 Arg Pro Ser His Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser 435 440 445 Ala Glu Ile Ala Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met 450 455 460 Arg Thr Lys Gly Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn 465 470 475 480 Leu Ile Asp Glu Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly 485 490 495 Ser Leu Phe Ala Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg 500 505 510 Gln Ser His Cys Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp 515 520 525 Glu Leu Thr Arg Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu 530 535 540 Pro Phe Glu Arg 545 <210> 143 <211> 6921 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 143 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980 aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040 ttttgtttaa ctttaagaag gagatataca tatggaaact gaaaccgaag ctcgtcgttc 5100 tgcgaactac gaacctaaca gctgggacta tgattacctg ctgtcctccg acacggacga 5160 gtccatcgaa gtatacaaag acaaagcgaa aaagctggaa gccgaagttc gtcgcgagat 5220 taataacgaa aaagcagaat ttctgaccct gctggaactg attgacaacg tccagcgcct 5280 gggcctgggt taccgtttcg agtctgatat ccgtggtgcg ctggatcgct tcgtttcctc 5340 cggcggcttc gatgcggtaa ccaagacttc cctgcacggt acggcactgt ctttccgtct 5400 gctgcgtcaa cacggttttg aggtttctca ggaagcgttc agcggcttca aagaccaaaa 5460 cggcaacttc ctggagaacc tgaaggaaga tatcaaagct atcctgagcc tgtacgaggc 5520 cagcttcctg gctctggaag gcgaaaacat cctggacgag gcgaaggttt tcgcaatctc 5580 tcatctgaaa gaactgtctg aagaaaagat cggtaaagag ctggcagaac aggtgaacca 5640 tgcactggaa ctgccactgc atcgccgtac tcagcgtctg gaagcagtat ggtctatcga 5700 ggcctaccgt aaaaaggagg acgcgaatca ggttctgctg gagctggcaa ttctggatta 5760 caacatgatc cagtctgtat accagcgtga tctgcgtgaa acgtcccgtt ggtggcgtcg 5820 tgtgggtctg gcgaccaaac tgcactttgc tcgtgaccgc ctgattgaga gcttctactg 5880 ggccgtgggt gtagcattcg aaccgcaata ctccgactgc cgtaactccg tcgcaaaaat 5940 gttttctttc gtaaccatta tcgacgatat ctacgatgta tacggcaccc tggacgaact 6000 ggagctgttt actgatgcag ttgagcgttg ggacgtaaac gccatcaacg acctgccgga 6060 ttacatgaaa ctgtgctttc tggctctgta taacactatt aacgaaatcg cctacgacaa 6120 cctgaaagat aaaggtgaga acatcctgcc gtatctgacc aaagcctggg ctgacctgtg 6180 caacgctttc ctgcaagaag ccaagtggct gtacaacaaa tctactccga cctttgacga 6240 ctacttcggc aacgcatgga aatcctcttc tggcccgctg caactggtgt tcgcttactt 6300 cgctgtcgtg cagaacatta aaaaggaaga gatcgaaaac ctgcaaaaat accatgacac 6360 catctctcgt ccttcccata tcttccgtct gtgcaatgac ctggctagcg cgtctgcgga 6420 aattgcgcgt ggtgaaaccg caaatagcgt ttcttgttac atgcgcacta aaggtatctc 6480 cgaagaactg gctaccgaaa gcgtgatgaa tctgatcgat gaaacctgga aaaagatgaa 6540 caaggaaaaa ctgggtggta gcctgttcgc gaaaccgttc gtggaaaccg cgatcaacct 6600 ggcacgtcaa tctcactgca cttatcataa cggcgacgcg catacctctc cggatgagct 6660 gacccgcaaa cgcgttctgt ctgtaatcac tgaaccgatt ctgccgtttg aacgctaagg 6720 atccgaattc gagctccgtc gacaagcttg cggccgcact cgagcaccac caccaccacc 6780 actgagatcc ggctgctaac aaagcccgaa aggaagctga gttggctgct gccaccgctg 6840 agcaataact agcataaccc cttggggcct ctaaacgggt cttgaggggt tttttgctga 6900 aaggaggaac tatatccgga t 6921 <210> 144 <211> 549 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 144 Met Thr Glu Thr Glu Thr Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro 1 5 10 15 Asn Ser Trp Asp Tyr Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser 20 25 30 Ile Glu Val Tyr Lys Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg 35 40 45 Arg Glu Ile Asn Asn Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu 50 55 60 Ile Asp Asn Val Gln Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp 65 70 75 80 Ile Arg Gly Ala Leu Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala 85 90 95 Val Thr Lys Thr Ser Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu 100 105 110 Arg Gln His Gly Phe Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys 115 120 125 Asp Gln Asn Gly Asn Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala 130 135 140 Ile Leu Ser Leu Tyr Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn 145 150 155 160 Ile Leu Asp Glu Ala Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu 165 170 175 Ser Glu Glu Lys Ile Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala 180 185 190 Leu Glu Leu Pro Leu His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp 195 200 205 Ser Ile Glu Ala Tyr Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu 210 215 220 Glu Leu Ala Ile Leu Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg 225 230 235 240 Asp Leu Arg Glu Thr Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr 245 250 255 Lys Leu His Phe Ala Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala 260 265 270 Val Gly Val Ala Phe Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val 275 280 285 Ala Lys Met Phe Ser Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val 290 295 300 Tyr Gly Thr Leu Asp Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg 305 310 315 320 Trp Asp Val Asn Ala Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys 325 330 335 Phe Leu Ala Leu Tyr Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu 340 345 350 Lys Asp Lys Gly Glu Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala 355 360 365 Asp Leu Cys Asn Ala Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys 370 375 380 Ser Thr Pro Thr Phe Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser 385 390 395 400 Ser Gly Pro Leu Gln Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn 405 410 415 Ile Lys Lys Glu Glu Ile Glu Asn Leu Gln Lys Tyr His Asp Thr Ile 420 425 430 Ser Arg Pro Ser His Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala 435 440 445 Ser Ala Glu Ile Ala Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr 450 455 460 Met Arg Thr Lys Gly Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met 465 470 475 480 Asn Leu Ile Asp Glu Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly 485 490 495 Gly Ser Leu Phe Ala Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala 500 505 510 Arg Gln Ser His Cys Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro 515 520 525 Asp Glu Leu Thr Arg Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile 530 535 540 Leu Pro Phe Glu Arg 545 <210> 145 <211> 6924 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 145 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980 aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040 ttttgtttaa ctttaagaag gagatataca tatgaccgaa actgaaaccg aagctcgtcg 5100 ttctgcgaac tacgaaccta acagctggga ctatgattac ctgctgtcct ccgacacgga 5160 cgagtccatc gaagtataca aagacaaagc gaaaaagctg gaagccgaag ttcgtcgcga 5220 gattaataac gaaaaagcag aatttctgac cctgctggaa ctgattgaca acgtccagcg 5280 cctgggcctg ggttaccgtt tcgagtctga tatccgtggt gcgctggatc gcttcgtttc 5340 ctccggcggc ttcgatgcgg taaccaagac ttccctgcac ggtacggcac tgtctttccg 5400 tctgctgcgt caacacggtt ttgaggtttc tcaggaagcg ttcagcggct tcaaagacca 5460 aaacggcaac ttcctggaga acctgaagga agatatcaaa gctatcctga gcctgtacga 5520 ggccagcttc ctggctctgg aaggcgaaaa catcctggac gaggcgaagg ttttcgcaat 5580 ctctcatctg aaagaactgt ctgaagaaaa gatcggtaaa gagctggcag aacaggtgaa 5640 ccatgcactg gaactgccac tgcatcgccg tactcagcgt ctggaagcag tatggtctat 5700 cgaggcctac cgtaaaaagg aggacgcgaa tcaggttctg ctggagctgg caattctgga 5760 ttacaacatg atccagtctg tataccagcg tgatctgcgt gaaacgtccc gttggtggcg 5820 tcgtgtgggt ctggcgacca aactgcactt tgctcgtgac cgcctgattg agagcttcta 5880 ctgggccgtg ggtgtagcat tcgaaccgca atactccgac tgccgtaact ccgtcgcaaa 5940 aatgttttct ttcgtaacca ttatcgacga tatctacgat gtatacggca ccctggacga 6000 actggagctg tttactgatg cagttgagcg ttgggacgta aacgccatca acgacctgcc 6060 ggattacatg aaactgtgct ttctggctct gtataacact attaacgaaa tcgcctacga 6120 caacctgaaa gataaaggtg agaacatcct gccgtatctg accaaagcct gggctgacct 6180 gtgcaacgct ttcctgcaag aagccaagtg gctgtacaac aaatctactc cgacctttga 6240 cgactacttc ggcaacgcat ggaaatcctc ttctggcccg ctgcaactgg tgttcgctta 6300 cttcgctgtc gtgcagaaca ttaaaaagga agagatcgaa aacctgcaaa aataccatga 6360 caccatctct cgtccttccc atatcttccg tctgtgcaat gacctggcta gcgcgtctgc 6420 ggaaattgcg cgtggtgaaa ccgcaaatag cgtttcttgt tacatgcgca ctaaaggtat 6480 ctccgaagaa ctggctaccg aaagcgtgat gaatctgatc gatgaaacct ggaaaaagat 6540 gaacaaggaa aaactgggtg gtagcctgtt cgcgaaaccg ttcgtggaaa ccgcgatcaa 6600 cctggcacgt caatctcact gcacttatca taacggcgac gcgcatacct ctccggatga 6660 gctgacccgc aaacgcgttc tgtctgtaat cactgaaccg attctgccgt ttgaacgcta 6720 aggatccgaa ttcgagctcc gtcgacaagc ttgcggccgc actcgagcac caccaccacc 6780 accactgaga tccggctgct aacaaagccc gaaaggaagc tgagttggct gctgccaccg 6840 ctgagcaata actagcataa ccccttgggg cctctaaacg ggtcttgagg ggttttttgc 6900 tgaaaggagg aactatatcc ggat 6924 <210> 146 <211> 544 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 146 Met Glu Thr Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr 1 5 10 15 Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val His Lys 20 25 30 Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn 35 40 45 Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln 50 55 60 Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Arg Ala Leu 65 70 75 80 Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Gly Val Thr Lys Thr Ser 85 90 95 Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe 100 105 110 Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn 115 120 125 Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu Tyr 130 135 140 Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala 145 150 155 160 Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile 165 170 175 Gly Lys Glu Leu Ala Glu Gln Val Ser His Ala Leu Glu Leu Pro Leu 180 185 190 His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu Ala Tyr 195 200 205 Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala Ile Leu 210 215 220 Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr 225 230 235 240 Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala 245 250 255 Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe 260 265 270 Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser 275 280 285 Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp 290 295 300 Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala 305 310 315 320 Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr 325 330 335 Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys Gly Glu 340 345 350 Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala 355 360 365 Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe 370 375 380 Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln 385 390 395 400 Leu Ile Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu 405 410 415 Ile Glu Asn Leu Gln Lys Tyr His Asp Ile Ile Ser Arg Pro Ser His 420 425 430 Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala 435 440 445 Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly 450 455 460 Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu 465 470 475 480 Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala 485 490 495 Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys 500 505 510 Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg 515 520 525 Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg 530 535 540 <210> 147 <211> 6909 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 147 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980 aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040 ttttgtttaa ctttaagaag gagatataca tatggaaacg cgtcgttctg cgaactacga 5100 acctaacagc tgggactatg attacctgct gtcctccgac acggacgagt ccatcgaagt 5160 acacaaagac aaagcgaaaa agctggaagc cgaagttcgt cgcgagatta ataacgaaaa 5220 agcagaattt ctgaccctgc tggaactgat tgacaacgtc cagcgcctgg gcctgggtta 5280 ccgtttcgag tctgatatcc gtcgtgcgct ggatcgcttc gtttcctccg gcggcttcga 5340 tggcgtaacc aagacttccc tgcacggtac ggcactgtct ttccgtctgc tgcgtcaaca 5400 cggttttgag gtttctcagg aagcgttcag cggcttcaaa gaccaaaacg gcaacttcct 5460 ggagaacctg aaggaagata tcaaagctat cctgagcctg tacgaggcca gcttcctggc 5520 tctggaaggc gaaaacatcc tggacgaggc gaaggttttc gcaatctctc atctgaaaga 5580 actgtctgaa gaaaagatcg gtaaagagct ggcagaacag gtgtcccatg cactggaact 5640 gccactgcat cgccgtactc agcgtctgga agcagtatgg tctatcgagg cctaccgtaa 5700 aaaggaggac gcgaaccagg ttctgctgga gctggcaatt ctggattaca acatgatcca 5760 gtctgtatac cagcgtgatc tgcgtgaaac gtcccgttgg tggcgtcgtg tgggtctggc 5820 gaccaaactg cactttgctc gtgaccgcct gattgagagc ttctactggg ccgtgggtgt 5880 agcattcgaa ccgcaatact ccgactgccg taactccgtc gcaaaaatgt tttctttcgt 5940 aaccattatc gacgatatct acgatgtata cggcaccctg gacgaactgg agctgtttac 6000 tgatgcagtt gagcgttggg acgtaaacgc catcaacgac ctgccggatt acatgaaact 6060 gtgctttctg gctctgtata acactattaa cgaaatcgcc tacgacaacc tgaaagataa 6120 aggtgagaac atcctgccgt atctgaccaa agcctgggct gacctgtgca acgctttcct 6180 gcaagaagcc aagtggctgt acaacaaatc tactccgacc tttgacgact acttcggcaa 6240 cgcatggaaa tcctcttctg gcccgctgca actgatcttc gcttacttcg ctgtcgtgca 6300 gaacattaaa aaggaagaga tcgaaaacct gcaaaaatac catgacatca tctctcgtcc 6360 ttcccatatc ttccgtctgt gcaatgacct ggctagcgcg tctgcggaaa ttgcgcgtgg 6420 tgaaaccgca aatagcgttt cttgttacat gcgcactaaa ggtatctccg aagaactggc 6480 taccgaaagc gtgatgaatc tgatcgatga aacctggaaa aagatgaaca aggaaaaact 6540 gggtggtagc ctgttcgcga aaccgttcgt ggaaaccgcg atcaacctgg cacgtcaatc 6600 tcactgcact tatcataacg gcgacgcgca tacctctccg gatgagctga cccgcaaacg 6660 cgttctgtct gtaatcactg aaccgattct gccgtttgaa cgctaaggat ccgaattcga 6720 gctccgtcga caagcttgcg gccgcactcg agcaccacca ccaccaccac tgagatccgg 6780 ctgctaacaa agcccgaaag gaagctgagt tggctgctgc caccgctgag caataactag 6840 cataacccct tggggcctct aaacgggtct tgaggggttt tttgctgaaa ggaggaacta 6900 tatccggat 6909 <210> 148 <211> 544 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 148 Met Glu Thr Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr 1 5 10 15 Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val Tyr Lys 20 25 30 Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn 35 40 45 Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln 50 55 60 Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Arg Ala Leu 65 70 75 80 Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys Thr Ser 85 90 95 Leu His Ala Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe 100 105 110 Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn 115 120 125 Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu Tyr 130 135 140 Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala 145 150 155 160 Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile 165 170 175 Gly Lys Asp Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu Pro Leu 180 185 190 His Arg Arg Thr Gln Arg Leu Glu Ala Val Leu Ser Ile Glu Ala Tyr 195 200 205 Arg Lys Lys Glu Asp Ala Asp Gln Val Leu Leu Glu Leu Ala Ile Leu 210 215 220 Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr 225 230 235 240 Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala 245 250 255 Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe 260 265 270 Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser 275 280 285 Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp 290 295 300 Glu Leu Glu Leu Phe Thr Asn Ala Val Glu Arg Trp Asp Val Asn Ala 305 310 315 320 Ile Asp Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr 325 330 335 Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Glu Lys Gly Glu 340 345 350 Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala 355 360 365 Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe 370 375 380 Asp Glu Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln 385 390 395 400 Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu 405 410 415 Ile Glu Asn Leu Gln Lys Tyr His Asp Ile Ile Ser Arg Pro Ser His 420 425 430 Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala 435 440 445 Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly 450 455 460 Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu 465 470 475 480 Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala 485 490 495 Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys 500 505 510 Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg 515 520 525 Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg 530 535 540 <210> 149 <211> 6909 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 149 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980 aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040 ttttgtttaa ctttaagaag gagatataca tatggaaacg cgtcgttctg cgaactacga 5100 acctaacagc tgggactatg attacctgct gtcctccgac acggacgagt ccatcgaagt 5160 atacaaagac aaagcgaaaa agctggaagc cgaagttcgt cgcgagatta ataacgaaaa 5220 agcagaattt ctgaccctgc tggaactgat tgacaacgtc cagcgcctgg gcctgggtta 5280 ccgtttcgag tctgatatcc gtcgtgcgct ggatcgcttc gtttcctccg gcggcttcga 5340 tgcggtaacc aagacttccc tgcacgcgac ggcactgtct ttccgtctgc tgcgtcaaca 5400 cggttttgag gtttctcagg aagcgttcag cggcttcaaa gaccaaaacg gcaacttcct 5460 ggagaacctg aaggaagata tcaaagctat cctgagcctg tacgaggcca gcttcctggc 5520 tctggaaggc gaaaacatcc tggacgaggc gaaggttttc gcaatctctc atctgaaaga 5580 actgtctgaa gaaaagatcg gtaaagatct ggcagaacag gtgaaccatg cactggaact 5640 gccactgcat cgccgtactc agcgtctgga agcagtactg tctatcgagg cctaccgtaa 5700 aaaggaggac gcggatcagg ttctgctgga gctggcaatt ctggattaca acatgatcca 5760 gtctgtatac cagcgtgatc tgcgtgaaac gtcccgttgg tggcgtcgtg tgggtctggc 5820 gaccaaactg cactttgctc gtgaccgcct gattgagagc ttctactggg ccgtgggtgt 5880 agcattcgaa ccgcaatact ccgactgccg taactccgtc gcaaaaatgt tttctttcgt 5940 aaccattatc gacgatatct acgatgtata cggcaccctg gacgaactgg agctgtttac 6000 taacgcagtt gagcgttggg acgtaaacgc catcgacgat ctgccggatt acatgaaact 6060 gtgctttctg gctctgtata acactattaa cgaaatcgcc tacgacaacc tgaaagaaaa 6120 aggtgagaac atcctgccgt atctgaccaa agcctgggct gacctgtgca acgctttcct 6180 gcaagaagcc aagtggctgt acaacaaatc tactccgacc tttgacgaat acttcggcaa 6240 cgcatggaaa tcctcttctg gcccgctgca actggtgttc gcttacttcg ctgtcgtgca 6300 gaacattaaa aaggaagaga tcgaaaacct gcaaaaatac catgacatca tctctcgtcc 6360 ttcccatatc ttccgtctgt gcaatgacct ggctagcgcg tctgcggaaa ttgcgcgtgg 6420 tgaaaccgca aatagcgttt cttgttacat gcgcactaaa ggtatctccg aagaactggc 6480 taccgaaagc gtgatgaatc tgatcgatga aacctggaaa aagatgaaca aggaaaaact 6540 gggtggtagc ctgttcgcga aaccgttcgt ggaaaccgcg atcaacctgg cacgtcaatc 6600 tcactgcact tatcataacg gcgacgcgca tacctctccg gatgagctga cccgcaaacg 6660 cgttctgtct gtaatcactg aaccgattct gccgtttgaa cgctaaggat ccgaattcga 6720 gctccgtcga caagcttgcg gccgcactcg agcaccacca ccaccaccac tgagatccgg 6780 ctgctaacaa agcccgaaag gaagctgagt tggctgctgc caccgctgag caataactag 6840 cataacccct tggggcctct aaacgggtct tgaggggttt tttgctgaaa ggaggaacta 6900 tatccggat 6909 <210> 150 <211> 551 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 150 Met Glu Ala Arg Arg Ser Ala Asn Tyr Gln Pro Asn Leu Trp Asn Phe 1 5 10 15 Glu Phe Leu Gln Ser Leu Glu Asn Asp Leu Lys Val Glu Lys Leu Glu 20 25 30 Glu Lys Ala Thr Lys Leu Glu Glu Glu Val Arg Cys Met Ile Asn Arg 35 40 45 Val Asp Thr Gln Pro Leu Ser Leu Leu Glu Leu Ile Asp Asp Val Gln 50 55 60 Arg Leu Gly Leu Thr Tyr Lys Phe Glu Lys Asp Ile Ile Lys Ala Leu 65 70 75 80 Glu Asn Ile Val Leu Leu Asp Glu Asn Lys Lys Asn Lys Ser Asp Leu 85 90 95 His Ala Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe Glu 100 105 110 Val Ser Gln Asp Val Phe Glu Arg Phe Lys Asp Lys Glu Gly Gly Phe 115 120 125 Ser Gly Glu Leu Lys Gly Asp Val Gln Gly Leu Leu Ser Leu Tyr Glu 130 135 140 Ala Ser Tyr Leu Gly Phe Glu Gly Glu Asn Leu Leu Glu Glu Ala Arg 145 150 155 160 Thr Phe Ser Ile Thr His Leu Lys Asn Asn Leu Lys Glu Gly Ile Asn 165 170 175 Thr Lys Val Ala Glu Gln Val Ser His Ala Leu Glu Leu Pro Tyr His 180 185 190 Gln Arg Leu His Arg Leu Glu Ala Arg Trp Phe Leu Asp Lys Tyr Glu 195 200 205 Pro Lys Glu Pro His His Gln Leu Leu Leu Glu Leu Ala Lys Leu Asp 210 215 220 Phe Asn Met Val Gln Thr Leu His Gln Lys Glu Leu Gln Asp Leu Ser 225 230 235 240 Arg Trp Trp Thr Glu Met Gly Leu Ala Ser Lys Leu Asp Phe Val Arg 245 250 255 Asp Arg Leu Met Glu Val Tyr Phe Trp Ala Leu Gly Met Ala Pro Asp 260 265 270 Pro Gln Phe Gly Glu Cys Arg Lys Ala Val Thr Lys Met Phe Gly Leu 275 280 285 Val Thr Ile Ile Asp Asp Val Tyr Asp Val Tyr Gly Thr Leu Asp Glu 290 295 300 Leu Gln Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala Ile 305 310 315 320 Asn Thr Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr Asn 325 330 335 Thr Val Asn Asp Thr Ser Tyr Ser Ile Leu Lys Glu Lys Gly His Asn 340 345 350 Asn Leu Ser Tyr Leu Thr Lys Ser Trp Arg Glu Leu Cys Lys Ala Phe 355 360 365 Leu Gln Glu Ala Lys Trp Ser Asn Asn Lys Ile Ile Pro Ala Phe Ser 370 375 380 Lys Tyr Leu Glu Asn Ala Ser Val Ser Ser Ser Gly Val Ala Leu Leu 385 390 395 400 Ala Pro Ser Tyr Phe Ser Val Cys Gln Gln Gln Glu Asp Ile Ser Asp 405 410 415 His Ala Leu Arg Ser Leu Thr Asp Phe His Gly Leu Val Arg Ser Ser 420 425 430 Cys Val Ile Phe Arg Leu Cys Asn Asp Leu Ala Thr Ser Ala Ala Glu 435 440 445 Leu Glu Arg Gly Glu Thr Thr Asn Ser Ile Ile Ser Tyr Met His Glu 450 455 460 Asn Asp Gly Thr Ser Glu Glu Gln Ala Arg Glu Glu Leu Arg Lys Leu 465 470 475 480 Ile Asp Ala Glu Trp Lys Lys Met Asn Arg Glu Arg Val Ser Asp Ser 485 490 495 Thr Leu Leu Pro Lys Ala Phe Met Glu Ile Ala Val Asn Met Ala Arg 500 505 510 Val Ser His Cys Thr Tyr Gln Tyr Gly Asp Gly Leu Gly Arg Pro Asp 515 520 525 Tyr Ala Thr Glu Asn Arg Ile Lys Leu Leu Leu Ile Asp Pro Phe Pro 530 535 540 Ile Asn Gln Leu Met Tyr Val 545 550 <210> 151 <211> 6935 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 151 tcgagcacca ccaccaccac cactgagatc cggctgctaa caaagcccga aaggaagctg 60 agttggctgc tgccaccgct gagcaataac tagcataacc ccttggggcc tctaaacggg 120 tcttgagggg ttttttgctg aaaggaggaa ctatatccgg attggcgaat gggacgcgcc 180 ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 240 tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 300 cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 360 acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 420 ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 480 gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 540 tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 600 ttttaacaaa atattaacgt ttacaatttc aggtggcact tttcggggaa atgtgcgcgg 660 aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca tgaattaatt 720 cttagaaaaa ctcatcgagc atcaaatgaa actgcaattt attcatatca ggattatcaa 780 taccatattt ttgaaaaagc cgtttctgta atgaaggaga aaactcaccg aggcagttcc 840 ataggatggc aagatcctgg tatcggtctg cgattccgac tcgtccaaca tcaatacaac 900 ctattaattt cccctcgtca aaaataaggt tatcaagtga gaaatcacca tgagtgacga 960 ctgaatccgg tgagaatggc aaaagtttat gcatttcttt ccagacttgt tcaacaggcc 1020 agccattacg ctcgtcatca aaatcactcg catcaaccaa accgttattc attcgtgatt 1080 gcgcctgagc gagacgaaat acgcgatcgc tgttaaaagg acaattacaa acaggaatcg 1140 aatgcaaccg gcgcaggaac actgccagcg catcaacaat attttcacct gaatcaggat 1200 attcttctaa tacctggaat gctgttttcc cggggatcgc agtggtgagt aaccatgcat 1260 catcaggagt acggataaaa tgcttgatgg tcggaagagg cataaattcc gtcagccagt 1320 ttagtctgac catctcatct gtaacatcat tggcaacgct acctttgcca tgtttcagaa 1380 acaactctgg cgcatcgggc ttcccataca atcgatagat tgtcgcacct gattgcccga 1440 cattatcgcg agcccattta tacccatata aatcagcatc catgttggaa tttaatcgcg 1500 gcctagagca agacgtttcc cgttgaatat ggctcataac accccttgta ttactgttta 1560 tgtaagcaga cagttttatt gttcatgacc aaaatccctt aacgtgagtt ttcgttccac 1620 tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc 1680 gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat 1740 caagagctac caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat 1800 actgtccttc tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct 1860 acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt 1920 cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc gggctgaacg 1980 gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta 2040 cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg 2100 gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg 2160 tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc 2220 tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg 2280 gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga ttctgtggat 2340 aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac gaccgagcgc 2400 agcgagtcag tgagcgagga agcggaagag cgcctgatgc ggtattttct ccttacgcat 2460 ctgtgcggta tttcacaccg catatatggt gcactctcag tacaatctgc tctgatgccg 2520 catagttaag ccagtataca ctccgctatc gctacgtgac tgggtcatgg ctgcgccccg 2580 acacccgcca acacccgctg acgcgccctg acgggcttgt ctgctcccgg catccgctta 2640 cagacaagct gtgaccgtct ccgggagctg catgtgtcag aggttttcac cgtcatcacc 2700 gaaacgcgcg aggcagctgc ggtaaagctc atcagcgtgg tcgtgaagcg attcacagat 2760 gtctgcctgt tcatccgcgt ccagctcgtt gagtttctcc agaagcgtta atgtctggct 2820 tctgataaag cgggccatgt taagggcggt tttttcctgt ttggtcactg atgcctccgt 2880 gtaaggggga tttctgttca tgggggtaat gataccgatg aaacgagaga ggatgctcac 2940 gatacgggtt actgatgatg aacatgcccg gttactggaa cgttgtgagg gtaaacaact 3000 ggcggtatgg atgcggcggg accagagaaa aatcactcag ggtcaatgcc agcgcttcgt 3060 taatacagat gtaggtgttc cacagggtag ccagcagcat cctgcgatgc agatccggaa 3120 cataatggtg cagggcgctg acttccgcgt ttccagactt tacgaaacac ggaaaccgaa 3180 gaccattcat gttgttgctc aggtcgcaga cgttttgcag cagcagtcgc ttcacgttcg 3240 ctcgcgtatc ggtgattcat tctgctaacc agtaaggcaa ccccgccagc ctagccgggt 3300 cctcaacgac aggagcacga tcatgcgcac ccgtggggcc gccatgccgg cgataatggc 3360 ctgcttctcg ccgaaacgtt tggtggcggg accagtgacg aaggcttgag cgagggcgtg 3420 caagattccg aataccgcaa gcgacaggcc gatcatcgtc gcgctccagc gaaagcggtc 3480 ctcgccgaaa atgacccaga gcgctgccgg cacctgtcct acgagttgca tgataaagaa 3540 gacagtcata agtgcggcga cgatagtcat gccccgcgcc caccggaagg agctgactgg 3600 gttgaaggct ctcaagggca tcggtcgaga tcccggtgcc taatgagtga gctaacttac 3660 attaattgcg ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca 3720 ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgcc agggtggttt 3780 ttcttttcac cagtgagacg ggcaacagct gattgccctt caccgcctgg ccctgagaga 3840 gttgcagcaa gcggtccacg ctggtttgcc ccagcaggcg aaaatcctgt ttgatggtgg 3900 ttaacggcgg gatataacat gagctgtctt cggtatcgtc gtatcccact accgagatat 3960 ccgcaccaac gcgcagcccg gactcggtaa tggcgcgcat tgcgcccagc gccatctgat 4020 cgttggcaac cagcatcgca gtgggaacga tgccctcatt cagcatttgc atggtttgtt 4080 gaaaaccgga catggcactc cagtcgcctt cccgttccgc tatcggctga atttgattgc 4140 gagtgagata tttatgccag ccagccagac gcagacgcgc cgagacagaa cttaatgggc 4200 ccgctaacag cgcgatttgc tggtgaccca atgcgaccag atgctccacg cccagtcgcg 4260 taccgtcttc atgggagaaa ataatactgt tgatgggtgt ctggtcagag acatcaagaa 4320 ataacgccgg aacattagtg caggcagctt ccacagcaat ggcatcctgg tcatccagcg 4380 gatagttaat gatcagccca ctgacgcgtt gcgcgagaag attgtgcacc gccgctttac 4440 aggcttcgac gccgcttcgt tctaccatcg acaccaccac gctggcaccc agttgatcgg 4500 cgcgagattt aatcgccgcg acaatttgcg acggcgcgtg cagggccaga ctggaggtgg 4560 caacgccaat cagcaacgac tgtttgcccg ccagttgttg tgccacgcgg ttgggaatgt 4620 aattcagctc cgccatcgcc gcttccactt tttcccgcgt tttcgcagaa acgtggctgg 4680 cctggttcac cacgcgggaa acggtctgat aagagacacc ggcatactct gcgacatcgt 4740 ataacgttac tggtttcaca ttcaccaccc tgaattgact ctcttccggg cgctatcatg 4800 ccataccgcg aaaggttttg cgccattcga tggtgtccgg gatctcgacg ctctccctta 4860 tgcgactcct gcattaggaa gcagcccagt agtaggttga ggccgttgag caccgccgcc 4920 gcaaggaatg gtgcatgcaa ggagatggcg cccaacagtc ccccggccac ggggcctgcc 4980 accataccca cgccgaaaca agcgctcatg agcccgaagt ggcgagcccg atcttcccca 5040 tcggtgatgt cggcgatata ggcgccagca accgcacctg tggcgccggt gatgccggcc 5100 acgatgcgtc cggcgtagag gatcgagatc tcgatcccgc gaaattaata cgactcacta 5160 taggggaatt gtgagcggat aacaattccc ctctagaaat aattttgttt aactttaaga 5220 aggagatata ccatggaagc tcgtcgttcc gcaaactatc agccaaacct gtggaatttc 5280 gaattcctgc aatccctgga gaacgacctg aaagtggaaa agctggagga gaaagcgacc 5340 aaactggagg aagaagttcg ctgcatgatc aaccgtgtag acacccagcc gctgtccctg 5400 ctggagctga tcgacgatgt gcagcgcctg ggtctgacct acaaatttga aaaagacatc 5460 attaaagccc tggaaaacat cgtactgctg gacgaaaaca aaaagaacaa atctgacctg 5520 cacgcaaccg ctctgtcttt ccgtctgctg cgtcagcacg gtttcgaggt ttctcaggat 5580 gtttttgagc gtttcaagga taaagaaggt ggtttcagcg gtgaactgaa aggtgacgtc 5640 caaggcctgc tgagcctgta tgaagcgtct tacctgggtt tcgagggtga gaacctgctg 5700 gaggaggcgc gtaccttttc catcacccac ctgaagaaca acctgaaaga aggcattaat 5760 accaaggttg cagaacaagt gagccacgcc ctggaactgc catatcacca gcgtctgcac 5820 cgtctggagg cacgttggtt cctggataaa tacgaaccga aagaaccgca tcaccagctg 5880 ctgctggagc tggcgaagct ggattttaac atggtacaga ccctgcacca gaaagagctg 5940 caagatctgt cccgctggtg gaccgagatg ggcctggcta gcaaactgga ttttgtacgc 6000 gaccgcctga tggaagttta tttctgggca ctgggtatgg cgccagaccc gcagtttggt 6060 gaatgtcgca aagctgttac taaaatgttt ggtctggtga cgatcatcga tgacgtgtat 6120 gacgtttatg gcactctgga cgaactgcaa ctgttcaccg atgctgtaga gcgctgggac 6180 gttaacgcta ttaacaccct gccggactat atgaaactgt gtttcctggc actgtacaac 6240 accgttaacg acacgtccta ttctattctg aaagagaaag gtcataacaa cctgtcctat 6300 ctgacgaaaa gctggcgtga actgtgcaaa gcctttctgc aagaggcgaa atggtccaac 6360 aacaaaatta tcccggcttt ctccaagtac ctggaaaacg ccagcgtttc ctcctccggt 6420 gtagcgctgc tggcgccgtc ttacttttcc gtatgccagc agcaggaaga catctccgac 6480 cacgcgctgc gttccctgac cgacttccat ggtctggtgc gttctagctg cgttatcttc 6540 cgcctgtgca acgatctggc cacctctgcg gcggagctgg aacgtggcga gactaccaat 6600 tctatcatta gctacatgca cgaaaacgat ggtaccagcg aggaacaggc ccgcgaagaa 6660 ctgcgtaaac tgatcgacgc cgaatggaaa aagatgaatc gtgaacgcgt tagcgactcc 6720 accctgctgc ctaaagcgtt catggaaatc gcagttaaca tggcacgtgt ttcccactgc 6780 acctaccagt atggcgatgg tctgggtcgc ccagactacg cgactgaaaa ccgcatcaaa 6840 ctgctgctga ttgacccttt cccgattaac cagctgatgt atgtctaact gcagggatcc 6900 gaattcgagc tccgtcgaca agcttgcggc cgcac 6935 <210> 152 <211> 553 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 152 Met Glu His Asn Ser Arg Arg Ser Ala Asn Tyr Gln Pro Asn Leu Trp 1 5 10 15 Asn Phe Glu Phe Leu Gln Ser Leu Glu Asn Asp Leu Lys Val Glu Lys 20 25 30 Leu Glu Glu Lys Ala Thr Lys Leu Glu Glu Glu Val Arg Cys Met Ile 35 40 45 Asn Arg Val Asp Thr Gln Pro Leu Ser Leu Leu Glu Leu Ile Asp Asp 50 55 60 Val Gln Arg Leu Gly Leu Thr Tyr Lys Phe Glu Lys Asp Ile Ile Lys 65 70 75 80 Ala Leu Glu Asn Ile Val Leu Leu Asp Glu Asn Lys Lys Asn Lys Ser 85 90 95 Asp Leu His Ala Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly 100 105 110 Phe Glu Val Ser Gln Asp Val Phe Glu Arg Phe Lys Asp Lys Glu Gly 115 120 125 Gly Phe Ser Gly Glu Leu Lys Gly Asp Val Gln Gly Leu Leu Ser Leu 130 135 140 Tyr Glu Ala Ser Tyr Leu Gly Phe Glu Gly Glu Asn Leu Leu Glu Glu 145 150 155 160 Ala Arg Thr Phe Ser Ile Thr His Leu Lys Asn Asn Leu Lys Glu Gly 165 170 175 Ile Asn Thr Lys Val Ala Glu Gln Val Ser His Ala Leu Glu Leu Pro 180 185 190 Tyr His Gln Arg Leu His Arg Leu Glu Ala Arg Trp Phe Leu Asp Lys 195 200 205 Tyr Glu Pro Lys Glu Pro His His Gln Leu Leu Leu Glu Leu Ala Lys 210 215 220 Leu Asp Phe Asn Met Val Gln Thr Leu His Gln Lys Glu Leu Gln Asp 225 230 235 240 Leu Ser Arg Trp Trp Thr Glu Met Gly Leu Ala Ser Lys Leu Asp Phe 245 250 255 Val Arg Asp Arg Leu Met Glu Val Tyr Phe Trp Ala Leu Gly Met Ala 260 265 270 Pro Asp Pro Gln Phe Gly Glu Cys Arg Lys Ala Val Thr Lys Met Phe 275 280 285 Gly Leu Val Thr Ile Ile Asp Asp Val Tyr Asp Val Tyr Gly Thr Leu 290 295 300 Asp Glu Leu Gln Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn 305 310 315 320 Ala Ile Asn Thr Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu 325 330 335 Tyr Asn Thr Val Asn Asp Thr Ser Tyr Ser Ile Leu Lys Glu Lys Gly 340 345 350 His Asn Asn Leu Ser Tyr Leu Thr Lys Ser Trp Arg Glu Leu Cys Lys 355 360 365 Ala Phe Leu Gln Glu Ala Lys Trp Ser Asn Asn Lys Ile Ile Pro Ala 370 375 380 Phe Ser Lys Tyr Leu Glu Asn Ala Ser Val Ser Ser Ser Gly Val Ala 385 390 395 400 Leu Leu Ala Pro Ser Tyr Phe Ser Val Cys Gln Gln Gln Glu Asp Ile 405 410 415 Ser Asp His Ala Leu Arg Ser Leu Thr Asp Phe His Gly Leu Val Arg 420 425 430 Ser Ser Cys Val Ile Phe Arg Leu Cys Asn Asp Leu Ala Thr Ser Ala 435 440 445 Ala Glu Leu Glu Arg Gly Glu Thr Thr Asn Ser Ile Ile Ser Tyr Met 450 455 460 His Glu Asn Asp Gly Thr Ser Glu Glu Gln Ala Arg Glu Glu Leu Arg 465 470 475 480 Lys Leu Ile Asp Ala Glu Trp Lys Lys Met Asn Arg Glu Arg Val Ser 485 490 495 Asp Ser Thr Leu Leu Pro Lys Ala Phe Met Glu Ile Ala Val Asn Met 500 505 510 Ala Arg Val Ser His Cys Thr Tyr Gln Tyr Gly Asp Gly Leu Gly Arg 515 520 525 Pro Asp Tyr Ala Thr Glu Asn Arg Ile Lys Leu Leu Leu Ile Asp Pro 530 535 540 Phe Pro Ile Asn Gln Leu Met Tyr Val 545 550 <210> 153 <211> 6941 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 153 tcgagcacca ccaccaccac cactgagatc cggctgctaa caaagcccga aaggaagctg 60 agttggctgc tgccaccgct gagcaataac tagcataacc ccttggggcc tctaaacggg 120 tcttgagggg ttttttgctg aaaggaggaa ctatatccgg attggcgaat gggacgcgcc 180 ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 240 tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 300 cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 360 acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 420 ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 480 gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 540 tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 600 ttttaacaaa atattaacgt ttacaatttc aggtggcact tttcggggaa atgtgcgcgg 660 aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca tgaattaatt 720 cttagaaaaa ctcatcgagc atcaaatgaa actgcaattt attcatatca ggattatcaa 780 taccatattt ttgaaaaagc cgtttctgta atgaaggaga aaactcaccg aggcagttcc 840 ataggatggc aagatcctgg tatcggtctg cgattccgac tcgtccaaca tcaatacaac 900 ctattaattt cccctcgtca aaaataaggt tatcaagtga gaaatcacca tgagtgacga 960 ctgaatccgg tgagaatggc aaaagtttat gcatttcttt ccagacttgt tcaacaggcc 1020 agccattacg ctcgtcatca aaatcactcg catcaaccaa accgttattc attcgtgatt 1080 gcgcctgagc gagacgaaat acgcgatcgc tgttaaaagg acaattacaa acaggaatcg 1140 aatgcaaccg gcgcaggaac actgccagcg catcaacaat attttcacct gaatcaggat 1200 attcttctaa tacctggaat gctgttttcc cggggatcgc agtggtgagt aaccatgcat 1260 catcaggagt acggataaaa tgcttgatgg tcggaagagg cataaattcc gtcagccagt 1320 ttagtctgac catctcatct gtaacatcat tggcaacgct acctttgcca tgtttcagaa 1380 acaactctgg cgcatcgggc ttcccataca atcgatagat tgtcgcacct gattgcccga 1440 cattatcgcg agcccattta tacccatata aatcagcatc catgttggaa tttaatcgcg 1500 gcctagagca agacgtttcc cgttgaatat ggctcataac accccttgta ttactgttta 1560 tgtaagcaga cagttttatt gttcatgacc aaaatccctt aacgtgagtt ttcgttccac 1620 tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc 1680 gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat 1740 caagagctac caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat 1800 actgtccttc tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct 1860 acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt 1920 cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc gggctgaacg 1980 gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta 2040 cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg 2100 gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg 2160 tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc 2220 tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg 2280 gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga ttctgtggat 2340 aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac gaccgagcgc 2400 agcgagtcag tgagcgagga agcggaagag cgcctgatgc ggtattttct ccttacgcat 2460 ctgtgcggta tttcacaccg catatatggt gcactctcag tacaatctgc tctgatgccg 2520 catagttaag ccagtataca ctccgctatc gctacgtgac tgggtcatgg ctgcgccccg 2580 acacccgcca acacccgctg acgcgccctg acgggcttgt ctgctcccgg catccgctta 2640 cagacaagct gtgaccgtct ccgggagctg catgtgtcag aggttttcac cgtcatcacc 2700 gaaacgcgcg aggcagctgc ggtaaagctc atcagcgtgg tcgtgaagcg attcacagat 2760 gtctgcctgt tcatccgcgt ccagctcgtt gagtttctcc agaagcgtta atgtctggct 2820 tctgataaag cgggccatgt taagggcggt tttttcctgt ttggtcactg atgcctccgt 2880 gtaaggggga tttctgttca tgggggtaat gataccgatg aaacgagaga ggatgctcac 2940 gatacgggtt actgatgatg aacatgcccg gttactggaa cgttgtgagg gtaaacaact 3000 ggcggtatgg atgcggcggg accagagaaa aatcactcag ggtcaatgcc agcgcttcgt 3060 taatacagat gtaggtgttc cacagggtag ccagcagcat cctgcgatgc agatccggaa 3120 cataatggtg cagggcgctg acttccgcgt ttccagactt tacgaaacac ggaaaccgaa 3180 gaccattcat gttgttgctc aggtcgcaga cgttttgcag cagcagtcgc ttcacgttcg 3240 ctcgcgtatc ggtgattcat tctgctaacc agtaaggcaa ccccgccagc ctagccgggt 3300 cctcaacgac aggagcacga tcatgcgcac ccgtggggcc gccatgccgg cgataatggc 3360 ctgcttctcg ccgaaacgtt tggtggcggg accagtgacg aaggcttgag cgagggcgtg 3420 caagattccg aataccgcaa gcgacaggcc gatcatcgtc gcgctccagc gaaagcggtc 3480 ctcgccgaaa atgacccaga gcgctgccgg cacctgtcct acgagttgca tgataaagaa 3540 gacagtcata agtgcggcga cgatagtcat gccccgcgcc caccggaagg agctgactgg 3600 gttgaaggct ctcaagggca tcggtcgaga tcccggtgcc taatgagtga gctaacttac 3660 attaattgcg ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca 3720 ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgcc agggtggttt 3780 ttcttttcac cagtgagacg ggcaacagct gattgccctt caccgcctgg ccctgagaga 3840 gttgcagcaa gcggtccacg ctggtttgcc ccagcaggcg aaaatcctgt ttgatggtgg 3900 ttaacggcgg gatataacat gagctgtctt cggtatcgtc gtatcccact accgagatat 3960 ccgcaccaac gcgcagcccg gactcggtaa tggcgcgcat tgcgcccagc gccatctgat 4020 cgttggcaac cagcatcgca gtgggaacga tgccctcatt cagcatttgc atggtttgtt 4080 gaaaaccgga catggcactc cagtcgcctt cccgttccgc tatcggctga atttgattgc 4140 gagtgagata tttatgccag ccagccagac gcagacgcgc cgagacagaa cttaatgggc 4200 ccgctaacag cgcgatttgc tggtgaccca atgcgaccag atgctccacg cccagtcgcg 4260 taccgtcttc atgggagaaa ataatactgt tgatgggtgt ctggtcagag acatcaagaa 4320 ataacgccgg aacattagtg caggcagctt ccacagcaat ggcatcctgg tcatccagcg 4380 gatagttaat gatcagccca ctgacgcgtt gcgcgagaag attgtgcacc gccgctttac 4440 aggcttcgac gccgcttcgt tctaccatcg acaccaccac gctggcaccc agttgatcgg 4500 cgcgagattt aatcgccgcg acaatttgcg acggcgcgtg cagggccaga ctggaggtgg 4560 caacgccaat cagcaacgac tgtttgcccg ccagttgttg tgccacgcgg ttgggaatgt 4620 aattcagctc cgccatcgcc gcttccactt tttcccgcgt tttcgcagaa acgtggctgg 4680 cctggttcac cacgcgggaa acggtctgat aagagacacc ggcatactct gcgacatcgt 4740 ataacgttac tggtttcaca ttcaccaccc tgaattgact ctcttccggg cgctatcatg 4800 ccataccgcg aaaggttttg cgccattcga tggtgtccgg gatctcgacg ctctccctta 4860 tgcgactcct gcattaggaa gcagcccagt agtaggttga ggccgttgag caccgccgcc 4920 gcaaggaatg gtgcatgcaa ggagatggcg cccaacagtc ccccggccac ggggcctgcc 4980 accataccca cgccgaaaca agcgctcatg agcccgaagt ggcgagcccg atcttcccca 5040 tcggtgatgt cggcgatata ggcgccagca accgcacctg tggcgccggt gatgccggcc 5100 acgatgcgtc cggcgtagag gatcgagatc tcgatcccgc gaaattaata cgactcacta 5160 taggggaatt gtgagcggat aacaattccc ctctagaaat aattttgttt aactttaaga 5220 aggagatata ccatggagca taattcccgt cgttccgcaa actatcagcc aaacctgtgg 5280 aatttcgaat tcctgcaatc cctggagaac gacctgaaag tggaaaagct ggaggagaaa 5340 gcgaccaaac tggaggaaga agttcgctgc atgatcaacc gtgtagacac ccagccgctg 5400 tccctgctgg agctgatcga cgatgtgcag cgcctgggtc tgacctacaa atttgaaaaa 5460 gacatcatta aagccctgga aaacatcgta ctgctggacg aaaacaaaaa gaacaaatct 5520 gacctgcacg caaccgctct gtctttccgt ctgctgcgtc agcacggttt cgaggtttct 5580 caggatgttt ttgagcgttt caaggataaa gaaggtggtt tcagcggtga actgaaaggt 5640 gacgtccaag gcctgctgag cctgtatgaa gcgtcttacc tgggtttcga gggtgagaac 5700 ctgctggagg aggcgcgtac cttttccatc acccacctga agaacaacct gaaagaaggc 5760 attaatacca aggttgcaga acaagtgagc cacgccctgg aactgccata tcaccagcgt 5820 ctgcaccgtc tggaggcacg ttggttcctg gataaatacg aaccgaaaga accgcatcac 5880 cagctgctgc tggagctggc gaagctggat tttaacatgg tacagaccct gcaccagaaa 5940 gagctgcaag atctgtcccg ctggtggacc gagatgggcc tggctagcaa actggatttt 6000 gtacgcgacc gcctgatgga agtttatttc tgggcactgg gtatggcgcc agacccgcag 6060 tttggtgaat gtcgcaaagc tgttactaaa atgtttggtc tggtgacgat catcgatgac 6120 gtgtatgacg tttatggcac tctggacgaa ctgcaactgt tcaccgatgc tgtagagcgc 6180 tgggacgtta acgctattaa caccctgccg gactatatga aactgtgttt cctggcactg 6240 tacaacaccg ttaacgacac gtcctattct attctgaaag agaaaggtca taacaacctg 6300 tcctatctga cgaaaagctg gcgtgaactg tgcaaagcct ttctgcaaga ggcgaaatgg 6360 tccaacaaca aaattatccc ggctttctcc aagtacctgg aaaacgccag cgtttcctcc 6420 tccggtgtag cgctgctggc gccgtcttac ttttccgtat gccagcagca ggaagacatc 6480 tccgaccacg cgctgcgttc cctgaccgac ttccatggtc tggtgcgttc tagctgcgtt 6540 atcttccgcc tgtgcaacga tctggccacc tctgcggcgg agctggaacg tggcgagact 6600 accaattcta tcattagcta catgcacgaa aacgatggta ccagcgagga acaggcccgc 6660 gaagaactgc gtaaactgat cgacgccgaa tggaaaaaga tgaatcgtga acgcgttagc 6720 gactccaccc tgctgcctaa agcgttcatg gaaatcgcag ttaacatggc acgtgtttcc 6780 cactgcacct accagtatgg cgatggtctg ggtcgcccag actacgcgac tgaaaaccgc 6840 atcaaactgc tgctgattga ccctttcccg attaaccagc tgatgtatgt ctaactgcag 6900 ggatccgaat tcgagctccg tcgacaagct tgcggccgca c 6941 <210> 154 <211> 4352 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 154 tagaaaaact catcgagcat caaatgaaac tgcaatttat tcatatcagg attatcaata 60 ccatattttt gaaaaagccg tttctgtaat gaaggagaaa actcaccgag gcagttccat 120 aggatggcaa gatcctggta tcggtctgcg attccgactc gtccaacatc aatacaacct 180 attaatttcc cctcgtcaaa aataaggtta tcaagtgaga aatcaccatg agtgacgact 240 gaatccggtg agaatggcaa aagtttatgc atttctttcc agacttgttc aacaggccag 300 ccattacgct cgtcatcaaa atcactcgca tcaaccaaac cgttattcat tcgtgattgc 360 gcctgagcga ggcgaaatac gcgatcgctg ttaaaaggac aattacaaac aggaatcgag 420 tgcaaccggc gcaggaacac tgccagcgca tcaacaatat tttcacctga atcaggatat 480 tcttctaata cctggaacgc tgtttttccg gggatcgcag tggtgagtaa ccatgcatca 540 tcaggagtac ggataaaatg cttgatggtc ggaagtggca taaattccgt cagccagttt 600 agtctgacca tctcatctgt aacatcattg gcaacgctac ctttgccatg tttcagaaac 660 aactctggcg catcgggctt cccatacaag cgatagattg tcgcacctga ttgcccgaca 720 ttatcgcgag cccatttata cccatataaa tcagcatcca tgttggaatt taatcgcggc 780 ctcgacgttt cccgttgaat atggctcata ttcttccttt ttcaatatta ttgaagcatt 840 tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 900 ataggggtca gtgttacaac caattaacca attctgaaca ttatcgcgag cccatttata 960 cctgaatatg gctcataaca ccccttgttt gcctggcggc agtagcgcgg tggtcccacc 1020 tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggactcc 1080 ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact 1140 gggcctttcg cccgggctaa ttagggggtg tcgccctttc gattgacgct gcagttagac 1200 atacatcagc tggttaatcg ggaaagggtc aatcagcagc agtttgatgc ggttttcagt 1260 cgcgtagtct gggcgaccca gaccatcgcc atactggtag gtgcagtggg aaacacgtgc 1320 catgttaact gcgatttcca tgaacgcttt aggcagcagg gtggagtcgc taacgcgttc 1380 acgattcatc tttttccatt cggcgtcgat cagtttacgc agttcttcgc gggcctgttc 1440 ctcgctggta ccatcgtttt cgtgcatgta gctaatgata gaattggtag tctcgccacg 1500 ttccagctcc gccgcagagg tggccagatc gttgcacagg cggaagataa cgcagctaga 1560 acgcaccaga ccatggaagt cggtcaggga acgcagcgcg tggtcggaga tgtcttcctg 1620 ctgctggcat acggaaaagt aagacggcgc cagcagcgct acaccggagg aggaaacgct 1680 ggcgttttcc aggtacttgg agaaagccgg gataattttg ttgttggacc atttcgcctc 1740 ttgcagaaag gctttgcaca gttcacgcca gcttttcgtc agataggaca ggttgttatg 1800 acctttctct ttcagaatag aataggacgt gtcgttaacg gtgttgtaca gtgccaggaa 1860 acacagtttc atatagtccg gcagggtgtt aatagcgtta acgtcccagc gctctacagc 1920 atcggtgaac agttgcagtt cgtccagagt gccataaacg tcatacacgt catcgatgat 1980 cgtcaccaga ccaaacattt tagtaacagc tttgcgacat tcaccaaact gcgggtctgg 2040 cgccataccc agtgcccaga aataaacttc catcaggcgg tcgcgtacaa aatccagttt 2100 gctagccagg cccatctcgg tccaccagcg ggacagatct tgcagctctt tctggtgcag 2160 ggtctgtacc atgttaaaat ccagcttcgc cagctccagc agcagctggt gatgcggttc 2220 tttcggttcg tatttatcca ggaaccaacg tgcctccaga cggtgcagac gctggtgata 2280 tggcagttcc agggcgtggc tcacttgttc tgcaaccttg gtattaatgc cttctttcag 2340 gttgttcttc aggtgggtga tggaaaaggt acgcgcctcc tccagcaggt tctcaccctc 2400 gaaacccagg taagacgctt catacaggct cagcaggcct tggacgtcac ctttcagttc 2460 accgctgaaa ccaccttctt tatccttgaa acgctcaaaa acatcctgag aaacctcgaa 2520 accgtgctga cgcagcagac ggaaagacag agcggttgcg tgcaggtcag atttgttctt 2580 tttgttttcg tccagcagta cgatgttttc cagggcttta atgatgtctt tttcaaattt 2640 gtaggtcaga cccaggcgct gcacatcgtc gatcagctcc agcagggaca gcggctgggt 2700 gtctacacgg ttgatcatgc agcgaacttc ttcctccagt ttggtcgctt tctcctccag 2760 cttttccact ttcaggtcgt tctccaggga ttgcaggaat tcgaaattcc acaggtttgg 2820 ctgatagttt gcggaacgac gggaattatg ctcggtaatc tgagtaaatt gagaagaggt 2880 cgcacacatg ttcagcgaca agggcgacac aaaatttatt ctaaatgcat aataaatact 2940 gataacatct tatagtttgt attatatttt gtattatcgt tgacatgtat aattttgata 3000 tcaaaaactg attttccctt tattattttc gagatttatt ttcttaattc tctttaacaa 3060 actagaaata ttgtatatac aaaaaatcat aaataataga tgaatagttt aattataggt 3120 gttcatcaat cgaaaaagca acgtatctta tttaaagtgc gttgcttttt tctcatttat 3180 aaggttaaat aattctcata tatcaagcaa agtgacaggc gcccttaaat attctgacaa 3240 atgctctttc cctaaactcc ccccataaaa aaacccgccg aagcgggttt ttacgttatt 3300 tgcggattaa cgattactcg ttatcagaac cgcccagggg gcccgagctt aagactggcc 3360 gtcgttttac aacacagaaa gagtttgtag aaacgcaaaa aggccatccg tcaggggcct 3420 tctgcttagt ttgatgcctg gcagttccct actctcgcct tccgcttcct cgctcactga 3480 ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 3540 acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 3600 aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 3660 tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 3720 aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 3780 gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc 3840 acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 3900 accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 3960 ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 4020 gtatgtaggc ggtgctacag agttcttgaa gtggtgggct aactacggct acactagaag 4080 aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 4140 ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 4200 gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 4260 cgctcagtgg aacgacgcgc gcgtaactca cgttaaggga ttttggtcat gagcttgcgc 4320 cgtcccgtca agtcagcgta atgctctgct tt 4352 <210> 155 <211> 6080 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 155 gtttgacagc ttatcatcga ctgcacggtg caccaatgct tctggcgtca ggcagccatc 60 ggaagctgtg gtatggctgt gcaggtcgta aatcactgca taattcgtgt cgctcaaggc 120 gcactcccgt tctggataat gttttttgcg ccgacatcat aacggttctg gcaaatattc 180 tgaaatgagc tgttgacaat taatcatccg gctcgtataa tgtgtggaat tgtgagcgga 240 taacaatttc acacaggaaa cagcgccgct gagaaaaagc gaagcggcac tgctctttaa 300 caatttatca gacaatctgt gtgggcactc gaccggaatt atcgattaac tttattatta 360 aaaattaaag aggtatatat taatgtatcg attaaataag gaggaataaa ccatgtgtgc 420 gacctcttct caatttactc agattaccga gcataattcc cgtcgttccg caaactatca 480 gccaaacctg tggaatttcg aattcctgca atccctggag aacgacctga aagtggaaaa 540 gctggaggag aaagcgacca aactggagga agaagttcgc tgcatgatca accgtgtaga 600 cacccagccg ctgtccctgc tggagctgat cgacgatgtg cagcgcctgg gtctgaccta 660 caaatttgaa aaagacatca ttaaagccct ggaaaacatc gtactgctgg acgaaaacaa 720 aaagaacaaa tctgacctgc acgcaaccgc tctgtctttc cgtctgctgc gtcagcacgg 780 tttcgaggtt tctcaggatg tttttgagcg tttcaaggat aaagaaggtg gtttcagcgg 840 tgaactgaaa ggtgacgtcc aaggcctgct gagcctgtat gaagcgtctt acctgggttt 900 cgagggtgag aacctgctgg aggaggcgcg taccttttcc atcacccacc tgaagaacaa 960 cctgaaagaa ggcattaata ccaaggttgc agaacaagtg agccacgccc tggaactgcc 1020 atatcaccag cgtctgcacc gtctggaggc acgttggttc ctggataaat acgaaccgaa 1080 agaaccgcat caccagctgc tgctggagct ggcgaagctg gattttaaca tggtacagac 1140 cctgcaccag aaagagctgc aagatctgtc ccgctggtgg accgagatgg gcctggctag 1200 caaactggat tttgtacgcg accgcctgat ggaagtttat ttctgggcac tgggtatggc 1260 gccagacccg cagtttggtg aatgtcgcaa agctgttact aaaatgtttg gtctggtgac 1320 gatcatcgat gacgtgtatg acgtttatgg cactctggac gaactgcaac tgttcaccga 1380 tgctgtagag cgctgggacg ttaacgctat taacaccctg ccggactata tgaaactgtg 1440 tttcctggca ctgtacaaca ccgttaacga cacgtcctat tctattctga aagagaaagg 1500 tcataacaac ctgtcctatc tgacgaaaag ctggcgtgaa ctgtgcaaag cctttctgca 1560 agaggcgaaa tggtccaaca acaaaattat cccggctttc tccaagtacc tggaaaacgc 1620 cagcgtttcc tcctccggtg tagcgctgct ggcgccgtct tacttttccg tatgccagca 1680 gcaggaagac atctccgacc acgcgctgcg ttccctgacc gacttccatg gtctggtgcg 1740 ttctagctgc gttatcttcc gcctgtgcaa cgatctggcc acctctgcgg cggagctgga 1800 acgtggcgag actaccaatt ctatcattag ctacatgcac gaaaacgatg gtaccagcga 1860 ggaacaggcc cgcgaagaac tgcgtaaact gatcgacgcc gaatggaaaa agatgaatcg 1920 tgaacgcgtt agcgactcca ccctgctgcc taaagcgttc atggaaatcg cagttaacat 1980 ggcacgtgtt tcccactgca cctaccagta tggcgatggt ctgggtcgcc cagactacgc 2040 gactgaaaac cgcatcaaac tgctgctgat tgaccctttc ccgattaacc agctgatgta 2100 tgtctaactg cagctggtac catatgggaa ttcgaagctt tctagaacaa aaactcatct 2160 cagaagagga tctgaatagc gccgtcgacc atcatcatca tcatcattga gtttaaacgg 2220 tctccagctt ggctgttttg gcggatgaga gaagattttc agcctgatac agattaaatc 2280 agaacgcaga agcggtctga taaaacagaa tttgcctggc ggcagtagcg cggtggtccc 2340 acctgacccc atgccgaact cagaagtgaa acgccgtagc gccgatggta gtgtggggtc 2400 tccccatgcg agagtaggga actgccaggc atcaaataaa acgaaaggct cagtcgaaag 2460 actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt aggacaaatc 2520 cgccgggagc ggatttgaac gttgcgaagc aacggcccgg agggtggcgg gcaggacgcc 2580 cgccataaac tgccaggcat caaattaagc agaaggccat cctgacggat ggcctttttg 2640 cgtttctaca aactcttttt gtttattttt ctaaatacat tcaaatatgt atccgctcat 2700 gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca 2760 acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca 2820 cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta 2880 catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt 2940 tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc gtgttgacgc 3000 cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc 3060 accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc 3120 cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa 3180 ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga 3240 accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat 3300 ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca 3360 attaatagac tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc 3420 ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat 3480 tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag 3540 tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa 3600 gcattggtaa ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca 3660 tttttaattt aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc 3720 ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc 3780 ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 3840 agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 3900 cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 3960 caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 4020 tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 4080 ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 4140 ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 4200 gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 4260 gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 4320 tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa 4380 cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc 4440 gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg 4500 ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcctgat 4560 gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatatggt gcactctcag 4620 tacaatctgc tctgatgccg catagttaag ccagtataca ctccgctatc gctacgtgac 4680 tgggtcatgg ctgcgccccg acacccgcca acacccgctg acgcgccctg acgggcttgt 4740 ctgctcccgg catccgctta cagacaagct gtgaccgtct ccgggagctg catgtgtcag 4800 aggttttcac cgtcatcacc gaaacgcgcg aggcagcaga tcaattcgcg cgcgaaggcg 4860 aagcggcatg catttacgtt gacaccatcg aatggtgcaa aacctttcgc ggtatggcat 4920 gatagcgccc ggaagagagt caattcaggg tggtgaatgt gaaaccagta acgttatacg 4980 atgtcgcaga gtatgccggt gtctcttatc agaccgtttc ccgcgtggtg aaccaggcca 5040 gccacgtttc tgcgaaaacg cgggaaaaag tggaagcggc gatggcggag ctgaattaca 5100 ttcccaaccg cgtggcacaa caactggcgg gcaaacagtc gttgctgatt ggcgttgcca 5160 cctccagtct ggccctgcac gcgccgtcgc aaattgtcgc ggcgattaaa tctcgcgccg 5220 atcaactggg tgccagcgtg gtggtgtcga tggtagaacg aagcggcgtc gaagcctgta 5280 aagcggcggt gcacaatctt ctcgcgcaac gcgtcagtgg gctgatcatt aactatccgc 5340 tggatgacca ggatgccatt gctgtggaag ctgcctgcac taatgttccg gcgttatttc 5400 ttgatgtctc tgaccagaca cccatcaaca gtattatttt ctcccatgaa gacggtacgc 5460 gactgggcgt ggagcatctg gtcgcattgg gtcaccagca aatcgcgctg ttagcgggcc 5520 cattaagttc tgtctcggcg cgtctgcgtc tggctggctg gcataaatat ctcactcgca 5580 atcaaattca gccgatagcg gaacgggaag gcgactggag tgccatgtcc ggttttcaac 5640 aaaccatgca aatgctgaat gagggcatcg ttcccactgc gatgctggtt gccaacgatc 5700 agatggcgct gggcgcaatg cgcgccatta ccgagtccgg gctgcgcgtt ggtgcggata 5760 tctcggtagt gggatacgac gataccgaag acagctcatg ttatatcccg ccgtcaacca 5820 ccatcaaaca ggattttcgc ctgctggggc aaaccagcgt ggaccgcttg ctgcaactct 5880 ctcagggcca ggcggtgaag ggcaatcagc tgttgcccgt ctcactggtg aaaagaaaaa 5940 ccaccctggc gcccaatacg caaaccgcct ctccccgcgc gttggccgat tcattaatgc 6000 agctggcacg acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc aattaatgtg 6060 agttagcgcg aattgatctg 6080 <210> 156 <211> 6646 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 156 ccgacaccat cgaatggtgc aaaacctttc gcggtatggc atgatagcgc ccggaagaga 60 gtcaattcag ggtggtgaat gtgaaaccag taacgttata cgatgtcgca gagtatgccg 120 gtgtctctta tcagaccgtt tcccgcgtgg tgaaccaggc cagccacgtt tctgcgaaaa 180 cgcgggaaaa agtggaagcg gcgatggcgg agctgaatta cattcccaac cgcgtggcac 240 aacaactggc gggcaaacag tcgttgctga ttggcgttgc cacctccagt ctggccctgc 300 acgcgccgtc gcaaattgtc gcggcgatta aatctcgcgc cgatcaactg ggtgccagcg 360 tggtggtgtc gatggtagaa cgaagcggcg tcgaagcctg taaagcggcg gtgcacaatc 420 ttctcgcgca acgcgtcagt gggctgatca ttaactatcc gctggatgac caggatgcca 480 ttgctgtgga agctgcctgc actaatgttc cggcgttatt tcttgatgtc tctgaccaga 540 cacccatcaa cagtattatt ttctcccatg aagacggtac gcgactgggc gtggagcatc 600 tggtcgcatt gggtcaccag caaatcgcgc tgttagcggg cccattaagt tctgtctcgg 660 cgcgtctgcg tctggctggc tggcataaat atctcactcg caatcaaatt cagccgatag 720 cggaacggga aggcgactgg agtgccatgt ccggttttca acaaaccatg caaatgctga 780 atgagggcat cgttcccact gcgatgctgg ttgccaacga tcagatggcg ctgggcgcaa 840 tgcgcgccat taccgagtcc gggctgcgcg ttggtgcgga tatctcggta gtgggatacg 900 acgataccga agacagctca tgttatatcc cgccgttaac caccatcaaa caggattttc 960 gcctgctggg gcaaaccagc gtggaccgct tgctgcaact ctctcagggc caggcggtga 1020 agggcaatca gctgttgccc gtctcactgg tgaaaagaaa aaccaccctg gcgcccaata 1080 cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt 1140 cccgactgga aagcgggcag tgagcgcaac gcaattaatg taagttagct cactcattag 1200 gcacaattct catgtttgac agcttatcat cgactgcacg gtgcaccaat gcttctggcg 1260 tcaggcagcc atcggaagct gtggtatggc tgtgcaggtc gtaaatcact gcataattcg 1320 tgtcgctcaa ggcgcactcc cgttctggat aatgtttttt gcgccgacat cataacggtt 1380 ctggcaaata ttctgaaatg agctgttgac aattaatcat cggctcgtat aatgtgtgga 1440 attgtgagcg gataacaatt tcacacagga aacagccagt ccgtttaggt gttttcacga 1500 gcacttcacc aacaaggacc atagcatatg aaaatcgaag aaggtaaact ggtaatctgg 1560 attaacggcg ataaaggcta taacggtctc gctgaagtcg gtaagaaatt cgagaaagat 1620 accggaatta aagtcaccgt tgagcatccg gataaactgg aagagaaatt cccacaggtt 1680 gcggcaactg gcgatggccc tgacattatc ttctgggcac acgaccgctt tggtggctac 1740 gctcaatctg gcctgttggc tgaaatcacc ccggacaaag cgttccagga caagctgtat 1800 ccgtttacct gggatgccgt acgttacaac ggcaagctga ttgcttaccc gatcgctgtt 1860 gaagcgttat cgctgattta taacaaagat ctgctgccga acccgccaaa aacctgggaa 1920 gagatcccgg cgctggataa agaactgaaa gcgaaaggta agagcgcgct gatgttcaac 1980 ctgcaagaac cgtacttcac ctggccgctg attgctgctg acgggggtta tgcgttcaag 2040 tatgaaaacg gcaagtacga cattaaagac gtgggcgtgg ataacgctgg cgcgaaagcg 2100 ggtctgacct tcctggttga cctgattaaa aacaaacaca tgaatgcaga caccgattac 2160 tccatcgcag aagctgcctt taataaaggc gaaacagcga tgaccatcaa cggcccgtgg 2220 gcatggtcca acatcgacac cagcaaagtg aattatggtg taacggtact gccgaccttc 2280 aagggtcaac catccaaacc gttcgttggc gtgctgagcg caggtattaa cgccgccagt 2340 ccgaacaaag agctggcaaa agagttcctc gaaaactatc tgctgactga tgaaggtctg 2400 gaagcggtta ataaagacaa accgctgggt gccgtagcgc tgaagtctta cgaggaagag 2460 ttggtgaaag atccgcggat tgccgccact atggaaaacg cccagaaagg tgaaatcatg 2520 ccgaacatcc cgcagatgtc cgctttctgg tatgccgtgc gtactgcggt gatcaacgcc 2580 gccagcggtc gtcagactgt cgatgaagcc ctgaaagacg cgcagactaa ttcgagctcg 2640 aacaacaaca acaataacaa taacaacaac ctcgggatcg agggaaggat ttcagaattc 2700 ggatcctcta gagtcgacct gcaggcaagc ttggcactgg ccgtcgtttt acaacgtcgt 2760 gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc 2820 agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg 2880 aatggcgaat ggcagcttgg ctgttttggc ggatgagata agattttcag cctgatacag 2940 attaaatcag aacgcagaag cggtctgata aaacagaatt tgcctggcgg cagtagcgcg 3000 gtggtcccac ctgaccccat gccgaactca gaagtgaaac gccgtagcgc cgatggtagt 3060 gtggggtctc cccatgcgag agtagggaac tgccaggcat caaataaaac gaaaggctca 3120 gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc tcctgagtag 3180 gacaaatccg ccgggagcgg atttgaacgt tgcgaagcaa cggcccggag ggtggcgggc 3240 aggacgcccg ccataaactg ccaggcatca aattaagcag aaggccatcc tgacggatgg 3300 cctttttgcg tttctacaaa ctctttttgt ttatttttct aaatacattc aaatatgtat 3360 ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag gaagagtatg 3420 agtattcaac atttccgtgt cgcccttatt cccttttttg cggcattttg ccttcctgtt 3480 tttgctcacc cagaaacgct ggtgaaagta aaagatgctg aagatcagtt gggtgcacga 3540 gtgggttaca tcgaactgga tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa 3600 gaacgttctc caatgatgag cacttttaaa gttctgctat gtggcgcggt attatcccgt 3660 gttgacgccg ggcaagagca actcggtcgc cgcatacact attctcagaa tgacttggtt 3720 gagtactcac cagtcacaga aaagcatctt acggatggca tgacagtaag agaattatgc 3780 agtgctgcca taaccatgag tgataacact gcggccaact tacttctgac aacgatcgga 3840 ggaccgaagg agctaaccgc ttttttgcac aacatggggg atcatgtaac tcgccttgat 3900 cgttgggaac cggagctgaa tgaagccata ccaaacgacg agcgtgacac cacgatgcct 3960 gtagcaatgg caacaacgtt gcgcaaacta ttaactggcg aactacttac tctagcttcc 4020 cggcaacaat taatagactg gatggaggcg gataaagttg caggaccact tctgcgctcg 4080 gcccttccgg ctggctggtt tattgctgat aaatctggag ccggtgagcg tgggtctcgc 4140 ggtatcattg cagcactggg gccagatggt aagccctccc gtatcgtagt tatctacacg 4200 acggggagtc aggcaactat ggatgaacga aatagacaga tcgctgagat aggtgcctca 4260 ctgattaagc attggtaact gtcagaccaa gtttactcat atatacttta gattgattta 4320 ccccggttga taatcagaaa agccccaaaa acaggaagat tgtataagca aatatttaaa 4380 ttgtaaacgt taatattttg ttaaaattcg cgttaaattt ttgttaaatc agctcatttt 4440 ttaaccaata ggccgaaatc ggcaaaatcc cttataaatc aaaagaatag accgagatag 4500 ggttgagtgt tgttccagtt tggaacaaga gtccactatt aaagaacgtg gactccaacg 4560 tcaaagggcg aaaaaccgtc tatcagggcg atggcccact acgtgaacca tcacccaaat 4620 caagtttttt ggggtcgagg tgccgtaaag cactaaatcg gaaccctaaa gggagccccc 4680 gatttagagc ttgacgggga aagccggcga acgtggcgag aaaggaaggg aagaaagcga 4740 aaggagcggg cgctagggcg ctggcaagtg tagcggtcac gctgcgcgta accaccacac 4800 ccgccgcgct taatgcgccg ctacagggcg cgtaaaagga tctaggtgaa gatccttttt 4860 gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc 4920 gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg 4980 caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact 5040 ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt ccttctagtg 5100 tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg 5160 ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac 5220 tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca 5280 cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg tgagctatga 5340 gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc 5400 ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct 5460 gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg 5520 agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt ttgctggcct 5580 tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg tattaccgcc 5640 tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc 5700 gaggaagcgg aagagcgcct gatgcggtat tttctcctta cgcatctgtg cggtatttca 5760 caccgcatat atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagt 5820 atacactccg ctatcgctac gtgactgggt catggctgcg ccccgacacc cgccaacacc 5880 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 5940 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgaggca 6000 gctgcggtaa agctcatcag cgtggtcgtg cagcgattca cagatgtctg cctgttcatc 6060 cgcgtccagc tcgttgagtt tctccagaag cgttaatgtc tggcttctga taaagcgggc 6120 catgttaagg gcggtttttt cctgtttggt cactgatgcc tccgtgtaag ggggatttct 6180 gttcatgggg gtaatgatac cgatgaaacg agagaggatg ctcacgatac gggttactga 6240 tgatgaacat gcccggttac tggaacgttg tgagggtaaa caactggcgg tatggatgcg 6300 gcgggaccag agaaaaatca ctcagggtca atgccagcgc ttcgttaata cagatgtagg 6360 tgttccacag ggtagccagc agcatcctgc gatgcagatc cggaacataa tggtgcaggg 6420 cgctgacttc cgcgtttcca gactttacga aacacggaaa ccgaagacca ttcatgttgt 6480 tgctcaggtc gcagacgttt tgcagcagca gtcgcttcac gttcgctcgc gtatcggtga 6540 ttcattctgc taaccagtaa ggcaaccccg ccagcctagc cgggtcctca acgacaggag 6600 cacgatcatg cgcacccgtg gccaggaccc aacgctgccc gaaatt 6646 <210> 157 <211> 8310 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 157 ccgacaccat cgaatggtgc aaaacctttc gcggtatggc atgatagcgc ccggaagaga 60 gtcaattcag ggtggtgaat gtgaaaccag taacgttata cgatgtcgca gagtatgccg 120 gtgtctctta tcagaccgtt tcccgcgtgg tgaaccaggc cagccacgtt tctgcgaaaa 180 cgcgggaaaa agtggaagcg gcgatggcgg agctgaatta cattcccaac cgcgtggcac 240 aacaactggc gggcaaacag tcgttgctga ttggcgttgc cacctccagt ctggccctgc 300 acgcgccgtc gcaaattgtc gcggcgatta aatctcgcgc cgatcaactg ggtgccagcg 360 tggtggtgtc gatggtagaa cgaagcggcg tcgaagcctg taaagcggcg gtgcacaatc 420 ttctcgcgca acgcgtcagt gggctgatca ttaactatcc gctggatgac caggatgcca 480 ttgctgtgga agctgcctgc actaatgttc cggcgttatt tcttgatgtc tctgaccaga 540 cacccatcaa cagtattatt ttctcccatg aagacggtac gcgactgggc gtggagcatc 600 tggtcgcatt gggtcaccag caaatcgcgc tgttagcggg cccattaagt tctgtctcgg 660 cgcgtctgcg tctggctggc tggcataaat atctcactcg caatcaaatt cagccgatag 720 cggaacggga aggcgactgg agtgccatgt ccggttttca acaaaccatg caaatgctga 780 atgagggcat cgttcccact gcgatgctgg ttgccaacga tcagatggcg ctgggcgcaa 840 tgcgcgccat taccgagtcc gggctgcgcg ttggtgcgga tatctcggta gtgggatacg 900 acgataccga agacagctca tgttatatcc cgccgttaac caccatcaaa caggattttc 960 gcctgctggg gcaaaccagc gtggaccgct tgctgcaact ctctcagggc caggcggtga 1020 agggcaatca gctgttgccc gtctcactgg tgaaaagaaa aaccaccctg gcgcccaata 1080 cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt 1140 cccgactgga aagcgggcag tgagcgcaac gcaattaatg taagttagct cactcattag 1200 gcacaattct catgtttgac agcttatcat cgactgcacg gtgcaccaat gcttctggcg 1260 tcaggcagcc atcggaagct gtggtatggc tgtgcaggtc gtaaatcact gcataattcg 1320 tgtcgctcaa ggcgcactcc cgttctggat aatgtttttt gcgccgacat cataacggtt 1380 ctggcaaata ttctgaaatg agctgttgac aattaatcat cggctcgtat aatgtgtgga 1440 attgtgagcg gataacaatt tcacacagga aacagccagt ccgtttaggt gttttcacga 1500 gcacttcacc aacaaggacc atagcatatg aaaatcgaag aaggtaaact ggtaatctgg 1560 attaacggcg ataaaggcta taacggtctc gctgaagtcg gtaagaaatt cgagaaagat 1620 accggaatta aagtcaccgt tgagcatccg gataaactgg aagagaaatt cccacaggtt 1680 gcggcaactg gcgatggccc tgacattatc ttctgggcac acgaccgctt tggtggctac 1740 gctcaatctg gcctgttggc tgaaatcacc ccggacaaag cgttccagga caagctgtat 1800 ccgtttacct gggatgccgt acgttacaac ggcaagctga ttgcttaccc gatcgctgtt 1860 gaagcgttat cgctgattta taacaaagat ctgctgccga acccgccaaa aacctgggaa 1920 gagatcccgg cgctggataa agaactgaaa gcgaaaggta agagcgcgct gatgttcaac 1980 ctgcaagaac cgtacttcac ctggccgctg attgctgctg acgggggtta tgcgttcaag 2040 tatgaaaacg gcaagtacga cattaaagac gtgggcgtgg ataacgctgg cgcgaaagcg 2100 ggtctgacct tcctggttga cctgattaaa aacaaacaca tgaatgcaga caccgattac 2160 tccatcgcag aagctgcctt taataaaggc gaaacagcga tgaccatcaa cggcccgtgg 2220 gcatggtcca acatcgacac cagcaaagtg aattatggtg taacggtact gccgaccttc 2280 aagggtcaac catccaaacc gttcgttggc gtgctgagcg caggtattaa cgccgccagt 2340 ccgaacaaag agctggcaaa agagttcctc gaaaactatc tgctgactga tgaaggtctg 2400 gaagcggtta ataaagacaa accgctgggt gccgtagcgc tgaagtctta cgaggaagag 2460 ttggtgaaag atccgcggat tgccgccact atggaaaacg cccagaaagg tgaaatcatg 2520 ccgaacatcc cgcagatgtc cgctttctgg tatgccgtgc gtactgcggt gatcaacgcc 2580 gccagcggtc gtcagactgt cgatgaagcc ctgaaagacg cgcagactaa ttcgagctcg 2640 aacaacaaca acaataacaa taacaacaac ctcgggatcg agggaaggat ttcagaattc 2700 tgtgcgacct cttctcaatt tactcagatt accgagcata attcccgtcg ttccgcaaac 2760 tatcagccaa acctgtggaa tttcgaattc ctgcaatccc tggagaacga cctgaaagtg 2820 gaaaagctgg aggagaaagc gaccaaactg gaggaagaag ttcgctgcat gatcaaccgt 2880 gtagacaccc agccgctgtc cctgctggag ctgatcgacg atgtgcagcg cctgggtctg 2940 acctacaaat ttgaaaaaga catcattaaa gccctggaaa acatcgtact gctggacgaa 3000 aacaaaaaga acaaatctga cctgcacgca accgctctgt ctttccgtct gctgcgtcag 3060 cacggtttcg aggtttctca ggatgttttt gagcgtttca aggataaaga aggtggtttc 3120 agcggtgaac tgaaaggtga cgtccaaggc ctgctgagcc tgtatgaagc gtcttacctg 3180 ggtttcgagg gtgagaacct gctggaggag gcgcgtacct tttccatcac ccacctgaag 3240 aacaacctga aagaaggcat taataccaag gttgcagaac aagtgagcca cgccctggaa 3300 ctgccatatc accagcgtct gcaccgtctg gaggcacgtt ggttcctgga taaatacgaa 3360 ccgaaagaac cgcatcacca gctgctgctg gagctggcga agctggattt taacatggta 3420 cagaccctgc accagaaaga gctgcaagat ctgtcccgct ggtggaccga gatgggcctg 3480 gctagcaaac tggattttgt acgcgaccgc ctgatggaag tttatttctg ggcactgggt 3540 atggcgccag acccgcagtt tggtgaatgt cgcaaagctg ttactaaaat gtttggtctg 3600 gtgacgatca tcgatgacgt gtatgacgtt tatggcactc tggacgaact gcaactgttc 3660 accgatgctg tagagcgctg ggacgttaac gctattaaca ccctgccgga ctatatgaaa 3720 ctgtgtttcc tggcactgta caacaccgtt aacgacacgt cctattctat tctgaaagag 3780 aaaggtcata acaacctgtc ctatctgacg aaaagctggc gtgaactgtg caaagccttt 3840 ctgcaagagg cgaaatggtc caacaacaaa attatcccgg ctttctccaa gtacctggaa 3900 aacgccagcg tttcctcctc cggtgtagcg ctgctggcgc cgtcttactt ttccgtatgc 3960 cagcagcagg aagacatctc cgaccacgcg ctgcgttccc tgaccgactt ccatggtctg 4020 gtgcgttcta gctgcgttat cttccgcctg tgcaacgatc tggccacctc tgcggcggag 4080 ctggaacgtg gcgagactac caattctatc attagctaca tgcacgaaaa cgatggtacc 4140 agcgaggaac aggcccgcga agaactgcgt aaactgatcg acgccgaatg gaaaaagatg 4200 aatcgtgaac gcgttagcga ctccaccctg ctgcctaaag cgttcatgga aatcgcagtt 4260 aacatggcac gtgtttccca ctgcacctac cagtatggcg atggtctggg tcgcccagac 4320 tacgcgactg aaaaccgcat caaactgctg ctgattgacc ctttcccgat taaccagctg 4380 atgtatgtct aagcttggca ctggccgtcg ttttacaacg tcgtgactgg gaaaaccctg 4440 gcgttaccca acttaatcgc cttgcagcac atcccccttt cgccagctgg cgtaatagcg 4500 aagaggcccg caccgatcgc ccttcccaac agttgcgcag cctgaatggc gaatggcagc 4560 ttggctgttt tggcggatga gataagattt tcagcctgat acagattaaa tcagaacgca 4620 gaagcggtct gataaaacag aatttgcctg gcggcagtag cgcggtggtc ccacctgacc 4680 ccatgccgaa ctcagaagtg aaacgccgta gcgccgatgg tagtgtgggg tctccccatg 4740 cgagagtagg gaactgccag gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc 4800 tttcgtttta tctgttgttt gtcggtgaac gctctcctga gtaggacaaa tccgccggga 4860 gcggatttga acgttgcgaa gcaacggccc ggagggtggc gggcaggacg cccgccataa 4920 actgccaggc atcaaattaa gcagaaggcc atcctgacgg atggcctttt tgcgtttcta 4980 caaactcttt ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat 5040 aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc 5100 gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa 5160 cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac 5220 tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tctccaatga 5280 tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtgttgac gccgggcaag 5340 agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca 5400 cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca 5460 tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa 5520 ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc 5580 tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa 5640 cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag 5700 actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct 5760 ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac 5820 tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa 5880 ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt 5940 aactgtcaga ccaagtttac tcatatatac tttagattga tttaccccgg ttgataatca 6000 gaaaagcccc aaaaacagga agattgtata agcaaatatt taaattgtaa acgttaatat 6060 tttgttaaaa ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga 6120 aatcggcaaa atcccttata aatcaaaaga atagaccgag atagggttga gtgttgttcc 6180 agtttggaac aagagtccac tattaaagaa cgtggactcc aacgtcaaag ggcgaaaaac 6240 cgtctatcag ggcgatggcc cactacgtga accatcaccc aaatcaagtt ttttggggtc 6300 gaggtgccgt aaagcactaa atcggaaccc taaagggagc ccccgattta gagcttgacg 6360 gggaaagccg gcgaacgtgg cgagaaagga agggaagaaa gcgaaaggag cgggcgctag 6420 ggcgctggca agtgtagcgg tcacgctgcg cgtaaccacc acacccgccg cgcttaatgc 6480 gccgctacag ggcgcgtaaa aggatctagg tgaagatcct ttttgataat ctcatgacca 6540 aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag 6600 gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac 6660 cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa 6720 ctggcttcag cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc 6780 accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag 6840 tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac 6900 cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc 6960 gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc 7020 ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca 7080 cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc 7140 tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg 7200 ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct 7260 ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata 7320 ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc 7380 gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc atatatggtg 7440 cactctcagt acaatctgct ctgatgccgc atagttaagc cagtatacac tccgctatcg 7500 ctacgtgact gggtcatggc tgcgccccga cacccgccaa cacccgctga cgcgccctga 7560 cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc 7620 atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga ggcagctgcg gtaaagctca 7680 tcagcgtggt cgtgcagcga ttcacagatg tctgcctgtt catccgcgtc cagctcgttg 7740 agtttctcca gaagcgttaa tgtctggctt ctgataaagc gggccatgtt aagggcggtt 7800 ttttcctgtt tggtcactga tgcctccgtg taagggggat ttctgttcat gggggtaatg 7860 ataccgatga aacgagagag gatgctcacg atacgggtta ctgatgatga acatgcccgg 7920 ttactggaac gttgtgaggg taaacaactg gcggtatgga tgcggcggga ccagagaaaa 7980 atcactcagg gtcaatgcca gcgcttcgtt aatacagatg taggtgttcc acagggtagc 8040 cagcagcatc ctgcgatgca gatccggaac ataatggtgc agggcgctga cttccgcgtt 8100 tccagacttt acgaaacacg gaaaccgaag accattcatg ttgttgctca ggtcgcagac 8160 gttttgcagc agcagtcgct tcacgttcgc tcgcgtatcg gtgattcatt ctgctaacca 8220 gtaaggcaac cccgccagcc tagccgggtc ctcaacgaca ggagcacgat catgcgcacc 8280 cgtggccagg acccaacgct gcccgaaatt 8310 <210> 158 <211> 560 <212> PRT <213> Populus tremuloides <400> 158 Met Arg Cys Ser Val Ser Thr Glu Asn Val Ser Phe Ser Glu Thr Glu 1 5 10 15 Thr Glu Thr Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr 20 25 30 Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val His Lys 35 40 45 Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn 50 55 60 Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln 65 70 75 80 Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Arg Ala Leu 85 90 95 Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Gly Val Thr Lys Thr Ser 100 105 110 Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe 115 120 125 Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn 130 135 140 Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu Tyr 145 150 155 160 Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala 165 170 175 Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile 180 185 190 Gly Lys Glu Leu Ala Glu Gln Val Ser His Ala Leu Glu Leu Pro Leu 195 200 205 His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu Ala Tyr 210 215 220 Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala Ile Leu 225 230 235 240 Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr 245 250 255 Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala 260 265 270 Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe 275 280 285 Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser 290 295 300 Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp 305 310 315 320 Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala 325 330 335 Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr 340 345 350 Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys Gly Glu 355 360 365 Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala 370 375 380 Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe 385 390 395 400 Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln 405 410 415 Leu Ile Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu 420 425 430 Ile Glu Asn Leu Gln Lys Tyr His Asp Ile Ile Ser Arg Pro Ser His 435 440 445 Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala 450 455 460 Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly 465 470 475 480 Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu 485 490 495 Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala 500 505 510 Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys 515 520 525 Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg 530 535 540 Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg 545 550 555 560 <210> 159 <211> 6957 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 159 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980 aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040 ttttgtttaa ctttaagaag gagatataca tatgcgttgt agcgtgtcca ccgaaaatgt 5100 gtctttctct gaaactgaaa ccgaaacgcg tcgttctgcg aactacgaac ctaacagctg 5160 ggactatgat tacctgctgt cctccgacac ggacgagtcc atcgaagtac acaaagacaa 5220 agcgaaaaag ctggaagccg aagttcgtcg cgagattaat aacgaaaaag cagaatttct 5280 gaccctgctg gaactgattg acaacgtcca gcgcctgggc ctgggttacc gtttcgagtc 5340 tgatatccgt cgtgcgctgg atcgcttcgt ttcctccggc ggcttcgatg gcgtaaccaa 5400 gacttccctg cacggtacgg cactgtcttt ccgtctgctg cgtcaacacg gttttgaggt 5460 ttctcaggaa gcgttcagcg gcttcaaaga ccaaaacggc aacttcctgg agaacctgaa 5520 ggaagatatc aaagctatcc tgagcctgta cgaggccagc ttcctggctc tggaaggcga 5580 aaacatcctg gacgaggcga aggttttcgc aatctctcat ctgaaagaac tgtctgaaga 5640 aaagatcggt aaagagctgg cagaacaggt gtcccatgca ctggaactgc cactgcatcg 5700 ccgtactcag cgtctggaag cagtatggtc tatcgaggcc taccgtaaaa aggaggacgc 5760 gaaccaggtt ctgctggagc tggcaattct ggattacaac atgatccagt ctgtatacca 5820 gcgtgatctg cgtgaaacgt cccgttggtg gcgtcgtgtg ggtctggcga ccaaactgca 5880 ctttgctcgt gaccgcctga ttgagagctt ctactgggcc gtgggtgtag cattcgaacc 5940 gcaatactcc gactgccgta actccgtcgc aaaaatgttt tctttcgtaa ccattatcga 6000 cgatatctac gatgtatacg gcaccctgga cgaactggag ctgtttactg atgcagttga 6060 gcgttgggac gtaaacgcca tcaacgacct gccggattac atgaaactgt gctttctggc 6120 tctgtataac actattaacg aaatcgccta cgacaacctg aaagataaag gtgagaacat 6180 cctgccgtat ctgaccaaag cctgggctga cctgtgcaac gctttcctgc aagaagccaa 6240 gtggctgtac aacaaatcta ctccgacctt tgacgactac ttcggcaacg catggaaatc 6300 ctcttctggc ccgctgcaac tgatcttcgc ttacttcgct gtcgtgcaga acattaaaaa 6360 ggaagagatc gaaaacctgc aaaaatacca tgacatcatc tctcgtcctt cccatatctt 6420 ccgtctgtgc aatgacctgg ctagcgcgtc tgcggaaatt gcgcgtggtg aaaccgcaaa 6480 tagcgtttct tgttacatgc gcactaaagg tatctccgaa gaactggcta ccgaaagcgt 6540 gatgaatctg atcgatgaaa cctggaaaaa gatgaacaag gaaaaactgg gtggtagcct 6600 gttcgcgaaa ccgttcgtgg aaaccgcgat caacctggca cgtcaatctc actgcactta 6660 tcataacggc gacgcgcata cctctccgga tgagctgacc cgcaaacgcg ttctgtctgt 6720 aatcactgaa ccgattctgc cgtttgaacg ctaaggatcc gaattcgagc tccgtcgaca 6780 agcttgcggc cgcactcgag caccaccacc accaccactg agatccggct gctaacaaag 6840 cccgaaagga agctgagttg gctgctgcca ccgctgagca ataactagca taaccccttg 6900 gggcctctaa acgggtcttg aggggttttt tgctgaaagg aggaactata tccggat 6957 <210> 160 <211> 560 <212> PRT <213> Populus trichocharpa <400> 160 Met Arg Cys Ser Val Ser Thr Glu Asn Val Ser Phe Thr Glu Thr Glu 1 5 10 15 Thr Glu Thr Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr 20 25 30 Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val Tyr Lys 35 40 45 Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn 50 55 60 Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln 65 70 75 80 Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Arg Ala Leu 85 90 95 Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys Thr Ser 100 105 110 Leu His Ala Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe 115 120 125 Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn 130 135 140 Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu Tyr 145 150 155 160 Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala 165 170 175 Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile 180 185 190 Gly Lys Asp Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu Pro Leu 195 200 205 His Arg Arg Thr Gln Arg Leu Glu Ala Val Leu Ser Ile Glu Ala Tyr 210 215 220 Arg Lys Lys Glu Asp Ala Asp Gln Val Leu Leu Glu Leu Ala Ile Leu 225 230 235 240 Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr 245 250 255 Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala 260 265 270 Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe 275 280 285 Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser 290 295 300 Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp 305 310 315 320 Glu Leu Glu Leu Phe Thr Asn Ala Val Glu Arg Trp Asp Val Asn Ala 325 330 335 Ile Asp Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr 340 345 350 Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Glu Lys Gly Glu 355 360 365 Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala 370 375 380 Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe 385 390 395 400 Asp Glu Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln 405 410 415 Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu 420 425 430 Ile Glu Asn Leu Gln Lys Tyr His Asp Ile Ile Ser Arg Pro Ser His 435 440 445 Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala 450 455 460 Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly 465 470 475 480 Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu 485 490 495 Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala 500 505 510 Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys 515 520 525 Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg 530 535 540 Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg 545 550 555 560 <210> 161 <211> 6963 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 161 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980 aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040 ttttgtttaa ctttaagaag gagatataca tatgcatatg cgttgtagcg tgtccaccga 5100 aaatgtgtct ttcaccgaaa ctgaaaccga aacgcgtcgt tctgcgaact acgaacctaa 5160 cagctgggac tatgattacc tgctgtcctc cgacacggac gagtccatcg aagtatacaa 5220 agacaaagcg aaaaagctgg aagccgaagt tcgtcgcgag attaataacg aaaaagcaga 5280 atttctgacc ctgctggaac tgattgacaa cgtccagcgc ctgggcctgg gttaccgttt 5340 cgagtctgat atccgtcgtg cgctggatcg cttcgtttcc tccggcggct tcgatgcggt 5400 aaccaagact tccctgcacg cgacggcact gtctttccgt ctgctgcgtc aacacggttt 5460 tgaggtttct caggaagcgt tcagcggctt caaagaccaa aacggcaact tcctggagaa 5520 cctgaaggaa gatatcaaag ctatcctgag cctgtacgag gccagcttcc tggctctgga 5580 aggcgaaaac atcctggacg aggcgaaggt tttcgcaatc tctcatctga aagaactgtc 5640 tgaagaaaag atcggtaaag atctggcaga acaggtgaac catgcactgg aactgccact 5700 gcatcgccgt actcagcgtc tggaagcagt actgtctatc gaggcctacc gtaaaaagga 5760 ggacgcggat caggttctgc tggagctggc aattctggat tacaacatga tccagtctgt 5820 ataccagcgt gatctgcgtg aaacgtcccg ttggtggcgt cgtgtgggtc tggcgaccaa 5880 actgcacttt gctcgtgacc gcctgattga gagcttctac tgggccgtgg gtgtagcatt 5940 cgaaccgcaa tactccgact gccgtaactc cgtcgcaaaa atgttttctt tcgtaaccat 6000 tatcgacgat atctacgatg tatacggcac cctggacgaa ctggagctgt ttactaacgc 6060 agttgagcgt tgggacgtaa acgccatcga cgatctgccg gattacatga aactgtgctt 6120 tctggctctg tataacacta ttaacgaaat cgcctacgac aacctgaaag aaaaaggtga 6180 gaacatcctg ccgtatctga ccaaagcctg ggctgacctg tgcaacgctt tcctgcaaga 6240 agccaagtgg ctgtacaaca aatctactcc gacctttgac gaatacttcg gcaacgcatg 6300 gaaatcctct tctggcccgc tgcaactggt gttcgcttac ttcgctgtcg tgcagaacat 6360 taaaaaggaa gagatcgaaa acctgcaaaa ataccatgac atcatctctc gtccttccca 6420 tatcttccgt ctgtgcaatg acctggctag cgcgtctgcg gaaattgcgc gtggtgaaac 6480 cgcaaatagc gtttcttgtt acatgcgcac taaaggtatc tccgaagaac tggctaccga 6540 aagcgtgatg aatctgatcg atgaaacctg gaaaaagatg aacaaggaaa aactgggtgg 6600 tagcctgttc gcgaaaccgt tcgtggaaac cgcgatcaac ctggcacgtc aatctcactg 6660 cacttatcat aacggcgacg cgcatacctc tccggatgag ctgacccgca aacgcgttct 6720 gtctgtaatc actgaaccga ttctgccgtt tgaacgctaa ggatccgaat tcgagctccg 6780 tcgacaagct tgcggccgca ctcgagcacc accaccacca ccactgagat ccggctgcta 6840 acaaagcccg aaaggaagct gagttggctg ctgccaccgc tgagcaataa ctagcataac 6900 cccttggggc ctctaaacgg gtcttgaggg gttttttgct gaaaggagga actatatccg 6960 gat 6963 <210> 162 <211> 578 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 162 Met Arg Gly Ser His His His His His His Gly Met Ala Ser Met Thr 1 5 10 15 Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys Asp 20 25 30 His Pro Phe Thr Met Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp 35 40 45 Asp Tyr Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val 50 55 60 Tyr Lys Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile 65 70 75 80 Asn Asn Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn 85 90 95 Val Gln Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Gly 100 105 110 Ala Leu Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys 115 120 125 Thr Ser Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His 130 135 140 Gly Phe Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn 145 150 155 160 Gly Asn Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser 165 170 175 Leu Tyr Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp 180 185 190 Glu Ala Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu 195 200 205 Lys Ile Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu 210 215 220 Pro Leu His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu 225 230 235 240 Ala Tyr Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala 245 250 255 Ile Leu Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg 260 265 270 Glu Thr Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His 275 280 285 Phe Ala Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val 290 295 300 Ala Phe Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met 305 310 315 320 Phe Ser Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr 325 330 335 Leu Asp Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val 340 345 350 Asn Ala Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala 355 360 365 Leu Tyr Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys 370 375 380 Gly Glu Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys 385 390 395 400 Asn Ala Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro 405 410 415 Thr Phe Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro 420 425 430 Leu Gln Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys 435 440 445 Glu Glu Ile Glu Asn Leu Gln Lys Tyr His Asp Thr Ile Ser Arg Pro 450 455 460 Ser His Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu 465 470 475 480 Ile Ala Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr 485 490 495 Lys Gly Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile 500 505 510 Asp Glu Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu 515 520 525 Phe Ala Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser 530 535 540 His Cys Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu 545 550 555 560 Thr Arg Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe 565 570 575 Glu Arg <210> 163 <211> 7370 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 163 aagggcgagc tcaacgatcc ggctgctaac aaagcccgaa aggaagctga gttggctgct 60 gccaccgctg agcaataact agcataaccc cttggggcct ctaaacgggt cttgaggagt 120 tttttgctga aaggaggaac tatatccgga tatcccgcaa gaggcccggc agtaccggca 180 taaccaagcc tatgcctaca gcatccaggg tgacggtgcc gaggatgacg atgagcgcat 240 tgttagattt catacacggt gcctgactgc gttagcaatt taactgtgat aaactaccgc 300 attaaagctt atcgatgata agctgtcaaa catgagaatt aattcttgaa gacgaaaggg 360 cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 420 aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 480 ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 540 aaggaagagt atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga 600 gaggctattc ggctatgact gggcacaact gacaatcggc tgctctgatg ccgccgtgtt 660 ccggctgtca gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct 720 gaatgaactg caggacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg 780 cgcagctgtg ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt 840 gccggggcag gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc 900 tgatgcaatg cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc 960 gaaacatcgc atcgagcggg cacgtactcg gatggaagcc ggtcttgtcg atcaggatga 1020 tctggacgaa gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg 1080 catgcccgac ggcgaggatc tcgtcgtgac acatggcgat gcctgcttgc cgaatatcat 1140 ggtggaaaat ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg 1200 ctatcaggac atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc 1260 tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta 1320 tcgccttctt gacgagttct tctgagcggg actctggggt tcgaaatgac cgaccaagcg 1380 acgcctaact gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt 1440 tttaatttaa aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt 1500 aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt 1560 gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag 1620 cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta actggcttca 1680 gcagagcgca gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca 1740 agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg 1800 ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg 1860 cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct 1920 acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga 1980 gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc 2040 ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg 2100 agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg 2160 cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt 2220 tatcccctga ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc 2280 gcagccgaac gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcctgatgc 2340 ggtattttct ccttacgcat ctgtgcggta tttcacaccg caatggtgca ctctcagtac 2400 aatctgctct gatgccgcat agttaagcca gtatacactc cgctatcgct acgtgactgg 2460 gtcatggctg cgccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 2520 ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 2580 ttttcaccgt catcaccgaa acgcgcgagg cagctgcggt aaagctcatc agcgtggtcg 2640 tgaagcgatt cacagatgtc tgcctgttca tccgcgtcca gctcgttgag tttctccaga 2700 agcgttaatg tctggcttct gataaagcgg gccatgttaa gggcggtttt ttcctgtttg 2760 gtcactgatg cctccgtgta agggggattt ctgttcatgg gggtaatgat accgatgaaa 2820 cgagagagga tgctcacgat acgggttact gatgatgaac atgcccggtt actggaacgt 2880 tgtgagggta aacaactggc ggtatggatg cggcgggacc agagaaaaat cactcagggt 2940 caatgccagc gcttcgttaa tacagatgta ggtgttccac agggtagcca gcagcatcct 3000 gcgatgcaga tccggaacat aatggtgcag ggcgctgact tccgcgtttc cagactttac 3060 gaaacacgga aaccgaagac cattcatgtt gttgctcagg tcgcagacgt tttgcagcag 3120 cagtcgcttc acgttcgctc gcgtatcggt gattcattct gctaaccagt aaggcaaccc 3180 cgccagccta gccgggtcct caacgacagg agcacgatca tgcgcacccg tggccaggac 3240 ccaacgctgc ccgagatgcg ccgcgtgcgg ctgctggaga tggcggacgc gatggatatg 3300 ttctgccaag ggttggtttg cgcattcaca gttctccgca agaattgatt ggctccaatt 3360 cttggagtgg tgaatccgtt agcgaggtgc cgccggcttc cattcaggtc gaggtggccc 3420 ggctccatgc accgcgacgc aacgcgggga ggcagacaag gtatagggcg gcgcctacaa 3480 tccatgccaa cccgttccat gtgctcgccg aggcggcata aatcgccgtg acgatcagcg 3540 gtccaatgat cgaagttagg ctggtaagag ccgcgagcga tccttgaagc tgtccctgat 3600 ggtcgtcatc tacctgcctg gacagcatgg cctgcaacgc gggcatcccg atgccgccgg 3660 aagcgagaag aatcataatg gggaaggcca tccagcctcg cgtcgcgaac gccagcaaga 3720 cgtagcccag cgcgtcggcc gccatgccgg cgataatggc ctgcttctcg ccgaaacgtt 3780 tggtggcggg accagtgacg aaggcttgag cgagggcgtg caagattccg aataccgcaa 3840 gcgacaggcc gatcatcgtc gcgctccagc gaaagcggtc ctcgccgaaa atgacccaga 3900 gcgctgccgg cacctgtcct acgagttgca tgataaagaa gacagtcata agtgcggcga 3960 cgatagtcat gccccgcgcc caccggaagg agctgactgg gttgaaggct ctcaagggca 4020 tcggtcgaga tcccggtgcc taatgagtga gctaacttac attaattgcg ttgcgctcac 4080 tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 4140 cggggagagg cggtttgcgt attgggcgcc agggtggttt ttcttttcac cagtgagacg 4200 ggcaacagct gattgccctt caccgcctgg ccctgagaga gttgcagcaa gcggtccacg 4260 ctggtttgcc ccagcaggcg aaaatcctgt ttgatggtgg ttaacggcgg gatataacat 4320 gagctgtctt cggtatcgtc gtatcccact accgagatat ccgcaccaac gcgcagcccg 4380 gactcggtaa tggcgcgcat tgcgcccagc gccatctgat cgttggcaac cagcatcgca 4440 gtgggaacga tgccctcatt cagcatttgc atggtttgtt gaaaaccgga catggcactc 4500 cagtcgcctt cccgttccgc tatcggctga atttgattgc gagtgagata tttatgccag 4560 ccagccagac gcagacgcgc cgagacagaa cttaatgggc ccgctaacag cgcgatttgc 4620 tggtgaccca atgcgaccag atgctccacg cccagtcgcg taccgtcttc atgggagaaa 4680 ataatactgt tgatgggtgt ctggtcagag acatcaagaa ataacgccgg aacattagtg 4740 caggcagctt ccacagcaat ggcatcctgg tcatccagcg gatagttaat gatcagccca 4800 ctgacgcgtt gcgcgagaag attgtgcacc gccgctttac aggcttcgac gccgcttcgt 4860 tctaccatcg acaccaccac gctggcaccc agttgatcgg cgcgagattt aatcgccgcg 4920 acaatttgcg acggcgcgtg cagggccaga ctggaggtgg caacgccaat cagcaacgac 4980 tgtttgcccg ccagttgttg tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc 5040 gcttccactt tttcccgcgt tttcgcagaa acgtggctgg cctggttcac cacgcgggaa 5100 acggtctgat aagagacacc ggcatactct gcgacatcgt ataacgttac tggtttcaca 5160 ttcaccaccc tgaattgact ctcttccggg cgctatcatg ccataccgcg aaaggttttg 5220 cgccattcga tggtgtccgg gatctcgacg ctctccctta tgcgactcct gcattaggaa 5280 gcagcccagt agtaggttga ggccgttgag caccgccgcc gcaaggaatg gtgcatgcaa 5340 ggagatggcg cccaacagtc ccccggccac ggggcctgcc accataccca cgccgaaaca 5400 agcgctcatg agcccgaagt ggcgagcccg atcttcccca tcggtgatgt cggcgatata 5460 ggcgccagca accgcacctg tggcgccggt gatgccggcc acgatgcgtc cggcgtagag 5520 gatcgagatc tcgatcccgc gaaattaata cgactcacta taggggaatt gtgagcggat 5580 aacaattccc ctctagaaat aattttgttt aactttaaga aggagatata catatgcggg 5640 gttctcatca tcatcatcat catggtatgg ctagcatgac tggtggacag caaatgggtc 5700 gggatctgta cgacgatgac gataaggatc atcccttcac catgcgtcgt tctgcgaact 5760 acgaacctaa cagctgggac tatgattacc tgctgtcctc cgacacggac gagtccatcg 5820 aagtatacaa agacaaagcg aaaaagctgg aagccgaagt tcgtcgcgag attaataacg 5880 aaaaagcaga atttctgacc ctgctggaac tgattgacaa cgtccagcgc ctgggcctgg 5940 gttaccgttt cgagtctgat atccgtggtg cgctggatcg cttcgtttcc tccggcggct 6000 tcgatgcggt aaccaagact tccctgcacg gtacggcact gtctttccgt ctgctgcgtc 6060 aacacggttt tgaggtttct caggaagcgt tcagcggctt caaagaccaa aacggcaact 6120 tcctggagaa cctgaaggaa gatatcaaag ctatcctgag cctgtacgag gccagcttcc 6180 tggctctgga aggcgaaaac atcctggacg aggcgaaggt tttcgcaatc tctcatctga 6240 aagaactgtc tgaagaaaag atcggtaaag agctggcaga acaggtgaac catgcactgg 6300 aactgccact gcatcgccgt actcagcgtc tggaagcagt atggtctatc gaggcctacc 6360 gtaaaaagga ggacgcgaat caggttctgc tggagctggc aattctggat tacaacatga 6420 tccagtctgt ataccagcgt gatctgcgtg aaacgtcccg ttggtggcgt cgtgtgggtc 6480 tggcgaccaa actgcacttt gctcgtgacc gcctgattga gagcttctac tgggccgtgg 6540 gtgtagcatt cgaaccgcaa tactccgact gccgtaactc cgtcgcaaaa atgttttctt 6600 tcgtaaccat tatcgacgat atctacgatg tatacggcac cctggacgaa ctggagctgt 6660 ttactgatgc agttgagcgt tgggacgtaa acgccatcaa cgacctgccg gattacatga 6720 aactgtgctt tctggctctg tataacacta ttaacgaaat cgcctacgac aacctgaaag 6780 ataaaggtga gaacatcctg ccgtatctga ccaaagcctg ggctgacctg tgcaacgctt 6840 tcctgcaaga agccaagtgg ctgtacaaca aatctactcc gacctttgac gactacttcg 6900 gcaacgcatg gaaatcctct tctggcccgc tgcaactggt gttcgcttac ttcgctgtcg 6960 tgcagaacat taaaaaggaa gagatcgaaa acctgcaaaa ataccatgac accatctctc 7020 gtccttccca tatcttccgt ctgtgcaatg acctggctag cgcgtctgcg gaaattgcgc 7080 gtggtgaaac cgcaaatagc gtttcttgtt acatgcgcac taaaggtatc tccgaagaac 7140 tggctaccga aagcgtgatg aatctgatcg atgaaacctg gaaaaagatg aacaaggaaa 7200 aactgggtgg tagcctgttc gcgaaaccgt tcgtggaaac cgcgatcaac ctggcacgtc 7260 aatctcactg cacttatcat aacggcgacg cgcatacctc tccggatgag ctgacccgca 7320 aacgcgttct gtctgtaatc actgaaccga ttctgccgtt tgaacgctaa 7370 <210> 164 <211> 578 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 164 Met Arg Gly Ser His His His His His His Gly Met Ala Ser Met Thr 1 5 10 15 Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys Asp 20 25 30 His Pro Phe Thr Met Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp 35 40 45 Asp Tyr Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val 50 55 60 His Lys Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile 65 70 75 80 Asn Asn Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn 85 90 95 Val Gln Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Arg 100 105 110 Ala Leu Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Gly Val Thr Lys 115 120 125 Thr Ser Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His 130 135 140 Gly Phe Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn 145 150 155 160 Gly Asn Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser 165 170 175 Leu Tyr Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp 180 185 190 Glu Ala Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu 195 200 205 Lys Ile Gly Lys Glu Leu Ala Glu Gln Val Ser His Ala Leu Glu Leu 210 215 220 Pro Leu His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu 225 230 235 240 Ala Tyr Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala 245 250 255 Ile Leu Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg 260 265 270 Glu Thr Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His 275 280 285 Phe Ala Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val 290 295 300 Ala Phe Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met 305 310 315 320 Phe Ser Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr 325 330 335 Leu Asp Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val 340 345 350 Asn Ala Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala 355 360 365 Leu Tyr Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys 370 375 380 Gly Glu Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys 385 390 395 400 Asn Ala Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro 405 410 415 Thr Phe Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro 420 425 430 Leu Gln Leu Ile Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys 435 440 445 Glu Glu Ile Glu Asn Leu Gln Lys Tyr His Asp Ile Ile Ser Arg Pro 450 455 460 Ser His Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu 465 470 475 480 Ile Ala Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr 485 490 495 Lys Gly Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile 500 505 510 Asp Glu Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu 515 520 525 Phe Ala Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser 530 535 540 His Cys Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu 545 550 555 560 Thr Arg Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe 565 570 575 Glu Arg <210> 165 <211> 7370 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 165 cgtcgttctg cgaactacga acctaacagc tgggactatg attacctgct gtcctccgac 60 acggacgagt ccatcgaagt acacaaagac aaagcgaaaa agctggaagc cgaagttcgt 120 cgcgagatta ataacgaaaa agcagaattt ctgaccctgc tggaactgat tgacaacgtc 180 cagcgcctgg gcctgggtta ccgtttcgag tctgatatcc gtcgtgcgct ggatcgcttc 240 gtttcctccg gcggcttcga tggcgtaacc aagacttccc tgcacggtac ggcactgtct 300 ttccgtctgc tgcgtcaaca cggttttgag gtttctcagg aagcgttcag cggcttcaaa 360 gaccaaaacg gcaacttcct ggagaacctg aaggaagata tcaaagctat cctgagcctg 420 tacgaggcca gcttcctggc tctggaaggc gaaaacatcc tggacgaggc gaaggttttc 480 gcaatctctc atctgaaaga actgtctgaa gaaaagatcg gtaaagagct ggcagaacag 540 gtgtcccatg cactggaact gccactgcat cgccgtactc agcgtctgga agcagtatgg 600 tctatcgagg cctaccgtaa aaaggaggac gcgaaccagg ttctgctgga gctggcaatt 660 ctggattaca acatgatcca gtctgtatac cagcgtgatc tgcgtgaaac gtcccgttgg 720 tggcgtcgtg tgggtctggc gaccaaactg cactttgctc gtgaccgcct gattgagagc 780 ttctactggg ccgtgggtgt agcattcgaa ccgcaatact ccgactgccg taactccgtc 840 gcaaaaatgt tttctttcgt aaccattatc gacgatatct acgatgtata cggcaccctg 900 gacgaactgg agctgtttac tgatgcagtt gagcgttggg acgtaaacgc catcaacgac 960 ctgccggatt acatgaaact gtgctttctg gctctgtata acactattaa cgaaatcgcc 1020 tacgacaacc tgaaagataa aggtgagaac atcctgccgt atctgaccaa agcctgggct 1080 gacctgtgca acgctttcct gcaagaagcc aagtggctgt acaacaaatc tactccgacc 1140 tttgacgact acttcggcaa cgcatggaaa tcctcttctg gcccgctgca actgatcttc 1200 gcttacttcg ctgtcgtgca gaacattaaa aaggaagaga tcgaaaacct gcaaaaatac 1260 catgacatca tctctcgtcc ttcccatatc ttccgtctgt gcaatgacct ggctagcgcg 1320 tctgcggaaa ttgcgcgtgg tgaaaccgca aatagcgttt cttgttacat gcgcactaaa 1380 ggtatctccg aagaactggc taccgaaagc gtgatgaatc tgatcgatga aacctggaaa 1440 aagatgaaca aggaaaaact gggtggtagc ctgttcgcga aaccgttcgt ggaaaccgcg 1500 atcaacctgg cacgtcaatc tcactgcact tatcataacg gcgacgcgca tacctctccg 1560 gatgagctga cccgcaaacg cgttctgtct gtaatcactg aaccgattct gccgtttgaa 1620 cgctaaaagg gcgagctcaa cgatccggct gctaacaaag cccgaaagga agctgagttg 1680 gctgctgcca ccgctgagca ataactagca taaccccttg gggcctctaa acgggtcttg 1740 aggagttttt tgctgaaagg aggaactata tccggatatc ccgcaagagg cccggcagta 1800 ccggcataac caagcctatg cctacagcat ccagggtgac ggtgccgagg atgacgatga 1860 gcgcattgtt agatttcata cacggtgcct gactgcgtta gcaatttaac tgtgataaac 1920 taccgcatta aagcttatcg atgataagct gtcaaacatg agaattaatt cttgaagacg 1980 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 2040 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 2100 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 2160 ttgaaaaagg aagagtatga ttgaacaaga tggattgcac gcaggttctc cggccgcttg 2220 ggtggagagg ctattcggct atgactgggc acaactgaca atcggctgct ctgatgccgc 2280 cgtgttccgg ctgtcagcgc aggggcgccc ggttcttttt gtcaagaccg acctgtccgg 2340 tgccctgaat gaactgcagg acgaggcagc gcggctatcg tggctggcca cgacgggcgt 2400 tccttgcgca gctgtgctcg acgttgtcac tgaagcggga agggactggc tgctattggg 2460 cgaagtgccg gggcaggatc tcctgtcatc tcaccttgct cctgccgaga aagtatccat 2520 catggctgat gcaatgcggc ggctgcatac gcttgatccg gctacctgcc cattcgacca 2580 ccaagcgaaa catcgcatcg agcgggcacg tactcggatg gaagccggtc ttgtcgatca 2640 ggatgatctg gacgaagagc atcaggggct cgcgccagcc gaactgttcg ccaggctcaa 2700 ggcgcgcatg cccgacggcg aggatctcgt cgtgacacat ggcgatgcct gcttgccgaa 2760 tatcatggtg gaaaatggcc gcttttctgg attcatcgac tgtggccggc tgggtgtggc 2820 ggaccgctat caggacatag cgttggctac ccgtgatatt gctgaagagc ttggcggcga 2880 atgggctgac cgcttcctcg tgctttacgg tatcgccgct cccgattcgc agcgcatcgc 2940 cttctatcgc cttcttgacg agttcttctg agcgggactc tggggttcga aatgaccgac 3000 caagcgacgc ctaactgtca gaccaagttt actcatatat actttagatt gatttaaaac 3060 ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa 3120 tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat 3180 cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc 3240 taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg 3300 gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag ttaggccacc 3360 acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg 3420 ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg 3480 ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa 3540 cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg 3600 aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga 3660 gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct 3720 gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca 3780 gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc 3840 ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg 3900 ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc 3960 tgatgcggta ttttctcctt acgcatctgt gcggtatttc acaccgcaat ggtgcactct 4020 cagtacaatc tgctctgatg ccgcatagtt aagccagtat acactccgct atcgctacgt 4080 gactgggtca tggctgcgcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct 4140 tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt 4200 cagaggtttt caccgtcatc accgaaacgc gcgaggcagc tgcggtaaag ctcatcagcg 4260 tggtcgtgaa gcgattcaca gatgtctgcc tgttcatccg cgtccagctc gttgagtttc 4320 tccagaagcg ttaatgtctg gcttctgata aagcgggcca tgttaagggc ggttttttcc 4380 tgtttggtca ctgatgcctc cgtgtaaggg ggatttctgt tcatgggggt aatgataccg 4440 atgaaacgag agaggatgct cacgatacgg gttactgatg atgaacatgc ccggttactg 4500 gaacgttgtg agggtaaaca actggcggta tggatgcggc gggaccagag aaaaatcact 4560 cagggtcaat gccagcgctt cgttaataca gatgtaggtg ttccacaggg tagccagcag 4620 catcctgcga tgcagatccg gaacataatg gtgcagggcg ctgacttccg cgtttccaga 4680 ctttacgaaa cacggaaacc gaagaccatt catgttgttg ctcaggtcgc agacgttttg 4740 cagcagcagt cgcttcacgt tcgctcgcgt atcggtgatt cattctgcta accagtaagg 4800 caaccccgcc agcctagccg ggtcctcaac gacaggagca cgatcatgcg cacccgtggc 4860 caggacccaa cgctgcccga gatgcgccgc gtgcggctgc tggagatggc ggacgcgatg 4920 gatatgttct gccaagggtt ggtttgcgca ttcacagttc tccgcaagaa ttgattggct 4980 ccaattcttg gagtggtgaa tccgttagcg aggtgccgcc ggcttccatt caggtcgagg 5040 tggcccggct ccatgcaccg cgacgcaacg cggggaggca gacaaggtat agggcggcgc 5100 ctacaatcca tgccaacccg ttccatgtgc tcgccgaggc ggcataaatc gccgtgacga 5160 tcagcggtcc aatgatcgaa gttaggctgg taagagccgc gagcgatcct tgaagctgtc 5220 cctgatggtc gtcatctacc tgcctggaca gcatggcctg caacgcgggc atcccgatgc 5280 cgccggaagc gagaagaatc ataatgggga aggccatcca gcctcgcgtc gcgaacgcca 5340 gcaagacgta gcccagcgcg tcggccgcca tgccggcgat aatggcctgc ttctcgccga 5400 aacgtttggt ggcgggacca gtgacgaagg cttgagcgag ggcgtgcaag attccgaata 5460 ccgcaagcga caggccgatc atcgtcgcgc tccagcgaaa gcggtcctcg ccgaaaatga 5520 cccagagcgc tgccggcacc tgtcctacga gttgcatgat aaagaagaca gtcataagtg 5580 cggcgacgat agtcatgccc cgcgcccacc ggaaggagct gactgggttg aaggctctca 5640 agggcatcgg tcgagatccc ggtgcctaat gagtgagcta acttacatta attgcgttgc 5700 gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 5760 aacgcgcggg gagaggcggt ttgcgtattg ggcgccaggg tggtttttct tttcaccagt 5820 gagacgggca acagctgatt gcccttcacc gcctggccct gagagagttg cagcaagcgg 5880 tccacgctgg tttgccccag caggcgaaaa tcctgtttga tggtggttaa cggcgggata 5940 taacatgagc tgtcttcggt atcgtcgtat cccactaccg agatatccgc accaacgcgc 6000 agcccggact cggtaatggc gcgcattgcg cccagcgcca tctgatcgtt ggcaaccagc 6060 atcgcagtgg gaacgatgcc ctcattcagc atttgcatgg tttgttgaaa accggacatg 6120 gcactccagt cgccttcccg ttccgctatc ggctgaattt gattgcgagt gagatattta 6180 tgccagccag ccagacgcag acgcgccgag acagaactta atgggcccgc taacagcgcg 6240 atttgctggt gacccaatgc gaccagatgc tccacgccca gtcgcgtacc gtcttcatgg 6300 gagaaaataa tactgttgat gggtgtctgg tcagagacat caagaaataa cgccggaaca 6360 ttagtgcagg cagcttccac agcaatggca tcctggtcat ccagcggata gttaatgatc 6420 agcccactga cgcgttgcgc gagaagattg tgcaccgccg ctttacaggc ttcgacgccg 6480 cttcgttcta ccatcgacac caccacgctg gcacccagtt gatcggcgcg agatttaatc 6540 gccgcgacaa tttgcgacgg cgcgtgcagg gccagactgg aggtggcaac gccaatcagc 6600 aacgactgtt tgcccgccag ttgttgtgcc acgcggttgg gaatgtaatt cagctccgcc 6660 atcgccgctt ccactttttc ccgcgttttc gcagaaacgt ggctggcctg gttcaccacg 6720 cgggaaacgg tctgataaga gacaccggca tactctgcga catcgtataa cgttactggt 6780 ttcacattca ccaccctgaa ttgactctct tccgggcgct atcatgccat accgcgaaag 6840 gttttgcgcc attcgatggt gtccgggatc tcgacgctct cccttatgcg actcctgcat 6900 taggaagcag cccagtagta ggttgaggcc gttgagcacc gccgccgcaa ggaatggtgc 6960 atgcaaggag atggcgccca acagtccccc ggccacgggg cctgccacca tacccacgcc 7020 gaaacaagcg ctcatgagcc cgaagtggcg agcccgatct tccccatcgg tgatgtcggc 7080 gatataggcg ccagcaaccg cacctgtggc gccggtgatg ccggccacga tgcgtccggc 7140 gtagaggatc gagatctcga tcccgcgaaa ttaatacgac tcactatagg ggaattgtga 7200 gcggataaca attcccctct agaaataatt ttgtttaact ttaagaagga gatatacata 7260 tgcggggttc tcatcatcat catcatcatg gtatggctag catgactggt ggacagcaaa 7320 tgggtcggga tctgtacgac gatgacgata aggatcatcc cttcaccatg 7370 <210> 166 <211> 578 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 166 Met Arg Gly Ser His His His His His His Gly Met Ala Ser Met Thr 1 5 10 15 Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys Asp 20 25 30 His Pro Phe Thr Met Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp 35 40 45 Asp Tyr Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val 50 55 60 Tyr Lys Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile 65 70 75 80 Asn Asn Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn 85 90 95 Val Gln Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Arg 100 105 110 Ala Leu Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys 115 120 125 Thr Ser Leu His Ala Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His 130 135 140 Gly Phe Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn 145 150 155 160 Gly Asn Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser 165 170 175 Leu Tyr Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp 180 185 190 Glu Ala Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu 195 200 205 Lys Ile Gly Lys Asp Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu 210 215 220 Pro Leu His Arg Arg Thr Gln Arg Leu Glu Ala Val Leu Ser Ile Glu 225 230 235 240 Ala Tyr Arg Lys Lys Glu Asp Ala Asp Gln Val Leu Leu Glu Leu Ala 245 250 255 Ile Leu Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg 260 265 270 Glu Thr Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His 275 280 285 Phe Ala Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val 290 295 300 Ala Phe Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met 305 310 315 320 Phe Ser Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr 325 330 335 Leu Asp Glu Leu Glu Leu Phe Thr Asn Ala Val Glu Arg Trp Asp Val 340 345 350 Asn Ala Ile Asp Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala 355 360 365 Leu Tyr Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Glu Lys 370 375 380 Gly Glu Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys 385 390 395 400 Asn Ala Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro 405 410 415 Thr Phe Asp Glu Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro 420 425 430 Leu Gln Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys 435 440 445 Glu Glu Ile Glu Asn Leu Gln Lys Tyr His Asp Ile Ile Ser Arg Pro 450 455 460 Ser His Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu 465 470 475 480 Ile Ala Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr 485 490 495 Lys Gly Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile 500 505 510 Asp Glu Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu 515 520 525 Phe Ala Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser 530 535 540 His Cys Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu 545 550 555 560 Thr Arg Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe 565 570 575 Glu Arg <210> 167 <211> 7370 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 167 cgtcgttctg cgaactacga acctaacagc tgggactatg attacctgct gtcctccgac 60 acggacgagt ccatcgaagt atacaaagac aaagcgaaaa agctggaagc cgaagttcgt 120 cgcgagatta ataacgaaaa agcagaattt ctgaccctgc tggaactgat tgacaacgtc 180 cagcgcctgg gcctgggtta ccgtttcgag tctgatatcc gtcgtgcgct ggatcgcttc 240 gtttcctccg gcggcttcga tgcggtaacc aagacttccc tgcacgcgac ggcactgtct 300 ttccgtctgc tgcgtcaaca cggttttgag gtttctcagg aagcgttcag cggcttcaaa 360 gaccaaaacg gcaacttcct ggagaacctg aaggaagata tcaaagctat cctgagcctg 420 tacgaggcca gcttcctggc tctggaaggc gaaaacatcc tggacgaggc gaaggttttc 480 gcaatctctc atctgaaaga actgtctgaa gaaaagatcg gtaaagatct ggcagaacag 540 gtgaaccatg cactggaact gccactgcat cgccgtactc agcgtctgga agcagtactg 600 tctatcgagg cctaccgtaa aaaggaggac gcggatcagg ttctgctgga gctggcaatt 660 ctggattaca acatgatcca gtctgtatac cagcgtgatc tgcgtgaaac gtcccgttgg 720 tggcgtcgtg tgggtctggc gaccaaactg cactttgctc gtgaccgcct gattgagagc 780 ttctactggg ccgtgggtgt agcattcgaa ccgcaatact ccgactgccg taactccgtc 840 gcaaaaatgt tttctttcgt aaccattatc gacgatatct acgatgtata cggcaccctg 900 gacgaactgg agctgtttac taacgcagtt gagcgttggg acgtaaacgc catcgacgat 960 ctgccggatt acatgaaact gtgctttctg gctctgtata acactattaa cgaaatcgcc 1020 tacgacaacc tgaaagaaaa aggtgagaac atcctgccgt atctgaccaa agcctgggct 1080 gacctgtgca acgctttcct gcaagaagcc aagtggctgt acaacaaatc tactccgacc 1140 tttgacgaat acttcggcaa cgcatggaaa tcctcttctg gcccgctgca actggtgttc 1200 gcttacttcg ctgtcgtgca gaacattaaa aaggaagaga tcgaaaacct gcaaaaatac 1260 catgacatca tctctcgtcc ttcccatatc ttccgtctgt gcaatgacct ggctagcgcg 1320 tctgcggaaa ttgcgcgtgg tgaaaccgca aatagcgttt cttgttacat gcgcactaaa 1380 ggtatctccg aagaactggc taccgaaagc gtgatgaatc tgatcgatga aacctggaaa 1440 aagatgaaca aggaaaaact gggtggtagc ctgttcgcga aaccgttcgt ggaaaccgcg 1500 atcaacctgg cacgtcaatc tcactgcact tatcataacg gcgacgcgca tacctctccg 1560 gatgagctga cccgcaaacg cgttctgtct gtaatcactg aaccgattct gccgtttgaa 1620 cgctaaaagg gcgagctcaa cgatccggct gctaacaaag cccgaaagga agctgagttg 1680 gctgctgcca ccgctgagca ataactagca taaccccttg gggcctctaa acgggtcttg 1740 aggagttttt tgctgaaagg aggaactata tccggatatc ccgcaagagg cccggcagta 1800 ccggcataac caagcctatg cctacagcat ccagggtgac ggtgccgagg atgacgatga 1860 gcgcattgtt agatttcata cacggtgcct gactgcgtta gcaatttaac tgtgataaac 1920 taccgcatta aagcttatcg atgataagct gtcaaacatg agaattaatt cttgaagacg 1980 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 2040 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 2100 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 2160 ttgaaaaagg aagagtatga ttgaacaaga tggattgcac gcaggttctc cggccgcttg 2220 ggtggagagg ctattcggct atgactgggc acaactgaca atcggctgct ctgatgccgc 2280 cgtgttccgg ctgtcagcgc aggggcgccc ggttcttttt gtcaagaccg acctgtccgg 2340 tgccctgaat gaactgcagg acgaggcagc gcggctatcg tggctggcca cgacgggcgt 2400 tccttgcgca gctgtgctcg acgttgtcac tgaagcggga agggactggc tgctattggg 2460 cgaagtgccg gggcaggatc tcctgtcatc tcaccttgct cctgccgaga aagtatccat 2520 catggctgat gcaatgcggc ggctgcatac gcttgatccg gctacctgcc cattcgacca 2580 ccaagcgaaa catcgcatcg agcgggcacg tactcggatg gaagccggtc ttgtcgatca 2640 ggatgatctg gacgaagagc atcaggggct cgcgccagcc gaactgttcg ccaggctcaa 2700 ggcgcgcatg cccgacggcg aggatctcgt cgtgacacat ggcgatgcct gcttgccgaa 2760 tatcatggtg gaaaatggcc gcttttctgg attcatcgac tgtggccggc tgggtgtggc 2820 ggaccgctat caggacatag cgttggctac ccgtgatatt gctgaagagc ttggcggcga 2880 atgggctgac cgcttcctcg tgctttacgg tatcgccgct cccgattcgc agcgcatcgc 2940 cttctatcgc cttcttgacg agttcttctg agcgggactc tggggttcga aatgaccgac 3000 caagcgacgc ctaactgtca gaccaagttt actcatatat actttagatt gatttaaaac 3060 ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa 3120 tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat 3180 cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc 3240 taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg 3300 gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag ttaggccacc 3360 acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg 3420 ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg 3480 ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa 3540 cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg 3600 aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga 3660 gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct 3720 gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca 3780 gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc 3840 ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg 3900 ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc 3960 tgatgcggta ttttctcctt acgcatctgt gcggtatttc acaccgcaat ggtgcactct 4020 cagtacaatc tgctctgatg ccgcatagtt aagccagtat acactccgct atcgctacgt 4080 gactgggtca tggctgcgcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct 4140 tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt 4200 cagaggtttt caccgtcatc accgaaacgc gcgaggcagc tgcggtaaag ctcatcagcg 4260 tggtcgtgaa gcgattcaca gatgtctgcc tgttcatccg cgtccagctc gttgagtttc 4320 tccagaagcg ttaatgtctg gcttctgata aagcgggcca tgttaagggc ggttttttcc 4380 tgtttggtca ctgatgcctc cgtgtaaggg ggatttctgt tcatgggggt aatgataccg 4440 atgaaacgag agaggatgct cacgatacgg gttactgatg atgaacatgc ccggttactg 4500 gaacgttgtg agggtaaaca actggcggta tggatgcggc gggaccagag aaaaatcact 4560 cagggtcaat gccagcgctt cgttaataca gatgtaggtg ttccacaggg tagccagcag 4620 catcctgcga tgcagatccg gaacataatg gtgcagggcg ctgacttccg cgtttccaga 4680 ctttacgaaa cacggaaacc gaagaccatt catgttgttg ctcaggtcgc agacgttttg 4740 cagcagcagt cgcttcacgt tcgctcgcgt atcggtgatt cattctgcta accagtaagg 4800 caaccccgcc agcctagccg ggtcctcaac gacaggagca cgatcatgcg cacccgtggc 4860 caggacccaa cgctgcccga gatgcgccgc gtgcggctgc tggagatggc ggacgcgatg 4920 gatatgttct gccaagggtt ggtttgcgca ttcacagttc tccgcaagaa ttgattggct 4980 ccaattcttg gagtggtgaa tccgttagcg aggtgccgcc ggcttccatt caggtcgagg 5040 tggcccggct ccatgcaccg cgacgcaacg cggggaggca gacaaggtat agggcggcgc 5100 ctacaatcca tgccaacccg ttccatgtgc tcgccgaggc ggcataaatc gccgtgacga 5160 tcagcggtcc aatgatcgaa gttaggctgg taagagccgc gagcgatcct tgaagctgtc 5220 cctgatggtc gtcatctacc tgcctggaca gcatggcctg caacgcgggc atcccgatgc 5280 cgccggaagc gagaagaatc ataatgggga aggccatcca gcctcgcgtc gcgaacgcca 5340 gcaagacgta gcccagcgcg tcggccgcca tgccggcgat aatggcctgc ttctcgccga 5400 aacgtttggt ggcgggacca gtgacgaagg cttgagcgag ggcgtgcaag attccgaata 5460 ccgcaagcga caggccgatc atcgtcgcgc tccagcgaaa gcggtcctcg ccgaaaatga 5520 cccagagcgc tgccggcacc tgtcctacga gttgcatgat aaagaagaca gtcataagtg 5580 cggcgacgat agtcatgccc cgcgcccacc ggaaggagct gactgggttg aaggctctca 5640 agggcatcgg tcgagatccc ggtgcctaat gagtgagcta acttacatta attgcgttgc 5700 gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 5760 aacgcgcggg gagaggcggt ttgcgtattg ggcgccaggg tggtttttct tttcaccagt 5820 gagacgggca acagctgatt gcccttcacc gcctggccct gagagagttg cagcaagcgg 5880 tccacgctgg tttgccccag caggcgaaaa tcctgtttga tggtggttaa cggcgggata 5940 taacatgagc tgtcttcggt atcgtcgtat cccactaccg agatatccgc accaacgcgc 6000 agcccggact cggtaatggc gcgcattgcg cccagcgcca tctgatcgtt ggcaaccagc 6060 atcgcagtgg gaacgatgcc ctcattcagc atttgcatgg tttgttgaaa accggacatg 6120 gcactccagt cgccttcccg ttccgctatc ggctgaattt gattgcgagt gagatattta 6180 tgccagccag ccagacgcag acgcgccgag acagaactta atgggcccgc taacagcgcg 6240 atttgctggt gacccaatgc gaccagatgc tccacgccca gtcgcgtacc gtcttcatgg 6300 gagaaaataa tactgttgat gggtgtctgg tcagagacat caagaaataa cgccggaaca 6360 ttagtgcagg cagcttccac agcaatggca tcctggtcat ccagcggata gttaatgatc 6420 agcccactga cgcgttgcgc gagaagattg tgcaccgccg ctttacaggc ttcgacgccg 6480 cttcgttcta ccatcgacac caccacgctg gcacccagtt gatcggcgcg agatttaatc 6540 gccgcgacaa tttgcgacgg cgcgtgcagg gccagactgg aggtggcaac gccaatcagc 6600 aacgactgtt tgcccgccag ttgttgtgcc acgcggttgg gaatgtaatt cagctccgcc 6660 atcgccgctt ccactttttc ccgcgttttc gcagaaacgt ggctggcctg gttcaccacg 6720 cgggaaacgg tctgataaga gacaccggca tactctgcga catcgtataa cgttactggt 6780 ttcacattca ccaccctgaa ttgactctct tccgggcgct atcatgccat accgcgaaag 6840 gttttgcgcc attcgatggt gtccgggatc tcgacgctct cccttatgcg actcctgcat 6900 taggaagcag cccagtagta ggttgaggcc gttgagcacc gccgccgcaa ggaatggtgc 6960 atgcaaggag atggcgccca acagtccccc ggccacgggg cctgccacca tacccacgcc 7020 gaaacaagcg ctcatgagcc cgaagtggcg agcccgatct tccccatcgg tgatgtcggc 7080 gatataggcg ccagcaaccg cacctgtggc gccggtgatg ccggccacga tgcgtccggc 7140 gtagaggatc gagatctcga tcccgcgaaa ttaatacgac tcactatagg ggaattgtga 7200 gcggataaca attcccctct agaaataatt ttgtttaact ttaagaagga gatatacata 7260 tgcggggttc tcatcatcat catcatcatg gtatggctag catgactggt ggacagcaaa 7320 tgggtcggga tctgtacgac gatgacgata aggatcatcc cttcaccatg 7370

Claims

단리된 포플러 (poplar) 이소프렌 신타아제 변이체로서, 상기 변이체는 이소프렌 신타아제 N-말단 부위의 절단을 포함하는 변이체.
제 1 항에 있어서, 상기 이소프렌 신타아제 변이체가 전장 이소프렌 신타아제와 비교시 증가된 특이 활성을 갖는 단리된 포플러 이소프렌 신타아제 변이체.
제 1 항에 있어서, 상기 이소프렌 신타아제가 SEQ ID NO:120 의 P. alba 이소프렌 신타아제인 단리된 포플러 이소프렌 신타아제 변이체.
제 3 항에 있어서, 상기 변이체가 하기로 이루어진 군으로부터 선택되는 단리된 포플러 이소프렌 신타아제 변이체: MEA 변이체 (SEQ ID NO:122), MSV 변이체 (SEQ ID NO:124), MVS 변이체 (SEQ ID NO:126), MTE 변이체 (SEQ ID NO:128), MNV 변이체 (SEQ ID NO:130).
제 4 항에 있어서, 상기 변이체가 MEA 변이체 (SEQ ID NO:122) 인 단리된 포플러 이소프렌 신타아제 변이체.
제 3 항에 있어서, 상기 변이체가 하기로 이루어진 군으로부터 선택되는 단리된 포플러 이소프렌 신타아제 변이체: TRC (-3) 변이체 (SEQ ID NO:136), TRC (-4) 변이체 (SEQ ID NO:138), TRC (-5) 변이체 (SEQ ID NO:140), TRC (-6) 변이체 (SEQ ID NO:142) 및 TRC (-7) 변이체 (SEQ ID NO:144).
제 1 항에 있어서, 상기 변이체가 P. tremuloides 이소프렌 신타아제의 MET 변이체 (SEQ ID NO:146) 인 단리된 포플러 이소프렌 신타아제 변이체.
제 1 항에 있어서, 상기 변이체가 P. trichocharpa 이소프렌 신타아제의 MET 변이체 (SEQ ID NO:148) 인 단리된 포플러 이소프렌 신타아제 변이체.
단리된 포플러 이소프렌 신타아제 변이체로서, 상기 변이체가 야생형 이소프렌 신타아제의 하나 이상의 아미노산 잔기의 치환을 포함하고; 이때 이소프렌 신타아제 변이체는 야생형 이소프렌 신타아제와 비교시 증가된 이소프렌 신타아제 활성을 갖는 변이체.
제 9 항에 있어서, 상기 증가된 이소프렌 신타아제 활성이, 모체 이소프렌 신타아제를 포함하는 숙주 세포와 비교시, 디메틸알릴 피로포스페이트 (DMAPP) 의 존재하에서 더 신속한 속도로 성장하는 이소프렌 변이체를 포함하는 숙주 세포에 의해 나타내어지는 변이체.
제 9 항에 있어서, 상기 이소프렌 신타아제가 SEQ ID NO:120 의 P. alba 이소프렌 신타아제인 단리된 포플러 이소프렌 신타아제 변이체.
제 11 항에 있어서, 상기 변이체가 하기로 이루어진 군으로부터 선택되는 하나 이상의 아미노산 치환을 포함하는 단리된 포플러 이소프렌 신타아제 변이체: V10M, F12S, T15A, E18G, V58I, V58F, L70Q, L70V, L70T, T71P, V79L, E89D, G94A, S119F, F120L, G127R, E175V, T212I, S257A, R262G, A266G, F280L, N297K, F305L, L319M, E323K, A328T, D342E, A359T, K366N, E368D, L374M, S396T, V418S, K438N, H440R, T442I, T442A, I449V, A469S, K500R, K505Q, G507S, S509N, F511Y, 및 N532K.
제 11 항에 있어서, 적어도 하나의 아미노산 치환이 L70R 치환인 단리된 포플러 이소프렌 신타아제 변이체.
제 11 항에 있어서, 상기 변이체가 하기로 이루어진 군으로부터 선택되는 하나 이상의 아미노산 치환을 포함하는 단리된 포플러 이소프렌 신타아제 변이체: G127R/F511Y, L70Q/G94A/R262G/F305L, F12S/T15A/E18G/N297K, S396T/T442I, V10M/E323K, F120L/A266G, K438N/K500R, V79L/S509N, E175V/S257A/E368D/A469S, T71P/L374M, F280L/H440R, E89D/H440R, V58F/A328T/N532K, S119F/D342E/I449V, 및 K366N/G507S.
SEQ ID NO:120 (도 19) 의 아미노산 잔기를 포함하는 폴리펩티드의 결정질 형태.
하기를 포함하는, 이소프렌의 생성 방법: (a) 이소프렌 신타아제 변이체를 인코딩하는 폴리뉴클레오티드 서열을 포함하는 발현 벡터를 포함하는 숙주 세포를 제공함; 및 (b) 상기 숙주 세포를 이소프렌 생성에 적합한 조건 하에서 배양함.
제 16 항에 있어서, (c) 이소프렌을 회수함을 추가로 포함하는 방법.
제 17 항에 있어서, (d) 이소프렌을 중합화함을 추가로 포함하는 방법.
하기를 포함하는, 이소프렌 신타아제 활성의 검출 방법: (a) 이소프렌 신타아제 변이체를 생성하기에 적합한 조건 하에서 발현 벡터를 포함하는 숙주 세포를 배양함; (b) 상기 숙주 세포를 리소자임을 포함하는 분해 버퍼로 분해하여 세포 분해물을 생성함; 및 (c) 상기 세포 분해물 내 이소프렌 신타아제 활성을 디메틸알릴 디포스페이트 (DMAPP) 로부터의 이소프렌 생성을 측정함으로써 검출함.
제 19 항에 있어서, 상기 숙주 세포가 그람-양성 박테리아 세포, 그람-음성 박테리아 세포, 사상 진균 세포, 및 효모 세포로 이루어진 군으로부터 선택되는 방법.
제 19 항에 있어서, 상기 숙주 세포가 에스케리키아 종 (대장균), 판테오아 종 (P. 시트레아 ), 바실러스 종 (B. 서브틸리스 ), 야로위아 종 (Y. 리포리티카 ), 및 트리코데르마 (T. 리세이 ) 로 이루어진 군으로부터 선택되는 방법.
제 19 항에 있어서, 상기 숙주 세포가 글루코오스, 글리세롤, 글리세린, 디히드록시아세톤, 효모 추출물, 바이오매스, 당질, 수크로오스, 및 오일로 이루어진 군으로부터 선택되는 탄소 공급원을 포함하는 배지에서 배양되는 방법.
하기를 포함하는 고처리량 스크리닝으로 다수의 샘플 내 이소프렌의 검출 방법:
(a) i) 각각 이소프렌 신타아제를 포함하는 다수의 샘플; ii) 다수의 웰을 포함하는 유리 플레이트; 및 iii) 유리 플레이트용 밀봉제를 제공함;
(b) 유리 플레이트의 다수의 웰에 다수의 샘플을 넣음;
(c) 유리 플레이트를 밀봉제로 밀봉하여, 다수의 웰 각각 내 샘플과 연관있는 상부공간을 갖는 밀봉된 유리 플레이트를 만듦;
(d) 이소프렌 신타아제가 활성인 조건 하에서 유리 플레이트를 인큐베이션함; 및
(e) 상부공간 내 이소프렌을 검출함.
제 23 항에서, 상기 이소프렌을 기체 크로마토그래피-질량 분광법 (GS-MS) 로 검출하는 방법.
제 23 항에 있어서, 상기 다수의 샘플이 프로모터와 작동가능하게 조합된 이소프렌 신타아제 변이체를 인코딩하는 폴리뉴클레오티드 서열을 포함하는 발현 벡터를 포함하는 숙주 세포를 포함하는 방법.
제 23 항에 있어서, 상기 다수의 샘플이 숙주 세포의 분해물, 리소자임, 및 디메틸알릴 디포스페이트 (DMAPP) 를 포함하는 방법.
제 23 항에 있어서, 상기 유리 플레이트가 딥-웰 유리 블록인 방법.
제 23 항에 있어서, 상기 다수의 웰이 24 개 이상의 웰을 포함하는 방법.
제 23 항에 있어서, 상기 다수의 웰 각각이 2 ml 이하의 부피를 포함하는 방법.
프로모터와 작동적으로 조합된 이소프렌 신타아제 변이체를 인코딩하는 이종 폴리뉴클레오티드 서열을 포함하는 숙주 세포로서, 상기 이소프렌 신타아제 변이체는 포플러 이소프렌 신타아제의 하나 이상 (1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10) 의 잔기에 상응하는 위치에서 치환을 포함하는 숙주 세포.
제 30 항에 있어서, 상기 이소프렌 신타아제가 SEQ ID NO:120 의 P. alba 이소프렌 신타아제인 숙주 세포.
제 31 항에 있어서, 상기 변이체가 하기로 이루어진 군으로부터 선택되는 숙주 세포: MEA 변이체 (SEQ ID NO:122), MSV 변이체 (SEQ ID NO:124), MVS 변이체 (SEQ ID NO:126), MTE 변이체 (SEQ ID NO:128), MNV 변이체 (SEQ ID NO:130).
제 31 항에 있어서, 상기 변이체가 하기로 이루어진 군으로부터 선택되는 숙주 세포: TRC (-3) 변이체 (SEQ ID NO:136), TRC (-4) 변이체 (SEQ ID NO:138), TRC (-5) 변이체 (SEQ ID NO:140), TRC (-6) 변이체 (SEQ ID NO:142) 및 TRC (-7) 변이체 (SEQ ID NO:144).
제 30 항에 있어서, 상기 변이체가 P. tremuloides 이소프렌 신타아제의 MET 변이체 (SEQ ID NO:146) 인 숙주 세포.
제 30 항에 있어서, 상기 변이체가 P. trichocharpa 이소프렌 신타아제의 MET 변이체 (SEQ ID NO:148) 인 숙주 세포.
제 31 항에 있어서, 상기 변이체가 하기로 이루어진 군으로부터 선택되는 하나 이상의 아미노산 치환을 포함하는 숙주 세포: V10M, F12S, T15A, E18G, V58I, V58F, L70Q, L70V, L70T, T71P, V79L, E89D, G94A, S119F, F120L, G127R, E175V, T212I, S257A, R262G, A266G, F280L, N297K, F305L, L319M, E323K, A328T, D342E, A359T, K366N, E368D, L374M, S396T, V418S, K438N, H440R, T442I, T442A, I449V, A469S, K500R, K505Q, G507S, S509N, F511Y, 및 N532K.
제 36 항에 있어서, 적어도 하나의 아미노산 치환이 L70R 치환인 숙주 세포.
제 31 항에 있어서, 상기 변이체가 하기로 이루어진 군으로부터 선택되는 하나 이상의 아미노산 치환을 포함하는 숙주 세포: G127R/F511Y, L70Q/G94A/R262G/F305L, F12S/T15A/E18G/N297K, S396T/T442I, V10M/E323K, F120L/A266G, K438N/K500R, V79L/S509N, E175V/S257A/E368D/A469S, T71P/L374M, F280L/H440R, E89D/H440R, V58F/A328T/N532K, S119F/D342E/I449V, 및 K366N/G507S.
제 30 항에 있어서, 상기 폴리뉴클레오티드 서열이 플라스미드 내에 함유되는 숙주 세포.
제 39 항에 있어서, 상기 폴리뉴클레오티드 서열이 숙주 세포의 염색체에 혼입되는 숙주 세포.
제 30 항에 있어서, 상기 숙주가 그람-양성 박테리아 세포, 그람-음성 박테리아 세포, 사상 진균 세포, 및 효모 세포로 이루어진 군으로부터 선택되는 숙주 세포.
제 30 항에 있어서, 상기 숙주가 에스케리키아 종 (대장균), 판테오아 종 (P. 시트레아 ), 바실러스 종 (B. 서브틸리스 ), 야로위아 종 (Y. 리포리티카 ), 및 트리코데르마 (T. 리세이 ) 로 이루어진 군으로부터 선택되는 숙주 세포.
제 30 항에 있어서, 상기 숙주 세포가 글루코오스, 글리세롤, 글리세린, 디히드록시아세톤, 효모 추출물, 바이오매스, 당질, 수크로오스, 및 오일로 이루어진 군으로부터 선택되는 탄소 공급원을 포함하는 배지에서 배양되는 숙주 세포.
제 30 항에 있어서, 상기 숙주 세포가 임의로는 천연형 DXP 경로와 조합되는, IDI 폴리펩티드를 인코딩하는 이종 또는 천연형 핵산 및/또는 DXS 폴리펩티드를 인코딩하는 이종 또는 천연형 핵산을 추가로 포함하는 숙주 세포.
제 30 항에 있어서, 상기 숙주 세포가 IDI 폴리펩티드 및 DXS 폴리펩티드를 인코딩하는 하나 이상의 핵산을 추가로 포함하는 숙주 세포.
제 30 항에 있어서, 상기 숙주 세포가 이소프렌 신타아제 변이체, IDI 폴리펩티드, 및 DXS 폴리펩티드를 인코딩하는 하나의 벡터를 포함하는 숙주 세포.
제 46 항에 있어서, 상기 숙주 세포가 사카로마이세스 세레비시아 및 엔테로 코커스 패칼리스로부터의 MVA 경로 폴리펩티드로 이루어진 군으로부터 선택되는 MVA 경로 폴리펩티드를 인코딩하는 이종 핵산을 추가로 포함하는 숙주 세포.
제 30 항에 있어서, 상기 숙주 세포가 MVA 경로 폴리펩티드 및 DXS 폴리펩티드를 인코딩하는 하나 이상의 핵산을 추가로 포함하고, 이때 하나의 벡터가 이소프렌 신타아제 변이체, MVA 경로 폴리펩티드, 및 DXS 폴리펩티드를 인코딩하는 숙주 세포.
제 48 항에 있어서, 상기 숙주 세포가 DXS 폴리펩티드, IDI 폴리펩티드, 또는 DXP 경로 폴리펩티드의 나머지 중 하나 이상, 및 MVA 경로 폴리펩티드를 인코딩하는 하나 이상의 핵산을 추가로 포함하는 숙주 세포.
하기를 포함하는, 이소프렌의 생성 방법:
(a) 제 30 항의 숙주 세포를 이소프렌 생성에 적합한 배양 조건 하에서 배양함; 및
(b) 이소프렌을 생성함.
제 50 항에 있어서, (c) 이소프렌을 회수함을 추가로 포함하는 방법.
제 51 항에 있어서, (d) 이소프렌을 중합화함을 추가로 포함하는 방법.
하기를 포함하는, 이소프렌 신타아제의 생성 방법:
(a) (i) 숙주 세포; 및 (ii) 프로모터와 작동적으로 조합된 이소프렌 신타아제 변이체를 인코딩하는 핵산을 제공하는 것으로, 이때 이소프렌 신타아제 변이체는 SEQ ID NO:120 의 P. alba 이소프렌 신타아제의 하나 이상 (1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10) 의 잔기와 상응하는 위치에서 치환을 포함함;
(b) 상기 숙주 세포를 상기 핵산과 접촉시켜 형질전환된 숙주 세포를 생성함; 및
(c) 상기 형질전환된 숙주 세포를 이소프렌 신타아제의 생성에 적합한 배양 조건 하에서 배양함.