KR20110020234A - 이소프렌의 미생물에 의한 개선된 생성을 위한 이소프렌 신타아제 변이체 - Google Patents
이소프렌의 미생물에 의한 개선된 생성을 위한 이소프렌 신타아제 변이체 Download PDFInfo
- Publication number
- KR20110020234A KR20110020234A KR1020107026164A KR20107026164A KR20110020234A KR 20110020234 A KR20110020234 A KR 20110020234A KR 1020107026164 A KR1020107026164 A KR 1020107026164A KR 20107026164 A KR20107026164 A KR 20107026164A KR 20110020234 A KR20110020234 A KR 20110020234A
- Authority
- KR
- South Korea
- Prior art keywords
- isoprene
- isoprene synthase
- variant
- host cell
- seq
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/10—Cells modified by introduction of foreign genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P5/00—Preparation of hydrocarbons or halogenated hydrocarbons
- C12P5/007—Preparation of hydrocarbons or halogenated hydrocarbons containing one or more isoprene units, i.e. terpenes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/25—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving enzymes not classifiable in groups C12Q1/26 - C12Q1/66
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y402/00—Carbon-oxygen lyases (4.2)
- C12Y402/03—Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)
- C12Y402/03027—Isoprene synthase (4.2.3.27)
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Analytical Chemistry (AREA)
- Cell Biology (AREA)
- Immunology (AREA)
- Plant Pathology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 발명은 개선된 촉매 활성 및/또는 용해성을 갖는 하나 이상의 이소프렌 신타아제를 포함하는 조성물 및 방법을 제공한다. 특히, 본 발명은 미생물 숙주 세포 내 이소프렌 생성 증가를 위한 변이체 식물 이소프렌 신타아제를 제공한다. 생합성적으로 생성된 본 발명의 이소프렌은 고무 및 엘라스토머 제조에서 유용하다.
Description
관련 출원에 대한 교차 인용
본 출원은 2008 년 4 월 23 일에 제출된 U.S. 가출원 시리즈 제 61/125,336 호에 대한 우선권을 주장하며, 이로써 그 전문은 본원에 참조 인용된다.
본 발명의 분야
본 발명은 개선된 촉매 활성 및/또는 용해성을 지닌 하나 이상의 이소프렌 신타아제 (synthase) 를 포함하는 조성물 및 방법을 제공한다. 특히, 본 발명은 미생물의 숙주 세포에서 증가된 이소프렌 생성을 위한 변이체 식물 이소프렌 신타아제를 제공한다. 본 발명의 생합성으로 생성된 이소프렌은 고무 및 엘라스토머 제조에서 유용하다는 점이 발견된다.
본 발명의 배경
이소프레노이드 (Isoprenoid) 는 의약품, 기능 식품, 향신료, 향료 및 고무 제품에서 유용한 것으로 여겨지는 이소프렌 중합체이다. 그러나, 천연의 이소프레노이드 공급은 생태계에 대한 염려로 제한되고 있다. 이러한 이유로, 불순물이 적고 더 균일성이 큰 이소프레노이드 조성물을 제공하기 위해서, 종종 고무 등의 이소프레노이드를 합성으로 생산한다.
이소프렌 (2-메틸-1,3-부타디엔) 은 수중에서 불용성이고 알코올에서는 가용성인 휘발성 탄화수소이다. 상업적으로 실행가능한 양의 이소프렌을 석유 C5 크래킹 분획분으로부터의 직접적 단리, 또는 C5 이소알칸 또는 이소알켄의 탈수로 수득할 수 있다 (Weissermel 및 Arpe, Industrial Organic Chemistry, 4th ed., Wiley-VCH, pp. 117-122, 2003). C5 골격은 또한 더 작은 하부단위로부터 합성될 수도 있다. 그러나 비재생성 자원과는 관계 없는 이소프렌의 상업적으로 실행가능한 생성 방법을 갖는 것이 바람직할 것이다.
이소프렌의 생합성에 의한 생성은 두 가지 별개의 대사 경로에 의해 발생한다 (Julsing 등., Appl Microbiol Biotechnol, 75:1377-1384, 2007). 진핵생물 및 원시생물에서, 이소프렌은 메발로네이트 (MVA) 경로를 통해 형성되는 한편 일부의 유박테리아 및 더 고등한 식물에서는 메틸에리트리톨 포스페이트 (MEP) 경로를 통해 이소프렌을 생성한다. 식물에서의 이소프렌 배출은 빛과 온도에 의존적이어서, 잎 발생과 연계되어 증가한다. 이소프렌-생성 효소인, 이소프렌 신타아제는 사시나무 (Aspen) 에서 동정되었고 (Silver 및 Fall, Plant Physiol, 97:1588-1591, 1991; 및 Silver 및 Fall, J Biol Chem, 270:13010-13016, 1995), 전체 잎에서부터 이소프렌의 생체 내 생성을 담당하고 있다고 여겨진다. 이소프렌의 박테리아 생성도 또한 기술되어 있는데 (Kuzma 등., Curr Microbiol, 30:97-103, 1995; 및 Wilkins, Chemosphere, 32:1427-1434, 1996), 그 생성량은 배양 배지의 영양분 및 박테리아 성장 단계에 따라 다양하다 (U.S. 특허 제. 5,849,970 호, Fall 등.; 및 Wagner 등., J Bacteriol, 181:4700-4703, 1999, 이 두 문헌은 본원에서 그 전문이 참조 인용되고 있음). 그러나, 선행 기술의 박테리아 시스템을 통해 수득가능한 이소프렌의 수준은 상업적으로 이용하기에는 불충분하다.
따라서, 당 기술은 이소프레노이드 제조의 공급 원료를 제공하는, 유효한 대규모의 박테리아에 의한 이소프렌 생성 방법이 요구된다.
본원에서 언급되는 모든 특허, 특허 출원, 논문 및 공보는 본원에서 명백하게 참조 인용되고 있다.
본 발명의 개요
본 발명은 개선된 촉매 활성 및/또는 용해성을 지닌 하나 이상의 이소프렌 신타아제 효소를 포함하는 조성물 및 방법을 제공한다. 특히, 본 발명은 미생물 숙주 세포에서 증가된 이소프렌 생성을 위한 변이체 식물 이소프렌 신타아제를 제공한다. 생합성으로 생성된 본 발명의 이소프렌은 고무 및 엘라스토머 제조에서 유용하다.
구체적으로, 본 발명은 단리된 이소프렌 신타아제 변이체를 제공하는데, 이때 상기 변이체는, SEQ ID NO: 2 에서 제시된 아미노산 서열을 포함하는 쿠주 (kudzu; 칡) 이소프렌 신타아제의 하나 이상의 잔기 (1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10) 에 상응하는 위치에서 치환을 포함한다. 일부 구현예에서, 이소프렌 신타아제 변이체는 쿠주 (Pueraria sp.) 이소프렌 신타아제 변이체 또는 포플러 (poplar) (Populus sp.) 이소프렌 신타아제 변이체이다. 일부 구현예에서, 하나 이상의 잔기는 하기로 이루어진 군으로부터 선택되나, 이로 제한되지는 않는다: L26, E30, F31, Q33, L35, E36, N37, L39, K40, V41, K43, L44, R61, V62, D63, Q65, K87, E94, N95, L99, D100, N105, K137, E138, G143, E144, N182, L184, K185, G187, N189, T190, P225, H226, K247, T257, E258, M259, D266, N334, D353, S357, I358I, E361, N389, I392, I393, K398, E401, C421, Q423, Q424, E425, D426, H430, L432, R433, S434, D437, R443, L462, E463, H476, N478, D479, Q485, D508, P513, A515, Q532, Y533, L537, G538, R539, Y542, A543, 및 P557. 일부 구현예에서, 하나 이상의 잔기는 하기로 이루어진 군으로부터 선택되나, 이로 제한되지는 않는다: P24, N25, Y309, D310, L377, F381, E384, Y399, N402, A403, S406, S407, G409, A411, L413, F449, A456, T457, S458, A459, A460, E461, L462, E463, R464, G465, E466, T467, T468, N469, M523, S527, 및 Y531. 일부 구현예에서, 하나 이상의 잔기는 하기로 이루어진 군으로부터 선택되나, 이로 제한되지는 않는다: A20, N21, Y22, Q23, R271, W278, F299, V302, 및 S408. 본 발명은 또한 SEQ ID NO: 2 에 제시된 아미노산 서열을 갖는 쿠주 이소프렌 신타아제에서 A20G 치환을 갖는 단리된 이소프렌 신타아제 변이체를 제공한다. 이들 구현예의 서브세트에서, 변이체는 2 개 이상의 치환 (2, 3, 4, 5, 6, 7, 8, 9 또는 10) 을 포함하며, 이때 상기 치환 중 하나는 SEQ ID NO: 2 에서 제시된 아미노산 서열을 갖는 쿠주 이소프렌 신타아제 내 A20G 치환이다. 본 발명은 또한 SEQ ID NO: 2 에 제시된 아미노산 서열을 갖는 쿠주 이소프렌 신타아제에서 S408D 치환을 갖는 단리된 이소프렌 신타아제 변이체를 제공한다. 이들 구현예의 서브세트에서, 변이체는 2 개 이상 (2, 3, 4, 5, 6, 7, 8, 9 또는 10) 의 치환을 포함하며, 이때 상기 치환의 하나는 SEQ ID NO: 2 에 제시된 아미노산 서열을 갖는 쿠주 이소프렌 신타아제 내 S408D 치환이다. 일부 바람직한 구현예에서, 이소프렌 신타아제 변이체는 야생형 이소프렌 신타아제와 비교시 하나 이상의 개선된 특성을 갖는다. 일부의 특히 바람직한 구현예에서, 하나 이상의 개선된 특성은 특이 활성 (디메틸알릴 디포스페이트로부터의 이소프렌 생성), 및 용해성으로 이루어진 군으로부터 선택되나, 이로 제한되지는 않는다.
게다가, 본 발명은 추가로 이소프렌 신타아제 변이체를 인코딩하는 (encoding) 폴리뉴클레오티드 서열을 제공한다. 또한, 프로모터와 작동가능하게 조합된 이소프렌 신타아제 변이체를 인코딩하는 폴리뉴클레오티드 서열을 포함하는 발현 벡터도 제공된다. 추가 구현예에서, 본 발명은 발현 벡터를 포함하는 숙주 세포를 제공한다. 또한, 숙주 세포의 분해물 (lysate) 이 제공되는데, 이때 상기 분해물은 추가로 리소자임을 포함한다. 일부 구현예에서, 분해물은 중성의 pH (6.5 내지 7.5) 이며, 기타 구현예에서는 분해물은 염기성 pH (7.5 초과 및 9.5 미만) 이다. 본 발명은 또한 하기를 포함하는 이소프렌 생성 방법을 제공한다: (a) 발현 벡터를 포함하는 숙주 세포를 제공함; 및 (b) 이소프렌 생성에 적합한 조건 하에서 숙주 세포를 배양함. 일부 구현예에서, 상기 방법은 추가로 (c) 상기 이소프렌을 회수함을 포함한다. 또한 추가의 구현예에서, 상기 방법은 추가로 (d) 상기 이소프렌을 중합화함을 포함한다. 본 발명은 나아가 하기를 포함하는 이소프렌 신타아제 활성의 검출 방법을 제공한다: (a) 이소프렌 신타아제 변이체 제공에 적합한 조건 하에서 발현 벡터를 포함하는 숙주 세포를 배양함; (b) 리소자임을 포함하는 분해 버퍼로 숙주 세포를 분해하여 세포 분해물을 생성함; 및 (c) 디메틸알릴 디포스페이트 (DMAPP)로부터 이소프렌 생성을 측정함으로써 상기 세포 분해물 내 이소프렌 신타아제 활성을 검출함. 일부 구현예에서, 숙주는 그람-양성 박테리아 세포, 그람-음성 박테리아 세포, 사상 진균 세포, 및 효모 세포로 이루어진 군으로부터 선택되나, 이로 제한되지는 않는다. 일부 바람직한 구현예에서, 숙주는 하기로 이루어진 군으로부터 선택되나, 이로 제한되지는 않는다: 에스케리키아 종 ( Escherichia sp .) (E. coli ; 대장균), 판테오아 종 (Panteoa sp .) (P. citrea (P. 시트레아 )), 바실러스 종 (Bacillus sp .) (B. subtilis; B. 서브틸리스 ), 야로위아 종 ( Yarrowia sp .) (Y. lipolytica ; Y. 리포리 티카), 및 트리코데르마 ( Trichoderma ) (T. reesei (T. 리세이 )). 일부 구현예에서, 숙주 세포는 글루코오스, 글리세롤, 글리세린, 디히드록시아세톤, 효모 추출물, 바이오매스 (biomass), 당질, 수크로오스, 및 오일로 이루어진 군으로부터 선택되나, 이로 제한되지 않는 탄소원을 포함하는 배지에서 배양된다.
더욱이, 본 발명은 하기를 포함하는 다수의 샘플 (고-처리량 스크리닝) 에서 이소프렌의 검출 방법을 제공한다: (a) i) 각각 이소프렌 신타아제를 포함하는 다수의 샘플; (ii) 다수의 웰을 포함하는 유리 플레이트; 및 iii) 유리 플레이트용 밀봉제 (seal) 를 제공함; (b) 유리 플레이트의 다수의 웰에 상기 다수의 샘플을 넣음; (c) 유리 플레이트를 밀봉제로 밀봉하여, 다수의 웰 각각 내 샘플과 연관있는 상부 공간을 갖는 밀봉된 유리 플레이트를 만듦; (d) 이소프렌 신타아제가 활성인 조건 하에서 유리 플레이트를 인큐베이션함; 및 (e) 상부공간 내 이소프렌을 검출함. 일부 구현예에서, 이소프렌은 기체 크로마토그래피-질량 분석 (GC-MS) 로 검출한다. 일부 구현예에서, 다수의 샘플은 프로모터와 작동가능하게 조합되어 있는 이소프렌 신타아제 변이체를 인코딩하는 폴리뉴클레오티드 서열을 포함하는 발현 벡터를 포함하는 숙주 세포를 포함한다. 일부 구현예에서, 다수의 샘플은 숙주 세포의 분해물, 리소자임, 및 디메틸알릴 디포스페이트 (DMAPP) 를 포함한다. 일부 바람직한 구현예에서, 유리 플레이트는 딥(deep)웰 유리 블록이다. 일부 바람직한 구현예에서, 다수의 웰은 24 개 이상의 웰 (바람직하게는 48 개 이상의 웰, 더욱 바람직하게는 96 개 이상의 웰, 보다 더욱 바람직하게는 192 개 이상의 웰, 및 가장 바람직하게는 384 개 이상의 웰) 을 포함한다. 특히 바람직한 구현예에서, 다수의 웰 각각은 부피가 2 ml 이하 (바람직하게는 2 ml ~ 0.2 ml) 이다.
아울러, 본 발명은 프로모터와 작동가능하게 조합된 이소프렌 신타아제 변이체를 인코딩하는 이종 폴리뉴클레오티드 서열을 포함하는 숙주 세포를 제공하는데, 이때 상기 이소프렌 신타아제 변이체는, SEQ ID NO: 2 에 제시된 아미노산 서열을 포함하는 쿠주 이소프렌 신타아제의 하나 이상의 잔기 (1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10) 에 상응하는 위치에서 치환을 포함한다. 일부 구현예에서, 상기 하나 이상의 잔기는 하기로 이루어진 군으로부터 선택되나 이로 제한되지는 않는다: L26, E30, F31, Q33, L35, E36, N37, L39, K40, V41, K43, L44, R61, V62, D63, Q65, K87, E94, N95, L99, D100, N105, K137, E138, G143, E144, N182, L184, K185, G187, N189, T190, P225, H226, K247, T257, E258, M259, D266, N334, D353, S357, I358I, E361, N389, I392, I393, K398, E401, C421, Q423, Q424, E425, D426, H430, L432, R433, S434, D437, R443, L462, E463, H476, N478, D479, Q485, D508, P513, A515, Q532, Y533, L537, G538, R539, Y542, A543, 및 P557. 일부 구현예에서, 상기 하나 이상의 잔기는 하기로 이루어진 군으로부터 선택되나 이로 제한되지는 않는다: P24, N25, Y309, D310, L377, F381, E384, Y399, N402, A403, S406, S407, G409, A411, L413, F449, A456, T457, S458, A459, A460, E461, L462, E463, R464, G465, E466, T467, T468, N469, M523, S527, 및 Y531. 일부 구현예에서, 상기 하나 이상의 잔기는 하기로 이루어진 군으로부터 선택되나 이로 제한되지는 않는다: A20, N21, Y22, Q23, R271, W278, F299, V302, 및 S408. 본 발명은 또한 SEQ ID NO: 2 에 제시된 아미노산 서열을 갖는 쿠주 이소프렌 신타아제 내 A20G 치환 및/또는 S408D 치환을 가진 단리된 이소프렌 신타아제 변이체를 제공한다. 일부 바람직한 구현예에서, 이소프렌 신타아제 변이체는 야생형 이소프렌 신타아제와 비교시 하나 이상의 개선된 특성을 지닌다. 일부의 특히 바람직한 구현예에서, 상기 하나 이상의 개선된 특성은 특이 활성 (디메틸알릴 디포스페이트로부터의 이소프렌 생성), 및 용해성으로 이루어진 군으로부터 선택되나 이로 제한되지는 않는다. 일부 바람직한 구현예에서, 폴리뉴클레오티드 서열은 플라스미드 내에 함유된다. 기타 바람직한 구현예에서, 폴리뉴클레오티드 서열은 숙주 세포의 염색체에 혼입된다. 일부 구현예에서, 숙주는 그람-양성 박테리아 세포, 그람-음성 박테리아 세포, 사상 진균 세포, 및 효모 세포로 이루어진 군으로부터 선택되나 이로 제한되지는 않는다. 일부 바람직한 구현예에서, 숙주는 에스케리키아 종 (E. coli ; 대장균), 판테오아 종 (P. 시트레아 ), 바실러스 종 (B. 서브틸리스), 야로위아 종 (Y. 리포리티카 ), 및 트리코데르마 (T. 리세이 ) 으로부터 선택되나 이로 제한되지는 않는다. 일부 구현예에서, 숙주 세포는 글루코오스, 글리세롤, 글리세린, 디히드록시아세톤, 효모 추출물, 바이오매스, 당질, 수크로오스, 및 오일로 이루어진 군으로부터 선택되나 이로 제한되지 않는 탄소원을 포함하는 배지에서 배양된다. 일부 구현예에서, 숙주 세포는 종종 천연형 DXP 경로와 조합되는, IDI 폴리펩티드를 인코딩하는 이종 또는 천연형 핵산 및/또는 DXS 폴리펩티드를 인코딩하는 이종 또는 천연형 핵산 (예를 들어, 천연형 DXP 경로와 더불어 E. coli 내에서의 dxs 및 idi 의 발현) 을 추가로 포함한다. 다르게는, 전체 DXP 경로 (도 15) 는 발현을 제어하는 단일의 프로모터 또는 개별 유전자들 중 하나 이상을 제어하는 여러 강도의 프로모터 (예를 들어 GI 1.20, GI 1.5, 또는 GI 1.6) 와 염색체 상에서 오페론으로서 혼입될 수 있거나, 또는 플라스미드 상에서 발현될 수 있다. 일부 구현예에서, 숙주 세포는 IDI 폴리펩티드 및 DXS 폴리펩티드를 인코딩하는 하나 이상의 핵산을 추가로 포함하고, 일부 바람직한 구현예에서, 하나의 벡터는 이소프렌 신타아제 변이체, IDI 폴리펩티드, 및 DXS 폴리펩티드를 인코딩한다. 일부 구현예에서, 숙주 세포는 MVA 경로 폴리펩티드 (예, 사카로마이세스 세레비시아 (Saccharomyces cerevisia) 또는 엔테로코커스 패칼리스 (Enterococcus faecalis) 로부터의 MVA 경로 폴리펩티드) 를 인코딩하는 이종 핵산을 추가로 포함한다. 일부 구현예에서, 숙주 세포는 MVA 경로 폴리펩티드 및 DXS 폴리펩티드를 인코딩하는 하나 이상의 핵산을 추가로 포함하고, 일부 바람직한 구현예에서, 하나의 벡터가 이소프렌 신타아제 변이체, MVA 경로 폴리펩티드, 및 DXS 폴리펩티드를 인코딩한다. 일부 바람직한 구현예에서, 숙주 세포는 DXS 폴리펩티드, IDI 폴리펩티드, 또는 DXP 경로 폴리펩티드의 나머지 중 하나 이상, 및 MVA 경로 폴리펩티드를 인코딩하는 하나 이상의 핵산을 추가로 포함한다. 일부 구현예에서, 벡터는 선별가능 마커 (예, 항생제 내성 핵산) 을 추가로 포함한다. 또한, 하기를 포함하는 이소프렌 생성 방법이 제공된다: (a) 이소프렌의 생성에 적합한 배양 조건 하에서, 숙주 세포를 배양함; 및 (b) 상기 이소프렌을 생성함. 일부 구현예에서, 상기 방법은 추가로 (c) 상기 이소프렌을 회수함을 포함한다. 일부 바람직한 구현예에서, 상기 방법은 추가로 (d) 이소프렌을 중합화함을 포함한다. 본 발명은 또한 하기를 포함하는 이소프렌 신타아제의 생성 방법을 제공한다: (a) (i) 숙주 세포; 및 (ii) 프로모터와 작동가능하게 조합된 이소프렌 신타아제 변이체를 인코딩하는 핵산 (이때, 상기 이소프렌 신타아제 변이체는 SEQ ID NO: 2 에 제시된 아미노산 서열을 포함하는 쿠주 이소프렌 신타아제의 하나 이상의 잔기 (1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10) 에 상응하는 위치에서 치환을 포함함) 를 제공함;
(b) 상기 숙주 세포를 상기 핵산과 접촉시켜 형질전환된 숙주 세포를 생성함; 및 (c) 형질전환된 숙주 세포를 이소프렌 신타아제의 생성에 적합한 배양 조건 하에서 배양함.
또 다른 측면에서, 본 발명은 단리된 포플러 이소프렌 신타아제 변이체를 제공한다. 한 구현예에서, 상기 변이체는 이소프렌 신타아제의 N-말단부에 절단 (truncation) 을 포함한다. 또 다른 구현예에서, 이소프렌 신타아제 변이체는 전장 (Full length) 이소프렌 신타아제와 비교시 특이 활성이 증가된다. 또 다른 구현예에서, 상기 이소프렌 신타아제는 SEQ ID NO:120 의 P. alba 이소프렌 신타아제이다. 또 다른 구현예에서, 상기 변이체는 하기로 이루어진 군으로부터 선택된다: MEA 변이체 (SEQ ID NO:122), MSV 변이체 (SEQ ID NO:124), MVS 변이체 (SEQ ID NO:126), MTE 변이체 (SEQ ID NO:128), MNV 변이체 (SEQ ID NO:130). 또 다른 구현예에서, 상기 변이체는 MEA 변이체이다 (SEQ ID NO:122). 또 다른 구현예에서, 상기 변이체는 하기로 이루어진 군으로부터 선택된다: TRC (-3) 변이체 (SEQ ID NO:136), TRC (-4) 변이체 (SEQ ID NO:138), TRC (-5) 변이체 (SEQ ID NO:140), TRC (-6) 변이체 (SEQ ID NO:142) 및 TRC (-7) 변이체 (SEQ ID NO:144). 또 다른 구현예에서, 상기 변이체는 P. tremuloides 이소프렌 신타아제의 MET 변이체이다 (SEQ ID NO:146). 또 다른 구현예에서, 상기 변이체는 P. trichocharpa 이소프렌 신타아제의 MET 변이체이다 (SEQ ID NO:148).
또 다른 측면에서, 본 발명은 단리된 포플러 이소프렌 신타아제 변이체를 제공하는데, 이때 상기 변이체는 야생형 이소프렌 신타아제의 하나 이상의 아미노산 잔기에서 치환을 포함하며; 및 이때 상기 이소프렌 신타아제 변이체는 야생형 이소프렌 신타아제와 비교시 증가된 이소프렌 신타아제 활성을 갖는다. 한 구현예에서, 증가된 이소프렌 신타아제 활성은, 모체 이소프렌 신타아제를 포함하는 숙주 세포와 비교시 디메틸알릴 피로포스페이트 (DMAPP)의 존재하에서 더 신속한 속도로 성장하는 이소프렌 변이체를 포함하는 숙주 세포로 표시된다. 또 다른 구현예에서, 상기 이소프렌 신타아제는 SEQ ID NO:120 의 P. alba 이소프렌 신타아제이다. 또 다른 구현예에서, 상기 변이체는 하기로 이루어진 군으로부터 선택되는 하나 이상의 아미노산 치환을 포함한다: V10M, F12S, T15A, E18G, V58I, V58F, L70Q, L70V, L70T, T71P, V79L, E89D, G94A, S119F, F120L, G127R, E175V, T212I, S257A, R262G, A266G, F280L, N297K, F305L, L319M, E323K, A328T, D342E, A359T, K366N, E368D, L374M, S396T, V418S, K438N, H440R, T442I, T442A, I449V, A469S, K500R, K505Q, G507S, S509N, F511Y, 및 N532K. 또 다른 구현예에서, 하나 이상의 아미노산 치환은 L70R 치환이다. 또 다른 구현예에서, 상기 변이체는 하기로 이루어진 군으로부터 선택되는 하나 이상의 아미노산 치환을 포함한다: G127R/F511Y, L70Q/G94A/R262G/F305L, F12S/ T15A/E18G/N297K, S396T/T442I, V10M/E323K, F120L/A266G, K438N/K500R, V79L/S509N, E175V/S257A/E368D/A469S, T71P/L374M, F280L/H440R, E89D/H440R, V58F/A328T/N532K, S119F/D342E/I449V, 및 K366N/G507S.
또 다른 측면에서, 본 발명은 SEQ ID NO:120 의 아미노산 잔기를 포함하는 폴리펩티드의 결정질 형태를 제공한다 (도 19).
또 다른 측면에서, 본 발명은 하기를 포함하는 이소프렌의 생성 방법을 제공한다: (a) 이소프렌 신타아제 변이체를 인코딩하는 폴리뉴클레오티드 서열을 포함하는 발현 벡터를 포함하는 숙주 세포를 제공함; 및 (b) 상기 숙주 세포를 이소프렌 생성에 적합한 조건 하에서 배양함. 한 구현예에서, 상기 방법은 (c) 상기 이소프렌을 회수함을 추가로 포함한다. 또 다른 구현예에서, 상기 방법은 (d) 상기 이소프렌을 중합화함을 추가로 포함한다.
또 다른 측면에서, 본 발명은 하기를 포함하는 이소프렌 신타아제 활성의 검출 방법을 제공한다: (a) 이소프렌 신타아제 변이체를 생성하기에 적합한 조건 하에서 발현 벡터를 포함하는 숙주 세포를 배양함; (b) 상기 숙주 세포를, 리소자임을 포함하는 분해 버퍼로 분해하여, 세포 분해물을 생성함; 및 (c) 디메틸알릴 디포스페이트 (DMAPP) 로부터 이소프렌 생성을 측정하여, 상기 세포 분해물 내 이소프렌 신타아제 활성을 검출함. 한 구현예에서, 숙주 세포는 그람-양성 박테리아 세포, 그람-음성 박테리아 세포, 사상 진균 세포, 및 효모 세포로 이루어진 군으로부터 선택된다. 또 다른 구현예에서, 숙주 세포는 에스케리키아 종 (E. coli; 대장균), 판테오아 종 (P. 시트레아 ), 바실러스 종 (B. 서브틸리스 ), 야로위 아 종 (Y. 리포리티카 ), 및 트리코데르마 (T. 리세이 ) 로 이루어진 군으로부터 선택된다. 또 다른 구현예에서, 상기 숙주 세포는 글루코오스, 글리세롤, 글리세린, 디히드록시아세톤, 효모 추출물, 바이오매스, 당질, 수크로오스, 및 오일로 이루어진 군으로부터 선택되는 탄소원을 포함하는 배지에서 배양된다.
또 다른 측면에서, 본 발명은 프로모터와 작동가능하게 조합된 이소프렌 신타아제 변이체를 인코딩하는 이종 폴리뉴클레오티드 서열을 포함하는 숙주 세포를 제공하는데, 이때 상기 이소프렌 신타아제 변이체는 포플러 이소프렌 신타아제의 하나 이상의 잔기 (1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10) 에 상응하는 위치에서 치환을 포함한다. 한 구현예에서, 이소프렌 신타아제는 SEQ ID NO:120 의 P. alba 이소프렌 신타아제이다. 또 다른 구현예에서, 상기 변이체는 하기로 이루어진 군으로부터 선택된다: MEA 변이체 (SEQ ID NO:122), MSV 변이체 (SEQ ID NO:124), MVS 변이체 (SEQ ID NO:126), MTE 변이체 (SEQ ID NO:128), MNV 변이체 (SEQ ID NO:130). 또 다른 구현예에서, 상기 변이체는 하기로 이루어진 군으로부터 선택된다: TRC (-3) 변이체 (SEQ ID NO:136), TRC (-4) 변이체 (SEQ ID NO:138), TRC (-5) 변이체 (SEQ ID NO:140), TRC (-6) 변이체 (SEQ ID NO:142) 및 TRC (-7) 변이체 (SEQ ID NO:144). 또 다른 구현예에서, 상기 변이체는 P. tremuloides 이소프렌 신타아제의 MET 변이체 (SEQ ID NO:146) 이다. 또 다른 구현예에서, 상기 변이체는 P. trichocharpa 이소프렌 신타아제의 MET 변이체이다 (SEQ ID NO:148). 또 다른 구현예에서, 상기 변이체는 하기로 이루어진 군으로부터 선택되는 하나 이상의 아미노산 치환을 포함한다: V10M, F12S, T15A, E18G, V58I, V58F, L70Q, L70V, L70T, T71P, V79L, E89D, G94A, S119F, F120L, G127R, E175V, T212I, S257A, R262G, A266G, F280L, N297K, F305L, L319M, E323K, A328T, D342E, A359T, K366N, E368D, L374M, S396T, V418S, K438N, H440R, T442I, T442A, I449V, A469S, K500R, K505Q, G507S, S509N, F511Y, 및 N532K. 또 다른 구현예에서, 하나 이상의 아미노산 치환은 L70R 치환이다. 또 다른 구현예에서, 상기 변이체는 하기로 이루어진 군으로부터 선택되는 하나 이상의 아미노산 치환을 포함한다: G127R/F511Y, L70Q/G94A/R262G/F305L, F12S/ T15A/E18G/N297K, S396T/T442I, V10M/E323K, F120L/A266G, K438N/K500R, V79L/S509N, E175V/S257A/E368D/A469S, T71P/L374M, F280L/H440R, E89D/H440R, V58F/A328T/N532K, S119F/D342E/I449V, 및 K366N/G507S. 또 다른 구현예에서, 상기 폴리뉴클레오티드 서열은 플라스미드 내에 함유된다. 또 다른 구현예에서, 상기 폴리뉴클레오티드 서열은 숙주 세포의 염색체에 혼입된다.
또 다른 구현예에서, 상기 숙주 세포는 그람-양성 박테리아 세포, 그람-음성 박테리아 세포, 사상 진균 세포, 및 효모 세포로 이루어진 군으로부터 선택된다. 또 다른 구현예에서, 상기 숙주는 에스케리키아 종 (E. coli ; 대장균), 판테오아 종 (P. 시트레아 ), 바실러스 종 (B. 서브틸리스 ), 야로위아 종 (Y. 리포리티카 ), 및 트리코데르마 (T. 리세이 ) 로 이루어진 군으로부터 선택된다. 또 다른 구현예에서, 숙주 세포는 글루코오스, 글리세롤, 글리세린, 디히드록시아세톤, 효모 추출물, 바이오매스, 당질, 수크로오스, 및 오일로 이루어진 군으로부터 선택되는 탄소원을 포함하는 배지에서 배양된다. 또 다른 구현예에서, 상기 숙주 세포는 추가로 천연형 DXP 경로와 임의 조합되는, IDI 폴리펩티드를 인코딩하는 이종 또는 천연형 핵산 및/또는 DXS 폴리펩티드를 인코딩하는 이종 또는 천연형 핵산을 포함한다. 또 다른 구현예에서, 숙주 세포는 추가로 IDI 폴리펩티드 및 DXS 폴리펩티드를 인코딩하는 하나 이상의 핵산을 포함한다. 또 다른 구현예에서, 숙주 세포는 이소프렌 신타아제 변이체, IDI 폴리펩티드, 및 DXS 폴리펩티드를 인코딩하는 하나의 벡터를 포함한다. 또 다른 구현예에서, 숙주 세포는 사카로마이세스 세 레비시아 또는 엔테로코커스 패칼리스로부터의 MVA 경로 폴리펩티드로 이루어진 군으로부터 선택되는 MVA 경로 폴리펩티드를 인코딩하는 이종 핵산을 추가로 포함한다. 또 다른 구현예에서, 숙주 세포는 MVA 경로 폴리펩티드 및 DXS 폴리펩티드를 인코딩하는 하나 이상의 핵산을 추가로 포함하고, 하나의 벡터는 이소프렌 신타아제 변이체, MVA 경로 폴리펩티드, 및 DXS 폴리펩티드를 인코딩한다. 또 다른 구현예에서, 숙주 세포는 DXS 폴리펩티드, IDI 폴리펩티드, 또는 DXP 경로 폴리펩티드의 나머지 중 하나 이상, 및 MVA 경로 폴리펩티드를 인코딩하는 하나 이상의 핵산을 추가로 포함한다.
또 다른 측면에서, 본 발명은 하기를 포함하는 이소프렌의 생성 방법을 제공한다: (a) 프로모터와 작동가능하게 조합된 이소프렌 신타아제 변이체를 인코딩하는 이종 폴리뉴클레오티드 서열을 포함하는 숙주 세포를 배양하는 것으로서, 이때 상기 이소프렌 신타아제 변이체는 이소프렌 생성에 적합한 배양 조건 하에서 포플러 이소프렌 신타아제의 하나 이상의 잔기 (1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10) 에 상응하는 위치에서 치환을 포함함; 및 (b) 상기 이소프렌을 생성함. 한 구현예에서, 상기 방법은 추가로 (c) 이소프렌을 회수함을 포함한다. 또 다른 구현예에서, 상기 방법은 추가로 (d) 이소프렌을 중합화함을 포함한다.
또 다른 측면에서, 본 발명은 하기를 포함하는 이소프렌 신타아제의 생성 방법을 제공한다: (a) (i) 숙주 세포; 및 (ii) 프로모터와 작동가능하게 조합된 이소프렌 신타아제 변이체를 인코딩하는 핵산 (이때, 이소프렌 신타아제 변이체는 SEQ ID NO:120 의 P. alba 이소프렌 신타아제의 하나 이상의 잔기 (1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10) 에 상응하는 위치에서 치환을 포함함) 을 제공함; (b) 상기 숙주 세포를 상기 핵산과 접촉하여 형질전환된 숙주 세포를 생성함; 및 (c) 이소프렌 신타아제의 생성에 적합한 배양 조건 하에서 상기 형질전환된 숙주 세포를 배양함.
도 1 은 에스케리키아 콜리 (대장균) 에서 발현을 위해 코돈-최적화된, 쿠주 (Pueraria montana) 이소프렌 신타아제의 코딩 서열 (SEQ ID NO:1)을 제공한다.
도 2 는 쿠주 이소프렌 신타아제의 아미노산 서열 (SEQ ID NO:2) 을 제공한다.
도 3 은 에스케리키아 콜리에서 발현을 위해 코돈-최적화된 포플러 (Populus alba x tremula) 이소프렌 신타아제의 코딩 서열 (SEQ ID NO:6) 을 제공한다.
도 4 는 포플러 (Populus alba x tremula) 이소프렌 신타아제의 아미노산 서열 (SEQ ID NO:7) 을 제공한다.
도 5 는 공간을 채운 분자로서 하이라이트한 시스테인 잔기를 갖는 쿠주 이소프렌 신타아제 상동성 모델을 제공한다.
도 6 은 공간을 채운 분자로서 하이라이트한 시스테인 잔기(암회색)를 갖는 포플러 이소프렌 신타아제 상동성 모델 을제공한다. 덧붙여, 상기 도 5 의 쿠주 모델에서의 시스테인 잔기가, 포플러 모델 상에서 공간을 채우는 분자로서 겹쳐진다 (담회색).
도 7 은 실시예 5 의 쿠주 IspS 시스테인 돌연변이체의 성장 곡선을 보이는 그래프를 제공한다.
도 8 은 분해 세포로부터의 쿠주 IspS 시스테인 돌연변이체의 SDS-PAGE 분석을 나타낸다. 펠릿 (Pellet) 및 상청액 분획물을 원심분리로 제조하였다.
도 9 는 플라스미드 MCM93 (pCR2.1-Kudzu) 의 맵을 제공한다.
도 10 은 플라스미드 MCM93 의 뉴클레오티드 서열 (SEQ ID NO:22) 을 제공한다.
도 11 은 pET24D-Kudzu 의 맵을 제공한다.
도 12 는 pET24D-Kudzu 의 뉴클레오티드 서열 (SEQ ID NO:23) 을 제공한다.
도 13 은 쿠주 이소프렌 신타아제-함유 봉입체의 SDS-PAGE 분석을 나타낸다. M 레인은 분자량 마커를 포함하며, 다른 레인들은 증가한 함량의 정제된 봉입체 제제를 포함한다. 쿠주 이소프렌 신타아제는 순도가 >90% 로 추산되었다.
도 14 는 위치 Y22, A20 및 S408 에 있어서 쿠주 부위 평가 라이브러리 (SEL) 멤버의 이소프렌 신타아제 활성을 나타내는 그래프이다. 대부분의 멤버는 매우 감소된 활성을 보이나, 보존성 치환은 활성에서 덜한 감소를 보인다. 패널 A 는 독립된 야생형 샘플 (동그라미한 WT) 과 비교한 Y22 라이브러리 멤버에 대한 검정 결과를 나타낸다. 패널 B 는 야생형 샘플 (동그라미한 WT) 와 비교한 A20 라이브러리 멤버에 대한 검정 결과를 나타낸다. 패널 C 는 S408 라이브러리 멤버에 대한 검정 결과를 나타내는데, 이는 멤버 S408D 가 야생형 대조군의 평균보다 1.5 내지 2-배 더 높은 활성을 갖는다는 점을 시사한다.
도 15 는 이소프렌에 대한 MVA 및 DXP 대사 경로를 나타낸다 (문헌 [F. Bouvier 등., Progress in Lipid Res. 44: 357-429, 2005] 를 기초로 함). 하기의 설명은 상기 경로에서 각각의 폴리펩티드에 대한 대안적인 명칭과 지시된 폴리펩티드의 활성 측정을 위한 검정을 개시하는 문헌 (이들 문헌 각각은 그 전문을, 특히 MVA 및 DXP 경로에서의 폴리펩티드에 있어서 폴리펩티드 활성 검정과 관련해서 본원에서 참조 인용되고 있음) 을 포함한다. 메발로네이트 경로: AACT; 아세틸-CoA 아세틸트랜스퍼라아제, MvaE, EC 2.3.1.9. Assay: J. Bacteriol., 184: 2116-2122, 2002; HMGS; 히드록시메틸글루타릴-CoA 신타아제, MvaS, EC 2.3.3.10. Assay: J. Bacteriol., 184: 4065-4070, 2002; HMGR; 3-히드록시-3-메틸글루타릴-CoA 리덕타아제, MvaE, EC 1.1.1.34. Assay: J. Bacteriol., 184: 2116-2122, 2002; MVK; 메발로네이트 키나아제, ERG12, EC 2.7.1.36. Assay: Curr Genet 19:9-14, 1991. PMK; 포스포메발로네이트 키나아제, ERG8, EC 2.7.4.2, Assay: Mol Cell Biol., 11:620-631, 1991; DPMDC; 디포스포메발로네이트 데카르복실라아제, MVD1, EC 4.1.1.33. Assay: Biochemistry, 33:13355-13362, 1994; IDI; 이소펜테닐-디포스페이트 델타-이소머라아제, IDI1, EC 5.3.3.2. Assay: J. Biol. Chem. 264:19169-19175, 1989. DXP 경로: DXS; 1-데옥시자일룰로오즈-5-포스페이트 신타아제, dxs, EC 2.2.1.7. Assay: PNAS, 94:12857-62, 1997; DXR; 1-데옥시-D-자일룰로오즈 5-포스페이트 리덕토이소머라아제, dxr, EC 2.2.1.7. Assay: Eur. J. Biochem. 269:4446-4457, 2002; MCT; 4-디포스포시티딜-2C-메틸-D-에리트리톨 신타아제, IspD, EC 2.7.7.60. Assay: PNAS, 97: 6451-6456, 2000; CMK; 4-디포스포시티딜-2-C-메틸-D-에리트리톨 키나아제, IspE, EC 2.7.1.148. Assay: PNAS, 97:1062-1067, 2000; MCS; 2C-메틸-D-에리트리톨 2,4-시클로디포스페이트 신타아제, IspF, EC 4.6.1.12. Assay: PNAS, 96:11758-11763, 1999; HDS; 1-히드록시-2-메틸-2-(E)-부테닐 4-디포스페이트 신타아제, ispG, EC 1.17.4.3. Assay: J. Org. Chem., 70:9168 -9174, 2005; HDR; 1-히드록시-2-메틸-2-(E)-부테닐 4-디포스페이트 리덕타아제, IspH, EC 1.17.1.2. Assay: JACS, 126:12847-12855, 2004.
도 16 은 pDu27 의 맵을 제공한다.
도 17 은 pDu27 에서 6Xhis N-말단 태깅된 (tagged) P. alba IspS 의 아미노산 서열 (SEQ ID NO:118) 을 제공한다.
도 18 은 플라스미드 pDu27 의 뉴클레오티드 서열 (SEQ ID NO:119) 을 제공한다.
도 19 는 pET24a 에서 전장 P. alba IspS 의 아미노산 서열 (SEQ ID NO:120) 을 제공한다. 밑줄진 잔기는 플라스미드 pDu39 내지 pDu43 내 IspS 에서 N-말단 절단의 위치를 나타낸다.
도 20 은 플라스미드 P. alba pET24a 의 뉴클레오티드 서열 (SEQ ID NO:121) 을 제공한다.
도 21 은 정제된 IspS 가 SDS-PAGE 분석에서 저분자량 "더블릿 (doublet)" 을 나타냄을 보인다.
도 22 는 질량 분석으로 동정된 트립신분해 펩티드를 나타낸다.
도 23 은 P. alba IspS 의 N-말단 절단물을 갖는 pDu40, pDu41, pDu42 및 pDu43 의 맵을 제공한다.
도 24 은 (균주 MD09-173 에서) pET24a-P. alba MEA 비태깅된 (untagged; 태깅되지 않은) Pdu39 의 맵을 제공한다.
도 25 는 pDu39 에서 P. alba IspS 의 절단된 "MEA" 변이체의 아미노산 서열 (SEQ ID NO:122) 을 제공한다.
도 26 은 플라스미드 pDu39 의 뉴클레오티드 서열 (SEQ ID NO:123) 을 제공한다.
도 27 은 pDu41 에서 절단된 "MSV" 변이체 P. alba IspS 의 아미노산 서열 (SEQ ID NO:124) 을 제공한다.
도 28 은 플라스미드 pDu41 (pET24a-P.alba(MSV) 비태깅됨) 의 뉴클레오티드 서열 (SEQ ID NO:125) 을 제공한다.
도 29 는 pDu43 에서 절단된 "MVS" 변이체 P. alba IspS 의 아미노산 서열 (SEQ ID NO:126) 을 제공한다.
도 30 은 플라스미드 pDu43 (pET24a-P.alba(MVS) 비태깅됨) 의 뉴클레오티드 서열 (SEQ ID NO:127) 을 제공한다.
도 31 은 pDu42 에서 P. alba IspS 의 절단된 "MTE" 변이체의 아미노산 서열 (SEQ ID NO:128) 을 제공한다.
도 32 는 플라스미드 pDu42 (pET24a-P.alba(MTE) 비태깅됨) 의 뉴클레오티드 서열 (SEQ ID NO:129) 을 제공한다.
도 33 은 pDu40 에서 절단된 "MNV" P. alba IspS 의 아미노산 서열 (SEQ ID NO:130) 을 제공한다.
도 34 는 플라스미드 pDu40 (pET24a-P.alba(MNV) 비태깅됨) 의 뉴클레오티드 서열 (SEQ ID NO:131) 를 제공한다.
도 35 는 MD09-161 및 MD09-163, C-말단 TEV, 6XHis-태깅된 IspS 변이체의 맵을 제공한다.
도 36 은 MD09-163 에서, P. alba MEA(+)TEV 의 아미노산 서열 (SEQ ID NO:132) 을 제공한다.
도 37 은 플라스미드 MD09-163 (pET24a-P.alba MEA(+)TEV 의 뉴클레오티드 서열 (SEQ ID NO:133) 를 제공한다. CDS 는 밑줄긋고, TEV 프로테아제 부위는 볼드체로 표시한다.
도 38 은 MD09-161 에서 P. alba FL(+)TEV 의 아미노산 서열 (SEQ ID NO:134) 을 제공한다.
도 39 는 플라스미드 MD09-161 (pET24a-P.alba FL(+)TEV 의 뉴클레오티드 서열 (SEQ ID NO:135) 를 제공한다. CDS 는 밑줄긋고, TEV 프로테아제 부위는 볼드체로 표시한다.
도 40 은 MD09-167, 전장 (FL; full-length), MD09-165, 및 절단된 이소프렌 신타아제 (MD09-173) 의 특이 활성을 나타내는 그래프를 보인다. 반응을 100 mM Tris, 100 mM NaCl, 50 mM MgCl2, 5 mM DMAPP, 및 전 세포 분해물의 상청액 내 2.5-4.5 ㎍ 이소프렌 신타아제를 함유하는 용액 중 15 분 동안 30 ℃ 에서 수행하였다.
도 41 은 속도/[E] 대 [DMAPP] 를 보여주는 그래프를 나타낸다. X 는 MD09-173 를 나타내고, 동그라미는 MD09-167 를 나타내고, 다이아몬드는 MD09-165 를 나타내며, 사각형은 전장 IspS 을 나타낸다.
도 42 는 [DMAPP] 에 대한 이소프렌 신타아제 활성을 보여주는 그래프를 나타낸다. X 는 MD09-173 절단된 이소프렌 신타아제로 산출된 데이타를 나타낸다. 동그라미는 MD09-167 이소프렌 신타아제로 산출된 데이타를 나타낸다. 다이아몬드는 MD09-165 이소프렌 신타아제로 산출된 데이타를 나타낸다. 사각형은 전장 이소프렌 신타아제로 산출된 데이타를 나타낸다. 각각의 데이타 세트는 독립적으로 성장하는 배양물로부터 3세트로 실시했다.
도 43 는 반응 속도에 대한 다양한 kcat 및 KM 및 Ki 의 효과를 나타내는 그래프를 나타낸다. 패널 A 에서, 라인 1 은 각종 DMAPP 농도에서 제도 (plotting) 된 전장 이소프렌 신타아제의 속도 방정식으로 나눈 절단된 이소프렌 신타아제 활성의 속도 방정식을 나타낸다. 라인 2 는 전장 이소프렌 신타아제의 속도 방정식을 나타내며, 이때 kcat 는 전장 이소프렌 신타아제의 속도 방정식으로 나눈 절단된 이소프렌 신타아제의 kcat 로 대체되어 있다. 라인 3 은 전장 이소프렌 신타아제의 속도 방정식을 나타내며, 이때 KM 는 전장 이소프렌 신타아제의 속도 방정식으로 나눈 절단된 이소프렌 신타아제의 KM 로 대체되어 있다. 라인 4 는 전장 이소프렌 신타아제의 속도 방정식을 나타내며, 이때 Ki 는 전장 이소프렌 신타아제의 속도 방정식으로 나눈 절단된 이소프렌 신타아제의 Ki 로 대체되어 있다. 패널 B 는 [DMAPP] 에 대해서, 절단된 이소프렌 신타아제 대 전장 이소프렌 신타아제의 속도 방정식 비율에 적합시킨 데이타를 나타내는 그래프를 나타낸다.
도 44 는 메발론산 (MVA) 에 의한 MCM531 의 성장 억제를 증명하는 그래프를 나타낸다. 세포는 상이한 농도의 MVA 를 갖는 마이크로타이터 플레이트 내 TM3 배지에서 성장시켰다. 4세트 웰의 OD600 를 지시된 시간에서 측정했다.
도 45 는 L70 SSL 플레이트의 DMAPP 검정을 나타내는 그래프를 보인다. 짙은 바 (bar) 는 전장 (P. alba pET24a) 또는 pDU39 (절단된) 대조군을 나타낸다. 추가 분석을 위해 웰 C3 (27), D3 (39), 또는 E3 (51) 에서의 변이체를 선택했다.
도 46 는 단백질 측정을 이용한 DMAPP 검정에 있어서 선택된 모든 변이체의 평균 특이 활성을 나타내는 그래프를 보인다. 오차 바 (error bar)는 하나의 표준 편차를 보인다. 모든 3 개의 L70R 변이체는 대조군 (WT) 보다 더 높은 활성을 보인다.
도 47 는 "MEA" 절단된 P. alba IspS 효소와 비교되는 모든 3 개의 L70R 변이체의 평균 특이 활성을 나타내는 그래프를 나타낸다. 오차 바는 하나의 표준 편차를 나타낸다.
도 48 는 플라스미드 pDu47-3, pDu47-4, 및 pDu47-5 의 맵을 제공한다.
도 49 는 플라스미드 pDu47-6, pDu47-7, 및 pDu48 의 맵을 제공한다.
도 50 은 플라스미드 pDu49, pDu50 및 pDu50-4 의 맵을 제공한다.
도 51 은 pDu47-3 내 P. alba TRC (-3) 의 아미노산 서열 (SEQ ID NO:136) 을 제공한다
도 52 는 플라스미드 pDu47-3 의 뉴클레오티드 서열 (SEQ ID NO:137) 을 제공한다.
도 53 은 pDu47-4 내 P. alba TRC (-4) 의 아미노산 서열 (SEQ ID NO:138) 을 제공한다.
도 54 는 플라스미드 pDu47-4 의 뉴클레오티드 서열 (SEQ ID NO:139) 을 제공한다.
도 55 는 pDu47-5 내 P. alba TRC (-5) 의 아미노산 서열 (SEQ ID NO:140) 을 제공한다.
도 56 은 플라스미드 pDu47-5 의 뉴클레오티드 서열 (SEQ ID NO:141) 을 제공한다.
도 57 는 pDu47-6 내 P. alba TRC (-6) 의 아미노산 서열 (SEQ ID NO:142) 을 제공한다.
도 58 은 플라스미드 pDu47-6 의 뉴클레오티드 서열 (SEQ ID NO:143) 을 제공한다.
도 59 는 pDu47-7 내 P. alba TRC (-7) 의 아미노산 서열 (SEQ ID NO:144) 을 제공한다.
도 60 은 플라스미드 pDu47-7 의 뉴클레오티드 서열 (SEQ ID NO:145) 을 제공한다.
도 61 은 pDu48 내 P. tremuloides TRC (MET) 의 아미노산 서열 (SEQ ID NO:146) 을 제공한다.
도 62 는 플라스미드 pDu48 의 뉴클레오티드 서열 (SEQ ID NO:147) 을 제공한다.
도 63 은 pDu49 내 P. trichocarpa (TRC) 의 아미노산 서열 (SEQ ID NO:148) 을 제공한다.
도 64 는 플라스미드 pDu49 의 뉴클레오티드 서열 (SEQ ID NO:149) 을 제공한다.
도 65 는 pDu50 내 Kudzu TRC (MEA) 의 아미노산 서열 (SEQ ID NO:150) 을 제공한다.
도 66 는 플라스미드 pDu50 의 뉴클레오티드 서열 (SEQ ID NO:151) 을 제공한다.
도 67 는 pDu50-4 내 KudzuTRC (-4) 의 아미노산 서열 (SEQ ID NO:152) 을 제공한다.
도 68 은 플라스미드 pDu50-4 의 뉴클레오티드 서열 (SEQ ID NO:153) 을 제공한다.
도 69 는 IspS 의 절단된 변이체의 ,DMAPP 검정으로부터의 원래 및 OD-정규화 데이타를 나타내는 그래프를 보인다.
도 70 은 IspS 절단물의 특이 활성을 나타내는 그래프를 보인다. P. alba, P. tremuloides 및 P. trichocharpa 절단물을 P. alba "전장" 변이체와 비교하여 특이 활성에 대해서 대조했다.
도 71 은 플라스미드 p9795 의 맵을 제공한다.
도 72 은 플라스미드 p9795 의 뉴클레오티드 서열 (SEQ ID NO:154) 을 제공한다.
도 73 은 플라스미드 pTrcKudzu 의 맵을 제공한다.
도 74 는 플라스미드 pTrcKudzu 의 뉴클레오티드 서열 (SEQ ID NO:155) 을 제공한다.
도 75 는 플라스미드 pMAL-C4X 의 맵을 제공한다.
도 76 은 플라스미드 pMAL-C4X 의 뉴클레오티드 서열 (SEQ ID NO:156) 을 제공한다.
도 77 는 플라스미드 pMAL-C4X-Kudzu 의 맵을 제공한다.
도 78 은 플라스미드 pMAL-C4X-Kudzu 의 뉴클레오티드 서열 (SEQ ID NO:157) 을 제공한다.
도 79 는 플라스미드 pET24 P. tremuloides pET24a 및 P. trichocharpa pET24a 의 맵을 제공한다.
도 80 은 P. trichocharpa pET24a 내 P. tremuloides IspS 의 아미노산 서열 (SEQ ID NO:158) 을 제공한다.
도 81 은 플라스미드 P. tremuloides pET24a 의 뉴클레오티드 서열 (SEQ ID NO:159) 을 제공한다.
도 82 는 P. trichocharpa pET24a 내 P. trichocharpa IspS 의 아미노산 서열 (SEQ ID NO:160) 을 제공한다.
도 83 은 플라스미드 P. trichocharpa pET24a 의 뉴클레오티드 서열 (SEQ ID NO:161) 을 제공한다.
도 84 는 플라스미드 pDu30, pDu31, 및 pDu32 의 맵을 제공한다.
도 85 는 pDu30 에서 IspS 변이체 P.albaTRC-pET200 의 아미노산 서열 (SEQ ID NO:162) 을 제공한다.
도 86 은 pDu30 의 뉴클레오티드 서열 (SEQ ID NO:163) 을 제공한다.
도 87 은 pDu31 에서 IspS 변이체 P.tremTRC-pET200 의 아미노산 서열 (SEQ ID NO:164) 을 제공한다.
도 88 은 pDu31 의 뉴클레오티드 서열 (SEQ ID NO:165) 을 제공한다.
도 89 는 pDu32 내 IspS 변이체 P.trichTRC-pET200 의 아미노산 서열 (SEQ ID NO:166) 을 제공한다.
도 90 는 pDu32 의 뉴클레오티드 서열 (SEQ ID NO:167) 을 제공한다.
도 91 은 이량체로서 나타낸 P. tremuloides IspS 의 3차원 구조를 제공한다. 사슬 A 는 암회색으로 표시하고, 사슬 B 는 중간의 회색으로 표시하고, 각 활성 부위의 단일 마그네슘 이온은 담회색으로 표시한다.
도 92 은 P. tremuloides IspS 의 구조의 단량체 단면을 제공한다. 마그네슘을 담회색 구 (sphere) 로 나타내고, N- 및 C-말단을 표시했다.
도 93 은 (A) BdpS 및 LS, (B) BdpS 및 포플러 IspS, (C) LS 및 포플러 IspS, 및 (D) TEAS 및 포플러 IspS 사이의 구조 정렬을 나타낸다. 각 경우에, 제 1 의 구조는 담회색으로, 제 2 의 구조는 암회색으로 표시한다. 2가 양이온을 구로서 나타낸다.
도 94 는 BdpS 및 LS 내 루프의 3차 구조를 나타낸다. 패널 A 는 담회색으로 Ls 의 N-말단 루프를 나타내고, 암회색으로 BdpS 의 N-말단 루프를 나타낸다. 패널 B 는 루프 I 및 루프 II 가 구조적으로 상동인 것을 보여준다.
도 95 는 BdpS 의 N-말단 루프 (암회색) 및 포플러 IspS (담 회색) 이 구조적으로 방사형임을 보여준다. 패널 A 는 N-말단 루프를 보여주고, 패널 B 는 루프 I 및 루프 II 를 나타낸다.
도 96 은 LS (담회색) 의 N-말단 루프 및 포플러 IspS (암회색) 가 구조적으로 방사형임을 보여준다. 패널 A 는 N-말단 루프를 나타내고, 패널 B 는 루프 I 및 루프 II 를 나타낸다.
도 97 은 TEAS (담회색)의 N-말단 루프 및 포플러 IspS (암회색) 이 구조적으로 방사형임을 보여준다. 패널 A 는 N-말단 루프를 나타내고, 패널 B 는 루프 I 및 루프 II 를 나타낸다. 루프 I 는 TEAS 에서 혼란스럽다.
도 2 는 쿠주 이소프렌 신타아제의 아미노산 서열 (SEQ ID NO:2) 을 제공한다.
도 3 은 에스케리키아 콜리에서 발현을 위해 코돈-최적화된 포플러 (Populus alba x tremula) 이소프렌 신타아제의 코딩 서열 (SEQ ID NO:6) 을 제공한다.
도 4 는 포플러 (Populus alba x tremula) 이소프렌 신타아제의 아미노산 서열 (SEQ ID NO:7) 을 제공한다.
도 5 는 공간을 채운 분자로서 하이라이트한 시스테인 잔기를 갖는 쿠주 이소프렌 신타아제 상동성 모델을 제공한다.
도 6 은 공간을 채운 분자로서 하이라이트한 시스테인 잔기(암회색)를 갖는 포플러 이소프렌 신타아제 상동성 모델 을제공한다. 덧붙여, 상기 도 5 의 쿠주 모델에서의 시스테인 잔기가, 포플러 모델 상에서 공간을 채우는 분자로서 겹쳐진다 (담회색).
도 7 은 실시예 5 의 쿠주 IspS 시스테인 돌연변이체의 성장 곡선을 보이는 그래프를 제공한다.
도 8 은 분해 세포로부터의 쿠주 IspS 시스테인 돌연변이체의 SDS-PAGE 분석을 나타낸다. 펠릿 (Pellet) 및 상청액 분획물을 원심분리로 제조하였다.
도 9 는 플라스미드 MCM93 (pCR2.1-Kudzu) 의 맵을 제공한다.
도 10 은 플라스미드 MCM93 의 뉴클레오티드 서열 (SEQ ID NO:22) 을 제공한다.
도 11 은 pET24D-Kudzu 의 맵을 제공한다.
도 12 는 pET24D-Kudzu 의 뉴클레오티드 서열 (SEQ ID NO:23) 을 제공한다.
도 13 은 쿠주 이소프렌 신타아제-함유 봉입체의 SDS-PAGE 분석을 나타낸다. M 레인은 분자량 마커를 포함하며, 다른 레인들은 증가한 함량의 정제된 봉입체 제제를 포함한다. 쿠주 이소프렌 신타아제는 순도가 >90% 로 추산되었다.
도 14 는 위치 Y22, A20 및 S408 에 있어서 쿠주 부위 평가 라이브러리 (SEL) 멤버의 이소프렌 신타아제 활성을 나타내는 그래프이다. 대부분의 멤버는 매우 감소된 활성을 보이나, 보존성 치환은 활성에서 덜한 감소를 보인다. 패널 A 는 독립된 야생형 샘플 (동그라미한 WT) 과 비교한 Y22 라이브러리 멤버에 대한 검정 결과를 나타낸다. 패널 B 는 야생형 샘플 (동그라미한 WT) 와 비교한 A20 라이브러리 멤버에 대한 검정 결과를 나타낸다. 패널 C 는 S408 라이브러리 멤버에 대한 검정 결과를 나타내는데, 이는 멤버 S408D 가 야생형 대조군의 평균보다 1.5 내지 2-배 더 높은 활성을 갖는다는 점을 시사한다.
도 15 는 이소프렌에 대한 MVA 및 DXP 대사 경로를 나타낸다 (문헌 [F. Bouvier 등., Progress in Lipid Res. 44: 357-429, 2005] 를 기초로 함). 하기의 설명은 상기 경로에서 각각의 폴리펩티드에 대한 대안적인 명칭과 지시된 폴리펩티드의 활성 측정을 위한 검정을 개시하는 문헌 (이들 문헌 각각은 그 전문을, 특히 MVA 및 DXP 경로에서의 폴리펩티드에 있어서 폴리펩티드 활성 검정과 관련해서 본원에서 참조 인용되고 있음) 을 포함한다. 메발로네이트 경로: AACT; 아세틸-CoA 아세틸트랜스퍼라아제, MvaE, EC 2.3.1.9. Assay: J. Bacteriol., 184: 2116-2122, 2002; HMGS; 히드록시메틸글루타릴-CoA 신타아제, MvaS, EC 2.3.3.10. Assay: J. Bacteriol., 184: 4065-4070, 2002; HMGR; 3-히드록시-3-메틸글루타릴-CoA 리덕타아제, MvaE, EC 1.1.1.34. Assay: J. Bacteriol., 184: 2116-2122, 2002; MVK; 메발로네이트 키나아제, ERG12, EC 2.7.1.36. Assay: Curr Genet 19:9-14, 1991. PMK; 포스포메발로네이트 키나아제, ERG8, EC 2.7.4.2, Assay: Mol Cell Biol., 11:620-631, 1991; DPMDC; 디포스포메발로네이트 데카르복실라아제, MVD1, EC 4.1.1.33. Assay: Biochemistry, 33:13355-13362, 1994; IDI; 이소펜테닐-디포스페이트 델타-이소머라아제, IDI1, EC 5.3.3.2. Assay: J. Biol. Chem. 264:19169-19175, 1989. DXP 경로: DXS; 1-데옥시자일룰로오즈-5-포스페이트 신타아제, dxs, EC 2.2.1.7. Assay: PNAS, 94:12857-62, 1997; DXR; 1-데옥시-D-자일룰로오즈 5-포스페이트 리덕토이소머라아제, dxr, EC 2.2.1.7. Assay: Eur. J. Biochem. 269:4446-4457, 2002; MCT; 4-디포스포시티딜-2C-메틸-D-에리트리톨 신타아제, IspD, EC 2.7.7.60. Assay: PNAS, 97: 6451-6456, 2000; CMK; 4-디포스포시티딜-2-C-메틸-D-에리트리톨 키나아제, IspE, EC 2.7.1.148. Assay: PNAS, 97:1062-1067, 2000; MCS; 2C-메틸-D-에리트리톨 2,4-시클로디포스페이트 신타아제, IspF, EC 4.6.1.12. Assay: PNAS, 96:11758-11763, 1999; HDS; 1-히드록시-2-메틸-2-(E)-부테닐 4-디포스페이트 신타아제, ispG, EC 1.17.4.3. Assay: J. Org. Chem., 70:9168 -9174, 2005; HDR; 1-히드록시-2-메틸-2-(E)-부테닐 4-디포스페이트 리덕타아제, IspH, EC 1.17.1.2. Assay: JACS, 126:12847-12855, 2004.
도 16 은 pDu27 의 맵을 제공한다.
도 17 은 pDu27 에서 6Xhis N-말단 태깅된 (tagged) P. alba IspS 의 아미노산 서열 (SEQ ID NO:118) 을 제공한다.
도 18 은 플라스미드 pDu27 의 뉴클레오티드 서열 (SEQ ID NO:119) 을 제공한다.
도 19 는 pET24a 에서 전장 P. alba IspS 의 아미노산 서열 (SEQ ID NO:120) 을 제공한다. 밑줄진 잔기는 플라스미드 pDu39 내지 pDu43 내 IspS 에서 N-말단 절단의 위치를 나타낸다.
도 20 은 플라스미드 P. alba pET24a 의 뉴클레오티드 서열 (SEQ ID NO:121) 을 제공한다.
도 21 은 정제된 IspS 가 SDS-PAGE 분석에서 저분자량 "더블릿 (doublet)" 을 나타냄을 보인다.
도 22 는 질량 분석으로 동정된 트립신분해 펩티드를 나타낸다.
도 23 은 P. alba IspS 의 N-말단 절단물을 갖는 pDu40, pDu41, pDu42 및 pDu43 의 맵을 제공한다.
도 24 은 (균주 MD09-173 에서) pET24a-P. alba MEA 비태깅된 (untagged; 태깅되지 않은) Pdu39 의 맵을 제공한다.
도 25 는 pDu39 에서 P. alba IspS 의 절단된 "MEA" 변이체의 아미노산 서열 (SEQ ID NO:122) 을 제공한다.
도 26 은 플라스미드 pDu39 의 뉴클레오티드 서열 (SEQ ID NO:123) 을 제공한다.
도 27 은 pDu41 에서 절단된 "MSV" 변이체 P. alba IspS 의 아미노산 서열 (SEQ ID NO:124) 을 제공한다.
도 28 은 플라스미드 pDu41 (pET24a-P.alba(MSV) 비태깅됨) 의 뉴클레오티드 서열 (SEQ ID NO:125) 을 제공한다.
도 29 는 pDu43 에서 절단된 "MVS" 변이체 P. alba IspS 의 아미노산 서열 (SEQ ID NO:126) 을 제공한다.
도 30 은 플라스미드 pDu43 (pET24a-P.alba(MVS) 비태깅됨) 의 뉴클레오티드 서열 (SEQ ID NO:127) 을 제공한다.
도 31 은 pDu42 에서 P. alba IspS 의 절단된 "MTE" 변이체의 아미노산 서열 (SEQ ID NO:128) 을 제공한다.
도 32 는 플라스미드 pDu42 (pET24a-P.alba(MTE) 비태깅됨) 의 뉴클레오티드 서열 (SEQ ID NO:129) 을 제공한다.
도 33 은 pDu40 에서 절단된 "MNV" P. alba IspS 의 아미노산 서열 (SEQ ID NO:130) 을 제공한다.
도 34 는 플라스미드 pDu40 (pET24a-P.alba(MNV) 비태깅됨) 의 뉴클레오티드 서열 (SEQ ID NO:131) 를 제공한다.
도 35 는 MD09-161 및 MD09-163, C-말단 TEV, 6XHis-태깅된 IspS 변이체의 맵을 제공한다.
도 36 은 MD09-163 에서, P. alba MEA(+)TEV 의 아미노산 서열 (SEQ ID NO:132) 을 제공한다.
도 37 은 플라스미드 MD09-163 (pET24a-P.alba MEA(+)TEV 의 뉴클레오티드 서열 (SEQ ID NO:133) 를 제공한다. CDS 는 밑줄긋고, TEV 프로테아제 부위는 볼드체로 표시한다.
도 38 은 MD09-161 에서 P. alba FL(+)TEV 의 아미노산 서열 (SEQ ID NO:134) 을 제공한다.
도 39 는 플라스미드 MD09-161 (pET24a-P.alba FL(+)TEV 의 뉴클레오티드 서열 (SEQ ID NO:135) 를 제공한다. CDS 는 밑줄긋고, TEV 프로테아제 부위는 볼드체로 표시한다.
도 40 은 MD09-167, 전장 (FL; full-length), MD09-165, 및 절단된 이소프렌 신타아제 (MD09-173) 의 특이 활성을 나타내는 그래프를 보인다. 반응을 100 mM Tris, 100 mM NaCl, 50 mM MgCl2, 5 mM DMAPP, 및 전 세포 분해물의 상청액 내 2.5-4.5 ㎍ 이소프렌 신타아제를 함유하는 용액 중 15 분 동안 30 ℃ 에서 수행하였다.
도 41 은 속도/[E] 대 [DMAPP] 를 보여주는 그래프를 나타낸다. X 는 MD09-173 를 나타내고, 동그라미는 MD09-167 를 나타내고, 다이아몬드는 MD09-165 를 나타내며, 사각형은 전장 IspS 을 나타낸다.
도 42 는 [DMAPP] 에 대한 이소프렌 신타아제 활성을 보여주는 그래프를 나타낸다. X 는 MD09-173 절단된 이소프렌 신타아제로 산출된 데이타를 나타낸다. 동그라미는 MD09-167 이소프렌 신타아제로 산출된 데이타를 나타낸다. 다이아몬드는 MD09-165 이소프렌 신타아제로 산출된 데이타를 나타낸다. 사각형은 전장 이소프렌 신타아제로 산출된 데이타를 나타낸다. 각각의 데이타 세트는 독립적으로 성장하는 배양물로부터 3세트로 실시했다.
도 43 는 반응 속도에 대한 다양한 kcat 및 KM 및 Ki 의 효과를 나타내는 그래프를 나타낸다. 패널 A 에서, 라인 1 은 각종 DMAPP 농도에서 제도 (plotting) 된 전장 이소프렌 신타아제의 속도 방정식으로 나눈 절단된 이소프렌 신타아제 활성의 속도 방정식을 나타낸다. 라인 2 는 전장 이소프렌 신타아제의 속도 방정식을 나타내며, 이때 kcat 는 전장 이소프렌 신타아제의 속도 방정식으로 나눈 절단된 이소프렌 신타아제의 kcat 로 대체되어 있다. 라인 3 은 전장 이소프렌 신타아제의 속도 방정식을 나타내며, 이때 KM 는 전장 이소프렌 신타아제의 속도 방정식으로 나눈 절단된 이소프렌 신타아제의 KM 로 대체되어 있다. 라인 4 는 전장 이소프렌 신타아제의 속도 방정식을 나타내며, 이때 Ki 는 전장 이소프렌 신타아제의 속도 방정식으로 나눈 절단된 이소프렌 신타아제의 Ki 로 대체되어 있다. 패널 B 는 [DMAPP] 에 대해서, 절단된 이소프렌 신타아제 대 전장 이소프렌 신타아제의 속도 방정식 비율에 적합시킨 데이타를 나타내는 그래프를 나타낸다.
도 44 는 메발론산 (MVA) 에 의한 MCM531 의 성장 억제를 증명하는 그래프를 나타낸다. 세포는 상이한 농도의 MVA 를 갖는 마이크로타이터 플레이트 내 TM3 배지에서 성장시켰다. 4세트 웰의 OD600 를 지시된 시간에서 측정했다.
도 45 는 L70 SSL 플레이트의 DMAPP 검정을 나타내는 그래프를 보인다. 짙은 바 (bar) 는 전장 (P. alba pET24a) 또는 pDU39 (절단된) 대조군을 나타낸다. 추가 분석을 위해 웰 C3 (27), D3 (39), 또는 E3 (51) 에서의 변이체를 선택했다.
도 46 는 단백질 측정을 이용한 DMAPP 검정에 있어서 선택된 모든 변이체의 평균 특이 활성을 나타내는 그래프를 보인다. 오차 바 (error bar)는 하나의 표준 편차를 보인다. 모든 3 개의 L70R 변이체는 대조군 (WT) 보다 더 높은 활성을 보인다.
도 47 는 "MEA" 절단된 P. alba IspS 효소와 비교되는 모든 3 개의 L70R 변이체의 평균 특이 활성을 나타내는 그래프를 나타낸다. 오차 바는 하나의 표준 편차를 나타낸다.
도 48 는 플라스미드 pDu47-3, pDu47-4, 및 pDu47-5 의 맵을 제공한다.
도 49 는 플라스미드 pDu47-6, pDu47-7, 및 pDu48 의 맵을 제공한다.
도 50 은 플라스미드 pDu49, pDu50 및 pDu50-4 의 맵을 제공한다.
도 51 은 pDu47-3 내 P. alba TRC (-3) 의 아미노산 서열 (SEQ ID NO:136) 을 제공한다
도 52 는 플라스미드 pDu47-3 의 뉴클레오티드 서열 (SEQ ID NO:137) 을 제공한다.
도 53 은 pDu47-4 내 P. alba TRC (-4) 의 아미노산 서열 (SEQ ID NO:138) 을 제공한다.
도 54 는 플라스미드 pDu47-4 의 뉴클레오티드 서열 (SEQ ID NO:139) 을 제공한다.
도 55 는 pDu47-5 내 P. alba TRC (-5) 의 아미노산 서열 (SEQ ID NO:140) 을 제공한다.
도 56 은 플라스미드 pDu47-5 의 뉴클레오티드 서열 (SEQ ID NO:141) 을 제공한다.
도 57 는 pDu47-6 내 P. alba TRC (-6) 의 아미노산 서열 (SEQ ID NO:142) 을 제공한다.
도 58 은 플라스미드 pDu47-6 의 뉴클레오티드 서열 (SEQ ID NO:143) 을 제공한다.
도 59 는 pDu47-7 내 P. alba TRC (-7) 의 아미노산 서열 (SEQ ID NO:144) 을 제공한다.
도 60 은 플라스미드 pDu47-7 의 뉴클레오티드 서열 (SEQ ID NO:145) 을 제공한다.
도 61 은 pDu48 내 P. tremuloides TRC (MET) 의 아미노산 서열 (SEQ ID NO:146) 을 제공한다.
도 62 는 플라스미드 pDu48 의 뉴클레오티드 서열 (SEQ ID NO:147) 을 제공한다.
도 63 은 pDu49 내 P. trichocarpa (TRC) 의 아미노산 서열 (SEQ ID NO:148) 을 제공한다.
도 64 는 플라스미드 pDu49 의 뉴클레오티드 서열 (SEQ ID NO:149) 을 제공한다.
도 65 는 pDu50 내 Kudzu TRC (MEA) 의 아미노산 서열 (SEQ ID NO:150) 을 제공한다.
도 66 는 플라스미드 pDu50 의 뉴클레오티드 서열 (SEQ ID NO:151) 을 제공한다.
도 67 는 pDu50-4 내 KudzuTRC (-4) 의 아미노산 서열 (SEQ ID NO:152) 을 제공한다.
도 68 은 플라스미드 pDu50-4 의 뉴클레오티드 서열 (SEQ ID NO:153) 을 제공한다.
도 69 는 IspS 의 절단된 변이체의 ,DMAPP 검정으로부터의 원래 및 OD-정규화 데이타를 나타내는 그래프를 보인다.
도 70 은 IspS 절단물의 특이 활성을 나타내는 그래프를 보인다. P. alba, P. tremuloides 및 P. trichocharpa 절단물을 P. alba "전장" 변이체와 비교하여 특이 활성에 대해서 대조했다.
도 71 은 플라스미드 p9795 의 맵을 제공한다.
도 72 은 플라스미드 p9795 의 뉴클레오티드 서열 (SEQ ID NO:154) 을 제공한다.
도 73 은 플라스미드 pTrcKudzu 의 맵을 제공한다.
도 74 는 플라스미드 pTrcKudzu 의 뉴클레오티드 서열 (SEQ ID NO:155) 을 제공한다.
도 75 는 플라스미드 pMAL-C4X 의 맵을 제공한다.
도 76 은 플라스미드 pMAL-C4X 의 뉴클레오티드 서열 (SEQ ID NO:156) 을 제공한다.
도 77 는 플라스미드 pMAL-C4X-Kudzu 의 맵을 제공한다.
도 78 은 플라스미드 pMAL-C4X-Kudzu 의 뉴클레오티드 서열 (SEQ ID NO:157) 을 제공한다.
도 79 는 플라스미드 pET24 P. tremuloides pET24a 및 P. trichocharpa pET24a 의 맵을 제공한다.
도 80 은 P. trichocharpa pET24a 내 P. tremuloides IspS 의 아미노산 서열 (SEQ ID NO:158) 을 제공한다.
도 81 은 플라스미드 P. tremuloides pET24a 의 뉴클레오티드 서열 (SEQ ID NO:159) 을 제공한다.
도 82 는 P. trichocharpa pET24a 내 P. trichocharpa IspS 의 아미노산 서열 (SEQ ID NO:160) 을 제공한다.
도 83 은 플라스미드 P. trichocharpa pET24a 의 뉴클레오티드 서열 (SEQ ID NO:161) 을 제공한다.
도 84 는 플라스미드 pDu30, pDu31, 및 pDu32 의 맵을 제공한다.
도 85 는 pDu30 에서 IspS 변이체 P.albaTRC-pET200 의 아미노산 서열 (SEQ ID NO:162) 을 제공한다.
도 86 은 pDu30 의 뉴클레오티드 서열 (SEQ ID NO:163) 을 제공한다.
도 87 은 pDu31 에서 IspS 변이체 P.tremTRC-pET200 의 아미노산 서열 (SEQ ID NO:164) 을 제공한다.
도 88 은 pDu31 의 뉴클레오티드 서열 (SEQ ID NO:165) 을 제공한다.
도 89 는 pDu32 내 IspS 변이체 P.trichTRC-pET200 의 아미노산 서열 (SEQ ID NO:166) 을 제공한다.
도 90 는 pDu32 의 뉴클레오티드 서열 (SEQ ID NO:167) 을 제공한다.
도 91 은 이량체로서 나타낸 P. tremuloides IspS 의 3차원 구조를 제공한다. 사슬 A 는 암회색으로 표시하고, 사슬 B 는 중간의 회색으로 표시하고, 각 활성 부위의 단일 마그네슘 이온은 담회색으로 표시한다.
도 92 은 P. tremuloides IspS 의 구조의 단량체 단면을 제공한다. 마그네슘을 담회색 구 (sphere) 로 나타내고, N- 및 C-말단을 표시했다.
도 93 은 (A) BdpS 및 LS, (B) BdpS 및 포플러 IspS, (C) LS 및 포플러 IspS, 및 (D) TEAS 및 포플러 IspS 사이의 구조 정렬을 나타낸다. 각 경우에, 제 1 의 구조는 담회색으로, 제 2 의 구조는 암회색으로 표시한다. 2가 양이온을 구로서 나타낸다.
도 94 는 BdpS 및 LS 내 루프의 3차 구조를 나타낸다. 패널 A 는 담회색으로 Ls 의 N-말단 루프를 나타내고, 암회색으로 BdpS 의 N-말단 루프를 나타낸다. 패널 B 는 루프 I 및 루프 II 가 구조적으로 상동인 것을 보여준다.
도 95 는 BdpS 의 N-말단 루프 (암회색) 및 포플러 IspS (담 회색) 이 구조적으로 방사형임을 보여준다. 패널 A 는 N-말단 루프를 보여주고, 패널 B 는 루프 I 및 루프 II 를 나타낸다.
도 96 은 LS (담회색) 의 N-말단 루프 및 포플러 IspS (암회색) 가 구조적으로 방사형임을 보여준다. 패널 A 는 N-말단 루프를 나타내고, 패널 B 는 루프 I 및 루프 II 를 나타낸다.
도 97 은 TEAS (담회색)의 N-말단 루프 및 포플러 IspS (암회색) 이 구조적으로 방사형임을 보여준다. 패널 A 는 N-말단 루프를 나타내고, 패널 B 는 루프 I 및 루프 II 를 나타낸다. 루프 I 는 TEAS 에서 혼란스럽다.
본 발명의 일반적인 설명
본 발명은 개선된 촉매 활성 및/또는 용해성을 지닌 하나 이상의 이소프렌 신타아제 효소를 포함하는 조성물 및 방법을 제공한다. 특히, 본 발명은 미생물 숙주 세포내 증가된 이소프렌 생성을 위한 변이체 식물 이소프렌 신타아제를 제공한다. 생합성으로 생성된 본 발명의 이소프렌은 고무 및 엘라스토머 제조에서 유용하다는 점이 발견되었다.
달리 지시하지 않는 한, 본 발명의 실시는 당기술 범위에 있는, 생물학, 미생물학 및 재조합 DNA 에서 통상 사용되는 종래 기술을 포함한다. 이러한 기술은 당업자에게 공지되어 있으며, 수많은 문헌 및 참조문헌들에 기술되어 있다 (참고로, 예를 들면: Sambrook 등., "Molecular Cloning: A Laboratory Manual," Second Edition, Cold Spring Harbor, 1989; 및 Ausubel 등., "Current Protocols in Molecular Biology," 1987).
달리 본원에서 정의하지 않는 한 모든 기술적 및 과학적 용어는 본 발명이 적용되는 당기술의 당업자에게 통상 이해되는 바와 동일한 의미를 지닌다. 예를 들어, [Singleton 및 Sainsbury, Dictionary of Microbiology and Molecular Biology, 2d Ed., John Wiley and Sons, NY (1994); 및 Hale 및 Marham, The Harper Collins Dictionary of Biology, Harper Perennial, NY (1991)] 은 당업자에게 본원에서 사용되는 용어 대부분의 일반적인 사전의미를 제공한다. 본원에서 기술된 것과 유사하거나 또는 동등한 임의의 방법 및 물질들이 본 발명의 현장에서 유용하다는 점이 발견되었으나, 바람직한 방법 및 기술을 본원에서는 기술한다. 따라서, 바로 직후에 정의한 용어들은 본 명세서를 전체적으로 참조할 때 훨씬 더 충분히 기술된다.
게다가, 본원에서 제공된 제목은 본 발명의 각종 측면 또는 구현예를 제한하는 것이 아니며, 이는 총괄하여 본 명세서에 참조될 수 있다. 따라서, 바로 직후에 정의되는 용어들은 본 명세서를 전체적으로 참조할 때 훨씬 더 충분히 정의된다. 그러나, 본 발명의 이해가 용이하도록, 다수의 용어를 하기에 정의하였다.
정의
달리 본원에서 정의되지 않는 한, 본원에서 사용되는 모든 기술 및 과학적 용어는 본원이 속한 당 기술의 당업자에게 통상 이해되는 바와 동일한 의미를 지닌다. 본원에서 기술된 것과 유사하거나 또는 동등한 임의의 방법 및 물질들이 본 발명의 현장에서 유용하다는 점이 발견되었으나, 바람직한 방법 및 기술을 본원에서는 기술한다. 따라서, 바로 하기에 정의한 용어들은 본 명세서를 전체적으로 참조할 때 훨씬 더 충분히 기술된다.
본원에 사용된 바, 단수 형태에는 문맥상 명백히 다르게 제시되지 않는 경우 복수의 대응물이 포함된다. 달리 지시되지 않는 한, 핵산은 5' 에서 3' 방향으로 왼쪽에서 오른쪽으로 표기하며; 아미노산 서열은 아미노에서 카르복시 방향으로 왼쪽에서 오른쪽으로 각각 표기한다. 본 발명이 기재된 특정 방법론, 프로토콜 및 시약에 제한되지 않는 것은 자명한데, 그 이유는 이들은 당업자에 의해 사용되는 문맥에 따라 다양할 수 있기 때문이다.
본 명세서에 걸쳐서 나타낸 모든 최대 수치 한도는, 그 수치의 하한이 명백히 본원에 기재되어 있는 것처럼 모든 하한 수치를 포함하는 것으로 사용된다. 본 명세서에 걸쳐 나타낸 모든 최소 수치 한도는, 그 수치의 상한이 명백히 본원에 기재되어 있는 것처럼, 모든 상한 수치를 포함할 것이다. 본 명세서에 나타낸 모든 수치 범위는, 더 좁은 상기 수치 범위가 모두 본원에 기재되어 있는 것처럼, 더 넓은 상기 수치 범위 내에 존재하는 더 좁은 수치 범위 모두를 포함할 것이다.
인용된 모든 문헌은 관련 부분에서 본원에 참조되어 인용된다. 그러나, 임의의 문헌의 인용이 본 발명에 있어서 이것이 종래기술이라는 것을 인정하는 것으로 해석해서는 안된다.
본원에서 사용되는 바, 용어 2-메틸-1,3-부타디엔 (CAS# 78-79-5) ("이소프렌") 은 3,3-디메틸알릴 피로포스페이트 (DMAPP) 로부터의 피로포스페이트의 제거로 인한 직접 및 최종적인 휘발성 C5 탄화수소 생성물을 지칭하며, 이는 [하나의] IPP 분자(들) 의 [하나의] DMAPP 분자(들)로의 결합 또는 중합화를 포함하지는 않는다. 본원에서 사용되는 바, 용어 "이소프렌 신타아제" 및 "IspS" 는 디메틸알릴 디포스페이트 (DMAPP) 로부터 피로포스페이트의 제거를 촉매작용하여 이소프렌을 형성하는 효소를 지칭한다. 일부 바람직한 구현예에서, IspS 는 칡, 포플러 또는 북가시나무 등의 식물로부터 수득되는 효소이다. 일부 구현예에서, 용어 "IspS" 는 천연 발생하는 성숙한 효소 또는 그의 일부를 지칭한다.
관련 (및 유도체) 단백질은 "변이체 단백질" 을 포함한다. 일부 바람직한 구현예에서, 변이체 단백질은 모체 단백질 (예, SEQ ID NO:2 에 제시한 쿠주 IspS 또는 포플러 IspS) 과 소수의 아미노산 잔기에서 서로 상이하다. 상이한 아미노산 잔기의 개수는 하나 이상, 바람직하게는 1, 2, 3, 4, 5, 10, 15, 20, 30, 40, 50, 또는 이를 초과하는 아미노산 개수의 잔기이다. 일부 바람직한 구현예에서, 변이체간 상이한 아미노산의 개수는 1 내지 10 이다. 일부의 특히 바람직한 구현예에서, 관련 단백질 및 특히 변이체 단백질은 적어도 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 또는 99% 의 아미노산 서열 동일성을 포함한다. 게다가, 본원에서 사용되는 바와 같은 관련 단백질 또는 변이체 단백질은 또 다른 관련 단백질 또는 모체 단백질과 돌출 영역의 개수에서 차이나는 단백질을 지칭한다. 예를 들어, 일부 구현예에서, 변이체 단백질은 모체 단백질과 상이한 1, 2, 3, 4, 5, 또는 10 개의 상응하는 돌출 영역을 갖는다.
부위-포화 돌연변이 유발 (site-saturation mutagenesis), 스캐닝 돌연변이유발, 삽입 돌연변이유발, 랜덤 돌연변이유발, 부위-특이적 (site-directed) 돌연변이유발 및 방향적 진화 (directed-evolution) 및 각종 기타 재조합 접근법을 포함하나 이로 제한되지 않는 본 발명의 효소의 변이체 제조에 적합한 여러 방법이 당업계에 공지되어 있다
야생형 및 돌연변이 단백질의 특성화 (characterization) 를 적합한 임의의 수단 또는 "시험"으로 수행하는데, 이는 관심 특성들의 평가를 기초로 하는 것이 바람직하다. 예를 들어, 하기의 특성들 중 하나 이상을 본 발명의 일부 구현예에서 평가한다: pH 안정성; 온도 안정성; 산화 안정성; 단백질분해 안정성; 용해성; 시험관 내 DMAPP 의 이소프렌으로의 전환의 Km 및/또는 특이 활성; 숙주 유기체 (예, E.coli) 의 상황에서 생체 내 DMAPP에서 이소프렌으로의 전환의 Km 및/또는 특이 활성; 및 DXP 경로 및/또는 MVA 경로의 효소(들) 의 발현. 실제로, 시험 조건 중 하나 이상에서 안정성, 용해성, 활성 및/또는 발현 수준이 다양한 효소가 본 발명에서 유용할 수 있다는 점이 고려된다.
본원에서 사용되는 바와 같이, 용어 "유전자"란 폴리펩티드를 인코딩하는 폴리뉴클레오티드 (예, DNA 분절) 을 지칭하며, 이에는 코딩 영역 전 및 후의 영역뿐 아니라 개별 코딩 분절 (엑손) 사이의 개재 서열 (인트론) 도 포함된다.
본원에서 사용되는 바와 같이, "상동성 유전자" 는 상이한, 그러나 통상 관련있는 종들에서 유래된 한 쌍의 유전자로, 이는 서로 상응하고, 상기 유전자는 서로 동일하거나 또는 매우 유사한 유전자를 지칭한다. 상기 용어는 종분화 (즉, 새로운 종의 발달) 에 의해 분리된 유전자 (예를 들어 오르토로그 유전자 (orthologous gene)) 및 유전자 복제로 분리되어진 유전자 (예를 들어, 파라로그 유전자 (paralogous gene)) 를 포함한다.
본원에서 사용되는 바와 같이, "오르토로그" 및 "오르토로그 유전자" 는, 종분화에 의한 공통의 조상 유전자 (즉, 상동성 유전자) 로부터 진화된 상이한 종들의 유전자를 지칭한다. 전형적으로, 오르토로그는 진화 과정 동안 동일한 기능을 보유한다. 오르토로그의 동정은 새롭게 서열화 (sequencing)된 게놈에서 유전자 기능의 신뢰할만한 예견시에 유용함이 발견된다.
본원에서 사용되는 바와 같이, "파라로그" 및 "파라로그 유전자" 는, 게놈 내 복제에 의해 연관된 유전자를 지칭한다. 오르토로그가 진화 과정을 통해 동일한 기능을 보유하는 반면에, 파라로그에서는 비록 일부 기능은 종종 원 기능과 연계되어 있지만, 새로운 기능이 진화된다.
본원에서 사용되는 바와 같이, "상동성" 이란, 서열의 유사성 또는 동일성을 지칭하며, 동일성이 바람직하다. 이러한 상동성은 당업계에 공지된 표준 기술을 이용해 측정된다 (참고, 예, Smith 및 Waterman, Adv Appl Math, 2:482, 1981; Needleman 및 Wunsch, J Mol Biol, 48:443, 1970; Pearson 및 Lipman, Proc Natl Acad Sci USA, 85:2444, 1988; Wisconsin Genetics Software Package, Genetics Computer Group, Madison, WI 에서 GAP, BESTFIT, FASTA, 및 TFASTA 와 같은 프로그램; 및 Devereux 등., Nucl Acid Res, 12:387-395, 1984).
본원에서 사용되는 바와 같이, "유사 서열" 이란 유전자의 기능이 본질적으로 쿠주 이소프렌 신타아제 (IspS) 또는 포플러 IspS (IspS) 을 기준으로 하는 유전자와 동일한 것이다. 추가적으로, 유사 유전자는 쿠주 이소프렌 신타아제의 서열과 적어도 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 서열 동일성을 포함한다. 추가 구현예에서, 상기 특징들 중 하나 초과가 이 서열에 적용된다. 유사 서열은 서열 정렬의 공지된 방법으로 측정된다. 통상 사용되는 정렬 방법은 BLAST 이나, 상하에 지시된 바와 같이 서열 정렬화에서 유용한 기타 방법들도 존재한다.
유용한 알고리즘의 한 예가 PILEUP 이다. PILEUP 는 전진하는 쌍으로 있는 정렬을 이용해, 관련 서열군으로부터 다수의 서열 정렬을 만든다. 이것은 또한 정렬을 만드는데 사용되는 무리지어진 관계들을 나타내는 나무 (tree) 를 제도할 수 있다. PILEUP 는 Feng 및 Doolittle (Feng 및 Doolittle, J Mol Evol, 35:351-360, 1987) 의 전진의 정렬법의 간소화를 사용한다. 이 방법은 Higgins 및 Sharp (Higgins 및 Sharp, CABIOS 5:151-153, 1989) 에 의해 기술된 것과 유사하다. 유용한 PILEUP 파라미터는 3.00 의 디폴트 갭 가중치 (weight), 0.10 의 디폴트 갭 길이 가중치 및 가중치 말단 갭이 포함된다.
유용한 알고리즘의 또 다른 예는 [Altschul 등., (Altschul 등., J Mol Biol, 215:403-410, 1990; 및 Karlin 등., Proc Natl Acad Sci USA, 90:5873-5787, 1993)] 에 기술된 BLAST 알고리즘이다. 특히 유용한 BLAST 프로그램은 WU-BLAST-2 프로그램 (Altschul 등., Meth Enzymol, 266:460-480, 1996 참고) 이다. WU-BLAST-2 는 몇몇의 검색 파라미터를 사용하는데, 이의 대부분은 디폴트 값에 맞춰진다. 조정가능한 파라미터는 하기 값을 사용해 맞춰진다 : 오버랩 범위 (span) = 1, 오버랩 분획 (fraction) = 0.125, 단어 임계값 (word threshold) (T) = 11. HSP S 및 HSP S2 파라미터는 동적 (dynamic) 값이고, 관심있는 서열이 검색되는 특정 데이타베이스의 조성 및 특정 서열의 조성에 의존하여 프로그램 자체에 의해 성립된다. 그러나, 상기 값은 민감도를 증가시키도록 조정될 수 있다. % 아미노산 서열 동일성 값은 매칭하는 동일한 잔기의 수를 정렬된 영역 내 "더 긴" 서열의 잔기의 총 수로 나누어서 결정된다. "더 긴" 서열은 정렬된 영역에서 실제 잔기의 수가 가장 많은 것이다 (정렬 스코어를 최대화하기 위해 WU-Blast-2 에 의해 도입되는 갭은 무시함).
따라서, "핵산 서열 동일성 퍼센트 (%)" 는 출발 서열 (즉, 관심있는 서열) 의 뉴클레오티드 잔기와 동일한 후보 서열 내 뉴클레오티드 잔기의 % 로서 정의된다. 바람직한 방법은 WU-BLAST-2 의 BLASTN 모듈을 디폴트 파라미터에 맞추는데 사용되고, 오버랩 범위 및 오버랩 분획은 각각 1 및 0.125 로 맞추어진다.
본원에서 사용되는 바와 같이, 용어 "혼성화" 는 당업계에 공지된 바와 같이, 핵산 중 한 가닥이 염기쌍을 통해 상보성 가닥과 결합하는 방법을 말한다.
핵산 서열과 대조군 핵산 서열, 즉 이 2 개의 서열이 높은 엄격한 혼성화 및 세정 조건 하에 서로 특이적으로 혼성화된다면, 핵산 서열은 대조군 핵산 서열에 "선택적으로 혼성화가능한" 것으로 간주된다. 혼성화 조건은 핵산 결합 복합체 또는 프로브 (probe) 의 용융 온도 (Tm) 를 바탕으로 한다. 예를 들어, "최대의 엄격성" 은 전형적으로 약 Tm - 5℃ (프로브의 Tm 보다 5℃ 낮음) 에서 발생하고 ; "높은 엄격성" 은 Tm 보다 약 5 ~ 10℃ 낮은 온도에서 발생하고 ; "중간 정도의 엄격성" 은 프로브의 Tm 보다 약 10 ~ 20℃ 낮은 온도에서 발생하고 ; "낮은 엄격성" 은 Tm 보다 약 20 ~ 25℃ 낮은 온도에서 발생한다. 기능적으로, 혼성화 프로브를 사용해 엄격한 동일성 또는 거의 엄격한 동일성을 갖는 서열을 규명하기 위해서는 최대의 엄격한 조건이 사용될 수 있으며 ; 한편, 중간 또는 낮은 엄격한 혼성화는 폴리뉴클레오티드 서열 상동체를 규명 또는 검출하는데 사용될 수 있다.
중간 및 높은 엄격한 혼성화 조건은 당업계에 익히 공지되어 있다. 높은 엄격한 조건의 예는 50% 포름아미드, 5X SSC, 5X Denhardt 용액, 0.5% SDS 및 100 μg/ml 변성된 운반체 DNA 내, 약 42℃ 에서 혼성화하고, 이어서 2X SSC 및 0.5% SDS 내, 실온에서 2 회 세정하고, 0.1X SSC 및 0.5% SDS 내, 42℃ 에서 추가로 2 회 세정하는 것을 포함한다. 중간정도의 엄격한 조건의 예는 20% 포름아미드, 5X SSC (15O mM NaCl, 15 mM 트리나트륨 시트레이트), 50 mM 나트륨 포스페이트 (pH 7.6), 5X Denhardt 용액, 10% 덱스트란 술페이트 및 20 mg/ml 변성된 쉐어드 연어 정자 DNA (denatured sheared salmon sperm DNA) 를 포함하는 용액 내, 37℃ 에서 밤새 인큐베이션하고, 이어서 약 37 ~ 50℃, 1X SSC 에서 필터를 세정하는 것을 포함한다. 당업자는 프로브 길이 등과 같은 요소를 조절하는데 필요한 온도, 이온 세기 등을 조정하는 방법을 알고 있다.
본원에 사용되는 바와 같은, "재조합체"는 이종 핵산 서열의 도입에 의해 개질된 세포 또는 벡터, 또는 그렇게 해서 개질된 세포로부터 유래된 세포를 말하는 것을 포함한다. 따라서, 예를 들어, 재조합 세포는 세포의 본래의 (비-재조합) 형태 내에서 동일한 형태로 발견되지 않는 유전자를 발현하거나, 또는 고의적인 인간 개입의 결과로서 발현되거나 또는 전혀 발현되지 않는, 즉, 다르게 비정상적으로 발현되는 본래의 유전자를 발현한다. "재조합," "재조합화," 및 "재조합된" 핵산의 발생은 일반적으로 2 개 이상의 핵산 절편의 어셈블리로서, 이러한 어셈블리는 키메라 유전자를 산출한다.
바람직한 구현예에서, 돌연변이체 DNA 서열은 하나 이상의 코돈에서의 부위 포화 돌연변이유발로 발생된다. 또다른 바람직한 구현예에서, 부위 포화 돌연변이유발은 2 개 이상의 코돈에 대해 수행된다. 추가의 구현예에서, 돌연변이체 DNA 서열은 야생형 서열과 50% 초과, 55% 초과, 60% 초과, 65% 초과, 70% 초과, 75% 초과, 80% 초과, 85% 초과, 90% 초과, 95% 초과, 또는 98% 초과의 상동성을 갖는다. 대안적인 구현예에서, 돌연변이체 DNA 는 임의의 공지된 돌연변이유발 절차 예컨대, 방사선조사, 니트로소구아니딘 등을 사용하여 생체 내에서 발생한다. 이어서, 목적하는 DNA 서열을 단리하고 본원에 제공된 방법에 사용한다.
본원에 사용된 바와 같이, 용어 "표적 서열" 은 유입 서열을 숙주 세포 게놈에 삽입하는 것이 바람직한 경우, 서열을 인코딩하는 숙주 세포 내 DNA 서열을 말한다. 일부 구현예에서, 표적 서열은 기능성 야생형 유전자 또는 오페론을 인코딩하는 한편, 다른 구현예에서, 표적 서열은 기능성 돌연변이 유전자 또는 오페론, 또는 비-기능성 유전자 또는 오페론을 인코딩한다.
본원에서 사용되는 바와 같이, "측면 서열 (flanking sequence)" 은 논의되는 서열의 상류 또는 하류에 있는 임의의 서열을 말한다 (예를 들어, 유전자 A-B-C 에 대해서, 유전자 B 는 A 및 C 유전자 서열의 측면에 있음). 바람직한 구현예에서, 유입 서열은 각 면 상에 있는 상동성 박스의 측면에 있다. 또 다른 구현예에서, 유입 서열 및 상동성 박스는 각 면 상의 스터퍼 (stuffer) 서열의 측면에 있는 단위 (unit) 를 포함한다. 일부 구현예에서, 측면 서열은 단지 단일 면 (3' 또는 5') 상에만 존재하나, 바람직한 구현예에서, 상기 서열은 측면에 있는 서열의 각 면 상에 존재한다. 일부 구현예에서, 측면 서열은 단지 단일 면 (3' 또는 5') 상에만 존재하나, 한편, 바람직한 구현예에서, 상기 서열은 측면에 있는 서열의 각 면 상에 존재한다.
본원에 사용된 바와 같이, 용어 "스터퍼 서열" 은 상동성 박스의 측면에 있는 임의의 추가의 DNA (전형적으로 벡터 서열) 를 말한다. 그러나, 상기 용어는 임의의 비상동성 DNA 서열을 포함한다. 이론에 제한되지 않으면서, 스터퍼 서열은 세포가 DNA 취득을 개시하도록, 중요하지 않은 표적을 제공한다.
본원에 사용된 바와 같이, 용어 "증폭" 및 "유전자 증폭" 은, 증폭된 유전자가 게놈에 처음에 존재하던 것보다 높은 복사수로 존재하게 되는 식으로 특정 DNA 서열이 불균형되게 복제되는 방법을 말한다. 일부 구현예에서, 약물 (예를 들어, 억제가능 효소의 억제제) 의 존재하에서의 성장에 의한 세포의 선별은, 상기 약물의 존재하의 성장에 필요한 유전자 생성물을 인코딩하는 내인성 유전자의 증폭, 또는 상기 유전자 생성물을 인코딩하는 외인성 (즉, 투입됨) 서열의 증폭, 또는 둘 다를 도모한다.
"증폭" 은 주형 특이성과 관련된 핵산 복제의 특별한 경우이다. 이것은 비(非)-특이적 주형 복제 (즉, 주형-의존적이나 특이적 주형에는 의존하지 않는 복제) 와는 대조적인 것이다. 여기서 주형 특이성은 복제 충성도 (즉, 적합한 폴리뉴클레오티드 서열의 합성) 및 뉴클레오티드 (리보- 또는 데옥시리보-) 특이성과는 구별된다. 주형 특이성은 "표적" 특이성의 관점에서 빈번히 기술된다. 표적 서열은 다른 핵산으로부터 선별해 내기 위해 탐색된다는 의미에서 "표적들"이다. 증폭 기술은 일차적으로는 이 선별을 위해 고안되어 왔다.
본원에 사용된 바와 같이, 용어 "공동-증폭" 은 단일 세포 내로의 다른 유전자 서열과 함께 증폭가능 마커의 도입 (즉, 발현 벡터 내에 함유된 유전자들과 같은 하나 이상의 비-선별적 유전자를 포함함) 및 세포가 증폭가능 마커 및 기타, 비-선별적 유전자 서열 모두를 증폭시키도록 하는 적합한 선택적 압력의 적용을 말ㅎ한다. 증폭가능 마커는 다른 유전자 서열에 물리적으로 연결될 수 있거나, 다르게는 하나는 증폭가능 마커를 함유하고 다른 하나는 비-선별적 마커를 함유하는 2 개의 분리된 DNA 절편이 동일 세포 내에 도입될 수 있다.
본원에 사용된 바와 같이, 용어 "증폭가능 마커," "증폭가능 유전자" 및 "증폭 벡터" 는 적합한 성장 조건하에서 유전자의 증폭을 가능하게 하는 유전자를 인코딩하는 유전자 또는 벡터를 말한다.
"주형 특이성" 은 대부분 효소 선택에 의한 증폭 기술로 달성된다. 증폭 효소는 사용되는 조건 하에서 핵산의 불균질 혼합물 중의 오직 특이적 서열의 핵산만을 조작할 효소이다. 예를 들어, Qβ 복제효소의 경우, MDV-1 RNA 가 복제효소에 대한 특이적 주형이고 (예를 들어, Kacian 등., Proc Natl Acad Sci USA 69:3038, 1972 참조), 다른 핵산은 상기 증폭 효소에 의해 복제되지 않는다. 마찬가지로, T7 RNA 폴리머라아제의 경우, 상기 증폭 효소는 그 자신의 프로모터에 대해 엄격한 특이성을 갖는다 (Chamberlin 등., Nature 228:227, 1970 참조). T4 DNA 리가아제의 경우, 상기 효소는 라이게이션 (ligation; 결찰) 접합점에서 올리고뉴클레오티드 또는 폴리뉴클레오티드 기질과 주형 사이의 미스매치가 있는 경우, 2 개의 올리고뉴클레오티드 또는 폴리뉴클레오티드를 라이게이션하지 않을 것이다 (Wu and Wallace, Genomics 4:560, 1989 참조). 마지막으로, Taq 및 Pfu 폴리머라아제는 고온에서 작용하는 그들의 능력에 비추어, 결합된 서열에 대해 높은 특이성을 나타내는 것으로 발견되므로, 프라이머에 의해 정의되며; 고온은 표적 서열과의 프라이머 혼성화를 선호하고 비-표적 서열과의 혼성화를 선호하지 않는 열역학적 상태를 야기한다.
본원에 사용된 바와 같이, 용어 "증폭가능 핵산" 은 임의의 증폭 방법에 의해 증폭될 수 있는 핵산을 말한다. "증폭가능 핵산" 은 통상 "샘플 주형" 을 포함할 것으로 생각된다.
본원에 사용된 바와 같이, 용어 "샘플 주형" 은 "표적" (하기 정의됨) 의 존재를 분석하는 샘플로부터 기원하는 핵산을 말한다. 대조적으로, "배경 주형" 은 샘플에 존재할 수 있거나 존재할 수 없는, 샘플 주형 이외의 핵산을 말할 때 사용된다. 배경 주형은 대부분 종종 부주의에 의한 것이다. 이것은 잔류 결과일 수 있거나, 샘플로부터 정제해서 제거되어야 할 핵산 오염물의 존재로 인한 것일 수 있다. 예를 들어, 검출되는 것 이외의 개체로부터의 핵산은 테스트 샘플 중의 배경으로 존재할 수 있다.
본원에 사용된 바와 같이, 용어 "프라이머" 는 정제된 제한 분쇄물 (digest) 에서와 같이 자연 발생하거나 또는 합성적으로 생성되든지 간에, 핵산 가닥에 상보적인 프라이머 신장 생성물의 합성이 유도되는 조건하에 놓인 경우 (즉, 뉴클레오티드 및 DNA 폴리머라아제와 같은 유도제의 존재 하에서 및 적합한 온도 및 pH 에서) 합성 개시점으로 작용할 수 있는 올리고뉴클레오티드를 말한다. 프라이머는 증폭시 최대 효율을 위해 바람직하게는 단일 가닥이지만, 대안적으로는 이중 가닥일 수 있다. 이중 가닥인 경우, 프라이머는 먼저 가닥을 분리시키기 위해 처리된 후, 신장 생성물을 생성하는데 사용된다. 바람직하게는, 프라이머는 올리고데옥시리보뉴클레오티드이다. 프라이머는 유도제의 존재하에서 신장 생성물의 합성을 시작하기에 충분히 길어야만 한다. 프라이머의 정확한 길이는 온도, 프라이머의 공급원 및 방법의 용도를 포함하는 많은 요소에 따라 다를 것이다.
본원에 사용된 바와 같이, 용어 "프로브" 는 정제된 제한 분쇄물과 같이 자연 발생하거나 또는 합성적으로, 재조합적으로 또는 PCR 증폭에 의해 생성되든지간에, 또다른 관심있는 올리고뉴클레오티드에 혼성화할 수 있는 올리고뉴클레오티드 (즉, 일련의 뉴클레오티드) 를 말한다. 프로브는 단일 가닥 또는 이중 가닥일 수 있다. 프로브는 특정 유전자 서열의 검출, 확인 및 단리에 유용하다. 본 발명에서 사용되는 임의의 프로브는, 효소 (예를 들어, ELISA 뿐만 아니라, 효소-기반 조직화학적 검정), 형광, 방사능 및 발광 시스템을 포함하나 이에 제한되지 않는 임의의 검출 시스템으로 검출가능하도록, 임의의 "리포터 분자" 로 표지될 것으로 생각된다. 본 발명이 임의의 특정 검출 시스템 또는 표지에 제한되는 것으로 의도되지는 않는다.
본원에 사용된 바와 같이, 폴리머라아제 연쇄 반응과 관련하여 사용되는 경우 용어 "표적" 은, 폴리머라아제 연쇄 반응에 사용되는 프라이머에 의해 결합된 핵산의 영역을 말한다. 그러므로, "표적" 은 다른 핵산 서열로부터 색출된다. "분절" 은 표적 서열 내의 핵산의 영역으로서 정의된다.
본원에 사용된 바와 같이, 한 구현예에서, 용어 "폴리머라아제 연쇄 반응" ("PCR") 은 본원에 참조로서 인용된 미국 특허 제 4,683,195 호, 제 4,683,202 호 및 제 4,965,188 호의 방법들을 지칭하는데, 이들에는 클로닝 또는 정제 없이 게놈 DNA 의 혼합물 중의 표적 서열의 분절의 농도를 증가시키는 방법들이 있다. 표적 서열을 증폭시키는 이 방법은 목적하는 표적 서열을 함유한 DNA 혼합물에 과량의 2 개의 올리고뉴클레오티드 프라이머를 도입시킨 후, DNA 폴리머라아제의 존재하에서 정확한 순서의 열 사이클링 (cycling) 을 수행하는 것으로 이루어진다. 상기 2 개의 프라이머들은 상기 이중 가닥 표적 서열의 각 가닥들에 상보적이다. 증폭을 실행하기 위하여, 상기 혼합물을 변성시키고 그 후 프라이머를 표적 분자 내의 이들의 상보 서열들에 어닐링 (annealing) 시킨다. 어닐링 후, 상기 프라이머들은 폴리머라아제에 의해 신장되어 새로운 상보 가닥들의 쌍이 형성된다. 변성, 프라이머 어닐링 및 폴리머라아제 신장의 단계들을 수 회 (즉, 변성, 어닐링 및 신장이 하나의 "사이클" 을 구성하며; 다수의 "사이클들"이 있다) 반복하여 고농도의 목적 표적 서열의 증폭된 분절을 수득할 수 있다. 상기 목적 표적 서열의 증폭된 분절의 길이는 서로에 대한 프라이머들의 상대적 위치로 결정되며, 따라서, 이 길이는 제어가능한 파라미터이다. 상기 방법의 반복 양상 때문에, 상기 방법은 "폴리머라아제 연쇄 반응" (이하 "PCR") 으로 지칭된다. 목적하는 표적 서열의 증폭 분절들이 상기 혼합물 중 주된 서열 (농도의 면에서) 이 되기 때문에, 이들은 "PCR 증폭된" 것으로 불린다.
본원에서 사용되는 바와 같이, 용어 "증폭 시약"은, 프라이머, 핵산 주형 및 증폭 효소를 제외한 증폭에 필요한 시약들 (데옥시리보뉴클레오티드 트리포스페이트, 버퍼 등) 을 지칭한다. 전형적으로, 기타 반응 구성요소들과 함께 증폭 시약을 반응 용기 (시험관, 마이크로웰 등) 에 위치시키고 담는다.
PCR 로, 게놈 DNA 중의 특이적 표적 서열의 단일 카피를 여러 상이한 방법론 (예를 들어, 표지된 프로브로의 혼성화; 비오티닐화 프라이머의 혼입 후 아비딘-효소 컨쥬게이트 검출; 증폭된 분절 내로 32P-표지된 데옥시뉴클레오티드 트리포스페이트, 예컨대 dCTP 또는 dATP 의 혼입) 에 의해 검출가능한 수준으로 증폭시키는 것이 가능하다. 게놈 DNA 외에도, 임의의 올리고뉴클레오티드 또는 폴리뉴클레오티드 서열은 적합한 세트의 프라이머 분자로 증폭될 수 있다. 특히, PCR 과정 그 자체에 의해 제작된 증폭된 분절 그 자체는 수반되는 PCR 증폭에 대한 효과적인 주형이다.
본원에 사용된 바와 같이, 용어 "PCR 생성물," "PCR 절편," 및 "증폭 생성물" 은 변성, 어닐링 및 신장의 PCR 단계의 2 회 이상의 사이클이 완료된 후 화합물의 수득된 혼합물을 말한다. 이러한 용어는 하나 이상의 표적 서열의 하나 이상의 분절의 증폭이 있는 경우를 포함한다.
본원에서 사용되는 바와 같이, 용어 "RT-PCR" 은 RNA 서열들의 복제 및 증폭을 지칭한다. 이 방법에서는, 역전사가 PCR 에 연결되어 있는데, 가장 흔히는 미국 특허 제 5,322,770 호 (참조로서 본원에 포함됨) 에 기술된 바의, 열안정 폴리머라아제를 이용하는 1 가지 효소 방법을 사용한다. RT-PCR 에서, RNA 주형은 상기 폴리머라아제의 역전사효소 활성에 기인하여 cDNA 로 전환되며, 그 후, 상기 폴리머라아제의 중합활성 (즉, 기타 PCR 방법들에서와 같이) 으로 증폭된다.
본원에서 사용되는 바와 같이, 용어 "제한 엔도뉴클레아제" 및 "제한효소" 는 특정 뉴클레오티드 서열 또는 그 부근의 이중가닥 DNA 를 절단하는 박테리아 효소를 지칭한다.
"제한 부위" 는 주어진 제한 엔도뉴클레아제에 의해 인식 및 절단되는 뉴클레오티드 서열을 말하며, 흔히 DNA 절편의 삽입 부위이다. 본 발명의 특정 구현예에서, 제한 부위는 선별 마커 및 상기 DNA 구축물의 5' 및 3' 말단 내로 조작된다.
본원에 사용된 바와 같이, 용어 "염색체 혼입" 은 유입 서열이 숙주 세포의 염색체 내로 도입되는 방법을 말한다. 형질전환 DNA 의 상동 영역은 염색체의 상동 영역 내에 정렬된다. 이어서, 상동 박스 사이의 서열이 이중 교차 (즉, 상동 재조합) 내의 유입 서열에 의해 대체된다. 본 발명의 일부 구현예에서, DNA 구축물의 염색체 분절을 불활성화시키는 상동 섹션이 에스테리키아 염색체의 토착 염색체 영역의 측면 상동 영역에 정렬된다. 이어서, 토착 염색체 영역이 이중 교차 (즉, 상동 재조합) 내의 DNA 구축물에 의해 결실된다.
"상동 재조합" 은 동일한 또는 거의 동일한 뉴클레오티드 서열의 부위에서의 2 개의 DNA 분자 또는 쌍을 이룬 염색체들 사이의 DNA 절편의 교환을 의미한다. 바람직한 구현예에서, 염색체 혼입은 상동 재조합이다. 본원에서 사용되는 바와 같은 "상동 서열" 은 비교를 위해 최적으로 정렬되었을 때 또 다른 핵산 또는 폴리펩티드 서열과 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 88%, 85%, 80%, 75%, 또는 70% 서열 동일성을 갖는 핵산 또는 폴리펩티드 서열을 의미한다. 일부 구현예에서, 상동 서열은 85% 내지 100% 서열 동일성을 갖고, 다른 구현예에서 90% 내지 100% 서열 동일성이 있으며, 더욱 바람직한 구현예에서는, 95% 내지 100% 서열 동일성이 있다.
본원에서 사용된 바와 같은, "아미노산" 은 펩티드 또는 단백질 서열 또는 이들의 일부를 말한다. 용어 "단백질", "펩티드" 및 "폴리펩티드" 는 상호교환적으로 사용된다.
본원에서 사용된 바와 같은, 용어 "이종 단백질" 은 숙주 세포에서 자연 발생하지 않는 단백질 또는 폴리펩티드를 말한다. 이종 단백질의 예에는 이소프렌 신타아제와 같은 효소가 포함된다. 일부 구현예에서, 상기 단백질을 인코딩하는 유전자는 자연 발생적인 유전자인 반면, 다른 구현예에서는 돌연변이된 및/또는 합성의 유전자가 사용된다.
본원에서 사용되는 바와 같이, "상동 단백질" 은 천연형 또는 세포에서 자연적으로 발생하는 단백질 또는 폴리펩티드를 말한다. 바람직한 구현예에서, 세포는 그람-음성 세포이고, 특히 바람직한 구현예에서, 세포는 에스케리키아 숙주 세포이다.
효소는, 상기 효소가 세포 내에서 대응 야생형 세포에서 발현되는 수준보다 더 높은 수준으로 발현될 경우 숙주 세포 내에서 "과발현"이다.
용어 "단백질" 및 "폴리펩티드" 는 본원에서 상호교환적으로 사용된다. [IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN)] 에 따라 정의된 아미노산에 대한 3 자리 코드가 본 명세서 전체에 걸쳐 사용된다. 또한 유전적 코드의 축퇴성으로 인해 폴리펩티드가 하나 초과의 뉴클레오티드 서열에 의해 코딩될 수 있다는 것은 자명하다.
단백질 또는 펩티드의 용어 "성숙한" 형태란, 단백질 또는 펩티드의 최종 기능적 형태를 지칭한다. 예시로, 쿠주 이소프렌 신타아제의 성숙한 형태는 SEQ ID NO:2 의 아미노산 서열을 포함한다.
단백질 또는 펩티드의 용어 "전구체" 형태란, 단백질의 아미노 또는 카르보닐 말단에 작동가능하게 연결된 전구서열 (prosequence) 을 갖는 단백질의 성숙한 형태를 지칭한다. 전구체는 또한 전구서열의 아미노 말단에 작동가능하게 연결된 "신호 서열" 을 가질 수도 있다. 상기 전구체는 또한 번역 후 활성에 관여하는 부가적인 폴리뉴클레오티드 (예를 들어, 이로부터 절단되어 단백질 또는 펩티드의 성숙한 형태를 남기는 폴리뉴클레오티드) 를 가질 수 있다.
"자연 발생 효소"는 자연에서 발견되는 것과 동일한 변형되지 않은 아미노산 서열을 가진 효소를 지칭한다. 자연 발생 효소들은 본래적 효소들, 특정 미생물에서 자연적으로 발현되거나 발견되는 효소들을 포함한다.
2 개의 핵산 또는 폴리펩티드 서열의 맥락에서 용어 "동일한"은, 하기 서열 비교 또는 분석 알고리즘 중 하나를 사용하여 측정할 때, 이 2 개 서열 내 최대 대응으로 정렬시 동일한 잔기를 지칭한다.
용어 "최적 정렬"은 가장 높은 퍼센트 동일성 점수를 주는 정렬을 지칭한다.
2 개의 아미노산, 폴리뉴클레오티드 및/또는 유전자 서열들 (적절한 경우) 에 대하여 "퍼센트 서열 동일성", "퍼센트 아미노산 서열 동일성", "퍼센트 유전자 서열 동일성" 및/또는 "퍼센트 핵산/폴리뉴클레오티드 서열 동일성"은, 상기 서열들이 최적으로 정렬시 2 개 서열들 내의 동일한 잔기들의 백분율을 지칭한다. 따라서, 80% 아미노산 서열 동일성은 최적으로 정렬된 2 개의 폴리펩티드 서열 내에서 80% 의 아미노산들이 동일하다는 것을 의미한다.
2 개의 핵산 또는 폴리펩티드들의 맥락에서 "실질적으로 동일한" 이라는 어구는, 따라서, 표준 파라미터를 사용하는 프로그램 또는 알고리즘 (예컨대, BLAST, ALIGN, CLUSTAL) 을 사용하여 기준 서열과 비교시 서열 동일성이 70% 이상, 바람직하게는 75% 이상, 바람직하게는 80% 이상, 바람직하게는 85% 이상, 바람직하게는 90% 이상, 바람직하게는 95% 이상, 바람직하게는 97% 이상, 바람직하게는 98% 이상 및 바람직하게는 99% 이상인 폴리뉴클레오티드 또는 폴리펩티드를 지칭한다. 2 개의 폴리펩티드들이 실질적으로 동일하다는 한가지 표시는, 첫번째 폴리펩티드가 두번째 폴리펩티드에 대하여 면역학적으로 교차-반응성이 있는 것이다. 전형적으로, 보존적 아미노산 치환에 의해 다른 폴리펩티드들은 면역학적 교차-반응성이 있다. 따라서, 폴리펩티드는, 예를 들어, 2 개 펩티드들이 보존적 치환에 의해서만 다른 경우, 두번째 폴리펩티드와 실질적으로 동일하다. 2 개의 핵산 서열들이 실질적으로 동일한 또 다른 표시는, 상기 두 분자들이 엄격한 조건들 (예컨대, 중간 내지 높은 엄격성의 범위 내) 하에서 서로 혼성화하는 것이다.
용어 "단리된" 또는 "정제된"은 그의 본래 환경 (예컨대, 이것이 자연 발생적인 것일 경우 그의 천연적 환경) 으로부터 제거된 물질을 지칭한다. 예를 들어, 상기 물질은, 자연 발생 또는 야생형 유기체 (예, 쿠주) 중에, 또는 자연 발생 또는 야생형 유기체로부터 발현시에 정상적으로는 존재하지 않는 성분과 조합되어 존재하는 것보다 더 높거나 더 낮은 농도로 특정 조성물 중에 존재할 때 "정제된" 것으로 말해진다. 예를 들어, 살아있는 동물에 존재하는 자연 발생 폴리뉴클레오티드 또는 폴리펩티드는 단리된 것이 아니나, 자연계에서 공존하는 물질들의 일부 또는 전부로부터 분리된 동일한 폴리뉴클레오티드 또는 폴리펩티드는 단리된 것이다. 이러한 폴리뉴클레오티드는 벡터의 일부일 수 있고/있거나 이러한 폴리뉴클레오티드 또는 폴리펩티드는 조성물의 일부일 수 있고, 또한 이러한 벡터 또는 조성물이 그의 천연 환경의 일부가 아니라는 점에서 단리된 것일 수 있다. 바람직한 구현예들에서, 핵산 또는 단백질은, 예를 들어 전기영동 겔 또는 블럿 (blot) 내에서 본질적으로 하나의 밴드를 나타내는 경우, 정제된 것으로 불린다.
DNA 서열과 관련하여 사용될 때 용어 "단리된" 은, 그의 천연 유전적 환경에서 제거되어 기타의 이질적인 또는 원치 않는 코딩 서열들이 없고, 유전적으로 조작된 단백질 생산 시스템 내에 사용하기에 적당한 형태인 DNA 서열을 지칭한다. 마찬가지로, 재조합 DNA 서열과 관련하여 사용될 때 용어 "단리된" 은 숙주 세포의 유전적 환경에서 제거되어 기타의 이질적 또는 원치 않는 코딩 서열들이 없는 DNA 서열을 지칭한다 (예를 들어, E.coli 에서 번식시킨 쿠주 IspS 발현 벡터). 이러한 단리된 분자들은 이들의 천연 환경으로부터 분리된 것들이며, cDNA 및 게놈 클론들이 있다. 본 발명의 단리된 DNA 분자들에는, 이들이 통상적으로는 결합되어 있는 다른 유전자들은 없으나, 프로모터 및 터미네이터 (terminator; 종결자) 등의 자연 발생적 5' 및 3' 비번역 영역이 포함되어 있을 수 있다. 결합 영역들의 동정은 당업계의 통상의 지식을 가진 자에게 자명하다 (예컨대, Dynan 및 Tijan, Nature 316:774-78 [1985] 참조). 용어 "단리된 DNA 서열"은 다르게는 "클로닝된 DNA 서열"로 지칭된다.
단백질과 관련하여 사용될 때 용어 "단리된"은 그의 본래적 환경과 다른 조건에서 발견되는 단백질을 지칭한다. 바람직한 형태에서, 단리된 단백질에는, 다른 단백질, 특히 기타 상동 단백질들이 실질적으로 부재하다. 마찬가지로, 재조합으로 생성된 단백질과 관련하여 사용될 때 용어 "단리된" 은 숙주 유기체의 단백질 환경에서 제거되어 기타 이질적이거나 또는 원치 않는 단백질이 부재한 단백질을 지칭한다 (예를 들어, E.coli 에서 생성된 재조합 쿠주 IspS). 단리된 단백질은, SDS-PAGE 로 측정시, 10% 초과로 순수하고, 바람직하게는 20% 초과로 순수하며, 더욱 더 바람직하게는 30% 초과로 순수하다. 본 발명의 또 다른 면은, SDS-PAGE 로 측정된 바, 고도로 정제된 형태 (즉, 40% 초과, 60% 초과, 80% 초과, 90% 초과, 95% 초과, 97% 초과, 및 심지어 99% 초과로 순수) 의 단백질을 포괄한다.
하기의 카세트 돌연변이유발법이 본 발명의 효소 변이체의 구축을 용이하게 하기 위해 사용될 수 있으나, 기타 방법들이 사용될 수도 있다. 먼저, 본원에서 기술되는 바와 같이, 효소를 인코딩하는 자연-발생 유전자를 수득하고 그 전체 또는 일부를 서열화한다. 그 후, 인코딩된 효소의 하나 이상의 아미노산의 돌연변이화 (결실, 삽입 또는 치환) 를 만들기를 원하는 지점에서 상기 서열을 스캐닝한다. 이 지점과 측면에 있는 서열을, 발현시 각종 돌연변이체를 인코딩하는 올리고뉴클레오티드 풀 (pool) 로, 유전자의 짧은 분절을 대체하기 위한 제한 부위의 존재에 대해 평가한다. 이러한 제한 부위는 바람직하게도 유전자 분절 대체를 촉진시키기 위한 단백질 유전자 내에서의 독특한 부위이다. 그러나, 효소 유전자 내에서 매우 중복되는 것이 아닌 임의의 가까운 제한 부위가 사용될 수 있으나, 단 제한 분쇄에 의해 생성된 유전자 절편이 적절한 서열과 재결합될 수 있어야 한다. 제한 부위가 선택된 지점 (10 내지 15 개의 뉴클레오티드) 에서 가까운 거리 내 위치에 존재하지 않는 경우에는, 이러한 부위는 리딩 프레임도 인코딩된 아미노산도 모두 최종 구축물에서 변경되지 않는 방식으로 유전자 내 뉴클레오티드를 치환함으로써 형성한다. 이의 서열을 변경시켜 원하는 서열에 일치시키기 위해 유전자를 돌연변이화하는 것은 일반적으로 공지된 방법에 따라 M13 프라이머 신장으로 수행한다. 적합한 측면 영역의 위치를 찾아내어, 두 가까운 제한 부위 서열에 도달하게 하는 요구되는 변경을 평가하는 일은 유전자 코드의 중복성, 유전자의 제한 효소 맵 및 상당수의 상이한 제한 효소에 의해 일상적이다. 가까운 측면 제한 부위가 이용가능한 경우, 상술한 방법은 부위를 포함하지 않는 측면 영역과 연결될 때에만 사용하면 된다는 점에 주의한다.
일단 자연-발생 DNA 및/또는 합성 DNA 가 클로닝되면, 돌연변이될 위치와 측면에 있는 제한 부위는 관련 제한 효소로 분쇄되어 다수의 말단 종점-상보 올리고뉴클레오티드 카세트가 유전자에 라이게이션된다. 돌연변이유발은 이러한 방법으로 간략화되는데, 그 이유는 상기 올리고뉴클레오티드 전부가 동일한 제한 부위를 갖도록 합성될 수 있어 어떠한 합성 결합제도 제한 부위를 만드는데 필요하지 않기 때문이다.
본원에서 사용되는 바와 같이, "~ 와 상응하는" 이란, 단백질 또는 펩티드 내 열거된 위치에서의 잔기, 또는 단백질 또는 펩티드 내 열거된 잔기와 유사, 상동 또는 등가인 잔기를 지칭한다. 본원에서 사용되는 바와 같이, "상응 영역" 이란, 일반적으로 관련단백질 또는 모체 단백질에서 유사 위치를 지칭한다.
본원에 사용되는 바와 같은, 용어 "조합 돌연변이유발" 은 출발 서열의 변이체의 라이브러리가 생성되는 방법을 말한다. 상기 라이브러리에서, 변이체는 미리 정의된 일련의 돌연변이로부터 선택된 하나 또는 여러 돌연변이를 함유한다. 또한, 상기 방법은 미리 정의된 일련의 돌연변이의 일원이 아닌 랜덤 돌연변이를 도입하기 위한 수단을 제공한다. 일부 구현예에서, 상기 방법에는 본원에 참조로서 인용된, 미국 출원 제 09/699,250 호에 언급된 것들이 포함된다. 대안적인 구현예에서, 조합 돌연변이화 방법은 시판되는 키트 (예를 들어, QUIKCHANGE 다중 부위 특이적 돌연변이유발 키트, Stratagene, San Diego, CA) 를 포함한다.
본원에 사용되는 바와 같은, 용어 "돌연변이체의 라이브러리" 는 게놈의 대부분이 일치하나, 하나 이상의 유전자의 상이한 상동이 포함되는 세포의 집단을 말한다. 이러한 라이브러리는 예를 들어, 향상된 형질을 갖는 유전자 또는 오페론을 동정하는데 사용될 수 있다.
본원에서 사용된 바와 같이, 용어 "출발 유전자" 및 "모체 유전자" 는 본 발명을 사용하여 개선 및/또는 변화될 관심 대상 단백질을 인코딩하는 관심 대상 유전자를 지칭한다.
본원에 사용되는 바와 같은, 용어 "다중 서열 정렬" 및 "MSA" 은 알고리즘 (예를 들어, Clustal W) 을 사용하여 정렬된 출발 유전자의 다수의 상동체 서열을 말한다.
본원에서 사용되는 바와 같이, 용어 "보존 서열" 및 "정준 서열"은 관심 대상 특정 단백질 또는 서열의 모든 변이체들이 비교되는 전형적인 아미노산 서열을 지칭한다. 상기 용어는 또한 관심 대상 DNA 서열 내에 가장 흔히 존재하는 뉴클레오티드들을 나타내는 서열을 지칭한다. 유전자의 각 위치에 있어서, 상기 보존 서열은 MSA 내 상기 위치에서 가장 풍부한 아미노산을 제공한다.
본원에 사용되는 바와 같은, 용어 "보존 돌연변이화" 는 출발 유전자 및 보존 서열의 서열간 차이를 말한다. 보존 돌연변이는 MSA 로부터 수득된 출발 유전자 및 보존 서열의 서열을 비교하여 동정된다. 일부 구현예에서, 보존 돌연변이가 출발 유전자 내에 도입되어, 보존 서열과 더욱 유사하게 된다. 보존 돌연변이에는 또한 출발 유전자 중의 아미노산의 빈도와 관련된 위치에서 출발 유전자 중의 아미노산이 MSA 에서 더욱 종종 발견되는 아미노산으로 변경되는 아미노산 변경이 포함된다. 그러므로, 용어 보존 돌연변이는 출발 유전자의 아미노산을 MSA 중의 아미노산보다 더욱 풍부한 아미노산으로 대체하는 모든 단일 아미노산 변경을 포함한다.
용어 "개질된 서열" 및 "개질된 유전자"는 자연 발생적 핵산 서열의 결실, 삽입 또는 개입을 포함하는 서열을 나타내는 것으로 본원에서 상호교환적으로 사용된다. 일부 바람직한 구현예에서, 개질 서열의 발현 생성물은 절단된 단백질이다 (예를 들어, 개질이 서열의 결실 또는 개입인 경우). 일부 특히 바람직한 구현예에서, 절단된 단백질은 생물학적 활성을 유지한다. 대안적인 구현예에서, 개질 서열의 발현 생성물은 신장된 단백질이다 (예를 들어, 핵산 서열 내의 삽입을 포함하는 개질). 일부 구현예에서, 삽입은 절단된 단백질을 야기한다 (예를 들어, 삽입이 정지 코돈을 형성하는 경우). 따라서, 삽입은 발현 생성물로서 절단된 단백질 또는 신장된 단백질을 야기할 수 있다.
본원에 사용되는 바와 같은 용어 "돌연변이 서열" 및 "돌연변이 유전자"는 상호교환적으로 사용되고, 숙주 세포의 야생형 서열에서 발생하는 하나 이상의 코돈에서 변경이 이루어진 서열을 나타낸다. 돌연변이 서열의 발현 생성물은 야생형과 비교해 변경된 아미노산 서열을 갖는 단백질이다. 발현 생성물은 변경된 기능적 역량을 가질 수 있다 (예를 들어, 향상된 효소적 활성).
용어 "돌연변이유발 프라이머" 또는 "돌연변이유발 올리고뉴클레오티드" (본원에서 상호교환적으로 사용됨)는 주형 서열의 일부에 상응하고 그곳에 혼성화될 수 있는 올리고뉴클레오티드 조성물을 나타내는 것으로 의도된다. 돌연변이유발 프라이머에 있어서, 프라이머는 주형 핵산에 정확하게 부합하지 않을 것이고, 프라이머에서의 미스매치 또는 미스매치들은 핵산 라이브러리 내에 원하는 돌연변이를 도입하는데 사용된다. 본원에 사용되는 바와 같은 "비-돌연변이유발 프라이머" 또는 "비-돌연변이유발 올리고뉴클레오티드"는 주형 핵산에 정확하게 부합하는 올리고뉴클레오티드 조성물을 나타낸다. 본 발명의 하나의 구현예에서, 오직 돌연변이유발 프라이머만이 사용된다. 본 발명의 또 다른 바람직한 구현예에서, 프라이머는 하나 이상의 부위에 돌연변이유발 프라이머가 포함되고, 올리고뉴클레오티드 혼합물에 포함된 비-돌연변이유발 프라이머가 또한 있도록 디자인된다. 돌연변이유발 프라이머 중 하나 이상에 상응하는 돌연변이유발 프라이머 및 비-돌연변이유발 프라이머의 혼합물을 첨가하여, 다양한 조합 돌연변이 패턴이 제시된 생성된 핵산 라이브러리를 생성하는 것이 가능하다. 예를 들어, 돌연변이 핵산 라이브러리의 구성원 중 일부는 특정 위치에서 그의 전구체 서열을 유지하는 반면 다른 구성원은 상기 위치에서 돌연변이되는 것이 바람직한 경우, 비-돌연변이유발 프라이머는 제시된 잔기에 대한 핵산 라이브러리 내 비-돌연변이 구성원의 특정 수준을 수득하는 능력을 제공한다. 본 발명의 방법은 일반적으로 길이가 10~50개 염기인, 보다 바람직하게는 길이가 약 15~45개 염기인 돌연변이유발 및 비-돌연변이유발 올리고뉴클레오티드를 사용한다. 그러나, 원하는 돌연변이유발 결과를 얻기 위해 10개 염기보다는 짧거나 50개 염기보다는 긴 길이의 프라이머를 사용하는 것이 필요할 수 있다. 상응하는 돌연변이유발 및 비-돌연변이유발 프라이머에 있어서, 상응하는 올리고뉴클레오티드의 길이가 일치해야할 필요는 없으나, 첨가되는 돌연변이에 상응하는 부위 중에 오버랩은 있다.
일부 구현예에서, 프라이머는 소정의 비율로 첨가된다. 예를 들어, 생성된 라이브러리가 특정한 특이적 돌연변이의 유의한 수준을 가지며, 동일 또는 상이한 위치에서 상이한 돌연변이의 양이 더 적은 것이 바람직한 경우, 첨가되는 프라이머의 양을 조절하여, 원하는 방향의 라이브러리를 생성하는 것이 가능하다. 대안적으로는, 비-돌연변이유발 프라이머를 더 적게 또는 더 많이 첨가함으로써, 상응하는 돌연변이(들)가 돌연변이 핵산 라이브러리에서 생성되는 빈도를 조정하는 것이 가능하다.
용어 "야생형 서열," 또는 "야생형 유전자"는 숙주 세포에서 천연 또는 자연 발생하는 서열을 나타내는 것으로 본원에서 상호교환적으로 사용된다. 일부 구현예에서, 야생형 서열은 단백질 공학 프로젝트의 출발점인 관심 서열을 나타낸다. 야생형 서열은 상동 또는 이종 단백질을 인코딩할 수 있다. 상동 단백질은 숙주 세포 개입 없이 생성될 단백질이다. 이종 단백질은 숙주 세포 개입이 없다면 생성되지 않을 단백질이다.
본원에서 사용되는 바와 같이 용어 "분해물" 이란, 분해된 세포의 내용물을 함유하는 용액을 지칭한다. 일부 구현예에서, 분해물은 박테리아 세포 분해물 (예, Epicentre 로부터의 ReadyLyseTM 리소자임 용액을 이용해 분해된 E. coli 세포; 또는 세포파쇄기 (French Pressure cell) 을 이용해 분해된 E. coli 세포) 이다.
본원에서 사용되는 바와 같이, 용어 "리소자임" 은 N-아세틸 뮤람산과 N-아세틸 글루코사민간 결합을 가수분해하여, 다수의 박테리아의 세포벽에서 중요한 중합체를 절단하는 글리코시다아제를 지칭한다. 본 발명에서 사용하기에 적합한 리소자임에는 이에 제한되는 것은 아니나, 암탉 백색 달걀 리소자임 (Sigma), T4 리소자임, 재조합 비(非)포유류, 비(非)-조류 리소자임 (ReadyLyseTM), 또는 진균류 리소자임이 포함된다.
본원에서 사용되는 바와 같이, 용어 "상부공간" 이란, 밀봉된 용기 내 고체 또는 액체 샘플 위에 가두어진 증기/공기 혼합물을 지칭한다.
본원에서 사용되는 바와 같이, 용어 "고처리량 스크리닝" 및 "HTS (high throughput screening)" 은 4 시간 이내에 96 개 이상의 샘플에서 이소프렌을 측정하는 것이다. 바람직한 구현예에서, 샘플 부피는 2 mL 미만이다.
달리 언급되지 않는 한, 모든 성분 또는 조성물 수준은 그 성분 또는 조성물의 활성 수준과 관련되며, 불순물, 예를 들면 시판중 공급원으로 존재할 수 있는 잔류 용매 또는 부산물은 제외된다.
효소 성분 중량은 총 활성 단백질을 기준으로 한다. 모든 백분율 및 비율은 달리 지시되지 않는 한 중량으로 산출된다. 모든 백분율 및 비율은 다르게 언급되지 않는 한 총 조성물을 기준으로 산출된다.
본 발명의 상세한 설명
이소프렌 단량체는 폴리이소프렌 및 (이소부틸렌, 부타디엔, 스티렌, 또는 기타 단량체와의) 다양한 공중합체 제조에서 사용된다. 상업적으로 실행가능한 수준의 이소프렌을 생성가능하게 하는 균주 (원핵 또는 진핵) 를 만드는 것은 MVA 에서 이소프렌, 또는 DXP 에서 이소프렌인 전체 경로에서의 최적화를 요구한다. 이 경로에서의 주요 효소는 이소프렌 신타아제 (IspS) 로, 이는 전구체 DMAPP 를 이소프렌으로 전환시킨다. 현재까지 동정된 유일한 이소프렌 신타아제 (IspS) 은 포플러, 영국산 오크 및 칡 등과 같은 식물 유래의 것이다. 일부 박테리아, 예컨대 바실러스 서브틸러스 (Bacillus subtilis ) 가 또한 이소프렌을 생성하지만, 원핵 IspS 가 아직 동정되어있지 않고, 바실러스 내 고유의 IspS 활성은 상업적인 공정에서 충분하지 않다. 현재까지 동정된 식물 IspS 효소는 E. coli 에서의 발현에 의해 불완전하게 일부 특성화되어 있고, 이들 효소의 동적 파라미터 중 일부가 정제된 단백질을 이용하여 시험관 내에서 측정된다. 그러나, 천연형 IspS 효소의 동적 파라미터 (Km, 속도 등) 는 생물 숙주에서 이소프렌의 상업적 생산에 불충분하다.
본원에서 기술된 이러한 문제점을 해결하기 위해, 식물 IspS 를 박테리아 숙주에서 발현시킨다. 아울러, 관심 특성을 변경하도록 IspS 를 조작한다. 야생형 및 돌연변이체 IspS 의 특성화는 적합한 임의의 수단 또는 "시험" 을 통해 달성되며, 바람직하게는 관심 특성 평가를 기초로 한다. 관심 특성에는 이에 제한되는 것은 아니나 하기가 포함된다: pH 최적, 온도 안정성 (예, Tm 값), 세포내 및 세포외 용해성, Km 값, kcat 값, 또는 특이 활성뿐 아니라, 기질을 비롯한 잠재 억제제 또는 생성물 억제제에 대한 민감성. 산화 및 단백질 분해 안정성이 또한 관심대상이다. 게다가, 금속 이온 작용 및 이온 강도로 인한 활성화 또는 억제가 관심 대상이다. 이들 특성 및 파라미터는 정제된 또는 부분적으로 정제된 이소프렌 신타아제를 통해 시험관 내에서, 또는 DXP 경로, MVA 경로 또는 둘 다를 발현하는 E.coli 와 같은 숙주 유기체의 맥락에서 생체 내에서 DMAPP 에서 이소프렌으로의 전환에 의해 평가될 수 있다. 시험 조건 중 하나 이상에서 다양한 정도의 안정성, 용해성, 활성, 및/또는 발현 수준을 갖는 효소가 다양한 숙주에서 이소프렌을 생성하기 위한 본 발명에서 유용할 것이라는 점이 고려된다. 고처리량 방법, 예컨대 실시예 10 에 기술된 것이 경제적인 방식으로 이들 특성을 조사하는데 요구된다.
본 발명은 증가된 양의 이소프렌을 생산하기 위한 조성물 및 방법을 특징으로 삼다. 특히, 이들 조성물 및 방법은 이소프렌의 생성 속도를 증가시키고 생성된 이소프렌의 총 함량을 증가시킨다. 본원에서 기술된 이소프렌 생성의 생합성적 공정은 천연 고무 이용의 바람직한 대안법이다. 하기에 더 논의되는 바와 같이 세포에 의해 생성된 이소프렌의 양은, 이소프렌 신타아제 (IspS) 폴리펩티드를 인코딩하는 이종 핵산을, 세포에 도입함으로써 크게 증가될 수 있다. 이소프렌 신타아제 폴리펩티드는 디메틸알릴 디포스페이트 (DMAPP) 를 이소프렌으로 전환시킨다. 실시예에 나타내듯이, 이종 Pueraria montana (쿠주) 이소프렌 신타아제 폴리펩티드 및 이의 변이체는 그람-음성 박테리아 세포 (예, 대장균) 에서 발현되었다. 또한 실시예에 나타내고 본 발명의 범위 내에서 고려되는 것은 포플러 이소프렌 신타아제 폴리펩티드 및 이의 변이체로, 이는 그람-음성 박테리아 세포 (예, Escherichia coli) 에서 발현된 것이다.
박테리아 숙주 세포 내 식물 IspS 의 이종 발현으로 식물 IspS 가 없는 상응하는 세포보다 더 많은 이소프렌의 생성이 도모되었다.
프로테아제 효소의 표면 상 아미노-산 잔기의 돌연변이화가 이의 활성, 발현 및 안정성을 개선할 수 있다는 점이 보고되어 있다 (WO2008/153925, WO2008/153934, WO2008/153935). 놀랍게도, 우리는 완전이 상이한 효소, 즉 이소프렌 신타아제의 표면 상 아미노산 잔기를 돌연변이화하여, 이의 발현, 용해성 및 활성을 강화시킬 수 있다는 점을 발견했다. L70R 이 이러한 유익한 표면 돌연변이화의 예이다.
효소의 3차원 구조의 설명이 이의 표면 상 아미노산 잔기를 정확하게 동정하는데 본질적이다. 이소프렌 신타아제와 약 40% 동일한 서열을 갖는 구조를 이용하는 상동체 모델링 (예, 보르닐 신타아제 및 리모넨 신타아제, 이소프렌 신타아제와 가장흡사한 동일성을 갖는 공지된 구조의 효소임) 으로 모델링된 효소 구조의 전반적인 면을 나타낼 수 있으나, 표면-노출된 잔기를 정확하게 동정하고 이의 표면 노출정도를 수량화하기에는 불충분하다. 아미노산 잔기의 표면 노출은 이의 측쇄의 용매-접근가능 표면적 퍼센트로 정량된다.
하기의 이소프렌 신타아제 내 돌연변이 부류는, >50% 용매-노출, 바람직하게는 >65% 용매-노출, 및 가장 바람직하게는 >85% 용매-노출된 아미노산 잔기를 표적화함으로써 효소의 용해성을 개선할 수 있다:
소수성 → 양전하, 및 반대의 경우
소수성 → 음전하, 및 반대의 경우
소수성 → 중성의 극성, 및 반대의 경우
중성의 극성 → 양전하, 및 반대의 경우
중성의 극성 → 음전하, 및 반대의 경우
양전하 → 음전하, 및 반대의 경우
게다가, 이종 이소프렌 신타아제 핵산을 함유하는 세포에 의한 이소프렌 생성은, 이 세포에 의해 발현되는, 1-데옥시-D-자일룰로오즈-5-포스페이트 신타아제 (DXS) 폴리펩티드, 및/또는 이소펜테닐 디포스페이트 이소머라아제 (IDI) 폴리펩티드의 양을 증가시킴으로써 강화될 수 있다. 예를 들어, DXS 핵산 및/또는 IDI 핵산이 세포로 도입될 수 있다. DXS 핵산은 이종 핵산 또는 내인성 핵산의 복제 카피일 수 있다. 마찬가지로, IDI 핵산은 이종 핵산 또는 내인성 핵산의 복제 카피일 수 있다. 일부 구현예에서, DXS 및/또는 IDI 폴리펩티드의 양은, 내인성 DXS 및/또는 IDI 프로모터 또는 조절 영역을, DXS 및/또는 IDI 핵산의 더 큰 전사를 도모하는 기타 프로모터 및/또는 조절 영역으로 대체함으로써 증가된다. 일부 구현예에서, 세포는 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산 (예, 식물 이소프렌 신타아제 핵산) 및 이소프렌 신타아제 폴리펩티드를 인코딩하는 내인성 핵산의 복제 카피 양자 모두를 포함한다.
인코딩된 DXS 및 IDI 폴리펩티드는 이소프렌의 생합성을 위한 DXP 경로의 일부이다 (도 15). DXS 폴리펩티드는 피루베이트 및 D-글리세르알데히드-3-포스페이트를 1-데옥시-D-자일룰로오즈-5-포스페이트로 전환시킨다. 임의의 특정 이론에 얽매이도록 의도된 것은 아니나, DXS 폴리펩티드의 양을 증가시키는 것은 DXP 경로를 통한 탄소의 유동을 증가시켜 더 많은 이소프렌 생성을 도모한다고 여겨진다. IDI 폴리펩티드는 이소펜테닐 디포스페이트 (IPP) 및 디메틸알릴 디포스페이트 (DMAPP) 의 상호전환을 촉매작용한다. 임의의 특정 이론에 얽매이도록 의도된 것은 아니나, 세포 내 IDI 폴리펩티드의 양을 증가시키면, DMAPP 로 전환되고 차례로 이소프렌으로 전환되는, IPP 의 양을 증가시키는 것으로 여겨진다.
일부 구현예에서, 세포에서 MVA 폴리펩티드의 발현을 증가시킴으로써 이종 이소프렌 신타아제 핵산을 함유하는 세포에 의한 이소프렌의 생성이 늘어날 수 있다 (도 15). 예시적 MVA 경로 폴리펩티드에는, 하기의 폴리펩티드들 중 어느 것이든지 포함된다: 아세틸-CoA 아세틸트랜스퍼라아제 (AA-CoA 티올라아제) 폴리펩티드, 3-히드록시-3-메틸글루타릴-CoA 신타아제 (HMG-CoA 신타아제) 폴리펩티드, 3-히드록시-3-메틸글루타릴-CoA 리덕타아제 (HMG-CoA 리덕타아제) 폴리펩티드, 메발로네이트 키나아제 (MVK) 폴리펩티드, 포스포메발로네이트 키나아제 (PMK) 폴리펩티드, 디포스포메발로네이트 데카르복실라아제 (MVD) 폴리펩티드, IDI 폴리펩티드, 및 둘 이상의 MVA 경로 폴리펩티드의 활성을 갖는 폴리펩티드 (예, 융합 폴리펩티드). 예를 들면, 하나 이상의 MVA 경로 핵산이 세포내로 도입될 수 있다. 일부 구현예에서, 세포는 AA-CoA 티올라아제, HMG-CoA 신타아제, 및 HMG-CoA 리덕타아제 핵산을 포함하는 상부 (upper) MVA 경로를 포함한다. 일부 구현예에서, 세포는 MVK, PMK, MVD, 및 IDI 핵산을 포함하는 하부 (lower) MVA 경로를 포함한다. 일부 구현예에서, 세포는 AA-CoA 티올라아제, HMG-CoA 신타아제, HMG-CoA 리덕타아제, MVK, PMK, MVD, 및 IDI 핵산을 포함하는 전 MVA 경로를 포함한다. MVA 경로 핵산은 이종 핵산 또는 내인성 핵산의 복제 카피일 수 있다. 일부 구현예에서, 하나 이상의 MVA 경로 폴리펩티드의 양은 MVA 경로 핵산에 대한 내인성 프로모터 또는 조절 영역을, MVA 경로 핵산의 더 큰 전사를 도모하는 기타 프로모터 및/또는 조절 영역으로 대체하여 증가된다. 일부 구현예에서, 세포는 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산 (예, 식물 이소프렌 신타아제 핵산) 및 이소프렌 신타아제 폴리펩티드를 인코딩하는 내인성 핵산의 복제 카피 양자 모두를 포함한다.
일부 구현예에서, 상기 세포의 적어도 일부는, 연속 배양 (예컨대, 희석 없는 연속 배양) 에서 적어도 약 5, 10, 20, 50, 75, 100, 200, 300 회, 또는 이를 초과하는 회수의 세포 분열 동안 이종 이소프렌 신타아제, DXS, IDI, 및/또는 MVA 경로 핵산을 유지한다. 본 발명의 임의의 측면 중 일부 구현예에서, 이종 또는 내인성 이소프렌 신타아제의 복제 카피를 포함하는 핵산, DXS, IDI, 및/또는 MVA 경로 핵산은 또한 선별 마커, 예컨대 카나마이신, 암피실린, 카르베니실린, 겐타마이신, 하이그라마이신, 플레오마이신, 블레오마이신, 네오마이신 또는 클로람페니콜 항생제 내성 핵산을 포함한다.
I. 예시적 폴리펩티드 및 핵산
다양한 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드 및 핵산이 본 발명의 조성물 및 방법에 사용될 수 있다.
본원에서 사용되는 바와 같이, "폴리펩티드"는 폴리펩티드, 단백질, 펩티드, 폴리펩티드의 절편, 및 제 1 폴리펩티드의 일부 또는 전부 (예를 들어 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드) 및 제 2 폴리펩티드의 일부 또는 전부 (예를 들어 His-태그 (tag) 와 같은, 융합 폴리펩티드의 정제 또는 검출을 촉진하는 펩티드)를 포함하는 융합 폴리펩티드를 포함한다. 일부 구현예에서는, 융합 폴리펩티드는 둘 이상의 MVA 경로 폴리펩티드 (예, AA-CoA 티올라아제 및 HMG-CoA 환원효소 폴리펩티드)의 활성을 갖는다. 일부 구현예에서는, 폴리펩티드는 둘 이상의 MVA 경로 폴리펩티드의 활성을 갖는 자연 발생적 폴리펩티드 (예를 들어 엔테로코커스 패칼리스 mvaE 핵산에 의해 인코딩되는 폴리펩티드)이다.
각종 구현예에서, 폴리펩티드는 적어도 또는 약 50, 100, 150, 175, 200, 250, 300, 350, 400개 이상의 아미노산을 갖는다. 일부 구현예에서는, 폴리펩티드 절편은 전장 폴리펩티드로부터 적어도 또는 약 25, 50, 75, 100, 150, 200, 300개 이상의 연속 아미노산을 함유하며, 상응하는 전장 폴리펩티드의 활성의 적어도 또는 약 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 100%를 갖는다. 특정 구현예에서, 폴리펩티드는 임의 자연 발생적 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드의 전체 아미노산 서열 또는 분절을 포함한다. 일부 구현예에서는, 폴리펩티드는 야생형 이소프렌 신타아제의 서열 (즉, 자연 발생하는 서열), DXS, IDI 또는 MVA 경로 폴리펩티드와 비교하여 하나 이상의 돌연변이를 갖는다.
일부 구현예에서는, 폴리펩티드는 단리된 폴리펩티드이다. 본원에서 사용되는 바와 같이, "단리된 폴리펩티드"는 2, 5, 10, 20, 50개 이상의 상이한 폴리펩티드의 라이브러리와 같은 폴리펩티드의 라이브러리의 일부가 아니며, 자연적으로 발생하는 하나 이상의 성분으로부터 분리된다. 단리된 폴리펩티드는, 예를 들어 폴리펩티드를 인코딩하는 재조합 핵산의 발현에 의해 수득될 수 있다.
일부 구현예에서는, 폴리펩티드는 이종 폴리펩티드이다. "이종 폴리펩티드"는 동일한 숙주 세포에서 자연적으로 발현되는 또 다른 폴리펩티드의 서열과 아미노산 서열이 동일하지 않은 폴리펩티드를 의미한다.
본원에서 사용되는 바와 같이, "핵산"은 단일 또는 이중 가닥 형태인 둘 이상의 데옥시리보뉴클레오티드 및/또는 리보뉴클레오티드를 나타낸다. 일부 구현예에서는, 핵산은 재조합 핵산이다. "재조합 핵산"은 관심 핵산을 유도하는 유기체의 자연 발생적 게놈에서, 관심 핵산의 측면에 위치하는 하나 이상의 핵산 (예를 들어 유전자)이 없는 관심 핵산을 의미한다. 그러므로 상기 용어는 예를 들어 벡터, 자체 복제 플라스미드 또는 바이러스, 또는 원핵생물 또는 진핵생물의 게놈 DNA 내에 혼입되어 있거나, 또는 다른 서열과는 독립적인, 별개의 분자 (예를 들어 cDNA, 게놈 DNA 절편, 또는 PCR 또는 제한 엔도뉴클레아제 분쇄에 의해 생성되는 cDNA 절편) 로서 존재하는, 재조합 DNA를 포함한다.
각종 구현예에서 핵산은 재조합 핵산이다. 예를 들어, 일부 구현예에서, 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은, 또 다른 폴리펩티드의 전부 또는 일부를 인코딩하는 또 다른 핵산에 작동가능하게 연결되어, 재조합 핵산이 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드를 포함하는 융합 폴리펩티드, 및 또 다른 폴리펩티드 (예를 들어 His-태그와 같은, 융합 폴리펩티드의 정제 또는 검출을 촉진하는 펩티드) 의 전부 또는 일부를 인코딩한다. 일부 구현예에서는, 재조합 핵산의 일부 또는 전부가 화학적으로 합성된다. "이종 핵산"이란, 동일한 숙주 세포에서 핵산 서열이 자연적으로 발견되는 또 다른 핵산의 서열과 동일하지 않은 핵산을 의미한다.
특정 구현예에서는, 핵산은 임의의 자연 발생적 이소프렌 신타아제의 전체 핵산 서열 또는 분절, DXS, IDI 또는 MVA 경로 핵산을 포함한다. 일부 구현예에서는, 핵산은 자연 발생적 이소프렌 신타아제 핵산 DXS, IDI 또는 MVA 경로 핵산으로부터 적어도 또는 약 50, 100, 150, 200, 300, 400, 500, 600, 700, 800개 이상의 근접한 뉴클레오티드를 포함한다. 일부 구현예에서는, 핵산은 야생형 이소프렌 신타아제 서열 (즉, 자연 발생하는 서열), DXS, IDI 또는 MVA 경로 핵산과 비교하여 하나 이상의 돌연변이를 갖는다. 일부 구현예에서는, 핵산은 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산의 전사 또는 번역을 증가시키는 하나 이상의 돌연변이 (예를 들어 침묵 돌연변이)를 갖는다. 일부 구현예에서는, 핵산은 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드를 인코딩하는 임의 핵산의 축퇴성 변이체이다.
"코돈 축퇴성"은 인코딩된 폴리펩티드의 아미노산 서열에 영향을 주지 않고 뉴클레오티드 서열의 변이를 허용하는 유전적 코드에서의 분산 (divergence) 을 나타낸다. 숙련된 기술자는 주어진 아미노산을 구체화하기 위한 뉴클레오티드 코돈 사용 방식에서 특정 숙주 세포에 의해 나타나는 "코돈-바이어스 (codon-bias)"를 잘 인지한다. 그러므로, 숙주 세포 내의 개선된 발현을 위해 핵산을 합성하는 경우 핵산을 설계하기 위한 일부 구현예에서 코돈 이용의 빈도가 숙주 세포의 바람직한 코돈 이용의 빈도에 도달하는 것이 바람직하다.
예시적 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드 및 핵산의 기탁 번호를 U.S. 특허 제 61/013,574 의 부록 1 에 열거되어 있다 (특히 이소프렌 신타아제의 아미노산 핵산 서열, DXS, IDI 및/또는 MVA 경로 폴리펩티드 및 핵산과 관련해서, 상기 문헌의 전문이 본원에서 참고인용됨). Kegg 데이터베이스도 또한 수많은 예시적 이소프렌 신타아제의 아미노산 및 핵산 서열, DXS, IDI 및/또는 MVA 경로 폴리펩티드 및 핵산을 포함한다 (예를 들어 "www.genome.jp/kegg/pathway/map/map00100.html" 및 이 온라인에서의 서열들 참조; 이들 각각은 그 전체가 본원에서 참조 인용되며, 특히 이소프렌 신타아제의 아미노산 및 핵산 서열, DXS, IDI 및/또는 MVA 경로 폴리펩티드 및 핵산에 대해서 참조 인용되고 있음). 일부 구현예에서는, 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드 및/또는 핵산 중 하나 이상은 U.S. 특허 제 61/013,574 의 부록 1에서의 임의 기탁 번호 또는 상기 출원의 날짜로 Kegg 데이터베이스에 존재하는 임의 서열에 상응하는 임의의 서열과 같은, 2007년 12월 12일에 공식적으로 활용가능한 서열과 동일한 서열을 갖는다. 추가적인 예시적 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드 및 핵산은 하기에서 추가로 기재한다.
예시적 이소프렌
신타아제
폴리펩티드 및 핵산
상기 언급된 바와 같이, 이소프렌 신타아제 폴리펩티드는 디메틸알릴 디포스페이트 (DMAPP)를 이소프렌으로 전환시킨다. 예시적 이소프렌 신타아제 폴리펩티드는 이소프렌 신타아제 폴리펩티드의 하나 이상의 활성을 갖는, 폴리펩티드, 폴리펩티드의 절편, 펩티드, 및 융합 폴리펩티드를 포함한다. 문헌 [Silver 등., J. Biol. Chem. 270:13010-13016, 1995] 및 이 문헌 내 참조문헌 (각각 그 전문을 본원에서 참조인용함) 에서, 특히 이소프렌 신타아제 폴리펩티드 활성에 대한 검정과 관련하여 기술된 바와 같이, 세포 추출물 내 시험관 내, 또는 생체 내에서 DMAPP를 이소프렌으로 전환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법을 사용하여 폴리펩티드가 이소프렌 신타아제 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다. DMAPP (Sigma)를 질소 흐름 하에 건조되도록 증발시키고, 100 mM 인산 칼륨 버퍼 (pH 8.2) 중 100 mM의 농도로 재수화하고 -20℃에서 보관한다. 검정을 수행하기 위해, 5 ㎕의 1M MgCl2, 1 mM (250 ㎍/㎖) DMAPP, 65 ㎕의 식물 추출 버퍼 (PEB) (50 mM Tris-HCl, pH 8.0, 20 mM MgCl2, 5% 글리세롤 및 2 mM DTT)의 용액을 금속 나사 덮개 및 테플론 코팅된 규소 격막 (Agilent Technologies)을 갖는 20 ㎖ 상부공간 바이알 내의 25 ㎕의 세포 추출물에 첨가하고 37℃에서 15분 동안 진탕하면서 배양한다. 200 ㎕의 250 mM EDTA를 첨가하거나 또는 열 비활성화에 의해 반응을 켄칭하고, 이소프렌을 GC/MS로 정량한다.
예시적 이소프렌 신타아제 핵산은, 이소프렌 신타아제 폴리펩티드의 하나 이상의 활성을 갖는, 폴리펩티드, 폴리펩티드의 절편, 펩티드, 또는 융합 폴리펩티드를 인코딩하는 핵산을 포함한다. 예시적 이소프렌 신타아제 폴리펩티드 및 핵산은 본원에 기재된 임의의 공급원 유기체로부터의 자연 발생적 폴리펩티드 및 핵산 뿐 아니라 본원에 기재된 임의의 공급원 유기체에서 유래한 돌연변이체 폴리펩티드 및 핵산을 포함한다.
일부 구현예에서, 이소프렌 신타아제 폴리펩티드 또는 핵산은 콩과, 버드나무과 또는 참나무과로부터 유래된다. 일부 구현예에서, 이소프렌 신타아제 폴리펩티드 또는 핵산은 Pueraria montana (쿠주) 로부터 (Sharkey 등., Plant Physiology 137: 700-712, 2005), 포플러 (예컨대 Populus alba x tremula CAC35696) Miller 등., Planta 213: 483-487, 2001), 사시나무 (예컨대 Populus tremuloides) Silver 등., JBC 270(22): 13010-1316, 1995) 또는 영국 오크나무 (Quercus robur) (Zimmer 등., WO 98/02550) 의 자연-발생 폴리펩티드 또는 핵산인데, 상기 문헌 각각은 그 전문이, 특히 이소프렌 신타아제 핵산, 및 이소프렌 신타아제 폴리펩티드의 발현과 관련하여 본원에서 참조 인용되고 있다. 적합한 이소프렌 신타아제는, 이에 제한되는 것은 아니나, GenBank 기탁 번호 AY341431, AY316691, AY279379, AJ457070, 및 AY182241 (이들 각각은 그 전체가, 특히 이소프렌 신타아제 핵산 및 폴리펩티드의 서열과 관련하여 본원에서 참조인용됨) 에 의해 동정된 것이 포함된다. 일부 구현예에서, 이소프렌 신타아제 폴리펩티드 또는 핵산은 Quercus robur 로부터의 자연-발생적 폴리펩티드 또는 핵산이 아니다 (즉, 이소프렌 신타아제 폴리펩티드 또는 핵산은 Quercus robur 로부터의 자연-발생적 폴리펩티드 또는 핵산 이외의 이소프렌 신타아제 폴리펩티드 또는 핵산이다). 일부 구현예에서, 이소프렌 신타아제 핵산 또는 폴리펩티드는 포플러 (예컨대 Populus alba x tremula CAC35696) 로부터의 자연-발생적 폴리펩티드 또는 핵산이 아니다.
예시적
DXS
폴리펩티드 및 핵산
상기에 나타낸 바와 같이, 1-데옥시-D-자일룰로오즈-5-포스페이트 신타아제 (DXS) 폴리펩티드는 피루베이트 및 D-글리세르알데히드-3-포스페이트를 1-데옥시-D-자일룰로오즈-5-포스페이트로 전환한다. 예시적 DXS 폴리펩티드는, DXS 폴리펩티드의 하나 이상의 활성을 갖는, 폴리펩티드, 폴리펩티드의 절편, 펩티드, 및 융합 폴리펩티드를 포함한다. 세포 추출물 내에서 시험관내, 또는 생체내에서 피루베이트 및 D-글리세르알데히드-3-포스페이트를 1-데옥시-D-자일룰로오즈-5-포스페이트로 전환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (예, 본원에 기재된 것들)을 사용하여 폴리펩티드가 DXS 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다. 예시적 DXS 핵산은 DXS 폴리펩티드의 하나 이상의 활성을 갖는, 폴리펩티드, 폴리펩티드의 절편, 펩티드, 또는 융합 폴리펩티드를 인코딩하는 핵산을 포함한다. 예시적 DXS 폴리펩티드 및 핵산은 본원에 기재된 임의의 공급원 유기체로부터의 자연 발생적 폴리펩티드 및 핵산뿐 아니라 본원에 기재된 임의의 공급원 유기체에서 유래한 돌연변이체 폴리펩티드 및 핵산을 포함한다.
예시적
IDI
폴리펩티드 및 핵산
이소펜테닐 디포스페이트 이소머라아제 폴리펩티드 (이소펜테닐-디포스페이트 델타- 이소머라아제 또는 IDI)는 이소펜테닐 디포스페이트 (IPP) 및 디메틸알릴 디포스페이트 (DMAPP)의 상호전환 (예를 들어, IPP를 DMAPP로 전환시키고/시키거나 DMAPP를 IPP로 전환시킴)을 촉진한다. 예시적 IDI 폴리펩티드는 IDI 폴리펩티드의 하나 이상의 활성을 갖는, 폴리펩티드, 폴리펩티드의 절편, 펩티드, 및 융합 폴리펩티드를 포함한다. 세포 추출물 내에서 시험관내, 또는 생체내에서 IPP 및 DMAPP를 상호전환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (예, 본원에 기재된 것들)을 사용하여 폴리펩티드가 IDI 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다. 예시적 IDI 핵산은 IDI 폴리펩티드의 하나 이상의 활성을 갖는, 폴리펩티드, 폴리펩티드의 절편, 펩티드, 또는 융합 폴리펩티드를 인코딩하는 핵산을 포함한다. 예시적 IDI 폴리펩티드 및 핵산은 본원에 기재된 임의의 공급원 유기체로부터의 자연 발생적 폴리펩티드 및 핵산 뿐 아니라 본원에 기재된 임의의 공급원 유기체에서 유래한 돌연변이체 폴리펩티드 및 핵산을 포함한다.
예시적
MVA
경로 폴리펩티드 및 핵산
예시적 MVA 경로 폴리펩티드는 아세틸-CoA 아세틸트랜스퍼라아제 (AA-CoA 티올라아제) 폴리펩티드, 3-히드록시-3-메틸글루타릴-CoA 신타아제 (HMG-CoA 신타아제) 폴리펩티드, 3-히드록시-3-메틸글루타릴-CoA 리덕타아제 (HMG-CoA 리덕타아제) 폴리펩티드, 메발로네이트 키나아제 (MVK) 폴리펩티드, 포스포메발로네이트 키나아제 (PMK) 폴리펩티드, 디포스포메발로네이트 데카르복실라아제 (MVD) 폴리펩티드, IDI 폴리펩티드, 및 둘 이상의 MVA 경로 폴리펩티드의 활성을 갖는 폴리펩티드 (예를 들어 융합 폴리펩티드)를 포함한다. 특히, MVA 경로 폴리펩티드는 폴리펩티드, 폴리펩티드의 절편, 펩티드, 및 MVA 경로 폴리펩티드의 하나 이상의 활성을 갖는 융합 폴리펩티드를 포함한다. 예시적 MVA 경로 핵산은 MVA 경로 폴리펩티드의 하나 이상의 활성을 갖는 폴리펩티드, 폴리펩티드의 절편, 펩티드, 또는 융합 폴리펩티드를 인코딩하는 핵산을 포함한다. 예시적 MVA 경로 폴리펩티드 및 핵산은 본원에 기재된 임의의 공급원 유기체로부터의 자연 발생적 폴리펩티드 및 핵산 뿐 아니라 본원에 기재된 임의의 공급원 유기체에서 유래한 돌연변이체 폴리펩티드 및 핵산을 포함한다.
특히, 아세틸-CoA 아세틸트랜스퍼라아제 폴리펩티드 (AA-CoA 티올라아제 또는 AACT)는 두 분자의 아세틸-CoA를 아세토아세틸-CoA로 전환시킨다. 세포 추출물 내에서 시험관내, 또는 생체내에서 두 분자의 아세틸-CoA를 아세토아세틸-CoA로 전환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (예, 본원에 기재된 것들)을 사용하여 폴리펩티드가 AA-CoA 티올라아제 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다.
3-히드록시-3-메틸글루타릴-CoA 신타아제 (HMG-CoA 신타아제 또는 HMGS) 폴리펩티드는 아세토아세틸-CoA를 3-히드록시-3-메틸글루타릴-CoA로 전환시킨다. 세포 추출물 내에서 시험관내, 또는 생체내에서 아세토아세틸-CoA를 3-히드록시-3-메틸글루타릴-CoA로 전환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (예, 본원에 기재된 것들)을 사용하여 폴리펩티드가 HMG-CoA 신타아제 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다.
3-히드록시-3-메틸글루타릴-CoA 리덕타아제 (HMG-CoA 리덕타아제 또는 HMGR) 폴리펩티드는 3-히드록시-3-메틸글루타릴-CoA를 메발로네이트로 전환시킨다. 세포 추출물 내에서 시험관내, 또는 생체내에서 3-히드록시-3-메틸글루타릴-CoA를 메발로네이트로 전환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (예, 본원에 기재된 것들)을 사용하여 폴리펩티드가 HMG-CoA 리덕타아제 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다.
메발로네이트 키나아제 (MVK) 폴리펩티드는 메발로네이트를 인산화하여 메발로네이트-5-포스페이트를 형성시킨다. 세포 추출물 내에서 시험관내, 또는 생 체내에서 메발로네이트를 메발로네이트-5-포스페이트로 전환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (예, 본원에 기재된 것들)을 사용하여 폴리펩티드가 MVK 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다.
포스포메발로네이트 키나아제 (PMK) 폴리펩티드는 메발로네이트-5-포스페이트를 인산화하여 메발로네이트-5-디포스페이트를 형성시킨다. 세포 추출물 내에서 시험관내, 또는 생체내에서 메발로네이트-5-포스페이트를 메발로네이트-5-디포스페이트로 전환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (예, 본원에 기재된 것들)을 사용하여 폴리펩티드가 PMK 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다.
디포스포메발로네이트 데카르복실라아제 (MVD 또는 DPMDC) 폴리펩티드는 메발로네이트-5-디포스페이트를 이소펜테닐 디포스페이트 (IPP)로 전환시킨다. 세포 추출물 내에서 시험관내, 또는 생체내에서 메발로네이트-5-디포스페이트를 IPP로 전환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (예, 본원에 기재된 것들)을 사용하여 폴리펩티드가 MVD 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다.
핵산을
단리하기
위한 예시적 방법
이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산은 표준 방법을 사용하여 단리될 수 있다. 관심 공급원 유기체 (예를 들어 박테리아 게놈)으로부터 원하는 핵산을 수득하는 방법은 통상적인 것이며 분자 생물학계에 잘 알려져 있다 (예를 들어, WO 2004/033646 및 여기에서 인용된 참고문헌들 참조하는데, 이들 각각은 특히 관심 핵산의 단리에 대해 그 전문이 참고문헌으로 포함됨). 예를 들어, 핵산의 서열이 공지되어 있다면 (예를 들어 본원에 기재된 임의의 공지된 핵산), 제한 엔도뉴클레아제 분쇄에 의해 적합한 게놈 라이브러리가 생성될 수 있으며, 원하는 핵산 서열에 상보적인 프로브로 스크리닝될 수 있다. 서열이 단리되고 나면, 적절한 벡터를 사용하는 형질전환에 적합한 양의 DNA가 수득되도록 폴리머라아제 연쇄 반응 (PCR)과 같은 표준 프라이머 지정 증폭 방법을 사용하여 DNA를 증폭할 수 있다 (미국 특허 제 4,683,202 호; 특히 PCR 방법에 대해 그 전문이 참고문헌으로 포함됨). 대안적으로는, 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산 (예를 들어 공지된 핵산 서열을 갖는, 임의 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산)은 표준 방법을 사용하여 화학적으로 합성될 수 있다.
본원에서 기술된 조성물 및 방법에서 사용되기에 적합할 수 있는 추가적인 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드 및 핵산은 표준 방법을 이용해 동정될 수 있다. 예를 들어, 이소프렌을 자연적으로 생성하는 것으로 공지된 유기체의 염색체 DNA의 코스미드 (cosmid) 라이브러리는 대장균과 같은 유기체에서 구축된 후 이소프렌 생성에 대해 스크리닝될 수 있다. 이소프렌 신타아제, DXS, IDI, 및/또는 MVA 경로 핵산을 수득하는 추가 방법에는, 검정 (예컨대, 본원에 기술한 상부공간 검정) 또는 보존된 길이의 아미노산 (예를 들어 3 이상의 보존된 아미노산)을 인코딩하는 뉴클레오티드에 대해 지정된 프라이머를 사용하는 PCR에 의한 메타게놈 라이브러리 스크리닝을 포함한다. 보존된 아미노산은 공지된 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드의 아미노산 서열을 정렬함으로써 확인될 수 있다. 이소프렌 신타아제 폴리펩티드에 대한 보존된 아미노산은 공지된 이소프렌 신타아제 폴리펩티드의 정렬된 서열을 기초로 하여 확인될 수 있다. 이소프렌을 자연적으로 생성하는 것으로 발견된 유기체는 표준 단백질 정제 방법 (당업계에 익히 공지됨)에 적용될 수 있으며, 생성된 정제 폴리펩티드는 표준 방법을 사용하여 서열화될 수 있다. 다른 방법이 문헌에서 발견된다 (예를 들어, Julsing 등, Applied. Microbiol. Biotechnol. 75: 1377-84, 2007; Withers 등, Appl Environ Microbiol. 73(19):6277-83, 2007 참조; 특히 이 문헌 각각은 이소프렌의 합성에 관여하는 핵산의 동정에 대해서 그 전문이 참고문헌으로 포함됨).
추가적으로, 표준 서열 정렬 및/또는 구조 예측 프로그램을 사용하여, 제 1차 및/또는 예측된 폴리펩티드 제 2차 구조와 공지된 DXS, IDI, 또는 MVA 경로 폴리펩티드 및 핵산의 구조와의 유사성을 기초로 하여 추가적인 DXS, IDI, 또는 MVA 경로 폴리펩티드 및 핵산을 확인할 수 있다. swissprot-trembl 데이터베이스 ("www.expasy.org", Swiss Institute of Bioinformatics Swiss-Prot group CMU - 1 rue Michel Servet CH- 1211 Geneva 4, Switzerland)와 같은 표준 데이터베이스를 또한 사용하여 이소프렌 신타아제, DXS, IDI, 또는 MVA 경로 폴리펩티드 및 핵산을 동정할 수 있다. PredictProtein (Rost et al., The PredictProtein Server. Nucleic Acids Research 32(Web Server issue):W321-W326, 2004)과 같은 표준 구조 예측 프로그램의 디폴트 설정을 사용하여 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드의 제 2차 및/또는 제 3차 구조를 예측할 수 있다. 대안적으로, 표준 방법을 사용하여 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드의 실제적인 제 2차 및/또는 제 3차 구조가 측정될 수 있다. 공지된 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산으로부터 생성된 프로브에 대한 혼성화에 의해 추가적인 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산이 또한 동정될 수 있다.
예시적 프로모터 및 벡터
본원에 기재된 임의의 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 하나 이상의 벡터에 포함될 수 있다. 따라서, 본원에서 기재된, 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드 중 임의의 것을 인코딩하는 하나 이상의 핵산을 갖는 벡터를 나타낸다. 본원에서 사용되는 바와 같이, "벡터"는 숙주 세포에서 하나 이상의 관심 핵산을 전달하고 바람직하게는 발현시킬 수 있는 구축물을 의미한다. 벡터의 예에는 비제한적으로, 플라스미드, 바이러스 벡터, DNA 또는 RNA 발현 벡터, 코스미드 및 파지 벡터가 포함된다. 일부 구현예에서는, 벡터는 발현 조절 서열의 조절 하에 핵산을 함유한다.
본원에서 사용되는 바와 같이, "발현 조절 서열"은 관심 핵산의 전사를 지시하는 핵산 서열을 의미한다. 발현 조절 서열은 구성성 또는 유도성 프로모터와 같은 프로모터, 또는 인핸서일 수 있다. "유도성 프로모터"는 환경 또는 발달 조절 하에 활성인 프로모터이다. 발현 조절 서열은 전사될 핵산 분절에 작동가능하게 연결된다.
일부 구현예에서는, 벡터는 선별 마커를 포함한다. 용어 "선별 마커"는 도입된 핵산 또는 벡터를 포함하는 이들 숙주 세포의 선별을 용이하게 하는 숙주 세포에서 발현될 수 있는 핵산을 나타낸다. 선별가능한 마커의 예에는 비제한적으로, 항생제 내성 핵산 (예를 들어 카나마이신, 암피실린, 카르베니실린, 겐타마이신, 하이그로마이신, 플레오마이신, 블레오마이신, 네오마이신 또는 클로람페니콜) 및/또는 숙주 세포에 영양 이득과 같은 대사작용 이득을 부여하는 핵산이 포함된다. 일부 구현예에서는, 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 선별 마커 없이 세포의 염색체에 혼입된다.
적합한 벡터는 사용되는 숙주 세포와 호환 가능한 것들이다. 적합한 벡터는, 예를 들어 박테리아, 바이러스 (예를 들어 박테리오파지 T7 또는 M-13 유래 파지), 코스미드, 효모 또는 식물에서 유래할 수 있다. 이러한 벡터를 수득하고 사용하기 위한 프로토콜은 당업자에게 공지되어 있다 (예를 들어 Sambrook 등, Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor, 1989 참조; 특히 벡터의 사용에 대해 그 전문이 참고문헌으로 포함됨).
프로모터는 당업계에 익히 공지되어 있다. 숙주 세포에서 기능하는 임의의 프로모터는 숙주 세포 내의 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산의 발현에 사용될 수 있다. 다양한 숙주 세포에서 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산의 발현을 유발하는데 유용한 개시 조절 영역 또는 프로모터가 많이 존재하며 이는 당업자에게 익숙한 것이다 (예를 들어, WO 2004/033646 및 그의 참고문헌들 참조; 특히 관심 핵산의 발현을 위한 벡터에 대해 그 전문이 참고문헌으로 각각 포함됨). 비제한적으로 lac, trp, λPL, λPR, T7, tac, 및 trc (E. coli 내 발현에 유용함) 를 비롯한, 이들 핵산을 유발할 수 있는 사실상 임의의 프로모터가 본 발명에 적합하다.
일부 구현예에서는, 글루코오스 이소머라아제 프로모터가 사용된다 (예를 들어 미국 특허 제 7,132,527 호 및 그에 인용된 참고문헌들 참조; 특히 관심 폴리펩티드를 발현시키기 위한 플라스미드 시스템 및 프로모터에 대해 그 전문이 참고문헌으로 각각 포함됨). 보고된 글루코오스 이소머라아제 프로모터 돌연변이체는 글루코오스 이소머라아제 프로모터에 작동가능하게 연결된 핵산에 의해 인코딩되는 폴리펩티드의 발현 수준을 다양하게 하는데 사용될 수 있다 (미국 특허 제 7,132,527 호). 각종 구현예에서는 글루코오스 이소머라아제 프로모터가 저, 중 또는 고 카피 플라스미드 내에 포함된다 (미국 특허 제 7,132,527 호).
각종 구현예에서는 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산이 저 카피 플라스미드 (예를 들어, 세포 당 약 1 내지 약 4 카피로 유지되는 플라스미드), 중 카피 플라스미드 (예를 들어, 세포 당 약 10 내지 약 15 카피로 유지되는 플라스미드) 또는 고 카피 플라스미드 (예를 들어, 세포 당 약 50 이상의 카피로 유지되는 플라스미드) 내에 포함된다. 일부 구현예에서는, 이종 또는 가외 (extra) 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 T7 프로모터에 작동가능하게 연결된다. 일부 구현예에서는, T7 프로모터에 작동가능하게 연결되는 이종 또는 가외 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 중 또는 고 카피 플라스미드 내에 포함된다. 일부 구현예에서는, 이종 또는 가외 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 Trc 프로모터에 작동가능하게 연결된다. 일부 구현예에서는, Trc 프로모터에 작동가능하게 연결되는 이종 또는 가외 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 중 또는 고 카피 플라스미드 내에 포함된다. 일부 구현예에서는, 이종 또는 가외 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 Lac 프로모터에 작동가능하게 연결된다. 일부 구현예에서는, Lac 프로모터에 작동가능하게 연결되는 이종 또는 가외 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 저 카피 플라스미드 내에 포함된다. 일부 구현예에서는, 이종 또는 가외 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 내인성 에스케리키아, 판토에아 , 바실러스 , 야로위야 , 스트렙토마이세스 또는 트리코데르마 프로모터, 또는 내인성 알칼리 세린 프로테아제, 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 프로모터와 같은 내인성 프로모터에 작동가능하게 연결된다. 일부 구현예에서는, 내인성 프로모터에 작동가능하게 연결되는 이종 또는 가외 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 고 카피 플라스미드 내에 포함된다. 일부 구현예에서는, 벡터는 세포 내의 염색체에 혼입되지 않는 복제 플라스미드이다. 일부 구현예에서는, 벡터의 일부 또는 전부가 세포 내의 염색체에 혼입된다.
일부 구현예에서는, 발현 벡터는 또한 종결 서열을 포함한다. 종결 조절 영역은 또한 숙주 세포에 대해 천연적인 다양한 유전자에서 유래할 수 있다. 일부 구현예에서는, 종결 서열 및 프로모터 서열은 동일한 근원에서 유래한다. 또 다른 구현예에서는, 종결 서열은 숙주 세포에 대해 내인성이다.
일부 구현예에서는, 프로모터, 코딩 영역, 및 터미네이터는 모두 발현될 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산으로부터 기원한다. 일부 구현예에서는, 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산에 대한 코딩 영역은 발현 구축 프로모터 및 터미네이터 서열의 전사적 조절 하에 있도록 범용 발현 벡터에 삽입된다. 일부 구현예에서는, 유전자 또는 이의 부분은 강력한 cbh1 프로모터의 삽입된 하류이다.
이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 표준 기술을 사용하여 발현 벡터와 같은 벡터에 혼입될 수 있다 (Sambrook 등, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, 1982; 특히 적절한 DNA 서열의 스크리닝 및 벡터 구축에 대해 그 전문이 참고문헌으로 포함됨). 관심 핵산 (예를 들어 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산), 프로모터, 터미네이터 및 기타 서열을 포함하는 DNA 구축물을 라이게이션하고 이들을 적합한 벡터에 삽입하는 방법은 당업계에 익히 공지되어 있다. 예를 들어, 제한 효소는 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산 및 벡터를 절단하는데 사용될 수 있다. 이후, 절단된 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산, 및 절단된 벡터의 양립성 말단이 라이게이션될 수 있다. 일반적으로, 편리한 제한 부위에서의 라이게이션에 의해 연결이 일어난다. 이러한 부위가 존재하지 않는다면, 통상적인 실행에 따라 합성 올리고뉴클레오티드 링커를 사용한다 (Sambrook 등, Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor, 1989, 및 Bennett and Lasure, More Gene Manipulations in Fungi, Academic Press, San Diego, pp 70-76, 1991; 특히 올리고뉴클레오티드 링커에 대해 그 전문이 참고문헌으로 각각 포함됨). 추가적으로, 벡터는 공지된 재조합 기술을 사용하여 구축될 수 있다 (예를 들어, Invitrogen Life Technologies, Gateway Technology).
일부 구현예에서는, 자연 발생적 세포에서 현재 발견되는 것보다 훨씬 더 높은 수준으로 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산을 과발현시키는 것이 바람직할 수 있다. 이러한 결과는 이들 폴리펩티드를 인코딩하는 핵산을 멀티카피 플라스미드 내로 선택적으로 클로닝하거나 이들 핵산을 강력한 유도성 또는 구성성 프로모터 하에 둠으로써 성취될 수 있다. 바람직한 폴리펩티드를 과발현시키는 방법은 통상적이고 분자 생물학계에 익히 공지되어 있으며, 그 예를 [Sambrook 등, Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor, 1989] (특히 클로닝 기술에 대해 그 전문이 참고문헌으로 포함됨)에서 발견할 수 있다.
하기의 방책은 본 발명에 따른 유용한 추가적인 일반적 방법론의 설명을 포함한다: Kreigler, Gene Transfer and Expression; A Laboratory Manual, 1990; 및 Ausubel 등., Eds. Current Protocols in Molecular Biology, 1994 (이들 각각은 그 전문을, 특히 분자 생물학 및 클로닝 기술에 대해 본원에서 참조 인용됨).
예시적 공급원 유기체
이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산 (및 이의 인코딩된 폴리펩티드)는 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산을 자연적으로 함유하는 임의 유기체로부터 수득될 수 있다. 상기 나타낸 바와 같이, 이소프렌은 박테리아, 효모, 식물 및 동물과 같은 다양한 유기체에 의해 자연적으로 형성된다. 유기체는 이소프렌을 생성하기 위해 MVA 경로, DXP 경로, 또는 MVA 및 DXP 경로 모두를 포함한다 (도 15). 따라서 DXS 핵산은 예를 들어, DXP 경로를 포함하거나 MVA 및 DXP 경로를 모두 포함하는 임의 유기체로부터 수득될 수 있다. IDI 및 이소프렌 신타아제 핵산은 예를 들어, MVA 경로, DXP 경로, 또는 MVA 및 DXP 경로 모두를 포함하는 임의 유기체로부터 수득될 수 있다. MVA 경로 핵산은 예를 들어, MVA 경로를 포함하거나 MVA 및 DXP 경로를 모두 포함하는 임의의 유기체로부터 수득될 수 있다.
일부 구현예에서는, 이소프렌 신타아제의 핵산 서열, DXS, IDI 또는 MVA 경로 핵산 서열은 자연에서의 하기 임의의 유기체에 의해 생성되는 핵산의 서열과 동일하다. 일부 구현예에서는, 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드의 아미노산 서열은 자연에서의 하기 임의의 유기체에 의해 생성되는 폴리펩티드의 서열과 동일하다. 일부 구현예에서는, 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산 또는 폴리펩티드는 본원에서 기재된 임의 유기체에서 유래하는 돌연변이체 핵산 또는 폴리펩티드이다. 본원에서 사용되는 바와 같이, "~에서 유래하는"은 하나 이상의 돌연변이가 도입되는 핵산 또는 폴리펩티드의 공급원을 나타낸다. 예를 들어, "식물 폴리펩티드에서 유래하는" 폴리펩티드는 하나 이상의 돌연변이가 야생형 식물 폴리펩티드의 서열 (즉 자연적으로 발생하는 서열)에 도입되어 야기되는 관심 폴리펩티드를 나타낸다.
일부 구현예에서, 공급원 유기체는 박테리아, 예컨대 균주 에스케리키아 (Escherichia; 예, E. coli), 또는 균주 바실러스 (Bacillus ; 예, B. 서브틸리스) 이다.
본원에서 사용되는 바와 같이, "에스케리키아 속" 이란, E. coli (대장균), E. 아데카르복실라타 (E. adecarboxylata ), E. 알베르티이 (E. albertii ), E. 블라태 (E. blattae ), E. 페르구소닐 (E. fergusonii ), E. 헤르만니이 (E. hermannii ), E. 세네갈렌시스 (E. senegalensis ), 및 E. 불네리스 (E. vulneris ) 을 포함하나 이로 제한되는 것은 아닌 당업자에게 공지된 바와 같은 속 "에스케리키아" 내 모든 종을 포괄한다. 속 "에스케리키아" 는 그람-음성, 포자를 형성하지 않는, 조건 혐기성, 막대형 박테리아로 정의되며, 이는 엔테로박테리아세애 (Enterobacteriaceae) 과, 엔테로박테리아레스 ( Enterobacteriales ) 목, 감마 프로테오박테리아 ( Gamma Proteobacteria ) 강의 구성원으로서 분류된다.
본원에서 사용되는 바와 같이, "바실러스 속" 이란, B. 서브틸리스 (B. subtilis), B. 리체니포르미스 (B. licheniformis ), B. 렌투스 (B. lentus ), B. 브 레비스 (B. brevis ), B. 스테아로써모필루스 (B. stearothermophilus ), B. 알칼로필루스 (B. alkalophilus ), B. 아밀로리쿠에파시엔스 (B. amyloliquefaciens ), B. 클라우시 (B. clausii ), B. 할로두란스 (B. halodurans ), B. 메가테리움 (B. megaterium), B. 코아굴란스 (B. coagulans ), B. 써쿨란스 (B. circulans ), B. 라우투스 (B. lautus ) 및 B. 투링기엔시스 (B. thuringiensis )를 포함하나 이로 제한되는 것은 아닌 당업자에게 공지된 바와 같은 속 "바실러스" 내의 모든 종들을 포함한다. 바실러스 속이 분류학적 개편을 계속하여 거치고 있다는 것이 인지된다. 따라서, 속에는 현재 "지오바실러스 스테아로써모필루스 ( Geobacillus stearothermophilus)"로 명명되는 B. 스테아로써모필루스와 같은 유기체를 비제한적으로 포함하는 재분류된 종이 포함되는 것으로 의도된다. 산소의 존재 하에 내성 내생포자가 생성되는 것은 바실러스 속의 특징을 정의하는 것으로 고려되지만, 이러한 특징은 또한 최근 명명된 알리시클로바실러스 ( Alicyclobacillus ), 암 피바실러스 ( Amphibacillus ), 아뉴리니바실러스 ( Aneurinibacillus ), 아녹시바실러스 ( Anoxybacillus ), 브레비바실러스 ( Brevibacillus ), 필로바실러스 (Filobacillus), 그라실리바실러스 ( Gracilibacillus ), 할로바실러스 (Halobacillus), 파에니바실러스 ( Paenibacillus ), 살리바실러스 ( Salibacillus ), 써모바실러스 ( Thermobacillus ), 우레이바실러스 ( Ureibacillus ) 및 비르기바실러스 ( Virgibacillus )에 적용된다.
예시적 숙주 세포
다양한 숙주 세포가 사용되어 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드를 발현시키고 발명에 청구된 방법으로 이소프렌을 생성시킬 수 있다. 예시적 숙주 세포는 제목 "예시적 공급원 유기체" 하의 이전 부분에 열거된 임의의 유기체로부터의 세포를 포함한다. 숙주 세포는 자연적으로 이소프렌을 생성하는 세포 또는 자연적으로 이소프렌을 생성하지 않는 세포일 수 있다. 일부 구현예에서는, 숙주 세포는 DXP 경로를 사용하여 자연적으로 이소프렌을 생성하고, 이러한 경로를 사용하는 이소프렌의 생성이 강화되도록 이소프렌 신타아제, DXS 및/또는 IDI 핵산이 첨가된다. 일부 구현예에서는, 숙주 세포는 MVA 경로를 사용하여 자연적으로 이소프렌을 생성하고, 이러한 경로를 사용하는 이소프렌의 생성이 강화되도록 이소프렌 신타아제 및/또는 하나 이상의 MVA 경로 핵산이 첨가된다. 일부 구현예에서는, 숙주 세포는 DXP 경로를 사용하여 자연적으로 이소프렌을 생성하고, MVA 경로 뿐 아니라 DXP 경로의 일부 또는 전부를 사용하여 이소프렌이 생성되도록 하나 이상의 MVA 경로 핵산이 첨가된다. 일부 구현예에서는, 숙주 세포는 DXP 및 MVA 경로 모두를 사용하여 자연적으로 이소프렌을 생성하고, 이들 경로 중 하나 또는 둘 모두에 의한 이소프렌의 생성이 강화되도록 하나 이상의 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산이 첨가된다.
예시적 형질전환 방법
이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산 또는 이를 함유하는 벡터는 인코딩된 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드의 발현을 위한 표준 기술을 사용하여 숙주 세포 (예를 들어 박테리아 세포)에 삽입될 수 있다. DNA 구축물 또는 벡터를 숙주 세포에 도입하는 것은 형질전환, 전기천공, 핵 미량주사, 형질도입, 트랜스펙션 (예를 들어, 리포펙틴 매개 또는 DEAE-덱스트린 매개 트랜스펙션 또는 재조합 파지 바이러스를 사용하는 트랜스펙션), 인산칼슘 DNA 침전물로의 인큐베이션, DNA-코팅된 미세사출물로의 고속 충격 및 원형질체 융합과 같은 기술을 사용하여 수행될 수 있다. 일반적인 형질전환 기술은 당업계에 공지되어 있다 (예를 들어, Current Protocols in Molecular Biology (F. M. Ausubel 등. (eds) Chapter 9, 1987; Sambrook 등, Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor, 1989; 및 Campbell 등, Curr. Genet. 16:53-56, 1989 참조; 특히 형질전환 방법에 대해 그 전문이 참고문헌으로 각각 포함됨). 도입된 핵산은 염색체 DNA에 혼입되거나 염색체외 복제 서열로서 유지될 수 있다.
예시적 세포 배양 배지
본 발명은 또한 이소프렌을 생성하는 배양물 내의 세포 집단 또는 세포를 포함한다. "배양물 내의 세포"는 세포가 하나 이상의 세포 분열을 거치도록 하는 용액 (예를 들어 세포 배지) 내의 둘 이상의 세포를 의미한다. "배양물 내의 세포"에는 식물 조직으로 분화된 세포를 함유하는 살아있는 다세포성 식물의 일부인 식물 세포가 포함되지 않는다. 각종 구현예에서, 세포 배양물에는 적어도 또는 약 10, 20, 50, 100, 200, 500, 1,000, 5,000, 10,000개 이상의 세포가 포함된다.
임의의 탄소원이 숙주 세포를 배양하는데 사용될 수 있다. 용어 "탄소원"은 숙주 세포 또는 유기체에 의해 신진 대사될 수 있는 하나 이상의 탄소-함유 화합물을 나타낸다. 예를 들어, 숙주 세포를 배양하는데 사용되는 세포 배지는 숙주 세포의 생존성 또는 성장을 유지시키기에 적합한 임의의 탄소원을 포함할 수 있다.
일부 구현예에서는, 탄소원은 탄수화물 (예를 들어 단당류, 이당류, 올리고당류 또는 다당류), 반전당 (예를 들어 효소적으로 처리된 수크로오스 시럽), 글리세롤, 글리세린 (예를 들어 바이오디젤 또는 비누-제조 공정의 글리세린 부산물), 디히드록시아세톤, 1-탄소원, 지방산 (예를 들어 포화 지방산, 불포화 지방산 또는 다중불포화 지방산), 지질, 인지질, 글리세롤지질, 모노글리세리드, 디글리세리드, 트리글리세리드, 폴리펩티드 (예를 들어 미생물 또는 식물 단백질 또는 펩티드), 재생가능 탄소원 (예를 들어 가수분해된 바이오매스 탄소원과 같은 바이오매스 탄소원), 효모 추출물, 효모 추출물로부터의 성분, 중합체, 산, 알코올, 알데히드, 케톤, 아미노산, 숙시네이트, 락테이트, 아세테이트, 에탄올 또는 전술한 것 중 둘 이상의 임의 조합이다. 일부 구현예에서는, 탄소원은 비제한적으로 글루코오스를 포함하는 광합성의 산물이다.
예시적 단당류는 글루코오스 및 프룩토오스를 포함한다; 예시적 올리고당류는 락토오스 및 수크로오스를 포함하고, 예시적 다당류는 녹말 및 셀룰로오스를 포함한다. 예시적 탄수화물은 C6 당 (예를 들어 프룩토오스, 만노오스, 갈락토오스 또는 글루코오스) 및 C5 당 (예를 들어 자일로오스 또는 아라비노오스)을 포함한다. 일부 구현예에서는, 세포 배지는 탄수화물 뿐 아니라 탄수화물 외의 탄소원 (예를 들어 글리세롤, 글리세린, 디히드록시아세톤, 1-탄소원, 지방산, 지질, 인지질, 글리세롤지질, 모노글리세리드, 디글리세리드, 트리글리세리드, 재생가능 탄소원, 또는 효모 추출물로부터의 성분)을 포함한다. 일부 구현예에서는, 세포 배지는 탄수화물 뿐 아니라 폴리펩티드 (예를 들어 미생물 또는 식물 단백질 또는 펩티드)를 포함한다. 일부 구현예에서는, 미생물 폴리펩티드는 효모 또는 박테리아로부터의 폴리펩티드이다. 일부 구현예에서는, 식물 폴리펩티드는 콩, 옥수수, 카놀라, 자트로파, 야자, 땅콩, 해바라기, 코코넛, 겨자, 평지씨, 목화씨, 야자 핵, 올리브, 잇꽃, 참깨 또는 아마인으로부터의 폴리펩티드이다.
일부 구현예에서는, 탄수화물의 농도는 적어도 또는 약 10, 15, 20, 30, 40, 50, 60, 80, 100, 150, 200, 300, 400 g/L 이상과 같은 브로쓰 (broth) ℓ 당 적어도 또는 약 5 g 이상이다 (g/L, 브로쓰의 부피에는 세포 배지의 부피 및 세포의 부피가 모두 포함됨). 일부 구현예에서는, 탄수화물의 농도는 약 50 내지 약 400 g/L, 예를 들어 약 100 내지 약 360 g/L, 약 120 내지 약 360 g/L, 또는 약 200 내지 약 300 g/L이다. 일부 구현예에서는, 탄수화물의 농도는 숙주 세포의 배양 전 및/또는 배양 동안에 첨가되는 탄수화물 총량을 포함한다.
예시적 지질은 포화, 불포화 또는 분지된 C4 및 초과의 지방산인 하나 이상의 지방산을 함유하는 임의의 물질이다.
예시적 지방산은 "R"이 탄화수소인 화학식 RCOOH의 화합물을 포함한다. 예시적 불포화 지방산은 "R"이 하나 이상의 탄소-탄소 이중 결합을 포함하는 화합물을 포함한다. 예시적 불포화 지방산은 비제한적으로, 올레산, 박센산, 리놀렌산, 팔미텔라이딘산 및 아라키돈산을 포함한다. 예시적 다중불포화 지방산은 "R"이 다수의 탄소-탄소 이중 결합을 포함하는 화합물을 포함한다. 예시적 포화 지방산은 "R"이 포화 지방족기인 화합물을 포함한다. 일부 구현예에서는, 탄소원은 하나 이상의 C12-C22 지방산, 예를 들어 C12 포화 지방산, C14 포화 지방산, C16 포화 지방산, C18 포화 지방산, C20 포화 지방산 또는 C22 포화 지방산을 포함한다. 예시적 구현예에서는 지방산이 팔미트산이다. 일부 구현예에서는, 탄소원은 지방산 (예를 들어 불포화 지방산)의 염, 지방산 (예를 들어 불포화 지방산)의 유도체 또는 지방산 (예를 들어 불포화 지방산)의 유도체의 염이다. 적합한 염은 비제한적으로 리튬 염, 칼륨 염, 나트륨 염 등을 포함한다. 디- 및 트리글리세롤은 글리세롤의 지방산 에스테르이다.
일부 구현예에서는, 지질, 지방산, 모노글리세리드, 디글리세리드 또는 트리글리세리드의 농도는 적어도 또는 약 5, 10, 15, 20, 30, 40, 50, 60, 80, 100, 150, 200, 300, 400 g/L 이상과 같은 브로쓰 ℓ 당 적어도 또는 약 1 g (g/L, 브로쓰의 부피에는 세포 배지의 부피 및 세포의 부피가 모두 포함됨)이다. 일부 구현예에서는, 지질, 지방산, 모노글리세리드, 디글리세리드 또는 트리글리세리드의 농도는 약 10 내지 약 400 g/L, 예를 들어 약 25 내지 약 300 g/L, 약 60 내지 약 180 g/L, 또는 약 75 내지 약 150 g/L이다. 일부 구현예에서는, 농도는 숙주 세포 배양 전 및/또는 배양 동안 첨가되는 지질, 지방산, 모노글리세리드, 디글리세리드 또는 트리글리세리드 총량을 포함한다. 일부 구현예에서는, 탄소원은 (i) 지질, 지방산, 모노글리세리드, 디글리세리드 또는 트리글리세리드 및 (ii) 글루코오스와 같은 탄수화물을 모두 포함한다. 일부 구현예에서는, 지질, 지방산, 모노글리세리드, 디글리세리드 또는 트리글리세리드 대 탄수화물의 비율은 탄소 기준으로 약 1:1이다 (즉, 탄수화물 탄소 당 지질, 지방산, 모노글리세리드, 디글리세리드 또는 트리글리세리드 내의 하나의 탄소). 특정 구현예에서, 지질, 지방산, 모노글리세리드, 디글리세리드 또는 트리글리세리드의 양은 약 60 내지 180 g/L이고, 탄수화물의 양은 약 120 내지 360 g/L이다.
예시적 미생물 폴리펩티드 탄소원은 효모 또는 박테리아로부터의 하나 이상의 폴리펩티드를 포함한다. 예시적 식물 폴리펩티드 탄소원은 콩, 옥수수, 카놀라, 자트로파, 야자, 땅콩, 해바라기, 코코넛, 겨자, 평지씨, 목화씨, 야자 핵, 올리브, 잇꽃, 참깨 또는 아마인으로부터의 하나 이상의 폴리펩티드를 포함한다.
예시적 재생가능 탄소원은 치즈 유장 투과물, 옥수수 침지수, 사탕무 당밀, 보리 맥아, 및 전술한 임의의 것으로부터의 성분을 포함한다. 예시적 재생가능 탄소원은 또한 옥수수, 지팽이풀 (switchgrass), 사탕수수, 발효 공정의 세포 폐기물, 및 콩, 옥수수 또는 밀의 제분으로부터의 단백질 부산물과 같은 바이오매스 내에 존재하는 아세테이트, 글루코오스, 헥소오스, 펜토오스 및 자일로오스를 포함한다. 일부 구현예에서는, 바이오매스 탄소원은 비제한적으로 풀, 밀, 밀짚, 바가스, 사탕수수 바가스, 침엽수 펄프, 옥수수, 옥수수 속대 또는 껍질 (husk), 옥수수 핵 (corn kernel), 옥수수 핵으로부터의 섬유, 옥수수대, 지팽이풀, 벼 외피 산물, 또는 곡물 (예를 들어 옥수수, 수수, 호밀, 트리티케이트 (triticate), 보리, 밀, 및/또는 증류 곡물)의 습식 또는 건식 제분으로부터의 부산물과 같은 리그노셀룰로오스, 헤미셀룰로오스 또는 셀룰로오스 물질이다. 예시적 셀룰로오스 물질은 목재, 종이 및 펄프 폐기물, 초본 식물 및 과일 펄프를 포함한다. 일부 구현예에서는, 탄소원은 줄기, 낟알, 뿌리 또는 덩이줄기와 같은 임의 식물 부분을 포함한다. 일부 구현예에서는, 임의의 하기 식물의 전부 또는 일부가 탄소원으로서 사용된다: 옥수수, 밀, 호밀, 수수, 트리티테케이트, 쌀, 기장, 보리, 카사바, 콩, 완두와 같은 콩류, 감자, 고구마, 바나나, 사탕수수 및/또는 타피오카. 일부 구현예에서는, 탄소원은 자일로오스 및 글루코오스를 모두 포함하거나 수크로오스 및 글루코오스를 모두 포함하는 바이오매스 가수분해물과 같은 바이오매스 가수분해물이다.
일부 구현예에서는, 재생가능 탄소원 (예를 들어 바이오매스)은 세포 배양 배지에 첨가되기 전 사전처리된다. 일부 구현예에서는, 사전처리는 효소적 사전처리, 화학적 사전처리 또는 효소적 및 화학적 사전처리 모두의 조합을 포함한다 (예를 들어 Farzaneh 등, Bioresource Technology 96 (18): 2014-2018, 2005; 미국 특허 제 6,176,176 호; 미국 특허 제 6,106,888 호; 특히 재생가능 탄소원의 사전처리에 대해 그 전문이 참고문헌으로 각각 포함됨). 일부 구현예에서는, 재생가능 탄소원은 세포 배양 배지에 첨가되기 전 부분적으로 또는 완전히 가수분해된다.
일부 구현예에서는, 재생가능 탄소원 (예를 들어 옥수수대)은 세포 배양 배지에 첨가되기 전 암모니아 섬유 팽창 (AFEX) 사전처리를 거친다 (예를 들어 Farzaneh 등, Bioresource Technology 96 (18): 2014-2018, 2005). AFEX 사전처리 동안, 재생가능 탄소원은 온건한 온도 (예를 들어 약 60 내지 약 100℃) 및 고압 (예를 들어 약 250 내지 약 300 psi)에서 약 5분 동안 액체 무수 암모니아로 처리된다. 이후, 압력을 빠르게 해제시킨다. 이러한 방법에서, 리그닌 용해화, 헤미셀룰로오스 가수분해, 셀룰로오스 탈결정화 및 증가된 표면적의 조합된 화학적 및 물리적 효과는 셀룰로오스 및 헤미셀룰로오스가 발효가능 당으로 거의 완전하게 효소적으로 전환되게 한다. AFEX 사전처리는 거의 모든 암모니아가 회수되고 재사용될 수 있는 한편, 하류 방법에서 미생물에 대한 질소원으로서 역할하는 것으로 남아있다는 이점을 갖는다. 또한, 세정 흐름은 AFEX 사전처리에 필요하지 않다. 따라서, AFEX 처리 이후 건조 물질 회수는 본질적으로 100%이다. AFEX는 기본적으로 건조 대 건조 방법이다. 처리된 재생가능 탄소원은 장기간에 적합하며, 효소적 가수분해 또는 발효 방법에서 매우 높은 고체 적재로 공급될 수 있다. 셀룰로오스 및 헤미셀룰로오스는 분해가 없거나 거의 없이 AFEX 방법에서 잘 보존된다. AFEX 사전처리를 거친 재생가능 탄소원의 효소적 가수분해 전에 중화할 필요는 없다. AFEX-처리된 탄소원의 효소적 가수분해는 후속 발효 사용을 위한 깨끗한 당 흐름을 만들어낸다.
일부 구현예에서는, 탄소원 (예를 들어 재생가능 탄소원)의 농도는 적어도 또는 약 0.1, 0.5, 1, 1.5, 2, 3, 4, 5, 10, 15, 20, 30, 40 또는 50% 글루코오스 (w/v)와 동등하다. 탄소원으로부터 생성된 글루코오스의 양을 측정하기 위해 참조로서 글루코오스를 사용하는 표준 HPLC 방법을 사용하여 동량의 글루코오스를 측정할 수 있다. 일부 구현예에서는, 탄소원 (예를 들어 재생가능 탄소원)의 농도는 약 0.1 내지 약 20% 글루코오스, 예를 들어 약 0.1 내지 약 10% 글루코오스, 약 0.5 내지 약 10% 글루코오스, 약 1 내지 약 10% 글루코오스, 약 1 내지 약 5% 글루코오스, 또는 약 1 내지 약 2% 글루코오스와 동등하다.
일부 구현예에서는, 탄소원은 효모 추출물 또는 효모 추출물의 하나 이상의 성분을 포함한다. 일부 구현예에서는, 효모 추출물의 농도는 적어도 또는 약 5, 10, 15, 20, 30, 40, 50, 60, 80, 100, 150, 200, 300 g/L 이상과 같은 브로쓰의 ℓ 당 효모 추출물 1 g 이상 (g/L, 브로쓰의 부피에는 세포 배지의 부피 및 세포의 부피가 모두 포함됨)이다. 일부 구현예에서는, 효모 추출물의 농도는 약 1 내지 약 300 g/L, 예를 들어 약 1 내지 약 200 g/L, 약 5 내지 약 200 g/L, 약 5 내지 약 100 g/L, 또는 약 5 내지 약 60 g/L이다. 일부 구현예에서는, 농도는 숙주 세포의 배양 전 및/또는 배양 동안에 첨가되는 효모 추출물 총량을 포함한다. 일부 구현예에서는, 탄소원은 효모 추출물 (또는 이의 하나 이상의 성분) 및 글루코오스와 같은 또 다른 탄소원을 모두 포함한다. 일부 구현예에서는, 효모 추출물 대 다른 탄소원의 비율은 약 1:5, 약 1:10 또는 약 1:20 (w/w)이다.
추가적으로 탄소원은 또한 이산화탄소 또는 메탄올과 같은 1-탄소원 기질일 수 있다. 단일 탄소원 (예를 들어 메탄올, 포름알데히드 또는 포르메이트)로부터 글리세롤을 생성하는 것은 메탄올자화 (methylotrophic) 효모 (Yamada 등, Agric. Biol. Chem., 53(2) 541-543, 1989; 특히 탄소원에 대해 그 전문이 참고문헌으로 포함됨) 및 박테리아 (Hunter 등, Biochemistry, 24, 4148-4155, 1985; 특히 탄소원에 대해 그 전문이 참고문헌으로 포함됨)에서 보고된 바 있다. 이들 유기체는 메탄에서 포르메이트로의 산화 상태 범위에 있는 단일 탄소 화합물을 동화시키고 글리세롤을 생성시킬 수 있다. 탄소 동화의 경로는 리불로오스 모노포스페이트, 세린, 또는 자일룰로오즈-모노포스페이트를 통한 것일 수 있다 (Gottschalk, Bacterial Metabolism, Second Edition, Springer-Verlag: New York, 1986; 특히 탄소원에 대해 그 전문이 참고문헌으로 포함됨). 리불로오스 모노포스페이트 경로는 포르메이트와 리불로오스-5-포스페이트와의 축합으로 6개 탄소 당이 형성되어 이것이 프룩토오스가 되고 마침내 3탄소 산물 글리세르알데히드-3-포스페이트가 되는 것을 포함한다. 마찬가지로, 세린 경로는 메틸렌테트라하이드로폴레이트를 통해 1-탄소 화합물을 당분해 경로에 동화시킨다.
1 또는 2개의 탄소 기질에 추가로, 메탄올자화 유기체는 메틸아민, 글루코사민 및 대사작용 활성을 위한 다양한 아미노산과 같은 화합물을 함유하는 많은 다른 탄소를 이용하는 것으로 또한 알려져 있다. 예를 들어, 메탄올자화 효모는 메틸아민으로부터의 탄소를 이용하여 트레할로오스 또는 글리세롤을 형성시키는 것으로 알려져 있다 (Bellion 등, Microb. Growth Cl Compd, [Int. Symp.], 7th ed., 415-32. Editors: Murrell 등, Publisher: Intercept, Andover, UK, 1993; 특히 탄소원에 대해 그 전문이 참고문헌으로 포함됨). 유사하게, 다양한 칸디다 종은 알라닌 또는 올레산을 신진 대사시킨다 (Suiter 등, Arch. Microbiol. 153(5), 485-9, 1990; 특히 탄소원에 대해 그 전문이 참고문헌으로 포함됨).
일부 구현예에서는, 세포는 생리적 염 및 영양을 함유하는 표준 배지에서 배양된다 (예를 들어 [Pourquie, J. 등, Biochemistry and Genetics of Cellulose Degradation, eds. Aubert 등, Academic Press, pp. 71-86, 1988] 및 [Ilmen 등, Appl. Environ. Microbiol. 63: 1298-1306, 1997]; 특히 세포 배지에 대해 그 전문이 참고문헌으로 각각 포함됨). 예시적 성장 배지는 루리아 베르타니 (Luria Bertani, LB) 브로쓰, 사브로 덱스트로오스 (Sabouraud Dextrose, SD) 브로쓰, 또는 효모 배지 (Yeast medium, YM) 브로쓰와 같은 상업적으로 제조된 통상적 배지이다. 다른 한정 또는 합성 성장 배지가 또한 사용될 수 있고, 특정 숙주 세포의 성장을 위한 적절한 배지는 미생물 또는 발효 과학계의 당업자에게 알려져 있다.
적절한 탄소원에 추가로, 세포 배지는 바람직하게는 적합한 미네랄, 염, 공동 인자, 버퍼, 및 배양물의 성장 또는 이소프렌 생성의 증진에 적합한 당업자에게 알려져 있는 기타 성분을 함유한다 (예를 들어 WO 2004/033646 및 그에 인용된 참고문헌, 및 WO 96/35796 및 그에 인용된 참고문헌; 특히 세포 배지 및 세포 배양 조건에 대해 그 전문이 참고문헌으로 각각 포함됨). 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산이 유도성 프로모터의 조절 하에 있는 일부 구현예에서는 유도제 (예를 들어 당, 금속 염 또는 살균제)를 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드의 발현을 유도하기에 효과적인 농도로 배지에 첨가하는 것이 바람직하다. 일부 구현예에서는, 세포 배지는 하나 이상의 DXS, IDI 또는 MVA 경로 핵산을 갖는 벡터 상의 항생제 내성 핵산 (예를 들어 카나마이신 내성 핵산)에 상응하는 항생제 (예를 들어 카나마이신)를 갖는다.
이소프렌의 예시적 생성
일부 구현예에서, 세포는 이 세포에 의한 이소프렌 생성을 허용하는 조건 하 배양 배지에서 배양된다. 일부 구현예에서, 배지 내 세포는, 1, 10, 25, 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1,000, 1,250, 1,500, 1,750, 2,000, 2,500, 3,000, 4,000, 5,000 이상의 정도 또는 이를 초과하는 이소프렌 nmole/세포의 습식 중량에 대한 세포 g/시간 (nmol/gwcm/hr) 으로 이소프렌을 생성한다. 일부 구현예에서, 이소프렌의 양은 약 2 내지 약 5,000 nmole/gwcm/hr, 예컨대 약 2 내지 약 100 nmole/gwcm/hr, 약 100 내지 약 500 nmole/gwcm/hr, 약 150 내지 약 500 nmole/gwcm /hr, 약 500 내지 약 1,000 nmole/gwcm/hr, 약 1,000 내지 약 2,000 nmole/gwcm/hr, 또는 약 2,000 내지 약 5,000 nmole/gwcm/hr 이다. nmole/gwcm/hr 단위의 이소프렌 양은, 그 전문, 특히 이소프렌 생성 측정에 있어서 본원에서 참조 인용되고 있는 U.S. 특허 제 5,849, 970 호 에 개시된 바와 같이 측정될 수 있다. 예를 들어, 2 ㎖의 상부공간 (예를 들어, 밀봉된 바이알에서 32℃에서 200 rpm에서 진탕하면서 약 3시간 동안 배양된 2 ㎖의 배양물과 같은 배양물로부터의 상부공간)은, n-옥탄/포라실 C 컬럼 (Alltech Associates, Inc., Deerfield, IL)을 가지며 RGD2 산화수은 환원 기체 검출기 (Trace Analytical, Menlo Park, CA)와 결합된 등온선상 (85℃) 작동 시스템과 같은 표준 기체 크로마토그래피 시스템을 사용하여 이소프렌에 대해 분석된다 (예를 들어 Greenberg 등, Atmos. Environ. 27A: 2689-2692, 1993; Silver 등, Plant Physiol. 97:1588-1591, 1991 참조; 그 전문, 특히 이소프렌 생성의 측정에 대해 참고문헌으로 각각 포함됨). 기체 크로마토그래피 영역 단위는 표준 이소프렌 농도 보정 곡선을 통해 nmol 이소프렌으로 전환된다. 일부 구현예에서는, 세포의 습식 중량에 대한 세포의 g 에 대한 값은 세포 배양물의 샘플에 대한 A600 값을 수득한 후, 공지된 A600 값을 갖는 세포 배양물에 대한 습식 중량의 보정 곡선을 기준으로 하여 상기 A600 값을 세포의 g으로 전환함으로써 계산된다. 일부 구현예에서는, 세포의 g은 1의 A600 값을 갖는 1 ℓ의 브로쓰 (세포 배지 및 세포를 포함)가 1 g의 습식 세포 중량을 갖는다고 가정함으로써 추정된다. 상기 값은 또한 인큐베이션된 배양물의 시간 수 (예를 들어 3시간)로 나누어진다.
일부 구현예에서, 배양물 내 세포는 1, 10, 25, 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1,000, 1,250, 1,500, 1,750, 2,000, 2,500, 3,000, 4,000, 5,000, 10,000, 100,000 이상의 정도 또는 이를 초과하는 ng 의 이소프렌/세포의 습식 중량에 대한 세포의 g/시간 (ng/gwcm/hr)으로 이소프렌을 생성한다. 일부 구현예에서, 이소프렌의 양은, 약 2 내지 약 5,000 ng/gwcm/h, 예컨대 약 2 내지 약 100 ng/gwcm/h, 약 100 내지 약 500 ng/gwcm/h, 약 500 내지 약 1,000 ng/gwcm/h, 약 1,000 내지 약 2,000 ng/gwcm/h, 또는 약 2,000 내지 약 5,000 ng/gwcm/h 이다. ng/gwcm/hr으로의 이소프렌 양은 상기 토의된 nmol/gwcm/시간 단위에서의 이소프렌 생성에 대한 값을 68.1로 곱하여 계산될 수 있다 (하기 방정식 5에서 기재된 바와 같음).
일부 구현예에서, 배양물 내 세포는 1, 10, 25, 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1,000, 1,250, 1,500, 1,750, 2,000, 2,500, 3,000, 4,000, 5,000, 10,000, 50,000, 100,000 이상의 정도로 또는 이를 초과하는 mg 의 이소프렌/L 의 브로쓰 (mg/L브로쓰, 이때, 브로쓰의 부피에는 세포 및 세포 배지의 부피가 포함됨) 으로 누적 역가 (총량) 의 이소프렌을 생성한다. 일부 구현예에서, 이소프렌의 양은, 약 2 내지 약 5,000 mg/L브로쓰, 예컨대 약 2 내지 약 100 mg/L브로쓰, 약 100 내지 약 500 mg/L브로쓰, 약 500 내지 약 1,000 mg/L브로쓰, 약 1,000 내지 약 2,000 mg/L브로쓰, 또는 약 2,000 내지 약 5,000 mg/L브로쓰 이다. 진탕 플라스크 또는 유사한 배양물로부터의 이소프렌 mg/상부공간 L로의 이소프렌의 특이적 생산성은 약 1.0의 OD600 값의 세포 배양물로부터 1 ㎖ 샘플을 취하고 이를 20 ml 바이알에 넣고, 30분 동안 인큐베이션한 후 상부공간 내의 이소프렌의 양을 측정함으로써 측정될 수 있다. OD600 값이 1.0이 아니라면, OD600 값으로 나누어 1.0의 OD600 값에 대해 측정을 정규화시킬 수 있다. 이소프렌 mg/상부공간 L의 값은 38 배만큼 곱하여 배양물 브로쓰의 mg/L브로쓰/시간/OD600으로 전환될 수 있다. mg/L브로쓰/시간/OD600 단위의 값을 시간 수 및 OD600 값으로 곱하여 이소프렌 mg/브로쓰 L 단위의 누적 역가를 수득할 수 있다.
발효기 내 mg/L브로쓰/hr 로 표기되는 예시의 이소프렌 생산 속도는, 발효기 배출 기체의 샘플을 취하고, 이소프렌의 양에 대해 이를 분석하고 (L기체 당 이소프렌 mg 과 같은 단위로 함), 상기 값을 배출 기체가 브로쓰 각각의 ℓ를 통해 지나가는 속도 (예를 들어, 1 vvm (공기 부피/브로쓰 부피/분) 에서 이는 시간 당 60 L기체임)로 곱하여 측정될 수 있다. 따라서, 1 mg/L기체의 배출 기체 수준은 1 vvm의 공기 흐름에서 60 mg/L브로쓰/시간의 순간 생성 속도에 상응한다. 필요하다면, mg/L브로쓰/시간 단위의 값을 OD600 값으로 나누어 mg/L브로쓰/시간/OD 단위의 특이적 속도를 수득할 수 있다. 이소프렌 mg/L기체의 평균 값은 상기 평균 배출 기체 이소프렌 농도에 발효 동안의 발효 브로쓰의 ℓ 당 살포된 배출 기체의 총량을 곱하여 총 생성물 생산성 (발효 브로쓰 ℓ 당 이소프렌 g, mg/L브로쓰)으로 전환될 수 있다. 따라서, 1 vvm에서 10시간에 걸친 0.5 mg/L브로쓰/시간의 평균 배출 기체 이소프렌 농도는 300 mg 이소프렌/L브로쓰의 총 생성물 농도에 상응한다.
일부 구현예에서, 배양물 내 세포는 0.0015, 0.002, 0.005, 0.01, 0.02, 0.05, 0.1, 0.12, 0.14, 0.16, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0, 1.2, 1.4, 또는 1.6% 정도 또는 이를 초과하는 세포 배양 배지 내 탄소를 이소프렌으로 전환한다. 일부 구현예에서, 탄소의 이소프렌으로의 전환% 는 약 0.002 내지 약 1.6%, 예컨대 약 0.002 내지 약 0.005%, 약 0.005 내지 약 0.01%, 약 0.01 내지 약 0.05%, 약 0.05 내지 약 0.15%, 0.15 내지 약 0.2%, 약 0.2 내지 약 0.3%, 약 0.3 내지 약 0.5%, 약 0.5 내지 약 0.8%, 약 0.8 내지 약 1.0%, 또는 약 1.0 내지 약 1.6% 이다. 탄소의 이소프렌으로의 전환% (또한, "탄소 수율 %"로서 나타냄)는 생성된 이소프렌 내의 탄소 mol을 탄소원 내 탄소 mol (예를 들어 회분식 및 공급된 글루코오스 및 효모 추출물에서의 탄소 mol)로 나누어 측정될 수 있다. 이러한 수를 100%로 곱하여 % 값을 수득한다 (방정식 1에 나타낸 바와 같음).
방정식 1
탄소 수율% = (생성된 이소프렌 내의 탄소 mol)/(탄소원 내의 탄소 mol) * 100
상기 계산에 있어서, 효모 추출물은 50% w/w 탄소를 함유하는 것으로 추정될 수 있다.
방정식 2
탄소 수율% = (39.1 g 이소프렌 * 1/68.1 mol/g * 5 C/mol)/[(181221 g 글루코오스 * 1/180 mol/g * 6 C/mol) + (17780 g 효모 추출물 * 0.5 * 1/12 mol/g)] * 100 = 0.042%
당업자는 이소프렌 생성 속도 또는 생성된 이소프렌의 양을 어떠한 다른 단위로도 용이하게 전환할 수 있다. 단위들간의 상호전환에 대한 예시적 방정식을 하기에 열거한다.
이소프렌 생성 속도에 대한 단위 (총 및 특이적)
방정식 3
1 g 이소프렌/L브로쓰/시간 = 14.7 mmol 이소프렌/L브로쓰/시간 (총 체적 속도)
방정식 4
1 nmol 이소프렌/gwcm/시간 = 1 nmol 이소프렌/L브로쓰/시간/OD600 (이러한 전환은 1의 OD600 값을 갖는 1ℓ의 브로쓰가 1 g의 습식 세포 중량을 갖는다고 가정함)
방정식 5
1 nmol 이소프렌/gwcm/시간 = 68.1 ng 이소프렌/gwcm/시간 (이소프렌 분자량이 주어짐)
방정식 6
1 nmol 이소프렌/L기체 02/시간 = 90 nmol 이소프렌/L브로쓰/시간 (배양물 브로쓰 L 당 90 L/시간의 02 유속에서)
방정식 7
1 ug 이소프렌/배출 기체 중 L기체 이소프렌 = L브로쓰 당 60 L기체의 유속에서 60 ug 이소프렌/L브로쓰/시간 (1 vvm)
역가에
대한 단위 (총 및 특이적)
방정식 8
1 nmol 이소프렌/mg 세포 단백질 = 150 nmol 이소프렌/L브로쓰/OD600 (이러한 전환은 1의 OD600 값을 갖는 1ℓ의 브로쓰가 약 150 mg의 총 세포 단백질을 갖는다고 가정함) (특이적 생산성)
방정식 9
1 g 이소프렌/L브로쓰 = 14.7 mmol 이소프렌/L브로쓰 (총 역가)
필요하다면, 방정식 10을 사용하여 세포의 습식 중량을 포함하는 임의의 단위를 세포의 건식 중량을 포함하는 상응하는 단위로 전환할 수 있다.
방정식 10
세포의 건식 중량 = (세포의 습식 중량)/3.3
본 발명에 의해 포함되는 일부 구현예에서는 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산을 포함하는 세포가, 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산을 갖지 않는 본질적으로 동일한 조건 하에 성장한 상응하는 세포에서 생성된 이소프렌의 양보다 적어도 또는 약 2배, 3배, 5배, 10배, 25배, 50배, 100배, 150배, 200배, 400배 이상의 이소프렌 양을 생성한다.
본 발명에 포함되는 일부 구현예에서는 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산, 및 DXS, IDI 및/또는 MVA 경로 폴리펩티드를 인코딩하는 하나 이상의 이종 핵산을 포함하는 세포가, 이종 핵산을 갖지 않는 본질적으로 동일한 조건 하에 성장한 상응하는 세포에서 생성된 이소프렌의 양보다 적어도 또는 약 2-배, 3-배, 5-배, 10-배, 25-배, 50-배, 100-배, 150-배, 200-배, 400-배 이상의 이소프렌의 양을 생성한다.
예시적 이소프렌 정제 방법
일부 구현예에서는, 본원에 기재된 임의의 방법은 이소프렌을 회수하는 것을 추가로 포함한다. 예를 들어, 본 발명의 조성물 및 방법을 사용하여 생성된 이소프렌은 기체 스트리핑, 분획화, 흡수/탈착, 투과증발, 고체상으로부터의 이소프렌의 열 또는 진공 탈착, 또는 고정 또는 흡수된 이소프렌을 용매를 사용하여 고체상으로 추출하는 것과 같은 표준 기술을 사용하여 회수될 수 있다 (예를 들어 미국 특허 제 4,703,007 호 및 제 4,570,029 호 참조; 특히 이소프렌 회수 및 정제 방법에 대해 그 전문이 참고문헌으로 각각 포함됨). 일부 구현예에서는, 이소프렌의 회수는 액체 형태의 이소프렌 (예를 들어 용매 중 이소프렌의 용액 또는 이소프렌의 순 용액)의 단리를 포함한다. 기체 스트리핑은 연속 방식으로 발효 배출 기체 흐름으로부터 이소프렌 증기를 제거하는 것을 포함한다. 이러한 제거는 고체상으로의 흡수, 액체상으로의 분할, 또는 직접 축합을 비제한적으로 포함하는 여러 상이한 방법으로 달성될 수 있다. 일부 구현예에서는, 희석 이소프렌 증기 흐름의 막 풍부함은 액체 이소프렌의 축합을 야기하는 증기의 이슬점을 초과한다.
이소프렌의 회수는 한 단계 또는 다수 단계를 포함할 수 있다. 일부 구현예에서는, 발효 배출 기체로부터의 이소프렌 증기의 제거 및 이소프렌의 액체상으로의 전환은 동시에 수행된다. 예를 들어, 이소프렌은 배출 기체 흐름으로부터 직접적으로 축합되어 액체를 형성할 수 있다. 일부 구현예에서는, 발효 배출 기체로부터의 이소프렌 증기의 제거 및 이소프렌의 액체상으로의 전환은 순차적으로 수행된다. 예를 들어, 이소프렌은 고체상으로 흡수된 후 용매로 고체상으로부터 추출될 수 있다.
일부 구현예에서는, 본원에 기재된 임의의 방법은 이소프렌을 정제하는 것을 추가로 포함한다. 예를 들어, 본 발명의 조성물 및 방법을 사용하여 생성된 이소프렌은 표준 기술을 사용하여 정제될 수 있다. 정제는, 이소프렌이 생성되는 경우 존재하는 하나 이상의 성분으로부터 이소프렌이 분리되는 과정을 나타낸다. 일부 구현예에서는, 이소프렌은 실제적으로 순수한 액체로서 수득된다. 정제 방법의 예에는 (i) 액체 추출용 용제 중의 용액으로부터의 증류 및 (ii) 크로마토그래피가 포함된다. 본원에서 사용되는 바와 같이, "정제된 이소프렌"은 이소프렌이 생성되는 경우 존재하는 하나 이상의 성분으로부터 분리된 이소프렌을 의미한다. 일부 구현예에서 이소프렌은, 이소프렌이 생성되는 경우 존재하는 다른 성분 없이, 적어도 약 20 중량%이다. 각종 구현예에서는, 이소프렌은 적어도 또는 약 25, 30, 40, 50, 60, 70, 75, 80, 90, 95 또는 99 중량% 순수하다. 순도는 적절한 방법, 예를 들어 컬럼 크로마토그래피, HPLC 분석 또는 GC- MS 분석에 의해 검정될 수 있다.
이소프렌 신타아제의 결정 구조
본 발명은 또한 상기에서 기술하고 하기 실시예에 기술한 바와 같은, 식물 이소프렌 신타아제 (예를 들어, 포플러 및 쿠주) 의 결정질 형태 및 이의 변이체에 대한 것이기도 하다. 한 구현예에서, 본 발명은 표 16-7 에 개시한 포플러 이소프렌 신타아제의 결정 구조를 갖는 임의의 폴리펩티드를 포함한다.
실험
본 발명의 특정 바람직한 구현예 및 측면을 설명하고 추가로 예시하기 위해 하기 실시예를 제공하나, 이것이 본 범위를 제한하는 것으로 해석해서는 안된다.
하기의 실험 개시에서, 하기의 약자가 적용된다: ℃ (섭씨 온도); rpm (분당 회전수); H2O (물); diH2O (탈이온수); aa 및 AA (아미노산); bp (염기쌍); kb (킬로염기쌍); kD (킬로달톤); gm (그람); ㎍ 및 ug (마이크로그람); mg (밀리그람); ng (나노그람); ㎕ 및 ul (마이크로리터); ml (밀리리터); mm (밀리미터); qs (충분량); nm (나노미터); ㎛ 및 um (마이크로미터); M (몰); mM (밀리몰); μM 및 uM (마이크로몰); pM (피코몰); U (유닛); MW (분자량); sec (초); min (분/분들); hr (시간/시간들); OD600 (600 nm 에서의 광학 밀도); BSA (소혈청알부민); DMAPP (디메틸알릴 디포스페이트); DTT (디티오트레이톨); EtOH (에탄올); IPTG (이소프로필-베타-D-티오갈락토피라노시드); 이소프렌 (2-메틸-1,3-부타디엔); IspS (이소프렌 신타아제); PAGE (폴리아크릴아미드 겔 전기영동); PBS (인산염완충식염수 [150 mM NaCl, 10 mM 나트륨 포스페이트 버퍼, pH 7.2]); 및 SDS (나트륨 도데실 술페이트).
하기의 약자가 실험 실시예에서 지칭되는 회사 제품 또는 서비스에 적용된다: Agilent (Agilent Technologies, Santa Clara, CA); Becton Coulter (Becton Coulter, Inc., Fullerton, CA); Bio-Rad (Bio-Rad Laboratories, Hercules, CA); Cayman Chemical (Cayman Chemical Co., Ann Arbor, MI); CTC Analytics (CTC Analytics A.G., Zwingen, Switzerland); EMS (Electron Microscopy Supply, Hatfield, PA); Epicentre (Epicentre Biotechnologies, Madison, WI); Integrated DNA Technologies (Integrated DNA Technologies, Coralville, IA); Invitrogen (Invitrogen Corp., Carlsbad, CA); Molecular Dynamics (Molecular Dynamics, Sunnyvale, CA); Novagen (Novagen, Inc., Madison, WI); Perkin Elmer (Perkin Elmer, Waltham, MA); Roche (Roche Applied Science, Indianopolis, IN); Sigma (Sigma-Aldrich, St. Louis, MO); Stratagene (Stratagene Cloning Systems, La Jolla, CA); Qiagen (Qiagen, Inc., Valencia, CA); Takara (Takara Bio USA, Madison, WI); Thomson Instrument (Thomson Instrument Co., Oceanside, CA); V&P Scientific (V&P Scientific, Inc., San Diego, CA); 및 Zinsser (Zinsser North America, Northridge, CA).
실시예
1
재조합 박테리아 내 발현을 위한
쿠주
이소프렌
신타아제의
클로닝
이 실시예에서는 E. coli 내 쿠주 이소프렌 신타아제 (IspS) 를 생성하는데 사용되는 방법을 설명한다. 쿠주 (Pueraria montana) 이소프렌 신타아제 유전자 (IspS) 에 대한 단백질 서열을 GenBank (AAQ84170) 로부터 입수했다. E. coli 코돈 사용 방식 (codon usage) 에 최적화된 쿠주 이소프렌 신타아제 유전자를 DNA2.0 (Menlo Park, CA) 로부터 구입하였고, 이를 SEQ ID NO:1 (도 1) 로 제시하였다. 이소프렌 신타아제 유전자를 BspLU11I /PstI 로 제한 엔도뉴클레아제 분쇄시켜 공급된 플라스미드로부터 제거하고, 겔-정제하고, NcoI/PstI 로 분쇄되어진 pTrcHis2B (Invitrogen) 로 라이게이션시켰다. 이소프렌 신타아제 유전자 내의 정지 코돈이 PstI 부위에 대해 5' 가 되도록 구축물을 설계하였다. 그 결과, 구축물이 발현되는 경우, His-태그가 이소프렌 신타아제 단백질에 결합하지 않는다. 생성된 플라스미드, pTrcKudzu 를 서열화로 확인하였다.
이소프렌 신타아제 유전자를 pET16b (Novagen) 에 클로닝하였다. 이 경우, 재조합 이소프렌 신타아제 단백질이 N-말단 His 태그를 함유하도록 이소프렌 신타아제 유전자를 pET16b 에 삽입하였다. 프라이머 세트 pET-His-Kudzu-2F: 5'-CGTGAGATCA TATGTGTGCG ACCTCTTCTC AATTTAC (SEQ ID NO:3) 및 pET-His-Kudzu-R: 5'-CGGTCGACGG ATCCCTGCAG TTAGACATAC ATCAGCTG (SEQ ID NO:4) 를 사용하여 PCR로 pTrcKudzu 로부터 이소프렌 신타아제 유전자를 증폭하였다. 이들 프라이머는 각각 유전자의 5'-말단에는 NdeI 부위, 및 3'-말단에는 BamH1 부위를 첨가하였다. 상기 기재된 플라스미드 pTrcKudzu 를 주형 DNA 로서 사용하고, Herculase DNA 폴리머라아제 (Stratagene) 를 제조자의 지침에 따라 사용하고, 프라이머를 10 pM 의 농도로 첨가하였다. PCR를 25 ㎕ 의 총 부피로 실행하였다. PCR 생성물을 NdeI/BamHI으로 분쇄시키고, 동일한 효소로 분쇄된 pET16b 에 클로닝하였다. 라이게이션 믹스를 E. coli Top 10 (Invitrogen) 에 형질전환하고 서열화로 올바른 클론을 선별하였다. 그 후, pETNHisKudzu 로 지명된 생성된 플라스미드를 T7 프로모터로부터 발현하기 위해 BL21(λDE3)pLysS (Novagen) 세포로 형질전환하였다.
또한 쿠주 이소프렌 신타아제 유전자를 저 카피 수 플라스미드 pCL1920에 클로닝하였다 (Lerner 및 Inouye, Nucl Acids Res, 18:4631, 1990). 프라이머를 사용하여 상기 기재된 pTrcKudzu 로부터 쿠주 이소프렌 신타아제 유전자를 증폭하였다. 정방향 (forward) 프라이머는 HindIII 부위 및 E. coli 공통 (consensus) RBS 를 5' 말단에 첨가하였다. PstI 클로닝 부위는 이미 pTrcKudzu 정지 코돈의 바로 3'에 존재하여, 따라서 역방향 프라이머를 최종 PCR 생성물이 PstI 부위를 포함하도록 구축하였다. 프라이머의 서열은 하기와 같았다: HindIII-rbs-Kudzu F: 5'-CATATGAAAG CTTGTATCGA TTAAATAAGG AGGAATAAAC C (SEQ ID NO:5) 및 BamH1-Kudzu R: 5'-CGGTCGACGG ATCCCTGCAG TTAGACATAC ATCAGCTG (SEQ ID NO:4) 10 pM 농도의 프라이머 및 1 ng 의 주형 DNA (pTrcKudzu) 와 함께 Herculase DNA 폴리머라아제 (Stratagene) 를 사용하여 PCR 생성물을 증폭하였다. 증폭 프로토콜에는 [95℃에서 1분, 60℃에서 1분, 72℃에서 2분] 의 30 사이클이 포함되었다. 생성물을 HindIII 및 PstI 으로 분쇄하고, 이를 HindIII 및 PstI 으로 또한 분쇄되어있는 pCL1920에 라이게이션시켰다. 라이게이션 믹스를 E. coli Top 10에 형질전환하였다. 여러 형질전환체를 서열화로 확인하였다. 생성된 플라스미드를 pCL-lac-Kudzu 로 지정하였다.
베타-락타마아제 유전자를 제거하기 위해, pTrcKudzu 를 BspHI 로 분쇄하고, 쉬림프 알칼리 포스파타아제 (SAP) 로 처리하고, 65℃ 에서 10 분 인큐베이션하여 SAP 를 열 사멸한 후, Klenow 절편 (New England BioLabs) 및 dNTP의 2 개의 단위로 인큐베이션함으로써 말단을 충전시켰다. 5 kb 절편을 아가로오스 겔로부터 정제하고 Kan(R) 유전자에 라이게이션하였다. Kan(R) 유전자를, 제조자 지침에 따라 프라이머 MCM22 및 MCM23 및 Taq DNA 폴리머라아제를 이용하여 pCR-Blunt-II-TOPO (Invitrogen) 로부터 PCR 증폭으로 제조하였다. PCR 절편을 HindIII 및 PvuI 로 분쇄하고, Klenow 절편 및 dNTP 을 이용하여 말단을 충전하였다. 라이게이션 혼합물을 E. coli Top 10 화학적 적격 세포에 형질전환하고, 카나마이신 내성을 부여하는 플라스미드 pTrcKudzu(kan) 를 갖는 형질전환체를 카나마이신 (50㎍/ml) 함유 Luria 아가 상에서 선별하였다. 프라이머의 서열은 하기였다: MCM22 5'- gatcaagctt AACCGGAATTGCCAGCTG (SEQ ID NO:15); 및 MCM23 5'- gatccgatcgTCAGAAGAACTCGTCAAGAAGGC (SEQ ID NO:16).
실시예
2
재조합 박테리아 내 발현을 위한 포플러 이소프렌
신타아제의
클로닝
이 실시예에서는 E. coli 내 poplar 이소프렌 신타아제 (IspS) 를 생성하는데 사용되는 방법을 기술한다. poplar (Populus alba x Populus tremula) 이소프렌 신타아제의 단백질 서열 (Schnitzler 등., Planta 222:777-786, 2005) 을 GenBank (CAC35696) 로부터 입수하였다. E. coli 에 대해 코돈 최적화된 유전자를 DNA2.0 로부터 구입하고, SEQ ID NO:6 (도 3) 에 제시하였다. 이소프렌 신타아제 유전자를 BspLU11I /PstI 로 제한 엔도뉴클라아제 분쇄시켜 공급된 플라스미드 (p9796-poplar) 로부터 제거하고, 겔-정제하고 NcoI/PstI 로 분쇄되어져 있는 pTrcHis2B 에 라이게이션하였다. 삽입물 내 정지 코돈이 PstI 부위 앞에 있도록 구축물을 클로닝하여, His-Tag 가 이소프렌 신타아제 단백질에 결합하지 않는 구축물을 도모하였다. 생성 플라스미드인 pTrcPoplar 를, 벡터 서열 내에서 혼성화하는 시판중인 프라이머 (정방향 및 역방향) 뿐 아니라 프라이머 Poplar InSeq (SEQ ID NO:8) 를 이용해 서열화하여 확인했다.
실시예
3
재조합 박테리아 내 이소프렌 생성
이 실시예에서, 재조합 E. coli 에서의 이소프렌의 생성 및 측정에 사용되는 방법을 기술한다.
I 이소프렌 생성의 측정
진탕 플라스크 배양물에 대해, 1 ㎖ 의 배양물을 진탕 플라스크로부터 20 ㎖ CTC 상부공간 바이알 (Agilent 바이알 카탈로그 번호 5188 2753; 마개 카탈로그 번호 5188 2759) 로 옮겼다. 마개를 단단히 조이고, 바이알을 250 rpm 에서 진탕하면서 동등한 온도에서 인큐베이션하였다. 30 분 후 바이알을 인큐베이터에서 꺼내 하기 기재한 바와 같이 분석하였다. 발효기 내의 이소프렌 생성을 측정한 경우, 발효기의 배출 기체로부터 샘플을 취하고 직접적으로 분석하였다.
상부공간 방식으로 작동하는 CTC Analytics CombiPAL 오토샘플러가 접속된 Agilent 6890 GC/MS 시스템을 사용하여 분석을 수행하였다. Agilent HP-5MS GC/MS 컬럼 (30 m x 0.25 mm; 0.25 ㎛ 필름 두께) 을 분석물을 분리하는데 사용하였다. 샘플러를 500 ㎕ 의 상부공간 기체가 주입되도록 설정하였다. GC/MS 방법은 1 ㎖/분의 흐름으로 담체 기체로서 헬륨을 이용하였다. 주입 포트를 50:1의 살포 비율로 250℃ 에서 고정하였다. 분석하는 동안 오븐 온도를 37℃ 에서 2분 동안 고정하였다. Agilent 5793N 질량 선택 검출기를 m/z 67 상 단일 이온 모니터링 (SIM) 방식으로 실행시켰다. 검출기를 1.4 내지 1.7분에서 스위치를 꺼서 영구 기체가 용리되게 하였다. 이들 조건 하에 이소프렌 (2-메틸-1,3-부타디엔) 을 1.78분에서 용리하도록 관찰하였다. 보정 표를 사용하여 이소프렌의 절대량을 정량하였고, 1 ㎍/L 내지 200 ㎍/L 에서 선형인 것을 발견하였다. 검출 한계는 이러한 방법을 사용하여 50 내지 100 ng/L 인 것으로 추정하였다.
II. 진탕 플라스크 내 이소프렌의 생성
상기 벡터를 E. coli 균주 BL21(λDE3)pLysS (Novagen) 에 도입하여, 균주 BL21/ptrcKudzu, BL21/pCL-lac-Kudzu 및 BL21/pETHisKudzu 를 생성했다. 단리를 위해 상기 균주를, 적절한 항생제 (BL21/ptrcKudzu 및 BL21/pETHisKudzu 에 대해서는 50 ㎍/㎖ 카르베니실린, 및 BL21/pCL-lac-Kudzu 에 대해서는 50 ㎍/㎖ 스펙티노마이신) 을 함유하는 LA (Luria 아가; Luria agar) 상에 퍼뜨리고 (spread), 37℃에서 하룻밤 동안 인큐베이션하였다. 단일 콜로니를 20 ㎖ Luria Bertani 브로쓰: LB) 및 적절한 항생제를 함유하는 250 ㎖ 배플 (baffled) 진탕 플라스크에 접종하였다. 배양물을 200 rpm 에서 진탕하면서 20℃ 에서 하룻밤 동안 성장시켰다. 하룻밤 배양물의 OD600 을 측정하고 배양물을, 적절한 항생제를 함유하는 30 ㎖ MagicMedia 발현 배지 (Invitrogen) 를 포함하는 250 ㎖ 배플 진탕 플라스크 내로 OD600 이 ~ 0.05 가 되도록 희석하였다. 배양물을 200 rpm에서 진탕하면서 30℃에서 인큐베이션하였다. OD60O 가 ~ 0.5 내지 0.8일 때 400 μM IPTG를 첨가하고 세포를 추가 6 시간 동안 200 rpm 에서 진탕하면서 30℃ 에서 인큐베이션하였다. IPTG로 유도 후 0, 2, 4 및 6 시간에, 배양물의 1 ㎖ 분취물을 수집하고, OD600 을 측정하고 생성된 이소프렌의 양을 상기 기재된 바와 같이 측정하였다.
III. 14ℓ 발효에서 BL21/ptrcKudzu 로부터 이소프렌의 생성
재조합 쿠주 이소프렌 신타아제 유전자를 함유하는 E. coli 로부터의 이소프렌의 대규모 생성을 유가식 배양물에서 측정하였다. 발효 배지의 ℓ 당 발효 배지 (TM2) 의 제조 방법은 하기와 같다: K2HPO4 13.6 g, KH2PO4 13.6 g, MgSO4 * 7H2O 2 g, 시트르산 모노히드레이트 2 g, 시트르산 철 암모늄 0.3 g, (NH4)2SO4 3.2 g, 효모 추출물 5 g, 1000X 개질 미량 금속 용액 1 ml. 모든 성분을 함께 첨가하고 diH2O 중에 용해하였다. 수산화칼륨 (KOH) 으로 pH 를 6.8 로 조정하고 부피에 대해 충분량이 되게 하였다. 최종 생성물을 0.22 μM 필터로 여과 멸균하였으나, 오토클레이브 (autoclave) 하지 않았다.
1000X 개질 미량 금속 용액에 대한 제조 방법은 하기와 같다: 시트르산 * H2O 40 g, MnSO4 * H2O 30 g, NaCl 10 g, FeSO4 * 7H2O 1 g, CoCl2 * 6H2O 1 g, ZnSO * 7H2O 1 g, CuSO4 * 5H2O 100 mg, H3BO3 100 mg, NaMoO4 * 2H2O 100 mg. 각각의 성분을 diH2O 에 한번에 하나씩 용해하고, HCl/NaOH로 pH를 3.0 로 조절하고, 부피에 대해 충분량이 되게 하고 0.22 μ 필터로 여과 멸균하였다.
이러한 실험을 14ℓ 생물반응기 (bioreactor) 에서 실행하여 원하는 발효, pH 6.7 및 온도 34℃ 에서 글루코오스로부터 이소프렌이 형성되는 것을 모니터링하였다. 동결 바이알에서 취한 E. coli 균주 L21/ptrcKudzu 의 접종물을 2 개의 600 ml 플라스크 내 소이톤 (soytone)-효모 추출물-글루코오스 배지에서 제조하였다. 접종물이 OD550 = 0.6 으로 성장한 후, 두 개의 600 ㎖ 플라스크를 원심분리하고, 세포 펠릿 (pellet) 을 생물반응기에 옮기기 위해 상기의 내용물을 70 ㎖ 상청액에 재현탁하였다 (70 ㎖의 OD 3.1 물질). 접종 후 다양한 시간 지점에서, 샘플을 꺼내고 생성된 이소프렌의 양을 상기 기재한 바와 같이 측정하였다.
실시예
4
식물 이소프렌
신타아제의
개선을 위한 부위 선별
식물의 이소프렌 신타아제는 테르펜 신타아제와 상동인 것으로 예상하였다. 2 개의 상동 테르펜 신타아제의 3차 구조를 보르닐 디포스페이트 신타아제 (pdb 엔트리 1N1B) 및 5-에피-아리스토로첸 신타아제 (pdb 엔트리 5EAU) 으로부터 측정하였다. 이들 효소는 단지 32% 의 상동성을 공유하나, 이의 3차 구조는 보존된다. 게다가, 이 둘의 효소와의 중간체 복합체의 구조는, 3 차 폴딩 (folding) 뿐 아니라 이들 효소의 활성 부위에서 세부 상호작용도 고도로 보존된다는 점을 보였다.
쿠주 및 포플러 이소프렌 신타아제는 하기 표 4-1 에 나타낸 바와 같이 보르닐 디포스페이트 신타아제와 5-에피-아리스토로첸 신타아제 간에 보여지는 것보다 더 큰 서열 동일성을 지닌다.
표 4-1 각종 효소의 % 동일성
포플러 이소프렌 신타아제의 상동성 모델을 보르닐 디포스페이트 (BDP-신타아제) pdb 엔트리 1N24 (~40% 서열 동일성) 을 기준으로 하여 제작하였다. 상기 상동성 모델은, Chemical Computing Group, Inc 에 의해 작성되고 지지된 프로그램 MOE 를 이용해 만든 10 개의 시범 모델의 밀접 유사성을 기준으로 하면 개연성이 있을 것으로 보인다. 개연성의 기준은 BDP-신타아제 구조에서 촉매작용에 관련된 것으로 밝혀진 부위에서 공통된 아미노산 잔기의 보존이다.
포플러 IspS 의 상동성 모델 및 BDP-신타아제의 구조에서 활성 부위의 비교로, 금속 이온 결합 및 포스페이트 인지에 관여하는 활성 부위가 보존된다는 것이 나타났다. 특히, 포플러 IspS 의 Lys 272, Asp 309, Asp 313, Glu 387, Arg 450 및 Asn 453 이 BDP-신타아제 내에서 동 잔기와 오버랩한다는 점이 관찰되었다. 이 예에서, 포플러 IspS 에서의 아미노산 잔기 위치는 SEQ ID NO: 7 로부터 유래한다. BDP-신타아제의 중간체의 포지셔닝도 또한 포플러 IspS 상동성 모델과 비교하였다. 이를 기준으로, 포플러 IspS 효소와 결합하고 반응하기 위해 이소펜테닐 디포스페이트가 요구할 수 있는 유사한 결합 영역 및 접근 방향을 동정할 수 있었다.
쿠주 이소프렌 신타아제의 상동성 모델은 (~40% 서열 동일성) 을 갖는 보르닐 디포스페이트 신타아제 pdb 엔트리 1N24 를 기준으로 제작하였다. 쿠주 IspS 의 상동성 모델과 BDP-신타아제의 구조에서의 활성 부위의 비교로 금속 이온 결합 및 포스페이트 인지에 관여하는 수 많은 활성 부위 잔기가 보존된다는 것이 나타났다. 특히, 쿠주 IspS 의 Arg 269, Asp 306, Asp 310, Glu 384, Arg 450 및 Asn 453 가 BDP-신타아제 내에서 동 잔기와 오버랩한다는 점이 관찰되었다.
포플러 및 쿠주 IspS 의 상동성 모델에서 동정된 활성 부위 잔기의 비교로, 한 상동성 모델에서의 잔기는 또한 나머지 다른 상동성 모델 내에서 유사 잔기들과 상당한 상동성을 지니고, 잔기 중 일부 관련 위치 넘버는 단지 사소하게 변화하면서 나타난다는 점이 드러났다. 상동성 모델을 기초로, 개선된 성능을 갖는 변이체 IspS 효소를 생성하는 돌연변이유발 후보로서 포플러 및 쿠주 IspS 내 부위를 동정하였다. 요약하면, 금속 결합의 상호작용, 디포스페이트 인지, IPP 사슬 결합 및/또는 활성 부위로의 접근을 변경할 수 있는 IspS 에서 부위를 선별하였다.
I. 디포스페이트/ 금속 결합 부위
금속 및 디포스페이트 (DPP) 결합 측쇄와 근접해 있는 것으로 발견된 포플러 IspS 내 아미노산 잔기의 측쇄를 동정하였다. 이들 잔기에는 Phe 384, Tyr 402, Ala 406, Ser 409, Ala 460 및 Asn 469 이 포함된다. 본 발명자들은 Lys 272 가 다른 공지된 포플러 IspS 서열과의 상동성을 기준으로 하면 부정확하여, 이 위치에서 Arg 를 갖는다는 점에 주의했다.
II. 기질 접근 루프 (access loop)
포플러 IspS 의 기질 접근 루프는 BDP-신타아제 구조로부터 벗어난 영역 내에 존재한다. BDP-신타아제 구조에서, 잔기는 커버를 만드는 분절을 형성한다. 이론에 얽매이지 않고, 본 발명자들은 포플러 IspS 의 실제 3 차 구조 내 상기 분절이 유사 구조를 형성할 것으로 예상했다. 그리하여 잔기 455-466 를 비롯한 상기 루프 내 잔기는 포플러 IspS 효소의 활성을 변경하는 위치에 있을 것이다. 포플러 IspS 효소 잔기 454-466 는 하기의 서열을 갖는다: LASASAEIARGET (SEQ ID NO:9).
III. 이소프레닐 결합 부위
BDP-신타아제 및 반응 생성물, 보르닐 디포스페이트의 복합체 (pdb 엔트리 1N24) 를 기질 특이성 및/또는 반응 속도 (기질과 생성물의 변경된 온 (on) 및 오프 (off) 속도) 를 조절할 수 있는 포플러 모델 내에서 잔기를 동정하는데 사용하였다. 이들 잔기에는 Arg 274, Trp 281 Phe 302, Val 305, Ser 411, Gln 415, Phe 449, Ser 537 및 Glu 540 이 포함된다.
표 4-2 돌연변이유발 부위 후보자
실시예
5
쿠주
이소프렌
신타아제내
비(非)보존성
시스테인의
돌연변이화
보르닐 디포스페이트 신타아제 결정 구조를 기초로하는 쿠주 및 포플러 이소프렌 신타아제 (IspS) 상동성 모델을, 시스테인 잔기의 위치에 대해서 비교하였다. 시스테인은 디술파이드 결합을 형성해 구조를 안정화시키는 잠재성이 있다. 용해성 및/또는 활성에 영향을 미치는 것으로 생각되는 비(非)보존성 시스테인을, 부위-특이적 돌연변이유발로 변경하였다. 모델링에 사용되는 쿠주 IspS 아미노산 서열은 도 2 (SEQ ID NO:2) 에 나타낸다. 도 5 의 상동성 모델에서 나타낸 바와 같이, 쿠주 IspS 내 위치 57, 291, 343, 378, 421, 446, 451 및 529 (단백질의 성숙 형태 기준) 에, 8 개의 시스테인이 존재한다. 대조적으로, 도 6 의 상동성 모델에 나타낸 바와 같이, 포플러 IspS 아미노산 서열에서는 쿠주 시스테인이 중첩되는 5 개의 시스테인이 존재한다. 상기 시스테인 중 수 개는 분명하게도 포플러와 쿠주 IspS 서열 사이에서 보존되는데, 이는 이들 위치가 구조의 안정화, 활성 및/또는 기타 단백질 기능에 있어서 중요하다는 점을 보여준다. 쿠주 에서 나머지 시스테인 (비보존성 잔기 57, 291, 421 및 446) 은 본원에서 기술한 바와 같이 세린으로 돌연변이된다.
I. 돌연변이유발
QuikChange®다중 부위 돌연변이유발 키트 (Stratagene) 을 제조자 지침에 따라 사용하였다. 하기 프라이머를 돌연변이유발을 위해 활용했다:
실시예 1 에서 기술한 플라스미드 pTrcKudzu(kan) 를 주형 DNA 로 사용했다. 프라이머 C57S-F, C291S-F, C421S-F, 및 C446-F 를 단일 반응으로 조합했다 (100 pmol). 주형 DNA 를 첨가하고 (~200 나노그람) 및 0.5 ㎕ 의 Quiksolution 를 권고되는 부피의 효소 및 버퍼로 첨가하였다. PCR 반응을 30 사이클로 55℃의 어닐링 온도 및 12 분의 신장 시간을 이용하여 Eppendorf PCR 기계 중에서 실시했다. 사이클의 기타 파라미터는 지침에 나타낸 바와 같다. PCR 믹스를 4 시간 동안 37℃ 에서 (각 2 시간 동안 2 x 1 ㎕) DpnI 로 처리한 다음, 5 ㎕ 의 반응물을 E. coli Top10 (Invitrogen) 화학적 적격 세포로 형질전환하고, 카나마이신 (50 ㎍/ml) 를 함유하는 Luria 아가 상에 플레이트하였다. 하룻밤 37℃ 에서 인큐베이션 후, 수 개의 콜로니를 고르고 카나마이신 (50 ㎍/ml) 를 함유하는 5 ml 의 Luria 브로쓰에 접종했다. 플라스미드를 QIAprep Spin Miniprep 키트 (Qiagen) 를 이용해 단리하고, IspS 유전자 전부를 서열화하였다. 다양한, 단일의 및 조합의 돌연변이들을 하기 표 5-1 에 나타낸 대로 만들었다.
표 5-1.
돌연변이화
pTrcKudzu
플라스미드로 형질전환된
BL21
(λ
DE3
) 세포*
모든 변이체 플라스미드를 화학적 적격 BL21(λDE3) 세포 (Novagen) 에 형질전환시켰다. 제 2 의 반응에서 C6 으로부터 단리된 플라스미드 DNA 및 pTrcKudzu(kan) 를 QUIKCHANGE® 부위 특이적 돌연변이유발 키트 (Stratagene) 에서 주형으로 사용하고, C421S-F 및 C421S-R프라이머와 단일 부위 반응시켰다. 서열화로 확인한 후 2 개의 추가 균주를 수득했다.
II. 세포 성장 및 이소프렌 생성
세포를, 교반하면서 하룻밤 30℃에서 50 mg/L 카나마이신으로 보충된 Luria 브로쓰를 함유하는 5 ml 튜브에서 성장시켰다. 이들 배양물을 10 g/L 글루코오스 및 50 mg/L 카나마이신으로 보충된 TM3 브로쓰 중에서 희석했다. 배양물 부피는 250 ml 배플 Bellco Delong 플라스크에서 25 ml 인데, 여기서 세포를 30℃ 에서 교반하면서 (225 rpm) 성장시켰다. 샘플을 지시된 바와 같이 A600 에서의 광학 밀도 측정를 위해 무균상태로 취하였다. 그 결과를 도 7 에 나타낸다. 배양물을 200 μM IPTG 로 3.33 hr 에서 유도하여 7.8 hr 에서 수확할 때까지 성장을 지속되게 하였다. 배양물을 10,000 X g 에서 10 분간 원심분리하고, 상청액을 디캔팅 (decant) 하고, 세포 펠릿을 하룻밤 -80℃ 에서 동결시켰다.
동결된 세포 펠릿을 융해하고 2 ml PEB (50 mM Tris-HCl, pH 8.0, 20 mM MgCl, 2 mM 디티오트레이톨, 및 50% [v/v] 글리세롤) 에서 재현탁하였다. 세포를 1 패스, 20,000 psi 에서 세포 파쇄기 (French pressure cell disruption) 로 분해하였다. 분해물을 10,000 X g 에서 15 분 원심분리하였다. 상청액을 디캔팅하고 펠릿을 2 ml PEB 중에서 재현탁하였다. 펠릿 및 상청액을 환원 조건 하 MES 버퍼 중에서 실시하는 SDS-PAGE, 4-12% NuPage 겔 (Invitrogen) 로 분석하였다. 분자량 표준은 SeeBlue2 (Invitrogen) 였다. 그 결과를 도 8 에 나타낸다. IspS 단백질 농도는 표준으로서 BSA 를 이용하는 BCA 검정 (Pierce) 을 이용해 추산했다 (표 5-2).
III. 이소프렌 신타아제 활성 및 용해성에 대한 검정
요약컨대, 상청액의 활성을 DMAPP 와의 반응으로 측정하고, 발생 이소프렌을 GC/MS 로 정량화하였다.
상부공간 검정. 200 ㎕ 의 원하는 배양물의 샘플을 2 ml CTC 상부공간 바이알 (Agilent 바이알 카탈로그 No. 5188 2753, 및 마개 Catalog No. 5188 2759) 에 접종한다. 마개를 단단히 조이고, 바이알을 37℃에서 250 rpm 에서 진탕하면서 인큐베이션하였다. 30 분 후 바이알을 인큐베이터에서 꺼내고, 주변의 수돗물로 잠시 냉각하였다. 바이알을 GC-MS 로 분석하기 위해 CombiPal Headspace 오토 샘플러에 넣었다. 분석을 상부공간 방식으로 작동하는 CTC Analytics CombiPAL 오토샘플러와 접속된 Agilent 6890 GC/MS 시스템을 이용하여 수행했다. Agilent HP-5MS GC/MS 컬럼 (30 m x 0.25 mm; 0.25 ㎛ 필름 두께) 을 분석물을 분리하는데 사용하였다. 샘플러를 500 ㎕의 상부공간 기체가 주입되도록 설정하였다. GC/MS 방법은 1 ㎖/분의 흐름으로 담체 기체로서 헬륨을 이용하였다. 주입 포트를 50:1의 살포 비율로 250℃에서 고정하였다. 분석하는 동안 오븐 온도를 37℃에서 2분 동안 고정하였다. Agilent 5793N 질량 선택 검출기를 m/z 67 상 단일 이온 모니터링 (SIM) 방식으로 실행시켰다. 검출기를 1.4 내지 1.7분에서 스위치를 꺼서 영구 기체가 용리되게 하였다. 이들 조건 하에 이소프렌 (2-메틸-1,3-부타디엔)을 1.78분에서 용리하도록 관찰하였다. 보정 표를 사용하여 이소프렌의 절대량을 정량하였고, 1 ㎍/L 내지 200 ㎍/L 에서 선형인 것을 발견하였다. 검출 한계는 이러한 방법을 사용하여 50 - 100 ng/L인 것으로 추정되었다.
DMAPP 검정. 원심분리된 세포파쇄기 (French Pressure cell) 분해물 유래의 상청액 분획물의 95 ㎕ 의 분취량을 상부공간 바이알에 첨가하였다. 100 mM 칼륨 포스페이트 버퍼, pH 8.2 중 8 mM DMAPP 의 5 ㎕ 분취량을 첨가하고, 바이알을 밀봉하고, 실온에서 30 분 인큐베이션되게 하였다. 생성된 이소프렌의 양을 상기에 기술한 바와 같이 GC/MS 로 측정하고 표 5-2 에 나타낸다.
표 5-2. 시스테인 돌연변이체의 미정제 추출물로부터의 이소프렌
신타아제
활성
표 5-2 에 나타낸 값은 두 개의 상이한 농도의 추출물과의 반응 평균이다. 임의의 시스테인 돌연변이를 포함하는 모든 단백질은, 불용성 (펠릿) 분획물 내 단백질 비율의 상대적인 증가로 판단하건대, 효소 활성이 심각하게 축소되었고, 가용성 단백질의 명백한 감소를 야기시켰다.
실시예
6
포플러 이소프렌
신타아제
내
잔기의
돌연변이화
쿠주 및 포플러 이소프렌 신타아제와 기타 신타아제의 아미노산 서열 정렬을 벡터 Nti (Invitrogen) 를 이용해 수행했다. 정렬된 서열은 하기를 포함한다: 베타-오시멘(ocimene) 신타아제 Lotus corniculatus (AAT86042); 추정 테르펜 신테타아제 Medficago trunculata (AAV36465); 가상 단백질 Vitis vinifera (can65805); 가상 단백질 Vitis vinifera (CAN62729); 피넨 (pinene) 신타아제 Quercus ilex (CAK55186); IspS Pueraria montana (kudzu) Sharkey (AAQ84170); 모노테르펜 신타아제 Eucaliptus globulus (BAF02832); IspS Populus nigra Fortunati (CAL69918); IspS Populus tremuloides Sharkey (AAQ16588); IspS Populus alba (BAD98243); 및 IspS Populus alba x tremula Zimmer (CAC35696). Populus alba x tremula (CAC35696) 의 데이타베이스로부터의 서열은 위치 272 및 497 에서 상이한 아미노산을 보이는데, 다른 위치에서는 고 보존된다. 추가적으로 포플러 IspS 의 상동성 모델 분석을 기초로 할 때, 위치 453 이 돌연변이유발에 대한 제 3 의 후보로서 동정되었다.
I. 돌연변이유발
QuikChange®다중-부위 특이적 돌연변이유발 키트 (Stratagene) 를 제조자의 지침에 따라 이용하여, 하기의 돌연변이를 단독 또는 조합하여 Populus alba x tremula IspS 서열 (SEQ ID NO:7): K272R; C497W; 및 N453D 에 도입하였다. 하기의 프라이머를 돌연변이유발을 위해 활용하였다:
Poplar K272R 5’-ccaaactgcacttcg ctcgtgaccgcctgattgag (SEQ ID NO:17);
Poplar N453D 5’-atctttcgcctgtgcgacgacctggcaagc (SEQ ID NO:18); 및
Poplar C497W 5’-tgaatctgatcgacgaaacctggaagaaaatgaacaaagaaaaac (SEQ ID NO:19).
하기의 프라이머, Poplar InSeq, 5’-gagaaaatcggtaaggaactgg (SEQ ID NO:8) 를 서열화를 위해 사용했다.
돌연변이유발을 제조자 지침에 따라 수행하고, 모든 3 가지 돌연변이유발 프라이머를 주형 DNA (100 ng) 로서 pTrcPoplar 와의 단일 반응 믹스 (각각 100 ng) 에 첨가했다. 0.5 ㎕ 의 Quik Solution 첨가로 돌연변이유발 반응을 보조하였다. 제안된 PCR 사이클을 55℃ 의 어닐링 온도 및 12 분의 신장 시간으로 해 수행했다. 기타 파라미터는 지침에 지적된 바와 같다. PCR 믹스를 DpnI 로 4 hrs 동안 37℃ 에서 (1 ㎕ 각각 x 2 h) 분쇄한 다음, 5 ㎕ 의 반응물을 E. coli Top10 화학적 적격 세포 (Invitrogen) 로 형질전환하였다. 수 개의 콜로니를 선택하고 카르베니실린 (50 ㎍/ml) 을 함유하는 5 ml 의 Luria 브로쓰 (LB) 중에서 성장시켰다. 플라스미드를 Qiagen QIAprep spin mini-prep kit 를 이용해 단리하고, Poplar InSeq 프라이머뿐 아니라, 벡터로 혼성화되는 정방향 및 역방향 프라이머를 이용하는 서열화를 의뢰했다.
pTrcPoplar 의 생성 변이체를 수득했다: pTrcPoplar K272R, pTrcPoplar K272R/N453D; pTrcPoplar K272R/N453D/C497W; 및 pTrcPoplar 272R/497W. 이들 플라스미드를, 분석을 위해 BL21(λDE3)pLysS 화학적 적격 세포 (Novagen) 로 형질전환하였다. 변이체를 상부공간 활성 (전 세포로부터의 이소프렌 생성), 용해성, 및 특이 활성에 대해 분석했다.
II. 세포 성장 및 이소프렌 생성
변이체, 모체 Poplar 균주, 및 pTrcKudzu 함유 균주를 카르베니실린 (50 mg/ml-Poplar 균주) 또는 카나마이신 (50 mg/ml-Kudzu 균주) 를 함유하는 5 ml 의 Luria Bertani 배지 중 37℃ 에서 하룻밤 성장시켰다. 이들 배양물을 10g/L 글루코오스와 50 ㎍/ml 카르베니실린 (Poplar 돌연변이체 및 야생형) 또는 50 mg/L 카나마이신 (BL21/pTrcKudzu) 로 보충된 TM3 브로쓰 내로 OD600 가 0.05 가 되도록 희석하였다. TM3 브로쓰에 대한 제조방법은 하기와 같다: K2HPO4 (13.6 g/l) KH2PO4 (13.6 g/l), MgSO4 * 7H2O (2 g/l) 시트르산 모노히드레이트 (2 g/L) 시트르산 철 암모늄 (0.3 g/L) (NH4)2SO4 (3.2 g/L) 효모 추출물 (0.2 g/L) 1 ml 의 1000x 미량 원소 용액 (수산화암모늄으로 6.8 로 조절된 pH, 멸균 diH2O 로 부피에 대해 충분량, 및 0.22 마이크론 필터로 여과 멸균함). 1000X 미량 원소 용액에 대한 제조방법은 하기와 같다: 시트르산 * H2O (40 g/L), MnSO4 * H2O (30 g/L), NaCl (10 g/L), FeSO4 * 7 H2O (1 g/L), CoCl2 * 6 H2O (1 g/L), ZnSO * 7 H2O (1 g/L), CuSO4 * 5 H2O (100 mg/L), H3BO3 (100 mg/L), NaMoO4 * 2 H2O (100 mg/L). 각 성분을 diH2O에 한번에 하나씩 용해하고, HCl/NaOH로 pH를 3.0이 되게 하고, 부피에 대해 충분량이 되게 하고 0.22 μ 필터로 여과 멸균하였다.
희석된 배양물 부피는, 30℃ 에서 교반하면서 (225 rpm) 성장하도록 250 ml 배플 Bellco Delong 플라스크에서 25 ml 였다. 샘플을 지시된 바와 같이 A600 에서의 광학 밀도 측정을 위해 무균상태로 취하였다. 두 배양물 세트를 설정하였는데, 그 중 하나는 0.2 mM IPTG 으로 유도하기 위해, 하나는 유도하지 않은 채로 잔류하기 위해 설정하였다. 30℃ 에서 200 rpm 로 진탕하면서 성장 3 시간 후 (OD600~0.5), 배양물의 한 세트는 0.2 mM IPTG 로 유도하고, 추가 3 시간 동안 30℃ 에서 200 rpm 으로 진탕하면서 인큐베이션하였고, 유도되지 않은 세트는 동일한 시간 동안 추가로 인큐베이션하였다. OD600 을 유도 시간 전 (접종 후 3 시간) 에 및 이소프렌 측정 때에 모든 배양물에 대해서 상부공간 검정에 의해 (3 h 유도 후, 총 6 시간의 성장) 측정했다. 세포 배양물을 7000 x g 에서 15 분 동안 Sorvall 초스피드 원심분리기에서 원심분리하여, 세포를 펠릿화하였다. 상청액을 제거하고, 이소프렌 신타아제 활성에 대해 시험관 내 검정에서 사용하기 위해 세포 펠릿을 동결하였다. 성장 및 상부공간 검정의 결과를 하기 표에 나타낸다.
표 6-1. 포플러
IspS
변이체를
발현하는
E.
coli
균주의 성장 (
OD
600
값)
표 6-2 포플러
IspS
변이체를
발현하는
E.
coli
균주에 의한 이소프렌 생성 (㎍/L)
놀랍게도, 쿠주 IspS 를 발현하는 균주가 임의의 측정가능한 이소프렌 생성을 드러내었다. 이는, 포플러 효소의 동적 특성들이 쿠주 효소의 것보다 우수하다고 문헌에서 보고한 것을 고려해볼 때 예상 밖이다. 특히, 종래 기술은 재조합 쿠주 IspS 의 특이 활성 (U/mg) 및 Km (μM) 이 각각 0.075 및 7,700 이고,천연형 aspen IspS 에 대해서는 각각 0.5 및 8,000 이고, 재조합 포플러 IspS 에 대해서는 각각 0.16 및 9,000 이라고 기술하고 있다 (Silver 및 Fall, J Biol Chem, 270:13010-1316, 1995; Miller 등., Planta, 213:483-487, 2001; 및 Sharkey 등., Plant Physiology, 137:700-712, 2005). 3 개의 효소에 대해 게재된 Km 값은 모두 꽤 높으며 서로의 범위 내에 존재하나, 쿠주 이소프렌 신타아제의 특이 활성은 다른 두 가지 이소프렌 신타아제의 것보다 현저하게 더 나쁘다.
III.이소프렌 신타아제 활성 및 용해성에 대한 검정
DMAPP 가 이소프렌 신타아제 효소에 대한 직접적인 기질이기 때문에, DMAPP 검정을 이용함으로써, 이소프렌 신타아제의 활성을 직접 측정할 수 있다. 야생형 쿠주 뿐 아니라, 포플러 모체 및 돌연변이체 균주의 세포 펠릿를 융해하고, 2 ml PEB (50 mM Tris-HCl, pH 8.0, 20 mM MgCl, 2 mM 디티오트레이톨, 및 50% [v/v] 글리세롤) 에 재현탁하였다. 세포를 세포파쇄기 (French pressure cell disruption) 로, 1 패스, 20,000 psi 에서 분해하였다. 이어서, 분해물 (1 ml) 을 마이크로퓨즈 (microfuge) 에서 20 분 동안 20,000 rpm 으로 4℃ 에서 원심분리하였다. 상청액을 제거하고, 펠릿을 1 ml 의 PEB 중에 재현탁하였다. 상청액 및 펠릿 샘플을 SDS-PAGE 및 DMAPP 검정으로 분석하고, 총 단백질 함량을 BCA 로 측정하였다.
표 6-3. 원심분리된 세포
분해물의
상청액으로부터
이소프렌 생성의
DMAPP
검정
생성을 총 세포 분해물 상청액 단백질로 정규화하였다.
표 6-4. 원심분리된 세포
분해물의
펠릿으로부터 이소프렌 생성의
DMAPP
검정
생성을 총 세포 분해물 펠릿 단백질로 정규화하였다.
포플러 변이체 K272R/C497W 는 유도된 배양물의 상청액 분획분에서 야생형과 비교하였을 때 활성 면에서 1.8x 증가를 보였다. 마찬가지로, 포플러 변이체 K272R 및 K272R/C497W 는 유도하지 않은 배양물의 상청액 분획분에서 야생형과 비교하였을 때, 활성 면에서 5.2x 및 3.4x 증가를 보였다. 게다가, 포플러 변이체 K272R 는, 유도된 배양물의 펠릿에서 야생형과 비교하였을 때 활성 면에서 2x 증가를 보였다. 그러나, 가장 두드러진 결과는 쿠주 IspS 이 본원에서 활용된 포플러 IspS 보다 더 큰 활성이라는 점이었다 (185x). 상기 표에서, H2 는 pTrcPoplar K272R/C497W H2 로 지명되는 클론의 명칭이다.
실시예
7
쿠주
이소프렌
신타아제의
서브클로닝
(
subcloning
)
이 실시예에서는, 쿠주 이소프렌 신타아제 (IspS) SEL 구축에 사용되는 방법을 기술한다. 부위 평가 라이브러리 (SEL) 의 구축을 위한 발현 벡터를 제조하기 위해서, 쿠주 이소프렌 신타아제 유전자를 pCR2.1 벡터 (Invitrogen) 에서 pET24d 벡터 (Novagen) 로 서브클로닝 (subcloning) 하였다. 쿠주 IspS 유전자를 프라이머 MCM50 5’-GATCATGCAT TCGCCCTTAG GAGGTAAAAA AACATGTGTG CGACCTCTTC TCAATTTACT (SEQ ID NO:20); 및 MCM53 5’-CGGTCGACGG ATCCCTGCAG TTAGACATAC ATCAGCTG (SEQ ID NO:21) 를 이용하여 pTrcKudzu 주형 DNA 로부터 증폭하였다. PCR 반응을 Taq DNA 폴리머라아제 (Invitrogen) 를 이용하여 실시하고, 수득한 PCR 생성물을 pCR2.1-TOPO TA 클로닝 벡터 (Invitrogen) 로 클로닝하고, E. coli Top10 화학적 적격 세포 (Invitrogen) 로 형질전환시켰다. 형질전환체를 카르베니실린 (50 ㎍/ml) 를 함유하는 L 아가 상에 플레이팅하고, 하룻밤 37℃ 에서 인큐베이션하였다. 카르베니실린 50 ㎍/ml 을 함유하는 5 ml 의 Luria 브로쓰 배양물을 단일의 형질전환체와 접종시키고 하룻밤 37℃ 에서 성장시켰다. 5 개의 콜로니를, 1 ml 의 액체 배지 (Luria 브로쓰) 로부터 단리된 플라스미드 DNA 의 서열화로써 올바른 삽입을 위해 스크리닝하고, QIAprep Spin Mini-prep Kit (Qiagen) 를 이용해 정제하였다. 수득한 플라스미드 (MCM93 으로 지명됨) 은 pCR2.1 주쇄 (backbone) 에 쿠주 IspS 코딩 서열을 함유한다 (도 9). MCM93 (SEQ ID NO:22) 의 서열은 도 10 에 나타낸다.
쿠주 코딩 서열을 PciI 및 BamH1 (Roche) 를 이용하는 제한 엔도뉴클레아제 분쇄로 제거하였고, QIAquick Gel Extraction kit (Qiagen) 을 이용해 겔 정제하였다. pET24d 벡터 DNA 를 NcoI 및 BamHI (Roche) 로 분쇄하고, 쉬림프 알칼리 포스파타아제 (Roche) 로 처리하고, QIAprep Spin Mini-prep Kit (Qiagen) 를 이용해 정제하였다. 쿠주 IspS 절편을, Rapid DNA Ligation Kit (Roche) 을 이용해, NcoI/BamH1 분쇄된 pET24d 에 5: 1 의 절편 대 벡터 비율로 총 부피 20 ㎕ 로 하여 라이게이션하였다. 라이게이션 혼합물의 일부 (5 ㎕) 를 E. coli Top 10 화학적 적격 세포로 형질전환시키고, 카나마이신 (50 ㎍/ml) 을 함유하는 L 아가 상에 플레이팅하였다. 올바른 형질전환체를 서열화로 확인하고, 화학적 적격 BL21(λDE3)pLysS 세포 (Novagen) 로 형질전환하였다. 단일의 콜로니를 카나마이신 (50 ㎍/ml) 함유 L 아가 상 37℃ 에서 하룻밤 성장 후 선택하였다. pET24D-Kudzu 로서 지명되는 생성 플라스미드의 맵을 도 11 에 나타낸다. pET24D-Kudzu 의 서열 (SEQ ID NO:23) 은 도 12 에 나타낸다. IspS 활성을 실시예 5) 에 기술된 상부공간 검정을 이용하여 확인하였다.
실시예
8
이소프렌
신타아제
부위 평가 라이브러리 (
SEL
) 의 구축
식물 IspS 의 동적 파라미터를 개선하기 위해, SEL 을 쿠주 및 포플러 IspS 효소 모두의 상동성 모델로부터 선택되는 부위에서 제조하였다. 상기 상동성 모델로부터 지시된 부위에서의 조작으로 두 효소를 개선할 수 있다는 점이 예상되나, 이번 구현예에서는 쿠주 SEL 을 기술한다. 관심 쿠주 IspS 표면 부위에는, 하기가 포함되나 이로 제한되지는 않는다: 26 L, 30 E, 31 F, 33 Q, 35 L, 36 E, 37 N, 39 L, 40 K, 41 V, 43 K, 44 L, 61 R, 62 V, 63 D, 65 Q, 87 K, 94 E, 95 N, 99 L, 100 D, 105 N, 137 K, 138 E, 143 G, 144 E, 182 N, 184 L, 185 K, 187 G, 189 N, 190 T, 225 P, 226 H, 247 K, 257 T, 258 E, 259 M, 266 D, 334 N, 353 D, 357 S, 358 I, 361 E, 389 N, 392 I, 393 I, 398 K, 401 E, 421 C, 423 Q, 424 Q, 425 E, 426 D, 430 H, 432 L, 433 R, 434 S, 437 D, 443 R, 462 L, 463 E, 476 H, 478 N, 479 D, 485 Q, 508 D, 513 P, 515 A, 532 Q, 533 Y, 537 L, 538 G, 539 R, 542 Y, 543 A, 및 557 P, 관심 쿠주 IspS 활성 부위 위치에는 하기가 포함되나 이로 제한되지는 않는다: 24 P, 25 N, 309 Y, 310 D, 377 L, 381 F, 384 E, 399 Y, 402 N, 403 A, 406 S, 407 S, 409 G, 411 A, 413 L, 449 F, 456 A, 457 T, 458 S, 458 S, 459 A, 460 A, 461 E, 462 L, 463 E, 464 R, 465 G, 466 E, 467 T, 468 T, 469 N, 523 M, 527 S, 및 531 Y. 추가의 관심 쿠주 IspS 활성 부위 위치에는 하기가 포함되나, 이로 제한되지는 않는다: 20 A, 21 N, 22 Y, 23 Q, 271 R, 278 W, 299 F, 302 V, 및 408 S. 각각의 라이브러리 SEL 은 최대로 20 개의 상이한 변이체를 포함하는 클론을 함유한다. 예를 들면, 쿠주 이소프렌 신타아제 SEL 531 은, 성숙한 쿠주 효소의 위치 531 에서 티로신을 코딩하는 DNA 삼중자 (triplet) 가 하기를 인코딩하는 또 다른 DNA 삼중자로 대체된 변이체를 포함한다: 알라닌, 아스파르트산, 시스테인, 글루탐산, 페닐알라닌, 글리신, 히스티딘, 이소류신, 리신, 류신, 메티오닌, 아스파라긴, 프롤린, 글루타민, 아르기닌, 세린, 트레오닌, 발린, 또는 트립토판. 요약하면, 성숙한 IspS 의 DNA 코딩 가닥에서 특이적 위치의 DNA 삼중자가 대체된다. 돌연변이화 IspS 핵산은 후속해서 적합한 발현 벡터에 라이게이션되어 적합한 숙주 세포를 형질전환하는데 사용된다.
부위 평가 라이브러리는, 돌연변이될 코돈 대신에 "nns" 서열을 갖는 프라이머를 순서화하거나, 또는 합성 구축물 (예, DNA2.0) 을 순서화함으로써 제조된다. 이어서, 상기 프라이머는, 기술된 바와 같이 (예, WO0507682A2), 시판중인 돌연변이유발 키트 (예, Stratagene) 를 이용해 지시된 부위에서 SEL 을 생성하는 유전자를 돌연변이화시키는데 사용된다. 돌연변이된 코돈은 서열 분석으로 동정한다. 부위 라이브러리를 96 웰 마스터 플레이트에서 배열하고, 나중에 사용하도록 동결한다. 배양물을 상기 마스터 플레이트로부터 성장시키고 스크리닝을 위해 준비한다.
원하는 최종 생성물은 IspS 를 통해 탄소 유동을 최대화하도록 대사적으로 조작된 숙주에서 최적으로 기능하는 IspS 효소이다. 이를 위해, 몇몇의 스크리닝 단계를 사용해, 올바른 파라미터가 제시되는 것을 보장한다. 예시적 스크린에는 하기가 포함되나 이로 제한되는 것은 아니다: 발현, HG 생성을 위한 DMAPP 공급, 마이크로반응기, 단백질 측정 및 상부공간 검정. 발현 스크린: 단백질 발현의 수준을 분석하는 방법의 한 가지 예는 하기와 같다. 세포 분해물의 가용성 및 불용성 분획분 (용해된 세포 배양물로부터 수득함) 을 원심분리로 준비한다. 생성된 상청액 및 펠릿을 SDS-PAGE 로 분석한다. % 가용성 단백질은 상청액 대 펠릿 내 존재하는 단백질의 밀도계측 분석으로 측정한다.
예시적 구현예에서, 쿠주 부위 평가 라이브러리를 pET24D 발현 벡터에서 구축한다. pET24D-Kudzu 벡터 (쿠주 이소프렌 신타아제 유전자 함유) 는 주형 DNA 로서 역할한다.
재료:
pET24D-Kudzu 벡터 (~50 ng/㎕)
Kudzu IS 부위-특이적 돌연변이유발 프라이머 (Integrated DNA Technologies)
QuikChange®다중 부위-특이적 돌연변이유발 키트 (Stratagene)
MJ Research PTC-200 Peltier Thermal Cylcer (Bio-Rad Laboratories)
One Shot TOP10 적격 세포 (Invitrogen)
QIAprep Spin Miniprep Kit (Qiagen)
BL21(λDE3) pLysS 적격 세포 (Invitrogen)
Luria Broth (LB) 아가 플레이트
방법:
돌연변이유발 방법은, 돌연변이될 코돈 서열과 상응하는 특이적으로 설계된 3중의 DNA 서열 NNS (N = A, C, T 또는 G 및 S = C 또는 G) 를 비롯한 25 내지 45 개의 뉴클레오티드 길이인 단일의 정방향 프라이머를 이용해, 특이적 DNA 삼중자에서 모든 가능한 돌연변이화의 제조를 수행하는 코돈-특이적 돌연변이화 접근법을 기초로 하였다. 이 방법으로 관심 대상의 특이적 pET24D-kudzu 코돈에서 뉴클레오티드의 랜덤 혼입을 도모한다. 표 8-1 은 돌연변이유발에 사용되는 올리고뉴클레오티드 프라이머를 열거하는데, 이 프라이머 명칭 내 숫자는 성숙한 쿠주 이소프렌 신타아제 효소 서열에서의 코돈 위치와 대응한다. 모든 올리고뉴클레오티드 프라이머를 100 nmole 규모로 합성하였고 (Integrated DNA Technologies) 및 PAGE 정제하였다.
표 8-1.
쿠주
IspS
코든-특이적
돌연변이화
프라이머
PCR 반응을 0.5ml 얇은-벽으로 된 PCR 튜브에서 QuikChange®다중 부위-특이적 돌연변이유발 키트 (Stratagene) 에 대한 제조자의 프로토콜에 따라 설정하여: 1㎕ pET24 Kudzu 벡터 (50ng/㎕); 1㎕ Kudzu IS 부위-특이적 정방향 돌연변이유발 프라이머 (10㎕M); 2.5㎕ 10X QuikChange®다중 반응 버퍼; 1㎕ dNTP 믹스, 1㎕ QuikChange®다중 효소 블렌드 (2.5U/㎕); 및 18.5㎕ 증류된 오토클레이브 물로 25㎕ 의 총 반응 믹스를 제공했다. pET24 Kudzu SEL 을 하기의 조건을 이용하여 증폭하였다: 95℃ 에서 1 분 (첫 번째 사이클에서만) 후, 95℃ 에서 1 분, 55℃ 에서 1 분, 65℃ 에서 12 분 (29 사이클 반복). 이어서, 반응 혼합물을, 각 튜브에 1.5㎕ DpnI 제한 효소 첨가에 의해 DpnI 분쇄 (QuikChange®다중 부위-특이적 돌연변이유발 키트로 공급됨) 에 적용하였고, 37℃ 에서 2 시간 동안 인큐베이션하여, 모체 pET24D-kudzu 벡터를 분쇄시켰다. 이어서, DpnI-처리된 PCR 반응물을 One Shot TOP10 적격 세포 (Invitrogen) 로 형질전환시키고, 50㎍/ml 카나마이신을 함유하는 LB 아가 플레이트에 플레이팅하고, 37℃ 에서 하룻밤 인큐베이션하였다. 익일, 96 랜덤 콜로니를 고르고 서열화하여 가능한 19 개의 아미노산 변이체 중 최소 15 개를 동정하였다. 부위-특이적 변이체를 동정하자마자, 각각의 변이체 클론을 이어서 (LB + 50㎍/ml 카나마이신)의 5 ml 튜브에 접종하고, 37℃ 에서 진탕하면서 (250 rpm) 하룻밤 성장시켰다. 다음날, 플라스미드 DNA 를 QIAprep Spin Miniprep Kit (Qiagen) 을 이용해 정제하였다. 그 후, 변이체를 One Shot BL21(λDE3) pLysS 적격 세포 (Invitrogen) 에 단백질 발현 스크리닝을 위해서 형질전환시키고, 50㎍/ml 카나마이신 및 30㎍/ml 클로람페니콜을 함유하는 LB 아가 플레이트 상에서 플레이팅하고 하룻밤 37℃ 에서 인큐베이션하였다.
E. coli BL21(λDE3) pLysS 세포에서 pET24D-Kudzu SEL 을 생성하는 대안 방법을 또한 성공적으로 활용했다. 상술된 DpnI-처리 PCR 반응으로부터 수득된 TOP10 적격 세포 형질전환체는, 3ml 의 LB 배지를 상기 아가의 상부에 적용하고, 멸균 플레이트 스프레더 (spreader) 로 스크레이핑 (scraping) 하여 세포를 재현탁시킴으로써 수확하였다. 이어서, 3ml 의 모은 (pooling) 재현탁된 세포를 LB + 50㎍/ml 카나마이신을 함유하는 25 ml 진탕 플레이크에 접종하는데 사용했다. 그 후 모은 배양물을 하룻밤 37℃ 에서 진탕하면서 (250rpm) 성장시켰다. 다음날, 플라스미드 DNA 를 모아진 배양물로부터 QIAprep Spin Miniprep Kit (Qiagen) 을 이용하여 정제하였다. 이어서, 모은 플라스미드 DNA 를 상술한 바와 같은 단백질 발현 스크리닝을 위해 One Shot BL21(λDE3) pLysS 적격 세포에 형질전환시켰다.
마스터 플레이트를 제작하기 위해, 96 웰 플레이트에서 올바른 구축물을 4 세트로 배열한다. 올바른 서열의 한 콜로니를 사용하여 4 개의 웰에 접종하고, 플레이트를 수 시간 내지 하룻밤 동안 37℃ 에서 50 ㎍/ml 카나마이신 함유 LB 중 진탕하면서 (200 rpm) 성장시켰다. 멸균 글리세롤을 배양물에 첨가하여 최종 농도가 15% (최종 총 부피: 150-200 ㎕/웰) 가 되게 한다. 이어서, 플레이트를 Breathe-EASIER (EMS Catalog No. 70536-20) 막을 이용하여 밀봉하고 -80℃ 에서 보관하였다.
실시예
9
이소프렌
신타아제
봉입체 (
inclusion
body
) 의 생성 및 정제
쿠주 이소프렌 신타아제를 함유하는 봉입체를, 효소가 균주 BL21(λDE3) 내 샤페론 GroELS 의 존재시 과발현할 때 형성시켰다. 간략하게, pETNHisKudzu (U.S. 출원 No. 61/013,574, 본원에서 참조 인용됨) 를 제조자의 지침에 따라 pGro7 (Takara Catalog No. 3340) 로 서브클로닝하였다. 500 mL 의 배양물을 본질적으로 기술된 바와 같이 성장시켰다 (Whittington 등., Proc Natl Acad Sci USA, 99:15375-15380, 2002). 샤페론의 존재 및 저온 배양에도 불구하고, 배양물은 대개 봉입체를 양산하고 오로지 낮은 수준만으로 가용성 활성 단백질을 양산하였다. 봉입체를 제조자의 지침에 따라 IFOLD Protein Refolding System (Novagen Catalog No. 71552-3) 를 이용하여 수확하였다. 이러한 절차로 고 수율 (>50 mg) 의 재조합 쿠주 이소프렌 신타아제를 도모하였다. 봉입체의 순도는 도 13 에 나타낸다. 이 제조법을 래빗 폴리크로날 항-이소프렌 신타아제 항혈청 (Invitrogen) 생산에 사용했다.
실시예
10
이소프렌
신타아제
변이체의
고처리량
생화학 스크린
이 실시예는 이소프렌 신타아제 활성의 측정에 있어서 고처리량 방법을 기술한다. 이소프렌 신타아제 변이체를 발현할 수 있는 BL21(λDE3)pLysS E. coli 숙주 세포의 라이브러리를 96-웰 플레이트에 배열하고 -80℃ 에서 실시예 8, 상기에서 기술한 바와 같이 15% 글리세롤 스톡으로서 동결 보관했다. 96 개 이하의 변이체의 플레이트를 분석하기 위해, 글리세롤 스톡 마스터 플레이트의 복제 스탬프 (replica stamp) 를 96-pin Multi-Blot floating pin (부유 핀) 도구 (V&P Scientific Catalog No. VP 408AF) 로 적절한 항생제(들) (예, 30 ㎍/mL 클로람페니콜, 50 ㎍/mL 카나마이신) 를 함유하는 Luria 브로쓰 아가 상에서 만들었다. 복제 플레이트를 하룻밤 30℃ 에서 인큐베이션하여 박테리아 패치 (patch) 가 성장하게 하였다. 동일한 부유 핀 복제자를 이용하여, 0.08% Biospringer 효모 추출물 및 1% 글루코오스 + 항생제들 (30 ㎍/mL 클로람페니콜, 50 ㎍/mL 카나마이신) 로 보충된 250 ㎕ 의 TM3 배지를 함유하는 96-사각형의 딥웰 플레이트를 아가 플레이트로부터 접종하고 하룻밤 30℃ 에서 인큐베이션하였다. TM3 브로쓰의 제조방법은 하기와 같다: K2HPO4 (13.6 g/l) KH2PO4 (13.6 g/l), MgSO4 * 7H2O (2 g/l) 시트르산 모노히드레이트 (2 g/L) 시트르산 철 암모늄 (0.3 g/L) (NH4)2SO4 (3.2 g/L) 효모 추출물 (0.2 g/L) 1 ml 의 1000x 미량 원소 용액 (수산화암모늄으로 pH 를 6.8 로 조절, 멸균 diH2O 으로 부피는 충분량 및 0.22 마이크론 필터로 여과 멸균됨). 1000X 미량 원소 용액의 제조 방법은 하기와 같다: 시트르산 * H2O (40 g/L), MnSO4 * H2O (30 g/L), NaCl (10 g/L), FeSO4 * 7 H2O (1 g/L), CoCl2 * 6 H2O (1 g/L), ZnSO * 7 H2O (1 g/L), CuSO4 * 5 H2O (100 mg/L), H3BO3 (100 mg/L), NaMoO4 * 2 H2O (100 mg/L). 각각의 성분을 diH2O 중에 한번에 하나씩 용해하고, pH 는 HCl/NaOH 로 3.0 으로 조절하고, 부피는 충분량이 되게 하고 0.22 마이크론 필터로 여과 멸균하였다. 하룻밤 배양물을 동일한 배지로 OD600 이 0.05 가 되도록 희석하고, 또 다른 96-사각형의 딥웰 플레이트 (Thomson Instrument, Catalog No. 951652C; 이때 각각의 웰은 600 ㎕ 의 희석물을 함유함) 에서 성장시켰다. 희석물을 30℃ 에서 0.8 의 OD600 으로 진탕하면서 성장시킨 다음, IPTG 를 400 μM 농도로 첨가하여 유도하였다. 플레이트를 5 시간 동안 성장시키고, OD600 를 품질 대조 및 정규화를 위해 측정한다.
400 ㎕ 의 부피의 배양물을 새로운 96-웰 플레이트 (Perkin Elmer, Catalog No. 6008290) 로 옮기고, 세포를 Beckman Coulter Allegra 6R 원심분리기에서 2500 x g 로 원심분리하여 수확하였다. 펠릿을 200 ㎕ 의 저장성 (hypotonic) 버퍼 (5mM MgCL2, 5mM Tris HCl, 5mM DTT pH 8.0) 중에서 재현탁하고, 플레이트를 -80℃ 에서 최소 60 분의 시간 동안 동결한다. 세포 분해물을, 플레이트를 융해하고 32 ㎕ 의 이소프렌 신타아제 DMAPP 검정 버퍼 (57mM Tris HCl, 19 mM MgCl2, 74 ㎍/mL DNase I (Sigma Catalog No. DN-25), 2.63x105 U/mL 의 ReadyLyse 리소자임 용액 (Epicentre Catalog No. R1802M), 및 5 mg/mL 의 분자 생물 등급 BSA 를 첨가함으로써 제조한다. 플레이트를 25℃ 에서 30 분 동안 진탕하면서 인큐베이션한 다음 얼음 위에 놓는다. 이소프렌 생성을 위해, 80 ㎕ 분취량의 분해물을 96-딥웰 유리 플레이트 (Zinsser Catalog No. 3600600) 으로 옮기고, 20 ㎕ 의 100mM KHPO4 중 10 mM DMAPP 용액, pH 8.2 (Cayman Chemical Catalog No. 63180) 을 첨가한다. 플레이트를 알루미늄 플레이트 밀봉제로 밀봉하고 (Beckman Coultor Catalog No. 538619) 60 분 동안 30℃ 에서 진탕하여 인큐베이션한다. 효소 반응은, 유리 블록을 가열함으로써 (70℃로 5 분 동안) 종결한다. 각각의 웰의 상부공간은 실시예 5 에서 기술한 바와 같이 정량적으로 분석한다.
단백질 농도를 측정하기 위해, 5㎕ 이상의 분해물을, 니트로셀룰로오스 막 (Invitrogen Catalog No. LC2000) 으로 옮긴 후 웨스턴 블롯 분석을 위한 프리캐스트 (precast) 겔 (Invitrogen Catalog No. NP0301BOX) 상에서 작동시켰다. 사용된 일차 항체는 실시예 9 의 항-이소프렌 신타아제 항체이다. 일차 항체 결합 후 Alexa Fluor 488 (Invitrogen Catalog No. A-11008) 로 표지된 이차 항체 발생으로 정량적 신호 측정을 가능하게 한다. 웨스턴 블롯 절차는 Invitrogen 에 의해 기술된 바와 같이 실시했다. 형광 신호는 블루 필터 설정을 이용하는 Molecular Dynamics Storm 기기로 기록하였고, Molecular Dynamics ImageQuant 이미지 분석 소프트웨어 패키지로 정량적으로 분석하였다. 라이브러리 멤버의 특이 활성은, 유도 배양물의 A600 또는 웨스턴 블롯으로 측정된 이소프렌 신타아제 단백질 농도로 나눈 이소프렌 생성량 비율로부터 산출하였다. 이소프렌 신타아제 단백질 표준은, 일차 표준으로서 역할하는 Coomassie brilliant blue (쿠마시 브릴리언트 블루) R250 로 염색된 BSA 로 표준 겔 밀도계측에 의해 보정되었다. 전체 라이브러리의 특이 활성 면에서 증가, 감소 또는 변화 없음을 추가 분석을 위해 표로 만들었다. 도 14 는 위치 Y22, A20, 및 S408 에 대한 쿠주 부위 평가 라이브러리 (SEL) 멤버의 이소프렌 신타아제 활성을 나타내는 그래프를 제공한다. 대부분의 멤버는 야생형과 비교했을 때 매우 감소된 활성을 나타내나, 보존성 치환들은 활성면에서 더 적은 감소를 보인다. 변이체 A20G 의 활성은 야생형 쿠주 효소의 것과 비슷한데, 이는 이 변이체가 조합 돌연변이에 대한 후보 파트너 인 것을 나타낸다. 흥미롭게도, 라이브러리 S408 의 변이체 S408D 는 야생형과 비교시 활성이 증가하였음을 보이기 때문에, 조합 돌연변이의 또 다른 후보 파트너가 된다.
실시예
11
이소프렌
신타아제
절단물
이 실시예는 정제된 포플러 IspS 제조물에서 보이는 저 (low) 밴드의 더블릿 (doublet) 에서 단백질의 아미노산 서열의 동정을 기술한다 (도 21 참고). 질량 분석으로 동정한 추정 절단 부위를 기준으로 하여 일련의 N-말단 절단된 IspS 분자들을 또한 만들었다. IspS 의 더 짧은 N-말단 절단물 (pDu39 내 "MEA" 절단물, 하기 참고) 를 또한 만들어서, 추가의 절단의 IspS 활성에 대한 효과를 조사했다 (Williams DC, McGarvey DJ, Katahira EJ, Croteau R (1998) Biochemistry 37:12213-12220).
I. 단백질 정제를 위한 N-말단 6XHis-태깅된 IspS (pDu27 내) 의 구축:
주형 P. alba pET24a 로부터의 전장 P. alba IspS (도 19 및 20) 를 PCR 로 제조하였다. 하기의 PCR 반응물을 제조하였다: 1㎕ (주형)-P. alba pET24a, 5 ㎕ 10X PfuUltraII 융합 버퍼, 1 ㎕ dNTP (10 mM), 1㎕ 프라이머 (50 μM) 프라이머 F-(MCM219), 1 ㎕ 프라이머 (50 μM) 프라이머 R-(MCM182), 41 ㎕ diH2O 및 1 ㎕ 의 PfuUltra II 융합 DNA 폴리머라아제 (Stratagene). PCR 사이클 파라미터는 하기와 같다: 95 ℃ 1 분, 95 ℃ 1 분, 55 ℃ 20 초, 72 ℃ 27 초 (29 사이클) 후, 72 ℃ 3 분 및 냉각될 때까지 4 ℃ (Eppendorf Mastercycler 를 이용함). PCR 생성물을 0.8% E-겔 (Invitrogen) 및 Qiagen QIAquick Gel Extraction 및 QIAprep Spin Miniprep 키트를 이용하여 제조자의 권고되는 프로토콜에 따라 겔 추출하고 정제하였다. 3 ㎕ 분취량의 정제된 생성물을 제조자의 프로토콜에 따라 pET200D/TOPO 벡터 (Invitrogen) 에 라이게이션하였다. 반응물을 5 분 동안 실온에서 인큐베이션한 다음, 6 ㎕ 토포이소머라아제 혼합물을 제조자의 프로토콜에 따라 E. coli Top10 화학적 적격 세포 (Invitrogen) 로 형질전환시켰다. 형질전환체를, 카나마이신 (50 ㎍/ml) (Kan50) 을 함유하는 KB 플레이트 상에서 선별하고, 37 ℃ 에서 하룻밤 인큐베이션하였다. 5 개의 콜로니를 고르고, T7 정방향 및 MCM182 프라이머를 이용하는 PuReTaq Ready-To-Go PCR Beads (Amersham) 를 이용해 스크리닝하였다. 올바른 크기의 삽입물을 갖는 클론을, T7 정방향 및 T7 역방향 프라이머 (Quintara Biosciences) 를 이용하여 서열화하여 추가로 확인했다. 한 구축물인 pDu27 (도 16-18) 를 추가 연구를 위해 선택했다. 1 ㎕ 분취량의 플라스미드 제조물을, 제조자의 프로토콜에 따라 BL21(λDE3)pLysS (Invitrogen) 에 형질전환하였다. 형질전환체를 Kan50+ 및 클로람페니콜 (35 ㎍/ml) (Cm35) 를 함유하는 LB 플레이트 상에서 선별하고, 37 ℃ 에서 하룻밤 인큐베이션하였다. 수득한 균주를 N-말단 6XHis-태깅된 P. alba IspS 의 발현 및 정제에 사용했다.
II. 6XHis-태깅된 IspS 의 정제
6XHis-태깅된 IspS 의 발현
N-말단 6XHis-태깅된 IspS 를 균주 MD08-99 로부터 발현 및 정제하였다. 성장 절차는 BL21(λDE3)pLysS 세포에서 발현된 히스티딘 태깅된 효소에 적합하다. 10 ml 의 하룻밤 배양물을, 각 1 L 의 계획된 성장을 위해 제조했다. 적절한 항생제 (50 mg/ml 카나마이신, 50 mg/ml 클로람페니콜, 및/또는 50 mg/ml 카르벤실린) 를, 25 ml 플라스크 내 10 ml 의 LB 배지에 첨가하고, 신선한 플레이트의 세포에서 또는 글리세롤 동결된 세포 스톡에서 직접적으로 취한 1 개의 콜로니에 접종했다. 배양물을 30 ℃ 에서 하룻밤 ~220 rpm 으로 진탕하면서 성장시켰다. 명 (day) 배양물을, 각각의 배양물에 대해 적절한 항생제를 갖는 LB 배지 1 리터 중에서 제조했다. 각 1 L 의 명 배양물을 10 ml 의 하룻밤 배양물과 접종시키고 OD600 가 ~0.4-0.6 에 도달할 때까지 ~220 rpm 에서 진탕하면서 30-37 ℃ 에서 성장시켰다. 명 배양물을 이어서 400 μM IPTG 로 유도시키고 ~5-6 시간 동안 220 rpm 에서 진탕하면서 30℃ 에서 성장 지속을 가능하게 했다. 이어서, 세포를 10 분 동안 4 ℃ 에서 10,000 x g 로 원심분리하여 수확했다. 수확 후, 세포를 직접 사용하거나 또는 공정 대기 상태까지 (ready to process) -80℃ 에서 보관했다.
6XHis-태깅된 IspS 의 정제
BL21(λDE3)pLysS 세포로부터 히스티딘 태깅된 효소를 정제하기 위해, 세포를 조심스레 신선한 분해 버퍼 (분해 버퍼: Ni 세정 (wash) 버퍼 + 0.5 mM PMSF, 0.01% Tween-20, 1 mg/ml 리소자임, 0.2 mg/ml DNaseI; Ni 세정 버퍼: 50 mM NaH2PO4, 300 mM NaCl, 20 mM 이미다졸, pH 8.0) 에서 재현탁하였다. 1L 의 세포 펠릿 당 대략 40-50 ml 의 분해 버퍼를 사용했다. 이어서, 세포를 약 30 분 동안 얼음 상에서 인큐베이션하였다. 이어서, 세포 현탁액을 세포파쇄기 (대(大) 세포파쇄기; 1200 psi/고 셋팅) 를 통해 분해물이 투명하게 보이기 시작할 때까지 2-3 회 통과시켜 완전히 분해시켰다. 분해물의 샘플을 활성 검정 및 겔 분석 (~100 ㎕) 을 위해 저장했다. 이어서, Sorvall Discovery 90SE 초원심분리기에서 30 분, 4℃, 30,000xg 로 분해물을 원심분리하여, 상기 분해물을 투명하게 만들었다. 상청액을 제거 및 보유했다. "투명하게 된 분해물" 의 샘플을 활성 검정 및 겔 분석 (~100 ㎕) 을 위해 저장했다.
투명해진 분해물을 0-100% Ni 버퍼 B 구배를 이용하여 HisTrap HP 컬럼 (GE Healthcare) 상에서 실시했다. 이어서, 샘플을 제조자의 지침에 따라 SDS-PAGE 겔 (4-12% 겔 NUPAGE, Invitrogen) 로 분석했다. 원하는 분획분을 스핀 필터 (Vivaspin-20, Sartoris,) 상에서 농축한 다음 Sephadex G25 수지로 패킹된 HiPrep 26/10 Desalting 컬럼 (GE heathcare) 을 걸쳐 탈염시켰다. G-25 버퍼는 50 mM HEPES, 50 mM NaCl, 및 1 mM DTT, pH 7.4 로 이루어졌다. 이어서, 원하는 샘플을 0% Q seph 버퍼 A 에서 100% Q seph 버퍼 B (Q seph 버퍼 A: 50 mM Tris, 0.05 M NaCl, 1 mM DTT, pH 7.6, 및 Q seph 버퍼 B: 50 mM Tris, 1.0 M NaCl, 1 mM DTT, pH 7.6) 로의 구배 용리를 이용하는 HiTrap Q HP 컬럼 (GE) 을 통해 정제하였다. 원하는 단백질을 함유하는 분획분을 분석하고 농축했다. 이어서, 샘플 버퍼를, Sephadex G25 수지로 패킹된 Hi Prep 26/10 Desalting 컬럼 (GE heathcare) 에 상기 샘플을 통과시켜 50 mM HEPES, 50 mM NaCL, pH 7.4 및 1 mM DTT 로 교환시켰다. 겔 여과의 최종 연마 (polishing) 단계를, 필요할 경우에 사용했다. 샘플을, 겔 여과 버퍼 (50 mM HEPES, 150 mM NaCl, 1mM DTT, pH 7.4) 중 Hi Load 26/60 Superdex 200 prep grade (GE) 를 통해 통과시켰다. 이어서, 분획분을 분석하고 농축했다. 이어서, 샘플을 -80 ℃ 에서 보관했다. 밴드 분석을 위한 제조에 있어서, 샘플을 SDS-PAGE 겔 (4-12% NUPAGE 겔, Invitrogen) 상에서 수행하고, 염색하고, 원하는 밴드를 잘라내고 하기와 같이 처리했다.
III. 이소프렌 신타아제의 질량 분석
샘플 제조
겔 내부 분쇄 (In-Gel Digestion) 및 LCQ-Deca 질량 분석 절차를 이용했다 (Modified Rosenfeld in-gel Digest Protocol) (Rosenfeld 등, Anal. Biochem. (1992) 203, 173-179; Hellman 등, Anal Biochem, (1995) 224, 451-455). 정제된 샘플의 이소프렌 신타아제를 4-12% SDS-PAGE (NUPAGE, Invitrogen) 상에 작동시키고, Coomassie Brilliant Blue R-250 (Thermo Scientific) 또는 SimplyBlue Safe Stain (Invitrogen) 로 염색하였다. 관심 밴드(들)을 겔에서 오려내어 탈염색하였다. 각각의 겔 조각 (slice) 를 ~1 mm x 1mm 의 작은 조각으로 깍둑썰기하고, 0.65 mL "번들번들한" (실리콘 처리된) 튜브 (PGC Scientific) 에 넣었다. 약 100㎕ 의 25mM NH4HCO3/50% ACN/H2O 를 각 튜브에 첨가하고, 10 분간 보르텍스 (vortex) 하였다. 상청액을 추출 및 폐기했다. 이러한 단계들을 2 회 반복했다. 이어서, 겔 조각들을 Savant SpeedVac 중에 작동시켜 건조했다 (~ 20 내지 30 분).
이어서, 샘플을 환원 및 알킬화시켰다. 환원을 위해서는, 25 mM NH4HCO3 중 10 mM DTT (신선한 것으로 제조) 25 ㎕ (또는 커버하기에 충분량) 를 건조된 겔에 첨가했다. 이어서, 튜브를 보르텍스하고 잠시 회전시켰다. 반응물을 50 ℃ 에서 1 시간 동안 인큐베이션하였다. 알킬화를 위해서는, 상청액을 제거하고, 25 mM NH4HCO3 중 25 ㎕ 이상의 55 mM 요오도아세트아미드 (IAA) 를 겔에 첨가했다. 반응 튜브를 다시 보르텍스하고, 잠깐 회전시켰다. 반응물을 1 시간 동안 실온에서 암실에 두었다. 상청액을 제거하고 겔을 ~ 100 ㎕ 의 25mM NH4HCO3/50% ACN/H2O 로, 10 분 동안 보르텍스 및 잠시 회전시켜 세정했다. 상청액을 제거하고, 세정 단계를 1 회 반복했다. 겔 조각들을 이어서 SpeedVac (~ 15 -30 분) 중에서 건조시켰다.
400 ㎕ 의 0.1% n-옥틸 B-D-글루코피라노시다아제 수를, 100 uL 의 8M 우레아에 첨가하여, 분쇄 버퍼를 제조하였다. 400 uL 의 상기 분쇄 버퍼를 20 ug 의 신선하게 제조된 트립신에 첨가했다. 0.05 ㎍/㎕ 의 서열화-등급 (sequencing-grade) 트립신을 400 uL 의 1.6 M 우레아 용액에 용해시킨 20 ㎍ 서열화 등급 트립신 (Promega) 의 1 개의 바이알로부터 제조하였다. 트립신 효소 용액을 겔 조각을 커버하기에 충분하도록 첨가했다. 튜브를 파라필름으로 커버하고 37 ℃ 에서 하룻밤 (16-20 시간) 인큐베이션하였다. 겔 보다 약간의 여분의 버퍼가 존재함을 보장했다
겔로부터 잠시 분쇄물을 보르텍스 및 회전시켜 펩티드를 추출했다. 분쇄 용액을 겔 로딩 팁을 이용해 0.65 mL 실리콘처리된 튜브로 옮겼다. 50 ㎕ (커버하기에 충분량) 의 50% ACN/0.1% FA/H2O 를 겔 조각에 첨가하고, 샘플을 10 분 동안 보르텍스한 다음, 회전하고, 5 분 동안 초음파처리했다. 추출된 펩티드를 하나의 튜브에 모았다. 겔 조각이 겉보기에 흰색으로 되고 크기가 줄어들 때까지 추출 단계를 2 내지 3 회 이상 반복했다. 추출된 분쇄물을 보르텍스, 회전하고 Speed Vac 에서 건조하여 부피가 55 ㎕ 되게 했다. 부피가 55 ㎕ 미만이었을 경우에는, 충분한 0.1% FA 를 첨가하여, 최종 부피가 55 ㎕ 가 되게 했다.
질량 분광법
샘플을 Thermofinnigan (San Jose, CA) LCQ-Deca 전기분무 이온화 (electrospray ionization;ESI) 이온-트랩 질량 분광기에 주입하였다. Vydac C18 컬럼 (5μ, 300A, 0.2 x 150 mm, Michrom Bioresources, Auburn, CA) 를 200 ㎕/min 유속으로 이용했다. 주입 부피는 50 uL 이었고, 온-라인 트래핑 카트리지 (Peptide CapTrap, Michrom Bioresources, Auburn, CA) 를 통해 여과한 후, 컬럼에 로딩했다. 겔-내 분쇄물의 분리를, 하기 구배로 수행했다: (용매 A: H2O 중 0.1% 트리플루오로아세트산 (J.T. Baker, Phillipsburg, NJ), 용매 B: 아세토니트릴 중 0.08% 트리플루오로아세트산 (J.T. Baker, Phillipsburg, NJ)):
표 11-1.
구배
표
질량 분광 결과
단백질의 6.4 ㎍ 분취물을 5 개의 레인으로 4-12% bis-tris NUPAGE 겔 (Invitrogen) 상, MOPS 버퍼에 로딩하고, 50 분 작동하였다. 상술한 바와 같이, 겔을 2 분 동안 염색한 다음 15 분 동안 탈염색하였다. 겔을 H2O 중에 세정한 다음, 모든 밴드를 오려내, 작은 조각으로 컷팅하고 탈염색하였다. 겔 조각을 DTT/IAA 각각으로, 1 시간 동안, 각각 52 ℃ 및 RT 에서, 환원 및 알킬화하였다. 트립신을 하룻밤 분쇄를 위해 첨가했다. 추출된 펩티드를 LCQ-Deca 상에서 작동시켰다. 도 21 및 22 는, 질량 분광 분석 결과를 보여준다. 저 (lower) 더블릿 밴드 (도 21) 는 IspS 로 동정된다. 도 22 는, (pDu27 내 N-말단 His-태깅된 IspS 단백질의 펩티드 서열에 의하면) 아미노산 39, 40, 42, 및 44 뒤에 N-말단 절단물이 발견되었음을 나타낸다. IspS 의 C-말단은 온전하다.
IV. N-말단 절단된 IspS 변이체의 구축:
친화 태그 (affinity tag) 가 없는 모든 절단된 구축물을, PCR 증폭으로부터 주형 P.alba pET24a 를 이용하는 QuickChange 부위-특이적 돌연변이유발 키트 (Stratagene) 를 이용하여 제조했다. 약 50 ng 의 주형 DNA 을, 각 관련 절단물에 상응하는 정방향 (For) 및 역방향 (Rev) 프라이머 쌍 (QC MSV For 및 QC MSV Rev, 예를 들어 표 11-2 참조) 으로 돌연변이유발된 PCR 생성물의 증폭에 사용했다 (Eppendorf Mastercycler Gradient PCR 기기 사용). 하기의 PCR 반응 혼합물을 이용했다: 1 ㎕ P. alba pET24a, 5 ㎕ 10X PfuUltra HF 버퍼, 1 ㎕ dNTP, 1 ul (50 μM) 프라이머-For (예 QC MSV For), 1 ㎕ (50 μM) 프라이머-Rev (예 QC MSV Rev), 2 ㎕ DMSO, 39 ㎕ diH2O, 1 ㎕ PfuUltra HF 폴리머라아제 (Stratagene). 하기의 PCR 사이클 파라미터를 사용했다: 95 ℃ 1 분, 95 ℃ 30 초, 55 ℃ 1 분, 68 ℃ 7.3 분 (1 사이클) 후, 95 ℃ 30 초, 55 ℃ 1 분, 68 ℃ 7.3 분 (총 18 사이클) 다음 4 ℃. PCR 생성물을 1-2 ㎕ 의 DpnI (Roche) 로 1-3 시간 동안 37 ℃ 에서 처리했다. 5 ㎕ 분취량의 DpnI 처리된 생성물을 0.8% E-겔 (Invitrogen) 상에서 시각화하였다. 1 ㎕ 분취량의 각 생성물을 화학적 적격 E. coli Top10 세포 (Invitrogen) 에 제조자 프로토콜에 따라 형질전환시켰다. 형질전환체를, 카나마이신을 50 ㎍/ml 농도로 함유하는 (Kan50) LB 배지에 있어서 선별하고, 37 ℃ 에서 하룻밤 인큐베이션하였다. 각 형질전환체의 5 개의 콜로니를 선별하고 정지상까지 3 ml 액체 LB Kan50 에서 성장시켰다. 플라스미드를 제조자가 추천하는 프로토콜에 따라 Qiagen miniprep 키트를 이용해 정제했다. 정제된 플라스미드를 T7 정방향 및 역방향 프라이머로 서열화 (Quintara Biosciences 에 의함) 하고, 이의 각 절단물에 대해서 확인했다. 생성된 플라스미드 (pDU39 내지 pDU43, 표 11-4, 도 23-34 참고) 를 화학적 적격 E. coli BL21(λDE3) pLysS (Invitrogen) 로 제조자의 추천되는 프로토콜에 따라 형질전환시켰다. 표 X 는 절단된 IspS 효소의 발현에 사용된 균주를 기술한다.
친화성 (6XHis) 및 단백질분해 (TEV, Tobacco Etch Virus) 태그를 갖는 구축물을, PCR 반응용 주형으로서 P. alba pET24a 를 이용해 제조했다. PCR 반응 혼합물을 하기와 같이 제조했다: 1ul (P. alba pET24a), 5ul 10X PfuUltraII 융합 버퍼, 1ul dNTP (10 mM), 1ul 프라이머 (50 μM) Alba FL-NdeI-For 또는 Alba TRC (MEA)-NdeI-F, 1ul 프라이머 (50uM) Alba FLTRC (+) TEV-R, 41 ul diH2O 및 1ul 의 PfuUltra II 융합 DNA 폴리머라아제 (Stratagene). PCR 사이클 파라미터는 하기와 같았다: 95 ℃ 1 분, 95 ℃ 30 초, 55 ℃ 20 초, 72 ℃ 25 초 (1 사이클) 다음, 95℃ 30 초, 55 ℃ 20 초, 72 ℃ 25 초 반복 (추가의 28 사이클) 후, 72℃ 3분 다음 4 ℃. 증폭 및 생성물의 정확한 분자량의 0.8% E-겔 (Invitrogen) 상에서의 시각화에 의한 확인 후, PCR 생성물을 제한 효소 NdeI 및 XhoI (Roche) 로 2 시간 동안 37 ℃ 에서 분쇄한 다음, 제조자의 추천되는 프로토콜에 따라 Qiaquick Gel Purification system (Qiagen) 을 이용해 겔 정제하였다. 3 ㎕ 의 정제된 생성물을 NdeI 및 XhoI (Roche) 로 분쇄된 pET-24a (Invitrogen) 에 라이게이션하고, 겔 정제하고 제조자의 추천되는 프로토콜에 따라 인산기이탈 반응 (SAP, 쉬림프 알칼리 포스파타아제 이용) (Promega) 하였다. T4 리가아제 (NEB) 를 라이게이션 반응에 사용하고, 이를 16 ℃ 에서 하룻밤 인큐베이션하였다. 라이게이션 반응물을 수중으로 30 분 동안 투석하였고, 2 ㎕ 의 반응물을 사용하여, MCM331 (하기 참고) 적격 세포를 전기천공하였다. 세포를 30 ℃ 에서 2 시간 동안 회수되게 한 후, 플레이트에 퍼뜨린 5 mM (R)-(-)-메발로노락톤 (MVA) (Sigma) 과 Kan50 상에서 선별하였다. 양성의 형질전환체를 3 ml 의 액체 LB Kan50 에 접종하고, 플라스미드를 QIAPrep Spin miniprep 키트 (Qiagen) 를 이용해 단리하였다. 삽입물을 NdeI 및 XhoI(Roche) 를 이용한 제한 분쇄로 확인하였고, 양성의 클론을 T7 프로모터 및 T7 터미네이터 서열화 프라이머를 이용해 서열화하였다 (Quintara Biosciences). 1 ㎕ 의 각 플라스미드 (플라스미드 설명에 대한 표 11-4 및 도 35-39 참고) 를 화학적 적격 E. coli BL21(λDE3) pLysS (Invitrogen) 로 제조자가 권고하는 프로토콜에 따라 형질전환시켰다. 형질전환체를 LB Kan50 + Cm35 (클로람페니콜 35 ug/ml) 플레이트 상에서 선별하였고, 37 ℃ 에서 인큐베이션하였다. 모든 발현 균주의 설명에 대해서는 표 11-5 를 참조한다.
균주 MCM331 을 하기와 같이 제조하였다. 메발로네이트 키나아제, 메발로네이트 포스페이트 키나아제, 메발로네이트 피로포스페이트 데카르복실라아제, 및 IPP 이소머라아제를 포함하는 합성 오페론을 E. coli 의 염색체에 혼입시켰다. 바람직하다면, 오페론의 5' 에 상이한 프로모터를 혼입함으로써 발현물을 변경할 수 있다.
i) 표적 벡터 구축
attTn7 부위를 혼입을 위해 선택했다. 상동성 상류 (upstream) 영역 (attTn7 up) (프라이머 MCM78 및 MCM79) 및 하류 (downstream) (attTn7 down) (프라이머 MCM88 및 MCM89) 를, MG1655 세포로부터 PCR 로써 증폭하였다. 1 ㎕ 10 μM 프라이머, 3 ㎕ ddH2O, 45 ㎕ Invitrogen Platinum PCR Supermix High Fidelity, 및 스크래핑된 MG1655 의 콜로니를 갖는 50 ㎕ 반응물을 2:00 동안 94 ℃ 에서 변성시키고, 25 회 사이클 (94 ℃ 에서 2:00, 50 ℃ 에서 0:30, 및 68 ℃ 에서 1:00) 하고, 7:00 동안 72 ℃ 에서 신장시키고, 4 ℃ 로 냉각하였다. 이렇게 수득한 DNA 를 제조자 지침에 따라 pCR2.1 (Invitrogen) 로 클로닝하여, 플라스미드 MCM278 (attTn7 up) 및 MCM252 (attTn7 down) 을 도모하였다. MCM252 로부터 분쇄 및 겔 정제된 832 bp ApaI-PvuI 절편을 ApaI-PvuI 분쇄되고 겔 정제된 플라스미드 pR6K 에 클로닝하여, 플라스미드 MCM276 를 제조했다. MCM278 로부터 분쇄 및 겔 정제된 825bp PstI-NotI 절편을, PstI-NotI 분쇄되고 겔 정제된 MCM276 에 클로닝하여, 플라스미드 MCM281 를 제조했다.
ii) 하위 경로 및 프로모터의 클로닝
MVK-PMK-MVD-IDI 유전자를, 제조자 지침에 따라 Roche Expand Long PCR 시스템을 이용해 프라이머 MCM104 및 MCM105 로 pTrcKKDyIkIS 로부터 증폭하였다. 이러한 생성물을 NotI 및 ApaI 로 분쇄하고, NotI 및 ApaI 로 분쇄되어진 MCM281 로 클로닝하고, 겔 정제하였다. 프라이머 MCM120 및 MCM127 를 Stratagene Pfu Ultra II 를 이용해 GeneBridges FRT-gb2-Cm-FRT 주형 DNA 로부터 CMR 카세트를 증폭하는데 사용했다. 4:00 동안 95 ℃ 에서 변성하고, 0:20 동안 95 ℃, 0:20 동안 55 ℃, 2:00 동안 72 ℃ 의 5 사이클, 0:20 동안 95 ℃, 0:20 동안 58 ℃, 2:00 동안 72 ℃, 10:00 동안 72 ℃ 의 25 사이클 후 4 ℃ 로 냉각하는 PCR 프로그램을, 1uL ~10ng/㎕ 주형, 1 ㎕ 각 프라이머, 1.25 ㎕ 10mM dNTPs, 5 ㎕ 10x 버퍼, 1 ㎕ 효소, 및 39.75 ㎕ ddH20 를 함유하는 네 가지의 50 uL PCR 반응물로 해서 이용했다. 반응물을 모으고, Qiagen PCR cleanup 컬럼 상에서 정제하여, 물로-세정된 Pir1 세포 (플라스미드 MCM296 를 포함함) 을 전기천공하는데 사용했다. 전기천공은 2.5V 및 200 ohms 에서 2 mM 큐벳 내에서 실시했다. 전기천공 반응물을 3 시간 동안 30 ℃ 에서 LB 중에서 회수하였다. 형질전환체 MCM330 를 CMP5, Kan50 을 지닌 LA 상에서 선별했다.
iii) E. coli 염색체로의 혼입
MCM330 로부터의 Miniprepped DNA (Qiaquick Spin 키트) 를, SnaBI 로 분쇄하고, GeneBridges 플라스미드 pRedET Carb 을 포함하는 MG1655 또는 BL21(DE3) (Novagen) 를 전기천공하는데 사용했다. 세포를 30 ℃ 에서 ~OD1 까지 성장시키고, 0.4% L-아라비노오스로 37 ℃ 에서 1.5 시간 동안 유도했다. 이들 세포를 3 회 4 C ddH2O 중에서 세정한 후, 2 ㎕ 의 DNA 로 전기 천공하였다. 혼입체를 클로람페니콜 (5 ㎍/ml) 를 함유하는 L 아가 상에서 선별하고, 후속해서 L 아가 + 카나마이신 (50 ㎍/ml) 상에서 성장하지 않음을 확인했다. BL21 혼입 MCM331, 및 MG1655 혼입 MCM333 를 동결하였다.
표 11-2.
프라이머
표 11-3 균주
MCM331 의
구축을 위한
프라이머
표 11-4
IspS
변이체
발현을 위한 플라스미드
표 11-5
IspS
변이체의
발현을 위한 균주
V. IspS 절단물의 생화학적 분석
각종 N-말단 절단된 IspS 효소의 상대 활성을 DMAPP 검정으로 측정했다. 상술한 균주를 96-웰 플레이트에서 DMAPP 검정을 통해 분석하였다. 모든 균주를 4세트로 하여 검정하였다. "전장" 변이체란, P. alba pET24a 플라스미드로부터 BL21(λDE3) pLysS (Invitrogen) 에서 발현되는 IspS 효소를 지칭한다.
표 11-6. N-말단
절단물의
DMAPP
검정
결과: 표 X 는 OD600 에 대해 정규화하였을 때, 균주 MD09-173 (플라스미드 pDu39 포함), MD09-175 (pDu41), MD09-176 (pDu42), 및 MD09-177 (pDu43) 모두가 (P. alba pET24a 를 갖는 균주 BL21(λDE3) pLysS 에서) "전장" 야생형 IspS 효소보다 DMAPP 활성이 더 높다는 것을 나타낸다.
VI. IspS 에서 "MEA" 절단물의 상세한 동적 분석
상대적 특이 활성을 측정하고, "N-말단 절단된" P. alba 이소프렌 신타아제의 동역학을 "전장" P. alba 이소프렌 신타아제와 비교하여 조사했다. 4 개의 상이한 구축물을 발현하는 4 가지의 균주를 이 분석에서 사용했다: P. alba pET24a 함유 BL21(λDE3) pLysS; MD09-173; MD09-165; 및 MD09-167 (상세하게 상기에서 상술한 균주) 이들 균주는 "전장" P. alba IspS, "절단된" P. alba IspS (MEA 절단), "전장" C-말단 TEV 및 His-태깅된 P. alba IspS, 및 "절단된" C-말단 TEV 및 His-태깅된 P. alba IspS 각각을 발현한다. 하기에 기술되는 실험에서, "절단된" 이란, 구체적으로 P. alba IspS 의 MEA 변이체를 지칭한다.
모든 균주를 30 mg/L 클로람페니콜(Cm) 및 50 mg/L 카나마이신을 함유하는 LB 에 접종하고, 하룻밤 2 mL 배양물 튜브에서 37 ℃ 에서 성장시켰다. 다음날 아침에 하룻밤 배양물을 30 mg/L 클로람페니콜(Cm) 및 50 mg/L 카나마이신을 함유하는 LB 브로쓰 25 mL 에서, 1:100 희석하고, 37 ℃ 에서 OD~0.5 까지 성장시켰다. 각 균주를 3 세트로 성장시켰다. 이어서, 배양물을 400 uM IPTG 로 유도하고, 30 ℃ 에서 4 시간 동안 인큐베이션하였다. 20 mL 의 각 배양물을 20 분 동안 3000 x g 에서 원심분리하고, 상청액을 폐기하였다. 펠릿을 하룻밤 -80 ℃ 에서 동결시켰다. 펠릿을 100 mM Tris, 100 mM NaCl, 0.25 mg/mL 리소자임 및 0.25 mg/mL DNAase, pH 8 를 함유하는 버퍼 2 mL 중에서 재현탁하였다. 세포 현탁액을 20,000 psi 에서 2 회 세포파쇄 (french pressed) 하였고, 그 다음 분해물을 20 분 동안 14000 x g 에서 원심분리하여, 동역학 연구 및 단백질 농도 측정에서 사용되는 무세포 추출물을 수득하였다.
특이 활성을 측정하기 위해, 각 균주로부터의 5 ㎕ 의 무세포 추출물을, 기밀 2 mL 바이알 내 30 ℃ 에서 15 분 동안 100 ㎕ 최종 부피로 100 mM Tris 및 100 mM NaCl (pH 8) 을 함유하는 버퍼 중 5 mM DMAPP, 50 mM MgCl2 와 함께 인큐베이션하였다. 반응을, 100 ㎕ 의 500 uM EDTA, pH 8 첨가로 종결시켰다. 샘플을 GC-MS 로 분석하여, 바이알의 상부공간 내 이소프렌의 농도를 측정했다.
kcat 및 KM 을 측정하기 위해서, 각 균주로부터의 5 uL 의 무세포 추출물을, 기밀 2mL 바이알 내에서 30 ℃ 에서 15 분 동안 100 ㎕ 의 최종 부피로 100 mM Tris, 50 mM MgCl2 및 100 mM NaCl (pH 8)를 함유하는 버퍼 중 0.625 ~ 40 mM DMAPP 범위의 농도로 하는 DMAPP 와 인큐베이션하였다. 반응을 100 ㎕ 의 500 mM EDTA, pH 8 를 첨가하여 종결하였다. 샘플을 GC-MS 로 분석하여, 바이알 상부공간 내 이소프렌의 농도를 측정하였다. Kaleidagraph 및 하기 비경쟁 기질 억제에 대한 적합을 이용하여 데이타를 분석하였다: 속도/E = kcat*S/(KM+S*(1+S/Ki)). 2.5 mM DMAPP 와의 MD09-167 를 2 세트로 수행한 것을 제외하고는 모든 데이타를 3 세트로 수행하였다.
무세포 추출물을 Caliper 미세유체성 (microfluidic) 전기영동 기기 (Caliper Life Sciences, Hopkinton, MA, USA) 상에서 작동시켜, 각 샘플 내 이소프렌 신타아제의 양을 수량화하였다. 미세유체성 칩 및 단백질 샘플을 제작자 지침에 따라 제조했다 (LabChip®HT Protein Express, P/N 760301). 배양 분해물을, 30 분 동안 실온에서 0.1% Tween 20, 0.1 mg/ml 리소자임, 1.0 ug/ml DNAse 함유하는 50 mM Tris pH 8.0 를 첨가함으로써 96-웰 마이크로타이터에서 제조한 후, 원심분리하였다. 이어서, 상청액을 또 다른 96 웰 플레이트에 옮기고, -20 ℃ 에서 사용할 때까지 보관했는데, 사용시에는 상청액을 실온에서 30 분 동안 융해하였다. 잠시 진탕한 후, 2 ㎕ 의 각 배양물 샘플을, 7 ㎕ 샘플 버퍼 (Caliper)을 함유하는 96-웰 PCR 플레이트 (Bio-Rad, Hercules, CA,USA) 에 옮긴 후, 이 플레이트를 자동온도조절 플레이트 가열기 상에서 90 ℃ 로 5 분 동안 가열하였다. 플레이트를 냉각되게 한 후, 35 ㎕ 물을 각 샘플에 첨가하였다. 이어서, 플레이트를 제작자에 의해 공급되고 보정된 단백질 표준에 따라 기기 상에 놓았다. 이 기기는 샘플을 단백질에 비공유 결합하는 형광 염료와 혼합한 후 겔 매트릭스를 통해 전기영동함으로써 기능한다. 단백질이 칩 내 초점을 지남에 따라, 형광 신호가 기록되고, 단백질 농도가 이 신호를 단백질 표준의 보정 세트에 의해 만들어진 신호와 비교하여 수량 평가함으로써 측정된다.
표 11-7. 이소프렌
신타아제의
k
cat
및
K
M
및 특이
활성값
파라미터는, 하기의 비경쟁 기질 억제 방식식을 속도/[E] 대 [DMAPP] 에 대해 수득된 데이타에 적합시켜 결정하였다:
특이 활성 (S.A.) 은, 전체의 세포 분해물의 상청액으로부터 5 mM DMAPP, 50 mM MgCl2, 100 mM Tris, 100 mM NaCl, 및 2.5-4.5 ㎍ 이소프렌 신타아제를 함유하는 반응물에 대해서 산출하였다. 반응을 30 ℃ 에서 15 분 동안 3 세트로 독립적으로 성장하는 배양물을 이용하여 수행했다.
결과/논의:
각 단백질의 특이 활성을 측정했다 (도 40 및 표 11-7). 절단된 이소프렌 신타아제의 특이 활성은, 전장 이소프렌 신타아제의 특이 활성보다 약 2 배 더 컸다. C-말단 His-태깅된 전장 이소프렌 신타아제는 전장 이소프렌 신타아제와 대략적으로 동일한 특이 활성을 도출하였다. C-말단 His-태깅된 절단된 이소프렌 신타아제는 태깅되지 않은 절단된 이소프렌 신타아제보다 덜한 특이 활성을 보이나, 두 전장 이소프렌 신타아제의 특이 활성 보다는 더 컸다.
DMAPP 에서의 이소프렌으로의 전환 속도를 DMAPP 농도 범위에 걸쳐 분석하여, 효소의 kcat 및 KM 파라미터를 측정하였다(도 41 및 42 및 표 11-7). 효소 모두 DMAPP 에 의한 비경쟁적 기질 억제와 부합하는 속도 프로파일을 보였다. 전장 구축물에 대한 Ki 는, Ki 를 변경하고 데이타의 최대 적합 (R-값) 을 관찰함으로써 결정된 바와 같이, 절단된 구축물에 대한 Ki 보다 더 컸다 (상기 데이타는 나타내지 않음). 이 문헌에서의 도면에서 모든 데이타는 10 mM 의 Ki 에 적합되어 있다. 절단된 이소프렌 신타아제의 KM 은 전장 이소프렌 신타아제에 비해 감소한다. 따라서, 기질 농도가 감소함에 따라, 절단된 이소프렌 신타아제 대 전장 이소프렌 신타아제의 이소프렌 신타아제 활성간 비율은 증가할 것이다 (도 43). 절단된 이소프렌 신타아제의 kcats 는 전장 이소프렌 신타아제에 비해 증가하였다. 이로써, 모든 기질 농도에서 전장 이소프렌 신타아제보다 절단된 이소프렌 신타아제에 대한 이소프렌 신타아제 활성이 더 크다는 결론을 얻는다 (도 43). 다양한 DMAPP 농도에서, 전장 이소프렌 신타아제에 대한 절단된 이소프렌 신타아제의 활성 비율을 측정하였다 (도 43).
결론: "절단된" 이소프렌 신타아제는, "전장" 이소프렌 신타에제와 비교할 때 DMAPP 에서의 이소프렌으로의 전환의 촉매작용에 관해서 증가된 kcat 값 및 감소된 KM 값을 보인다. "절단된" 이소프렌 신타아제의 특이 활성은, "전장" 이소프렌 신타아제의 특이 활성에 비해 증가된다. 가장 활성인 이소프렌 신타아제는 비태깅 절단된 이소프렌 신타아제 "MEA" 변이체 (균주 MD09-173) 였다. 절단된 이소프렌 신타아제는, 전장 이소프렌 신타아제와 비교시, 이소프렌을 생성하는데 사용되는 유기체에서 이소프렌 신타아제 활성을 증가시킬 수 있다.
실시예
12
이소프렌
신타아제
풍부 -
DMAPP
독성의 경감
이 실시예는 동적 개선, 증가된 발현, 증가된 용해성, 또는 DMAPP 가 이소프렌 신타아제에 의해 더 효과적으로 이소프렌으로 전환시키는 임의의 기타 수단을 통해, 효소에 더 나은 활성을 부여하는 IspS 내 잔기 변화를 동정한다. 이러한 절차는 개선된 IspS 변이체의 발현에 의해 DMAPP 의 세포독성 세포내 수준의 경감을 가능하게 한다. IspS 변이체의 이종 혼합물을 발현하는 세포군에서, 최고의 효소는 이의 숙주 균주의 더 나은 성장을 가능하게 할 것이고, 혼합 집단에서 풍부할 것이다.
I. 균주 구축
람다 프로모터가 혼입된 mKKDyI 를 추진하는 균주 MCM518-521 및 528-531 의 구축물은 하기와 같다. 프라이머 MCM120 및 MCM224 (표 12-1) 을, 제작자 프로토콜에 따라 Stratagene Herculase II Fusion 키트를 이용해, GeneBridges FRT-gb2-Cm-FRT 주형으로부터 내성 카세트를 증폭시키는데 사용했다. 4 가지의 50 ㎕ 반응물을 하기와 같이 사이클을 돌렸다: 95℃, 2 분; 30 사이클 동안 (95 ℃, 20 초, 55 ℃, 20 초, 72 ℃, 1 분); 72 ℃, 3 분; 및 냉각하기까지 4℃. 4 가지의 반응물을 모으고, 제작자 프로토콜에 따라 Qiagen PCR 컬럼 상에서 정제하고 60 ㎕ EB 로 55 ℃ 에서 용리하였다.
플라스미드 pRedET-carb (GeneBridges) 을 MCM446 로 전기천공하였다. 형질전환체를 1 시간 동안 SOC (Invitrogen) 중 30 ℃ 에서 진탕함으로써 회수한 후, 카르베니실린 (50 ㎍/ml) (carb50) 를 함유하는 LB 플레이트 상에서 30 ℃ 에서 하룻밤 선별하였다. 카르베니실린 내성 콜로니를 MCM508 로서 동결했다 (표 12-2).
5mL LB/carb50 중 신선한 스트리크 (streak) 로부터 균주 MCM508 를 30 ℃ 에서 ~ 0.5 의 OD600 로 성장시켰다. 40mM L-아라비노오스를 첨가하고, 배양물을 37 ℃ 에서 1.5 시간 동안 인큐베이션하였다. 세포를 수확하고, 3 ㎕ 의 정제된 앰프리콘으로 상기에서와 같이 전기천공한 후 500 ㎕ SOC 중 37 ℃ 에서 1.5-3 시간 동안 회수하였다. 형질전환체를 LB/kan10 플레이트 상 37 ℃ 에서 선별하였다.
표적 유전자자리에서의 앰프리콘의 재조합을 프라이머 GB-DW 및 MCM208 로 PCR 을 통해 확인했다. 생성 앰프리콘을 서열화하여 하기 서열을 갖는 4 가지의 클론을 동정하였다. 카르베니실린-민감성 클론을 균주 MCM518-52 로서 동결하였다.
MCM518-521 를, LB kan10 플레이트 상에서 다시 스트리킹하고 37 ℃ 에서 하룻밤 성장시켰다.
균주 MCM518-521 를 LB/kan10 중 37 ℃ 에서 배양한 다음, 플라스미드 pCP20 로 전기형질전환 (electrotransformation) 하였다 (Datsenko KA, Wanner BL. One-step inactivation of chromosomal genes in Escherichia coli K-12 using PCR products. Proc Natl Acad Sci U S A. 2000 Jun 6;97(12):6640-5). 세포를 30 ℃ 에서 1 시간 동안 진탕하면서 500 ㎕ SOC 중에서 회수하였다. 형질전환체를 LB/carb50 플레이트 상 30 ℃ 에서 하룻밤 선별하였다. 다음날 아침 각 형질전환체로부터의 콜로니를 30 ℃ 에서 액체 LB/carb50 중에서 육안으로 봤을 때 탁할 때까지 성장시켰다. 이어서, 배양물을 37 ℃ 로 적어도 3 시간 동안 바꿨다. 세포를 상기 배양물로부터 LB 플레이트 상으로 스트리킹하고 하룻밤 37 ℃ 에서 성장시켰다.
다음날, 콜로니를 LB, LB/carb50 및 LB/kan10 상에 패칭 (patching) 했다. carb50 도 kan10 에서도 성장하지 않고 LB 상 상기 패치로부터 액체 LB 중에서 배양된 클론을 MCM528-531 로서 동결했다.
DNA
서열
이들 어셈블리에는 균주 MCM518-521 내 염색체 상에 삽입된 새로운 프로모터뿐 아니라 맨 처음의 mMVK ORF 를 포함한다. 이들 어셈블리의 상류는 GeneBridges FRT-gb2-Cm-FRT 카세트로부터의 서열이다. 하류는 mMVK ORF 의 나머지 다음 균주 MCM508 로부터의 하위 MVA 경로 인테론의 나머지이다.
네오-PL.2-mKKDyI (MCM521 유래) 를 BL21(λDE3) 로 형질도입하여, 균주 MD09-171 를 제조했다. MCM521 의 P1 분해물을 만들고, 표준 분자 생물학 기법 (Miller, A Short Course in Bacterial Genetics) 에 따라 BL21(λDE3) 로 형질도입하였다. 형질전환체를 Kan20 LB 배지 플레이트 상에서 선별하였다. 양성의 콜로니를 PCR 로 추가 확인하여, BL21(λDE3) 균주 내 PL.2-mKKDyI 의 존재를 확인했다. 이어서, 1 ㎕ 의 pCP20 플라스미드를 상기 균주 내로 형질전환시키고, LB + Carb50 상에서 선별 및 30 ℃ 에서 인큐베이션하였다. 양성의 형질전환체를 후속해서 LB 플레이트 상에서 스트리킹하고, 37 ℃ 에서 pCP20 플라스미드의 소실을 위해 인큐베이션하였다. 네오마이신 (카나마이신) 내성 마커의 소실을 확인하기 위해, 37 ℃ 에서 성장시킨 콜로니를 LB Kan20, LB Carb50, 및 단순 (plain) LB 플레이트 상으로 패치하였다. pCP20 를 소실한, 카나마이신 내성 마커 없는 혼입 PL.2 mKKDyI 를 갖는 균주는 카나마이신 및 카르베니실린에 민감적일 것이다. 4 KanS CarbS 를 이용하여, BL21(λDE3) 내 mKKDyI 의 존재에 대해, 모체 BL21(λDE3) 균주를 대조군으로 하여 PCR 을 통해 체크하였다. 일단 PCR 로 mKKDyI 의 존재가 확인되면, 생성 균주를 1 ㎕ 의 pLysS 플라스미드 (Invitrogen) 로 형질전환시켰다. 생성 균주인 MD09-171 는 하기에 기술된 풍부 실험에 사용하였다.
표 12-1. 균주 구축에 사용된
프라이머
표 12-2. 균주
II. 메발론산에 의한 MCM531 의 성장 억제
MCM531 (균주 설명 참고) 의 하룻밤 배양물을 0.05 의 OD600 (이는 96-웰 플레이트 판독기에서 약 0.005 의 OD600 에 해당함) 로 다시 희석하였다 (SpectraMax M2, Molecular Devices). 이어서, 희석한 배양물을, 0, 1, 5, 10, 15 또는 20 mM MVA 가 첨가된, 표준 TM3 배지 ((13.6 g K2PO4, 13.6 g KH2PO4, 2.0 g MgSO4*7H2O), 1% 글루코오스 및 0.8 g/L Biospringer 효모 추출물 (1% 효모 추출물 최종) 로 보충되어 있음) 중 96-웰 딥 웰 플레이트 내 개별 웰에서 분획하였다. 도 44 는 각종 농도의 MVA 에서 MCM531 의 성장 곡선을 나타낸다. MVA 농도를 4세트로 검정하고, 오차 바는 무시해도 될 정도였다. 도 44 는 MCM531 이 5 mM MVA 의 농도 이상에서 성장을 심하게 억제함을 보였다.
III. IspS 의 돌연변이유발 및 선별/풍부 검정
무작위로 돌연변이유발시킨 IspS 오픈 리딩 프레임 (해독틀) 을 제조하기 위해, GeneMorph II EZ 클론 도메인 돌연변이유발 키트 (Stratagene) 를 제작자가 권고하는 프로토콜에 따라 사용했다. 주형 (Pdu39 (pET24a-P. alba (MEA))) 을 증폭하는 특이적 프라이머는 하기에 기술한다 (표 12-3, pET24 메가프라임 정방향 및 역방향). 원하는 돌연변이 빈도를 달성하기 위해, GeneMorph II 키트에 개괄된 프로토콜을 따랐다. 분자 당 2 내지 3 개의 잔기 변경을 만들기 위해, 약 150 ng 의 출발 주형 DNA 를 초기 PCR 반응에서 사용했다. 더 크거나 더 작은 주형을 더 적거나 더 많은 잔기 변경을 각각 갖는 IspS 효소를 제조하는데 사용했다. 이어서, 생성된 돌연변이체 "메가프라이머" 를 제작자가 권고하는 프로토콜에 따라 플라스미드의 나머지를 증폭하는데 사용했다.
GeneMorph II 키트로부터의 최종 PCR 생성물을 제작자가 권고하는 프로토콜에 따라 DpnI 로 처리했다. E. coli 로의 형질전환 이전에, 미세투석 (microdialysis) 에 의한 PCR 반응물을 탈염시키는 것이 필수적이었다. 전형적으로는 약 20 ㎕ 의 PCR 반응물을 미세투석에 적용하고, 이를 표준 분자 생물학 절차로써 균주 MD09-171 (표 12-2) 로의 전기천공에 사용하였다. 전기천공 후, 세포를 2 시간 동안 30 ℃ 에서 회수한 다음, LB 배지 Kan50 Cm35 로 플레이팅했다. 전체 부피의 형질전환물을 플레이팅하여 돌연변이유발 절차에 의해 생성된 모든 돌연변이들을 회수하였다.
풍부를 위해, 모든 형질전환체를 스크레이핑하고 함께 모았다. 각 풀에서의 분취물을 보관을 위해 -80 에서 동결하였다. 풍부 이전, 균주 (대조군 또는 실험 풀) 을 Kan50 을 갖는 LB 에 직접 접종하고 몇 시간 동안 성장시켜 풀 이종성 소실을 최소하였다. 이러한 회수 기간 후에, 세포를 Kan50, 5 mM MVA, 및 200 μM IPTG 를 포함하는 액체 TM3 배지 (상술하였음) 로 희석하였다 (정확한 희석도는 배지/대조군 반응물의 각 풀/공급원에 대해 실험하여 결정하였다). 이어서, 배양물을 진탕 인큐베이터 내 34℃ 에서 OD600 가 5 이하일 때 까지 두었다. 이때, 플라스미드를 1 ml 의 "풍부" 배양물로부터 miniprep protocol (Qiagen) 을 통해 정제하였다. 그 후, 상기 플라스미드 제조물을 상술한 바와 같은 전기적격 (electrocompetent) MD09-171 세포 내로 형질전환시켰다. 형질전환된 세포를 2 시간 동안 항생제가 없는 LB 배지에서 회수한 다음, 상술한 바와 같이 Kan50, 5 mM MVA 및 200 μM IPTG 를 갖는 TM3 로의 희석에 의한 풍부의 후속 라운드에 적용시켰다. 이러한 배양물을 진탕 인큐베이터내로 34℃ 에서 이것이 상술한 바와 같이 5 이하의 OD600 에 도달할 때까지 두었다. 이어서, 플라스미드를 정제하고, 재형질전환하고 및 "풍부"의 추가 라운드에 적용했다. 풍부 프로세스는 5 또는 6 라운드의 선별, 플라스미드 정제 및 재형질전환동안 지속되었다. 상기 프로세스는 배양물이 균질해질 때까지, 즉 이것이 서열 분석에 의하면 IspS 의 오직 한 변이체 만을 함유할 때까지 지속하였다.
풍부의 마지막 라운드 후에, 플라스미드 풀을 화학 적격 E. coli Top10 세포 (Invitrogen) 내로 제작자가 권고하는 프로토콜에 따라 형질전환하였고, 회수하고, Kan50 을 갖는 LB 배지에 플레이팅하고, P. alba IspS 의 야생형 서열과의 비교하기 위해 완벽한 서열화 (Quintara Biosciences) 를 의뢰했다. 서열화에 사용된 프라이머는 하기에 기술한다.
표 12-3.
IspS
돌연변이유발 및 서열화에 사용된
프라이머
IV. 풍부/DMAPP 독성 경감에 의해 동정된 각 잔기 변경:
선별/풍부로부터 단리된 플라스미드를 완전히 서열화하였다. 하기 잔기 변경을 서열화 (Quintara Biosciences) 에 의해 확인했다. 잔기 넘버링은 P. alba "전장" 서열에 상응하고 (P. alba pET24a; SEQ ID NO:120), 여기서, 출발 메티오닌이 아미노산 넘버 1 이다. 동정된 잔기 변경에는 하기가 포함된다: V10M, F12S, T15A, E18G, V58I, V58F, L70Q, L70V, L70T, T71P, V79L, E89D, G94A, S119F, F120L, G127R, E175V, T212I, S257A, R262G, A266G, F280L, N297K, F305L, L319M, E323K, A328T, D342E, A359T, K366N, E368D, L374M, S396T, V418S, K438N, H440R, T442I, T442A, I449V, A469S, K500R, K505Q, G507S, S509N, F511Y, 및 N532K.
(단일 IspS 효소에서) 잔기 변경의 조합을 풍부/DMAPP 독성 경감으로 동정했다: G127R/F511Y, L70Q/G94A/R262G/F305L, F12S/T15A/E18G/N297K, S396T/T442I, V10M/E323K, F120L/A266G, K438N/K500R, V79L/S509N, E175V/S257A/E368D/A469S, T71P/L374M, F280L/H440R, E89D/H440R, V58F/A328T/N532K, S119F/D342E/I449V, 및 K366N/G507S.
실시예
13
부위 포화 라이브러리 (
SSL
) 의 구축 및
L70R
변이체의
생화학 분석
이 실시예에는 상술한 선별/풍부 절차에 의해 동정된 부위, 및 IspS 의 용해성, 발현 및 활성에 대한 이의 효과와 관련해 잠재적으로 관심대상인 기타 부위 (활성 부위, 포플러 종 간 보존됨) 에서 가능한 아미노산 치환의 조사를 포함한다.
I. 균주 구축
상술된 선별/풍부 절차로 동정된 잔기 (L70, G94, R262, F305) 를 분석을 위해 선택했다. 나아가, 추정상 기질 결합에 관여하는 잔기 (F303, V3065, F385, S412, Q416, F450) 및 각종 포플러 종 간 상이한 잔기 (예 V418, T442) 를 추가 분석을 위해 선택했다 (넘버링은 P. alba IspS 의 "전장" 아미노산 서열에 상응한다). 아미노산 치환들의 무작위 풀 (Site Saturation Library, SSL) 을 만들기 위해, pDu39 (상기 설명 참고) 을, 하기에 나타낸 QC 프라이머 (표 13-1) 로 QuickChange (Stratagene) 돌연변이유발에 제작자가 권고하는 프로토콜에 따라 적용했다. PCR 반응물은 하기와 같이 제조되었다: 1 ㎕ pDu39, 5 ㎕ 10X PfuUltra HF 버퍼, 1 ㎕ dNTP, 1 ㎕ (50 μM) 프라이머-For (예 QC L69 F), 1 ㎕ (50uM) 프라이머-Rev (예 QC L69 R), 2 ㎕ DMSO, 39 ㎕ diH2O, 및 1 ㎕ PfuUltra HF 폴리머라아제 (Stratagene). QuickChange 에서 PCR 사이클링 파라미터는 하기와 같다: 95℃ 1 분, 95℃ 30 초, 55℃ 1 분, 68℃ 7.3 분 (1 사이클) 다음 95℃ 30 초, 55℃ 1 분, 68℃ 7.3 분 (17 이상 사이클 동안). 이어서, 온도를 4℃ 로 감소시켰다. 상술한 잔기에 대한 코돈에서 염기 NNK 의 혼입은 주어진 부위에서 모든 20 가지의 가능한 아미노산을 나타내는 코돈의 삽입을 가능하게 한다. 1 ㎕ 의 생성된 풀의 돌연변이유발된 PCR 생성물을 DpnI 처리하고 (상술됨), 제작자가 권고하는 프로토콜에 따라 화학적 적격 E. coli Top10 세포 (Invitrogen) 로 형질전환시켰다. 전체의 형질전환 반응물을 항생제가 없는 1 ml LB 배지에서 37 ℃ 에서 1 시간 동안 회수하여 LB Kan50 로 플레이팅하였다. 다음날, 모든 형질전환체를 LB 플레이트에서 스크레이핑해내고, 철저하게 혼합하고 플라스미드를 miniprep (Qiagen) 통해 정제하였다. 이어서, 플라스미드 풀을 제작자의 프로토콜에 따라 화학적 적격 BL21(λDE3)pLysS 세포 (Invitrogen) 내로 형질전환시켰다. 형질전환 반응물을 37 ℃ 에서 1 시간 동안 1 ml LB 배지에서 회수한 다음, 양성 콜로니를 분리하기에 충분한 희석으로 LB Kan50 Cm35 상으로 플레이팅하였다. 37 ℃ 에서 하룻밤 인큐베이션한 후, 각 콜로니를 500 ul 의 액체 LB Kan50 Cm35 각각을 함유하는 96-웰 딥-웹 마이크로타이터 플레이트 (VWR) 내 각 웰에 접종하였다. 8 개의 웰 (전형적으로는 컬럼 12, A 내지 H) 내, 균주 MD09-173 (상기 참고) 또는 BL21(λDE3)pLysS (P. alba pET24a (전장) 을 가짐) 을 DMAPP 검정 대조군으로서 접종했다. 이어서, 마이크로타이터 플레이트를 반투과 막(Breathe-Easier, Diversified Biotech) 으로 밀봉하고, 30 ℃ 에서 진탕 인큐베이터 (Vertiga) 내 하룻밤 인큐베이션했다. 다음날, 96-웰 플레이트 내 각 웰로부터의 100 ㎕ 샘플을, 새 200 ul 96-웰 플레이트 내 50 ㎕ 의 50% 글리세롤과 혼합하고, -80 ℃ 에서 추가 분석할 때까지 동결했다. 이어서, 이 플레이트를 하기에 기술한 DMAPP 검정에 사용했다.
표 13-1. 돌연변이유발에 사용된
프라이머
II. 2 차 검정을 위한 "우승자" 플레이트의 제조 및 증가된 특이 활성을 지닌 변이체로서 L70R 의 동정
야생형과 비교했을 때 증가된 특이적 이소프렌 생성을 보이는 변이체를 추가 분석을 위해 선택했다. 도 45 는 개별 잔기, 이 경우에는 L70 에 대한 SSL 플레이트의 전형적인 데이타 세트를 보인다. 이 특정 플레이트로부터, 웰 C3 (27), D3 (39), 및 E3 (51) 내 샘플을 추가 분석을 위해 선택했다. DMAPP 분석에 적용했을 때 증가된 이소프렌 생산성을 보이는 상이한 잔기에서 (상술함) 기타 변이체를, -80 ℃ 에서 보관된 이의 원 SSL 플레이트 (상술함) 로부터 단리하고, 2차 스크리닝을 위해 새로운 "우승자" 플레이트로 재배열하였다. MD09-173 를 함유하는 2 개의 웰을 대조군으로서 포함하였다. 모든 변이체를 서열화하였고 (Quintara Biosciences), 상술한 DMAPP 검정에 적용했다. 서열화 결과에 대해서는 표 13-2 를 참고한다. DMAPP 검정에 있어서, 각 변이체의 단일 성장을 검정하여, 단일의 분해물을 수득하였으나, 통계적으로 유의한 데이타를 작성하기 위해 4 세트로 하였다. 샘플을 표 13-2 에서 지시된 OD600 에서 검정하였다. 단백질 분석을, Western Breeze Western 블롯 키트 (Invitrogen) 를 이용해 모든 분해물에 대해서 수행한 후, Storm860 (하기 참고) 상에서 형광 검출하였다.
III. DMAPP 검정 - 성장, 분해 및 이소프렌 측정
하룻밤 글리세롤 스톡 플레이트로부터 VP-Scientific Replication Tool patch LB Agar CM35/Kan50 대형 패치 플레이트를 이용해 글리세롤 스톡 플레이트로부터 패치 플레이트를 제조했다. 배양물을 30℃ 에서 하룻밤 (20 내지 24 시간) 인큐베이션했다. 플레이트를 4℃ 에서 1 주일 이하 동안 보관했다.
하룻밤 성장 플레이트를 500 mL 의 LB CM35/Kan50 배지로부터 제조했다. 300 ㎕/웰의 LB CM35/Kan50 배지를 딥 96 웰 플레이트로 분배 (dispensing) 했다. V&S Replication Tool 을 이용해여, 패치 접종원을 딥 96 웰 플레이트로 옮겼다. 상기 도구를 디핑 (dipping) 한 다음 핀을 웰 내에서 진탕함으로써 배지를 접종시켰다. 하룻밤 성장 플레이트를 Breathe-Easier Sealing Membrane 으로 밀봉했다. 플레이트를 16 내지 18 시간 동안 800 rpm 으로 Vertiga 진탕 인큐베이터내에서 30 ℃ 에서 하룻밤 인큐베이션했다.
딥 96 웰 하루 성장 플레이트를, 588 ㎕/웰의 LB CM35/Kan50 배지를 분배하여 제조하였다. 하룻밤 성장 플레이트를 인큐베이터에서 제거하고, 배양물을 50-배 희석했다. 12 ㎕ 의 하룻밤 배양물을 588 ㎕/웰의 보충된 LB 배지를 함유하는 하루 성장 플레이트로 옮겼다. 하룻밤 성장 플레이트를 새로운 Breathe-Easier Sealing Membrane 으로 밀봉하고, 34 ℃ 에서 및 800 rpm 로 2.25 시간 동안 Vertiga 진탕 인큐베이터 내에서 인큐베이션하였다.
IspS 의 발현을 유도하기 위해, 융해된 12 mM IPTG 을 50 mL 또는 100 mL 멸균 저장소에 붓고, 및 20 ㎕/웰을 각 600 ㎕/웰 배양물로 분배했다. 하룻밤 성장 플레이트를 Breathe-Easier Sealing Membrane 로 재밀봉하고, 34℃ 및 800 rpm 에서 4 시간 동안 Vertiga 진탕 인큐베이터에서 인큐베이션했다.
세포를 수확하기 위해, 200 ㎕ 의 유도된 배양물을 450 ㎕ Nunc 보관 플레이트로 옮겼다. 플레이트를 3300 rpm 에서 20 분 동안 4 ℃ 에서 저속도 벤치탑 원심분리기 내에서 원심분리하였다. 180 ㎕ 상청액을 피펫으로 제거 및 폐기했다. 플레이트를 알루미늄 호일막으로 밀봉하고, 플라스틱 플레이트 뚜껑으로 덮어씌우고 -80 ℃ 에서 동결 보관했다.
플레이트의 OD600 를 판독했다. 150 ㎕ 1x PBS 를 96 웰 Costar Read Plate (#9017) 로 분배했다. 50 ㎕ 의 배양물 샘플을 이어서 판독 플레이트로 옮겼다. 이후, OD600 판독은 Spectramax 플레이트 판독기로 실시했다.
분해: 수확 플레이트를 실온 수조에서 4 분간 해동한 다음 25℃ 에서 1200 rpm, 1 분 동안 Thermomixer 에서 인큐베이션하였다. 분해 버퍼를 80 ㎕/웰 내지 20 ㎕/웰의 수확 세포로 분배했다. 1.25X 분해 작용 스톡 버퍼 (Lysis Working Stock Buffer) 를 6.25 ml 1M Tris pH 8, 625 ㎕ 10% Tween 20, 312.5 ㎕ 0.2 M PMSF, 462.5 ㎕ 10 mg/ml DNAse I (Sigma), 1.25 ml 1 M MgCl2, 132.5 ㎕ 25000 U/㎕ 리소자임 (Epicentre Technologies) 및 40.968 ml dIH20 로부터 제조했다. 플레이트를 Thermomixer 상 25℃ 및 1200 rpm 에서 30 분 동안 인큐베이션하였다. 19 ml 의 1.25x 분해 작용 스톡을 4.75 ml dIH2O 로 희석하여, 1x 분해 버퍼 스톡을 제조했다.
DMAPP 작용 스톡을 하기와 같이 제조했다.
희석제는 0.1 M 칼륨 포스페이트였다. 200 uL/웰을 샘플 웰로의 이동을 위해 분배하고 얼음 상에서 보관했다.
DMAPP 반응: 1x 분해 버퍼를 65 ㎕/웰로 분배했다. 15 ㎕/웰의 분해물을 96 딥 웰 Zinsser 유리 블록 내 각각의 샘플 웰에 옮겼다. DMAPP 시약을 20 ㎕/웰로 분배했다. 이 유리 블록을 알루미늄 호일막으로 밀봉하고 25 ℃ 에서 450 rpm 로 45 분간 인큐베이션했다. 유리 블록을 70 ℃ 수조로 옮기고 6 분 동안 인큐베이션하여 반응을 정지했다. GC 분석을 상기에 기술한 대로 수행했다.
IV. 형광 표지된 2차 항체를 갖는 이소프렌 신타아제의 Western 블롯
샘플을 제조하고, 제조자의 프로토콜에 따라 NativePAGE™Novex®Bis-Tris Gels (Invitrogen) 상에서 시행했다. 상기 시행을 마친 후, 겔을 제조자가 권고하는 프로토콜에 따라 XCell II™Blot Module (Invitrogen) 을 이용해 즉시 니트로셀룰로오스 막으로 이동시켰다. 이동 후, 막을, 키트에 제공된 커버가 있는 플라스틱 접시 내 15 ml 의 적절한 블로킹 용액 (초여과 수 31.5 ml, 차단제/희석제 (Part A) 9 ml, 차단제/희석제 (Part B) 4.5 ml) 에 넣고, 1 회전/초로 세팅된 회전 진탕기 상에서 30 분 동안 인큐베이션하였다. 블로킹 용액을 디캔팅하고 막을 2 회 20 ml 의 물로 5 분 동안 헹구었다. 막을 15 ml 의 일차 항체(Ab) 용액 (5 ml 블로킹 용액 내 24 ㎕ 의 일차 Ab) 으로 1 시간 인큐베이션한 후, 3 회 5 분 동안 25 ml 의 1x 항체 세정 용액으로 세정했다. 이어서, 막을 15 ml 의 2차 항체 용액 (15 의 블로킹 용액 중 15ul 이차 Ab (Alexa Fluor 488 goat anti-rabbit IgG (H+L, Invitrogen)) 중에서 30 분 동안 인큐베이션했다. 막을 3 회 5 분 20 ml 의 항체 세정물 (Antibody Wash) 로 세정하고, 2 회 2 분 20 ml 의 물로 헹구었다. 막을 페이퍼 타월 사이로 건조하고 실온에서 추가 검출을 위해 보관했다. 형광 밴드를 검출하고 Storm 860 Molecular Imager (GMI, Inc) 를 이용해 정량하였다.
V. 결과:
표 13-2 는 검정된 각 변이체에 대한 관련 데이타 모두를 나타낸다: (4 개의 모든 복제물의) 서열화 결과, 잔기 변경, 평균 이소프렌 생성, 단백질 농도 및 평균 특이 활성. 도 46 은 표 13-2 에 나타낸 데이타의 그래프 표현을 나타낸다. 특이 활성은 생성된 이소프렌 (㎍/l) 을 0.0414 로 곱한 다음 단백질 농도 (mg/ml) 로 나눠 산출하였다. 이러한 전환 인자 (0.0414) 는 밀봉된 2 ml GC 바이알 중 총 상부공간 부피 (1.9 ml), 분해물 부피 (15 ul), DMAPP 검정 기간 (45 분), 및 이소프렌의 분자량을 설명하다. 따라서, 특이 활성 값은 nmol 이소프렌/mg Isps/min 으로 표기한다.
표 13-2 의 데이타 및 도 46 에서의 그래프는, 모든 분석된 변이체 중에서, 모든 3 개의 L70R 변이체가 야생형보다 더 높은 특이 활성을 나타냄을 보인다. L70R 변이체를 추가로 분석하기 위해, 모든 3 개의 단리체 (각각의 4 개의 복제본) 에 대한 특이 활성 값을 평균 내고 대조군 (2 개의 단리체, 각각 4 개의 복제본) 과 비교했다. 따라서, L70R 변이체에 대해서는 12 회 측정을, 야생형에 대해서는 8 회 측정하였다. 이들 데이타는 하기 표 13-3 에 나타낸다. 단백질에 있어서 정정시, L70R 변이체는 MD09-173 (MEA 절단물) 보다 25% 활성 증가를 보였다. 도 47 은 MEA 와 비교시 모든 L70R 변이체에 대한 평균 특이 활성을 나타낸다. 오차 바는 하나의 표준편차를 나타낸다. L70R 및 MEA 대조군에 대한 2 개의 데이타를 Student T-Test 에 통계분석을 위해 적용하여, 6.0011 x 10- 5 의 P-값을 얻었다.
표 13-2. 서열화 결과, 이소프렌 생성, 단백질 농도 및 우승자 플레이트 내 모든
잔기에
대한 특이 활성
모든 플라스미드의 서열이 지시된 코돈을 제외하고는 Pdu39 (상기 참고) 와 동일하다는 점에 주의한다. L70R 변이체는 회색으로 하이라이트하였다.
표 13-3.
MEA
대조군에 대한 모든
L70R
변이체의
평균 특이 활성
막대 그래프에 대한 도 47 을 참고한다.
실시예
14
P.
alba
,
P.
tremuloides
,
P.
trichocharpa
, 및
쿠주
이소프렌
신타아제의
절단물
이 실시예는 P. alba, P. tremuloides, P. trichocharpa, 및 쿠주의 IspS 효소에서 일련의 절단물의 생성 및 이의 활성에 대한 효과 측정을 기술한다.
I. 균주 구축
모든 이소프렌 신타아제 유전자를 DNA2.0 (Menlo Park, CA) 에 의해 E. coli 에 대해 코돈 최적화하고, 합성 및 pET24a 로 클로닝하였다. 모든 절단된 구축물을, PCR 증폭을 위해 상술한 주형 P. alba pET24a (플라스미드 pDu47-3 내지 -7 에 대해서, 도 48, 49, 51-60), P. tremuloides pET24a (플라스미드 pDu48, 도 49C, 61 및 62), P. trichocharpa pET24a (pDu49, 도 50A, 63, 64), 또는 pET24d-Kudzu (pDu50 및 50-4, 도 50B, 50C, 65-68) 를 이용하는 QuickChange 부위-특이적 돌연변이유발 키트 (Stratagene) 를 이용해 제조했다. 약 50 ng 의 주형 DNA 를, 각 관련 절단물 (QC Trunc -3 F 및 QC Trunc -3 R, 예를 들어 표 14-1 참고) 에 상응하는 정방향 (For) 및 역방향 (Rev) 프라이머 쌍으로 PCR 생성물의 증폭 (Eppendorf Mastercycler Gradient PCR Machine 사용) 에 이용했다. PCR 반응 혼합물은 하기와 같았다: 1 ㎕ P. alba pET24a (또는 기타 주형), 5 ㎕ 10X PfuUltra HF 버퍼, 1 ㎕ dNTP (10 mM), 1 ㎕ (50uM) 프라이머-For, 1 ㎕ (50 μM) 프라이머-Rev, 1.5 ㎕ DMSO, 39.5 ㎕ diH2O 및 1 ㎕ PfuUltra HF 폴리머라아제. PCR 사이클 파라미터는 하기와 같았다: 18 사이클 동안 (95 ℃ 1 분, 95 ℃ 1 분, 55 ℃ 1 분, 68 ℃ 7.30 분) 이후 냉각될 때까지 4℃ 로, Eppendorf Mastercycler Gradient Machine 를 이용함. PCR 생성물을 1-2 ㎕ 의 DpnI (Roche) 로 1~ 3 시간 동안 37 ℃ 에서 처리했다. 5 ㎕ 의 DpnI 처리 생성물을 0.8% E-겔 (Invitrogen) 상에서 시각화하였다. 1 ㎕ 의 각 생성물을 화학적 적격 E. coli Top10 세포 (Invitrogen) 내로 형질전환시켰다 (제작자의 프로토콜에 따름). 카나마이신을 50 ㎍/ml (Kan50) 로 함유하는 LB 배지 상에서 선별하고 하룻밤 37 ℃ 에서 인큐베이션했다. 각 형질전환물의 5 개의 콜로니를 선별하고, 3 ml 액체 LB Kan50 중 정지상까지 성장시켰다. 플라스미드를 제작자가 권고하는 프로토콜에 따라 QIAPrep Spin miniprep kit (Qiagen) 를 이용해 정제하였다. 정제된 플라스미드를 T7 정방향 및 역방향 프라이머로 서열화하고 (Quintara Biosciences), 모체 서열과 비교하고, 이의 각 절단물에 대해서 확인했다. 생성된 플라스미드 (pDu47-3 내지 pDu50-4, 표 14-2 참고) 를 제작자가 권고하는 프로토콜에 따라 화학적 적격 E. coli BL21(DE3) pLysS (Invitrogen) 내로 형질전환시켰다. 표 14-3 은 절단된 IspS 효소의 발현에 사용된 균주를 기술한다.
37 ℃ 에서 하룻밤 인큐베이션한 후, 각각의 콜로니를, 500 ㎕ 의 액체 LB Kan50 CM35 각각을 함유하는 96-웰 딥-웰 마이크로타이터 플레이트 (VWR) 내의 각 웰에 접종하였다. 이어서, 마이크로타이터 플레이트를 반투과막 (Breathe-Easier, Diversified Biotech) 으로 밀봉하고, 하룻밤 30 ℃ 에서 진탕 인큐베이터 (Vertiga) 중에서 인큐베이션하였다. 다음날, 96-웰 플레이트 내 각 웰로부터의 100 ㎕ 샘플을, 새로운 200 ㎕ 96-웰 플레이트 중 50 ㎕ 의 50% 글리세롤과 혼합하고, 추가 분석할 때까지 -80 ℃ 에서 동결했다. 이어서, 이 플레이트를 실시예 13 에서 기술한 바와 같이 DMAPP 검정에 사용했다. 표 14-4 는 모든 샘플의 평균 특이 생산성을 나타내고, 도 69 는 동일한 데이타의 그래프 표현을 나타낸다.
DMAPP 활성 및 단백질 정량을 실시예 13 에 기술한 바와 같이 측정했다.
특이 활성은 생성된 이소프렌 (㎍/l) 을 0.00776 로 곱한 다음 단백질 농도 (mg/ml) 로 나눠 산출하였다. 이러한 전환 인자 (0.00776) 는 밀봉된 2 ml GC 바이알 중 총 상부공간 부피 (1.9 ml), 분해물 부피 (80 ㎕), DMAPP 검정 기간 (45 분), 및 이소프렌의 분자량을 설명한다. 따라서, 특이 활성 값은 nmol 이소프렌/mg Isps/min 으로 표기한다.
표 14-1.
프라이머
표 14-2 플라스미드
표 14-3 균주
표 14-4
상술된
변이체의
특이 생산성
제 2 의 실험을 표 14-5 에 개괄한 균주로 수행했다. 대조군은 P. alba pET24a 포함 BL21 DE3 pLysS 이었다 (전장 P. alba IspS).
표 14-5. 균주
결과
P. alba IspS 의 모든 절단물 및 P. tremuloides 및 P. trichocharpa 로부터 2 개를 동시에 DMAPP 검정 및 정량적 Western 블롯을 통해 검정하여 이의 관련 특이 활성을 비교했다. 변이체 당 적어도 2 개의 샘플을 이소프렌 생성 및 IspS 의 양 (mg/ml) 에 대해서 검정하였다. 변이체 MD09-174 는 이소프렌을 거의 생성하지 않고 거의 단백질을 발현하지 않았으나, 고 특이 활성을 보였다. 고 특이 활성은 또한 MD09-173, MD09-176, 및 MD09-197-3 에 의해서도 나타났다 (표 14-6 및 도 70 참고). 3 ㎍ 총 단백질 중 가장 높은 수준의 단백질 (㎍) 은 MD09-176 및 MD09-197-3 에서 나타났는데, 이는 이들 변이체가 E. coli BL21 DE3 숙주 균주에서 더 효과적으로 발현되었음을 나타낸다.
표 14-6.
절단물의
특이 활성
실시예
15
3-차 구조 측정을 위한 구축물
I. pMAL-C4X Kudzu 의 구축
칡 (Pueraria lobata) 의 이소프렌 신타아제 (IspS) 를 코딩하고 E.coli 에 대해 코돈-최적화된 합성 유전자를 DNdA2.0 (Menlo Park, CA) 에서 구입하고 플라스미드 p9795 (도 71 및 72) 로서 제공하였다. 삽입물을 BspLU11I/PstI 로 분쇄하여 제거하고 겔-정제하고 NcoI/PstI-분쇄된 pTrcHis2B (Invitrogen, Carlsbad, California) 로 다시 라이게이션하였다. 생성된 플라스미드는 pTrcKudzu 로 지정하였다 (도 73: pTrcKudzu 의 맵). 삽입물 내 정지 코돈이 PstI 부위 앞에 있어, His-태그가 IspS 단백질에 결합되지 않은 구축물을 도모하였다.
E. coli 코돈-최적화된 Kudzu 유전자를, DNA 주형으로서 플라스미드 pTrcKudzu 를 이용하고, 프라이머 EL-959 및 EL-960, 10mM dNTP (Roche, Indianapolis, IN), 및 Pfu Ultra II Fusion DNA 폴리머라아제 (Stratagene, La Jolla, CA) 를 제작자의 프로토콜에 따라 이용하여 PCR 반응을 수행해 증폭하였다. PCR 조건은 하기와 같았다: 95 ℃ 2 분 (제 1 의 사이클에서만 임), 95 ℃ 25 초, 60 ℃ 25 초, 72 ℃ 30 초 (28 사이클 동안 반복), 및 72 ℃ 엥서 1 분간 최종 신장. 이어서, PCR 생성물을 QIAquick PCR Purification Kit (Qiagen Inc, Valencia, CA) 을 이용해 정제하였다.
Kudzu PCR 생성물 (1 ㎍) 을, 제작자의 프로토콜에 따라 EcoRI 및 HindIII 제한 엔도뉴클레아제 (Roche) 를 이용해 분쇄하였다. 분쇄물을 37 ℃ 에서 30 분 동안 인큐베이션하여 쿠주 유전자에 존재하는 내부 EcoRI 부위의 분쇄를 최소화하였다. 이어서, 분쇄된 PCR 절편을 QIAquick PCR Purification 키트를 이용해 정제하였다. 벡터 pMAL-C4X (0.5 ㎍) (New England Biolabs, Ipswich, MA; 도 75 및 76) 를 제작자의 프로토콜에 따라 EcoRI 및 HindIII 제한 엔도뉴클레아제 (Roche) 을 이용해 분쇄하였다. 이어서, 분쇄된 벡터를 QIAquick Gel Extraction Kit (Qiagen Inc) 을 이용해 겔 정제하였다. DNA 라이게이션 반응을 T4 DNA 리가아제 (New England Biolabs) 를 이용해 5:1 비율의 분쇄된 쿠주 PCR 생성물 대 분쇄된 pMAL-C4X 벡터로 제작자의 프로토콜에 따라 수행했다. 이어서, 라이게이션 반응의 분취물을 TOP10 화학적 적격 세포 (Invitrogen Corp) 내로 형질전환하였다. 형질전환체를 LA + 50 ㎍/㎕ 카르베니실린 플레이트 상에서 선별했다.
쿠주 유전자를 함유하는 형질전환체의 스크리닝은, 콜로니를 고르고, 제작자의 프로토콜에 따라 PuReTaq Ready-To-Go PCR beads (GE Healthcare, Piscataway, NJ) 를 이용해 프라이머 EL-957 및 EL-966 로 PCR 수행하여 실시하였다. PCR 조건은 하기와 같다: 95 ℃ 2 분 (제 1 의 사이클에서만), 95 ℃ 30 초, 50 ℃ 30 초, 72 ℃ 40 초 (28 사이클 동안 반복) 및 72 ℃ 에서 1 분 최종 신장. PCR 생성물을 600 bp 절편을 구하는 2% E-겔 (Invitrogen Corp) 상에서 분석하였다. 올바른 크기의 PCR 생성 삽입물을 함유하는 콜로니를 프라이머 EL-950, EL-951, EL-953, 및 EL-957 를 이용하여 DNA 서열화를 위해 기탁하였다. DNA 서열화로 플라스미드 pMAL-C4X Kudzu 의 구축물을 확인하였다 (도 77 - 79).
표 15-1
프라이머
서열
플라스미드 pMAL-C4X Kudzu 를 OneShot BL21(λDE3) 화학적 적격 세포 (Invitrogen Corp) 내로 형질전환하였다. 발현 균주 형질전환체를 LA + 50 mg/ml 카르베니실린 플레이트 상에서 선별하였다.
II. 결정 구조 시험을 위한 IspS 변이체
이 실시예는 발현, 정제 및 결정화를 위한 친화 태깅된 이소프렌 신타아제 (IspS) 효소 제조 방법을 기술한다.
균주 구축
pET200D-TOPO 벡터 (Invitrogen) 내 구축물에 있어서, P. alba, P. tremuloides, 및 P. trichocharpa 로부터의 IspS 효소의 PCR 생성물을, 0.8% E-겔 (Invitrogen) 을 이용해 제작자가 권고하는 프로토콜에 따라 겔 추출하고 정제했다. pET200 구축물을 위한 PCR 반응은 하기와 같다: 반응 혼합물은 1㎕ (주형)-pET24a-P.alba, 5 ㎕ 10X PfuUltraII 융합 버퍼, 1 ㎕ dNTP (10 mM), 1 ㎕ 프라이머 (50uM) 프라이머 F-(MCM219 또는 218), 1 ㎕ 프라이머 (50uM) 프라이머 R-(MCM182), 41 ㎕ diH2O 및 1 ㎕ 의 PfuUltra II 융합 DNA 폴리머라아제 (Stratagene) 이었다; 사이클 파라미터는 95℃ 1 분, 95℃ 1 분, 55℃ 20 초, 72℃ 27 초 (29 사이클 동안) 후 72℃ 에서 3 분 다음 냉각까지 4℃ (Eppendorf Mastercycler 이용). 유사 반응을 P. tremuloides, P. trichocarpa, 및 쿠주 에 대해서 수행했다. 이어서, 3 ㎕ 의 정제된 생성물을 제작자의 프로토콜에 따라 pET200D/TOPO 벡터 (Invitrogen) 에 라이게이션하였다. 반응물을 5 분 동안 실온에서 인큐베이션한 다음 6 ㎕ 토포이소머라아제 혼합물을 제조자의 프로토콜에 따라 E. coli Top10 화학적 적격 세포 (Invitrogen) 내로 형질전환시켰다. 형질전환체를 LB Kan50 상에서 선별하고, 37 ℃ 에서 하룻밤 인큐베이션하였다. 구축물 당 5 개의 콜로니를 선별하고, T7 정방향 및 MCM182 프라이머 (표 15-2) 를 이용하는 PuReTaq Ready-To-Go PCR Beads (Amersham) 를 이용해 스크리닝하였다. 올바른 크기의 삽입물을 갖는 클론을, QIAPrep Spin Miniprep kit (Qiagen) 를 이용하는 플라스미드 miniprep 에 의해 추가로 확인한 후, T7 정방향 및 T7 역방향 프라이머 (Quintara Biosciences) 를 이용하여 서열화하였다. 각 IspS 변이체에 대한 하나의 완전히 서열된 구축물(자세사항 및 서열에 대해서는 하기 참고/ 도 79-90) 을 추가 연구를 위해 선택했다. 1 ㎕ 의 각 플라스미드를 BL21(λDE3) pLysS (Invitrogen) 내로 제작자의 프로토콜에 따라 형질전환시켰다. 형질전환체를 Kan50 + Cm35 를 갖는 LB 배지 상에서 선별하고 37℃ 에서 하룻밤 인큐베이션하였다. 결정학 연구를 위해 각종 IspS 효소의 발현 및 정제에 생성된 균주를 사용했다.
N-말단 6His-태깅된 IspS 플라스미드의 구축, 균주 및 정제를 실시예 11 에 기술한다.
표 15-2.
프라이머
표 15-3 플라스미드
표 15-4
III. TEV (Tobacco Etch Virus) 또는 EK (Enterokinase; 엔테로키나아제)-태깅된 효소의 분쇄
TEV
절단 (균주
MD09
-165 및
MD09
-
167 로
부터의
IspS
)
균주 MD09-165 및 MD09-167 는 실시예 11 에 기술되어 있다. 분쇄를 위해, 효소를 Ni 전하를 띤 세파로오스 (GE Healthcare) 를 통해 정제하고, 1 mM DTT 를 함유하는 50 mM HEPES, 50 mM NaCl pH 7.4 버퍼로 탈염시켰다. 분쇄를 Eton Bioscience Inc 의 TurboTEV 프로테아제로 수행했다. 10 ㎍ 의 정제된 단백질 당 1 단위의 TurboTEV 를 사용했다. 분쇄를 4℃ 에서 하룻밤 수행했다. 샘플을 Ni 버퍼 중에 평형화된 또 다른 Ni 컬럼을 통과시켜 절단되지 않은 효소, 태그, TurboTEV 프로테아제 (역시 태깅되어 있음) 및 불순물을 제거했다. Ni 컬럼 통과물 및 세정물을 SDS-PAGE 겔 (NUPAGE, Invitrogen) 및 DMAPP 활성 검정을 이용해 분석했다. 순수 효소를 함유하는 샘플을 모으고, 1 mM DTT 를 함유하는 50 mM NaCl pH 7.4 버퍼로 탈염시키고, -80℃ 에서 보관했다.
EK
절단 (균주
MD08
-102 및
MD08
-
104 로부터의
IspS
)
분쇄를 위해, 효소를 Ni 전하를 띤 세파로오스 (GE Healthcare) 를 통해 정제하고, 1 mM DTT 를 함유하는 50 mM HEPES, 50 mM NaCl pH 7.4 버퍼로 탈염시켰다.
분쇄를 20 ㎍ 의 정제된 단백질 당 1 단위의 EKMax 를 이용해 EKMax (E180-02) (Invitrogen) 로 4 ℃ 에서 하룻밤 수행했다. 샘플을 EK Away resin (Invitrogen) 통과시켜 여분의 엔테로키나아제를 제거했다. 샘플을 Ni 전하를 띤 세파로오스 수지 (Ni 세정 버퍼 중 평형화됨) 상으로 뱃치 (batch) 시키고 가끔 뒤짚으면서 30 분 동안 4 ℃ 에서 인큐베이션했다. 이로 절단되지 않은 효소, 태그 및 불순물이 제거되었다. Ni 컬럼 통과물 및 세정물을 SDS-PAGE 겔 (4-12% NUPAGE, Invitrogen) 및 DMAPP 활성 검정을 이용해 분석했다. 순수 효소를 함유하는 샘플을 모으고, 1 mM DTT 를 함유하는 50 mM HEPES, 50 mM NaCl pH 7.4 버퍼 중으로 탈염시켜 -80℃ 에서 보관했다.
IV. MBP-IspS 의 정제
MBP-Kudzu 이소프렌 신타아제 발현을 위한 pMAL-C4X Kudzu 의 구축은 상술되어 있다. 15-L 스케일로 배치 배양물에서 성장시킨 E. coli 로부터 MBP-Kudzu 이소프렌 신타아제 생성.
배지 제조법 (발효 배지 리터 당)
K2HPO4 7.5 g, MgSO4 * 7H2O 2 g, 시트르산 모노히드레이트 2 g, 시트르산 철 암모늄 0.3 g, 효모 추출물 0.5 g, 1000X 개질된 미량 금속 용액 1 ml. 성분 모두를 함께 첨가하고 diH2O 중에 용해했다. 이 용액을 오토클레이브하였다. pH 를 수산화암모늄 (30%) 으로 7.0 으로 조절하고 부피에 있어서는 충분량으로 했다. 글루코오스 10 g, 티아민 * HCl 0.1 g, 및 항생제를, 멸균 및 pH 조절 후 첨가했다.
1000X
개질된
미량 금속 용액
시트르산 * H2O 40 g, MnSO4 * H2O 30 g, NaCl 10 g, FeSO4 * 7H2O 1 g, CoCl2 * 6H2O 1 g, ZnSO * 7H2O 1 g, CuSO4 * 5H2O 100 mg, H3BO3 100 mg, NaMoO4 * 2H2O 100 mg. 각각의 성분을 diH2O 중 한번에 하나씩 용해하고, HCl/NaOH 로 pH 를 3.0 으로 한 다음 부피에 대해 충분량이 되게 하고, 0.22 마이크론 필터로 여과 멸균하였다.
말토오스 결합 단백질 (MBP)-Kudzu 이소프렌 신타아제 융합 분자를 발현하는 pMAL-C4X 플라스미드를 함유하는 BL21 (DE3) E. coli 세포로 15-L 생물반응기 중에서 발효를 수행했다. 이러한 실험을 실행하여, 원하는 발효 pH 7.0 및 온도 30 ℃ 에서 이소프렌 신타아제를 생성하였다. E. coli 균주의 동결된 바이알을 융해하고 트립톤-효모 추출물 배지에 접종했다. 접종원이 550 nm 에서 측정된 OD (OD550) 가 1.0 일 때까지 성장시킨 후, 120 mL 를 15-L 생물반응기에 접종하는데 사용하여 초기 부피를 9-L 로 하였다.
원하는 분자의 발현은, 이소프로필-베타-D-1-티오갈락토피라노시드 (IPTG) 를 첨가함으로써 달성했다. IPTG 농도를, OD550 가 10 값에 도달했을 때 1 mM 으로 만들었다. 원하는 생성물을 함유하는 세포를 IPTG 첨가 후 3 시간 후 수확했다.
MBP
-
IspS
정제
브로쓰를 15 분 동안 10000 x g 에서 원심분리하였다. 펠릿을 수집하고 추가 정제할 때까지 -80 ℃ 에서 동결하였다. 세포를 MBP-결합 버퍼 (5% 글리세롤, 20 mM Tris pH 7.4, 200 mM NaCl, 2 mM DTT, 1mg/ml 리소자임) 중에서 재현탁하고, 3 회 20000 psi 에서 세포파쇄기를 통과시켰다. 이어서, 분해물을 1 시간 동안 100000 x g 로 초원심분리하여, 비교적 맑은 용액을 수득했다. 상청액을 원심분리 튜브 바닥의 겔라틴성 물질을 교란시키지 않으면서 이 튜브 상부에서 피펫팅하였다. 겔 여과를 Superdex-200 26/60 컬럼 (GE healthcare) 을 이용해 상청액 상에서 수행했다. 컬럼을 3 mL/min 의 유속으로 23 ℃ 에서 MBP-결합 버퍼를 이용해 전개하였다. 분획분을 하기에 기술된 DMAPP 활성에 대해서 시험하였다. 활성 분획분을 모으고 25 mL 아밀로오스 수지 (New England Biolabs) 상으로 로딩하였다. 컬럼을 10 컬럼부피 MBP-결합 버퍼로 세정한 다음, 단백질을 10 mM 말토오스를 함유하는 2 컬럼 부피의 MBP-결합 버퍼로 용리하여 >90% 순수 MBP-IspS 를 수득했다.
V. DMAPP 검정
하기의 반응 혼합물을 DMAPP 검정에 사용했다: 25 ㎕ 분해물 혼합물, 5 ㎕ MgCl2 (1 M), 5 ㎕ DMAPP (100mM), 및 65 ㎕ 100 mM Tris pH 8, 100 mM NaCl (총 부피가 100 ㎕ 이 되게 하는 양으로 함). 반응을 30 ℃ 에서 15 분 동안 기밀의 1.8 mL GC 튜브 중에서 수행했다. 반응을 100 ㎕ 500 mM EDTA (pH 8) 의 첨가로 종결했다. 생성된 이소프렌의 양을 상기에 기술한 바와 같이 GC/MS 로 측정했다.
실시예
16
IspS 의
3차원 구조
식물 이소프렌 신타아제 (IspS) 의 7 가지 구축물을 X-선 회절에 적합한 결정을 생성하도록 제조하였다. 이들은 다음이다: N-말단 히스티딘-태깅된 말토오스 결합 단백질 및 쿠주 IspS 를 함유하는 구축물 (MBP-kudzu), N-말단 히스티딘-태그를 가진 전장 P. alba IspS (MD08-99), 첫 19 개의 N-말단 잔기가 제거된 P. alba IspS (MD08-100) (이 구축물은 또한 정제 후 N-말단 his-태그가 제거됨), 전장, 비태깅된 P. alba IspS (균주 RM11608-2), 트윈-아르기닌 motif 앞 2 개의 추가 잔기를 특징으로 하는 절단된 P. alba IspS 구축물을 제조함 (MD09-167), N-말단 his-태그 및 N-말단 절단물 둘 모두를 함유하는 P. tricharpa IspS (MD08-104) 를 제조함, 및 N-말단 his-태그 및 N-말단 절단물을 갖는 P. tremuloides 유래의 IspS 로 이루어진 또 다른 구축물 (MD08-102) 을 제조함. 다양한 이소프렌 신타아제를 발현하는 균주의 구축은 하기에 기술한다.
각 구축물을 정제한 다음 농축된 단백질 용액을 가능한 결정화 조건을 조사하기 위해 제조하였다. 각각의 구축물을 독립적으로 정제하고 하기와 같이 조사했다. 모든 내부 결정화 (in-house crystallization) 스크린을, 부유 방울 증기 확산법 (hanging drop vapor diffusion method) 을 이용하여 설정하였다. 최소한 각 구축물을 하기의 시판 스크린을 이용해 조사했다: Cystal Screen, Hampton Research (Aliso Viejo, CA) 및 JCSG+ Suite, Qiagen (Valencia, CA).
정제된 MBP-kudzu 를 하기의 시판 스크린을 이용하여 설정하였다: Crystal Screen, Hampton Research 및 JCSG+ Suite. 게다가, 정제된 MBP-kudzu 를 Hauptman-Woodward Institute (Buffalo, NY) 에 고처리량 스크리닝을 위해 의뢰하였고, 여기서 최소한 1536 가지의 조건을 조사하였다. 정제된 MBP-kudzu 융합물은 다수의 조건 하에서 용액 중에 침전되었고, 어떠한 단백질 결정도 관찰되지 않았다.
결정화 스크리닝에 사용된 다음 구축물은 MD08-99 (N-말단 히스티딘-태그를 갖는 전장 P. alba IspS) 였다. MD08-99 를 정제하고, 히스티딘-태그를 제거했다. MBP-kudzu 에 대해서와 동일한 3 가지의 초기 결정화 스크린을 수행했다. Hampton Research Crystal Screen 및 Qiagen JCSG+ Suite 를 다수의 단백질 농도로 각각 수행했다. 소형의 침상 (needle-like) 결정을 일부의 Hampton Research Crystal Screen 조건에서 관찰했다. 결정을 개선하기 위한 추가의 노력에는 IspS 억제제 나트륨 이반드로네이트 (Sigma-Aldrich, St Louis, MO) 로 공동-결정화를 포함하였다. 종합해 보면, 추가의 288 가지의 결정화 조건을 pH, 농도 및 결정화 시약을 변동시키면서 시도했다. 이어서, 9 가지의 최고 결정을 데이타 수집을 위해 제조하고, Rigaku RU200 회전 애노드 생성기 및 R-AXIS IV++ 에서 내부 실험하였는데, 이들은 x-선을 회절하지 않았거나 염 결정이었다.
P. alba IspS 의 첫 19 개의 N-말단 잔기를 제거하여 MD08-100 를 구축했다. 이 구축물은 정제 후에 N-말단 히스티딘-태그가 제거되었다. 내부의 결정화 스크린을, Hampton Research Crystal Screen 및 Qiagen JCSG+ Suite 을 각각 다수의 단백질 농도로 함으로써 이용해 수행했다. 최초의 결정 히트는, 내부의 x-선 생성기를 이용해 16 Å 해상도 (resolution) 로 회절하는 6방정계 플레이트 및 5 Å 해상도로 회절하는 소형의 막대기를 포함한다. 결정을 개선하기 위해, MD08-100 를 나트륨 이반드로네이트 또는 나트륨 피로포스페이트 (Sigma-Aldrich, St Louis, MO) (둘 모두 IspS 활성의 억제제임) 으로 공동-결정화하였다. 어느 억제제도 개선된 결정 또는 개선된 회절을 도모하지 않았다. 추가 168 가지 결정화 조건을, pH, 농도 및 결정화 시약 변동으로 시도했다. 21 개의 가장 유망한 MD08-100 결정을 회절을 위해 스크리닝하였고, 수득된 최고의 해상도는 5Å 였다.
발효 작업으로부터의 전장, 비태깅된 P. alba IspS (균주 RM11608-2) 를 정제하였다. 최초의 스크린은 Hampton Research Crystal Screen 을 이용하여 설정하고, 결정을 4 가지의 상이한 조건에서 관찰하였다. 4 개 모두의 결정을 내부 회절로 실험하였는데, 3 개는 염 결정이었고 1 개는 회절하지 않았다.
트윈-아르기닌 motif 앞 2 개의 추가 잔기를 특징으로 하는 절단된 P. alba IspS 구축물을 제조했다 (MD09-167). 이 구축물은 C-말단 히스티딘-태그를 포함하였고, 결정화 실험은 절단되거나 절단되지 않은 태그로 단백질 농도를 다양하게 하고 나트륨 피로포스페이트 존재 또는 부재하에서 설정하였다. 최초의 결정화 스크린을 MBP-kudzu 에 따라 수행했다. 이 구축물로부터의 결정을 다양한 조건에서 관찰하였다: 최적화로 pH, 침전제, 농도 및 억제제의 528 가지 변동이 포함된다. 최적화 실험으로부터, 15 가지의 상이한 MD09-167 결정을 회절을 위해 내부 스크리닝했다. 해상도를 개선하기 위해, 다양한 결정 동결 조건을 실험하고, 회절 한계의 개선 효과는 10Å 내지 6.5Å 이었다.
P. tricharpa IspS 를 함유하는 새로운 구축물을 제조하였는데, 이는 N-말단 히스티딘-태그 및 N-말단 절단물을 모두 포함한다 (MD08-104). 히스티딘-태그가 절단된 정제된 MD08-104 를 Hampton Research Crystal Screen 및 the Qiagen JCSG+ suite 을 이용하여 조사하였다. 이 구축물은 P. alba IspS 구축물보다 더 무거운 침전물을 생성하였다. 매우 작은 침상들이 관찰되었는데, 결정 중 어느 것도 회절에 적합하지 않았다.
N-말단 히스티딘-태그 및 N-말단 절단물을 갖는 P. tremuloides 로부터의 IspS 로 이루어진 또 다른 구축물을 제조하였다 (MD08-102). 절단된 히스티딘-태그의 존재 또는 부재하 정제된 MD08-102 를 다양한 단백질 농도로 Hampton Research Crystal Screen 및 Qiagen JCSG+ Suite 을 이용해 설정하였다. 막대기 및 판형 결정을 동일한 조건에서 관찰하였고, 추가 120 가지 실험을 결정을 개선하도록 pH, 농도 및 결정화 시약을 변동함으로써 수행했다. 최적화 실험으로부터, 10 개의 결정을 내부 실험하여, 초기 최고 회절은 5Å에 다달았다. 결정의 동결 조건의 추가 개질시, 절단되지 않은 히스티딘-태깅된 단백질로부터 3.3 Å으로 회절되는 결정이 발견되었다. 이 결정을, 2 ㎕ 의 단백질 (10 mg/ml, 30mM MgCl2 와 함께) 을 2 ㎕ 의 침전 용액 [10% (wt/vol) 폴리에틸렌 글리콜 8000, 0.1 M HEPES, pH 7.5, 8% 에틸렌 글리콜] 과 혼합하여 성장시키고 500 ㎕ 침전제에 대해 평형화시켰다. 막대형 결정 무리가 3 주 후에 나타났다. 이 결정은 정방정계 공간군 (space group) P43212 에 속하고, 단위 격자 크기 a = 154.2, b = 154.2, c = 142.7 를 갖는다.
내부 x-선 회절 데이타를 Rigaku RU200 생성기 및 R-AXIS IV++ 검출기를 이용해 100 K 에서 질소 흐름 하 수집했다. 액체 질소에서 결정을 급속동결하기 전에, 10% (wt/vol) 폴리에틸렌 글리콜 8000, 0.1 M HEPES, pH 7.5, 및 25% 에틸렌 글리콜을 함유하는 용액을 통해 강타시켜 부동시켰다. 데이타를 Mosflm (Leslie, A. (1998) J. of Appl. Crystallography 30, 1036-1040) 를 이용하여 통합하고, SCALA (Collaborative Computational Project, N. (1994) Acta Crystallographica Section D 50, 760-763) 를 이용하 척도화하였다. 이어서, 데이타를 출발 모델로서 리모넨 신타아제의 단량체로 (Protein Data Bank ID 2ONH)(Berman, H., 등. (2007) Nucl. Acids Res. 35, D301-303), MrBUMP (Keegan, R. M., 및 Winn, M. D. (2007) Acta Crystallographica Section D 63, 447-457; Vagin, A., 및 Teplyakov, A. (1997) J. of Appl. Crystallography 30, 1022-1025) 를 이용하여 분자 대체함으로써 단계적으로 진행했다. 결정은 비대칭 단위에서 1 개의 이량체를 포함하고 용매 함량은 66% 이다.
동일한 결정으로부터 설정된 3.05Å 데이타를 이어서 Stanford Synchrotron Radiation Laboratory 의 빔라인 (beamline) 11-1 을 이용해 수집했다. 이들 데이타를 또한 Mosflm 및 SCALA 를 이용해 처리하였다. 데이타 수집 및 정밀화 통계를 표 16-1 에 나타낸다.
Refmac5 (Collaborative Computational Project, N. (1994) Acta Crystallographica Section D 50, 760-763) 로의 정밀화를, 시각화 프로그램 Coot (Emsley, P., 및 Cowtan, K. (2004) Acta Crystallographica Section D 60, 2126-2132) 를 이용해 반복적 수동 개조 단계로 이용했다. 정밀화 동안, 단백질의 기하계측은 Molprobity (Davis, I. W., 등. (2007) Nucl. Acids Res., gkm216) 를 이용해 체크했다.
포플러 IspS 의 폴딩은 보르닐 디포스페이트 신타아제 (Whittington, D. A., 등. (2002) Proc. Natl Acad. Sci. USA 99, 15375-15380), 리모넨 신타아제 (Hyatt, D. C., 등. (2007) Proc. Natl Acad. Sci. USA 104, 5360-5365), 및 담배 5-에피-아리스토로첸 신타아제 (Starks, C. M., 등. (1997) Science 277, 1815-1820) 와 유사하다. 구조는 2 개의 나선형 도메인, 활성 부위를 포함하는 C-말단 도메인, 및 N-말단 도메인으로 이루어진다 (도 90 및 91). 좌표는 표 16-7 에 제공한다.
표 16-1.
데이타
수집 및 정밀화 통계
유연성 루프
이소프렌 신타아제의 3차원 구조의 결정에서 얻은 독특하면서 뜻밖인 발견은, 활성 부위를 형성하는 수 개의 결정적인 루프가 유연하다는 점이다. 이 발견은 기타 테르펜 신타아제의 공지된 구조를 이소프렌 신타아제의 구조와 비교할 때 즉시 알 수 있다 (도 94). 대체로, 구조는 2차 구조 및 연결 루프의 형태 (conformation) 에서 고 보존된다 (구축물 P.tremTRC-pET200 로부터의 Poplar tremuloides IspS 의 이 실시예에서, 넘버링하는 통상의 방식은 태그를 함유하는 완전한 서열의 첫번째 넘버가 -35 이고, IspS 의 첫번째 잔기는 1 인 방식임). 그러나, 상당 부분의 기질 결합 포켓, 특히 절단된 N-말단을 형성하는 3 개의 분절은 잔기 438-453 로 이루어진 루프 (루프 I) 및 잔기 512-527 로 이루어진 루프 (루프 II)의 2 개의 루프와 함께 방사형으로 보인다 (도 95 내지 97). 이는 본 기질 결정에서 효소와 복합되는 기질의 부재로 인한 것이다.
예를 들어, 효소와 BdpS 를 비교하는 경우에서, 우리는 잔기 498-513 및 573-587 에 해당하는 루프가 동일 개수의 잔기로 이루어지고 이들 영역에서 상동성의, 그러나 동일하지 않은 아미노산을 갖는다는 점을 발견했다. 우리는 이들 구조를 철저하게 연구할수록, 관련 테르펜 신타아제에는 분절 내 유사한 유연성을 보일 것이라고 예상한다. 이들 가변성 루프 영역에 상응하는 테르펜 신타아제의 잔기를 표 16-2 에 열거한다.
표 16-2. 테르펜
신타아제
내 가변성 루프에 상응하는
잔기
이 중요한 발견은, 간단한 방식으로 개선된 신타아제의 조작에 활용될 수 있다. 이러한 분절들을 형성하는 아미노산 내에서 치환을 만들어 효소가 반드시 기질 결합 단계에서 겪는 전이 (transition) 를 용이하게 하고, DMAPP 에서 이소프렌으로의 전자 이동 및 효소의 인산기이탈반응 동안 발생될 것으로 상정되는 상이한 역학 단계에서 기질의 재배열을 가능하게 함으로써 효소 성능을 강화시키는데 유연성을 활용하는 것이 바람직할 수 있다.
상기 구조는 이들 루프가 적어도 2 가지 형태로 존재할 수 있다는 새로운 시각을 제공한다: 우리가 이소프렌 신타아제의 비(非)복합화 구조에서 본 바와 같이, 기질의 부재 하에서는 "개방" 형태, 및 기질이 결합하는 경우에는 "폐쇄" 또는 활성 형태. 따라서, 표 16-3 에 기술된 바와 같은 활성 형태로 루프와 접촉하게 되는 잔기를 개질하는 것이 유익할 것이다.
표 16-3. 유연성 요소의 5
옹스트롬
내 오는
잔기
식물 이소프렌
신타아제의
개선을 위한 부위의 선별
식물의 이소프렌 신타아제는 테르펜 신타아제와 상동인 것으로 예상했다. 3 개의 상동성 테르펜 신타아제의 3차원 구조가 결정되어 있다: Salvia officinalis 보르닐 디포스페이트 신타아제 (BdpS; pdb 엔트리 1N1B), Mentha spicata 리모넨 신타아제 (LS; pdb 엔트리 2ONG), 및 담배 5-에피-아리스토로첸 신타아제 (TEAS; pdb 엔트리 5EAS). 이들 효소는 단지 33% 상동성을 공유하나 이의 3차 구조는 보존된다. 서열 동일성은 표 16-4 에 나타내고 구조 간 구조적 상동성은 표 16-5 에 나타낸다. 게다가, 3 개의 관련 효소 모두와의 중간 복합체의 구조는 3 차 폴딩뿐 아니라 이들 효소의 활성 부위 내 세부 상호작용이 고 보존된다는 점이 밝혀져 있다.
표 16-4. 테르펜
사이클라아제의
% 동일성
a Polar alba 이소프렌 신타아제
b Polar tremuloides 이소프렌 신타아제
c 보르닐 디포스페이트 신타아제
d 리모넨 신타아제
e 5-에피-아리스토로첸 신타아제
표 16-5. 테르펜
신타아제의
구조적 정렬
a Polar tremuloides 이소프렌 신타아제
b 보르닐 디포스페이트 신타아제
c 리모넨 신타아제
d 5-에피-아리스토로첸 신타아제
e Ca 원자에 대해서 Å 로 표기된 평균평방근편차 및 괄호에는 정렬된 잔기의 넘버임
구축물 P.tremTRC-pET200 으로부터의 Poplar tremuloides IspS 의 상기 실시예에서, 넘버링의 통상 방식은 태그를 포함하는 완전한 서열의 제 1 의 넘버를 -35 으로 하고, IspS 의 제 1 의 잔기를 1 로 하는 방식이다.
BdpS 구조 및 포플러 IspS 구조로부터의 활성 부위의 비교로, 금속 이온 결합 및 포스페이트 인지와 관여하는 활성 부위가 보존된다는 것을 나타낸다. 특히, 포플러 IspS 의 Arg 255, Asp 292, Asp 296, Glu 370, Arg 433 및 Asn 436 는 BdpS 내 동 잔기와 오버랩되는 것으로 관찰되었다. BdpS 의 중간체의 위치결정을 또한 포플러 IspS 구조와 비교하였다. 상기를 기준으로 하면, 포플러 IspS 효소와 결합하고 반응하기 위해 디메틸알릴 피로포스테이트가 요구할 수 있는 유사한 결합 영역 및 접근 방향을 동정할 수 있었다.
포플러 IspS 의 구조를 기준으로, 개선된 성능을 지닌 변이체 IspS 효소를 생성하는 돌연변이유발 후보로서 포플러 IspS 의 부위를 동정하였다. 요약하면, 금속 결합의 상호작용, 디포스페이트 인지, DMAPP 사슬 결합 및/또는 활성 부위로의 접근을 변경할 수 있는 부위를 IspS 내에서 선별하였다.
I. 디포스페이트/ 금속 결합 부위
금속 및 디포스페이트 결합 측쇄 근처에서 발견되는 포플러 IspS 내 아미노산 잔기의 측쇄를 동정하였다. 이들 잔기에는 Asp 293, Tyr 385, Ser 392, 및 Asp 437 이 포함된다. 이들 부위의 조작으로 효소 활성 증가를 도모할 수 있다.
II. 기질 접근 루프
포플러 IspS 의 기질 접근 루프는 BdpS 구조로부터 벗어난 영역 내에 존재한다. BdpS 구조에서, 잔기는 활성 부위 위 커버를 만든다. 기질 결합시 포플러 IspS 의 구조는 유사한 구조를 형성하기 쉽다. 그리하여 잔기 440-453 및 512-524 를 비롯한 이들 루프 내 잔기는 포플러 IspS 효소의 활성을 변경하는 위치에 올 것이다. 포플러 IspS 효소에서, 잔기 440-453 는 서열 SASAEIARGETANS 를 갖고, 잔기 512-526 는 서열 YHNGDAHTSPDEL 을 갖는다.
III. 이소프레닐 결합 부위
BdpS 와 반응 생성물, 보르닐 디포스페이트의 복합체를 (PDB 엔트리 1N24), 단백질 공학으로 기질 특이성 및/또는 반응 속도 (기질과 생성물의 변경된 온 (on) 및 오프 (off) 속도) 를 조절할 수 있는 포플러 IspS 내 잔기를 동정하는데 사용될 수 있다. 이들 잔기에는 Ser 261, Trp 264, Phe 285, Thr 289, Ser 393, Ser 394, Phe 432, 및 Try 512 이 포함된다.
표 16-6. 후보 돌연변이유발 부위
표 16-7.
P.
tremuloides
IspS 의
좌표
본 발명의 기술된 방법 및 시스템의 각종 변경 및 변형은 본 발명의 영역 및 취지로부터 벗어나지 않은 채 당업자에게는 자명할 것이다. 비록 본 발명을 특정 바람직한 구현예와 연관지어 설명하였더라도, 청구되는 바와 같이 본 발명이 그러한 특정한 실시예로 과도하게 한정되어지지 않아야 된다는 점은 분명하다. 정말로, 당업자에게 분명한 본 발명을 실시하기 위해 기술되어 있는 형식들의 각종 변형은 하기 청구항 범위 내에 존재하는 것으로 의도된다.
<110> GENENCOR INTERNATIONAL, INC.
THE GOODYEAR TIRE & RUBBER COMPANY
Marguerite A. CERVIN
Gregory M. WHITED
Ansrei MIASNIKOV
Caroline PERES
Walter WEYLER
Derek WELLS
<120> ISOPRENE SYNTHASE VARIANTS FOR IMPROVED MICROBIAL PRODUCTION OF
ISOPRENE
<130> 643842000540
<140> Not Yet Assigned
<141> 2009-04-23
<150> US 61/125,336
<151> 2008-04-23
<160> 167
<170> FastSEQ for Windows Version 4.0
<210> 1
<211> 1695
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 1
atgtgtgcga cctcttctca atttactcag attaccgagc ataattcccg tcgttccgca 60
aactatcagc caaacctgtg gaatttcgaa ttcctgcaat ccctggagaa cgacctgaaa 120
gtggaaaagc tggaggagaa agcgaccaaa ctggaggaag aagttcgctg catgatcaac 180
cgtgtagaca cccagccgct gtccctgctg gagctgatcg acgatgtgca gcgcctgggt 240
ctgacctaca aatttgaaaa agacatcatt aaagccctgg aaaacatcgt actgctggac 300
gaaaacaaaa agaacaaatc tgacctgcac gcaaccgctc tgtctttccg tctgctgcgt 360
cagcacggtt tcgaggtttc tcaggatgtt tttgagcgtt tcaaggataa agaaggtggt 420
ttcagcggtg aactgaaagg tgacgtccaa ggcctgctga gcctgtatga agcgtcttac 480
ctgggtttcg agggtgagaa cctgctggag gaggcgcgta ccttttccat cacccacctg 540
aagaacaacc tgaaagaagg cattaatacc aaggttgcag aacaagtgag ccacgccctg 600
gaactgccat atcaccagcg tctgcaccgt ctggaggcac gttggttcct ggataaatac 660
gaaccgaaag aaccgcatca ccagctgctg ctggagctgg cgaagctgga ttttaacatg 720
gtacagaccc tgcaccagaa agagctgcaa gatctgtccc gctggtggac cgagatgggc 780
ctggctagca aactggattt tgtacgcgac cgcctgatgg aagtttattt ctgggcactg 840
ggtatggcgc cagacccgca gtttggtgaa tgtcgcaaag ctgttactaa aatgtttggt 900
ctggtgacga tcatcgatga cgtgtatgac gtttatggca ctctggacga actgcaactg 960
ttcaccgatg ctgtagagcg ctgggacgtt aacgctatta acaccctgcc ggactatatg 1020
aaactgtgtt tcctggcact gtacaacacc gttaacgaca cgtcctattc tattctgaaa 1080
gagaaaggtc ataacaacct gtcctatctg acgaaaagct ggcgtgaact gtgcaaagcc 1140
tttctgcaag aggcgaaatg gtccaacaac aaaattatcc cggctttctc caagtacctg 1200
gaaaacgcca gcgtttcctc ctccggtgta gcgctgctgg cgccgtctta cttttccgta 1260
tgccagcagc aggaagacat ctccgaccac gcgctgcgtt ccctgaccga cttccatggt 1320
ctggtgcgtt ctagctgcgt tatcttccgc ctgtgcaacg atctggccac ctctgcggcg 1380
gagctggaac gtggcgagac taccaattct atcattagct acatgcacga aaacgatggt 1440
accagcgagg aacaggcccg cgaagaactg cgtaaactga tcgacgccga atggaaaaag 1500
atgaatcgtg aacgcgttag cgactccacc ctgctgccta aagcgttcat ggaaatcgca 1560
gttaacatgg cacgtgtttc ccactgcacc taccagtatg gcgatggtct gggtcgccca 1620
gactacgcga ctgaaaaccg catcaaactg ctgctgattg accctttccc gattaaccag 1680
ctgatgtatg tctaa 1695
<210> 2
<211> 564
<212> PRT
<213> Peuraria sp.
<400> 2
Met Cys Ala Thr Ser Ser Gln Phe Thr Gln Ile Thr Glu His Asn Ser
1 5 10 15
Arg Arg Ser Ala Asn Tyr Gln Pro Asn Leu Trp Asn Phe Glu Phe Leu
20 25 30
Gln Ser Leu Glu Asn Asp Leu Lys Val Glu Lys Leu Glu Glu Lys Ala
35 40 45
Thr Lys Leu Glu Glu Glu Val Arg Cys Met Ile Asn Arg Val Asp Thr
50 55 60
Gln Pro Leu Ser Leu Leu Glu Leu Ile Asp Asp Val Gln Arg Leu Gly
65 70 75 80
Leu Thr Tyr Lys Phe Glu Lys Asp Ile Ile Lys Ala Leu Glu Asn Ile
85 90 95
Val Leu Leu Asp Glu Asn Lys Lys Asn Lys Ser Asp Leu His Ala Thr
100 105 110
Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe Glu Val Ser Gln
115 120 125
Asp Val Phe Glu Arg Phe Lys Asp Lys Glu Gly Gly Phe Ser Gly Glu
130 135 140
Leu Lys Gly Asp Val Gln Gly Leu Leu Ser Leu Tyr Glu Ala Ser Tyr
145 150 155 160
Leu Gly Phe Glu Gly Glu Asn Leu Leu Glu Glu Ala Arg Thr Phe Ser
165 170 175
Ile Thr His Leu Lys Asn Asn Leu Lys Glu Gly Ile Asn Thr Lys Val
180 185 190
Ala Glu Gln Val Ser His Ala Leu Glu Leu Pro Tyr His Gln Arg Leu
195 200 205
His Arg Leu Glu Ala Arg Trp Phe Leu Asp Lys Tyr Glu Pro Lys Glu
210 215 220
Pro His His Gln Leu Leu Leu Glu Leu Ala Lys Leu Asp Phe Asn Met
225 230 235 240
Val Gln Thr Leu His Gln Lys Glu Leu Gln Asp Leu Ser Arg Trp Trp
245 250 255
Thr Glu Met Gly Leu Ala Ser Lys Leu Asp Phe Val Arg Asp Arg Leu
260 265 270
Met Glu Val Tyr Phe Trp Ala Leu Gly Met Ala Pro Asp Pro Gln Phe
275 280 285
Gly Glu Cys Arg Lys Ala Val Thr Lys Met Phe Gly Leu Val Thr Ile
290 295 300
Ile Asp Asp Val Tyr Asp Val Tyr Gly Thr Leu Asp Glu Leu Gln Leu
305 310 315 320
Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala Ile Asn Thr Leu
325 330 335
Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr Asn Thr Val Asn
340 345 350
Asp Thr Ser Tyr Ser Ile Leu Lys Glu Lys Gly His Asn Asn Leu Ser
355 360 365
Tyr Leu Thr Lys Ser Trp Arg Glu Leu Cys Lys Ala Phe Leu Gln Glu
370 375 380
Ala Lys Trp Ser Asn Asn Lys Ile Ile Pro Ala Phe Ser Lys Tyr Leu
385 390 395 400
Glu Asn Ala Ser Val Ser Ser Ser Gly Val Ala Leu Leu Ala Pro Ser
405 410 415
Tyr Phe Ser Val Cys Gln Gln Gln Glu Asp Ile Ser Asp His Ala Leu
420 425 430
Arg Ser Leu Thr Asp Phe His Gly Leu Val Arg Ser Ser Cys Val Ile
435 440 445
Phe Arg Leu Cys Asn Asp Leu Ala Thr Ser Ala Ala Glu Leu Glu Arg
450 455 460
Gly Glu Thr Thr Asn Ser Ile Ile Ser Tyr Met His Glu Asn Asp Gly
465 470 475 480
Thr Ser Glu Glu Gln Ala Arg Glu Glu Leu Arg Lys Leu Ile Asp Ala
485 490 495
Glu Trp Lys Lys Met Asn Arg Glu Arg Val Ser Asp Ser Thr Leu Leu
500 505 510
Pro Lys Ala Phe Met Glu Ile Ala Val Asn Met Ala Arg Val Ser His
515 520 525
Cys Thr Tyr Gln Tyr Gly Asp Gly Leu Gly Arg Pro Asp Tyr Ala Thr
530 535 540
Glu Asn Arg Ile Lys Leu Leu Leu Ile Asp Pro Phe Pro Ile Asn Gln
545 550 555 560
Leu Met Tyr Val
<210> 3
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 3
cgtgagatca tatgtgtgcg acctcttctc aatttac 37
<210> 4
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 4
cggtcgacgg atccctgcag ttagacatac atcagctg 38
<210> 5
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 5
catatgaaag cttgtatcga ttaaataagg aggaataaac c 41
<210> 6
<211> 1680
<212> DNA
<213> Poplus alba x tremula
<400> 6
atgtgctctg tttctaccga gaacgtttcc ttcactgaga cggaaaccga ggcacgtcgt 60
agcgcgaact acgagccgaa tagctgggac tacgatttcc tgctgtcttc cgatactgac 120
gaatctattg aggtgtacaa agacaaagca aagaaactgg aggctgaagt gcgccgcgaa 180
attaacaacg agaaagctga attcctgact ctgctggagc tgatcgataa cgtacagcgc 240
ctgggtctgg gttaccgctt cgaatctgat atccgtcgcg cactggatcg tttcgtaagc 300
agcggcggtt tcgatggcgt gaccaaaacg agcctgcacg ctaccgcgct gtccttccgt 360
ctgctgcgtc agcacggctt cgaagtttct caggaagcat tctccggttt caaagatcaa 420
aacggtaact tcctggaaaa cctgaaagaa gacactaagg cgatcctgag cctgtatgag 480
gcaagctttc tggccctgga gggtgagaac atcctggatg aggcgcgcgt attcgccatc 540
tcccatctga aagagctgtc tgaagagaaa atcggtaagg aactggcaga gcaggttaat 600
cacgcactgg aactgccgct gcatcgtcgt acccagcgtc tggaggcggt ttggtccatc 660
gaagcgtacc gcaaaaagga ggatgctaac caggttctgc tggaactggc catcctggac 720
tacaacatga tccagtccgt ttaccagcgt gatctgcgtg aaacctcccg ttggtggcgc 780
cgtgtgggcc tggcgaccaa actgcacttc gctaaggacc gcctgattga gtctttttac 840
tgggcagtcg gcgttgcgtt cgaacctcag tattctgact gccgtaacag cgttgcgaaa 900
atgttcagct tcgttactat tatcgacgac atctacgacg tttacggtac tctggacgag 960
ctggaactgt ttaccgacgc tgtcgaacgt tgggatgtta acgccatcaa cgatctgcct 1020
gactacatga aactgtgctt cctggcactg tataacacga tcaacgaaat tgcatacgac 1080
aacctgaaag acaaaggtga aaacatcctg ccgtacctga ctaaagcgtg ggcggatctg 1140
tgtaacgctt ttctgcaaga agcgaaatgg ctgtataaca aatccactcc gacctttgac 1200
gattatttcg gcaatgcctg gaaatccagc tctggcccgc tgcaactgat cttcgcttat 1260
tttgcggttg tccaaaacat caaaaaggag gaaattgaaa acctgcaaaa ataccacgat 1320
atcattagcc gtccttctca tatctttcgc ctgtgcaacg acctggcaag cgcgtccgca 1380
gagatcgcac gtggcgaaac cgctaactct gtttcctgct acatgcgcac caagggcatt 1440
tccgaagagc tggcaaccga gagcgtaatg aatctgatcg acgaaacctg taagaaaatg 1500
aacaaagaaa aactgggtgg ctccctgttc gctaaaccgt tcgtagagac tgctattaac 1560
ctggcacgtc agagccactg cacctaccac aatggtgacg cacatactag cccggatgaa 1620
ctgactcgta aacgtgtact gtctgttatc accgaaccga ttctgccgtt cgaacgttaa 1680
1680
<210> 7
<211> 559
<212> PRT
<213> Poplus alba x tremula
<400> 7
Met Cys Ser Val Ser Thr Glu Asn Val Ser Phe Thr Glu Thr Glu Thr
1 5 10 15
Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr Asp
20 25 30
Phe Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val Tyr Lys Asp
35 40 45
Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn Glu
50 55 60
Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln Arg
65 70 75 80
Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Arg Ala Leu Asp
85 90 95
Arg Phe Val Ser Ser Gly Gly Phe Asp Gly Val Thr Lys Thr Ser Leu
100 105 110
His Ala Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe Glu
115 120 125
Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn Phe
130 135 140
Leu Glu Asn Leu Lys Glu Asp Thr Lys Ala Ile Leu Ser Leu Tyr Glu
145 150 155 160
Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala Arg
165 170 175
Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile Gly
180 185 190
Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu Pro Leu His
195 200 205
Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu Ala Tyr Arg
210 215 220
Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala Ile Leu Asp
225 230 235 240
Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr Ser
245 250 255
Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala Lys
260 265 270
Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe Glu
275 280 285
Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser Phe
290 295 300
Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp Glu
305 310 315 320
Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala Ile
325 330 335
Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr Asn
340 345 350
Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys Gly Glu Asn
355 360 365
Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala Phe
370 375 380
Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe Asp
385 390 395 400
Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln Leu
405 410 415
Ile Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu Ile
420 425 430
Glu Asn Leu Gln Lys Tyr His Asp Ile Ile Ser Arg Pro Ser His Ile
435 440 445
Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala Arg
450 455 460
Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly Ile
465 470 475 480
Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu Thr
485 490 495
Cys Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala Lys
500 505 510
Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys Thr
515 520 525
Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg Lys
530 535 540
Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg
545 550 555
<210> 8
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 8
gagaaaatcg gtaaggaact gg 22
<210> 9
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 9
Leu Ala Ser Ala Ser Ala Glu Ile Ala Arg Gly Glu Thr
1 5 10
<210> 10
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 10
ctggaggaag aagttcgctc catgatcaac cgtgtagac 39
<210> 11
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 11
cgccagaccc gcagtttggt gaatctcgca aagctgttac taaaatg 47
<210> 12
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 12
cgccgtctta cttttccgta tcccagcagc aggaagacat c 41
<210> 13
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 13
catggtctgg tgcgttctag ctccgttatc ttccgcctgt gc 42
<210> 14
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 14
gatgtcttcc tgctgctggg atacggaaaa gtaagacggc g 41
<210> 15
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 15
gatcaagctt aaccggaatt gccagctg 28
<210> 16
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 16
gatccgatcg tcagaagaac tcgtcaagaa ggc 33
<210> 17
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 17
ccaaactgca cttcgctcgt gaccgcctga ttgag 35
<210> 18
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 18
atctttcgcc tgtgcgacga cctggcaagc 30
<210> 19
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 19
tgaatctgat cgacgaaacc tggaagaaaa tgaacaaaga aaaac 45
<210> 20
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 20
gatcatgcat tcgcccttag gaggtaaaaa aacatgtgtg cgacctcttc tcaatttact 60
60
<210> 21
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 21
cggtcgacgg atccctgcag ttagacatac atcagctg 38
<210> 22
<211> 5679
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (3895)
<223> n = A,T,C or G
<400> 22
aagggcgaat tctgcagata tccatcacac tggcggccgc tcgagcatgc atctagaggg 60
cccaattcgc cctatagtga gtcgtattac aattcactgg ccgtcgtttt acaacgtcgt 120
gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc 180
agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg 240
aatggcgaat ggacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc 300
gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt 360
cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag 420
ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt 480
cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt 540
tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt 600
cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt 660
aacaaaaatt taacgcgaat tttaacaaaa ttcagggcgc aagggctgct aaaggaagcg 720
gaacacgtag aaagccagtc cgcagaaacg gtgctgaccc cggatgaatg tcagctactg 780
ggctatctgg acaagggaaa acgcaagcgc aaagagaaag caggtagctt gcagtgggct 840
tacatggcga tagctagact gggcggtttt atggacagca agcgaaccgg aattgccagc 900
tggggcgccc tctggtaagg ttgggaagcc ctgcaaagta aactggatgg ctttcttgcc 960
gccaaggatc tgatggcgca ggggatcaag atctgatcaa gagacaggat gaggatcgtt 1020
tcgcatgatt gaacaagatg gattgcacgc aggttctccg gccgcttggg tggagaggct 1080
attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg tgttccggct 1140
gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg ccctgaatga 1200
actgcaggac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc cttgcgcagc 1260
tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg aagtgccggg 1320
gcaggatctc ctgtcatccc accttgctcc tgccgagaaa gtatccatca tggctgatgc 1380
aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc aagcgaaaca 1440
tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg atgatctgga 1500
cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg cgcgcatgcc 1560
cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata tcatggtgga 1620
aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg accgctatca 1680
ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat gggctgaccg 1740
cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct tctatcgcct 1800
tcttgacgag ttcttctgaa ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc 1860
gcccttattc ccttttttgc ggcattttgc cttcctgttt ttgctcaccc agaaacgctg 1920
gtgaaagtaa aagatgctga agatcagttg ggtgcacgag tgggttacat cgaactggat 1980
ctcaacagcg gtaagatcct tgagagtttt cgccccgaag aacgttttcc aatgatgagc 2040
acttttaaag ttctgctatg tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa 2100
ctcggtcgcc gcatacacta ttctcagaat gacttggttg agtactcacc agtcacagaa 2160
aagcatctta cggatggcat gacagtaaga gaattatgca gtgctgccat aaccatgagt 2220
gataacactg cggccaactt acttctgaca acgatcggag gaccgaagga gctaaccgct 2280
tttttgcaca acatggggga tcatgtaact cgccttgatc gttgggaacc ggagctgaat 2340
gaagccatac caaacgacga gcgtgacacc acgatgcctg tagcaatggc aacaacgttg 2400
cgcaaactat taactggcga actacttact ctagcttccc ggcaacaatt aatagactgg 2460
atggaggcgg ataaagttgc aggaccactt ctgcgctcgg cccttccggc tggctggttt 2520
attgctgata aatctggagc cggtgagcgt gggtctcgcg gtatcattgc agcactgggg 2580
ccagatggta agccctcccg tatcgtagtt atctacacga cggggagtca ggcaactatg 2640
gatgaacgaa atagacagat cgctgagata ggtgcctcac tgattaagca ttggtaactg 2700
tcagaccaag tttactcata tatactttag attgatttaa aacttcattt ttaatttaaa 2760
aggatctagg tgaagatcct ttttgataat ctcatgacca aaatccctta acgtgagttt 2820
tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt 2880
tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 2940
ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag 3000
ataccaaata ctgttcttct agtgtagccg tagttaggcc accacttcaa gaactctgta 3060
gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat 3120
aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg 3180
ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg 3240
agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac 3300
aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga 3360
aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt 3420
ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta 3480
cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat 3540
tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg cagccgaacg 3600
accgagcgca gcgagtcagt gagcgaggaa gcggaagagc gcccaatacg caaaccgcct 3660
ctccccgcgc gttggccgat tcattaatgc agctggcacg acaggtttcc cgactggaaa 3720
gcgggcagtg agcgcaacgc aattaatgtg agttagctca ctcattaggc accccaggct 3780
ttacacttta tgcttccggc tcgtatgttg tgtggaattg tgagcggata acaatttcac 3840
acaggaaaca gctatgacca tgattacgcc aagcttggta ccgagctcgg atccnctagt 3900
aacggccgcc agtgtgctgg aattcgccct tgatcatgca ttcgccctta ggaggtaaaa 3960
aaacatgtgt gcgacctctt ctcaatttac tcagattacc gagcataatt cccgtcgttc 4020
cgcaaactat cagccaaacc tgtggaattt cgaattcctg caatccctgg agaacgacct 4080
gaaagtggaa aagctggagg agaaagcgac caaactggag gaagaagttc gctgcatgat 4140
caaccgtgta gacacccagc cgctgtccct gctggagctg atcgacgatg tgcagcgcct 4200
gggtctgacc tacaaatttg aaaaagacat cattaaagcc ctggaaaaca tcgtactgct 4260
ggacgaaaac aaaaagaaca aatctgacct gcacgcaacc gctctgtctt tccgtctgct 4320
gcgtcagcac ggtttcgagg tttctcagga tgtttttgag cgtttcaagg ataaagaagg 4380
tggtttcagc ggtgaactga aaggtgacgt ccaaggcctg ctgagcctgt atgaagcgtc 4440
ttacctgggt ttcgagggtg agaacctgct ggaggaggcg cgtacctttt ccatcaccca 4500
cctgaagaac aacctgaaag aaggcattaa taccaaggtt gcagaacaag tgagccacgc 4560
cctggaactg ccatatcacc agcgtctgca ccgtctggag gcacgttggt tcctggataa 4620
atacgaaccg aaagaaccgc atcaccagct gctgctggag ctggcgaagc tggattttaa 4680
catggtacag accctgcacc agaaagagct gcaagatctg tcccgctggt ggaccgagat 4740
gggcctggct agcaaactgg attttgtacg cgaccgcctg atggaagttt atttctgggc 4800
actgggtatg gcgccagacc cgcagtttgg tgaatgtcgc aaagctgtta ctaaaatgtt 4860
tggtctggtg acgatcatcg atgacgtgta tgacgtttat ggcactctgg acgaactgca 4920
actgttcacc gatgctgtag agcgctggga cgttaacgct attaacaccc tgccggacta 4980
tatgaaactg tgtttcctgg cactgtacaa caccgttaac gacacgtcct attctattct 5040
gaaagagaaa ggtcataaca acctgtccta tctgacgaaa agctggcgtg aactgtgcaa 5100
agcctttctg caagaggcga aatggtccaa caacaaaatt atcccggctt tctccaagta 5160
cctggaaaac gccagcgttt cctcctccgg tgtagcgctg ctggcgccgt cttacttttc 5220
cgtatgccag cagcaggaag acatctccga ccacgcgctg cgttccctga ccgacttcca 5280
tggtctggtg cgttctagct gcgttatctt ccgcctgtgc aacgatctgg ccacctctgc 5340
ggcggagctg gaacgtggcg agactaccaa ttctatcatt agctacatgc acgaaaacga 5400
tggtaccagc gaggaacagg cccgcgaaga actgcgtaaa ctgatcgacg ccgaatggaa 5460
aaagatgaat cgtgaacgcg ttagcgactc caccctgctg cctaaagcgt tcatggaaat 5520
cgcagttaac atggcacgtg tttcccactg cacctaccag tatggcgatg gtctgggtcg 5580
cccagactac gcgactgaaa accgcatcaa actgctgctg attgaccctt tcccgattaa 5640
ccagctgatg tatgtctaac tgcagggatc cgtcgaccg 5679
<210> 23
<211> 6974
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 23
gtgcggccgc aagcttgtcg acggagctcg aattcggatc cctgcagtta gacatacatc 60
agctggttaa tcgggaaagg gtcaatcagc agcagtttga tgcggttttc agtcgcgtag 120
tctgggcgac ccagaccatc gccatactgg taggtgcagt gggaaacacg tgccatgtta 180
actgcgattt ccatgaacgc tttaggcagc agggtggagt cgctaacgcg ttcacgattc 240
atctttttcc attcggcgtc gatcagttta cgcagttctt cgcgggcctg ttcctcgctg 300
gtaccatcgt tttcgtgcat gtagctaatg atagaattgg tagtctcgcc acgttccagc 360
tccgccgcag aggtggccag atcgttgcac aggcggaaga taacgcagct agaacgcacc 420
agaccatgga agtcggtcag ggaacgcagc gcgtggtcgg agatgtcttc ctgctgctgg 480
catacggaaa agtaagacgg cgccagcagc gctacaccgg aggaggaaac gctggcgttt 540
tccaggtact tggagaaagc cgggataatt ttgttgttgg accatttcgc ctcttgcaga 600
aaggctttgc acagttcacg ccagcttttc gtcagatagg acaggttgtt atgacctttc 660
tctttcagaa tagaatagga cgtgtcgtta acggtgttgt acagtgccag gaaacacagt 720
ttcatatagt ccggcagggt gttaatagcg ttaacgtccc agcgctctac agcatcggtg 780
aacagttgca gttcgtccag agtgccataa acgtcataca cgtcatcgat gatcgtcacc 840
agaccaaaca ttttagtaac agctttgcga cattcaccaa actgcgggtc tggcgccata 900
cccagtgccc agaaataaac ttccatcagg cggtcgcgta caaaatccag tttgctagcc 960
aggcccatct cggtccacca gcgggacaga tcttgcagct ctttctggtg cagggtctgt 1020
accatgttaa aatccagctt cgccagctcc agcagcagct ggtgatgcgg ttctttcggt 1080
tcgtatttat ccaggaacca acgtgcctcc agacggtgca gacgctggtg atatggcagt 1140
tccagggcgt ggctcacttg ttctgcaacc ttggtattaa tgccttcttt caggttgttc 1200
ttcaggtggg tgatggaaaa ggtacgcgcc tcctccagca ggttctcacc ctcgaaaccc 1260
aggtaagacg cttcatacag gctcagcagg ccttggacgt cacctttcag ttcaccgctg 1320
aaaccacctt ctttatcctt gaaacgctca aaaacatcct gagaaacctc gaaaccgtgc 1380
tgacgcagca gacggaaaga cagagcggtt gcgtgcaggt cagatttgtt ctttttgttt 1440
tcgtccagca gtacgatgtt ttccagggct ttaatgatgt ctttttcaaa tttgtaggtc 1500
agacccaggc gctgcacatc gtcgatcagc tccagcaggg acagcggctg ggtgtctaca 1560
cggttgatca tgcagcgaac ttcttcctcc agtttggtcg ctttctcctc cagcttttcc 1620
actttcaggt cgttctccag ggattgcagg aattcgaaat tccacaggtt tggctgatag 1680
tttgcggaac gacgggaatt atgctcggta atctgagtaa attgagaaga ggtcgcacac 1740
atggtatatc tccttcttaa agttaaacaa aattatttct agaggggaat tgttatccgc 1800
tcacaattcc cctatagtga gtcgtattaa tttcgcggga tcgagatctc gatcctctac 1860
gccggacgca tcgtggccgg catcaccggc gccacaggtg cggttgctgg cgcctatatc 1920
gccgacatca ccgatgggga agatcgggct cgccacttcg ggctcatgag cgcttgtttc 1980
ggcgtgggta tggtggcagg ccccgtggcc gggggactgt tgggcgccat ctccttgcat 2040
gcaccattcc ttgcggcggc ggtgctcaac ggcctcaacc tactactggg ctgcttccta 2100
atgcaggagt cgcataaggg agagcgtcga gatcccggac accatcgaat ggcgcaaaac 2160
ctttcgcggt atggcatgat agcgcccgga agagagtcaa ttcagggtgg tgaatgtgaa 2220
accagtaacg ttatacgatg tcgcagagta tgccggtgtc tcttatcaga ccgtttcccg 2280
cgtggtgaac caggccagcc acgtttctgc gaaaacgcgg gaaaaagtgg aagcggcgat 2340
ggcggagctg aattacattc ccaaccgcgt ggcacaacaa ctggcgggca aacagtcgtt 2400
gctgattggc gttgccacct ccagtctggc cctgcacgcg ccgtcgcaaa ttgtcgcggc 2460
gattaaatct cgcgccgatc aactgggtgc cagcgtggtg gtgtcgatgg tagaacgaag 2520
cggcgtcgaa gcctgtaaag cggcggtgca caatcttctc gcgcaacgcg tcagtgggct 2580
gatcattaac tatccgctgg atgaccagga tgccattgct gtggaagctg cctgcactaa 2640
tgttccggcg ttatttcttg atgtctctga ccagacaccc atcaacagta ttattttctc 2700
ccatgaagac ggtacgcgac tgggcgtgga gcatctggtc gcattgggtc accagcaaat 2760
cgcgctgtta gcgggcccat taagttctgt ctcggcgcgt ctgcgtctgg ctggctggca 2820
taaatatctc actcgcaatc aaattcagcc gatagcggaa cgggaaggcg actggagtgc 2880
catgtccggt tttcaacaaa ccatgcaaat gctgaatgag ggcatcgttc ccactgcgat 2940
gctggttgcc aacgatcaga tggcgctggg cgcaatgcgc gccattaccg agtccgggct 3000
gcgcgttggt gcggatatct cggtagtggg atacgacgat accgaagaca gctcatgtta 3060
tatcccgccg ttaaccacca tcaaacagga ttttcgcctg ctggggcaaa ccagcgtgga 3120
ccgcttgctg caactctctc agggccaggc ggtgaagggc aatcagctgt tgcccgtctc 3180
actggtgaaa agaaaaacca ccctggcgcc caatacgcaa accgcctctc cccgcgcgtt 3240
ggccgattca ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc 3300
gcaacgcaat taatgtaagt tagctcactc attaggcacc gggatctcga ccgatgccct 3360
tgagagcctt caacccagtc agctccttcc ggtgggcgcg gggcatgact atcgtcgccg 3420
cacttatgac tgtcttcttt atcatgcaac tcgtaggaca ggtgccggca gcgctctggg 3480
tcattttcgg cgaggaccgc tttcgctgga gcgcgacgat gatcggcctg tcgcttgcgg 3540
tattcggaat cttgcacgcc ctcgctcaag ccttcgtcac tggtcccgcc accaaacgtt 3600
tcggcgagaa gcaggccatt atcgccggca tggcggcccc acgggtgcgc atgatcgtgc 3660
tcctgtcgtt gaggacccgg ctaggctggc ggggttgcct tactggttag cagaatgaat 3720
caccgatacg cgagcgaacg tgaagcgact gctgctgcaa aacgtctgcg acctgagcaa 3780
caacatgaat ggtcttcggt ttccgtgttt cgtaaagtct ggaaacgcgg aagtcagcgc 3840
cctgcaccat tatgttccgg atctgcatcg caggatgctg ctggctaccc tgtggaacac 3900
ctacatctgt attaacgaag cgctggcatt gaccctgagt gatttttctc tggtcccgcc 3960
gcatccatac cgccagttgt ttaccctcac aacgttccag taaccgggca tgttcatcat 4020
cagtaacccg tatcgtgagc atcctctctc gtttcatcgg tatcattacc cccatgaaca 4080
gaaatccccc ttacacggag gcatcagtga ccaaacagga aaaaaccgcc cttaacatgg 4140
cccgctttat cagaagccag acattaacgc ttctggagaa actcaacgag ctggacgcgg 4200
atgaacaggc agacatctgt gaatcgcttc acgaccacgc tgatgagctt taccgcagct 4260
gcctcgcgcg tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg 4320
tcacagcttg tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg 4380
gtgttggcgg gtgtcggggc gcagccatga cccagtcacg tagcgatagc ggagtgtata 4440
ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata tatgcggtgt 4500
gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgctcttc cgcttcctcg 4560
ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag 4620
gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa 4680
ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 4740
cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 4800
ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 4860
accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 4920
catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 4980
gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 5040
tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 5100
agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 5160
actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga 5220
gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 5280
aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 5340
gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gaacaataaa 5400
actgtctgct tacataaaca gtaatacaag gggtgttatg agccatattc aacgggaaac 5460
gtcttgctct aggccgcgat taaattccaa catggatgct gatttatatg ggtataaatg 5520
ggctcgcgat aatgtcgggc aatcaggtgc gacaatctat cgattgtatg ggaagcccga 5580
tgcgccagag ttgtttctga aacatggcaa aggtagcgtt gccaatgatg ttacagatga 5640
gatggtcaga ctaaactggc tgacggaatt tatgcctctt ccgaccatca agcattttat 5700
ccgtactcct gatgatgcat ggttactcac cactgcgatc cccgggaaaa cagcattcca 5760
ggtattagaa gaatatcctg attcaggtga aaatattgtt gatgcgctgg cagtgttcct 5820
gcgccggttg cattcgattc ctgtttgtaa ttgtcctttt aacagcgatc gcgtatttcg 5880
tctcgctcag gcgcaatcac gaatgaataa cggtttggtt gatgcgagtg attttgatga 5940
cgagcgtaat ggctggcctg ttgaacaagt ctggaaagaa atgcataaac ttttgccatt 6000
ctcaccggat tcagtcgtca ctcatggtga tttctcactt gataacctta tttttgacga 6060
ggggaaatta ataggttgta ttgatgttgg acgagtcgga atcgcagacc gataccagga 6120
tcttgccatc ctatggaact gcctcggtga gttttctcct tcattacaga aacggctttt 6180
tcaaaaatat ggtattgata atcctgatat gaataaattg cagtttcatt tgatgctcga 6240
tgagtttttc taagaattaa ttcatgagcg gatacatatt tgaatgtatt tagaaaaata 6300
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgaaatt gtaaacgtta 6360
atattttgtt aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg 6420
ccgaaatcgg caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtgttg 6480
ttccagtttg gaacaagagt ccactattaa agaacgtgga ctccaacgtc aaagggcgaa 6540
aaaccgtcta tcagggcgat ggcccactac gtgaaccatc accctaatca agttttttgg 6600
ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg gagcccccga tttagagctt 6660
gacggggaaa gccggcgaac gtggcgagaa aggaagggaa gaaagcgaaa ggagcgggcg 6720
ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc gccgcgctta 6780
atgcgccgct acagggcgcg tcccattcgc caatccggat atagttcctc ctttcagcaa 6840
aaaacccctc aagacccgtt tagaggcccc aaggggttat gctagttatt gctcagcggt 6900
ggcagcagcc aactcagctt cctttcgggc tttgttagca gccggatctc agtggtggtg 6960
gtggtggtgc tcga 6974
<210> 24
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (19)..(20)
<223> n = A,T,C or G
<400> 24
cataattccc gtcgttccnn saactatcag ccaaacctg 39
<210> 25
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (22)..(23)
<223> n = A,T,C or G
<400> 25
cataattccc gtcgttccgc annstatcag ccaaacctgt g 41
<210> 26
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (18)..(19)
<223> n = A,T,C or G
<400> 26
cccgtcgttc cgcaaacnns cagccaaacc tgtggaattt c 41
<210> 27
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (18)..(19)
<223> n = A,T,C or G
<400> 27
gtcgttccgc aaactatnns ccaaacctgt ggaatttc 38
<210> 28
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (19)..(20)
<223> n = A,T,C or G
<400> 28
ctggattttg tacgcgacnn sctgatggaa gtttatttc 39
<210> 29
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (19)..(20)
<223> n = A,T,C or G
<400> 29
ctgatggaag tttatttcnn sgcactgggt atggcgcc 38
<210> 30
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (20)..(21)
<223> n = A,T,C or G
<400> 30
caaagctgtt actaaaatgn nsggtctggt gacgatcatc 40
<210> 31
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (18)..(19)
<223> n = A,T,C or G
<400> 31
ctaaaatgtt tggtctgnns acgatcatcg atgacgtg 38
<210> 32
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (22)..(23)
<223> n = A,T,C or G
<400> 32
gaaaacgcca gcgtttcctc cnnsggtgta gcgctgctgg c 41
<210> 33
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 33
caccatgcgt tgtagcgtgt cca 23
<210> 34
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 34
gggcccgttt aaactttaac tagactctgc agttagcgtt caaacggcag aa 52
<210> 35
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 35
gaaggagata tacatatgag cgtgtccacc gaaaatg 37
<210> 36
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 36
cattttcggt ggacacgctc atatgtatat ctccttc 37
<210> 37
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 37
gaaggagata tacatatggt gtccaccgaa aatgtgtc 38
<210> 38
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 38
gacacatttt cggtggacac catatgtata tctccttc 38
<210> 39
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 39
gaaggagata tacatatgac cgaaaatgtg tctttcac 38
<210> 40
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 40
gtgaaagaca cattttcggt catatgtata tctccttc 38
<210> 41
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 41
gaaggagata tacatatgaa tgtgtctttc accgaaac 38
<210> 42
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 42
gtttcggtga aagacacatt catatgtata tctccttc 38
<210> 43
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 43
gaaggagata tacatatgga agctcgtcgt tctgcg 36
<210> 44
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 44
cgcagaacga cgagcttcca tatgtatatc tccttc 36
<210> 45
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 45
gaaggagata tacatatgcg ttgtagcgtg 30
<210> 46
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 46
cccgcgctta ctcgaggccc tgaaaataca ggttttcgcg ttcaaacggc agaatcggtt 60
60
<210> 47
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 47
gaaactgaaa cccatatgga agctcgtcgt tctgc 35
<210> 48
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 48
gcatgctcga gcggccgctt ttaatcaaac atcctgccaa ctc 43
<210> 49
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 49
gatcgaaggg cgatcgtgtc acagtctggc gaaaccg 37
<210> 50
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 50
ctgaattctg cagatatctg tttttccact cttcgttcac ttt 43
<210> 51
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 51
tctagagggc ccaagaaaaa tgccccgctt acg 33
<210> 52
<211> 111
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 52
gatcgcggcc gcgcccttga cgatgccaca tcctgagcaa ataattcaac cactaattgt 60
gagcggataa cacaaggagg aaacagctat gtcattaccg ttcttaactt c 111
<210> 53
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 53
gatcgggccc caagaaaaaa ggcacgtcat ctgacgtgcc ttttttattt gtagacgcgt 60
tgttatagca ttcta 75
<210> 54
<211> 81
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 54
aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaagcaa 60
ttaaccctca ctaaagggcg g 81
<210> 55
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 55
agagtgttca ccaaaaataa taacctttcc cggtgcagaa gttaagaacg gtaatgacat 60
agctgtttcc tccttgtgtt atccgctcac aattagtggt tgaattattt gctcaggatg 120
tggcatcgtc aagggctaat acgactcact atagggctcg 160
<210> 56
<211> 445
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 56
aaagaccgac caagcgacgt ctgagagctc cctggcgaat tcggtaccaa taaaagagct 60
ttattttcat gatctgtgtg ttggtttttg tgtgcggcgc ggaagttcct attctctaga 120
aagtatagga acttcctcga gccctatagt gagtcgtatt aaattcatat aaaaaacata 180
cagataacca tctgcggtga taaattatct ctggcggtgt tgacataaat accactggcg 240
gtgatactga gcacatcagc aggacgcact gaccaccatg aaggtgcaaa ggaggtaaaa 300
aaacatggta tcctgttctg cgccgggtaa gatttacctg ttcggtgaac acgccgtagt 360
ttatggcgaa actgcaattg cgtgtgcggt ggaactgcgt acccgtgttc gcgcggaact 420
caatgactct atcactattc agagc 445
<210> 57
<211> 445
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 57
aaagaccgac caagcgacgt ctgagagctc cctggcgaat tcggtaccaa taaaagagct 60
ttattttcat gatctgtgtg ttggtttttg tgtgcggcgc ggaagttcct attctctaga 120
aagtatagga acttcctcga gccctatagt gagtcgtatt aaattcatat aaaaaacata 180
cagataacca tctgcggtga taaattatct ctggcggtgt tgacctaaat accactggcg 240
gtgatactga gcacatcagc aggacgcact gaccaccatg aaggtgcaaa ggaggtaaaa 300
aaacatggta tcctgttctg cgccgggtaa gatttacctg ttcggtgaac acgccgtagt 360
ttatggcgaa actgcaattg cgtgtgcggt ggaactgcgt acccgtgttc gcgcggaact 420
caatgactct atcactattc agagc 445
<210> 58
<211> 442
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 58
aaagaccgac caagcgacgt ctgagagctc cctggcgaat tcggtaccaa taaaagagct 60
ttattttcat gatctgtgtg ttggtttttg tgtgcggcgc ggaagttcct attctctaga 120
aagtatagga acttcctcga gccctatagt gagtcgtatt aaattcatat aaaaaacata 180
cagataacca tctgcggtga taaattatct ctggcggtgt tgacctaaat accactggcg 240
gtgatactga gcacatcagc aggacgcact gaccaccatg aaggtgcaaa ggtaaaaaaa 300
catggtatcc tgttctgcgc cgggtaagat ttacctgttc ggtgaacacg ccgtagttta 360
tggcgaaact gcaattgcgt gtgcggtgga actgcgtacc cgtgttcgcg cggaactcaa 420
tgactctatc actattcaga gc 442
<210> 59
<211> 445
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 59
aaagaccgac caagcgacgt ctgagagctc cctggcgaat tcggtaccaa taaaagagct 60
ttattttcat gatctgtgtg ttggtttttg tgtgcggcgc ggaagttcct attctctaga 120
aagtatagga acttcctcga gccctatagt gagtcgtatt aaattcatat aaaaaacata 180
cagataacca tctgcggtga taaattatct ctggcggtgt tgacgtaaat accactggcg 240
gtgatactga gcacatcagc aggacgcact gaccaccatg aaggtgcaaa ggaggtaaaa 300
aaacatggta tcctgttctg cgccgggtaa gatttacctg ttcggtgaac acgccgtagt 360
ttatggcgaa actgcaattg cgtgtgcggt ggaactgcgt acccgtgttc gcgcggaact 420
caatgactct atcactattc agagc 445
<210> 60
<211> 81
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 60
aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaagcaa 60
ttaaccctca ctaaagggcg g 81
<210> 61
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 61
gctctgaata gtgatagagt ca 22
<210> 62
<211> 199
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (112)
<223> n = A,T,C or G
<400> 62
taaatcttac ccggcgcaga acaggatacc atgttttttt acctcctttg caccttcatg 60
gtggtcagtg cgtcctgctg atgtgctcag tatcaccgcc agtggtattt angtcaacac 120
cgccagagat aatttatcac cgcagatggt tatctgtatg ttttttatat gaatttaata 180
cgactcacta tagggctcg 199
<210> 63
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 63
aaagaccgac caagcgacgt ctga 24
<210> 64
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 64
caccatggta tcctgttctg cg 22
<210> 65
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 65
ttaatctact ttcagacctt gc 22
<210> 66
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 66
aggaggtggt ctcaaatgac tgccgacaac aatagta 37
<210> 67
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 67
aggaggtggt ctcagcgctc tgcagttata gcattctatg aatttgcctg 50
<210> 68
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (16)..(17)
<223> n = A,T,C or G
<400> 68
gaaaaagcag aatttnnkac cctgctggaa ctg 33
<210> 69
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (17)..(18)
<223> n = A,T,C or G
<400> 69
cagttccagc agggtmnnaa attctgcttt ttc 33
<210> 70
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (16)..(17)
<223> n = A,T,C or G
<400> 70
gagtctgata tccgtnnkgc gctggatcgc ttc 33
<210> 71
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (17)..(18)
<223> n = A,T,C or G
<400> 71
gaagcgatcc agcgcmnnac ggatatcaga ctc 33
<210> 72
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (16)..(17)
<223> n = A,T,C or G
<400> 72
tcccgttggt ggcgtnnkgt gggtctggcg acc 33
<210> 73
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (17)..(18)
<223> n = A,T,C or G
<400> 73
ggtcgccaga cccacmnnac gccaccaacg gga 33
<210> 74
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (16)..(17)
<223> n = A,T,C or G
<400> 74
tccgtcgcaa aaatgnnktc tttcgtaacc att 33
<210> 75
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (17)..(18)
<223> n = A,T,C or G
<400> 75
aatggttacg aaagamnnca tttttgcgac gga 33
<210> 76
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (16)..(17)
<223> n = A,T,C or G
<400> 76
gcaaaaatgt tttctnnkgt aaccattatc gac 33
<210> 77
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (17)..(18)
<223> n = A,T,C or G
<400> 77
gtcgataatg gttacmnnag aaaacatttt tgc 33
<210> 78
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (16)..(17)
<223> n = A,T,C or G
<400> 78
aaaatgtttt ctttcnnkac cattatcgac gat 33
<210> 79
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (17)..(18)
<223> n = A,T,C or G
<400> 79
atcgtcgata atggtmnnga aagaaaacat ttt 33
<210> 80
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (16)..(17)
<223> n = A,T,C or G
<400> 80
gacctgtgca acgctnnkct gcaagaagcc aag 33
<210> 81
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (17)..(18)
<223> n = A,T,C or G
<400> 81
cttggcttct tgcagmnnag cgttgcacag gtc 33
<210> 82
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (16)..(17)
<223> n = A,T,C or G
<400> 82
gcatggaaat cctctnnkgg cccgctgcaa ctg 33
<210> 83
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (17)..(18)
<223> n = A,T,C or G
<400> 83
cagttgcagc gggccmnnag aggatttcca tgc 33
<210> 84
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (16)..(17)
<223> n = A,T,C or G
<400> 84
tcttctggcc cgctgnnkct ggtgttcgct tac 33
<210> 85
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (17)..(18)
<223> n = A,T,C or G
<400> 85
gtaagcgaac accagmnnca gcgggccaga aga 33
<210> 86
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (16)..(17)
<223> n = A,T,C or G
<400> 86
ggcccgctgc aactgnnktt cgcttacttc gct 33
<210> 87
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (17)..(18)
<223> n = A,T,C or G
<400> 87
agcgaagtaa gcgaamnnca gttgcagcgg gcc 33
<210> 88
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (16)..(17)
<223> n = A,T,C or G
<400> 88
caaaaatacc atgacnnkat ctctcgtcct tcc 33
<210> 89
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (17)..(18)
<223> n = A,T,C or G
<400> 89
ggaaggacga gagatmnngt catggtattt ttg 33
<210> 90
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (16)..(17)
<223> n = A,T,C or G
<400> 90
cgtccttccc atatcnnkcg tctgtgcaat gac 33
<210> 91
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (17)..(18)
<223> n = A,T,C or G
<400> 91
gtcattgcac agacgmnnga tatgggaagg acg 33
<210> 92
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 92
gaaggagata tacatatgac cgaagctcgt cgt 33
<210> 93
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 93
acgacgagct tcggtcatat gtatatctcc ttc 33
<210> 94
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 94
gaaggagata tacatatgga aaccgaagct cgt 33
<210> 95
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 95
acgagcttcg gtttccatat gtatatctcc ttc 33
<210> 96
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 96
gaaggagata tacatatgac tgaaaccgaa gct 33
<210> 97
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 97
agcttcggtt tcagtcatat gtatatctcc ttc 33
<210> 98
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 98
gaaggagata tacatatgga aactgaaacc gaa 33
<210> 99
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 99
ttcggtttca gtttccatat gtatatctcc ttc 33
<210> 100
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 100
gaaggagata tacatatgac cgaaactgaa acc 33
<210> 101
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 101
ggtttcagtt tcggtcatat gtatatctcc ttc 33
<210> 102
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 102
agaaggagat ataccatgga agctcgtcgt tccgcaaac 39
<210> 103
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 103
gtttgcggaa cgacgagctt ccatggtata tctccttct 39
<210> 104
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 104
agaaggagat ataccatgga gcataattcc cgt 33
<210> 105
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 105
acgggaatta tgctccatgg tatatctcct tct 33
<210> 106
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 106
gaaggagata tacatatgga aacgcgtcgt tct 33
<210> 107
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 107
agaacgacgc gtttccatat gtatatctcc ttc 33
<210> 108
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 108
cggtgaactg aaaggtgacg tcc 23
<210> 109
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 109
ggacgttaac gctattaaca ccctg 25
<210> 110
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 110
cacatcgtcg atcagctcca gc 22
<210> 111
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 111
ggtcgtcaga ctgtcgatga agcc 24
<210> 112
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 112
gcttatgaat tctgtgcgac ctcttctcaa tttactcag 39
<210> 113
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 113
gcttataagc ttagacatac atcagctggt taatcggg 38
<210> 114
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 114
ctcctccagc aggttctcac c 21
<210> 115
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 115
gggcccgttt aaactttaac tagactctgc agttagcgtt caaacggcag aa 52
<210> 116
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 116
caccatgcgt cgttctgcga actac 25
<210> 117
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 117
caccatgcgt cgttctgcga actac 25
<210> 118
<211> 596
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 118
Met Arg Gly Ser His His His His His His Gly Met Ala Ser Met Thr
1 5 10 15
Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys Asp
20 25 30
His Pro Phe Thr Met Arg Cys Ser Val Ser Thr Glu Asn Val Ser Phe
35 40 45
Thr Glu Thr Glu Thr Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn
50 55 60
Ser Trp Asp Tyr Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile
65 70 75 80
Glu Val Tyr Lys Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg
85 90 95
Glu Ile Asn Asn Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile
100 105 110
Asp Asn Val Gln Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile
115 120 125
Arg Gly Ala Leu Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val
130 135 140
Thr Lys Thr Ser Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg
145 150 155 160
Gln His Gly Phe Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp
165 170 175
Gln Asn Gly Asn Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile
180 185 190
Leu Ser Leu Tyr Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile
195 200 205
Leu Asp Glu Ala Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser
210 215 220
Glu Glu Lys Ile Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu
225 230 235 240
Glu Leu Pro Leu His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser
245 250 255
Ile Glu Ala Tyr Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu
260 265 270
Leu Ala Ile Leu Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp
275 280 285
Leu Arg Glu Thr Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys
290 295 300
Leu His Phe Ala Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val
305 310 315 320
Gly Val Ala Phe Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala
325 330 335
Lys Met Phe Ser Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr
340 345 350
Gly Thr Leu Asp Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp
355 360 365
Asp Val Asn Ala Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe
370 375 380
Leu Ala Leu Tyr Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys
385 390 395 400
Asp Lys Gly Glu Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp
405 410 415
Leu Cys Asn Ala Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser
420 425 430
Thr Pro Thr Phe Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser
435 440 445
Gly Pro Leu Gln Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile
450 455 460
Lys Lys Glu Glu Ile Glu Asn Leu Gln Lys Tyr His Asp Thr Ile Ser
465 470 475 480
Arg Pro Ser His Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser
485 490 495
Ala Glu Ile Ala Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met
500 505 510
Arg Thr Lys Gly Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn
515 520 525
Leu Ile Asp Glu Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly
530 535 540
Ser Leu Phe Ala Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg
545 550 555 560
Gln Ser His Cys Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp
565 570 575
Glu Leu Thr Arg Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu
580 585 590
Pro Phe Glu Arg
595
<210> 119
<211> 7424
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 119
aagggcgagc tcaacgatcc ggctgctaac aaagcccgaa aggaagctga gttggctgct 60
gccaccgctg agcaataact agcataaccc cttggggcct ctaaacgggt cttgaggagt 120
tttttgctga aaggaggaac tatatccgga tatcccgcaa gaggcccggc agtaccggca 180
taaccaagcc tatgcctaca gcatccaggg tgacggtgcc gaggatgacg atgagcgcat 240
tgttagattt catacacggt gcctgactgc gttagcaatt taactgtgat aaactaccgc 300
attaaagctt atcgatgata agctgtcaaa catgagaatt aattcttgaa gacgaaaggg 360
cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 420
aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 480
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 540
aaggaagagt atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga 600
gaggctattc ggctatgact gggcacaact gacaatcggc tgctctgatg ccgccgtgtt 660
ccggctgtca gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct 720
gaatgaactg caggacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg 780
cgcagctgtg ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt 840
gccggggcag gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc 900
tgatgcaatg cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc 960
gaaacatcgc atcgagcggg cacgtactcg gatggaagcc ggtcttgtcg atcaggatga 1020
tctggacgaa gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg 1080
catgcccgac ggcgaggatc tcgtcgtgac acatggcgat gcctgcttgc cgaatatcat 1140
ggtggaaaat ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg 1200
ctatcaggac atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc 1260
tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta 1320
tcgccttctt gacgagttct tctgagcggg actctggggt tcgaaatgac cgaccaagcg 1380
acgcctaact gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt 1440
tttaatttaa aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt 1500
aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt 1560
gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag 1620
cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta actggcttca 1680
gcagagcgca gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca 1740
agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg 1800
ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg 1860
cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct 1920
acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga 1980
gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc 2040
ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg 2100
agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg 2160
cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt 2220
tatcccctga ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc 2280
gcagccgaac gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcctgatgc 2340
ggtattttct ccttacgcat ctgtgcggta tttcacaccg caatggtgca ctctcagtac 2400
aatctgctct gatgccgcat agttaagcca gtatacactc cgctatcgct acgtgactgg 2460
gtcatggctg cgccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 2520
ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 2580
ttttcaccgt catcaccgaa acgcgcgagg cagctgcggt aaagctcatc agcgtggtcg 2640
tgaagcgatt cacagatgtc tgcctgttca tccgcgtcca gctcgttgag tttctccaga 2700
agcgttaatg tctggcttct gataaagcgg gccatgttaa gggcggtttt ttcctgtttg 2760
gtcactgatg cctccgtgta agggggattt ctgttcatgg gggtaatgat accgatgaaa 2820
cgagagagga tgctcacgat acgggttact gatgatgaac atgcccggtt actggaacgt 2880
tgtgagggta aacaactggc ggtatggatg cggcgggacc agagaaaaat cactcagggt 2940
caatgccagc gcttcgttaa tacagatgta ggtgttccac agggtagcca gcagcatcct 3000
gcgatgcaga tccggaacat aatggtgcag ggcgctgact tccgcgtttc cagactttac 3060
gaaacacgga aaccgaagac cattcatgtt gttgctcagg tcgcagacgt tttgcagcag 3120
cagtcgcttc acgttcgctc gcgtatcggt gattcattct gctaaccagt aaggcaaccc 3180
cgccagccta gccgggtcct caacgacagg agcacgatca tgcgcacccg tggccaggac 3240
ccaacgctgc ccgagatgcg ccgcgtgcgg ctgctggaga tggcggacgc gatggatatg 3300
ttctgccaag ggttggtttg cgcattcaca gttctccgca agaattgatt ggctccaatt 3360
cttggagtgg tgaatccgtt agcgaggtgc cgccggcttc cattcaggtc gaggtggccc 3420
ggctccatgc accgcgacgc aacgcgggga ggcagacaag gtatagggcg gcgcctacaa 3480
tccatgccaa cccgttccat gtgctcgccg aggcggcata aatcgccgtg acgatcagcg 3540
gtccaatgat cgaagttagg ctggtaagag ccgcgagcga tccttgaagc tgtccctgat 3600
ggtcgtcatc tacctgcctg gacagcatgg cctgcaacgc gggcatcccg atgccgccgg 3660
aagcgagaag aatcataatg gggaaggcca tccagcctcg cgtcgcgaac gccagcaaga 3720
cgtagcccag cgcgtcggcc gccatgccgg cgataatggc ctgcttctcg ccgaaacgtt 3780
tggtggcggg accagtgacg aaggcttgag cgagggcgtg caagattccg aataccgcaa 3840
gcgacaggcc gatcatcgtc gcgctccagc gaaagcggtc ctcgccgaaa atgacccaga 3900
gcgctgccgg cacctgtcct acgagttgca tgataaagaa gacagtcata agtgcggcga 3960
cgatagtcat gccccgcgcc caccggaagg agctgactgg gttgaaggct ctcaagggca 4020
tcggtcgaga tcccggtgcc taatgagtga gctaacttac attaattgcg ttgcgctcac 4080
tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 4140
cggggagagg cggtttgcgt attgggcgcc agggtggttt ttcttttcac cagtgagacg 4200
ggcaacagct gattgccctt caccgcctgg ccctgagaga gttgcagcaa gcggtccacg 4260
ctggtttgcc ccagcaggcg aaaatcctgt ttgatggtgg ttaacggcgg gatataacat 4320
gagctgtctt cggtatcgtc gtatcccact accgagatat ccgcaccaac gcgcagcccg 4380
gactcggtaa tggcgcgcat tgcgcccagc gccatctgat cgttggcaac cagcatcgca 4440
gtgggaacga tgccctcatt cagcatttgc atggtttgtt gaaaaccgga catggcactc 4500
cagtcgcctt cccgttccgc tatcggctga atttgattgc gagtgagata tttatgccag 4560
ccagccagac gcagacgcgc cgagacagaa cttaatgggc ccgctaacag cgcgatttgc 4620
tggtgaccca atgcgaccag atgctccacg cccagtcgcg taccgtcttc atgggagaaa 4680
ataatactgt tgatgggtgt ctggtcagag acatcaagaa ataacgccgg aacattagtg 4740
caggcagctt ccacagcaat ggcatcctgg tcatccagcg gatagttaat gatcagccca 4800
ctgacgcgtt gcgcgagaag attgtgcacc gccgctttac aggcttcgac gccgcttcgt 4860
tctaccatcg acaccaccac gctggcaccc agttgatcgg cgcgagattt aatcgccgcg 4920
acaatttgcg acggcgcgtg cagggccaga ctggaggtgg caacgccaat cagcaacgac 4980
tgtttgcccg ccagttgttg tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc 5040
gcttccactt tttcccgcgt tttcgcagaa acgtggctgg cctggttcac cacgcgggaa 5100
acggtctgat aagagacacc ggcatactct gcgacatcgt ataacgttac tggtttcaca 5160
ttcaccaccc tgaattgact ctcttccggg cgctatcatg ccataccgcg aaaggttttg 5220
cgccattcga tggtgtccgg gatctcgacg ctctccctta tgcgactcct gcattaggaa 5280
gcagcccagt agtaggttga ggccgttgag caccgccgcc gcaaggaatg gtgcatgcaa 5340
ggagatggcg cccaacagtc ccccggccac ggggcctgcc accataccca cgccgaaaca 5400
agcgctcatg agcccgaagt ggcgagcccg atcttcccca tcggtgatgt cggcgatata 5460
ggcgccagca accgcacctg tggcgccggt gatgccggcc acgatgcgtc cggcgtagag 5520
gatcgagatc tcgatcccgc gaaattaata cgactcacta taggggaatt gtgagcggat 5580
aacaattccc ctctagaaat aattttgttt aactttaaga aggagatata catatgcggg 5640
gttctcatca tcatcatcat catggtatgg ctagcatgac tggtggacag caaatgggtc 5700
gggatctgta cgacgatgac gataaggatc atcccttcac catgcgttgt agcgtgtcca 5760
ccgaaaatgt gtctttcacc gaaactgaaa ccgaagctcg tcgttctgcg aactacgaac 5820
ctaacagctg ggactatgat tacctgctgt cctccgacac ggacgagtcc atcgaagtat 5880
acaaagacaa agcgaaaaag ctggaagccg aagttcgtcg cgagattaat aacgaaaaag 5940
cagaatttct gaccctgctg gaactgattg acaacgtcca gcgcctgggc ctgggttacc 6000
gtttcgagtc tgatatccgt ggtgcgctgg atcgcttcgt ttcctccggc ggcttcgatg 6060
cggtaaccaa gacttccctg cacggtacgg cactgtcttt ccgtctgctg cgtcaacacg 6120
gttttgaggt ttctcaggaa gcgttcagcg gcttcaaaga ccaaaacggc aacttcctgg 6180
agaacctgaa ggaagatatc aaagctatcc tgagcctgta cgaggccagc ttcctggctc 6240
tggaaggcga aaacatcctg gacgaggcga aggttttcgc aatctctcat ctgaaagaac 6300
tgtctgaaga aaagatcggt aaagagctgg cagaacaggt gaaccatgca ctggaactgc 6360
cactgcatcg ccgtactcag cgtctggaag cagtatggtc tatcgaggcc taccgtaaaa 6420
aggaggacgc gaatcaggtt ctgctggagc tggcaattct ggattacaac atgatccagt 6480
ctgtatacca gcgtgatctg cgtgaaacgt cccgttggtg gcgtcgtgtg ggtctggcga 6540
ccaaactgca ctttgctcgt gaccgcctga ttgagagctt ctactgggcc gtgggtgtag 6600
cattcgaacc gcaatactcc gactgccgta actccgtcgc aaaaatgttt tctttcgtaa 6660
ccattatcga cgatatctac gatgtatacg gcaccctgga cgaactggag ctgtttactg 6720
atgcagttga gcgttgggac gtaaacgcca tcaacgacct gccggattac atgaaactgt 6780
gctttctggc tctgtataac actattaacg aaatcgccta cgacaacctg aaagataaag 6840
gtgagaacat cctgccgtat ctgaccaaag cctgggctga cctgtgcaac gctttcctgc 6900
aagaagccaa gtggctgtac aacaaatcta ctccgacctt tgacgactac ttcggcaacg 6960
catggaaatc ctcttctggc ccgctgcaac tggtgttcgc ttacttcgct gtcgtgcaga 7020
acattaaaaa ggaagagatc gaaaacctgc aaaaatacca tgacaccatc tctcgtcctt 7080
cccatatctt ccgtctgtgc aatgacctgg ctagcgcgtc tgcggaaatt gcgcgtggtg 7140
aaaccgcaaa tagcgtttct tgttacatgc gcactaaagg tatctccgaa gaactggcta 7200
ccgaaagcgt gatgaatctg atcgatgaaa cctggaaaaa gatgaacaag gaaaaactgg 7260
gtggtagcct gttcgcgaaa ccgttcgtgg aaaccgcgat caacctggca cgtcaatctc 7320
actgcactta tcataacggc gacgcgcata cctctccgga tgagctgacc cgcaaacgcg 7380
ttctgtctgt aatcactgaa ccgattctgc cgtttgaacg ctaa 7424
<210> 120
<211> 560
<212> PRT
<213> Poplus alba v tremula
<400> 120
Met Arg Cys Ser Val Ser Thr Glu Asn Val Ser Phe Thr Glu Thr Glu
1 5 10 15
Thr Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr
20 25 30
Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val Tyr Lys
35 40 45
Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn
50 55 60
Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln
65 70 75 80
Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Gly Ala Leu
85 90 95
Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys Thr Ser
100 105 110
Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe
115 120 125
Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn
130 135 140
Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu Tyr
145 150 155 160
Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala
165 170 175
Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile
180 185 190
Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu Pro Leu
195 200 205
His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu Ala Tyr
210 215 220
Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala Ile Leu
225 230 235 240
Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr
245 250 255
Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala
260 265 270
Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe
275 280 285
Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser
290 295 300
Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp
305 310 315 320
Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala
325 330 335
Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr
340 345 350
Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys Gly Glu
355 360 365
Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala
370 375 380
Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe
385 390 395 400
Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln
405 410 415
Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu
420 425 430
Ile Glu Asn Leu Gln Lys Tyr His Asp Thr Ile Ser Arg Pro Ser His
435 440 445
Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala
450 455 460
Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly
465 470 475 480
Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu
485 490 495
Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala
500 505 510
Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys
515 520 525
Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg
530 535 540
Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg
545 550 555 560
<210> 121
<211> 6957
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 121
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840
agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900
cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020
tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080
tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140
taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200
ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260
tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320
tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520
gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580
gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640
aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700
ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760
acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880
tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940
tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000
cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060
gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120
ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600
tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740
ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800
ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860
cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920
gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980
aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040
ttttgtttaa ctttaagaag gagatataca tatgcgttgt agcgtgtcca ccgaaaatgt 5100
gtctttcacc gaaactgaaa ccgaagctcg tcgttctgcg aactacgaac ctaacagctg 5160
ggactatgat tacctgctgt cctccgacac ggacgagtcc atcgaagtat acaaagacaa 5220
agcgaaaaag ctggaagccg aagttcgtcg cgagattaat aacgaaaaag cagaatttct 5280
gaccctgctg gaactgattg acaacgtcca gcgcctgggc ctgggttacc gtttcgagtc 5340
tgatatccgt ggtgcgctgg atcgcttcgt ttcctccggc ggcttcgatg cggtaaccaa 5400
gacttccctg cacggtacgg cactgtcttt ccgtctgctg cgtcaacacg gttttgaggt 5460
ttctcaggaa gcgttcagcg gcttcaaaga ccaaaacggc aacttcctgg agaacctgaa 5520
ggaagatatc aaagctatcc tgagcctgta cgaggccagc ttcctggctc tggaaggcga 5580
aaacatcctg gacgaggcga aggttttcgc aatctctcat ctgaaagaac tgtctgaaga 5640
aaagatcggt aaagagctgg cagaacaggt gaaccatgca ctggaactgc cactgcatcg 5700
ccgtactcag cgtctggaag cagtatggtc tatcgaggcc taccgtaaaa aggaggacgc 5760
gaatcaggtt ctgctggagc tggcaattct ggattacaac atgatccagt ctgtatacca 5820
gcgtgatctg cgtgaaacgt cccgttggtg gcgtcgtgtg ggtctggcga ccaaactgca 5880
ctttgctcgt gaccgcctga ttgagagctt ctactgggcc gtgggtgtag cattcgaacc 5940
gcaatactcc gactgccgta actccgtcgc aaaaatgttt tctttcgtaa ccattatcga 6000
cgatatctac gatgtatacg gcaccctgga cgaactggag ctgtttactg atgcagttga 6060
gcgttgggac gtaaacgcca tcaacgacct gccggattac atgaaactgt gctttctggc 6120
tctgtataac actattaacg aaatcgccta cgacaacctg aaagataaag gtgagaacat 6180
cctgccgtat ctgaccaaag cctgggctga cctgtgcaac gctttcctgc aagaagccaa 6240
gtggctgtac aacaaatcta ctccgacctt tgacgactac ttcggcaacg catggaaatc 6300
ctcttctggc ccgctgcaac tggtgttcgc ttacttcgct gtcgtgcaga acattaaaaa 6360
ggaagagatc gaaaacctgc aaaaatacca tgacaccatc tctcgtcctt cccatatctt 6420
ccgtctgtgc aatgacctgg ctagcgcgtc tgcggaaatt gcgcgtggtg aaaccgcaaa 6480
tagcgtttct tgttacatgc gcactaaagg tatctccgaa gaactggcta ccgaaagcgt 6540
gatgaatctg atcgatgaaa cctggaaaaa gatgaacaag gaaaaactgg gtggtagcct 6600
gttcgcgaaa ccgttcgtgg aaaccgcgat caacctggca cgtcaatctc actgcactta 6660
tcataacggc gacgcgcata cctctccgga tgagctgacc cgcaaacgcg ttctgtctgt 6720
aatcactgaa ccgattctgc cgtttgaacg ctaaggatcc gaattcgagc tccgtcgaca 6780
agcttgcggc cgcactcgag caccaccacc accaccactg agatccggct gctaacaaag 6840
cccgaaagga agctgagttg gctgctgcca ccgctgagca ataactagca taaccccttg 6900
gggcctctaa acgggtcttg aggggttttt tgctgaaagg aggaactata tccggat 6957
<210> 122
<211> 544
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 122
Met Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr
1 5 10 15
Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val Tyr Lys
20 25 30
Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn
35 40 45
Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln
50 55 60
Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Gly Ala Leu
65 70 75 80
Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys Thr Ser
85 90 95
Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe
100 105 110
Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn
115 120 125
Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu Tyr
130 135 140
Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala
145 150 155 160
Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile
165 170 175
Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu Pro Leu
180 185 190
His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu Ala Tyr
195 200 205
Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala Ile Leu
210 215 220
Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr
225 230 235 240
Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala
245 250 255
Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe
260 265 270
Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser
275 280 285
Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp
290 295 300
Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala
305 310 315 320
Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr
325 330 335
Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys Gly Glu
340 345 350
Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala
355 360 365
Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe
370 375 380
Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln
385 390 395 400
Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu
405 410 415
Ile Glu Asn Leu Gln Lys Tyr His Asp Thr Ile Ser Arg Pro Ser His
420 425 430
Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala
435 440 445
Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly
450 455 460
Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu
465 470 475 480
Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala
485 490 495
Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys
500 505 510
Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg
515 520 525
Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg
530 535 540
<210> 123
<211> 6909
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 123
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840
agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900
cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020
tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080
tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140
taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200
ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260
tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320
tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520
gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580
gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640
aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700
ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760
acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880
tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940
tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000
cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060
gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120
ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600
tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740
ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800
ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860
cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920
gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980
aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040
ttttgtttaa ctttaagaag gagatataca tatggaagct cgtcgttctg cgaactacga 5100
acctaacagc tgggactatg attacctgct gtcctccgac acggacgagt ccatcgaagt 5160
atacaaagac aaagcgaaaa agctggaagc cgaagttcgt cgcgagatta ataacgaaaa 5220
agcagaattt ctgaccctgc tggaactgat tgacaacgtc cagcgcctgg gcctgggtta 5280
ccgtttcgag tctgatatcc gtggtgcgct ggatcgcttc gtttcctccg gcggcttcga 5340
tgcggtaacc aagacttccc tgcacggtac ggcactgtct ttccgtctgc tgcgtcaaca 5400
cggttttgag gtttctcagg aagcgttcag cggcttcaaa gaccaaaacg gcaacttcct 5460
ggagaacctg aaggaagata tcaaagctat cctgagcctg tacgaggcca gcttcctggc 5520
tctggaaggc gaaaacatcc tggacgaggc gaaggttttc gcaatctctc atctgaaaga 5580
actgtctgaa gaaaagatcg gtaaagagct ggcagaacag gtgaaccatg cactggaact 5640
gccactgcat cgccgtactc agcgtctgga agcagtatgg tctatcgagg cctaccgtaa 5700
aaaggaggac gcgaatcagg ttctgctgga gctggcaatt ctggattaca acatgatcca 5760
gtctgtatac cagcgtgatc tgcgtgaaac gtcccgttgg tggcgtcgtg tgggtctggc 5820
gaccaaactg cactttgctc gtgaccgcct gattgagagc ttctactggg ccgtgggtgt 5880
agcattcgaa ccgcaatact ccgactgccg taactccgtc gcaaaaatgt tttctttcgt 5940
aaccattatc gacgatatct acgatgtata cggcaccctg gacgaactgg agctgtttac 6000
tgatgcagtt gagcgttggg acgtaaacgc catcaacgac ctgccggatt acatgaaact 6060
gtgctttctg gctctgtata acactattaa cgaaatcgcc tacgacaacc tgaaagataa 6120
aggtgagaac atcctgccgt atctgaccaa agcctgggct gacctgtgca acgctttcct 6180
gcaagaagcc aagtggctgt acaacaaatc tactccgacc tttgacgact acttcggcaa 6240
cgcatggaaa tcctcttctg gcccgctgca actggtgttc gcttacttcg ctgtcgtgca 6300
gaacattaaa aaggaagaga tcgaaaacct gcaaaaatac catgacacca tctctcgtcc 6360
ttcccatatc ttccgtctgt gcaatgacct ggctagcgcg tctgcggaaa ttgcgcgtgg 6420
tgaaaccgca aatagcgttt cttgttacat gcgcactaaa ggtatctccg aagaactggc 6480
taccgaaagc gtgatgaatc tgatcgatga aacctggaaa aagatgaaca aggaaaaact 6540
gggtggtagc ctgttcgcga aaccgttcgt ggaaaccgcg atcaacctgg cacgtcaatc 6600
tcactgcact tatcataacg gcgacgcgca tacctctccg gatgagctga cccgcaaacg 6660
cgttctgtct gtaatcactg aaccgattct gccgtttgaa cgctaaggat ccgaattcga 6720
gctccgtcga caagcttgcg gccgcactcg agcaccacca ccaccaccac tgagatccgg 6780
ctgctaacaa agcccgaaag gaagctgagt tggctgctgc caccgctgag caataactag 6840
cataacccct tggggcctct aaacgggtct tgaggggttt tttgctgaaa ggaggaacta 6900
tatccggat 6909
<210> 124
<211> 558
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 124
Met Ser Val Ser Thr Glu Asn Val Ser Phe Thr Glu Thr Glu Thr Glu
1 5 10 15
Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr Asp Tyr
20 25 30
Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val Tyr Lys Asp Lys
35 40 45
Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn Glu Lys
50 55 60
Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln Arg Leu
65 70 75 80
Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Gly Ala Leu Asp Arg
85 90 95
Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys Thr Ser Leu His
100 105 110
Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe Glu Val
115 120 125
Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn Phe Leu
130 135 140
Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu Tyr Glu Ala
145 150 155 160
Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala Lys Val
165 170 175
Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile Gly Lys
180 185 190
Glu Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu Pro Leu His Arg
195 200 205
Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu Ala Tyr Arg Lys
210 215 220
Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala Ile Leu Asp Tyr
225 230 235 240
Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr Ser Arg
245 250 255
Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala Arg Asp
260 265 270
Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe Glu Pro
275 280 285
Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser Phe Val
290 295 300
Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp Glu Leu
305 310 315 320
Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala Ile Asn
325 330 335
Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr Asn Thr
340 345 350
Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys Gly Glu Asn Ile
355 360 365
Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala Phe Leu
370 375 380
Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe Asp Asp
385 390 395 400
Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln Leu Val
405 410 415
Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu Ile Glu
420 425 430
Asn Leu Gln Lys Tyr His Asp Thr Ile Ser Arg Pro Ser His Ile Phe
435 440 445
Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala Arg Gly
450 455 460
Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly Ile Ser
465 470 475 480
Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu Thr Trp
485 490 495
Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala Lys Pro
500 505 510
Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys Thr Tyr
515 520 525
His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg Lys Arg
530 535 540
Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg
545 550 555
<210> 125
<211> 6951
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 125
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840
agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900
cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020
tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080
tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140
taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200
ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260
tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320
tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520
gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580
gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640
aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700
ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760
acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880
tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940
tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000
cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060
gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120
ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600
tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740
ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800
ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860
cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920
gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980
aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040
ttttgtttaa ctttaagaag gagatataca tatgagcgtg tccaccgaaa atgtgtcttt 5100
caccgaaact gaaaccgaag ctcgtcgttc tgcgaactac gaacctaaca gctgggacta 5160
tgattacctg ctgtcctccg acacggacga gtccatcgaa gtatacaaag acaaagcgaa 5220
aaagctggaa gccgaagttc gtcgcgagat taataacgaa aaagcagaat ttctgaccct 5280
gctggaactg attgacaacg tccagcgcct gggcctgggt taccgtttcg agtctgatat 5340
ccgtggtgcg ctggatcgct tcgtttcctc cggcggcttc gatgcggtaa ccaagacttc 5400
cctgcacggt acggcactgt ctttccgtct gctgcgtcaa cacggttttg aggtttctca 5460
ggaagcgttc agcggcttca aagaccaaaa cggcaacttc ctggagaacc tgaaggaaga 5520
tatcaaagct atcctgagcc tgtacgaggc cagcttcctg gctctggaag gcgaaaacat 5580
cctggacgag gcgaaggttt tcgcaatctc tcatctgaaa gaactgtctg aagaaaagat 5640
cggtaaagag ctggcagaac aggtgaacca tgcactggaa ctgccactgc atcgccgtac 5700
tcagcgtctg gaagcagtat ggtctatcga ggcctaccgt aaaaaggagg acgcgaatca 5760
ggttctgctg gagctggcaa ttctggatta caacatgatc cagtctgtat accagcgtga 5820
tctgcgtgaa acgtcccgtt ggtggcgtcg tgtgggtctg gcgaccaaac tgcactttgc 5880
tcgtgaccgc ctgattgaga gcttctactg ggccgtgggt gtagcattcg aaccgcaata 5940
ctccgactgc cgtaactccg tcgcaaaaat gttttctttc gtaaccatta tcgacgatat 6000
ctacgatgta tacggcaccc tggacgaact ggagctgttt actgatgcag ttgagcgttg 6060
ggacgtaaac gccatcaacg acctgccgga ttacatgaaa ctgtgctttc tggctctgta 6120
taacactatt aacgaaatcg cctacgacaa cctgaaagat aaaggtgaga acatcctgcc 6180
gtatctgacc aaagcctggg ctgacctgtg caacgctttc ctgcaagaag ccaagtggct 6240
gtacaacaaa tctactccga cctttgacga ctacttcggc aacgcatgga aatcctcttc 6300
tggcccgctg caactggtgt tcgcttactt cgctgtcgtg cagaacatta aaaaggaaga 6360
gatcgaaaac ctgcaaaaat accatgacac catctctcgt ccttcccata tcttccgtct 6420
gtgcaatgac ctggctagcg cgtctgcgga aattgcgcgt ggtgaaaccg caaatagcgt 6480
ttcttgttac atgcgcacta aaggtatctc cgaagaactg gctaccgaaa gcgtgatgaa 6540
tctgatcgat gaaacctgga aaaagatgaa caaggaaaaa ctgggtggta gcctgttcgc 6600
gaaaccgttc gtggaaaccg cgatcaacct ggcacgtcaa tctcactgca cttatcataa 6660
cggcgacgcg catacctctc cggatgagct gacccgcaaa cgcgttctgt ctgtaatcac 6720
tgaaccgatt ctgccgtttg aacgctaagg atccgaattc gagctccgtc gacaagcttg 6780
cggccgcact cgagcaccac caccaccacc actgagatcc ggctgctaac aaagcccgaa 6840
aggaagctga gttggctgct gccaccgctg agcaataact agcataaccc cttggggcct 6900
ctaaacgggt cttgaggggt tttttgctga aaggaggaac tatatccgga t 6951
<210> 126
<211> 557
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 126
Met Val Ser Thr Glu Asn Val Ser Phe Thr Glu Thr Glu Thr Glu Ala
1 5 10 15
Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr Asp Tyr Leu
20 25 30
Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val Tyr Lys Asp Lys Ala
35 40 45
Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn Glu Lys Ala
50 55 60
Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln Arg Leu Gly
65 70 75 80
Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Gly Ala Leu Asp Arg Phe
85 90 95
Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys Thr Ser Leu His Gly
100 105 110
Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe Glu Val Ser
115 120 125
Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn Phe Leu Glu
130 135 140
Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu Tyr Glu Ala Ser
145 150 155 160
Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala Lys Val Phe
165 170 175
Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile Gly Lys Glu
180 185 190
Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu Pro Leu His Arg Arg
195 200 205
Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu Ala Tyr Arg Lys Lys
210 215 220
Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala Ile Leu Asp Tyr Asn
225 230 235 240
Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr Ser Arg Trp
245 250 255
Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala Arg Asp Arg
260 265 270
Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe Glu Pro Gln
275 280 285
Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser Phe Val Thr
290 295 300
Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp Glu Leu Glu
305 310 315 320
Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala Ile Asn Asp
325 330 335
Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr Asn Thr Ile
340 345 350
Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys Gly Glu Asn Ile Leu
355 360 365
Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala Phe Leu Gln
370 375 380
Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe Asp Asp Tyr
385 390 395 400
Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln Leu Val Phe
405 410 415
Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu Ile Glu Asn
420 425 430
Leu Gln Lys Tyr His Asp Thr Ile Ser Arg Pro Ser His Ile Phe Arg
435 440 445
Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala Arg Gly Glu
450 455 460
Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly Ile Ser Glu
465 470 475 480
Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu Thr Trp Lys
485 490 495
Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala Lys Pro Phe
500 505 510
Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys Thr Tyr His
515 520 525
Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg Lys Arg Val
530 535 540
Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg
545 550 555
<210> 127
<211> 6948
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 127
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840
agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900
cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020
tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080
tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140
taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200
ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260
tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320
tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520
gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580
gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640
aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700
ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760
acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880
tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940
tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000
cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060
gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120
ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600
tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740
ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800
ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860
cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920
gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980
aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040
ttttgtttaa ctttaagaag gagatataca tatggtgtcc accgaaaatg tgtctttcac 5100
cgaaactgaa accgaagctc gtcgttctgc gaactacgaa cctaacagct gggactatga 5160
ttacctgctg tcctccgaca cggacgagtc catcgaagta tacaaagaca aagcgaaaaa 5220
gctggaagcc gaagttcgtc gcgagattaa taacgaaaaa gcagaatttc tgaccctgct 5280
ggaactgatt gacaacgtcc agcgcctggg cctgggttac cgtttcgagt ctgatatccg 5340
tggtgcgctg gatcgcttcg tttcctccgg cggcttcgat gcggtaacca agacttccct 5400
gcacggtacg gcactgtctt tccgtctgct gcgtcaacac ggttttgagg tttctcagga 5460
agcgttcagc ggcttcaaag accaaaacgg caacttcctg gagaacctga aggaagatat 5520
caaagctatc ctgagcctgt acgaggccag cttcctggct ctggaaggcg aaaacatcct 5580
ggacgaggcg aaggttttcg caatctctca tctgaaagaa ctgtctgaag aaaagatcgg 5640
taaagagctg gcagaacagg tgaaccatgc actggaactg ccactgcatc gccgtactca 5700
gcgtctggaa gcagtatggt ctatcgaggc ctaccgtaaa aaggaggacg cgaatcaggt 5760
tctgctggag ctggcaattc tggattacaa catgatccag tctgtatacc agcgtgatct 5820
gcgtgaaacg tcccgttggt ggcgtcgtgt gggtctggcg accaaactgc actttgctcg 5880
tgaccgcctg attgagagct tctactgggc cgtgggtgta gcattcgaac cgcaatactc 5940
cgactgccgt aactccgtcg caaaaatgtt ttctttcgta accattatcg acgatatcta 6000
cgatgtatac ggcaccctgg acgaactgga gctgtttact gatgcagttg agcgttggga 6060
cgtaaacgcc atcaacgacc tgccggatta catgaaactg tgctttctgg ctctgtataa 6120
cactattaac gaaatcgcct acgacaacct gaaagataaa ggtgagaaca tcctgccgta 6180
tctgaccaaa gcctgggctg acctgtgcaa cgctttcctg caagaagcca agtggctgta 6240
caacaaatct actccgacct ttgacgacta cttcggcaac gcatggaaat cctcttctgg 6300
cccgctgcaa ctggtgttcg cttacttcgc tgtcgtgcag aacattaaaa aggaagagat 6360
cgaaaacctg caaaaatacc atgacaccat ctctcgtcct tcccatatct tccgtctgtg 6420
caatgacctg gctagcgcgt ctgcggaaat tgcgcgtggt gaaaccgcaa atagcgtttc 6480
ttgttacatg cgcactaaag gtatctccga agaactggct accgaaagcg tgatgaatct 6540
gatcgatgaa acctggaaaa agatgaacaa ggaaaaactg ggtggtagcc tgttcgcgaa 6600
accgttcgtg gaaaccgcga tcaacctggc acgtcaatct cactgcactt atcataacgg 6660
cgacgcgcat acctctccgg atgagctgac ccgcaaacgc gttctgtctg taatcactga 6720
accgattctg ccgtttgaac gctaaggatc cgaattcgag ctccgtcgac aagcttgcgg 6780
ccgcactcga gcaccaccac caccaccact gagatccggc tgctaacaaa gcccgaaagg 6840
aagctgagtt ggctgctgcc accgctgagc aataactagc ataacccctt ggggcctcta 6900
aacgggtctt gaggggtttt ttgctgaaag gaggaactat atccggat 6948
<210> 128
<211> 555
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 128
Met Thr Glu Asn Val Ser Phe Thr Glu Thr Glu Thr Glu Ala Arg Arg
1 5 10 15
Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr Asp Tyr Leu Leu Ser
20 25 30
Ser Asp Thr Asp Glu Ser Ile Glu Val Tyr Lys Asp Lys Ala Lys Lys
35 40 45
Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn Glu Lys Ala Glu Phe
50 55 60
Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln Arg Leu Gly Leu Gly
65 70 75 80
Tyr Arg Phe Glu Ser Asp Ile Arg Gly Ala Leu Asp Arg Phe Val Ser
85 90 95
Ser Gly Gly Phe Asp Ala Val Thr Lys Thr Ser Leu His Gly Thr Ala
100 105 110
Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe Glu Val Ser Gln Glu
115 120 125
Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn Phe Leu Glu Asn Leu
130 135 140
Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu Tyr Glu Ala Ser Phe Leu
145 150 155 160
Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala Lys Val Phe Ala Ile
165 170 175
Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile Gly Lys Glu Leu Ala
180 185 190
Glu Gln Val Asn His Ala Leu Glu Leu Pro Leu His Arg Arg Thr Gln
195 200 205
Arg Leu Glu Ala Val Trp Ser Ile Glu Ala Tyr Arg Lys Lys Glu Asp
210 215 220
Ala Asn Gln Val Leu Leu Glu Leu Ala Ile Leu Asp Tyr Asn Met Ile
225 230 235 240
Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr Ser Arg Trp Trp Arg
245 250 255
Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala Arg Asp Arg Leu Ile
260 265 270
Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe Glu Pro Gln Tyr Ser
275 280 285
Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser Phe Val Thr Ile Ile
290 295 300
Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp Glu Leu Glu Leu Phe
305 310 315 320
Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala Ile Asn Asp Leu Pro
325 330 335
Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr Asn Thr Ile Asn Glu
340 345 350
Ile Ala Tyr Asp Asn Leu Lys Asp Lys Gly Glu Asn Ile Leu Pro Tyr
355 360 365
Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala Phe Leu Gln Glu Ala
370 375 380
Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe Asp Asp Tyr Phe Gly
385 390 395 400
Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln Leu Val Phe Ala Tyr
405 410 415
Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu Ile Glu Asn Leu Gln
420 425 430
Lys Tyr His Asp Thr Ile Ser Arg Pro Ser His Ile Phe Arg Leu Cys
435 440 445
Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala Arg Gly Glu Thr Ala
450 455 460
Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly Ile Ser Glu Glu Leu
465 470 475 480
Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu Thr Trp Lys Lys Met
485 490 495
Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala Lys Pro Phe Val Glu
500 505 510
Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys Thr Tyr His Asn Gly
515 520 525
Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg Lys Arg Val Leu Ser
530 535 540
Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg
545 550 555
<210> 129
<211> 6942
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 129
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840
agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900
cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020
tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080
tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140
taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200
ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260
tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320
tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520
gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580
gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640
aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700
ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760
acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880
tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940
tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000
cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060
gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120
ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600
tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740
ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800
ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860
cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920
gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980
aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040
ttttgtttaa ctttaagaag gagatataca tatgaccgaa aatgtgtctt tcaccgaaac 5100
tgaaaccgaa gctcgtcgtt ctgcgaacta cgaacctaac agctgggact atgattacct 5160
gctgtcctcc gacacggacg agtccatcga agtatacaaa gacaaagcga aaaagctgga 5220
agccgaagtt cgtcgcgaga ttaataacga aaaagcagaa tttctgaccc tgctggaact 5280
gattgacaac gtccagcgcc tgggcctggg ttaccgtttc gagtctgata tccgtggtgc 5340
gctggatcgc ttcgtttcct ccggcggctt cgatgcggta accaagactt ccctgcacgg 5400
tacggcactg tctttccgtc tgctgcgtca acacggtttt gaggtttctc aggaagcgtt 5460
cagcggcttc aaagaccaaa acggcaactt cctggagaac ctgaaggaag atatcaaagc 5520
tatcctgagc ctgtacgagg ccagcttcct ggctctggaa ggcgaaaaca tcctggacga 5580
ggcgaaggtt ttcgcaatct ctcatctgaa agaactgtct gaagaaaaga tcggtaaaga 5640
gctggcagaa caggtgaacc atgcactgga actgccactg catcgccgta ctcagcgtct 5700
ggaagcagta tggtctatcg aggcctaccg taaaaaggag gacgcgaatc aggttctgct 5760
ggagctggca attctggatt acaacatgat ccagtctgta taccagcgtg atctgcgtga 5820
aacgtcccgt tggtggcgtc gtgtgggtct ggcgaccaaa ctgcactttg ctcgtgaccg 5880
cctgattgag agcttctact gggccgtggg tgtagcattc gaaccgcaat actccgactg 5940
ccgtaactcc gtcgcaaaaa tgttttcttt cgtaaccatt atcgacgata tctacgatgt 6000
atacggcacc ctggacgaac tggagctgtt tactgatgca gttgagcgtt gggacgtaaa 6060
cgccatcaac gacctgccgg attacatgaa actgtgcttt ctggctctgt ataacactat 6120
taacgaaatc gcctacgaca acctgaaaga taaaggtgag aacatcctgc cgtatctgac 6180
caaagcctgg gctgacctgt gcaacgcttt cctgcaagaa gccaagtggc tgtacaacaa 6240
atctactccg acctttgacg actacttcgg caacgcatgg aaatcctctt ctggcccgct 6300
gcaactggtg ttcgcttact tcgctgtcgt gcagaacatt aaaaaggaag agatcgaaaa 6360
cctgcaaaaa taccatgaca ccatctctcg tccttcccat atcttccgtc tgtgcaatga 6420
cctggctagc gcgtctgcgg aaattgcgcg tggtgaaacc gcaaatagcg tttcttgtta 6480
catgcgcact aaaggtatct ccgaagaact ggctaccgaa agcgtgatga atctgatcga 6540
tgaaacctgg aaaaagatga acaaggaaaa actgggtggt agcctgttcg cgaaaccgtt 6600
cgtggaaacc gcgatcaacc tggcacgtca atctcactgc acttatcata acggcgacgc 6660
gcatacctct ccggatgagc tgacccgcaa acgcgttctg tctgtaatca ctgaaccgat 6720
tctgccgttt gaacgctaag gatccgaatt cgagctccgt cgacaagctt gcggccgcac 6780
tcgagcacca ccaccaccac cactgagatc cggctgctaa caaagcccga aaggaagctg 6840
agttggctgc tgccaccgct gagcaataac tagcataacc ccttggggcc tctaaacggg 6900
tcttgagggg ttttttgctg aaaggaggaa ctatatccgg at 6942
<210> 130
<211> 553
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 130
Met Asn Val Ser Phe Thr Glu Thr Glu Thr Glu Ala Arg Arg Ser Ala
1 5 10 15
Asn Tyr Glu Pro Asn Ser Trp Asp Tyr Asp Tyr Leu Leu Ser Ser Asp
20 25 30
Thr Asp Glu Ser Ile Glu Val Tyr Lys Asp Lys Ala Lys Lys Leu Glu
35 40 45
Ala Glu Val Arg Arg Glu Ile Asn Asn Glu Lys Ala Glu Phe Leu Thr
50 55 60
Leu Leu Glu Leu Ile Asp Asn Val Gln Arg Leu Gly Leu Gly Tyr Arg
65 70 75 80
Phe Glu Ser Asp Ile Arg Gly Ala Leu Asp Arg Phe Val Ser Ser Gly
85 90 95
Gly Phe Asp Ala Val Thr Lys Thr Ser Leu His Gly Thr Ala Leu Ser
100 105 110
Phe Arg Leu Leu Arg Gln His Gly Phe Glu Val Ser Gln Glu Ala Phe
115 120 125
Ser Gly Phe Lys Asp Gln Asn Gly Asn Phe Leu Glu Asn Leu Lys Glu
130 135 140
Asp Ile Lys Ala Ile Leu Ser Leu Tyr Glu Ala Ser Phe Leu Ala Leu
145 150 155 160
Glu Gly Glu Asn Ile Leu Asp Glu Ala Lys Val Phe Ala Ile Ser His
165 170 175
Leu Lys Glu Leu Ser Glu Glu Lys Ile Gly Lys Glu Leu Ala Glu Gln
180 185 190
Val Asn His Ala Leu Glu Leu Pro Leu His Arg Arg Thr Gln Arg Leu
195 200 205
Glu Ala Val Trp Ser Ile Glu Ala Tyr Arg Lys Lys Glu Asp Ala Asn
210 215 220
Gln Val Leu Leu Glu Leu Ala Ile Leu Asp Tyr Asn Met Ile Gln Ser
225 230 235 240
Val Tyr Gln Arg Asp Leu Arg Glu Thr Ser Arg Trp Trp Arg Arg Val
245 250 255
Gly Leu Ala Thr Lys Leu His Phe Ala Arg Asp Arg Leu Ile Glu Ser
260 265 270
Phe Tyr Trp Ala Val Gly Val Ala Phe Glu Pro Gln Tyr Ser Asp Cys
275 280 285
Arg Asn Ser Val Ala Lys Met Phe Ser Phe Val Thr Ile Ile Asp Asp
290 295 300
Ile Tyr Asp Val Tyr Gly Thr Leu Asp Glu Leu Glu Leu Phe Thr Asp
305 310 315 320
Ala Val Glu Arg Trp Asp Val Asn Ala Ile Asn Asp Leu Pro Asp Tyr
325 330 335
Met Lys Leu Cys Phe Leu Ala Leu Tyr Asn Thr Ile Asn Glu Ile Ala
340 345 350
Tyr Asp Asn Leu Lys Asp Lys Gly Glu Asn Ile Leu Pro Tyr Leu Thr
355 360 365
Lys Ala Trp Ala Asp Leu Cys Asn Ala Phe Leu Gln Glu Ala Lys Trp
370 375 380
Leu Tyr Asn Lys Ser Thr Pro Thr Phe Asp Asp Tyr Phe Gly Asn Ala
385 390 395 400
Trp Lys Ser Ser Ser Gly Pro Leu Gln Leu Val Phe Ala Tyr Phe Ala
405 410 415
Val Val Gln Asn Ile Lys Lys Glu Glu Ile Glu Asn Leu Gln Lys Tyr
420 425 430
His Asp Thr Ile Ser Arg Pro Ser His Ile Phe Arg Leu Cys Asn Asp
435 440 445
Leu Ala Ser Ala Ser Ala Glu Ile Ala Arg Gly Glu Thr Ala Asn Ser
450 455 460
Val Ser Cys Tyr Met Arg Thr Lys Gly Ile Ser Glu Glu Leu Ala Thr
465 470 475 480
Glu Ser Val Met Asn Leu Ile Asp Glu Thr Trp Lys Lys Met Asn Lys
485 490 495
Glu Lys Leu Gly Gly Ser Leu Phe Ala Lys Pro Phe Val Glu Thr Ala
500 505 510
Ile Asn Leu Ala Arg Gln Ser His Cys Thr Tyr His Asn Gly Asp Ala
515 520 525
His Thr Ser Pro Asp Glu Leu Thr Arg Lys Arg Val Leu Ser Val Ile
530 535 540
Thr Glu Pro Ile Leu Pro Phe Glu Arg
545 550
<210> 131
<211> 6936
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 131
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840
agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900
cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020
tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080
tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140
taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200
ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260
tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320
tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520
gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580
gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640
aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700
ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760
acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880
tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940
tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000
cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060
gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120
ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600
tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740
ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800
ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860
cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920
gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980
aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040
ttttgtttaa ctttaagaag gagatataca tatgaatgtg tctttcaccg aaactgaaac 5100
cgaagctcgt cgttctgcga actacgaacc taacagctgg gactatgatt acctgctgtc 5160
ctccgacacg gacgagtcca tcgaagtata caaagacaaa gcgaaaaagc tggaagccga 5220
agttcgtcgc gagattaata acgaaaaagc agaatttctg accctgctgg aactgattga 5280
caacgtccag cgcctgggcc tgggttaccg tttcgagtct gatatccgtg gtgcgctgga 5340
tcgcttcgtt tcctccggcg gcttcgatgc ggtaaccaag acttccctgc acggtacggc 5400
actgtctttc cgtctgctgc gtcaacacgg ttttgaggtt tctcaggaag cgttcagcgg 5460
cttcaaagac caaaacggca acttcctgga gaacctgaag gaagatatca aagctatcct 5520
gagcctgtac gaggccagct tcctggctct ggaaggcgaa aacatcctgg acgaggcgaa 5580
ggttttcgca atctctcatc tgaaagaact gtctgaagaa aagatcggta aagagctggc 5640
agaacaggtg aaccatgcac tggaactgcc actgcatcgc cgtactcagc gtctggaagc 5700
agtatggtct atcgaggcct accgtaaaaa ggaggacgcg aatcaggttc tgctggagct 5760
ggcaattctg gattacaaca tgatccagtc tgtataccag cgtgatctgc gtgaaacgtc 5820
ccgttggtgg cgtcgtgtgg gtctggcgac caaactgcac tttgctcgtg accgcctgat 5880
tgagagcttc tactgggccg tgggtgtagc attcgaaccg caatactccg actgccgtaa 5940
ctccgtcgca aaaatgtttt ctttcgtaac cattatcgac gatatctacg atgtatacgg 6000
caccctggac gaactggagc tgtttactga tgcagttgag cgttgggacg taaacgccat 6060
caacgacctg ccggattaca tgaaactgtg ctttctggct ctgtataaca ctattaacga 6120
aatcgcctac gacaacctga aagataaagg tgagaacatc ctgccgtatc tgaccaaagc 6180
ctgggctgac ctgtgcaacg ctttcctgca agaagccaag tggctgtaca acaaatctac 6240
tccgaccttt gacgactact tcggcaacgc atggaaatcc tcttctggcc cgctgcaact 6300
ggtgttcgct tacttcgctg tcgtgcagaa cattaaaaag gaagagatcg aaaacctgca 6360
aaaataccat gacaccatct ctcgtccttc ccatatcttc cgtctgtgca atgacctggc 6420
tagcgcgtct gcggaaattg cgcgtggtga aaccgcaaat agcgtttctt gttacatgcg 6480
cactaaaggt atctccgaag aactggctac cgaaagcgtg atgaatctga tcgatgaaac 6540
ctggaaaaag atgaacaagg aaaaactggg tggtagcctg ttcgcgaaac cgttcgtgga 6600
aaccgcgatc aacctggcac gtcaatctca ctgcacttat cataacggcg acgcgcatac 6660
ctctccggat gagctgaccc gcaaacgcgt tctgtctgta atcactgaac cgattctgcc 6720
gtttgaacgc taaggatccg aattcgagct ccgtcgacaa gcttgcggcc gcactcgagc 6780
accaccacca ccaccactga gatccggctg ctaacaaagc ccgaaaggaa gctgagttgg 6840
ctgctgccac cgctgagcaa taactagcat aaccccttgg ggcctctaaa cgggtcttga 6900
ggggtttttt gctgaaagga ggaactatat ccggat 6936
<210> 132
<211> 559
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 132
Met Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr
1 5 10 15
Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val Tyr Lys
20 25 30
Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn
35 40 45
Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln
50 55 60
Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Gly Ala Leu
65 70 75 80
Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys Thr Ser
85 90 95
Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe
100 105 110
Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn
115 120 125
Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu Tyr
130 135 140
Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala
145 150 155 160
Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile
165 170 175
Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu Pro Leu
180 185 190
His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu Ala Tyr
195 200 205
Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala Ile Leu
210 215 220
Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr
225 230 235 240
Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala
245 250 255
Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe
260 265 270
Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser
275 280 285
Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp
290 295 300
Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala
305 310 315 320
Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr
325 330 335
Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys Gly Glu
340 345 350
Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala
355 360 365
Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe
370 375 380
Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln
385 390 395 400
Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu
405 410 415
Ile Glu Asn Leu Gln Lys Tyr His Asp Thr Ile Ser Arg Pro Ser His
420 425 430
Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala
435 440 445
Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly
450 455 460
Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu
465 470 475 480
Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala
485 490 495
Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys
500 505 510
Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg
515 520 525
Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg
530 535 540
Glu Asn Leu Tyr Phe Gln Gly Leu Glu His His His His His His
545 550 555
<210> 133
<211> 6887
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 133
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840
agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900
cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020
tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080
tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140
taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200
ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260
tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320
tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520
gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580
gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640
aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700
ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760
acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880
tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940
tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000
cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060
gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120
ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600
tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740
ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800
ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860
cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920
gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980
aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040
ttttgtttaa ctttaagaag gagatataca tatggaagct cgtcgttctg cgaactacga 5100
acctaacagc tgggactatg attacctgct gtcctccgac acggacgagt ccatcgaagt 5160
atacaaagac aaagcgaaaa agctggaagc cgaagttcgt cgcgagatta ataacgaaaa 5220
agcagaattt ctgaccctgc tggaactgat tgacaacgtc cagcgcctgg gcctgggtta 5280
ccgtttcgag tctgatatcc gtggtgcgct ggatcgcttc gtttcctccg gcggcttcga 5340
tgcggtaacc aagacttccc tgcacggtac ggcactgtct ttccgtctgc tgcgtcaaca 5400
cggttttgag gtttctcagg aagcgttcag cggcttcaaa gaccaaaacg gcaacttcct 5460
ggagaacctg aaggaagata tcaaagctat cctgagcctg tacgaggcca gcttcctggc 5520
tctggaaggc gaaaacatcc tggacgaggc gaaggttttc gcaatctctc atctgaaaga 5580
actgtctgaa gaaaagatcg gtaaagagct ggcagaacag gtgaaccatg cactggaact 5640
gccactgcat cgccgtactc agcgtctgga agcagtatgg tctatcgagg cctaccgtaa 5700
aaaggaggac gcgaatcagg ttctgctgga gctggcaatt ctggattaca acatgatcca 5760
gtctgtatac cagcgtgatc tgcgtgaaac gtcccgttgg tggcgtcgtg tgggtctggc 5820
gaccaaactg cactttgctc gtgaccgcct gattgagagc ttctactggg ccgtgggtgt 5880
agcattcgaa ccgcaatact ccgactgccg taactccgtc gcaaaaatgt tttctttcgt 5940
aaccattatc gacgatatct acgatgtata cggcaccctg gacgaactgg agctgtttac 6000
tgatgcagtt gagcgttggg acgtaaacgc catcaacgac ctgccggatt acatgaaact 6060
gtgctttctg gctctgtata acactattaa cgaaatcgcc tacgacaacc tgaaagataa 6120
aggtgagaac atcctgccgt atctgaccaa agcctgggct gacctgtgca acgctttcct 6180
gcaagaagcc aagtggctgt acaacaaatc tactccgacc tttgacgact acttcggcaa 6240
cgcatggaaa tcctcttctg gcccgctgca actggtgttc gcttacttcg ctgtcgtgca 6300
gaacattaaa aaggaagaga tcgaaaacct gcaaaaatac catgacacca tctctcgtcc 6360
ttcccatatc ttccgtctgt gcaatgacct ggctagcgcg tctgcggaaa ttgcgcgtgg 6420
tgaaaccgca aatagcgttt cttgttacat gcgcactaaa ggtatctccg aagaactggc 6480
taccgaaagc gtgatgaatc tgatcgatga aacctggaaa aagatgaaca aggaaaaact 6540
gggtggtagc ctgttcgcga aaccgttcgt ggaaaccgcg atcaacctgg cacgtcaatc 6600
tcactgcact tatcataacg gcgacgcgca tacctctccg gatgagctga cccgcaaacg 6660
cgttctgtct gtaatcactg aaccgattct gccgtttgaa cgcgaaaacc tgtattttca 6720
gggcctcgag caccaccacc accaccactg agatccggct gctaacaaag cccgaaagga 6780
agctgagttg gctgctgcca ccgctgagca ataactagca taaccccttg gggcctctaa 6840
acgggtcttg aggggttttt tgctgaaagg aggaactata tccggat 6887
<210> 134
<211> 575
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 134
Met Arg Cys Ser Val Ser Thr Glu Asn Val Ser Phe Thr Glu Thr Glu
1 5 10 15
Thr Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr
20 25 30
Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val Tyr Lys
35 40 45
Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn
50 55 60
Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln
65 70 75 80
Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Gly Ala Leu
85 90 95
Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys Thr Ser
100 105 110
Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe
115 120 125
Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn
130 135 140
Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu Tyr
145 150 155 160
Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala
165 170 175
Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile
180 185 190
Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu Pro Leu
195 200 205
His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu Ala Tyr
210 215 220
Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala Ile Leu
225 230 235 240
Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr
245 250 255
Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala
260 265 270
Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe
275 280 285
Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser
290 295 300
Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp
305 310 315 320
Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala
325 330 335
Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr
340 345 350
Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys Gly Glu
355 360 365
Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala
370 375 380
Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe
385 390 395 400
Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln
405 410 415
Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu
420 425 430
Ile Glu Asn Leu Gln Lys Tyr His Asp Thr Ile Ser Arg Pro Ser His
435 440 445
Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala
450 455 460
Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly
465 470 475 480
Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu
485 490 495
Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala
500 505 510
Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys
515 520 525
Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg
530 535 540
Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg
545 550 555 560
Glu Asn Leu Tyr Phe Gln Gly Leu Glu His His His His His His
565 570 575
<210> 135
<211> 6935
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 135
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840
agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900
cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020
tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080
tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140
taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200
ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260
tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320
tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520
gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580
gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640
aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700
ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760
acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880
tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940
tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000
cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060
gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120
ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600
tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740
ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800
ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860
cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920
gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980
aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040
ttttgtttaa ctttaagaag gagatataca tatgcgttgt agcgtgtcca ccgaaaatgt 5100
gtctttcacc gaaactgaaa ccgaagctcg tcgttctgcg aactacgaac ctaacagctg 5160
ggactatgat tacctgctgt cctccgacac ggacgagtcc atcgaagtat acaaagacaa 5220
agcgaaaaag ctggaagccg aagttcgtcg cgagattaat aacgaaaaag cagaatttct 5280
gaccctgctg gaactgattg acaacgtcca gcgcctgggc ctgggttacc gtttcgagtc 5340
tgatatccgt ggtgcgctgg atcgcttcgt ttcctccggc ggcttcgatg cggtaaccaa 5400
gacttccctg cacggtacgg cactgtcttt ccgtctgctg cgtcaacacg gttttgaggt 5460
ttctcaggaa gcgttcagcg gcttcaaaga ccaaaacggc aacttcctgg agaacctgaa 5520
ggaagatatc aaagctatcc tgagcctgta cgaggccagc ttcctggctc tggaaggcga 5580
aaacatcctg gacgaggcga aggttttcgc aatctctcat ctgaaagaac tgtctgaaga 5640
aaagatcggt aaagagctgg cagaacaggt gaaccatgca ctggaactgc cactgcatcg 5700
ccgtactcag cgtctggaag cagtatggtc tatcgaggcc taccgtaaaa aggaggacgc 5760
gaatcaggtt ctgctggagc tggcaattct ggattacaac atgatccagt ctgtatacca 5820
gcgtgatctg cgtgaaacgt cccgttggtg gcgtcgtgtg ggtctggcga ccaaactgca 5880
ctttgctcgt gaccgcctga ttgagagctt ctactgggcc gtgggtgtag cattcgaacc 5940
gcaatactcc gactgccgta actccgtcgc aaaaatgttt tctttcgtaa ccattatcga 6000
cgatatctac gatgtatacg gcaccctgga cgaactggag ctgtttactg atgcagttga 6060
gcgttgggac gtaaacgcca tcaacgacct gccggattac atgaaactgt gctttctggc 6120
tctgtataac actattaacg aaatcgccta cgacaacctg aaagataaag gtgagaacat 6180
cctgccgtat ctgaccaaag cctgggctga cctgtgcaac gctttcctgc aagaagccaa 6240
gtggctgtac aacaaatcta ctccgacctt tgacgactac ttcggcaacg catggaaatc 6300
ctcttctggc ccgctgcaac tggtgttcgc ttacttcgct gtcgtgcaga acattaaaaa 6360
ggaagagatc gaaaacctgc aaaaatacca tgacaccatc tctcgtcctt cccatatctt 6420
ccgtctgtgc aatgacctgg ctagcgcgtc tgcggaaatt gcgcgtggtg aaaccgcaaa 6480
tagcgtttct tgttacatgc gcactaaagg tatctccgaa gaactggcta ccgaaagcgt 6540
gatgaatctg atcgatgaaa cctggaaaaa gatgaacaag gaaaaactgg gtggtagcct 6600
gttcgcgaaa ccgttcgtgg aaaccgcgat caacctggca cgtcaatctc actgcactta 6660
tcataacggc gacgcgcata cctctccgga tgagctgacc cgcaaacgcg ttctgtctgt 6720
aatcactgaa ccgattctgc cgtttgaacg cgaaaacctg tattttcagg gcctcgagca 6780
ccaccaccac caccactgag atccggctgc taacaaagcc cgaaaggaag ctgagttggc 6840
tgctgccacc gctgagcaat aactagcata accccttggg gcctctaaac gggtcttgag 6900
gggttttttg ctgaaaggag gaactatatc cggat 6935
<210> 136
<211> 545
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 136
Met Thr Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp
1 5 10 15
Tyr Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val Tyr
20 25 30
Lys Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn
35 40 45
Asn Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val
50 55 60
Gln Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Gly Ala
65 70 75 80
Leu Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys Thr
85 90 95
Ser Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly
100 105 110
Phe Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly
115 120 125
Asn Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu
130 135 140
Tyr Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu
145 150 155 160
Ala Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys
165 170 175
Ile Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu Pro
180 185 190
Leu His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu Ala
195 200 205
Tyr Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala Ile
210 215 220
Leu Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu
225 230 235 240
Thr Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe
245 250 255
Ala Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala
260 265 270
Phe Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe
275 280 285
Ser Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu
290 295 300
Asp Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn
305 310 315 320
Ala Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu
325 330 335
Tyr Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys Gly
340 345 350
Glu Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn
355 360 365
Ala Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr
370 375 380
Phe Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu
385 390 395 400
Gln Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu
405 410 415
Glu Ile Glu Asn Leu Gln Lys Tyr His Asp Thr Ile Ser Arg Pro Ser
420 425 430
His Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile
435 440 445
Ala Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys
450 455 460
Gly Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp
465 470 475 480
Glu Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe
485 490 495
Ala Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His
500 505 510
Cys Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr
515 520 525
Arg Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu
530 535 540
Arg
545
<210> 137
<211> 6912
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 137
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840
agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900
cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020
tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080
tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140
taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200
ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260
tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320
tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520
gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580
gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640
aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700
ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760
acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880
tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940
tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000
cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060
gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120
ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600
tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740
ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800
ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860
cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920
gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980
aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040
ttttgtttaa ctttaagaag gagatataca tatgaccgaa gctcgtcgtt ctgcgaacta 5100
cgaacctaac agctgggact atgattacct gctgtcctcc gacacggacg agtccatcga 5160
agtatacaaa gacaaagcga aaaagctgga agccgaagtt cgtcgcgaga ttaataacga 5220
aaaagcagaa tttctgaccc tgctggaact gattgacaac gtccagcgcc tgggcctggg 5280
ttaccgtttc gagtctgata tccgtggtgc gctggatcgc ttcgtttcct ccggcggctt 5340
cgatgcggta accaagactt ccctgcacgg tacggcactg tctttccgtc tgctgcgtca 5400
acacggtttt gaggtttctc aggaagcgtt cagcggcttc aaagaccaaa acggcaactt 5460
cctggagaac ctgaaggaag atatcaaagc tatcctgagc ctgtacgagg ccagcttcct 5520
ggctctggaa ggcgaaaaca tcctggacga ggcgaaggtt ttcgcaatct ctcatctgaa 5580
agaactgtct gaagaaaaga tcggtaaaga gctggcagaa caggtgaacc atgcactgga 5640
actgccactg catcgccgta ctcagcgtct ggaagcagta tggtctatcg aggcctaccg 5700
taaaaaggag gacgcgaatc aggttctgct ggagctggca attctggatt acaacatgat 5760
ccagtctgta taccagcgtg atctgcgtga aacgtcccgt tggtggcgtc gtgtgggtct 5820
ggcgaccaaa ctgcactttg ctcgtgaccg cctgattgag agcttctact gggccgtggg 5880
tgtagcattc gaaccgcaat actccgactg ccgtaactcc gtcgcaaaaa tgttttcttt 5940
cgtaaccatt atcgacgata tctacgatgt atacggcacc ctggacgaac tggagctgtt 6000
tactgatgca gttgagcgtt gggacgtaaa cgccatcaac gacctgccgg attacatgaa 6060
actgtgcttt ctggctctgt ataacactat taacgaaatc gcctacgaca acctgaaaga 6120
taaaggtgag aacatcctgc cgtatctgac caaagcctgg gctgacctgt gcaacgcttt 6180
cctgcaagaa gccaagtggc tgtacaacaa atctactccg acctttgacg actacttcgg 6240
caacgcatgg aaatcctctt ctggcccgct gcaactggtg ttcgcttact tcgctgtcgt 6300
gcagaacatt aaaaaggaag agatcgaaaa cctgcaaaaa taccatgaca ccatctctcg 6360
tccttcccat atcttccgtc tgtgcaatga cctggctagc gcgtctgcgg aaattgcgcg 6420
tggtgaaacc gcaaatagcg tttcttgtta catgcgcact aaaggtatct ccgaagaact 6480
ggctaccgaa agcgtgatga atctgatcga tgaaacctgg aaaaagatga acaaggaaaa 6540
actgggtggt agcctgttcg cgaaaccgtt cgtggaaacc gcgatcaacc tggcacgtca 6600
atctcactgc acttatcata acggcgacgc gcatacctct ccggatgagc tgacccgcaa 6660
acgcgttctg tctgtaatca ctgaaccgat tctgccgttt gaacgctaag gatccgaatt 6720
cgagctccgt cgacaagctt gcggccgcac tcgagcacca ccaccaccac cactgagatc 6780
cggctgctaa caaagcccga aaggaagctg agttggctgc tgccaccgct gagcaataac 6840
tagcataacc ccttggggcc tctaaacggg tcttgagggg ttttttgctg aaaggaggaa 6900
ctatatccgg at 6912
<210> 138
<211> 546
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 138
Met Glu Thr Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp
1 5 10 15
Asp Tyr Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val
20 25 30
Tyr Lys Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile
35 40 45
Asn Asn Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn
50 55 60
Val Gln Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Gly
65 70 75 80
Ala Leu Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys
85 90 95
Thr Ser Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His
100 105 110
Gly Phe Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn
115 120 125
Gly Asn Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser
130 135 140
Leu Tyr Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp
145 150 155 160
Glu Ala Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu
165 170 175
Lys Ile Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu
180 185 190
Pro Leu His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu
195 200 205
Ala Tyr Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala
210 215 220
Ile Leu Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg
225 230 235 240
Glu Thr Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His
245 250 255
Phe Ala Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val
260 265 270
Ala Phe Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met
275 280 285
Phe Ser Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr
290 295 300
Leu Asp Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val
305 310 315 320
Asn Ala Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala
325 330 335
Leu Tyr Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys
340 345 350
Gly Glu Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys
355 360 365
Asn Ala Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro
370 375 380
Thr Phe Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro
385 390 395 400
Leu Gln Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys
405 410 415
Glu Glu Ile Glu Asn Leu Gln Lys Tyr His Asp Thr Ile Ser Arg Pro
420 425 430
Ser His Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu
435 440 445
Ile Ala Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr
450 455 460
Lys Gly Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile
465 470 475 480
Asp Glu Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu
485 490 495
Phe Ala Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser
500 505 510
His Cys Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu
515 520 525
Thr Arg Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe
530 535 540
Glu Arg
545
<210> 139
<211> 6915
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 139
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840
agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900
cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020
tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080
tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140
taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200
ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260
tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320
tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520
gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580
gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640
aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700
ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760
acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880
tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940
tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000
cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060
gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120
ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600
tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740
ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800
ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860
cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920
gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980
aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040
ttttgtttaa ctttaagaag gagatataca tatggaaacc gaagctcgtc gttctgcgaa 5100
ctacgaacct aacagctggg actatgatta cctgctgtcc tccgacacgg acgagtccat 5160
cgaagtatac aaagacaaag cgaaaaagct ggaagccgaa gttcgtcgcg agattaataa 5220
cgaaaaagca gaatttctga ccctgctgga actgattgac aacgtccagc gcctgggcct 5280
gggttaccgt ttcgagtctg atatccgtgg tgcgctggat cgcttcgttt cctccggcgg 5340
cttcgatgcg gtaaccaaga cttccctgca cggtacggca ctgtctttcc gtctgctgcg 5400
tcaacacggt tttgaggttt ctcaggaagc gttcagcggc ttcaaagacc aaaacggcaa 5460
cttcctggag aacctgaagg aagatatcaa agctatcctg agcctgtacg aggccagctt 5520
cctggctctg gaaggcgaaa acatcctgga cgaggcgaag gttttcgcaa tctctcatct 5580
gaaagaactg tctgaagaaa agatcggtaa agagctggca gaacaggtga accatgcact 5640
ggaactgcca ctgcatcgcc gtactcagcg tctggaagca gtatggtcta tcgaggccta 5700
ccgtaaaaag gaggacgcga atcaggttct gctggagctg gcaattctgg attacaacat 5760
gatccagtct gtataccagc gtgatctgcg tgaaacgtcc cgttggtggc gtcgtgtggg 5820
tctggcgacc aaactgcact ttgctcgtga ccgcctgatt gagagcttct actgggccgt 5880
gggtgtagca ttcgaaccgc aatactccga ctgccgtaac tccgtcgcaa aaatgttttc 5940
tttcgtaacc attatcgacg atatctacga tgtatacggc accctggacg aactggagct 6000
gtttactgat gcagttgagc gttgggacgt aaacgccatc aacgacctgc cggattacat 6060
gaaactgtgc tttctggctc tgtataacac tattaacgaa atcgcctacg acaacctgaa 6120
agataaaggt gagaacatcc tgccgtatct gaccaaagcc tgggctgacc tgtgcaacgc 6180
tttcctgcaa gaagccaagt ggctgtacaa caaatctact ccgacctttg acgactactt 6240
cggcaacgca tggaaatcct cttctggccc gctgcaactg gtgttcgctt acttcgctgt 6300
cgtgcagaac attaaaaagg aagagatcga aaacctgcaa aaataccatg acaccatctc 6360
tcgtccttcc catatcttcc gtctgtgcaa tgacctggct agcgcgtctg cggaaattgc 6420
gcgtggtgaa accgcaaata gcgtttcttg ttacatgcgc actaaaggta tctccgaaga 6480
actggctacc gaaagcgtga tgaatctgat cgatgaaacc tggaaaaaga tgaacaagga 6540
aaaactgggt ggtagcctgt tcgcgaaacc gttcgtggaa accgcgatca acctggcacg 6600
tcaatctcac tgcacttatc ataacggcga cgcgcatacc tctccggatg agctgacccg 6660
caaacgcgtt ctgtctgtaa tcactgaacc gattctgccg tttgaacgct aaggatccga 6720
attcgagctc cgtcgacaag cttgcggccg cactcgagca ccaccaccac caccactgag 6780
atccggctgc taacaaagcc cgaaaggaag ctgagttggc tgctgccacc gctgagcaat 6840
aactagcata accccttggg gcctctaaac gggtcttgag gggttttttg ctgaaaggag 6900
gaactatatc cggat 6915
<210> 140
<211> 547
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 140
Met Thr Glu Thr Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser
1 5 10 15
Trp Asp Tyr Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu
20 25 30
Val Tyr Lys Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu
35 40 45
Ile Asn Asn Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp
50 55 60
Asn Val Gln Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg
65 70 75 80
Gly Ala Leu Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr
85 90 95
Lys Thr Ser Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln
100 105 110
His Gly Phe Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln
115 120 125
Asn Gly Asn Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu
130 135 140
Ser Leu Tyr Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu
145 150 155 160
Asp Glu Ala Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu
165 170 175
Glu Lys Ile Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu Glu
180 185 190
Leu Pro Leu His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile
195 200 205
Glu Ala Tyr Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu
210 215 220
Ala Ile Leu Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu
225 230 235 240
Arg Glu Thr Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu
245 250 255
His Phe Ala Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly
260 265 270
Val Ala Phe Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys
275 280 285
Met Phe Ser Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly
290 295 300
Thr Leu Asp Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp
305 310 315 320
Val Asn Ala Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu
325 330 335
Ala Leu Tyr Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp
340 345 350
Lys Gly Glu Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu
355 360 365
Cys Asn Ala Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr
370 375 380
Pro Thr Phe Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly
385 390 395 400
Pro Leu Gln Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys
405 410 415
Lys Glu Glu Ile Glu Asn Leu Gln Lys Tyr His Asp Thr Ile Ser Arg
420 425 430
Pro Ser His Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala
435 440 445
Glu Ile Ala Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg
450 455 460
Thr Lys Gly Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu
465 470 475 480
Ile Asp Glu Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser
485 490 495
Leu Phe Ala Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln
500 505 510
Ser His Cys Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu
515 520 525
Leu Thr Arg Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro
530 535 540
Phe Glu Arg
545
<210> 141
<211> 6918
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 141
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840
agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900
cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020
tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080
tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140
taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200
ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260
tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320
tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520
gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580
gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640
aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700
ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760
acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880
tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940
tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000
cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060
gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120
ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600
tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740
ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800
ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860
cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920
gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980
aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040
ttttgtttaa ctttaagaag gagatataca tatgactgaa accgaagctc gtcgttctgc 5100
gaactacgaa cctaacagct gggactatga ttacctgctg tcctccgaca cggacgagtc 5160
catcgaagta tacaaagaca aagcgaaaaa gctggaagcc gaagttcgtc gcgagattaa 5220
taacgaaaaa gcagaatttc tgaccctgct ggaactgatt gacaacgtcc agcgcctggg 5280
cctgggttac cgtttcgagt ctgatatccg tggtgcgctg gatcgcttcg tttcctccgg 5340
cggcttcgat gcggtaacca agacttccct gcacggtacg gcactgtctt tccgtctgct 5400
gcgtcaacac ggttttgagg tttctcagga agcgttcagc ggcttcaaag accaaaacgg 5460
caacttcctg gagaacctga aggaagatat caaagctatc ctgagcctgt acgaggccag 5520
cttcctggct ctggaaggcg aaaacatcct ggacgaggcg aaggttttcg caatctctca 5580
tctgaaagaa ctgtctgaag aaaagatcgg taaagagctg gcagaacagg tgaaccatgc 5640
actggaactg ccactgcatc gccgtactca gcgtctggaa gcagtatggt ctatcgaggc 5700
ctaccgtaaa aaggaggacg cgaatcaggt tctgctggag ctggcaattc tggattacaa 5760
catgatccag tctgtatacc agcgtgatct gcgtgaaacg tcccgttggt ggcgtcgtgt 5820
gggtctggcg accaaactgc actttgctcg tgaccgcctg attgagagct tctactgggc 5880
cgtgggtgta gcattcgaac cgcaatactc cgactgccgt aactccgtcg caaaaatgtt 5940
ttctttcgta accattatcg acgatatcta cgatgtatac ggcaccctgg acgaactgga 6000
gctgtttact gatgcagttg agcgttggga cgtaaacgcc atcaacgacc tgccggatta 6060
catgaaactg tgctttctgg ctctgtataa cactattaac gaaatcgcct acgacaacct 6120
gaaagataaa ggtgagaaca tcctgccgta tctgaccaaa gcctgggctg acctgtgcaa 6180
cgctttcctg caagaagcca agtggctgta caacaaatct actccgacct ttgacgacta 6240
cttcggcaac gcatggaaat cctcttctgg cccgctgcaa ctggtgttcg cttacttcgc 6300
tgtcgtgcag aacattaaaa aggaagagat cgaaaacctg caaaaatacc atgacaccat 6360
ctctcgtcct tcccatatct tccgtctgtg caatgacctg gctagcgcgt ctgcggaaat 6420
tgcgcgtggt gaaaccgcaa atagcgtttc ttgttacatg cgcactaaag gtatctccga 6480
agaactggct accgaaagcg tgatgaatct gatcgatgaa acctggaaaa agatgaacaa 6540
ggaaaaactg ggtggtagcc tgttcgcgaa accgttcgtg gaaaccgcga tcaacctggc 6600
acgtcaatct cactgcactt atcataacgg cgacgcgcat acctctccgg atgagctgac 6660
ccgcaaacgc gttctgtctg taatcactga accgattctg ccgtttgaac gctaaggatc 6720
cgaattcgag ctccgtcgac aagcttgcgg ccgcactcga gcaccaccac caccaccact 6780
gagatccggc tgctaacaaa gcccgaaagg aagctgagtt ggctgctgcc accgctgagc 6840
aataactagc ataacccctt ggggcctcta aacgggtctt gaggggtttt ttgctgaaag 6900
gaggaactat atccggat 6918
<210> 142
<211> 548
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 142
Met Glu Thr Glu Thr Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn
1 5 10 15
Ser Trp Asp Tyr Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile
20 25 30
Glu Val Tyr Lys Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg
35 40 45
Glu Ile Asn Asn Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile
50 55 60
Asp Asn Val Gln Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile
65 70 75 80
Arg Gly Ala Leu Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val
85 90 95
Thr Lys Thr Ser Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg
100 105 110
Gln His Gly Phe Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp
115 120 125
Gln Asn Gly Asn Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile
130 135 140
Leu Ser Leu Tyr Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile
145 150 155 160
Leu Asp Glu Ala Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser
165 170 175
Glu Glu Lys Ile Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu
180 185 190
Glu Leu Pro Leu His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser
195 200 205
Ile Glu Ala Tyr Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu
210 215 220
Leu Ala Ile Leu Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp
225 230 235 240
Leu Arg Glu Thr Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys
245 250 255
Leu His Phe Ala Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val
260 265 270
Gly Val Ala Phe Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala
275 280 285
Lys Met Phe Ser Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr
290 295 300
Gly Thr Leu Asp Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp
305 310 315 320
Asp Val Asn Ala Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe
325 330 335
Leu Ala Leu Tyr Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys
340 345 350
Asp Lys Gly Glu Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp
355 360 365
Leu Cys Asn Ala Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser
370 375 380
Thr Pro Thr Phe Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser
385 390 395 400
Gly Pro Leu Gln Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile
405 410 415
Lys Lys Glu Glu Ile Glu Asn Leu Gln Lys Tyr His Asp Thr Ile Ser
420 425 430
Arg Pro Ser His Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser
435 440 445
Ala Glu Ile Ala Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met
450 455 460
Arg Thr Lys Gly Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn
465 470 475 480
Leu Ile Asp Glu Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly
485 490 495
Ser Leu Phe Ala Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg
500 505 510
Gln Ser His Cys Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp
515 520 525
Glu Leu Thr Arg Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu
530 535 540
Pro Phe Glu Arg
545
<210> 143
<211> 6921
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 143
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840
agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900
cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020
tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080
tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140
taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200
ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260
tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320
tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520
gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580
gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640
aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700
ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760
acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880
tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940
tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000
cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060
gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120
ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600
tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740
ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800
ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860
cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920
gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980
aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040
ttttgtttaa ctttaagaag gagatataca tatggaaact gaaaccgaag ctcgtcgttc 5100
tgcgaactac gaacctaaca gctgggacta tgattacctg ctgtcctccg acacggacga 5160
gtccatcgaa gtatacaaag acaaagcgaa aaagctggaa gccgaagttc gtcgcgagat 5220
taataacgaa aaagcagaat ttctgaccct gctggaactg attgacaacg tccagcgcct 5280
gggcctgggt taccgtttcg agtctgatat ccgtggtgcg ctggatcgct tcgtttcctc 5340
cggcggcttc gatgcggtaa ccaagacttc cctgcacggt acggcactgt ctttccgtct 5400
gctgcgtcaa cacggttttg aggtttctca ggaagcgttc agcggcttca aagaccaaaa 5460
cggcaacttc ctggagaacc tgaaggaaga tatcaaagct atcctgagcc tgtacgaggc 5520
cagcttcctg gctctggaag gcgaaaacat cctggacgag gcgaaggttt tcgcaatctc 5580
tcatctgaaa gaactgtctg aagaaaagat cggtaaagag ctggcagaac aggtgaacca 5640
tgcactggaa ctgccactgc atcgccgtac tcagcgtctg gaagcagtat ggtctatcga 5700
ggcctaccgt aaaaaggagg acgcgaatca ggttctgctg gagctggcaa ttctggatta 5760
caacatgatc cagtctgtat accagcgtga tctgcgtgaa acgtcccgtt ggtggcgtcg 5820
tgtgggtctg gcgaccaaac tgcactttgc tcgtgaccgc ctgattgaga gcttctactg 5880
ggccgtgggt gtagcattcg aaccgcaata ctccgactgc cgtaactccg tcgcaaaaat 5940
gttttctttc gtaaccatta tcgacgatat ctacgatgta tacggcaccc tggacgaact 6000
ggagctgttt actgatgcag ttgagcgttg ggacgtaaac gccatcaacg acctgccgga 6060
ttacatgaaa ctgtgctttc tggctctgta taacactatt aacgaaatcg cctacgacaa 6120
cctgaaagat aaaggtgaga acatcctgcc gtatctgacc aaagcctggg ctgacctgtg 6180
caacgctttc ctgcaagaag ccaagtggct gtacaacaaa tctactccga cctttgacga 6240
ctacttcggc aacgcatgga aatcctcttc tggcccgctg caactggtgt tcgcttactt 6300
cgctgtcgtg cagaacatta aaaaggaaga gatcgaaaac ctgcaaaaat accatgacac 6360
catctctcgt ccttcccata tcttccgtct gtgcaatgac ctggctagcg cgtctgcgga 6420
aattgcgcgt ggtgaaaccg caaatagcgt ttcttgttac atgcgcacta aaggtatctc 6480
cgaagaactg gctaccgaaa gcgtgatgaa tctgatcgat gaaacctgga aaaagatgaa 6540
caaggaaaaa ctgggtggta gcctgttcgc gaaaccgttc gtggaaaccg cgatcaacct 6600
ggcacgtcaa tctcactgca cttatcataa cggcgacgcg catacctctc cggatgagct 6660
gacccgcaaa cgcgttctgt ctgtaatcac tgaaccgatt ctgccgtttg aacgctaagg 6720
atccgaattc gagctccgtc gacaagcttg cggccgcact cgagcaccac caccaccacc 6780
actgagatcc ggctgctaac aaagcccgaa aggaagctga gttggctgct gccaccgctg 6840
agcaataact agcataaccc cttggggcct ctaaacgggt cttgaggggt tttttgctga 6900
aaggaggaac tatatccgga t 6921
<210> 144
<211> 549
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 144
Met Thr Glu Thr Glu Thr Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro
1 5 10 15
Asn Ser Trp Asp Tyr Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser
20 25 30
Ile Glu Val Tyr Lys Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg
35 40 45
Arg Glu Ile Asn Asn Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu
50 55 60
Ile Asp Asn Val Gln Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp
65 70 75 80
Ile Arg Gly Ala Leu Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala
85 90 95
Val Thr Lys Thr Ser Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu
100 105 110
Arg Gln His Gly Phe Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys
115 120 125
Asp Gln Asn Gly Asn Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala
130 135 140
Ile Leu Ser Leu Tyr Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn
145 150 155 160
Ile Leu Asp Glu Ala Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu
165 170 175
Ser Glu Glu Lys Ile Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala
180 185 190
Leu Glu Leu Pro Leu His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp
195 200 205
Ser Ile Glu Ala Tyr Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu
210 215 220
Glu Leu Ala Ile Leu Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg
225 230 235 240
Asp Leu Arg Glu Thr Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr
245 250 255
Lys Leu His Phe Ala Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala
260 265 270
Val Gly Val Ala Phe Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val
275 280 285
Ala Lys Met Phe Ser Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val
290 295 300
Tyr Gly Thr Leu Asp Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg
305 310 315 320
Trp Asp Val Asn Ala Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys
325 330 335
Phe Leu Ala Leu Tyr Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu
340 345 350
Lys Asp Lys Gly Glu Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala
355 360 365
Asp Leu Cys Asn Ala Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys
370 375 380
Ser Thr Pro Thr Phe Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser
385 390 395 400
Ser Gly Pro Leu Gln Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn
405 410 415
Ile Lys Lys Glu Glu Ile Glu Asn Leu Gln Lys Tyr His Asp Thr Ile
420 425 430
Ser Arg Pro Ser His Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala
435 440 445
Ser Ala Glu Ile Ala Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr
450 455 460
Met Arg Thr Lys Gly Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met
465 470 475 480
Asn Leu Ile Asp Glu Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly
485 490 495
Gly Ser Leu Phe Ala Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala
500 505 510
Arg Gln Ser His Cys Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro
515 520 525
Asp Glu Leu Thr Arg Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile
530 535 540
Leu Pro Phe Glu Arg
545
<210> 145
<211> 6924
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 145
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840
agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900
cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020
tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080
tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140
taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200
ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260
tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320
tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520
gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580
gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640
aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700
ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760
acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880
tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940
tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000
cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060
gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120
ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600
tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740
ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800
ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860
cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920
gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980
aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040
ttttgtttaa ctttaagaag gagatataca tatgaccgaa actgaaaccg aagctcgtcg 5100
ttctgcgaac tacgaaccta acagctggga ctatgattac ctgctgtcct ccgacacgga 5160
cgagtccatc gaagtataca aagacaaagc gaaaaagctg gaagccgaag ttcgtcgcga 5220
gattaataac gaaaaagcag aatttctgac cctgctggaa ctgattgaca acgtccagcg 5280
cctgggcctg ggttaccgtt tcgagtctga tatccgtggt gcgctggatc gcttcgtttc 5340
ctccggcggc ttcgatgcgg taaccaagac ttccctgcac ggtacggcac tgtctttccg 5400
tctgctgcgt caacacggtt ttgaggtttc tcaggaagcg ttcagcggct tcaaagacca 5460
aaacggcaac ttcctggaga acctgaagga agatatcaaa gctatcctga gcctgtacga 5520
ggccagcttc ctggctctgg aaggcgaaaa catcctggac gaggcgaagg ttttcgcaat 5580
ctctcatctg aaagaactgt ctgaagaaaa gatcggtaaa gagctggcag aacaggtgaa 5640
ccatgcactg gaactgccac tgcatcgccg tactcagcgt ctggaagcag tatggtctat 5700
cgaggcctac cgtaaaaagg aggacgcgaa tcaggttctg ctggagctgg caattctgga 5760
ttacaacatg atccagtctg tataccagcg tgatctgcgt gaaacgtccc gttggtggcg 5820
tcgtgtgggt ctggcgacca aactgcactt tgctcgtgac cgcctgattg agagcttcta 5880
ctgggccgtg ggtgtagcat tcgaaccgca atactccgac tgccgtaact ccgtcgcaaa 5940
aatgttttct ttcgtaacca ttatcgacga tatctacgat gtatacggca ccctggacga 6000
actggagctg tttactgatg cagttgagcg ttgggacgta aacgccatca acgacctgcc 6060
ggattacatg aaactgtgct ttctggctct gtataacact attaacgaaa tcgcctacga 6120
caacctgaaa gataaaggtg agaacatcct gccgtatctg accaaagcct gggctgacct 6180
gtgcaacgct ttcctgcaag aagccaagtg gctgtacaac aaatctactc cgacctttga 6240
cgactacttc ggcaacgcat ggaaatcctc ttctggcccg ctgcaactgg tgttcgctta 6300
cttcgctgtc gtgcagaaca ttaaaaagga agagatcgaa aacctgcaaa aataccatga 6360
caccatctct cgtccttccc atatcttccg tctgtgcaat gacctggcta gcgcgtctgc 6420
ggaaattgcg cgtggtgaaa ccgcaaatag cgtttcttgt tacatgcgca ctaaaggtat 6480
ctccgaagaa ctggctaccg aaagcgtgat gaatctgatc gatgaaacct ggaaaaagat 6540
gaacaaggaa aaactgggtg gtagcctgtt cgcgaaaccg ttcgtggaaa ccgcgatcaa 6600
cctggcacgt caatctcact gcacttatca taacggcgac gcgcatacct ctccggatga 6660
gctgacccgc aaacgcgttc tgtctgtaat cactgaaccg attctgccgt ttgaacgcta 6720
aggatccgaa ttcgagctcc gtcgacaagc ttgcggccgc actcgagcac caccaccacc 6780
accactgaga tccggctgct aacaaagccc gaaaggaagc tgagttggct gctgccaccg 6840
ctgagcaata actagcataa ccccttgggg cctctaaacg ggtcttgagg ggttttttgc 6900
tgaaaggagg aactatatcc ggat 6924
<210> 146
<211> 544
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 146
Met Glu Thr Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr
1 5 10 15
Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val His Lys
20 25 30
Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn
35 40 45
Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln
50 55 60
Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Arg Ala Leu
65 70 75 80
Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Gly Val Thr Lys Thr Ser
85 90 95
Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe
100 105 110
Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn
115 120 125
Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu Tyr
130 135 140
Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala
145 150 155 160
Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile
165 170 175
Gly Lys Glu Leu Ala Glu Gln Val Ser His Ala Leu Glu Leu Pro Leu
180 185 190
His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu Ala Tyr
195 200 205
Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala Ile Leu
210 215 220
Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr
225 230 235 240
Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala
245 250 255
Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe
260 265 270
Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser
275 280 285
Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp
290 295 300
Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala
305 310 315 320
Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr
325 330 335
Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys Gly Glu
340 345 350
Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala
355 360 365
Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe
370 375 380
Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln
385 390 395 400
Leu Ile Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu
405 410 415
Ile Glu Asn Leu Gln Lys Tyr His Asp Ile Ile Ser Arg Pro Ser His
420 425 430
Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala
435 440 445
Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly
450 455 460
Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu
465 470 475 480
Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala
485 490 495
Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys
500 505 510
Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg
515 520 525
Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg
530 535 540
<210> 147
<211> 6909
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 147
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840
agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900
cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020
tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080
tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140
taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200
ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260
tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320
tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520
gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580
gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640
aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700
ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760
acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880
tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940
tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000
cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060
gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120
ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600
tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740
ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800
ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860
cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920
gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980
aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040
ttttgtttaa ctttaagaag gagatataca tatggaaacg cgtcgttctg cgaactacga 5100
acctaacagc tgggactatg attacctgct gtcctccgac acggacgagt ccatcgaagt 5160
acacaaagac aaagcgaaaa agctggaagc cgaagttcgt cgcgagatta ataacgaaaa 5220
agcagaattt ctgaccctgc tggaactgat tgacaacgtc cagcgcctgg gcctgggtta 5280
ccgtttcgag tctgatatcc gtcgtgcgct ggatcgcttc gtttcctccg gcggcttcga 5340
tggcgtaacc aagacttccc tgcacggtac ggcactgtct ttccgtctgc tgcgtcaaca 5400
cggttttgag gtttctcagg aagcgttcag cggcttcaaa gaccaaaacg gcaacttcct 5460
ggagaacctg aaggaagata tcaaagctat cctgagcctg tacgaggcca gcttcctggc 5520
tctggaaggc gaaaacatcc tggacgaggc gaaggttttc gcaatctctc atctgaaaga 5580
actgtctgaa gaaaagatcg gtaaagagct ggcagaacag gtgtcccatg cactggaact 5640
gccactgcat cgccgtactc agcgtctgga agcagtatgg tctatcgagg cctaccgtaa 5700
aaaggaggac gcgaaccagg ttctgctgga gctggcaatt ctggattaca acatgatcca 5760
gtctgtatac cagcgtgatc tgcgtgaaac gtcccgttgg tggcgtcgtg tgggtctggc 5820
gaccaaactg cactttgctc gtgaccgcct gattgagagc ttctactggg ccgtgggtgt 5880
agcattcgaa ccgcaatact ccgactgccg taactccgtc gcaaaaatgt tttctttcgt 5940
aaccattatc gacgatatct acgatgtata cggcaccctg gacgaactgg agctgtttac 6000
tgatgcagtt gagcgttggg acgtaaacgc catcaacgac ctgccggatt acatgaaact 6060
gtgctttctg gctctgtata acactattaa cgaaatcgcc tacgacaacc tgaaagataa 6120
aggtgagaac atcctgccgt atctgaccaa agcctgggct gacctgtgca acgctttcct 6180
gcaagaagcc aagtggctgt acaacaaatc tactccgacc tttgacgact acttcggcaa 6240
cgcatggaaa tcctcttctg gcccgctgca actgatcttc gcttacttcg ctgtcgtgca 6300
gaacattaaa aaggaagaga tcgaaaacct gcaaaaatac catgacatca tctctcgtcc 6360
ttcccatatc ttccgtctgt gcaatgacct ggctagcgcg tctgcggaaa ttgcgcgtgg 6420
tgaaaccgca aatagcgttt cttgttacat gcgcactaaa ggtatctccg aagaactggc 6480
taccgaaagc gtgatgaatc tgatcgatga aacctggaaa aagatgaaca aggaaaaact 6540
gggtggtagc ctgttcgcga aaccgttcgt ggaaaccgcg atcaacctgg cacgtcaatc 6600
tcactgcact tatcataacg gcgacgcgca tacctctccg gatgagctga cccgcaaacg 6660
cgttctgtct gtaatcactg aaccgattct gccgtttgaa cgctaaggat ccgaattcga 6720
gctccgtcga caagcttgcg gccgcactcg agcaccacca ccaccaccac tgagatccgg 6780
ctgctaacaa agcccgaaag gaagctgagt tggctgctgc caccgctgag caataactag 6840
cataacccct tggggcctct aaacgggtct tgaggggttt tttgctgaaa ggaggaacta 6900
tatccggat 6909
<210> 148
<211> 544
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 148
Met Glu Thr Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr
1 5 10 15
Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val Tyr Lys
20 25 30
Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn
35 40 45
Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln
50 55 60
Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Arg Ala Leu
65 70 75 80
Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys Thr Ser
85 90 95
Leu His Ala Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe
100 105 110
Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn
115 120 125
Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu Tyr
130 135 140
Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala
145 150 155 160
Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile
165 170 175
Gly Lys Asp Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu Pro Leu
180 185 190
His Arg Arg Thr Gln Arg Leu Glu Ala Val Leu Ser Ile Glu Ala Tyr
195 200 205
Arg Lys Lys Glu Asp Ala Asp Gln Val Leu Leu Glu Leu Ala Ile Leu
210 215 220
Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr
225 230 235 240
Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala
245 250 255
Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe
260 265 270
Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser
275 280 285
Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp
290 295 300
Glu Leu Glu Leu Phe Thr Asn Ala Val Glu Arg Trp Asp Val Asn Ala
305 310 315 320
Ile Asp Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr
325 330 335
Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Glu Lys Gly Glu
340 345 350
Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala
355 360 365
Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe
370 375 380
Asp Glu Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln
385 390 395 400
Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu
405 410 415
Ile Glu Asn Leu Gln Lys Tyr His Asp Ile Ile Ser Arg Pro Ser His
420 425 430
Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala
435 440 445
Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly
450 455 460
Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu
465 470 475 480
Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala
485 490 495
Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys
500 505 510
Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg
515 520 525
Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg
530 535 540
<210> 149
<211> 6909
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 149
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840
agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900
cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020
tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080
tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140
taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200
ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260
tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320
tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520
gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580
gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640
aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700
ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760
acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880
tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940
tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000
cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060
gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120
ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600
tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740
ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800
ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860
cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920
gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980
aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040
ttttgtttaa ctttaagaag gagatataca tatggaaacg cgtcgttctg cgaactacga 5100
acctaacagc tgggactatg attacctgct gtcctccgac acggacgagt ccatcgaagt 5160
atacaaagac aaagcgaaaa agctggaagc cgaagttcgt cgcgagatta ataacgaaaa 5220
agcagaattt ctgaccctgc tggaactgat tgacaacgtc cagcgcctgg gcctgggtta 5280
ccgtttcgag tctgatatcc gtcgtgcgct ggatcgcttc gtttcctccg gcggcttcga 5340
tgcggtaacc aagacttccc tgcacgcgac ggcactgtct ttccgtctgc tgcgtcaaca 5400
cggttttgag gtttctcagg aagcgttcag cggcttcaaa gaccaaaacg gcaacttcct 5460
ggagaacctg aaggaagata tcaaagctat cctgagcctg tacgaggcca gcttcctggc 5520
tctggaaggc gaaaacatcc tggacgaggc gaaggttttc gcaatctctc atctgaaaga 5580
actgtctgaa gaaaagatcg gtaaagatct ggcagaacag gtgaaccatg cactggaact 5640
gccactgcat cgccgtactc agcgtctgga agcagtactg tctatcgagg cctaccgtaa 5700
aaaggaggac gcggatcagg ttctgctgga gctggcaatt ctggattaca acatgatcca 5760
gtctgtatac cagcgtgatc tgcgtgaaac gtcccgttgg tggcgtcgtg tgggtctggc 5820
gaccaaactg cactttgctc gtgaccgcct gattgagagc ttctactggg ccgtgggtgt 5880
agcattcgaa ccgcaatact ccgactgccg taactccgtc gcaaaaatgt tttctttcgt 5940
aaccattatc gacgatatct acgatgtata cggcaccctg gacgaactgg agctgtttac 6000
taacgcagtt gagcgttggg acgtaaacgc catcgacgat ctgccggatt acatgaaact 6060
gtgctttctg gctctgtata acactattaa cgaaatcgcc tacgacaacc tgaaagaaaa 6120
aggtgagaac atcctgccgt atctgaccaa agcctgggct gacctgtgca acgctttcct 6180
gcaagaagcc aagtggctgt acaacaaatc tactccgacc tttgacgaat acttcggcaa 6240
cgcatggaaa tcctcttctg gcccgctgca actggtgttc gcttacttcg ctgtcgtgca 6300
gaacattaaa aaggaagaga tcgaaaacct gcaaaaatac catgacatca tctctcgtcc 6360
ttcccatatc ttccgtctgt gcaatgacct ggctagcgcg tctgcggaaa ttgcgcgtgg 6420
tgaaaccgca aatagcgttt cttgttacat gcgcactaaa ggtatctccg aagaactggc 6480
taccgaaagc gtgatgaatc tgatcgatga aacctggaaa aagatgaaca aggaaaaact 6540
gggtggtagc ctgttcgcga aaccgttcgt ggaaaccgcg atcaacctgg cacgtcaatc 6600
tcactgcact tatcataacg gcgacgcgca tacctctccg gatgagctga cccgcaaacg 6660
cgttctgtct gtaatcactg aaccgattct gccgtttgaa cgctaaggat ccgaattcga 6720
gctccgtcga caagcttgcg gccgcactcg agcaccacca ccaccaccac tgagatccgg 6780
ctgctaacaa agcccgaaag gaagctgagt tggctgctgc caccgctgag caataactag 6840
cataacccct tggggcctct aaacgggtct tgaggggttt tttgctgaaa ggaggaacta 6900
tatccggat 6909
<210> 150
<211> 551
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 150
Met Glu Ala Arg Arg Ser Ala Asn Tyr Gln Pro Asn Leu Trp Asn Phe
1 5 10 15
Glu Phe Leu Gln Ser Leu Glu Asn Asp Leu Lys Val Glu Lys Leu Glu
20 25 30
Glu Lys Ala Thr Lys Leu Glu Glu Glu Val Arg Cys Met Ile Asn Arg
35 40 45
Val Asp Thr Gln Pro Leu Ser Leu Leu Glu Leu Ile Asp Asp Val Gln
50 55 60
Arg Leu Gly Leu Thr Tyr Lys Phe Glu Lys Asp Ile Ile Lys Ala Leu
65 70 75 80
Glu Asn Ile Val Leu Leu Asp Glu Asn Lys Lys Asn Lys Ser Asp Leu
85 90 95
His Ala Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe Glu
100 105 110
Val Ser Gln Asp Val Phe Glu Arg Phe Lys Asp Lys Glu Gly Gly Phe
115 120 125
Ser Gly Glu Leu Lys Gly Asp Val Gln Gly Leu Leu Ser Leu Tyr Glu
130 135 140
Ala Ser Tyr Leu Gly Phe Glu Gly Glu Asn Leu Leu Glu Glu Ala Arg
145 150 155 160
Thr Phe Ser Ile Thr His Leu Lys Asn Asn Leu Lys Glu Gly Ile Asn
165 170 175
Thr Lys Val Ala Glu Gln Val Ser His Ala Leu Glu Leu Pro Tyr His
180 185 190
Gln Arg Leu His Arg Leu Glu Ala Arg Trp Phe Leu Asp Lys Tyr Glu
195 200 205
Pro Lys Glu Pro His His Gln Leu Leu Leu Glu Leu Ala Lys Leu Asp
210 215 220
Phe Asn Met Val Gln Thr Leu His Gln Lys Glu Leu Gln Asp Leu Ser
225 230 235 240
Arg Trp Trp Thr Glu Met Gly Leu Ala Ser Lys Leu Asp Phe Val Arg
245 250 255
Asp Arg Leu Met Glu Val Tyr Phe Trp Ala Leu Gly Met Ala Pro Asp
260 265 270
Pro Gln Phe Gly Glu Cys Arg Lys Ala Val Thr Lys Met Phe Gly Leu
275 280 285
Val Thr Ile Ile Asp Asp Val Tyr Asp Val Tyr Gly Thr Leu Asp Glu
290 295 300
Leu Gln Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala Ile
305 310 315 320
Asn Thr Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr Asn
325 330 335
Thr Val Asn Asp Thr Ser Tyr Ser Ile Leu Lys Glu Lys Gly His Asn
340 345 350
Asn Leu Ser Tyr Leu Thr Lys Ser Trp Arg Glu Leu Cys Lys Ala Phe
355 360 365
Leu Gln Glu Ala Lys Trp Ser Asn Asn Lys Ile Ile Pro Ala Phe Ser
370 375 380
Lys Tyr Leu Glu Asn Ala Ser Val Ser Ser Ser Gly Val Ala Leu Leu
385 390 395 400
Ala Pro Ser Tyr Phe Ser Val Cys Gln Gln Gln Glu Asp Ile Ser Asp
405 410 415
His Ala Leu Arg Ser Leu Thr Asp Phe His Gly Leu Val Arg Ser Ser
420 425 430
Cys Val Ile Phe Arg Leu Cys Asn Asp Leu Ala Thr Ser Ala Ala Glu
435 440 445
Leu Glu Arg Gly Glu Thr Thr Asn Ser Ile Ile Ser Tyr Met His Glu
450 455 460
Asn Asp Gly Thr Ser Glu Glu Gln Ala Arg Glu Glu Leu Arg Lys Leu
465 470 475 480
Ile Asp Ala Glu Trp Lys Lys Met Asn Arg Glu Arg Val Ser Asp Ser
485 490 495
Thr Leu Leu Pro Lys Ala Phe Met Glu Ile Ala Val Asn Met Ala Arg
500 505 510
Val Ser His Cys Thr Tyr Gln Tyr Gly Asp Gly Leu Gly Arg Pro Asp
515 520 525
Tyr Ala Thr Glu Asn Arg Ile Lys Leu Leu Leu Ile Asp Pro Phe Pro
530 535 540
Ile Asn Gln Leu Met Tyr Val
545 550
<210> 151
<211> 6935
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 151
tcgagcacca ccaccaccac cactgagatc cggctgctaa caaagcccga aaggaagctg 60
agttggctgc tgccaccgct gagcaataac tagcataacc ccttggggcc tctaaacggg 120
tcttgagggg ttttttgctg aaaggaggaa ctatatccgg attggcgaat gggacgcgcc 180
ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 240
tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 300
cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 360
acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 420
ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 480
gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 540
tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 600
ttttaacaaa atattaacgt ttacaatttc aggtggcact tttcggggaa atgtgcgcgg 660
aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca tgaattaatt 720
cttagaaaaa ctcatcgagc atcaaatgaa actgcaattt attcatatca ggattatcaa 780
taccatattt ttgaaaaagc cgtttctgta atgaaggaga aaactcaccg aggcagttcc 840
ataggatggc aagatcctgg tatcggtctg cgattccgac tcgtccaaca tcaatacaac 900
ctattaattt cccctcgtca aaaataaggt tatcaagtga gaaatcacca tgagtgacga 960
ctgaatccgg tgagaatggc aaaagtttat gcatttcttt ccagacttgt tcaacaggcc 1020
agccattacg ctcgtcatca aaatcactcg catcaaccaa accgttattc attcgtgatt 1080
gcgcctgagc gagacgaaat acgcgatcgc tgttaaaagg acaattacaa acaggaatcg 1140
aatgcaaccg gcgcaggaac actgccagcg catcaacaat attttcacct gaatcaggat 1200
attcttctaa tacctggaat gctgttttcc cggggatcgc agtggtgagt aaccatgcat 1260
catcaggagt acggataaaa tgcttgatgg tcggaagagg cataaattcc gtcagccagt 1320
ttagtctgac catctcatct gtaacatcat tggcaacgct acctttgcca tgtttcagaa 1380
acaactctgg cgcatcgggc ttcccataca atcgatagat tgtcgcacct gattgcccga 1440
cattatcgcg agcccattta tacccatata aatcagcatc catgttggaa tttaatcgcg 1500
gcctagagca agacgtttcc cgttgaatat ggctcataac accccttgta ttactgttta 1560
tgtaagcaga cagttttatt gttcatgacc aaaatccctt aacgtgagtt ttcgttccac 1620
tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc 1680
gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat 1740
caagagctac caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat 1800
actgtccttc tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct 1860
acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt 1920
cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc gggctgaacg 1980
gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta 2040
cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg 2100
gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg 2160
tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc 2220
tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg 2280
gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga ttctgtggat 2340
aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac gaccgagcgc 2400
agcgagtcag tgagcgagga agcggaagag cgcctgatgc ggtattttct ccttacgcat 2460
ctgtgcggta tttcacaccg catatatggt gcactctcag tacaatctgc tctgatgccg 2520
catagttaag ccagtataca ctccgctatc gctacgtgac tgggtcatgg ctgcgccccg 2580
acacccgcca acacccgctg acgcgccctg acgggcttgt ctgctcccgg catccgctta 2640
cagacaagct gtgaccgtct ccgggagctg catgtgtcag aggttttcac cgtcatcacc 2700
gaaacgcgcg aggcagctgc ggtaaagctc atcagcgtgg tcgtgaagcg attcacagat 2760
gtctgcctgt tcatccgcgt ccagctcgtt gagtttctcc agaagcgtta atgtctggct 2820
tctgataaag cgggccatgt taagggcggt tttttcctgt ttggtcactg atgcctccgt 2880
gtaaggggga tttctgttca tgggggtaat gataccgatg aaacgagaga ggatgctcac 2940
gatacgggtt actgatgatg aacatgcccg gttactggaa cgttgtgagg gtaaacaact 3000
ggcggtatgg atgcggcggg accagagaaa aatcactcag ggtcaatgcc agcgcttcgt 3060
taatacagat gtaggtgttc cacagggtag ccagcagcat cctgcgatgc agatccggaa 3120
cataatggtg cagggcgctg acttccgcgt ttccagactt tacgaaacac ggaaaccgaa 3180
gaccattcat gttgttgctc aggtcgcaga cgttttgcag cagcagtcgc ttcacgttcg 3240
ctcgcgtatc ggtgattcat tctgctaacc agtaaggcaa ccccgccagc ctagccgggt 3300
cctcaacgac aggagcacga tcatgcgcac ccgtggggcc gccatgccgg cgataatggc 3360
ctgcttctcg ccgaaacgtt tggtggcggg accagtgacg aaggcttgag cgagggcgtg 3420
caagattccg aataccgcaa gcgacaggcc gatcatcgtc gcgctccagc gaaagcggtc 3480
ctcgccgaaa atgacccaga gcgctgccgg cacctgtcct acgagttgca tgataaagaa 3540
gacagtcata agtgcggcga cgatagtcat gccccgcgcc caccggaagg agctgactgg 3600
gttgaaggct ctcaagggca tcggtcgaga tcccggtgcc taatgagtga gctaacttac 3660
attaattgcg ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca 3720
ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgcc agggtggttt 3780
ttcttttcac cagtgagacg ggcaacagct gattgccctt caccgcctgg ccctgagaga 3840
gttgcagcaa gcggtccacg ctggtttgcc ccagcaggcg aaaatcctgt ttgatggtgg 3900
ttaacggcgg gatataacat gagctgtctt cggtatcgtc gtatcccact accgagatat 3960
ccgcaccaac gcgcagcccg gactcggtaa tggcgcgcat tgcgcccagc gccatctgat 4020
cgttggcaac cagcatcgca gtgggaacga tgccctcatt cagcatttgc atggtttgtt 4080
gaaaaccgga catggcactc cagtcgcctt cccgttccgc tatcggctga atttgattgc 4140
gagtgagata tttatgccag ccagccagac gcagacgcgc cgagacagaa cttaatgggc 4200
ccgctaacag cgcgatttgc tggtgaccca atgcgaccag atgctccacg cccagtcgcg 4260
taccgtcttc atgggagaaa ataatactgt tgatgggtgt ctggtcagag acatcaagaa 4320
ataacgccgg aacattagtg caggcagctt ccacagcaat ggcatcctgg tcatccagcg 4380
gatagttaat gatcagccca ctgacgcgtt gcgcgagaag attgtgcacc gccgctttac 4440
aggcttcgac gccgcttcgt tctaccatcg acaccaccac gctggcaccc agttgatcgg 4500
cgcgagattt aatcgccgcg acaatttgcg acggcgcgtg cagggccaga ctggaggtgg 4560
caacgccaat cagcaacgac tgtttgcccg ccagttgttg tgccacgcgg ttgggaatgt 4620
aattcagctc cgccatcgcc gcttccactt tttcccgcgt tttcgcagaa acgtggctgg 4680
cctggttcac cacgcgggaa acggtctgat aagagacacc ggcatactct gcgacatcgt 4740
ataacgttac tggtttcaca ttcaccaccc tgaattgact ctcttccggg cgctatcatg 4800
ccataccgcg aaaggttttg cgccattcga tggtgtccgg gatctcgacg ctctccctta 4860
tgcgactcct gcattaggaa gcagcccagt agtaggttga ggccgttgag caccgccgcc 4920
gcaaggaatg gtgcatgcaa ggagatggcg cccaacagtc ccccggccac ggggcctgcc 4980
accataccca cgccgaaaca agcgctcatg agcccgaagt ggcgagcccg atcttcccca 5040
tcggtgatgt cggcgatata ggcgccagca accgcacctg tggcgccggt gatgccggcc 5100
acgatgcgtc cggcgtagag gatcgagatc tcgatcccgc gaaattaata cgactcacta 5160
taggggaatt gtgagcggat aacaattccc ctctagaaat aattttgttt aactttaaga 5220
aggagatata ccatggaagc tcgtcgttcc gcaaactatc agccaaacct gtggaatttc 5280
gaattcctgc aatccctgga gaacgacctg aaagtggaaa agctggagga gaaagcgacc 5340
aaactggagg aagaagttcg ctgcatgatc aaccgtgtag acacccagcc gctgtccctg 5400
ctggagctga tcgacgatgt gcagcgcctg ggtctgacct acaaatttga aaaagacatc 5460
attaaagccc tggaaaacat cgtactgctg gacgaaaaca aaaagaacaa atctgacctg 5520
cacgcaaccg ctctgtcttt ccgtctgctg cgtcagcacg gtttcgaggt ttctcaggat 5580
gtttttgagc gtttcaagga taaagaaggt ggtttcagcg gtgaactgaa aggtgacgtc 5640
caaggcctgc tgagcctgta tgaagcgtct tacctgggtt tcgagggtga gaacctgctg 5700
gaggaggcgc gtaccttttc catcacccac ctgaagaaca acctgaaaga aggcattaat 5760
accaaggttg cagaacaagt gagccacgcc ctggaactgc catatcacca gcgtctgcac 5820
cgtctggagg cacgttggtt cctggataaa tacgaaccga aagaaccgca tcaccagctg 5880
ctgctggagc tggcgaagct ggattttaac atggtacaga ccctgcacca gaaagagctg 5940
caagatctgt cccgctggtg gaccgagatg ggcctggcta gcaaactgga ttttgtacgc 6000
gaccgcctga tggaagttta tttctgggca ctgggtatgg cgccagaccc gcagtttggt 6060
gaatgtcgca aagctgttac taaaatgttt ggtctggtga cgatcatcga tgacgtgtat 6120
gacgtttatg gcactctgga cgaactgcaa ctgttcaccg atgctgtaga gcgctgggac 6180
gttaacgcta ttaacaccct gccggactat atgaaactgt gtttcctggc actgtacaac 6240
accgttaacg acacgtccta ttctattctg aaagagaaag gtcataacaa cctgtcctat 6300
ctgacgaaaa gctggcgtga actgtgcaaa gcctttctgc aagaggcgaa atggtccaac 6360
aacaaaatta tcccggcttt ctccaagtac ctggaaaacg ccagcgtttc ctcctccggt 6420
gtagcgctgc tggcgccgtc ttacttttcc gtatgccagc agcaggaaga catctccgac 6480
cacgcgctgc gttccctgac cgacttccat ggtctggtgc gttctagctg cgttatcttc 6540
cgcctgtgca acgatctggc cacctctgcg gcggagctgg aacgtggcga gactaccaat 6600
tctatcatta gctacatgca cgaaaacgat ggtaccagcg aggaacaggc ccgcgaagaa 6660
ctgcgtaaac tgatcgacgc cgaatggaaa aagatgaatc gtgaacgcgt tagcgactcc 6720
accctgctgc ctaaagcgtt catggaaatc gcagttaaca tggcacgtgt ttcccactgc 6780
acctaccagt atggcgatgg tctgggtcgc ccagactacg cgactgaaaa ccgcatcaaa 6840
ctgctgctga ttgacccttt cccgattaac cagctgatgt atgtctaact gcagggatcc 6900
gaattcgagc tccgtcgaca agcttgcggc cgcac 6935
<210> 152
<211> 553
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 152
Met Glu His Asn Ser Arg Arg Ser Ala Asn Tyr Gln Pro Asn Leu Trp
1 5 10 15
Asn Phe Glu Phe Leu Gln Ser Leu Glu Asn Asp Leu Lys Val Glu Lys
20 25 30
Leu Glu Glu Lys Ala Thr Lys Leu Glu Glu Glu Val Arg Cys Met Ile
35 40 45
Asn Arg Val Asp Thr Gln Pro Leu Ser Leu Leu Glu Leu Ile Asp Asp
50 55 60
Val Gln Arg Leu Gly Leu Thr Tyr Lys Phe Glu Lys Asp Ile Ile Lys
65 70 75 80
Ala Leu Glu Asn Ile Val Leu Leu Asp Glu Asn Lys Lys Asn Lys Ser
85 90 95
Asp Leu His Ala Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly
100 105 110
Phe Glu Val Ser Gln Asp Val Phe Glu Arg Phe Lys Asp Lys Glu Gly
115 120 125
Gly Phe Ser Gly Glu Leu Lys Gly Asp Val Gln Gly Leu Leu Ser Leu
130 135 140
Tyr Glu Ala Ser Tyr Leu Gly Phe Glu Gly Glu Asn Leu Leu Glu Glu
145 150 155 160
Ala Arg Thr Phe Ser Ile Thr His Leu Lys Asn Asn Leu Lys Glu Gly
165 170 175
Ile Asn Thr Lys Val Ala Glu Gln Val Ser His Ala Leu Glu Leu Pro
180 185 190
Tyr His Gln Arg Leu His Arg Leu Glu Ala Arg Trp Phe Leu Asp Lys
195 200 205
Tyr Glu Pro Lys Glu Pro His His Gln Leu Leu Leu Glu Leu Ala Lys
210 215 220
Leu Asp Phe Asn Met Val Gln Thr Leu His Gln Lys Glu Leu Gln Asp
225 230 235 240
Leu Ser Arg Trp Trp Thr Glu Met Gly Leu Ala Ser Lys Leu Asp Phe
245 250 255
Val Arg Asp Arg Leu Met Glu Val Tyr Phe Trp Ala Leu Gly Met Ala
260 265 270
Pro Asp Pro Gln Phe Gly Glu Cys Arg Lys Ala Val Thr Lys Met Phe
275 280 285
Gly Leu Val Thr Ile Ile Asp Asp Val Tyr Asp Val Tyr Gly Thr Leu
290 295 300
Asp Glu Leu Gln Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn
305 310 315 320
Ala Ile Asn Thr Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu
325 330 335
Tyr Asn Thr Val Asn Asp Thr Ser Tyr Ser Ile Leu Lys Glu Lys Gly
340 345 350
His Asn Asn Leu Ser Tyr Leu Thr Lys Ser Trp Arg Glu Leu Cys Lys
355 360 365
Ala Phe Leu Gln Glu Ala Lys Trp Ser Asn Asn Lys Ile Ile Pro Ala
370 375 380
Phe Ser Lys Tyr Leu Glu Asn Ala Ser Val Ser Ser Ser Gly Val Ala
385 390 395 400
Leu Leu Ala Pro Ser Tyr Phe Ser Val Cys Gln Gln Gln Glu Asp Ile
405 410 415
Ser Asp His Ala Leu Arg Ser Leu Thr Asp Phe His Gly Leu Val Arg
420 425 430
Ser Ser Cys Val Ile Phe Arg Leu Cys Asn Asp Leu Ala Thr Ser Ala
435 440 445
Ala Glu Leu Glu Arg Gly Glu Thr Thr Asn Ser Ile Ile Ser Tyr Met
450 455 460
His Glu Asn Asp Gly Thr Ser Glu Glu Gln Ala Arg Glu Glu Leu Arg
465 470 475 480
Lys Leu Ile Asp Ala Glu Trp Lys Lys Met Asn Arg Glu Arg Val Ser
485 490 495
Asp Ser Thr Leu Leu Pro Lys Ala Phe Met Glu Ile Ala Val Asn Met
500 505 510
Ala Arg Val Ser His Cys Thr Tyr Gln Tyr Gly Asp Gly Leu Gly Arg
515 520 525
Pro Asp Tyr Ala Thr Glu Asn Arg Ile Lys Leu Leu Leu Ile Asp Pro
530 535 540
Phe Pro Ile Asn Gln Leu Met Tyr Val
545 550
<210> 153
<211> 6941
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 153
tcgagcacca ccaccaccac cactgagatc cggctgctaa caaagcccga aaggaagctg 60
agttggctgc tgccaccgct gagcaataac tagcataacc ccttggggcc tctaaacggg 120
tcttgagggg ttttttgctg aaaggaggaa ctatatccgg attggcgaat gggacgcgcc 180
ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 240
tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 300
cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 360
acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 420
ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 480
gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 540
tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 600
ttttaacaaa atattaacgt ttacaatttc aggtggcact tttcggggaa atgtgcgcgg 660
aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca tgaattaatt 720
cttagaaaaa ctcatcgagc atcaaatgaa actgcaattt attcatatca ggattatcaa 780
taccatattt ttgaaaaagc cgtttctgta atgaaggaga aaactcaccg aggcagttcc 840
ataggatggc aagatcctgg tatcggtctg cgattccgac tcgtccaaca tcaatacaac 900
ctattaattt cccctcgtca aaaataaggt tatcaagtga gaaatcacca tgagtgacga 960
ctgaatccgg tgagaatggc aaaagtttat gcatttcttt ccagacttgt tcaacaggcc 1020
agccattacg ctcgtcatca aaatcactcg catcaaccaa accgttattc attcgtgatt 1080
gcgcctgagc gagacgaaat acgcgatcgc tgttaaaagg acaattacaa acaggaatcg 1140
aatgcaaccg gcgcaggaac actgccagcg catcaacaat attttcacct gaatcaggat 1200
attcttctaa tacctggaat gctgttttcc cggggatcgc agtggtgagt aaccatgcat 1260
catcaggagt acggataaaa tgcttgatgg tcggaagagg cataaattcc gtcagccagt 1320
ttagtctgac catctcatct gtaacatcat tggcaacgct acctttgcca tgtttcagaa 1380
acaactctgg cgcatcgggc ttcccataca atcgatagat tgtcgcacct gattgcccga 1440
cattatcgcg agcccattta tacccatata aatcagcatc catgttggaa tttaatcgcg 1500
gcctagagca agacgtttcc cgttgaatat ggctcataac accccttgta ttactgttta 1560
tgtaagcaga cagttttatt gttcatgacc aaaatccctt aacgtgagtt ttcgttccac 1620
tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc 1680
gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat 1740
caagagctac caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat 1800
actgtccttc tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct 1860
acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt 1920
cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc gggctgaacg 1980
gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta 2040
cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg 2100
gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg 2160
tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc 2220
tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg 2280
gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga ttctgtggat 2340
aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac gaccgagcgc 2400
agcgagtcag tgagcgagga agcggaagag cgcctgatgc ggtattttct ccttacgcat 2460
ctgtgcggta tttcacaccg catatatggt gcactctcag tacaatctgc tctgatgccg 2520
catagttaag ccagtataca ctccgctatc gctacgtgac tgggtcatgg ctgcgccccg 2580
acacccgcca acacccgctg acgcgccctg acgggcttgt ctgctcccgg catccgctta 2640
cagacaagct gtgaccgtct ccgggagctg catgtgtcag aggttttcac cgtcatcacc 2700
gaaacgcgcg aggcagctgc ggtaaagctc atcagcgtgg tcgtgaagcg attcacagat 2760
gtctgcctgt tcatccgcgt ccagctcgtt gagtttctcc agaagcgtta atgtctggct 2820
tctgataaag cgggccatgt taagggcggt tttttcctgt ttggtcactg atgcctccgt 2880
gtaaggggga tttctgttca tgggggtaat gataccgatg aaacgagaga ggatgctcac 2940
gatacgggtt actgatgatg aacatgcccg gttactggaa cgttgtgagg gtaaacaact 3000
ggcggtatgg atgcggcggg accagagaaa aatcactcag ggtcaatgcc agcgcttcgt 3060
taatacagat gtaggtgttc cacagggtag ccagcagcat cctgcgatgc agatccggaa 3120
cataatggtg cagggcgctg acttccgcgt ttccagactt tacgaaacac ggaaaccgaa 3180
gaccattcat gttgttgctc aggtcgcaga cgttttgcag cagcagtcgc ttcacgttcg 3240
ctcgcgtatc ggtgattcat tctgctaacc agtaaggcaa ccccgccagc ctagccgggt 3300
cctcaacgac aggagcacga tcatgcgcac ccgtggggcc gccatgccgg cgataatggc 3360
ctgcttctcg ccgaaacgtt tggtggcggg accagtgacg aaggcttgag cgagggcgtg 3420
caagattccg aataccgcaa gcgacaggcc gatcatcgtc gcgctccagc gaaagcggtc 3480
ctcgccgaaa atgacccaga gcgctgccgg cacctgtcct acgagttgca tgataaagaa 3540
gacagtcata agtgcggcga cgatagtcat gccccgcgcc caccggaagg agctgactgg 3600
gttgaaggct ctcaagggca tcggtcgaga tcccggtgcc taatgagtga gctaacttac 3660
attaattgcg ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca 3720
ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgcc agggtggttt 3780
ttcttttcac cagtgagacg ggcaacagct gattgccctt caccgcctgg ccctgagaga 3840
gttgcagcaa gcggtccacg ctggtttgcc ccagcaggcg aaaatcctgt ttgatggtgg 3900
ttaacggcgg gatataacat gagctgtctt cggtatcgtc gtatcccact accgagatat 3960
ccgcaccaac gcgcagcccg gactcggtaa tggcgcgcat tgcgcccagc gccatctgat 4020
cgttggcaac cagcatcgca gtgggaacga tgccctcatt cagcatttgc atggtttgtt 4080
gaaaaccgga catggcactc cagtcgcctt cccgttccgc tatcggctga atttgattgc 4140
gagtgagata tttatgccag ccagccagac gcagacgcgc cgagacagaa cttaatgggc 4200
ccgctaacag cgcgatttgc tggtgaccca atgcgaccag atgctccacg cccagtcgcg 4260
taccgtcttc atgggagaaa ataatactgt tgatgggtgt ctggtcagag acatcaagaa 4320
ataacgccgg aacattagtg caggcagctt ccacagcaat ggcatcctgg tcatccagcg 4380
gatagttaat gatcagccca ctgacgcgtt gcgcgagaag attgtgcacc gccgctttac 4440
aggcttcgac gccgcttcgt tctaccatcg acaccaccac gctggcaccc agttgatcgg 4500
cgcgagattt aatcgccgcg acaatttgcg acggcgcgtg cagggccaga ctggaggtgg 4560
caacgccaat cagcaacgac tgtttgcccg ccagttgttg tgccacgcgg ttgggaatgt 4620
aattcagctc cgccatcgcc gcttccactt tttcccgcgt tttcgcagaa acgtggctgg 4680
cctggttcac cacgcgggaa acggtctgat aagagacacc ggcatactct gcgacatcgt 4740
ataacgttac tggtttcaca ttcaccaccc tgaattgact ctcttccggg cgctatcatg 4800
ccataccgcg aaaggttttg cgccattcga tggtgtccgg gatctcgacg ctctccctta 4860
tgcgactcct gcattaggaa gcagcccagt agtaggttga ggccgttgag caccgccgcc 4920
gcaaggaatg gtgcatgcaa ggagatggcg cccaacagtc ccccggccac ggggcctgcc 4980
accataccca cgccgaaaca agcgctcatg agcccgaagt ggcgagcccg atcttcccca 5040
tcggtgatgt cggcgatata ggcgccagca accgcacctg tggcgccggt gatgccggcc 5100
acgatgcgtc cggcgtagag gatcgagatc tcgatcccgc gaaattaata cgactcacta 5160
taggggaatt gtgagcggat aacaattccc ctctagaaat aattttgttt aactttaaga 5220
aggagatata ccatggagca taattcccgt cgttccgcaa actatcagcc aaacctgtgg 5280
aatttcgaat tcctgcaatc cctggagaac gacctgaaag tggaaaagct ggaggagaaa 5340
gcgaccaaac tggaggaaga agttcgctgc atgatcaacc gtgtagacac ccagccgctg 5400
tccctgctgg agctgatcga cgatgtgcag cgcctgggtc tgacctacaa atttgaaaaa 5460
gacatcatta aagccctgga aaacatcgta ctgctggacg aaaacaaaaa gaacaaatct 5520
gacctgcacg caaccgctct gtctttccgt ctgctgcgtc agcacggttt cgaggtttct 5580
caggatgttt ttgagcgttt caaggataaa gaaggtggtt tcagcggtga actgaaaggt 5640
gacgtccaag gcctgctgag cctgtatgaa gcgtcttacc tgggtttcga gggtgagaac 5700
ctgctggagg aggcgcgtac cttttccatc acccacctga agaacaacct gaaagaaggc 5760
attaatacca aggttgcaga acaagtgagc cacgccctgg aactgccata tcaccagcgt 5820
ctgcaccgtc tggaggcacg ttggttcctg gataaatacg aaccgaaaga accgcatcac 5880
cagctgctgc tggagctggc gaagctggat tttaacatgg tacagaccct gcaccagaaa 5940
gagctgcaag atctgtcccg ctggtggacc gagatgggcc tggctagcaa actggatttt 6000
gtacgcgacc gcctgatgga agtttatttc tgggcactgg gtatggcgcc agacccgcag 6060
tttggtgaat gtcgcaaagc tgttactaaa atgtttggtc tggtgacgat catcgatgac 6120
gtgtatgacg tttatggcac tctggacgaa ctgcaactgt tcaccgatgc tgtagagcgc 6180
tgggacgtta acgctattaa caccctgccg gactatatga aactgtgttt cctggcactg 6240
tacaacaccg ttaacgacac gtcctattct attctgaaag agaaaggtca taacaacctg 6300
tcctatctga cgaaaagctg gcgtgaactg tgcaaagcct ttctgcaaga ggcgaaatgg 6360
tccaacaaca aaattatccc ggctttctcc aagtacctgg aaaacgccag cgtttcctcc 6420
tccggtgtag cgctgctggc gccgtcttac ttttccgtat gccagcagca ggaagacatc 6480
tccgaccacg cgctgcgttc cctgaccgac ttccatggtc tggtgcgttc tagctgcgtt 6540
atcttccgcc tgtgcaacga tctggccacc tctgcggcgg agctggaacg tggcgagact 6600
accaattcta tcattagcta catgcacgaa aacgatggta ccagcgagga acaggcccgc 6660
gaagaactgc gtaaactgat cgacgccgaa tggaaaaaga tgaatcgtga acgcgttagc 6720
gactccaccc tgctgcctaa agcgttcatg gaaatcgcag ttaacatggc acgtgtttcc 6780
cactgcacct accagtatgg cgatggtctg ggtcgcccag actacgcgac tgaaaaccgc 6840
atcaaactgc tgctgattga ccctttcccg attaaccagc tgatgtatgt ctaactgcag 6900
ggatccgaat tcgagctccg tcgacaagct tgcggccgca c 6941
<210> 154
<211> 4352
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 154
tagaaaaact catcgagcat caaatgaaac tgcaatttat tcatatcagg attatcaata 60
ccatattttt gaaaaagccg tttctgtaat gaaggagaaa actcaccgag gcagttccat 120
aggatggcaa gatcctggta tcggtctgcg attccgactc gtccaacatc aatacaacct 180
attaatttcc cctcgtcaaa aataaggtta tcaagtgaga aatcaccatg agtgacgact 240
gaatccggtg agaatggcaa aagtttatgc atttctttcc agacttgttc aacaggccag 300
ccattacgct cgtcatcaaa atcactcgca tcaaccaaac cgttattcat tcgtgattgc 360
gcctgagcga ggcgaaatac gcgatcgctg ttaaaaggac aattacaaac aggaatcgag 420
tgcaaccggc gcaggaacac tgccagcgca tcaacaatat tttcacctga atcaggatat 480
tcttctaata cctggaacgc tgtttttccg gggatcgcag tggtgagtaa ccatgcatca 540
tcaggagtac ggataaaatg cttgatggtc ggaagtggca taaattccgt cagccagttt 600
agtctgacca tctcatctgt aacatcattg gcaacgctac ctttgccatg tttcagaaac 660
aactctggcg catcgggctt cccatacaag cgatagattg tcgcacctga ttgcccgaca 720
ttatcgcgag cccatttata cccatataaa tcagcatcca tgttggaatt taatcgcggc 780
ctcgacgttt cccgttgaat atggctcata ttcttccttt ttcaatatta ttgaagcatt 840
tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 900
ataggggtca gtgttacaac caattaacca attctgaaca ttatcgcgag cccatttata 960
cctgaatatg gctcataaca ccccttgttt gcctggcggc agtagcgcgg tggtcccacc 1020
tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggactcc 1080
ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact 1140
gggcctttcg cccgggctaa ttagggggtg tcgccctttc gattgacgct gcagttagac 1200
atacatcagc tggttaatcg ggaaagggtc aatcagcagc agtttgatgc ggttttcagt 1260
cgcgtagtct gggcgaccca gaccatcgcc atactggtag gtgcagtggg aaacacgtgc 1320
catgttaact gcgatttcca tgaacgcttt aggcagcagg gtggagtcgc taacgcgttc 1380
acgattcatc tttttccatt cggcgtcgat cagtttacgc agttcttcgc gggcctgttc 1440
ctcgctggta ccatcgtttt cgtgcatgta gctaatgata gaattggtag tctcgccacg 1500
ttccagctcc gccgcagagg tggccagatc gttgcacagg cggaagataa cgcagctaga 1560
acgcaccaga ccatggaagt cggtcaggga acgcagcgcg tggtcggaga tgtcttcctg 1620
ctgctggcat acggaaaagt aagacggcgc cagcagcgct acaccggagg aggaaacgct 1680
ggcgttttcc aggtacttgg agaaagccgg gataattttg ttgttggacc atttcgcctc 1740
ttgcagaaag gctttgcaca gttcacgcca gcttttcgtc agataggaca ggttgttatg 1800
acctttctct ttcagaatag aataggacgt gtcgttaacg gtgttgtaca gtgccaggaa 1860
acacagtttc atatagtccg gcagggtgtt aatagcgtta acgtcccagc gctctacagc 1920
atcggtgaac agttgcagtt cgtccagagt gccataaacg tcatacacgt catcgatgat 1980
cgtcaccaga ccaaacattt tagtaacagc tttgcgacat tcaccaaact gcgggtctgg 2040
cgccataccc agtgcccaga aataaacttc catcaggcgg tcgcgtacaa aatccagttt 2100
gctagccagg cccatctcgg tccaccagcg ggacagatct tgcagctctt tctggtgcag 2160
ggtctgtacc atgttaaaat ccagcttcgc cagctccagc agcagctggt gatgcggttc 2220
tttcggttcg tatttatcca ggaaccaacg tgcctccaga cggtgcagac gctggtgata 2280
tggcagttcc agggcgtggc tcacttgttc tgcaaccttg gtattaatgc cttctttcag 2340
gttgttcttc aggtgggtga tggaaaaggt acgcgcctcc tccagcaggt tctcaccctc 2400
gaaacccagg taagacgctt catacaggct cagcaggcct tggacgtcac ctttcagttc 2460
accgctgaaa ccaccttctt tatccttgaa acgctcaaaa acatcctgag aaacctcgaa 2520
accgtgctga cgcagcagac ggaaagacag agcggttgcg tgcaggtcag atttgttctt 2580
tttgttttcg tccagcagta cgatgttttc cagggcttta atgatgtctt tttcaaattt 2640
gtaggtcaga cccaggcgct gcacatcgtc gatcagctcc agcagggaca gcggctgggt 2700
gtctacacgg ttgatcatgc agcgaacttc ttcctccagt ttggtcgctt tctcctccag 2760
cttttccact ttcaggtcgt tctccaggga ttgcaggaat tcgaaattcc acaggtttgg 2820
ctgatagttt gcggaacgac gggaattatg ctcggtaatc tgagtaaatt gagaagaggt 2880
cgcacacatg ttcagcgaca agggcgacac aaaatttatt ctaaatgcat aataaatact 2940
gataacatct tatagtttgt attatatttt gtattatcgt tgacatgtat aattttgata 3000
tcaaaaactg attttccctt tattattttc gagatttatt ttcttaattc tctttaacaa 3060
actagaaata ttgtatatac aaaaaatcat aaataataga tgaatagttt aattataggt 3120
gttcatcaat cgaaaaagca acgtatctta tttaaagtgc gttgcttttt tctcatttat 3180
aaggttaaat aattctcata tatcaagcaa agtgacaggc gcccttaaat attctgacaa 3240
atgctctttc cctaaactcc ccccataaaa aaacccgccg aagcgggttt ttacgttatt 3300
tgcggattaa cgattactcg ttatcagaac cgcccagggg gcccgagctt aagactggcc 3360
gtcgttttac aacacagaaa gagtttgtag aaacgcaaaa aggccatccg tcaggggcct 3420
tctgcttagt ttgatgcctg gcagttccct actctcgcct tccgcttcct cgctcactga 3480
ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 3540
acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 3600
aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 3660
tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 3720
aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 3780
gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc 3840
acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 3900
accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 3960
ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 4020
gtatgtaggc ggtgctacag agttcttgaa gtggtgggct aactacggct acactagaag 4080
aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 4140
ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 4200
gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 4260
cgctcagtgg aacgacgcgc gcgtaactca cgttaaggga ttttggtcat gagcttgcgc 4320
cgtcccgtca agtcagcgta atgctctgct tt 4352
<210> 155
<211> 6080
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 155
gtttgacagc ttatcatcga ctgcacggtg caccaatgct tctggcgtca ggcagccatc 60
ggaagctgtg gtatggctgt gcaggtcgta aatcactgca taattcgtgt cgctcaaggc 120
gcactcccgt tctggataat gttttttgcg ccgacatcat aacggttctg gcaaatattc 180
tgaaatgagc tgttgacaat taatcatccg gctcgtataa tgtgtggaat tgtgagcgga 240
taacaatttc acacaggaaa cagcgccgct gagaaaaagc gaagcggcac tgctctttaa 300
caatttatca gacaatctgt gtgggcactc gaccggaatt atcgattaac tttattatta 360
aaaattaaag aggtatatat taatgtatcg attaaataag gaggaataaa ccatgtgtgc 420
gacctcttct caatttactc agattaccga gcataattcc cgtcgttccg caaactatca 480
gccaaacctg tggaatttcg aattcctgca atccctggag aacgacctga aagtggaaaa 540
gctggaggag aaagcgacca aactggagga agaagttcgc tgcatgatca accgtgtaga 600
cacccagccg ctgtccctgc tggagctgat cgacgatgtg cagcgcctgg gtctgaccta 660
caaatttgaa aaagacatca ttaaagccct ggaaaacatc gtactgctgg acgaaaacaa 720
aaagaacaaa tctgacctgc acgcaaccgc tctgtctttc cgtctgctgc gtcagcacgg 780
tttcgaggtt tctcaggatg tttttgagcg tttcaaggat aaagaaggtg gtttcagcgg 840
tgaactgaaa ggtgacgtcc aaggcctgct gagcctgtat gaagcgtctt acctgggttt 900
cgagggtgag aacctgctgg aggaggcgcg taccttttcc atcacccacc tgaagaacaa 960
cctgaaagaa ggcattaata ccaaggttgc agaacaagtg agccacgccc tggaactgcc 1020
atatcaccag cgtctgcacc gtctggaggc acgttggttc ctggataaat acgaaccgaa 1080
agaaccgcat caccagctgc tgctggagct ggcgaagctg gattttaaca tggtacagac 1140
cctgcaccag aaagagctgc aagatctgtc ccgctggtgg accgagatgg gcctggctag 1200
caaactggat tttgtacgcg accgcctgat ggaagtttat ttctgggcac tgggtatggc 1260
gccagacccg cagtttggtg aatgtcgcaa agctgttact aaaatgtttg gtctggtgac 1320
gatcatcgat gacgtgtatg acgtttatgg cactctggac gaactgcaac tgttcaccga 1380
tgctgtagag cgctgggacg ttaacgctat taacaccctg ccggactata tgaaactgtg 1440
tttcctggca ctgtacaaca ccgttaacga cacgtcctat tctattctga aagagaaagg 1500
tcataacaac ctgtcctatc tgacgaaaag ctggcgtgaa ctgtgcaaag cctttctgca 1560
agaggcgaaa tggtccaaca acaaaattat cccggctttc tccaagtacc tggaaaacgc 1620
cagcgtttcc tcctccggtg tagcgctgct ggcgccgtct tacttttccg tatgccagca 1680
gcaggaagac atctccgacc acgcgctgcg ttccctgacc gacttccatg gtctggtgcg 1740
ttctagctgc gttatcttcc gcctgtgcaa cgatctggcc acctctgcgg cggagctgga 1800
acgtggcgag actaccaatt ctatcattag ctacatgcac gaaaacgatg gtaccagcga 1860
ggaacaggcc cgcgaagaac tgcgtaaact gatcgacgcc gaatggaaaa agatgaatcg 1920
tgaacgcgtt agcgactcca ccctgctgcc taaagcgttc atggaaatcg cagttaacat 1980
ggcacgtgtt tcccactgca cctaccagta tggcgatggt ctgggtcgcc cagactacgc 2040
gactgaaaac cgcatcaaac tgctgctgat tgaccctttc ccgattaacc agctgatgta 2100
tgtctaactg cagctggtac catatgggaa ttcgaagctt tctagaacaa aaactcatct 2160
cagaagagga tctgaatagc gccgtcgacc atcatcatca tcatcattga gtttaaacgg 2220
tctccagctt ggctgttttg gcggatgaga gaagattttc agcctgatac agattaaatc 2280
agaacgcaga agcggtctga taaaacagaa tttgcctggc ggcagtagcg cggtggtccc 2340
acctgacccc atgccgaact cagaagtgaa acgccgtagc gccgatggta gtgtggggtc 2400
tccccatgcg agagtaggga actgccaggc atcaaataaa acgaaaggct cagtcgaaag 2460
actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt aggacaaatc 2520
cgccgggagc ggatttgaac gttgcgaagc aacggcccgg agggtggcgg gcaggacgcc 2580
cgccataaac tgccaggcat caaattaagc agaaggccat cctgacggat ggcctttttg 2640
cgtttctaca aactcttttt gtttattttt ctaaatacat tcaaatatgt atccgctcat 2700
gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca 2760
acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca 2820
cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta 2880
catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt 2940
tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc gtgttgacgc 3000
cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc 3060
accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc 3120
cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa 3180
ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga 3240
accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat 3300
ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca 3360
attaatagac tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc 3420
ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat 3480
tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag 3540
tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa 3600
gcattggtaa ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca 3660
tttttaattt aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc 3720
ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc 3780
ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 3840
agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 3900
cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 3960
caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 4020
tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 4080
ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 4140
ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 4200
gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 4260
gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 4320
tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa 4380
cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc 4440
gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg 4500
ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcctgat 4560
gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatatggt gcactctcag 4620
tacaatctgc tctgatgccg catagttaag ccagtataca ctccgctatc gctacgtgac 4680
tgggtcatgg ctgcgccccg acacccgcca acacccgctg acgcgccctg acgggcttgt 4740
ctgctcccgg catccgctta cagacaagct gtgaccgtct ccgggagctg catgtgtcag 4800
aggttttcac cgtcatcacc gaaacgcgcg aggcagcaga tcaattcgcg cgcgaaggcg 4860
aagcggcatg catttacgtt gacaccatcg aatggtgcaa aacctttcgc ggtatggcat 4920
gatagcgccc ggaagagagt caattcaggg tggtgaatgt gaaaccagta acgttatacg 4980
atgtcgcaga gtatgccggt gtctcttatc agaccgtttc ccgcgtggtg aaccaggcca 5040
gccacgtttc tgcgaaaacg cgggaaaaag tggaagcggc gatggcggag ctgaattaca 5100
ttcccaaccg cgtggcacaa caactggcgg gcaaacagtc gttgctgatt ggcgttgcca 5160
cctccagtct ggccctgcac gcgccgtcgc aaattgtcgc ggcgattaaa tctcgcgccg 5220
atcaactggg tgccagcgtg gtggtgtcga tggtagaacg aagcggcgtc gaagcctgta 5280
aagcggcggt gcacaatctt ctcgcgcaac gcgtcagtgg gctgatcatt aactatccgc 5340
tggatgacca ggatgccatt gctgtggaag ctgcctgcac taatgttccg gcgttatttc 5400
ttgatgtctc tgaccagaca cccatcaaca gtattatttt ctcccatgaa gacggtacgc 5460
gactgggcgt ggagcatctg gtcgcattgg gtcaccagca aatcgcgctg ttagcgggcc 5520
cattaagttc tgtctcggcg cgtctgcgtc tggctggctg gcataaatat ctcactcgca 5580
atcaaattca gccgatagcg gaacgggaag gcgactggag tgccatgtcc ggttttcaac 5640
aaaccatgca aatgctgaat gagggcatcg ttcccactgc gatgctggtt gccaacgatc 5700
agatggcgct gggcgcaatg cgcgccatta ccgagtccgg gctgcgcgtt ggtgcggata 5760
tctcggtagt gggatacgac gataccgaag acagctcatg ttatatcccg ccgtcaacca 5820
ccatcaaaca ggattttcgc ctgctggggc aaaccagcgt ggaccgcttg ctgcaactct 5880
ctcagggcca ggcggtgaag ggcaatcagc tgttgcccgt ctcactggtg aaaagaaaaa 5940
ccaccctggc gcccaatacg caaaccgcct ctccccgcgc gttggccgat tcattaatgc 6000
agctggcacg acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc aattaatgtg 6060
agttagcgcg aattgatctg 6080
<210> 156
<211> 6646
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 156
ccgacaccat cgaatggtgc aaaacctttc gcggtatggc atgatagcgc ccggaagaga 60
gtcaattcag ggtggtgaat gtgaaaccag taacgttata cgatgtcgca gagtatgccg 120
gtgtctctta tcagaccgtt tcccgcgtgg tgaaccaggc cagccacgtt tctgcgaaaa 180
cgcgggaaaa agtggaagcg gcgatggcgg agctgaatta cattcccaac cgcgtggcac 240
aacaactggc gggcaaacag tcgttgctga ttggcgttgc cacctccagt ctggccctgc 300
acgcgccgtc gcaaattgtc gcggcgatta aatctcgcgc cgatcaactg ggtgccagcg 360
tggtggtgtc gatggtagaa cgaagcggcg tcgaagcctg taaagcggcg gtgcacaatc 420
ttctcgcgca acgcgtcagt gggctgatca ttaactatcc gctggatgac caggatgcca 480
ttgctgtgga agctgcctgc actaatgttc cggcgttatt tcttgatgtc tctgaccaga 540
cacccatcaa cagtattatt ttctcccatg aagacggtac gcgactgggc gtggagcatc 600
tggtcgcatt gggtcaccag caaatcgcgc tgttagcggg cccattaagt tctgtctcgg 660
cgcgtctgcg tctggctggc tggcataaat atctcactcg caatcaaatt cagccgatag 720
cggaacggga aggcgactgg agtgccatgt ccggttttca acaaaccatg caaatgctga 780
atgagggcat cgttcccact gcgatgctgg ttgccaacga tcagatggcg ctgggcgcaa 840
tgcgcgccat taccgagtcc gggctgcgcg ttggtgcgga tatctcggta gtgggatacg 900
acgataccga agacagctca tgttatatcc cgccgttaac caccatcaaa caggattttc 960
gcctgctggg gcaaaccagc gtggaccgct tgctgcaact ctctcagggc caggcggtga 1020
agggcaatca gctgttgccc gtctcactgg tgaaaagaaa aaccaccctg gcgcccaata 1080
cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt 1140
cccgactgga aagcgggcag tgagcgcaac gcaattaatg taagttagct cactcattag 1200
gcacaattct catgtttgac agcttatcat cgactgcacg gtgcaccaat gcttctggcg 1260
tcaggcagcc atcggaagct gtggtatggc tgtgcaggtc gtaaatcact gcataattcg 1320
tgtcgctcaa ggcgcactcc cgttctggat aatgtttttt gcgccgacat cataacggtt 1380
ctggcaaata ttctgaaatg agctgttgac aattaatcat cggctcgtat aatgtgtgga 1440
attgtgagcg gataacaatt tcacacagga aacagccagt ccgtttaggt gttttcacga 1500
gcacttcacc aacaaggacc atagcatatg aaaatcgaag aaggtaaact ggtaatctgg 1560
attaacggcg ataaaggcta taacggtctc gctgaagtcg gtaagaaatt cgagaaagat 1620
accggaatta aagtcaccgt tgagcatccg gataaactgg aagagaaatt cccacaggtt 1680
gcggcaactg gcgatggccc tgacattatc ttctgggcac acgaccgctt tggtggctac 1740
gctcaatctg gcctgttggc tgaaatcacc ccggacaaag cgttccagga caagctgtat 1800
ccgtttacct gggatgccgt acgttacaac ggcaagctga ttgcttaccc gatcgctgtt 1860
gaagcgttat cgctgattta taacaaagat ctgctgccga acccgccaaa aacctgggaa 1920
gagatcccgg cgctggataa agaactgaaa gcgaaaggta agagcgcgct gatgttcaac 1980
ctgcaagaac cgtacttcac ctggccgctg attgctgctg acgggggtta tgcgttcaag 2040
tatgaaaacg gcaagtacga cattaaagac gtgggcgtgg ataacgctgg cgcgaaagcg 2100
ggtctgacct tcctggttga cctgattaaa aacaaacaca tgaatgcaga caccgattac 2160
tccatcgcag aagctgcctt taataaaggc gaaacagcga tgaccatcaa cggcccgtgg 2220
gcatggtcca acatcgacac cagcaaagtg aattatggtg taacggtact gccgaccttc 2280
aagggtcaac catccaaacc gttcgttggc gtgctgagcg caggtattaa cgccgccagt 2340
ccgaacaaag agctggcaaa agagttcctc gaaaactatc tgctgactga tgaaggtctg 2400
gaagcggtta ataaagacaa accgctgggt gccgtagcgc tgaagtctta cgaggaagag 2460
ttggtgaaag atccgcggat tgccgccact atggaaaacg cccagaaagg tgaaatcatg 2520
ccgaacatcc cgcagatgtc cgctttctgg tatgccgtgc gtactgcggt gatcaacgcc 2580
gccagcggtc gtcagactgt cgatgaagcc ctgaaagacg cgcagactaa ttcgagctcg 2640
aacaacaaca acaataacaa taacaacaac ctcgggatcg agggaaggat ttcagaattc 2700
ggatcctcta gagtcgacct gcaggcaagc ttggcactgg ccgtcgtttt acaacgtcgt 2760
gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc 2820
agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg 2880
aatggcgaat ggcagcttgg ctgttttggc ggatgagata agattttcag cctgatacag 2940
attaaatcag aacgcagaag cggtctgata aaacagaatt tgcctggcgg cagtagcgcg 3000
gtggtcccac ctgaccccat gccgaactca gaagtgaaac gccgtagcgc cgatggtagt 3060
gtggggtctc cccatgcgag agtagggaac tgccaggcat caaataaaac gaaaggctca 3120
gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc tcctgagtag 3180
gacaaatccg ccgggagcgg atttgaacgt tgcgaagcaa cggcccggag ggtggcgggc 3240
aggacgcccg ccataaactg ccaggcatca aattaagcag aaggccatcc tgacggatgg 3300
cctttttgcg tttctacaaa ctctttttgt ttatttttct aaatacattc aaatatgtat 3360
ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag gaagagtatg 3420
agtattcaac atttccgtgt cgcccttatt cccttttttg cggcattttg ccttcctgtt 3480
tttgctcacc cagaaacgct ggtgaaagta aaagatgctg aagatcagtt gggtgcacga 3540
gtgggttaca tcgaactgga tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa 3600
gaacgttctc caatgatgag cacttttaaa gttctgctat gtggcgcggt attatcccgt 3660
gttgacgccg ggcaagagca actcggtcgc cgcatacact attctcagaa tgacttggtt 3720
gagtactcac cagtcacaga aaagcatctt acggatggca tgacagtaag agaattatgc 3780
agtgctgcca taaccatgag tgataacact gcggccaact tacttctgac aacgatcgga 3840
ggaccgaagg agctaaccgc ttttttgcac aacatggggg atcatgtaac tcgccttgat 3900
cgttgggaac cggagctgaa tgaagccata ccaaacgacg agcgtgacac cacgatgcct 3960
gtagcaatgg caacaacgtt gcgcaaacta ttaactggcg aactacttac tctagcttcc 4020
cggcaacaat taatagactg gatggaggcg gataaagttg caggaccact tctgcgctcg 4080
gcccttccgg ctggctggtt tattgctgat aaatctggag ccggtgagcg tgggtctcgc 4140
ggtatcattg cagcactggg gccagatggt aagccctccc gtatcgtagt tatctacacg 4200
acggggagtc aggcaactat ggatgaacga aatagacaga tcgctgagat aggtgcctca 4260
ctgattaagc attggtaact gtcagaccaa gtttactcat atatacttta gattgattta 4320
ccccggttga taatcagaaa agccccaaaa acaggaagat tgtataagca aatatttaaa 4380
ttgtaaacgt taatattttg ttaaaattcg cgttaaattt ttgttaaatc agctcatttt 4440
ttaaccaata ggccgaaatc ggcaaaatcc cttataaatc aaaagaatag accgagatag 4500
ggttgagtgt tgttccagtt tggaacaaga gtccactatt aaagaacgtg gactccaacg 4560
tcaaagggcg aaaaaccgtc tatcagggcg atggcccact acgtgaacca tcacccaaat 4620
caagtttttt ggggtcgagg tgccgtaaag cactaaatcg gaaccctaaa gggagccccc 4680
gatttagagc ttgacgggga aagccggcga acgtggcgag aaaggaaggg aagaaagcga 4740
aaggagcggg cgctagggcg ctggcaagtg tagcggtcac gctgcgcgta accaccacac 4800
ccgccgcgct taatgcgccg ctacagggcg cgtaaaagga tctaggtgaa gatccttttt 4860
gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc 4920
gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg 4980
caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact 5040
ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt ccttctagtg 5100
tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg 5160
ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac 5220
tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca 5280
cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg tgagctatga 5340
gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc 5400
ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct 5460
gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg 5520
agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt ttgctggcct 5580
tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg tattaccgcc 5640
tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc 5700
gaggaagcgg aagagcgcct gatgcggtat tttctcctta cgcatctgtg cggtatttca 5760
caccgcatat atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagt 5820
atacactccg ctatcgctac gtgactgggt catggctgcg ccccgacacc cgccaacacc 5880
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 5940
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgaggca 6000
gctgcggtaa agctcatcag cgtggtcgtg cagcgattca cagatgtctg cctgttcatc 6060
cgcgtccagc tcgttgagtt tctccagaag cgttaatgtc tggcttctga taaagcgggc 6120
catgttaagg gcggtttttt cctgtttggt cactgatgcc tccgtgtaag ggggatttct 6180
gttcatgggg gtaatgatac cgatgaaacg agagaggatg ctcacgatac gggttactga 6240
tgatgaacat gcccggttac tggaacgttg tgagggtaaa caactggcgg tatggatgcg 6300
gcgggaccag agaaaaatca ctcagggtca atgccagcgc ttcgttaata cagatgtagg 6360
tgttccacag ggtagccagc agcatcctgc gatgcagatc cggaacataa tggtgcaggg 6420
cgctgacttc cgcgtttcca gactttacga aacacggaaa ccgaagacca ttcatgttgt 6480
tgctcaggtc gcagacgttt tgcagcagca gtcgcttcac gttcgctcgc gtatcggtga 6540
ttcattctgc taaccagtaa ggcaaccccg ccagcctagc cgggtcctca acgacaggag 6600
cacgatcatg cgcacccgtg gccaggaccc aacgctgccc gaaatt 6646
<210> 157
<211> 8310
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 157
ccgacaccat cgaatggtgc aaaacctttc gcggtatggc atgatagcgc ccggaagaga 60
gtcaattcag ggtggtgaat gtgaaaccag taacgttata cgatgtcgca gagtatgccg 120
gtgtctctta tcagaccgtt tcccgcgtgg tgaaccaggc cagccacgtt tctgcgaaaa 180
cgcgggaaaa agtggaagcg gcgatggcgg agctgaatta cattcccaac cgcgtggcac 240
aacaactggc gggcaaacag tcgttgctga ttggcgttgc cacctccagt ctggccctgc 300
acgcgccgtc gcaaattgtc gcggcgatta aatctcgcgc cgatcaactg ggtgccagcg 360
tggtggtgtc gatggtagaa cgaagcggcg tcgaagcctg taaagcggcg gtgcacaatc 420
ttctcgcgca acgcgtcagt gggctgatca ttaactatcc gctggatgac caggatgcca 480
ttgctgtgga agctgcctgc actaatgttc cggcgttatt tcttgatgtc tctgaccaga 540
cacccatcaa cagtattatt ttctcccatg aagacggtac gcgactgggc gtggagcatc 600
tggtcgcatt gggtcaccag caaatcgcgc tgttagcggg cccattaagt tctgtctcgg 660
cgcgtctgcg tctggctggc tggcataaat atctcactcg caatcaaatt cagccgatag 720
cggaacggga aggcgactgg agtgccatgt ccggttttca acaaaccatg caaatgctga 780
atgagggcat cgttcccact gcgatgctgg ttgccaacga tcagatggcg ctgggcgcaa 840
tgcgcgccat taccgagtcc gggctgcgcg ttggtgcgga tatctcggta gtgggatacg 900
acgataccga agacagctca tgttatatcc cgccgttaac caccatcaaa caggattttc 960
gcctgctggg gcaaaccagc gtggaccgct tgctgcaact ctctcagggc caggcggtga 1020
agggcaatca gctgttgccc gtctcactgg tgaaaagaaa aaccaccctg gcgcccaata 1080
cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt 1140
cccgactgga aagcgggcag tgagcgcaac gcaattaatg taagttagct cactcattag 1200
gcacaattct catgtttgac agcttatcat cgactgcacg gtgcaccaat gcttctggcg 1260
tcaggcagcc atcggaagct gtggtatggc tgtgcaggtc gtaaatcact gcataattcg 1320
tgtcgctcaa ggcgcactcc cgttctggat aatgtttttt gcgccgacat cataacggtt 1380
ctggcaaata ttctgaaatg agctgttgac aattaatcat cggctcgtat aatgtgtgga 1440
attgtgagcg gataacaatt tcacacagga aacagccagt ccgtttaggt gttttcacga 1500
gcacttcacc aacaaggacc atagcatatg aaaatcgaag aaggtaaact ggtaatctgg 1560
attaacggcg ataaaggcta taacggtctc gctgaagtcg gtaagaaatt cgagaaagat 1620
accggaatta aagtcaccgt tgagcatccg gataaactgg aagagaaatt cccacaggtt 1680
gcggcaactg gcgatggccc tgacattatc ttctgggcac acgaccgctt tggtggctac 1740
gctcaatctg gcctgttggc tgaaatcacc ccggacaaag cgttccagga caagctgtat 1800
ccgtttacct gggatgccgt acgttacaac ggcaagctga ttgcttaccc gatcgctgtt 1860
gaagcgttat cgctgattta taacaaagat ctgctgccga acccgccaaa aacctgggaa 1920
gagatcccgg cgctggataa agaactgaaa gcgaaaggta agagcgcgct gatgttcaac 1980
ctgcaagaac cgtacttcac ctggccgctg attgctgctg acgggggtta tgcgttcaag 2040
tatgaaaacg gcaagtacga cattaaagac gtgggcgtgg ataacgctgg cgcgaaagcg 2100
ggtctgacct tcctggttga cctgattaaa aacaaacaca tgaatgcaga caccgattac 2160
tccatcgcag aagctgcctt taataaaggc gaaacagcga tgaccatcaa cggcccgtgg 2220
gcatggtcca acatcgacac cagcaaagtg aattatggtg taacggtact gccgaccttc 2280
aagggtcaac catccaaacc gttcgttggc gtgctgagcg caggtattaa cgccgccagt 2340
ccgaacaaag agctggcaaa agagttcctc gaaaactatc tgctgactga tgaaggtctg 2400
gaagcggtta ataaagacaa accgctgggt gccgtagcgc tgaagtctta cgaggaagag 2460
ttggtgaaag atccgcggat tgccgccact atggaaaacg cccagaaagg tgaaatcatg 2520
ccgaacatcc cgcagatgtc cgctttctgg tatgccgtgc gtactgcggt gatcaacgcc 2580
gccagcggtc gtcagactgt cgatgaagcc ctgaaagacg cgcagactaa ttcgagctcg 2640
aacaacaaca acaataacaa taacaacaac ctcgggatcg agggaaggat ttcagaattc 2700
tgtgcgacct cttctcaatt tactcagatt accgagcata attcccgtcg ttccgcaaac 2760
tatcagccaa acctgtggaa tttcgaattc ctgcaatccc tggagaacga cctgaaagtg 2820
gaaaagctgg aggagaaagc gaccaaactg gaggaagaag ttcgctgcat gatcaaccgt 2880
gtagacaccc agccgctgtc cctgctggag ctgatcgacg atgtgcagcg cctgggtctg 2940
acctacaaat ttgaaaaaga catcattaaa gccctggaaa acatcgtact gctggacgaa 3000
aacaaaaaga acaaatctga cctgcacgca accgctctgt ctttccgtct gctgcgtcag 3060
cacggtttcg aggtttctca ggatgttttt gagcgtttca aggataaaga aggtggtttc 3120
agcggtgaac tgaaaggtga cgtccaaggc ctgctgagcc tgtatgaagc gtcttacctg 3180
ggtttcgagg gtgagaacct gctggaggag gcgcgtacct tttccatcac ccacctgaag 3240
aacaacctga aagaaggcat taataccaag gttgcagaac aagtgagcca cgccctggaa 3300
ctgccatatc accagcgtct gcaccgtctg gaggcacgtt ggttcctgga taaatacgaa 3360
ccgaaagaac cgcatcacca gctgctgctg gagctggcga agctggattt taacatggta 3420
cagaccctgc accagaaaga gctgcaagat ctgtcccgct ggtggaccga gatgggcctg 3480
gctagcaaac tggattttgt acgcgaccgc ctgatggaag tttatttctg ggcactgggt 3540
atggcgccag acccgcagtt tggtgaatgt cgcaaagctg ttactaaaat gtttggtctg 3600
gtgacgatca tcgatgacgt gtatgacgtt tatggcactc tggacgaact gcaactgttc 3660
accgatgctg tagagcgctg ggacgttaac gctattaaca ccctgccgga ctatatgaaa 3720
ctgtgtttcc tggcactgta caacaccgtt aacgacacgt cctattctat tctgaaagag 3780
aaaggtcata acaacctgtc ctatctgacg aaaagctggc gtgaactgtg caaagccttt 3840
ctgcaagagg cgaaatggtc caacaacaaa attatcccgg ctttctccaa gtacctggaa 3900
aacgccagcg tttcctcctc cggtgtagcg ctgctggcgc cgtcttactt ttccgtatgc 3960
cagcagcagg aagacatctc cgaccacgcg ctgcgttccc tgaccgactt ccatggtctg 4020
gtgcgttcta gctgcgttat cttccgcctg tgcaacgatc tggccacctc tgcggcggag 4080
ctggaacgtg gcgagactac caattctatc attagctaca tgcacgaaaa cgatggtacc 4140
agcgaggaac aggcccgcga agaactgcgt aaactgatcg acgccgaatg gaaaaagatg 4200
aatcgtgaac gcgttagcga ctccaccctg ctgcctaaag cgttcatgga aatcgcagtt 4260
aacatggcac gtgtttccca ctgcacctac cagtatggcg atggtctggg tcgcccagac 4320
tacgcgactg aaaaccgcat caaactgctg ctgattgacc ctttcccgat taaccagctg 4380
atgtatgtct aagcttggca ctggccgtcg ttttacaacg tcgtgactgg gaaaaccctg 4440
gcgttaccca acttaatcgc cttgcagcac atcccccttt cgccagctgg cgtaatagcg 4500
aagaggcccg caccgatcgc ccttcccaac agttgcgcag cctgaatggc gaatggcagc 4560
ttggctgttt tggcggatga gataagattt tcagcctgat acagattaaa tcagaacgca 4620
gaagcggtct gataaaacag aatttgcctg gcggcagtag cgcggtggtc ccacctgacc 4680
ccatgccgaa ctcagaagtg aaacgccgta gcgccgatgg tagtgtgggg tctccccatg 4740
cgagagtagg gaactgccag gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc 4800
tttcgtttta tctgttgttt gtcggtgaac gctctcctga gtaggacaaa tccgccggga 4860
gcggatttga acgttgcgaa gcaacggccc ggagggtggc gggcaggacg cccgccataa 4920
actgccaggc atcaaattaa gcagaaggcc atcctgacgg atggcctttt tgcgtttcta 4980
caaactcttt ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat 5040
aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc 5100
gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa 5160
cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac 5220
tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tctccaatga 5280
tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtgttgac gccgggcaag 5340
agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca 5400
cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca 5460
tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa 5520
ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc 5580
tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa 5640
cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag 5700
actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct 5760
ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac 5820
tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa 5880
ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt 5940
aactgtcaga ccaagtttac tcatatatac tttagattga tttaccccgg ttgataatca 6000
gaaaagcccc aaaaacagga agattgtata agcaaatatt taaattgtaa acgttaatat 6060
tttgttaaaa ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga 6120
aatcggcaaa atcccttata aatcaaaaga atagaccgag atagggttga gtgttgttcc 6180
agtttggaac aagagtccac tattaaagaa cgtggactcc aacgtcaaag ggcgaaaaac 6240
cgtctatcag ggcgatggcc cactacgtga accatcaccc aaatcaagtt ttttggggtc 6300
gaggtgccgt aaagcactaa atcggaaccc taaagggagc ccccgattta gagcttgacg 6360
gggaaagccg gcgaacgtgg cgagaaagga agggaagaaa gcgaaaggag cgggcgctag 6420
ggcgctggca agtgtagcgg tcacgctgcg cgtaaccacc acacccgccg cgcttaatgc 6480
gccgctacag ggcgcgtaaa aggatctagg tgaagatcct ttttgataat ctcatgacca 6540
aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag 6600
gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac 6660
cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa 6720
ctggcttcag cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc 6780
accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag 6840
tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac 6900
cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc 6960
gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc 7020
ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca 7080
cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc 7140
tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg 7200
ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct 7260
ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata 7320
ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc 7380
gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc atatatggtg 7440
cactctcagt acaatctgct ctgatgccgc atagttaagc cagtatacac tccgctatcg 7500
ctacgtgact gggtcatggc tgcgccccga cacccgccaa cacccgctga cgcgccctga 7560
cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc 7620
atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga ggcagctgcg gtaaagctca 7680
tcagcgtggt cgtgcagcga ttcacagatg tctgcctgtt catccgcgtc cagctcgttg 7740
agtttctcca gaagcgttaa tgtctggctt ctgataaagc gggccatgtt aagggcggtt 7800
ttttcctgtt tggtcactga tgcctccgtg taagggggat ttctgttcat gggggtaatg 7860
ataccgatga aacgagagag gatgctcacg atacgggtta ctgatgatga acatgcccgg 7920
ttactggaac gttgtgaggg taaacaactg gcggtatgga tgcggcggga ccagagaaaa 7980
atcactcagg gtcaatgcca gcgcttcgtt aatacagatg taggtgttcc acagggtagc 8040
cagcagcatc ctgcgatgca gatccggaac ataatggtgc agggcgctga cttccgcgtt 8100
tccagacttt acgaaacacg gaaaccgaag accattcatg ttgttgctca ggtcgcagac 8160
gttttgcagc agcagtcgct tcacgttcgc tcgcgtatcg gtgattcatt ctgctaacca 8220
gtaaggcaac cccgccagcc tagccgggtc ctcaacgaca ggagcacgat catgcgcacc 8280
cgtggccagg acccaacgct gcccgaaatt 8310
<210> 158
<211> 560
<212> PRT
<213> Populus tremuloides
<400> 158
Met Arg Cys Ser Val Ser Thr Glu Asn Val Ser Phe Ser Glu Thr Glu
1 5 10 15
Thr Glu Thr Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr
20 25 30
Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val His Lys
35 40 45
Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn
50 55 60
Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln
65 70 75 80
Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Arg Ala Leu
85 90 95
Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Gly Val Thr Lys Thr Ser
100 105 110
Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe
115 120 125
Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn
130 135 140
Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu Tyr
145 150 155 160
Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala
165 170 175
Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile
180 185 190
Gly Lys Glu Leu Ala Glu Gln Val Ser His Ala Leu Glu Leu Pro Leu
195 200 205
His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu Ala Tyr
210 215 220
Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala Ile Leu
225 230 235 240
Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr
245 250 255
Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala
260 265 270
Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe
275 280 285
Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser
290 295 300
Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp
305 310 315 320
Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val Asn Ala
325 330 335
Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr
340 345 350
Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys Gly Glu
355 360 365
Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala
370 375 380
Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe
385 390 395 400
Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln
405 410 415
Leu Ile Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu
420 425 430
Ile Glu Asn Leu Gln Lys Tyr His Asp Ile Ile Ser Arg Pro Ser His
435 440 445
Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala
450 455 460
Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly
465 470 475 480
Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu
485 490 495
Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala
500 505 510
Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys
515 520 525
Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg
530 535 540
Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg
545 550 555 560
<210> 159
<211> 6957
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 159
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840
agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900
cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020
tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080
tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140
taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200
ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260
tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320
tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520
gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580
gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640
aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700
ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760
acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880
tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940
tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000
cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060
gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120
ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600
tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740
ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800
ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860
cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920
gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980
aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040
ttttgtttaa ctttaagaag gagatataca tatgcgttgt agcgtgtcca ccgaaaatgt 5100
gtctttctct gaaactgaaa ccgaaacgcg tcgttctgcg aactacgaac ctaacagctg 5160
ggactatgat tacctgctgt cctccgacac ggacgagtcc atcgaagtac acaaagacaa 5220
agcgaaaaag ctggaagccg aagttcgtcg cgagattaat aacgaaaaag cagaatttct 5280
gaccctgctg gaactgattg acaacgtcca gcgcctgggc ctgggttacc gtttcgagtc 5340
tgatatccgt cgtgcgctgg atcgcttcgt ttcctccggc ggcttcgatg gcgtaaccaa 5400
gacttccctg cacggtacgg cactgtcttt ccgtctgctg cgtcaacacg gttttgaggt 5460
ttctcaggaa gcgttcagcg gcttcaaaga ccaaaacggc aacttcctgg agaacctgaa 5520
ggaagatatc aaagctatcc tgagcctgta cgaggccagc ttcctggctc tggaaggcga 5580
aaacatcctg gacgaggcga aggttttcgc aatctctcat ctgaaagaac tgtctgaaga 5640
aaagatcggt aaagagctgg cagaacaggt gtcccatgca ctggaactgc cactgcatcg 5700
ccgtactcag cgtctggaag cagtatggtc tatcgaggcc taccgtaaaa aggaggacgc 5760
gaaccaggtt ctgctggagc tggcaattct ggattacaac atgatccagt ctgtatacca 5820
gcgtgatctg cgtgaaacgt cccgttggtg gcgtcgtgtg ggtctggcga ccaaactgca 5880
ctttgctcgt gaccgcctga ttgagagctt ctactgggcc gtgggtgtag cattcgaacc 5940
gcaatactcc gactgccgta actccgtcgc aaaaatgttt tctttcgtaa ccattatcga 6000
cgatatctac gatgtatacg gcaccctgga cgaactggag ctgtttactg atgcagttga 6060
gcgttgggac gtaaacgcca tcaacgacct gccggattac atgaaactgt gctttctggc 6120
tctgtataac actattaacg aaatcgccta cgacaacctg aaagataaag gtgagaacat 6180
cctgccgtat ctgaccaaag cctgggctga cctgtgcaac gctttcctgc aagaagccaa 6240
gtggctgtac aacaaatcta ctccgacctt tgacgactac ttcggcaacg catggaaatc 6300
ctcttctggc ccgctgcaac tgatcttcgc ttacttcgct gtcgtgcaga acattaaaaa 6360
ggaagagatc gaaaacctgc aaaaatacca tgacatcatc tctcgtcctt cccatatctt 6420
ccgtctgtgc aatgacctgg ctagcgcgtc tgcggaaatt gcgcgtggtg aaaccgcaaa 6480
tagcgtttct tgttacatgc gcactaaagg tatctccgaa gaactggcta ccgaaagcgt 6540
gatgaatctg atcgatgaaa cctggaaaaa gatgaacaag gaaaaactgg gtggtagcct 6600
gttcgcgaaa ccgttcgtgg aaaccgcgat caacctggca cgtcaatctc actgcactta 6660
tcataacggc gacgcgcata cctctccgga tgagctgacc cgcaaacgcg ttctgtctgt 6720
aatcactgaa ccgattctgc cgtttgaacg ctaaggatcc gaattcgagc tccgtcgaca 6780
agcttgcggc cgcactcgag caccaccacc accaccactg agatccggct gctaacaaag 6840
cccgaaagga agctgagttg gctgctgcca ccgctgagca ataactagca taaccccttg 6900
gggcctctaa acgggtcttg aggggttttt tgctgaaagg aggaactata tccggat 6957
<210> 160
<211> 560
<212> PRT
<213> Populus trichocharpa
<400> 160
Met Arg Cys Ser Val Ser Thr Glu Asn Val Ser Phe Thr Glu Thr Glu
1 5 10 15
Thr Glu Thr Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp Asp Tyr
20 25 30
Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val Tyr Lys
35 40 45
Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile Asn Asn
50 55 60
Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn Val Gln
65 70 75 80
Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Arg Ala Leu
85 90 95
Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys Thr Ser
100 105 110
Leu His Ala Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His Gly Phe
115 120 125
Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn Gly Asn
130 135 140
Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser Leu Tyr
145 150 155 160
Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp Glu Ala
165 170 175
Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu Lys Ile
180 185 190
Gly Lys Asp Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu Pro Leu
195 200 205
His Arg Arg Thr Gln Arg Leu Glu Ala Val Leu Ser Ile Glu Ala Tyr
210 215 220
Arg Lys Lys Glu Asp Ala Asp Gln Val Leu Leu Glu Leu Ala Ile Leu
225 230 235 240
Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg Glu Thr
245 250 255
Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His Phe Ala
260 265 270
Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val Ala Phe
275 280 285
Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met Phe Ser
290 295 300
Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr Leu Asp
305 310 315 320
Glu Leu Glu Leu Phe Thr Asn Ala Val Glu Arg Trp Asp Val Asn Ala
325 330 335
Ile Asp Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala Leu Tyr
340 345 350
Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Glu Lys Gly Glu
355 360 365
Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys Asn Ala
370 375 380
Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro Thr Phe
385 390 395 400
Asp Glu Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro Leu Gln
405 410 415
Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys Glu Glu
420 425 430
Ile Glu Asn Leu Gln Lys Tyr His Asp Ile Ile Ser Arg Pro Ser His
435 440 445
Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu Ile Ala
450 455 460
Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr Lys Gly
465 470 475 480
Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile Asp Glu
485 490 495
Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu Phe Ala
500 505 510
Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser His Cys
515 520 525
Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu Thr Arg
530 535 540
Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe Glu Arg
545 550 555 560
<210> 161
<211> 6963
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 161
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840
agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900
cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020
tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080
tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140
taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200
ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260
tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320
tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520
gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580
gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640
aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700
ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760
acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880
tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940
tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000
cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060
gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120
ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600
tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740
ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800
ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860
cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920
gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980
aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040
ttttgtttaa ctttaagaag gagatataca tatgcatatg cgttgtagcg tgtccaccga 5100
aaatgtgtct ttcaccgaaa ctgaaaccga aacgcgtcgt tctgcgaact acgaacctaa 5160
cagctgggac tatgattacc tgctgtcctc cgacacggac gagtccatcg aagtatacaa 5220
agacaaagcg aaaaagctgg aagccgaagt tcgtcgcgag attaataacg aaaaagcaga 5280
atttctgacc ctgctggaac tgattgacaa cgtccagcgc ctgggcctgg gttaccgttt 5340
cgagtctgat atccgtcgtg cgctggatcg cttcgtttcc tccggcggct tcgatgcggt 5400
aaccaagact tccctgcacg cgacggcact gtctttccgt ctgctgcgtc aacacggttt 5460
tgaggtttct caggaagcgt tcagcggctt caaagaccaa aacggcaact tcctggagaa 5520
cctgaaggaa gatatcaaag ctatcctgag cctgtacgag gccagcttcc tggctctgga 5580
aggcgaaaac atcctggacg aggcgaaggt tttcgcaatc tctcatctga aagaactgtc 5640
tgaagaaaag atcggtaaag atctggcaga acaggtgaac catgcactgg aactgccact 5700
gcatcgccgt actcagcgtc tggaagcagt actgtctatc gaggcctacc gtaaaaagga 5760
ggacgcggat caggttctgc tggagctggc aattctggat tacaacatga tccagtctgt 5820
ataccagcgt gatctgcgtg aaacgtcccg ttggtggcgt cgtgtgggtc tggcgaccaa 5880
actgcacttt gctcgtgacc gcctgattga gagcttctac tgggccgtgg gtgtagcatt 5940
cgaaccgcaa tactccgact gccgtaactc cgtcgcaaaa atgttttctt tcgtaaccat 6000
tatcgacgat atctacgatg tatacggcac cctggacgaa ctggagctgt ttactaacgc 6060
agttgagcgt tgggacgtaa acgccatcga cgatctgccg gattacatga aactgtgctt 6120
tctggctctg tataacacta ttaacgaaat cgcctacgac aacctgaaag aaaaaggtga 6180
gaacatcctg ccgtatctga ccaaagcctg ggctgacctg tgcaacgctt tcctgcaaga 6240
agccaagtgg ctgtacaaca aatctactcc gacctttgac gaatacttcg gcaacgcatg 6300
gaaatcctct tctggcccgc tgcaactggt gttcgcttac ttcgctgtcg tgcagaacat 6360
taaaaaggaa gagatcgaaa acctgcaaaa ataccatgac atcatctctc gtccttccca 6420
tatcttccgt ctgtgcaatg acctggctag cgcgtctgcg gaaattgcgc gtggtgaaac 6480
cgcaaatagc gtttcttgtt acatgcgcac taaaggtatc tccgaagaac tggctaccga 6540
aagcgtgatg aatctgatcg atgaaacctg gaaaaagatg aacaaggaaa aactgggtgg 6600
tagcctgttc gcgaaaccgt tcgtggaaac cgcgatcaac ctggcacgtc aatctcactg 6660
cacttatcat aacggcgacg cgcatacctc tccggatgag ctgacccgca aacgcgttct 6720
gtctgtaatc actgaaccga ttctgccgtt tgaacgctaa ggatccgaat tcgagctccg 6780
tcgacaagct tgcggccgca ctcgagcacc accaccacca ccactgagat ccggctgcta 6840
acaaagcccg aaaggaagct gagttggctg ctgccaccgc tgagcaataa ctagcataac 6900
cccttggggc ctctaaacgg gtcttgaggg gttttttgct gaaaggagga actatatccg 6960
gat 6963
<210> 162
<211> 578
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 162
Met Arg Gly Ser His His His His His His Gly Met Ala Ser Met Thr
1 5 10 15
Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys Asp
20 25 30
His Pro Phe Thr Met Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp
35 40 45
Asp Tyr Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val
50 55 60
Tyr Lys Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile
65 70 75 80
Asn Asn Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn
85 90 95
Val Gln Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Gly
100 105 110
Ala Leu Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys
115 120 125
Thr Ser Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His
130 135 140
Gly Phe Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn
145 150 155 160
Gly Asn Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser
165 170 175
Leu Tyr Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp
180 185 190
Glu Ala Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu
195 200 205
Lys Ile Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu
210 215 220
Pro Leu His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu
225 230 235 240
Ala Tyr Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala
245 250 255
Ile Leu Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg
260 265 270
Glu Thr Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His
275 280 285
Phe Ala Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val
290 295 300
Ala Phe Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met
305 310 315 320
Phe Ser Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr
325 330 335
Leu Asp Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val
340 345 350
Asn Ala Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala
355 360 365
Leu Tyr Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys
370 375 380
Gly Glu Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys
385 390 395 400
Asn Ala Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro
405 410 415
Thr Phe Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro
420 425 430
Leu Gln Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys
435 440 445
Glu Glu Ile Glu Asn Leu Gln Lys Tyr His Asp Thr Ile Ser Arg Pro
450 455 460
Ser His Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu
465 470 475 480
Ile Ala Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr
485 490 495
Lys Gly Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile
500 505 510
Asp Glu Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu
515 520 525
Phe Ala Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser
530 535 540
His Cys Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu
545 550 555 560
Thr Arg Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe
565 570 575
Glu Arg
<210> 163
<211> 7370
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 163
aagggcgagc tcaacgatcc ggctgctaac aaagcccgaa aggaagctga gttggctgct 60
gccaccgctg agcaataact agcataaccc cttggggcct ctaaacgggt cttgaggagt 120
tttttgctga aaggaggaac tatatccgga tatcccgcaa gaggcccggc agtaccggca 180
taaccaagcc tatgcctaca gcatccaggg tgacggtgcc gaggatgacg atgagcgcat 240
tgttagattt catacacggt gcctgactgc gttagcaatt taactgtgat aaactaccgc 300
attaaagctt atcgatgata agctgtcaaa catgagaatt aattcttgaa gacgaaaggg 360
cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 420
aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 480
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 540
aaggaagagt atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga 600
gaggctattc ggctatgact gggcacaact gacaatcggc tgctctgatg ccgccgtgtt 660
ccggctgtca gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct 720
gaatgaactg caggacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg 780
cgcagctgtg ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt 840
gccggggcag gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc 900
tgatgcaatg cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc 960
gaaacatcgc atcgagcggg cacgtactcg gatggaagcc ggtcttgtcg atcaggatga 1020
tctggacgaa gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg 1080
catgcccgac ggcgaggatc tcgtcgtgac acatggcgat gcctgcttgc cgaatatcat 1140
ggtggaaaat ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg 1200
ctatcaggac atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc 1260
tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta 1320
tcgccttctt gacgagttct tctgagcggg actctggggt tcgaaatgac cgaccaagcg 1380
acgcctaact gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt 1440
tttaatttaa aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt 1500
aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt 1560
gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag 1620
cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta actggcttca 1680
gcagagcgca gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca 1740
agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg 1800
ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg 1860
cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct 1920
acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga 1980
gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc 2040
ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg 2100
agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg 2160
cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt 2220
tatcccctga ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc 2280
gcagccgaac gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcctgatgc 2340
ggtattttct ccttacgcat ctgtgcggta tttcacaccg caatggtgca ctctcagtac 2400
aatctgctct gatgccgcat agttaagcca gtatacactc cgctatcgct acgtgactgg 2460
gtcatggctg cgccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 2520
ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 2580
ttttcaccgt catcaccgaa acgcgcgagg cagctgcggt aaagctcatc agcgtggtcg 2640
tgaagcgatt cacagatgtc tgcctgttca tccgcgtcca gctcgttgag tttctccaga 2700
agcgttaatg tctggcttct gataaagcgg gccatgttaa gggcggtttt ttcctgtttg 2760
gtcactgatg cctccgtgta agggggattt ctgttcatgg gggtaatgat accgatgaaa 2820
cgagagagga tgctcacgat acgggttact gatgatgaac atgcccggtt actggaacgt 2880
tgtgagggta aacaactggc ggtatggatg cggcgggacc agagaaaaat cactcagggt 2940
caatgccagc gcttcgttaa tacagatgta ggtgttccac agggtagcca gcagcatcct 3000
gcgatgcaga tccggaacat aatggtgcag ggcgctgact tccgcgtttc cagactttac 3060
gaaacacgga aaccgaagac cattcatgtt gttgctcagg tcgcagacgt tttgcagcag 3120
cagtcgcttc acgttcgctc gcgtatcggt gattcattct gctaaccagt aaggcaaccc 3180
cgccagccta gccgggtcct caacgacagg agcacgatca tgcgcacccg tggccaggac 3240
ccaacgctgc ccgagatgcg ccgcgtgcgg ctgctggaga tggcggacgc gatggatatg 3300
ttctgccaag ggttggtttg cgcattcaca gttctccgca agaattgatt ggctccaatt 3360
cttggagtgg tgaatccgtt agcgaggtgc cgccggcttc cattcaggtc gaggtggccc 3420
ggctccatgc accgcgacgc aacgcgggga ggcagacaag gtatagggcg gcgcctacaa 3480
tccatgccaa cccgttccat gtgctcgccg aggcggcata aatcgccgtg acgatcagcg 3540
gtccaatgat cgaagttagg ctggtaagag ccgcgagcga tccttgaagc tgtccctgat 3600
ggtcgtcatc tacctgcctg gacagcatgg cctgcaacgc gggcatcccg atgccgccgg 3660
aagcgagaag aatcataatg gggaaggcca tccagcctcg cgtcgcgaac gccagcaaga 3720
cgtagcccag cgcgtcggcc gccatgccgg cgataatggc ctgcttctcg ccgaaacgtt 3780
tggtggcggg accagtgacg aaggcttgag cgagggcgtg caagattccg aataccgcaa 3840
gcgacaggcc gatcatcgtc gcgctccagc gaaagcggtc ctcgccgaaa atgacccaga 3900
gcgctgccgg cacctgtcct acgagttgca tgataaagaa gacagtcata agtgcggcga 3960
cgatagtcat gccccgcgcc caccggaagg agctgactgg gttgaaggct ctcaagggca 4020
tcggtcgaga tcccggtgcc taatgagtga gctaacttac attaattgcg ttgcgctcac 4080
tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 4140
cggggagagg cggtttgcgt attgggcgcc agggtggttt ttcttttcac cagtgagacg 4200
ggcaacagct gattgccctt caccgcctgg ccctgagaga gttgcagcaa gcggtccacg 4260
ctggtttgcc ccagcaggcg aaaatcctgt ttgatggtgg ttaacggcgg gatataacat 4320
gagctgtctt cggtatcgtc gtatcccact accgagatat ccgcaccaac gcgcagcccg 4380
gactcggtaa tggcgcgcat tgcgcccagc gccatctgat cgttggcaac cagcatcgca 4440
gtgggaacga tgccctcatt cagcatttgc atggtttgtt gaaaaccgga catggcactc 4500
cagtcgcctt cccgttccgc tatcggctga atttgattgc gagtgagata tttatgccag 4560
ccagccagac gcagacgcgc cgagacagaa cttaatgggc ccgctaacag cgcgatttgc 4620
tggtgaccca atgcgaccag atgctccacg cccagtcgcg taccgtcttc atgggagaaa 4680
ataatactgt tgatgggtgt ctggtcagag acatcaagaa ataacgccgg aacattagtg 4740
caggcagctt ccacagcaat ggcatcctgg tcatccagcg gatagttaat gatcagccca 4800
ctgacgcgtt gcgcgagaag attgtgcacc gccgctttac aggcttcgac gccgcttcgt 4860
tctaccatcg acaccaccac gctggcaccc agttgatcgg cgcgagattt aatcgccgcg 4920
acaatttgcg acggcgcgtg cagggccaga ctggaggtgg caacgccaat cagcaacgac 4980
tgtttgcccg ccagttgttg tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc 5040
gcttccactt tttcccgcgt tttcgcagaa acgtggctgg cctggttcac cacgcgggaa 5100
acggtctgat aagagacacc ggcatactct gcgacatcgt ataacgttac tggtttcaca 5160
ttcaccaccc tgaattgact ctcttccggg cgctatcatg ccataccgcg aaaggttttg 5220
cgccattcga tggtgtccgg gatctcgacg ctctccctta tgcgactcct gcattaggaa 5280
gcagcccagt agtaggttga ggccgttgag caccgccgcc gcaaggaatg gtgcatgcaa 5340
ggagatggcg cccaacagtc ccccggccac ggggcctgcc accataccca cgccgaaaca 5400
agcgctcatg agcccgaagt ggcgagcccg atcttcccca tcggtgatgt cggcgatata 5460
ggcgccagca accgcacctg tggcgccggt gatgccggcc acgatgcgtc cggcgtagag 5520
gatcgagatc tcgatcccgc gaaattaata cgactcacta taggggaatt gtgagcggat 5580
aacaattccc ctctagaaat aattttgttt aactttaaga aggagatata catatgcggg 5640
gttctcatca tcatcatcat catggtatgg ctagcatgac tggtggacag caaatgggtc 5700
gggatctgta cgacgatgac gataaggatc atcccttcac catgcgtcgt tctgcgaact 5760
acgaacctaa cagctgggac tatgattacc tgctgtcctc cgacacggac gagtccatcg 5820
aagtatacaa agacaaagcg aaaaagctgg aagccgaagt tcgtcgcgag attaataacg 5880
aaaaagcaga atttctgacc ctgctggaac tgattgacaa cgtccagcgc ctgggcctgg 5940
gttaccgttt cgagtctgat atccgtggtg cgctggatcg cttcgtttcc tccggcggct 6000
tcgatgcggt aaccaagact tccctgcacg gtacggcact gtctttccgt ctgctgcgtc 6060
aacacggttt tgaggtttct caggaagcgt tcagcggctt caaagaccaa aacggcaact 6120
tcctggagaa cctgaaggaa gatatcaaag ctatcctgag cctgtacgag gccagcttcc 6180
tggctctgga aggcgaaaac atcctggacg aggcgaaggt tttcgcaatc tctcatctga 6240
aagaactgtc tgaagaaaag atcggtaaag agctggcaga acaggtgaac catgcactgg 6300
aactgccact gcatcgccgt actcagcgtc tggaagcagt atggtctatc gaggcctacc 6360
gtaaaaagga ggacgcgaat caggttctgc tggagctggc aattctggat tacaacatga 6420
tccagtctgt ataccagcgt gatctgcgtg aaacgtcccg ttggtggcgt cgtgtgggtc 6480
tggcgaccaa actgcacttt gctcgtgacc gcctgattga gagcttctac tgggccgtgg 6540
gtgtagcatt cgaaccgcaa tactccgact gccgtaactc cgtcgcaaaa atgttttctt 6600
tcgtaaccat tatcgacgat atctacgatg tatacggcac cctggacgaa ctggagctgt 6660
ttactgatgc agttgagcgt tgggacgtaa acgccatcaa cgacctgccg gattacatga 6720
aactgtgctt tctggctctg tataacacta ttaacgaaat cgcctacgac aacctgaaag 6780
ataaaggtga gaacatcctg ccgtatctga ccaaagcctg ggctgacctg tgcaacgctt 6840
tcctgcaaga agccaagtgg ctgtacaaca aatctactcc gacctttgac gactacttcg 6900
gcaacgcatg gaaatcctct tctggcccgc tgcaactggt gttcgcttac ttcgctgtcg 6960
tgcagaacat taaaaaggaa gagatcgaaa acctgcaaaa ataccatgac accatctctc 7020
gtccttccca tatcttccgt ctgtgcaatg acctggctag cgcgtctgcg gaaattgcgc 7080
gtggtgaaac cgcaaatagc gtttcttgtt acatgcgcac taaaggtatc tccgaagaac 7140
tggctaccga aagcgtgatg aatctgatcg atgaaacctg gaaaaagatg aacaaggaaa 7200
aactgggtgg tagcctgttc gcgaaaccgt tcgtggaaac cgcgatcaac ctggcacgtc 7260
aatctcactg cacttatcat aacggcgacg cgcatacctc tccggatgag ctgacccgca 7320
aacgcgttct gtctgtaatc actgaaccga ttctgccgtt tgaacgctaa 7370
<210> 164
<211> 578
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 164
Met Arg Gly Ser His His His His His His Gly Met Ala Ser Met Thr
1 5 10 15
Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys Asp
20 25 30
His Pro Phe Thr Met Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp
35 40 45
Asp Tyr Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val
50 55 60
His Lys Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile
65 70 75 80
Asn Asn Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn
85 90 95
Val Gln Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Arg
100 105 110
Ala Leu Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Gly Val Thr Lys
115 120 125
Thr Ser Leu His Gly Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His
130 135 140
Gly Phe Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn
145 150 155 160
Gly Asn Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser
165 170 175
Leu Tyr Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp
180 185 190
Glu Ala Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu
195 200 205
Lys Ile Gly Lys Glu Leu Ala Glu Gln Val Ser His Ala Leu Glu Leu
210 215 220
Pro Leu His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile Glu
225 230 235 240
Ala Tyr Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu Ala
245 250 255
Ile Leu Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg
260 265 270
Glu Thr Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His
275 280 285
Phe Ala Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val
290 295 300
Ala Phe Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met
305 310 315 320
Phe Ser Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr
325 330 335
Leu Asp Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp Val
340 345 350
Asn Ala Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala
355 360 365
Leu Tyr Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp Lys
370 375 380
Gly Glu Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys
385 390 395 400
Asn Ala Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro
405 410 415
Thr Phe Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro
420 425 430
Leu Gln Leu Ile Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys
435 440 445
Glu Glu Ile Glu Asn Leu Gln Lys Tyr His Asp Ile Ile Ser Arg Pro
450 455 460
Ser His Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu
465 470 475 480
Ile Ala Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr
485 490 495
Lys Gly Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile
500 505 510
Asp Glu Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu
515 520 525
Phe Ala Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser
530 535 540
His Cys Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu
545 550 555 560
Thr Arg Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe
565 570 575
Glu Arg
<210> 165
<211> 7370
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 165
cgtcgttctg cgaactacga acctaacagc tgggactatg attacctgct gtcctccgac 60
acggacgagt ccatcgaagt acacaaagac aaagcgaaaa agctggaagc cgaagttcgt 120
cgcgagatta ataacgaaaa agcagaattt ctgaccctgc tggaactgat tgacaacgtc 180
cagcgcctgg gcctgggtta ccgtttcgag tctgatatcc gtcgtgcgct ggatcgcttc 240
gtttcctccg gcggcttcga tggcgtaacc aagacttccc tgcacggtac ggcactgtct 300
ttccgtctgc tgcgtcaaca cggttttgag gtttctcagg aagcgttcag cggcttcaaa 360
gaccaaaacg gcaacttcct ggagaacctg aaggaagata tcaaagctat cctgagcctg 420
tacgaggcca gcttcctggc tctggaaggc gaaaacatcc tggacgaggc gaaggttttc 480
gcaatctctc atctgaaaga actgtctgaa gaaaagatcg gtaaagagct ggcagaacag 540
gtgtcccatg cactggaact gccactgcat cgccgtactc agcgtctgga agcagtatgg 600
tctatcgagg cctaccgtaa aaaggaggac gcgaaccagg ttctgctgga gctggcaatt 660
ctggattaca acatgatcca gtctgtatac cagcgtgatc tgcgtgaaac gtcccgttgg 720
tggcgtcgtg tgggtctggc gaccaaactg cactttgctc gtgaccgcct gattgagagc 780
ttctactggg ccgtgggtgt agcattcgaa ccgcaatact ccgactgccg taactccgtc 840
gcaaaaatgt tttctttcgt aaccattatc gacgatatct acgatgtata cggcaccctg 900
gacgaactgg agctgtttac tgatgcagtt gagcgttggg acgtaaacgc catcaacgac 960
ctgccggatt acatgaaact gtgctttctg gctctgtata acactattaa cgaaatcgcc 1020
tacgacaacc tgaaagataa aggtgagaac atcctgccgt atctgaccaa agcctgggct 1080
gacctgtgca acgctttcct gcaagaagcc aagtggctgt acaacaaatc tactccgacc 1140
tttgacgact acttcggcaa cgcatggaaa tcctcttctg gcccgctgca actgatcttc 1200
gcttacttcg ctgtcgtgca gaacattaaa aaggaagaga tcgaaaacct gcaaaaatac 1260
catgacatca tctctcgtcc ttcccatatc ttccgtctgt gcaatgacct ggctagcgcg 1320
tctgcggaaa ttgcgcgtgg tgaaaccgca aatagcgttt cttgttacat gcgcactaaa 1380
ggtatctccg aagaactggc taccgaaagc gtgatgaatc tgatcgatga aacctggaaa 1440
aagatgaaca aggaaaaact gggtggtagc ctgttcgcga aaccgttcgt ggaaaccgcg 1500
atcaacctgg cacgtcaatc tcactgcact tatcataacg gcgacgcgca tacctctccg 1560
gatgagctga cccgcaaacg cgttctgtct gtaatcactg aaccgattct gccgtttgaa 1620
cgctaaaagg gcgagctcaa cgatccggct gctaacaaag cccgaaagga agctgagttg 1680
gctgctgcca ccgctgagca ataactagca taaccccttg gggcctctaa acgggtcttg 1740
aggagttttt tgctgaaagg aggaactata tccggatatc ccgcaagagg cccggcagta 1800
ccggcataac caagcctatg cctacagcat ccagggtgac ggtgccgagg atgacgatga 1860
gcgcattgtt agatttcata cacggtgcct gactgcgtta gcaatttaac tgtgataaac 1920
taccgcatta aagcttatcg atgataagct gtcaaacatg agaattaatt cttgaagacg 1980
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 2040
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 2100
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 2160
ttgaaaaagg aagagtatga ttgaacaaga tggattgcac gcaggttctc cggccgcttg 2220
ggtggagagg ctattcggct atgactgggc acaactgaca atcggctgct ctgatgccgc 2280
cgtgttccgg ctgtcagcgc aggggcgccc ggttcttttt gtcaagaccg acctgtccgg 2340
tgccctgaat gaactgcagg acgaggcagc gcggctatcg tggctggcca cgacgggcgt 2400
tccttgcgca gctgtgctcg acgttgtcac tgaagcggga agggactggc tgctattggg 2460
cgaagtgccg gggcaggatc tcctgtcatc tcaccttgct cctgccgaga aagtatccat 2520
catggctgat gcaatgcggc ggctgcatac gcttgatccg gctacctgcc cattcgacca 2580
ccaagcgaaa catcgcatcg agcgggcacg tactcggatg gaagccggtc ttgtcgatca 2640
ggatgatctg gacgaagagc atcaggggct cgcgccagcc gaactgttcg ccaggctcaa 2700
ggcgcgcatg cccgacggcg aggatctcgt cgtgacacat ggcgatgcct gcttgccgaa 2760
tatcatggtg gaaaatggcc gcttttctgg attcatcgac tgtggccggc tgggtgtggc 2820
ggaccgctat caggacatag cgttggctac ccgtgatatt gctgaagagc ttggcggcga 2880
atgggctgac cgcttcctcg tgctttacgg tatcgccgct cccgattcgc agcgcatcgc 2940
cttctatcgc cttcttgacg agttcttctg agcgggactc tggggttcga aatgaccgac 3000
caagcgacgc ctaactgtca gaccaagttt actcatatat actttagatt gatttaaaac 3060
ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa 3120
tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat 3180
cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc 3240
taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg 3300
gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag ttaggccacc 3360
acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg 3420
ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg 3480
ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa 3540
cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg 3600
aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga 3660
gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct 3720
gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca 3780
gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc 3840
ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg 3900
ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc 3960
tgatgcggta ttttctcctt acgcatctgt gcggtatttc acaccgcaat ggtgcactct 4020
cagtacaatc tgctctgatg ccgcatagtt aagccagtat acactccgct atcgctacgt 4080
gactgggtca tggctgcgcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct 4140
tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt 4200
cagaggtttt caccgtcatc accgaaacgc gcgaggcagc tgcggtaaag ctcatcagcg 4260
tggtcgtgaa gcgattcaca gatgtctgcc tgttcatccg cgtccagctc gttgagtttc 4320
tccagaagcg ttaatgtctg gcttctgata aagcgggcca tgttaagggc ggttttttcc 4380
tgtttggtca ctgatgcctc cgtgtaaggg ggatttctgt tcatgggggt aatgataccg 4440
atgaaacgag agaggatgct cacgatacgg gttactgatg atgaacatgc ccggttactg 4500
gaacgttgtg agggtaaaca actggcggta tggatgcggc gggaccagag aaaaatcact 4560
cagggtcaat gccagcgctt cgttaataca gatgtaggtg ttccacaggg tagccagcag 4620
catcctgcga tgcagatccg gaacataatg gtgcagggcg ctgacttccg cgtttccaga 4680
ctttacgaaa cacggaaacc gaagaccatt catgttgttg ctcaggtcgc agacgttttg 4740
cagcagcagt cgcttcacgt tcgctcgcgt atcggtgatt cattctgcta accagtaagg 4800
caaccccgcc agcctagccg ggtcctcaac gacaggagca cgatcatgcg cacccgtggc 4860
caggacccaa cgctgcccga gatgcgccgc gtgcggctgc tggagatggc ggacgcgatg 4920
gatatgttct gccaagggtt ggtttgcgca ttcacagttc tccgcaagaa ttgattggct 4980
ccaattcttg gagtggtgaa tccgttagcg aggtgccgcc ggcttccatt caggtcgagg 5040
tggcccggct ccatgcaccg cgacgcaacg cggggaggca gacaaggtat agggcggcgc 5100
ctacaatcca tgccaacccg ttccatgtgc tcgccgaggc ggcataaatc gccgtgacga 5160
tcagcggtcc aatgatcgaa gttaggctgg taagagccgc gagcgatcct tgaagctgtc 5220
cctgatggtc gtcatctacc tgcctggaca gcatggcctg caacgcgggc atcccgatgc 5280
cgccggaagc gagaagaatc ataatgggga aggccatcca gcctcgcgtc gcgaacgcca 5340
gcaagacgta gcccagcgcg tcggccgcca tgccggcgat aatggcctgc ttctcgccga 5400
aacgtttggt ggcgggacca gtgacgaagg cttgagcgag ggcgtgcaag attccgaata 5460
ccgcaagcga caggccgatc atcgtcgcgc tccagcgaaa gcggtcctcg ccgaaaatga 5520
cccagagcgc tgccggcacc tgtcctacga gttgcatgat aaagaagaca gtcataagtg 5580
cggcgacgat agtcatgccc cgcgcccacc ggaaggagct gactgggttg aaggctctca 5640
agggcatcgg tcgagatccc ggtgcctaat gagtgagcta acttacatta attgcgttgc 5700
gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 5760
aacgcgcggg gagaggcggt ttgcgtattg ggcgccaggg tggtttttct tttcaccagt 5820
gagacgggca acagctgatt gcccttcacc gcctggccct gagagagttg cagcaagcgg 5880
tccacgctgg tttgccccag caggcgaaaa tcctgtttga tggtggttaa cggcgggata 5940
taacatgagc tgtcttcggt atcgtcgtat cccactaccg agatatccgc accaacgcgc 6000
agcccggact cggtaatggc gcgcattgcg cccagcgcca tctgatcgtt ggcaaccagc 6060
atcgcagtgg gaacgatgcc ctcattcagc atttgcatgg tttgttgaaa accggacatg 6120
gcactccagt cgccttcccg ttccgctatc ggctgaattt gattgcgagt gagatattta 6180
tgccagccag ccagacgcag acgcgccgag acagaactta atgggcccgc taacagcgcg 6240
atttgctggt gacccaatgc gaccagatgc tccacgccca gtcgcgtacc gtcttcatgg 6300
gagaaaataa tactgttgat gggtgtctgg tcagagacat caagaaataa cgccggaaca 6360
ttagtgcagg cagcttccac agcaatggca tcctggtcat ccagcggata gttaatgatc 6420
agcccactga cgcgttgcgc gagaagattg tgcaccgccg ctttacaggc ttcgacgccg 6480
cttcgttcta ccatcgacac caccacgctg gcacccagtt gatcggcgcg agatttaatc 6540
gccgcgacaa tttgcgacgg cgcgtgcagg gccagactgg aggtggcaac gccaatcagc 6600
aacgactgtt tgcccgccag ttgttgtgcc acgcggttgg gaatgtaatt cagctccgcc 6660
atcgccgctt ccactttttc ccgcgttttc gcagaaacgt ggctggcctg gttcaccacg 6720
cgggaaacgg tctgataaga gacaccggca tactctgcga catcgtataa cgttactggt 6780
ttcacattca ccaccctgaa ttgactctct tccgggcgct atcatgccat accgcgaaag 6840
gttttgcgcc attcgatggt gtccgggatc tcgacgctct cccttatgcg actcctgcat 6900
taggaagcag cccagtagta ggttgaggcc gttgagcacc gccgccgcaa ggaatggtgc 6960
atgcaaggag atggcgccca acagtccccc ggccacgggg cctgccacca tacccacgcc 7020
gaaacaagcg ctcatgagcc cgaagtggcg agcccgatct tccccatcgg tgatgtcggc 7080
gatataggcg ccagcaaccg cacctgtggc gccggtgatg ccggccacga tgcgtccggc 7140
gtagaggatc gagatctcga tcccgcgaaa ttaatacgac tcactatagg ggaattgtga 7200
gcggataaca attcccctct agaaataatt ttgtttaact ttaagaagga gatatacata 7260
tgcggggttc tcatcatcat catcatcatg gtatggctag catgactggt ggacagcaaa 7320
tgggtcggga tctgtacgac gatgacgata aggatcatcc cttcaccatg 7370
<210> 166
<211> 578
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 166
Met Arg Gly Ser His His His His His His Gly Met Ala Ser Met Thr
1 5 10 15
Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys Asp
20 25 30
His Pro Phe Thr Met Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser Trp
35 40 45
Asp Tyr Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu Val
50 55 60
Tyr Lys Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu Ile
65 70 75 80
Asn Asn Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp Asn
85 90 95
Val Gln Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg Arg
100 105 110
Ala Leu Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr Lys
115 120 125
Thr Ser Leu His Ala Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln His
130 135 140
Gly Phe Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln Asn
145 150 155 160
Gly Asn Phe Leu Glu Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu Ser
165 170 175
Leu Tyr Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu Asp
180 185 190
Glu Ala Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu Glu
195 200 205
Lys Ile Gly Lys Asp Leu Ala Glu Gln Val Asn His Ala Leu Glu Leu
210 215 220
Pro Leu His Arg Arg Thr Gln Arg Leu Glu Ala Val Leu Ser Ile Glu
225 230 235 240
Ala Tyr Arg Lys Lys Glu Asp Ala Asp Gln Val Leu Leu Glu Leu Ala
245 250 255
Ile Leu Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu Arg
260 265 270
Glu Thr Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu His
275 280 285
Phe Ala Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly Val
290 295 300
Ala Phe Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys Met
305 310 315 320
Phe Ser Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly Thr
325 330 335
Leu Asp Glu Leu Glu Leu Phe Thr Asn Ala Val Glu Arg Trp Asp Val
340 345 350
Asn Ala Ile Asp Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu Ala
355 360 365
Leu Tyr Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Glu Lys
370 375 380
Gly Glu Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu Cys
385 390 395 400
Asn Ala Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr Pro
405 410 415
Thr Phe Asp Glu Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly Pro
420 425 430
Leu Gln Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys Lys
435 440 445
Glu Glu Ile Glu Asn Leu Gln Lys Tyr His Asp Ile Ile Ser Arg Pro
450 455 460
Ser His Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala Glu
465 470 475 480
Ile Ala Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg Thr
485 490 495
Lys Gly Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu Ile
500 505 510
Asp Glu Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser Leu
515 520 525
Phe Ala Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln Ser
530 535 540
His Cys Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu Leu
545 550 555 560
Thr Arg Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro Phe
565 570 575
Glu Arg
<210> 167
<211> 7370
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 167
cgtcgttctg cgaactacga acctaacagc tgggactatg attacctgct gtcctccgac 60
acggacgagt ccatcgaagt atacaaagac aaagcgaaaa agctggaagc cgaagttcgt 120
cgcgagatta ataacgaaaa agcagaattt ctgaccctgc tggaactgat tgacaacgtc 180
cagcgcctgg gcctgggtta ccgtttcgag tctgatatcc gtcgtgcgct ggatcgcttc 240
gtttcctccg gcggcttcga tgcggtaacc aagacttccc tgcacgcgac ggcactgtct 300
ttccgtctgc tgcgtcaaca cggttttgag gtttctcagg aagcgttcag cggcttcaaa 360
gaccaaaacg gcaacttcct ggagaacctg aaggaagata tcaaagctat cctgagcctg 420
tacgaggcca gcttcctggc tctggaaggc gaaaacatcc tggacgaggc gaaggttttc 480
gcaatctctc atctgaaaga actgtctgaa gaaaagatcg gtaaagatct ggcagaacag 540
gtgaaccatg cactggaact gccactgcat cgccgtactc agcgtctgga agcagtactg 600
tctatcgagg cctaccgtaa aaaggaggac gcggatcagg ttctgctgga gctggcaatt 660
ctggattaca acatgatcca gtctgtatac cagcgtgatc tgcgtgaaac gtcccgttgg 720
tggcgtcgtg tgggtctggc gaccaaactg cactttgctc gtgaccgcct gattgagagc 780
ttctactggg ccgtgggtgt agcattcgaa ccgcaatact ccgactgccg taactccgtc 840
gcaaaaatgt tttctttcgt aaccattatc gacgatatct acgatgtata cggcaccctg 900
gacgaactgg agctgtttac taacgcagtt gagcgttggg acgtaaacgc catcgacgat 960
ctgccggatt acatgaaact gtgctttctg gctctgtata acactattaa cgaaatcgcc 1020
tacgacaacc tgaaagaaaa aggtgagaac atcctgccgt atctgaccaa agcctgggct 1080
gacctgtgca acgctttcct gcaagaagcc aagtggctgt acaacaaatc tactccgacc 1140
tttgacgaat acttcggcaa cgcatggaaa tcctcttctg gcccgctgca actggtgttc 1200
gcttacttcg ctgtcgtgca gaacattaaa aaggaagaga tcgaaaacct gcaaaaatac 1260
catgacatca tctctcgtcc ttcccatatc ttccgtctgt gcaatgacct ggctagcgcg 1320
tctgcggaaa ttgcgcgtgg tgaaaccgca aatagcgttt cttgttacat gcgcactaaa 1380
ggtatctccg aagaactggc taccgaaagc gtgatgaatc tgatcgatga aacctggaaa 1440
aagatgaaca aggaaaaact gggtggtagc ctgttcgcga aaccgttcgt ggaaaccgcg 1500
atcaacctgg cacgtcaatc tcactgcact tatcataacg gcgacgcgca tacctctccg 1560
gatgagctga cccgcaaacg cgttctgtct gtaatcactg aaccgattct gccgtttgaa 1620
cgctaaaagg gcgagctcaa cgatccggct gctaacaaag cccgaaagga agctgagttg 1680
gctgctgcca ccgctgagca ataactagca taaccccttg gggcctctaa acgggtcttg 1740
aggagttttt tgctgaaagg aggaactata tccggatatc ccgcaagagg cccggcagta 1800
ccggcataac caagcctatg cctacagcat ccagggtgac ggtgccgagg atgacgatga 1860
gcgcattgtt agatttcata cacggtgcct gactgcgtta gcaatttaac tgtgataaac 1920
taccgcatta aagcttatcg atgataagct gtcaaacatg agaattaatt cttgaagacg 1980
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 2040
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 2100
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 2160
ttgaaaaagg aagagtatga ttgaacaaga tggattgcac gcaggttctc cggccgcttg 2220
ggtggagagg ctattcggct atgactgggc acaactgaca atcggctgct ctgatgccgc 2280
cgtgttccgg ctgtcagcgc aggggcgccc ggttcttttt gtcaagaccg acctgtccgg 2340
tgccctgaat gaactgcagg acgaggcagc gcggctatcg tggctggcca cgacgggcgt 2400
tccttgcgca gctgtgctcg acgttgtcac tgaagcggga agggactggc tgctattggg 2460
cgaagtgccg gggcaggatc tcctgtcatc tcaccttgct cctgccgaga aagtatccat 2520
catggctgat gcaatgcggc ggctgcatac gcttgatccg gctacctgcc cattcgacca 2580
ccaagcgaaa catcgcatcg agcgggcacg tactcggatg gaagccggtc ttgtcgatca 2640
ggatgatctg gacgaagagc atcaggggct cgcgccagcc gaactgttcg ccaggctcaa 2700
ggcgcgcatg cccgacggcg aggatctcgt cgtgacacat ggcgatgcct gcttgccgaa 2760
tatcatggtg gaaaatggcc gcttttctgg attcatcgac tgtggccggc tgggtgtggc 2820
ggaccgctat caggacatag cgttggctac ccgtgatatt gctgaagagc ttggcggcga 2880
atgggctgac cgcttcctcg tgctttacgg tatcgccgct cccgattcgc agcgcatcgc 2940
cttctatcgc cttcttgacg agttcttctg agcgggactc tggggttcga aatgaccgac 3000
caagcgacgc ctaactgtca gaccaagttt actcatatat actttagatt gatttaaaac 3060
ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa 3120
tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat 3180
cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc 3240
taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg 3300
gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag ttaggccacc 3360
acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg 3420
ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg 3480
ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa 3540
cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg 3600
aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga 3660
gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct 3720
gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca 3780
gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc 3840
ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg 3900
ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc 3960
tgatgcggta ttttctcctt acgcatctgt gcggtatttc acaccgcaat ggtgcactct 4020
cagtacaatc tgctctgatg ccgcatagtt aagccagtat acactccgct atcgctacgt 4080
gactgggtca tggctgcgcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct 4140
tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt 4200
cagaggtttt caccgtcatc accgaaacgc gcgaggcagc tgcggtaaag ctcatcagcg 4260
tggtcgtgaa gcgattcaca gatgtctgcc tgttcatccg cgtccagctc gttgagtttc 4320
tccagaagcg ttaatgtctg gcttctgata aagcgggcca tgttaagggc ggttttttcc 4380
tgtttggtca ctgatgcctc cgtgtaaggg ggatttctgt tcatgggggt aatgataccg 4440
atgaaacgag agaggatgct cacgatacgg gttactgatg atgaacatgc ccggttactg 4500
gaacgttgtg agggtaaaca actggcggta tggatgcggc gggaccagag aaaaatcact 4560
cagggtcaat gccagcgctt cgttaataca gatgtaggtg ttccacaggg tagccagcag 4620
catcctgcga tgcagatccg gaacataatg gtgcagggcg ctgacttccg cgtttccaga 4680
ctttacgaaa cacggaaacc gaagaccatt catgttgttg ctcaggtcgc agacgttttg 4740
cagcagcagt cgcttcacgt tcgctcgcgt atcggtgatt cattctgcta accagtaagg 4800
caaccccgcc agcctagccg ggtcctcaac gacaggagca cgatcatgcg cacccgtggc 4860
caggacccaa cgctgcccga gatgcgccgc gtgcggctgc tggagatggc ggacgcgatg 4920
gatatgttct gccaagggtt ggtttgcgca ttcacagttc tccgcaagaa ttgattggct 4980
ccaattcttg gagtggtgaa tccgttagcg aggtgccgcc ggcttccatt caggtcgagg 5040
tggcccggct ccatgcaccg cgacgcaacg cggggaggca gacaaggtat agggcggcgc 5100
ctacaatcca tgccaacccg ttccatgtgc tcgccgaggc ggcataaatc gccgtgacga 5160
tcagcggtcc aatgatcgaa gttaggctgg taagagccgc gagcgatcct tgaagctgtc 5220
cctgatggtc gtcatctacc tgcctggaca gcatggcctg caacgcgggc atcccgatgc 5280
cgccggaagc gagaagaatc ataatgggga aggccatcca gcctcgcgtc gcgaacgcca 5340
gcaagacgta gcccagcgcg tcggccgcca tgccggcgat aatggcctgc ttctcgccga 5400
aacgtttggt ggcgggacca gtgacgaagg cttgagcgag ggcgtgcaag attccgaata 5460
ccgcaagcga caggccgatc atcgtcgcgc tccagcgaaa gcggtcctcg ccgaaaatga 5520
cccagagcgc tgccggcacc tgtcctacga gttgcatgat aaagaagaca gtcataagtg 5580
cggcgacgat agtcatgccc cgcgcccacc ggaaggagct gactgggttg aaggctctca 5640
agggcatcgg tcgagatccc ggtgcctaat gagtgagcta acttacatta attgcgttgc 5700
gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 5760
aacgcgcggg gagaggcggt ttgcgtattg ggcgccaggg tggtttttct tttcaccagt 5820
gagacgggca acagctgatt gcccttcacc gcctggccct gagagagttg cagcaagcgg 5880
tccacgctgg tttgccccag caggcgaaaa tcctgtttga tggtggttaa cggcgggata 5940
taacatgagc tgtcttcggt atcgtcgtat cccactaccg agatatccgc accaacgcgc 6000
agcccggact cggtaatggc gcgcattgcg cccagcgcca tctgatcgtt ggcaaccagc 6060
atcgcagtgg gaacgatgcc ctcattcagc atttgcatgg tttgttgaaa accggacatg 6120
gcactccagt cgccttcccg ttccgctatc ggctgaattt gattgcgagt gagatattta 6180
tgccagccag ccagacgcag acgcgccgag acagaactta atgggcccgc taacagcgcg 6240
atttgctggt gacccaatgc gaccagatgc tccacgccca gtcgcgtacc gtcttcatgg 6300
gagaaaataa tactgttgat gggtgtctgg tcagagacat caagaaataa cgccggaaca 6360
ttagtgcagg cagcttccac agcaatggca tcctggtcat ccagcggata gttaatgatc 6420
agcccactga cgcgttgcgc gagaagattg tgcaccgccg ctttacaggc ttcgacgccg 6480
cttcgttcta ccatcgacac caccacgctg gcacccagtt gatcggcgcg agatttaatc 6540
gccgcgacaa tttgcgacgg cgcgtgcagg gccagactgg aggtggcaac gccaatcagc 6600
aacgactgtt tgcccgccag ttgttgtgcc acgcggttgg gaatgtaatt cagctccgcc 6660
atcgccgctt ccactttttc ccgcgttttc gcagaaacgt ggctggcctg gttcaccacg 6720
cgggaaacgg tctgataaga gacaccggca tactctgcga catcgtataa cgttactggt 6780
ttcacattca ccaccctgaa ttgactctct tccgggcgct atcatgccat accgcgaaag 6840
gttttgcgcc attcgatggt gtccgggatc tcgacgctct cccttatgcg actcctgcat 6900
taggaagcag cccagtagta ggttgaggcc gttgagcacc gccgccgcaa ggaatggtgc 6960
atgcaaggag atggcgccca acagtccccc ggccacgggg cctgccacca tacccacgcc 7020
gaaacaagcg ctcatgagcc cgaagtggcg agcccgatct tccccatcgg tgatgtcggc 7080
gatataggcg ccagcaaccg cacctgtggc gccggtgatg ccggccacga tgcgtccggc 7140
gtagaggatc gagatctcga tcccgcgaaa ttaatacgac tcactatagg ggaattgtga 7200
gcggataaca attcccctct agaaataatt ttgtttaact ttaagaagga gatatacata 7260
tgcggggttc tcatcatcat catcatcatg gtatggctag catgactggt ggacagcaaa 7320
tgggtcggga tctgtacgac gatgacgata aggatcatcc cttcaccatg 7370
Claims (53)
- 단리된 포플러 (poplar) 이소프렌 신타아제 변이체로서, 상기 변이체는 이소프렌 신타아제 N-말단 부위의 절단을 포함하는 변이체.
- 제 1 항에 있어서, 상기 이소프렌 신타아제 변이체가 전장 이소프렌 신타아제와 비교시 증가된 특이 활성을 갖는 단리된 포플러 이소프렌 신타아제 변이체.
- 제 1 항에 있어서, 상기 이소프렌 신타아제가 SEQ ID NO:120 의 P. alba 이소프렌 신타아제인 단리된 포플러 이소프렌 신타아제 변이체.
- 제 3 항에 있어서, 상기 변이체가 하기로 이루어진 군으로부터 선택되는 단리된 포플러 이소프렌 신타아제 변이체: MEA 변이체 (SEQ ID NO:122), MSV 변이체 (SEQ ID NO:124), MVS 변이체 (SEQ ID NO:126), MTE 변이체 (SEQ ID NO:128), MNV 변이체 (SEQ ID NO:130).
- 제 4 항에 있어서, 상기 변이체가 MEA 변이체 (SEQ ID NO:122) 인 단리된 포플러 이소프렌 신타아제 변이체.
- 제 3 항에 있어서, 상기 변이체가 하기로 이루어진 군으로부터 선택되는 단리된 포플러 이소프렌 신타아제 변이체: TRC (-3) 변이체 (SEQ ID NO:136), TRC (-4) 변이체 (SEQ ID NO:138), TRC (-5) 변이체 (SEQ ID NO:140), TRC (-6) 변이체 (SEQ ID NO:142) 및 TRC (-7) 변이체 (SEQ ID NO:144).
- 제 1 항에 있어서, 상기 변이체가 P. tremuloides 이소프렌 신타아제의 MET 변이체 (SEQ ID NO:146) 인 단리된 포플러 이소프렌 신타아제 변이체.
- 제 1 항에 있어서, 상기 변이체가 P. trichocharpa 이소프렌 신타아제의 MET 변이체 (SEQ ID NO:148) 인 단리된 포플러 이소프렌 신타아제 변이체.
- 단리된 포플러 이소프렌 신타아제 변이체로서, 상기 변이체가 야생형 이소프렌 신타아제의 하나 이상의 아미노산 잔기의 치환을 포함하고; 이때 이소프렌 신타아제 변이체는 야생형 이소프렌 신타아제와 비교시 증가된 이소프렌 신타아제 활성을 갖는 변이체.
- 제 9 항에 있어서, 상기 증가된 이소프렌 신타아제 활성이, 모체 이소프렌 신타아제를 포함하는 숙주 세포와 비교시, 디메틸알릴 피로포스페이트 (DMAPP) 의 존재하에서 더 신속한 속도로 성장하는 이소프렌 변이체를 포함하는 숙주 세포에 의해 나타내어지는 변이체.
- 제 9 항에 있어서, 상기 이소프렌 신타아제가 SEQ ID NO:120 의 P. alba 이소프렌 신타아제인 단리된 포플러 이소프렌 신타아제 변이체.
- 제 11 항에 있어서, 상기 변이체가 하기로 이루어진 군으로부터 선택되는 하나 이상의 아미노산 치환을 포함하는 단리된 포플러 이소프렌 신타아제 변이체: V10M, F12S, T15A, E18G, V58I, V58F, L70Q, L70V, L70T, T71P, V79L, E89D, G94A, S119F, F120L, G127R, E175V, T212I, S257A, R262G, A266G, F280L, N297K, F305L, L319M, E323K, A328T, D342E, A359T, K366N, E368D, L374M, S396T, V418S, K438N, H440R, T442I, T442A, I449V, A469S, K500R, K505Q, G507S, S509N, F511Y, 및 N532K.
- 제 11 항에 있어서, 적어도 하나의 아미노산 치환이 L70R 치환인 단리된 포플러 이소프렌 신타아제 변이체.
- 제 11 항에 있어서, 상기 변이체가 하기로 이루어진 군으로부터 선택되는 하나 이상의 아미노산 치환을 포함하는 단리된 포플러 이소프렌 신타아제 변이체: G127R/F511Y, L70Q/G94A/R262G/F305L, F12S/T15A/E18G/N297K, S396T/T442I, V10M/E323K, F120L/A266G, K438N/K500R, V79L/S509N, E175V/S257A/E368D/A469S, T71P/L374M, F280L/H440R, E89D/H440R, V58F/A328T/N532K, S119F/D342E/I449V, 및 K366N/G507S.
- SEQ ID NO:120 (도 19) 의 아미노산 잔기를 포함하는 폴리펩티드의 결정질 형태.
- 하기를 포함하는, 이소프렌의 생성 방법: (a) 이소프렌 신타아제 변이체를 인코딩하는 폴리뉴클레오티드 서열을 포함하는 발현 벡터를 포함하는 숙주 세포를 제공함; 및 (b) 상기 숙주 세포를 이소프렌 생성에 적합한 조건 하에서 배양함.
- 제 16 항에 있어서, (c) 이소프렌을 회수함을 추가로 포함하는 방법.
- 제 17 항에 있어서, (d) 이소프렌을 중합화함을 추가로 포함하는 방법.
- 하기를 포함하는, 이소프렌 신타아제 활성의 검출 방법: (a) 이소프렌 신타아제 변이체를 생성하기에 적합한 조건 하에서 발현 벡터를 포함하는 숙주 세포를 배양함; (b) 상기 숙주 세포를 리소자임을 포함하는 분해 버퍼로 분해하여 세포 분해물을 생성함; 및 (c) 상기 세포 분해물 내 이소프렌 신타아제 활성을 디메틸알릴 디포스페이트 (DMAPP) 로부터의 이소프렌 생성을 측정함으로써 검출함.
- 제 19 항에 있어서, 상기 숙주 세포가 그람-양성 박테리아 세포, 그람-음성 박테리아 세포, 사상 진균 세포, 및 효모 세포로 이루어진 군으로부터 선택되는 방법.
- 제 19 항에 있어서, 상기 숙주 세포가 에스케리키아 종 (대장균), 판테오아 종 (P. 시트레아 ), 바실러스 종 (B. 서브틸리스 ), 야로위아 종 (Y. 리포리티카 ), 및 트리코데르마 (T. 리세이 ) 로 이루어진 군으로부터 선택되는 방법.
- 제 19 항에 있어서, 상기 숙주 세포가 글루코오스, 글리세롤, 글리세린, 디히드록시아세톤, 효모 추출물, 바이오매스, 당질, 수크로오스, 및 오일로 이루어진 군으로부터 선택되는 탄소 공급원을 포함하는 배지에서 배양되는 방법.
- 하기를 포함하는 고처리량 스크리닝으로 다수의 샘플 내 이소프렌의 검출 방법:
(a) i) 각각 이소프렌 신타아제를 포함하는 다수의 샘플; ii) 다수의 웰을 포함하는 유리 플레이트; 및 iii) 유리 플레이트용 밀봉제를 제공함;
(b) 유리 플레이트의 다수의 웰에 다수의 샘플을 넣음;
(c) 유리 플레이트를 밀봉제로 밀봉하여, 다수의 웰 각각 내 샘플과 연관있는 상부공간을 갖는 밀봉된 유리 플레이트를 만듦;
(d) 이소프렌 신타아제가 활성인 조건 하에서 유리 플레이트를 인큐베이션함; 및
(e) 상부공간 내 이소프렌을 검출함. - 제 23 항에서, 상기 이소프렌을 기체 크로마토그래피-질량 분광법 (GS-MS) 로 검출하는 방법.
- 제 23 항에 있어서, 상기 다수의 샘플이 프로모터와 작동가능하게 조합된 이소프렌 신타아제 변이체를 인코딩하는 폴리뉴클레오티드 서열을 포함하는 발현 벡터를 포함하는 숙주 세포를 포함하는 방법.
- 제 23 항에 있어서, 상기 다수의 샘플이 숙주 세포의 분해물, 리소자임, 및 디메틸알릴 디포스페이트 (DMAPP) 를 포함하는 방법.
- 제 23 항에 있어서, 상기 유리 플레이트가 딥-웰 유리 블록인 방법.
- 제 23 항에 있어서, 상기 다수의 웰이 24 개 이상의 웰을 포함하는 방법.
- 제 23 항에 있어서, 상기 다수의 웰 각각이 2 ml 이하의 부피를 포함하는 방법.
- 프로모터와 작동적으로 조합된 이소프렌 신타아제 변이체를 인코딩하는 이종 폴리뉴클레오티드 서열을 포함하는 숙주 세포로서, 상기 이소프렌 신타아제 변이체는 포플러 이소프렌 신타아제의 하나 이상 (1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10) 의 잔기에 상응하는 위치에서 치환을 포함하는 숙주 세포.
- 제 30 항에 있어서, 상기 이소프렌 신타아제가 SEQ ID NO:120 의 P. alba 이소프렌 신타아제인 숙주 세포.
- 제 31 항에 있어서, 상기 변이체가 하기로 이루어진 군으로부터 선택되는 숙주 세포: MEA 변이체 (SEQ ID NO:122), MSV 변이체 (SEQ ID NO:124), MVS 변이체 (SEQ ID NO:126), MTE 변이체 (SEQ ID NO:128), MNV 변이체 (SEQ ID NO:130).
- 제 31 항에 있어서, 상기 변이체가 하기로 이루어진 군으로부터 선택되는 숙주 세포: TRC (-3) 변이체 (SEQ ID NO:136), TRC (-4) 변이체 (SEQ ID NO:138), TRC (-5) 변이체 (SEQ ID NO:140), TRC (-6) 변이체 (SEQ ID NO:142) 및 TRC (-7) 변이체 (SEQ ID NO:144).
- 제 30 항에 있어서, 상기 변이체가 P. tremuloides 이소프렌 신타아제의 MET 변이체 (SEQ ID NO:146) 인 숙주 세포.
- 제 30 항에 있어서, 상기 변이체가 P. trichocharpa 이소프렌 신타아제의 MET 변이체 (SEQ ID NO:148) 인 숙주 세포.
- 제 31 항에 있어서, 상기 변이체가 하기로 이루어진 군으로부터 선택되는 하나 이상의 아미노산 치환을 포함하는 숙주 세포: V10M, F12S, T15A, E18G, V58I, V58F, L70Q, L70V, L70T, T71P, V79L, E89D, G94A, S119F, F120L, G127R, E175V, T212I, S257A, R262G, A266G, F280L, N297K, F305L, L319M, E323K, A328T, D342E, A359T, K366N, E368D, L374M, S396T, V418S, K438N, H440R, T442I, T442A, I449V, A469S, K500R, K505Q, G507S, S509N, F511Y, 및 N532K.
- 제 36 항에 있어서, 적어도 하나의 아미노산 치환이 L70R 치환인 숙주 세포.
- 제 31 항에 있어서, 상기 변이체가 하기로 이루어진 군으로부터 선택되는 하나 이상의 아미노산 치환을 포함하는 숙주 세포: G127R/F511Y, L70Q/G94A/R262G/F305L, F12S/T15A/E18G/N297K, S396T/T442I, V10M/E323K, F120L/A266G, K438N/K500R, V79L/S509N, E175V/S257A/E368D/A469S, T71P/L374M, F280L/H440R, E89D/H440R, V58F/A328T/N532K, S119F/D342E/I449V, 및 K366N/G507S.
- 제 30 항에 있어서, 상기 폴리뉴클레오티드 서열이 플라스미드 내에 함유되는 숙주 세포.
- 제 39 항에 있어서, 상기 폴리뉴클레오티드 서열이 숙주 세포의 염색체에 혼입되는 숙주 세포.
- 제 30 항에 있어서, 상기 숙주가 그람-양성 박테리아 세포, 그람-음성 박테리아 세포, 사상 진균 세포, 및 효모 세포로 이루어진 군으로부터 선택되는 숙주 세포.
- 제 30 항에 있어서, 상기 숙주가 에스케리키아 종 (대장균), 판테오아 종 (P. 시트레아 ), 바실러스 종 (B. 서브틸리스 ), 야로위아 종 (Y. 리포리티카 ), 및 트리코데르마 (T. 리세이 ) 로 이루어진 군으로부터 선택되는 숙주 세포.
- 제 30 항에 있어서, 상기 숙주 세포가 글루코오스, 글리세롤, 글리세린, 디히드록시아세톤, 효모 추출물, 바이오매스, 당질, 수크로오스, 및 오일로 이루어진 군으로부터 선택되는 탄소 공급원을 포함하는 배지에서 배양되는 숙주 세포.
- 제 30 항에 있어서, 상기 숙주 세포가 임의로는 천연형 DXP 경로와 조합되는, IDI 폴리펩티드를 인코딩하는 이종 또는 천연형 핵산 및/또는 DXS 폴리펩티드를 인코딩하는 이종 또는 천연형 핵산을 추가로 포함하는 숙주 세포.
- 제 30 항에 있어서, 상기 숙주 세포가 IDI 폴리펩티드 및 DXS 폴리펩티드를 인코딩하는 하나 이상의 핵산을 추가로 포함하는 숙주 세포.
- 제 30 항에 있어서, 상기 숙주 세포가 이소프렌 신타아제 변이체, IDI 폴리펩티드, 및 DXS 폴리펩티드를 인코딩하는 하나의 벡터를 포함하는 숙주 세포.
- 제 46 항에 있어서, 상기 숙주 세포가 사카로마이세스 세레비시아 및 엔테로 코커스 패칼리스로부터의 MVA 경로 폴리펩티드로 이루어진 군으로부터 선택되는 MVA 경로 폴리펩티드를 인코딩하는 이종 핵산을 추가로 포함하는 숙주 세포.
- 제 30 항에 있어서, 상기 숙주 세포가 MVA 경로 폴리펩티드 및 DXS 폴리펩티드를 인코딩하는 하나 이상의 핵산을 추가로 포함하고, 이때 하나의 벡터가 이소프렌 신타아제 변이체, MVA 경로 폴리펩티드, 및 DXS 폴리펩티드를 인코딩하는 숙주 세포.
- 제 48 항에 있어서, 상기 숙주 세포가 DXS 폴리펩티드, IDI 폴리펩티드, 또는 DXP 경로 폴리펩티드의 나머지 중 하나 이상, 및 MVA 경로 폴리펩티드를 인코딩하는 하나 이상의 핵산을 추가로 포함하는 숙주 세포.
- 하기를 포함하는, 이소프렌의 생성 방법:
(a) 제 30 항의 숙주 세포를 이소프렌 생성에 적합한 배양 조건 하에서 배양함; 및
(b) 이소프렌을 생성함. - 제 50 항에 있어서, (c) 이소프렌을 회수함을 추가로 포함하는 방법.
- 제 51 항에 있어서, (d) 이소프렌을 중합화함을 추가로 포함하는 방법.
- 하기를 포함하는, 이소프렌 신타아제의 생성 방법:
(a) (i) 숙주 세포; 및 (ii) 프로모터와 작동적으로 조합된 이소프렌 신타아제 변이체를 인코딩하는 핵산을 제공하는 것으로, 이때 이소프렌 신타아제 변이체는 SEQ ID NO:120 의 P. alba 이소프렌 신타아제의 하나 이상 (1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10) 의 잔기와 상응하는 위치에서 치환을 포함함;
(b) 상기 숙주 세포를 상기 핵산과 접촉시켜 형질전환된 숙주 세포를 생성함; 및
(c) 상기 형질전환된 숙주 세포를 이소프렌 신타아제의 생성에 적합한 배양 조건 하에서 배양함.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12533608P | 2008-04-23 | 2008-04-23 | |
US61/125,336 | 2008-04-23 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20110020234A true KR20110020234A (ko) | 2011-03-02 |
Family
ID=40810540
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020107026164A KR20110020234A (ko) | 2008-04-23 | 2009-04-23 | 이소프렌의 미생물에 의한 개선된 생성을 위한 이소프렌 신타아제 변이체 |
Country Status (14)
Country | Link |
---|---|
US (3) | US8173410B2 (ko) |
EP (1) | EP2279251A2 (ko) |
JP (2) | JP2011518564A (ko) |
KR (1) | KR20110020234A (ko) |
CN (1) | CN102171335A (ko) |
AU (1) | AU2009240505B2 (ko) |
BR (1) | BRPI0911667A2 (ko) |
CA (1) | CA2722440A1 (ko) |
MX (1) | MX2010011706A (ko) |
MY (1) | MY153871A (ko) |
RU (2) | RU2516343C2 (ko) |
SG (2) | SG192545A1 (ko) |
WO (1) | WO2009132220A2 (ko) |
ZA (2) | ZA201007564B (ko) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101582259B1 (ko) | 2014-07-04 | 2016-01-04 | 명지대학교 산학협력단 | 이소프렌을 생산하는 대장균 균주 fmis2 및 이의 용도 |
KR20160013824A (ko) * | 2014-07-28 | 2016-02-05 | 에스케이이노베이션 주식회사 | 신규 이소프렌 신타아제 및 이를 이용한 이소프렌의 제조방법 |
KR20170089227A (ko) * | 2016-01-26 | 2017-08-03 | 에스케이이노베이션 주식회사 | 재조합 호염성 메탄균주를 이용한 이소프렌의 제조방법 |
KR20190035204A (ko) * | 2017-09-26 | 2019-04-03 | 한국생명공학연구원 | 신규 이소프렌 합성 효소 및 이를 이용한 이소프렌 생산 방법 |
Families Citing this family (90)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX2009013329A (es) * | 2007-06-08 | 2010-02-24 | Danisco Us Inc Genencor Div | Sistema de expresion de celulasa heterologa y homologa. |
DK2235190T3 (en) | 2007-12-13 | 2018-07-23 | Danisco Us Inc | COMPOSITIONS AND PROCEDURES FOR PRODUCING ISOPRENE |
EP2279251A2 (en) | 2008-04-23 | 2011-02-02 | Danisco US Inc. | Isoprene synthase variants for improved microbial production of isoprene |
CA2729302A1 (en) * | 2008-06-30 | 2010-01-14 | The Goodyear Tire & Rubber Company | Polymers of isoprene from renewable resources |
CA2737082A1 (en) * | 2008-09-15 | 2010-03-18 | Danisco Us Inc. | Increased isoprene production using mevalonate kinase and isoprene synthase |
MY169163A (en) | 2008-09-15 | 2019-02-19 | Danisco Us Inc | Increased isoprene production using the archaeal lower mevalonate pathway |
CA2737223A1 (en) * | 2008-09-15 | 2010-03-18 | Danisco Us Inc. | Reduction of carbon dioxide emission during isoprene production by fermentation |
BR122018010313B1 (pt) | 2009-04-02 | 2019-04-24 | Amyris, Inc. | Métodos de estabilização e de hidrogenação para olefinas micróbio-derivadas |
CA2759700A1 (en) | 2009-04-23 | 2010-10-28 | Danisco Us Inc. | Three-dimensional structure of isoprene synthase and its use thereof for generating variants |
TWI434921B (zh) * | 2009-06-17 | 2014-04-21 | Danisco Us Inc | 從生物異戊二烯組合物製造燃料成分之方法及系統 |
TWI427149B (zh) | 2009-06-17 | 2014-02-21 | Danisco Us Inc | 使用dxp及mva途徑之改良之異戊二烯製造 |
TW201120213A (en) | 2009-06-17 | 2011-06-16 | Danisco Us Inc | Polymerization of isoprene from renewable resources |
US20110039323A1 (en) * | 2009-08-14 | 2011-02-17 | Eric Lawrence Singsaas | Isoprene Production |
US8778647B2 (en) * | 2009-12-22 | 2014-07-15 | Danisco Us Inc. | Methods of producing isoprene comprising a membrane bioreactor |
EP2516654B1 (en) | 2009-12-23 | 2015-01-21 | Danisco US Inc. | Compositions and methods for the increased production of isoprene with 6-phosphogluconolactonase (pgl) |
EP2566969B1 (en) | 2010-05-05 | 2019-09-04 | Genomatica, Inc. | Microorganisms and methods for the biosynthesis of butadiene |
US20130158106A1 (en) * | 2010-06-02 | 2013-06-20 | The United States Of America As Represented By The Department Of Veteran Affairs | Tocopherol derivatives and methods of use |
CN103025688A (zh) | 2010-06-17 | 2013-04-03 | 丹尼斯科美国公司 | 包含异戊二烯衍生物的燃料组合物 |
CA2807558A1 (en) | 2010-08-06 | 2012-02-09 | Danisco Us Inc. | Production of isoprene under neutral ph conditions |
EP2444415A1 (en) * | 2010-10-20 | 2012-04-25 | Genoplante-Valor | 1-Deoxy-D-xylulose 5-phosphate synthase alleles responsible for enhanced terpene biosynthesis |
JP2014502148A (ja) * | 2010-10-27 | 2014-01-30 | ダニスコ・ユーエス・インク | イソプレン生産の向上を目的としたイソプレン合成酵素変異体 |
CN103403145A (zh) | 2010-12-22 | 2013-11-20 | 丹尼斯科美国公司 | 使用重组细胞进行戊糖的生物制备 |
EP2655606A1 (en) | 2010-12-22 | 2013-10-30 | Danisco US Inc. | Compositions and methods for improved isoprene production using two types of ispg enzymes |
EP2670846B1 (en) | 2011-02-02 | 2015-08-19 | Amyris, Inc. | Methods of developing terpene synthase variants |
MY162964A (en) | 2011-02-02 | 2017-07-31 | Genomatica Inc | Microorganisms and methods for the biosynthesis of butadiene |
US8889383B2 (en) | 2011-04-29 | 2014-11-18 | Danisco Us Inc. | Production of mevalonate, isoprene, and isoprenoids using genes encoding polypeptides having thiolase, HMG-CoA synthase and HMG-CoA reductase enzymatic activities |
EP2702140B1 (en) | 2011-04-29 | 2018-10-31 | Danisco US Inc. | Recombinant microorganisms for enhanced production of mevalonate, isoprene, and isoprenoids |
US9169486B2 (en) | 2011-06-22 | 2015-10-27 | Genomatica, Inc. | Microorganisms for producing butadiene and methods related thereto |
WO2013016591A1 (en) * | 2011-07-26 | 2013-01-31 | Zuvachem, Inc. | High efficiency isoprene synthases produced by protein engineering |
JP2014528705A (ja) | 2011-08-04 | 2014-10-30 | ダニスコ・ユーエス・インク | アセトアセチルCoAシンターゼを用いるイソプレン、イソプレノイド前駆体、及びイソプレノイドの生産 |
EP2739742A1 (en) | 2011-08-05 | 2014-06-11 | Danisco US Inc. | PRODUCTION OF ISOPRENOIDS UNDER NEUTRAL pH CONDITIONS |
US9988648B2 (en) | 2011-09-16 | 2018-06-05 | Genomatica, Inc. | Microorganisms and methods for producing alkenes |
DK3339426T3 (da) | 2011-10-07 | 2022-09-12 | Danisco Us Inc | Anvendelse af phosphoketolase i fremstillingen af mevalonat, isoprenoid-udgangsstoffer og isopren |
CA2853125A1 (en) | 2011-10-27 | 2013-05-02 | The Goodyear Tire & Rubber Company | Isoprene synthase variants with improved solubility for production of isoprene |
WO2013096925A1 (en) | 2011-12-23 | 2013-06-27 | Danisco Us Inc. | Enhanced production of isoprene using host cells having decreased ispa activity |
US20140128645A1 (en) * | 2011-12-23 | 2014-05-08 | The Goodyear Tire & Rubber Company | Enhanced production of isoprene using marine bacterial cells |
US8865442B2 (en) | 2011-12-23 | 2014-10-21 | Danisco Us Inc. | Production of isoprene under reduced oxygen inlet levels |
US20150017696A1 (en) * | 2012-03-02 | 2015-01-15 | Codexis, Inc. a corporation | Recombinant host cells and processes for producing 1,3-butadiene through a crotonol intermediate |
US9315831B2 (en) | 2012-03-30 | 2016-04-19 | Danisco Us Inc. | Direct starch to fermentable sugar as feedstock for the production of isoprene, isoprenoid precursor molecules, and/or isoprenoids |
US9163263B2 (en) | 2012-05-02 | 2015-10-20 | The Goodyear Tire & Rubber Company | Identification of isoprene synthase variants with improved properties for the production of isoprene |
US8895277B2 (en) | 2012-05-02 | 2014-11-25 | Danisco Us Inc. | Legume isoprene synthase for production of isoprene |
JP6169073B2 (ja) * | 2012-05-30 | 2017-07-26 | 株式会社ブリヂストン | イソプレンシンターゼおよびそれをコードするポリヌクレオチド、ならびにイソプレンモノマーの製造方法 |
US8962296B2 (en) | 2012-05-30 | 2015-02-24 | Bridgestone Corporation | Isoprene synthase and gene encoding the same, and method for producing isoprene monomer |
WO2013181647A2 (en) | 2012-06-01 | 2013-12-05 | Danisco Us Inc. | Compositions and methods of producing isoprene and/or industrrial bio-products using anaerobic microorganisms |
US9382554B2 (en) | 2012-07-27 | 2016-07-05 | Wisys Technology Foundation, Inc. | Methods for isoprene and pinene production in cyanobacteria |
CA2886137C (en) | 2012-10-23 | 2021-10-19 | Sekisui Chemical Co., Ltd. | Recombinant cell, and method for producing isoprene |
WO2014066892A1 (en) * | 2012-10-26 | 2014-05-01 | Coelho Pedro S | De novo metabolic pathways for isoprene biosynthesis |
EP2935364A2 (en) | 2012-12-21 | 2015-10-28 | Danisco US Inc. | Production of isoprene, isoprenoid, and isoprenoid precursors using an alternative lower mevalonate pathway |
CN104884609B (zh) | 2012-12-27 | 2018-05-08 | 积水化学工业株式会社 | 重组细胞、以及异戊二烯的生产方法 |
US9175330B2 (en) * | 2013-02-20 | 2015-11-03 | Korea Research Institute Of Bioscience And Biotechnology | Method for screening and quantifying isoprene biosynthesis enzyme activity |
US9850512B2 (en) | 2013-03-15 | 2017-12-26 | The Research Foundation For The State University Of New York | Hydrolysis of cellulosic fines in primary clarified sludge of paper mills and the addition of a surfactant to increase the yield |
US20160040172A1 (en) | 2013-03-15 | 2016-02-11 | Genomatica, Inc. | Microorganisms and methods for producing butadiene and related compounds by formate assimilation |
US10246694B2 (en) | 2013-04-10 | 2019-04-02 | Danisco Us Inc. | Phosphoketolases for improved production of acetyl coenzyme A-derived metabolites, isoprene, isoprenoid precursors, and isoprenoids |
CN103215315B (zh) * | 2013-04-15 | 2015-05-20 | 上海工业生物技术研发中心 | 利用蓝藻生产异戊二烯 |
CA2915980A1 (en) | 2013-06-21 | 2014-12-24 | Danisco Us Inc. | Compositions and methods for clostridial transformation |
CA2916759C (en) | 2013-08-08 | 2023-02-28 | Knipbio | Methylotrophs for aquaculture and animal feed |
JP2016530333A (ja) | 2013-09-13 | 2016-09-29 | ザ ボード オブ トラスティーズ オブ ザ ユニバーシティ オブ アーカンソー | 放射線の影響から防護するため及び放射線の影響を緩和するための組成物の調製及び使用 |
MY172689A (en) | 2013-11-22 | 2019-12-10 | Ajinomoto Kk | Modified isoprene synthase |
JPWO2015080273A1 (ja) * | 2013-11-28 | 2017-03-16 | 味の素株式会社 | イソプレンモノマーの製造方法 |
EP4296364A2 (en) | 2013-12-03 | 2023-12-27 | Genomatica, Inc. | Microorganisms and methods for improving product yields on methanol using acetyl-coa synthesis |
DK3107993T3 (da) | 2014-02-20 | 2020-11-23 | Danisco Us Inc | Rekombinante mikroorganismer til forbedret fremstilling af mevalonat, isopren, isoprenoide forløbere, isoprenoider og acetyl-coa-afledte produkter |
US9951363B2 (en) | 2014-03-14 | 2018-04-24 | The Research Foundation for the State University of New York College of Environmental Science and Forestry | Enzymatic hydrolysis of old corrugated cardboard (OCC) fines from recycled linerboard mill waste rejects |
RU2014112066A (ru) | 2014-03-28 | 2015-10-10 | Адзиномото Ко., Инк. | Способ получения мономерного изопрена |
WO2016015021A1 (en) | 2014-07-24 | 2016-01-28 | The Regents Of The University Of California | Oxidative starch degradation by a new family of pmos |
RO130063A8 (ro) | 2014-08-28 | 2017-06-30 | Romvac Company S.A. | Producerea şi utilizarea ovotransferinei moderne () |
EP3741865B1 (en) | 2014-09-18 | 2024-03-13 | Genomatica, Inc. | Non-natural microbial organisms with improved energetic efficiency |
CN105985977B (zh) * | 2015-02-10 | 2020-12-25 | 中国科学院微生物研究所 | 异戊二烯合成酶基因及其应用 |
CN105985976A (zh) * | 2015-02-10 | 2016-10-05 | 中国科学院微生物研究所 | 异戊二烯合成酶基因及其应用 |
CN105985975A (zh) * | 2015-02-10 | 2016-10-05 | 中国科学院微生物研究所 | 异戊二烯合成酶基因及其应用 |
CN105985972A (zh) * | 2015-02-10 | 2016-10-05 | 中国科学院微生物研究所 | 异戊二烯合成酶基因及其应用 |
CN105985973A (zh) * | 2015-02-10 | 2016-10-05 | 中国科学院微生物研究所 | 异戊二烯合成酶基因及其应用 |
JPWO2016129637A1 (ja) * | 2015-02-13 | 2017-11-24 | 積水化学工業株式会社 | 核酸、融合タンパク質、組換え細胞、並びに、イソプレン又は環式テルペンの生産方法 |
US20160324914A1 (en) | 2015-05-05 | 2016-11-10 | Tocol Pharmaceuticals, Llc | Use of rice bran oil distillate extract for prevention and mitigation of the effects of radiation |
CN107991399B (zh) * | 2016-10-27 | 2022-03-08 | 天士力医药集团股份有限公司 | 一种同时测定复方丹参提取物或相关药材中31种成分的方法 |
JP2020513790A (ja) | 2017-02-06 | 2020-05-21 | ザイマージェン インコーポレイテッド | 発酵によりチラミンを生成させるための遺伝子操作型生合成経路 |
EP3587572A4 (en) | 2017-02-27 | 2020-12-30 | Sekisui Chemical Co., Ltd. | RECOMBINANT CELL, METHOD FOR MANUFACTURING A RECOMBINANT CELL, AND METHOD FOR MANUFACTURING ISOPRENE OR TERPE |
AU2018256863B2 (en) | 2017-04-27 | 2024-06-06 | Regents Of The University Of California | Microorganisms and methods for producing cannabinoids and cannabinoid derivatives |
EP3630943A4 (en) * | 2017-06-01 | 2021-06-09 | Knipbio, Inc. | HETEROLOGICAL CAROTINOID PRODUCTION IN MICROORGANISMS |
WO2019006255A1 (en) | 2017-06-30 | 2019-01-03 | Invista North America S.A.R.L. | METHODS, MATERIALS, SYNTHETIC HOSTS AND REAGENTS FOR HYDROCARBON BIOSYNTHESIS AND DERIVATIVES |
WO2019006257A1 (en) * | 2017-06-30 | 2019-01-03 | Invista North America .S.A.R.L. | METHODS, SYNTHETIC HOSTS AND REAGENTS FOR HYDROCARBON BIOSYNTHESIS |
WO2019036140A1 (en) | 2017-07-17 | 2019-02-21 | Zymergen Inc. | METALLO-ORGANIC STRESS MATERIALS |
US11505809B2 (en) | 2017-09-28 | 2022-11-22 | Inv Nylon Chemicals Americas Llc | Organisms and biosynthetic processes for hydrocarbon synthesis |
EP3720944A1 (en) | 2017-12-07 | 2020-10-14 | Zymergen Inc. | Engineered biosynthetic pathways for production of (6e)-8-hydroxygeraniol by fermentation |
CN111868047A (zh) | 2017-12-21 | 2020-10-30 | 齐默尔根公司 | 荆芥内半缩醛氧化还原酶、荆芥内半缩醛合酶和能够产生荆芥内酯的微生物 |
WO2020069142A1 (en) | 2018-09-26 | 2020-04-02 | Demetrix, Inc. | Optimized expression systems for expressing berberine bridge enzyme and berberine bridge enzyme-like polypeptides |
WO2020071538A1 (en) | 2018-10-05 | 2020-04-09 | Ajinomoto Co., Inc. | Method for producing target substance by bacterial fermentation |
WO2020236789A1 (en) | 2019-05-22 | 2020-11-26 | Demetrix, Inc. | Optimized cannabinoid synthase polypeptides |
CN110241103B (zh) * | 2019-07-04 | 2021-01-19 | 江西邦泰绿色生物合成生态产业园发展有限公司 | 一种生物酶法生产异戊二烯的方法 |
CA3152803A1 (en) | 2019-09-18 | 2021-03-25 | Demetrix, Inc. | Optimized tetrahydrocannabinolic acid (thca) synthase polypeptides |
WO2021183448A1 (en) | 2020-03-09 | 2021-09-16 | Demetrix, Inc. | Optimized olivetolic acid cyclase polypeptides |
Family Cites Families (88)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US1344713A (en) | 1915-12-02 | 1920-06-29 | Westinghouse Electric & Mfg Co | Reactance-coil |
DE1793254A1 (de) | 1968-08-23 | 1971-12-16 | Bayer Ag | Verfahren zur Gewinnung von Cyclopenten,Isopren und einem Diolefinstrom aus C?-Crackbenzinschnitten |
US5380831A (en) | 1986-04-04 | 1995-01-10 | Mycogen Plant Science, Inc. | Synthetic insecticidal crystal protein gene |
DE3338269A1 (de) | 1983-10-21 | 1985-05-02 | Basf Ag, 6700 Ludwigshafen | Verfahren zur gewinnung von isopren aus einem c(pfeil abwaerts)5(pfeil abwaerts)-kohlenwasserstoffgemisch |
GB8407828D0 (en) | 1984-03-27 | 1984-05-02 | Ontario Research Foundation | In situ preparation |
US4570029A (en) | 1985-03-04 | 1986-02-11 | Uop Inc. | Process for separating isoprene |
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
US4965188A (en) | 1986-08-22 | 1990-10-23 | Cetus Corporation | Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme |
US4683195A (en) | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
AU607398B2 (en) | 1985-08-29 | 1991-03-07 | Genencor Inc. | Heterologous polypeptides expressed in filamentous fungi, processes for making same, and vectors for making same |
DK122686D0 (da) | 1986-03-17 | 1986-03-17 | Novo Industri As | Fremstilling af proteiner |
GB8610600D0 (en) | 1986-04-30 | 1986-06-04 | Novo Industri As | Transformation of trichoderma |
US4846872A (en) | 1986-08-11 | 1989-07-11 | Fujisawa Pharmaceutical Co., Ltd. | Herbicide |
US5322770A (en) | 1989-12-22 | 1994-06-21 | Hoffman-Laroche Inc. | Reverse transcription with thermostable DNA polymerases - high temperature reverse transcription |
US5545816A (en) | 1990-03-02 | 1996-08-13 | Amoco Corporation | Phytoene biosynthesis in genetically engineered hosts |
US5306862A (en) | 1990-10-12 | 1994-04-26 | Amoco Corporation | Method and composition for increasing sterol accumulation in higher plants |
ES2182818T5 (es) | 1990-12-10 | 2015-07-06 | Danisco Us Inc. | Sacarificación mejorada de celulosa por clonación y amplificación del gen de beta-glucosidasa de Trichoderma reesei |
TW261517B (ko) | 1991-11-29 | 1995-11-01 | Mitsubishi Shozi Kk | |
WO1995004134A1 (en) | 1993-08-02 | 1995-02-09 | Genencor International, Inc. | Method of reducing complex carbohydrates in fermentation products |
CA2118071C (en) | 1993-10-28 | 2004-09-14 | Rodney B. Croteau | Dna encoding limonene synthase from mentha spicata |
US5861271A (en) | 1993-12-17 | 1999-01-19 | Fowler; Timothy | Cellulase enzymes and systems for their expressions |
US5686276A (en) | 1995-05-12 | 1997-11-11 | E. I. Du Pont De Nemours And Company | Bioconversion of a fermentable carbon source to 1,3-propanediol by a single microorganism |
US5849970A (en) | 1995-06-23 | 1998-12-15 | The Regents Of The University Of Colorado | Materials and methods for the bacterial production of isoprene |
US8106260B2 (en) | 1996-04-12 | 2012-01-31 | The Board Of Trustees Of The University Of Kentucky | Chimeric isoprenoid synthases and uses thereof |
DE19629568C1 (de) | 1996-07-15 | 1998-01-08 | Fraunhofer Ges Forschung | Verfahren zur Herstellung von Isopren |
USRE44266E1 (en) | 1997-01-17 | 2013-06-04 | The Scripps Research Institute | Expression of eukaryotic polypeptides in chloroplasts |
CA2736981A1 (en) | 1998-04-14 | 1999-10-21 | Kyowa Hakko Bio Co., Ltd. | Process for producing isoprenoid compounds by microorganisms |
US6176176B1 (en) | 1998-04-30 | 2001-01-23 | Board Of Trustees Operating Michigan State University | Apparatus for treating cellulosic materials |
AR022383A1 (es) | 1998-09-18 | 2002-09-04 | Univ Kentucky Res Found | Sintasas |
US6268328B1 (en) | 1998-12-18 | 2001-07-31 | Genencor International, Inc. | Variant EGIII-like cellulase compositions |
US6442536B1 (en) | 2000-01-18 | 2002-08-27 | Praxair Technology, Inc. | Method for predicting flammability limits of complex mixtures |
WO2001058839A1 (en) | 2000-02-07 | 2001-08-16 | Eastman Chemical Company | Process to recover condensable gases from oxygen containing mixtures |
KR20010084864A (ko) | 2000-02-29 | 2001-09-06 | 김수언 | 개똥쑥의 아모파-4,11-디엔 합성효소, 이를 코딩하는유전자, 이 유전자를 포함하는 발현벡터 및, 이발현벡터로 형질전환된 대장균 및 식물체 |
US6270739B1 (en) | 2000-06-16 | 2001-08-07 | Eastman Chemical Company | Process for the removal of carbon dioxide from 3,4-epoxy-1-butene process recycle streams |
US20030033626A1 (en) | 2000-07-31 | 2003-02-13 | Hahn Frederick M. | Manipulation of genes of the mevalonate and isoprenoid pathways to create novel traits in transgenic organisms |
EP1311709A4 (en) * | 2000-08-18 | 2006-08-02 | Integrigen Inc | METHODS AND COMPOSITIONS FOR DIRECTED MOLECULAR EVOLUTION USING MODIFICATION OF THE END OF DNA |
US6553689B2 (en) | 2000-09-24 | 2003-04-29 | 3M Innovative Properties Company | Vapor collection method and apparatus |
US6582914B1 (en) | 2000-10-26 | 2003-06-24 | Genencor International, Inc. | Method for generating a library of oligonucleotides comprising a controlled distribution of mutations |
CA2441594A1 (en) | 2001-03-22 | 2002-10-03 | Scentgene Pollination Ltd. | Method of enhancing entomophilous |
DK1373480T3 (da) | 2001-04-04 | 2009-05-11 | Genencor Int | Ukoblede produktive og katabolske værtscellebaner |
RU2197461C2 (ru) * | 2001-04-05 | 2003-01-27 | Общество с ограниченной ответственностью "Еврохим-СПб-Трейдинг" | Способ получения изопрена |
ATE405638T1 (de) | 2001-06-06 | 2008-09-15 | Dsm Ip Assets Bv | Verbesserte isoprenoid herstellung |
US6998471B2 (en) | 2001-07-25 | 2006-02-14 | E.I. Du Pont De Nemours And Company | Polynucleotides encoding an acetyl-CoA acetyltransferase from Hevea brasiliensis, related products, and methods |
US7172886B2 (en) | 2001-12-06 | 2007-02-06 | The Regents Of The University Of California | Biosynthesis of isopentenyl pyrophosphate |
US7192751B2 (en) | 2001-12-06 | 2007-03-20 | The Regents Of The University Of California | Biosynthesis of amorpha-4,11-diene |
EP1499709B1 (en) | 2002-04-22 | 2012-01-04 | E.I. Du Pont De Nemours And Company | Promoter and plasmid system for genetic engineering |
WO2003095651A1 (fr) | 2002-05-10 | 2003-11-20 | Kyowa Hakko Kogyo Co., Ltd. | Procede de production d'acide mevalonique |
MXPA05003382A (es) | 2002-10-04 | 2005-06-22 | Du Pont | Proceso para la produccion biologica de 1,3-propanodiol con alto rendimiento. |
US20040219629A1 (en) | 2002-12-19 | 2004-11-04 | Qiong Cheng | Increasing carotenoid production in bacteria via chromosomal integration |
FR2850101B1 (fr) | 2003-01-22 | 2007-03-02 | Michelin Soc Tech | Procede d'obtention d'une coupe c5 "fcc" enrichie en isoprene et polymerisation selective de l'isoprene a partir de cette coupe |
ES2340588T3 (es) | 2003-05-29 | 2010-06-07 | Genencor Int | Genes nuevos de trichoderma. |
CN1806042B (zh) | 2003-06-12 | 2012-07-04 | 帝斯曼知识产权资产管理有限公司 | 具有反馈抗性的甲羟戊酸激酶 |
PL202927B1 (pl) | 2003-07-20 | 2009-08-31 | Carr Daniel R | Peptyd i kompozycja farmaceutyczna oraz ich zastosowania medyczne |
SI1685244T1 (sl) | 2003-11-21 | 2012-06-29 | Danisco Us Inc | Ekspresija encimov, ki hidrolizirajo zrnat škrob, v Trichodermi in postopek za proizvajanje glukoze iz zrnatih škrobnih substratov |
CN102250861A (zh) | 2004-02-13 | 2011-11-23 | 诺维信公司 | 蛋白酶变体 |
CA2567547C (en) | 2004-05-21 | 2012-10-23 | The Regents Of The University Of California | Method for enhancing production of isoprenoid compounds |
CN100572370C (zh) | 2004-06-18 | 2009-12-23 | 国际壳牌研究有限公司 | 生产烯烃氧化物、1,2-二醇、1,2-二醇醚或链烷醇胺的方法 |
EP1824969B1 (en) | 2004-12-14 | 2011-03-02 | DSM IP Assets B.V. | Improved mevalonate kinase |
JP4117350B2 (ja) * | 2005-03-03 | 2008-07-16 | 富山県 | 機能改変フェニルアラニン脱水素酵素、およびこの酵素を用いた生体試料中のアミノ酸の分析方法 |
JP4446482B2 (ja) | 2005-08-10 | 2010-04-07 | 独立行政法人産業技術総合研究所 | ユーカリ・モノテルペン合成酵素遺伝子 |
BRPI0709540A2 (pt) | 2006-02-14 | 2011-07-19 | Firmenich & Cie | método para produzir terpenos e, portanto, microorganismos transformados por mep |
WO2007136847A2 (en) | 2006-05-19 | 2007-11-29 | The Regents Of The University Of California | Methods for increasing isoprenoid and isoprenoid precursor production by modulating fatty acid levels |
DK2024504T4 (da) * | 2006-05-26 | 2023-02-27 | Amyris Inc | Fremstilling af isoprenoider |
KR101486087B1 (ko) | 2006-06-23 | 2015-01-26 | 다니스코 유에스 인크. | 다수의 특성들을 조작하는 부위 평가 라이브러리를 사용한 서열 및 활성 관계에 대한 체계적 평가 |
US7947478B2 (en) | 2006-06-29 | 2011-05-24 | The Regents Of The University Of California | Short chain volatile hydrocarbon production using genetically engineered microalgae, cyanobacteria or bacteria |
JP2008035831A (ja) * | 2006-08-09 | 2008-02-21 | Nitta Ind Corp | 有用部分の生産性が高められた植物及びその作製方法 |
JP4986547B2 (ja) | 2006-09-04 | 2012-07-25 | 株式会社Adeka | 新規なアセトアセチルCoA合成酵素、それをコードするDNA配列、当該酵素の製造方法および当該酵素を利用したメバロン酸の製造方法 |
JP2008182950A (ja) | 2007-01-30 | 2008-08-14 | Hamamatsu Kagaku Gijutsu Kenkyu Shinkokai | 柑橘類酵素遺伝子調製方法 |
EP2152854A2 (en) | 2007-05-01 | 2010-02-17 | Acidophil LLC | Methods for the direct conversion of carbon dioxide into a hydrocarbon using a metabolically engineered photosynthetic microorganism |
CA2690032C (en) | 2007-06-06 | 2018-05-15 | Danisco Us Inc. | Methods for improving protein properties |
GB2463543A (en) | 2007-09-11 | 2010-03-24 | Sapphire Energy Inc | Molecule production by photosynthetic organisms |
DK2235190T3 (en) | 2007-12-13 | 2018-07-23 | Danisco Us Inc | COMPOSITIONS AND PROCEDURES FOR PRODUCING ISOPRENE |
WO2009100231A2 (en) | 2008-02-06 | 2009-08-13 | The Regents Of The University Of California | Short chain volatile isoprene hydrocarbon production using the mevalonic acid pathway in genetically engineered yeast and fungi |
JP2009207402A (ja) | 2008-03-04 | 2009-09-17 | Shizuokaken Koritsu Daigaku Hojin | 組換えサビネン合成酵素及びその利用 |
EP2279251A2 (en) * | 2008-04-23 | 2011-02-02 | Danisco US Inc. | Isoprene synthase variants for improved microbial production of isoprene |
CA2729302A1 (en) | 2008-06-30 | 2010-01-14 | The Goodyear Tire & Rubber Company | Polymers of isoprene from renewable resources |
EP3406722A1 (en) | 2008-07-02 | 2018-11-28 | Danisco US Inc. | Methods for producing isoprene free of c5 hydrocarbons under decoupling conditions and/or safe operating ranges |
US8476049B2 (en) | 2008-09-15 | 2013-07-02 | Danisco Us Inc. | Conversion of prenyl derivatives to isoprene |
SG169641A1 (en) | 2008-09-15 | 2011-04-29 | Danisco Us Inc | Systems using cell culture for production of isoprene |
CA2737223A1 (en) | 2008-09-15 | 2010-03-18 | Danisco Us Inc. | Reduction of carbon dioxide emission during isoprene production by fermentation |
MY169163A (en) | 2008-09-15 | 2019-02-19 | Danisco Us Inc | Increased isoprene production using the archaeal lower mevalonate pathway |
CA2737082A1 (en) | 2008-09-15 | 2010-03-18 | Danisco Us Inc. | Increased isoprene production using mevalonate kinase and isoprene synthase |
JP5793424B2 (ja) | 2008-12-30 | 2015-10-14 | ダニスコ・ユーエス・インク | イソプレンと副生成物の産出方法 |
CA2759700A1 (en) | 2009-04-23 | 2010-10-28 | Danisco Us Inc. | Three-dimensional structure of isoprene synthase and its use thereof for generating variants |
JP4760951B2 (ja) | 2009-05-08 | 2011-08-31 | トヨタ自動車株式会社 | ブタノール生産能を有する組換え微生物及びブタノールの製造方法 |
TWI427149B (zh) | 2009-06-17 | 2014-02-21 | Danisco Us Inc | 使用dxp及mva途徑之改良之異戊二烯製造 |
CA2766810C (en) | 2009-06-29 | 2017-10-10 | The University Of Western Australia | Terpene synthases from santalum |
JP2014502148A (ja) | 2010-10-27 | 2014-01-30 | ダニスコ・ユーエス・インク | イソプレン生産の向上を目的としたイソプレン合成酵素変異体 |
-
2009
- 2009-04-23 EP EP09735440A patent/EP2279251A2/en not_active Withdrawn
- 2009-04-23 WO PCT/US2009/041581 patent/WO2009132220A2/en active Application Filing
- 2009-04-23 CA CA2722440A patent/CA2722440A1/en not_active Abandoned
- 2009-04-23 BR BRPI0911667A patent/BRPI0911667A2/pt not_active IP Right Cessation
- 2009-04-23 AU AU2009240505A patent/AU2009240505B2/en not_active Ceased
- 2009-04-23 SG SG2013055827A patent/SG192545A1/en unknown
- 2009-04-23 SG SG201007802A patent/SG165884A1/en unknown
- 2009-04-23 MX MX2010011706A patent/MX2010011706A/es unknown
- 2009-04-23 KR KR1020107026164A patent/KR20110020234A/ko not_active Application Discontinuation
- 2009-04-23 ZA ZA201007564A patent/ZA201007564B/xx unknown
- 2009-04-23 US US12/429,143 patent/US8173410B2/en not_active Expired - Fee Related
- 2009-04-23 RU RU2010147659/10A patent/RU2516343C2/ru not_active IP Right Cessation
- 2009-04-23 JP JP2011506460A patent/JP2011518564A/ja active Pending
- 2009-04-23 MY MYPI2010004990A patent/MY153871A/en unknown
- 2009-04-23 CN CN2009801234600A patent/CN102171335A/zh active Pending
-
2011
- 2011-10-22 ZA ZA2011/08569A patent/ZA201108569B/en unknown
-
2012
- 2012-03-30 US US13/436,612 patent/US8916370B2/en not_active Expired - Fee Related
-
2014
- 2014-03-06 RU RU2014108776/10A patent/RU2014108776A/ru not_active Application Discontinuation
- 2014-04-17 JP JP2014085377A patent/JP2014158489A/ja active Pending
- 2014-11-17 US US14/543,628 patent/US20150191712A1/en not_active Abandoned
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101582259B1 (ko) | 2014-07-04 | 2016-01-04 | 명지대학교 산학협력단 | 이소프렌을 생산하는 대장균 균주 fmis2 및 이의 용도 |
KR20160013824A (ko) * | 2014-07-28 | 2016-02-05 | 에스케이이노베이션 주식회사 | 신규 이소프렌 신타아제 및 이를 이용한 이소프렌의 제조방법 |
US11254922B2 (en) | 2014-07-28 | 2022-02-22 | Sk Innovation Co., Ltd. | Isoprene synthase and method of preparing isoprene using thereof |
KR20170089227A (ko) * | 2016-01-26 | 2017-08-03 | 에스케이이노베이션 주식회사 | 재조합 호염성 메탄균주를 이용한 이소프렌의 제조방법 |
KR20190035204A (ko) * | 2017-09-26 | 2019-04-03 | 한국생명공학연구원 | 신규 이소프렌 합성 효소 및 이를 이용한 이소프렌 생산 방법 |
Also Published As
Publication number | Publication date |
---|---|
AU2009240505B2 (en) | 2013-09-05 |
RU2516343C2 (ru) | 2014-05-20 |
SG165884A1 (en) | 2010-11-29 |
CN102171335A (zh) | 2011-08-31 |
RU2014108776A (ru) | 2015-09-20 |
EP2279251A2 (en) | 2011-02-02 |
US20130260432A1 (en) | 2013-10-03 |
US20100003716A1 (en) | 2010-01-07 |
WO2009132220A2 (en) | 2009-10-29 |
SG192545A1 (en) | 2013-08-30 |
RU2010147659A (ru) | 2012-05-27 |
US20150191712A1 (en) | 2015-07-09 |
WO2009132220A9 (en) | 2010-05-06 |
AU2009240505A1 (en) | 2009-10-29 |
BRPI0911667A2 (pt) | 2019-04-24 |
CA2722440A1 (en) | 2009-10-29 |
WO2009132220A3 (en) | 2010-01-21 |
JP2014158489A (ja) | 2014-09-04 |
ZA201108569B (en) | 2014-10-29 |
JP2011518564A (ja) | 2011-06-30 |
MY153871A (en) | 2015-03-31 |
US8173410B2 (en) | 2012-05-08 |
ZA201007564B (en) | 2012-01-25 |
MX2010011706A (es) | 2011-03-15 |
US8916370B2 (en) | 2014-12-23 |
AU2009240505A2 (en) | 2010-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20110020234A (ko) | 이소프렌의 미생물에 의한 개선된 생성을 위한 이소프렌 신타아제 변이체 | |
TW201111512A (en) | Improved isoprene production using the DXP and MVA pathway | |
DK2670846T3 (en) | METHODS FOR THE DEVELOPMENT OF TERPEN SYNTHASE VARIETIES | |
DK2855662T3 (en) | RECOMBINANT MICROORGANISMS AND APPLICATIONS THEREOF | |
KR102604096B1 (ko) | 윌슨병을 치료하기 위한 유전자 치료 | |
KR20110122672A (ko) | 이소프렌 및 공-산물을 제조하는 방법 | |
KR20120047908A (ko) | 이소프렌 유도체들을 포함하는 연료 조성물들 | |
KR20140015136A (ko) | 3-히드록시프로피온산 및 다른 생성물의 제조 방법 | |
CN109923211A (zh) | Pd-1归巢核酸内切酶变体、组合物及使用方法 | |
KR20120136349A (ko) | 고가의 화학적 생성물의 미생물 생산, 및 관련 조성물, 방법 및 시스템 | |
DK2768848T3 (en) | METHODS AND PROCEDURES FOR EXPRESSION AND SECRETARY OF PEPTIDES AND PROTEINS | |
CA2763792C (en) | Expression cassettes derived from maize | |
BRPI0806354A2 (pt) | plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados | |
CN109661403A (zh) | 前导序列修饰的葡糖淀粉酶多肽和具有增强的生物产物产生的工程化的酵母菌株 | |
CN107580503B (zh) | 用于治疗细菌感染的杀菌剂与亲溶酶体碱化剂的组合 | |
KR20150014953A (ko) | 케톨-산 리덕토아이소머라아제 효소 및 사용 방법 | |
KR20130117753A (ko) | 포스포케톨라아제를 포함하는 재조합 숙주 세포 | |
KR20140092759A (ko) | 숙주 세포 및 아이소부탄올의 제조 방법 | |
TW201120213A (en) | Polymerization of isoprene from renewable resources | |
KR20130027063A (ko) | Fe-s 클러스터 요구성 단백질의 활성 향상 | |
KR20100031700A (ko) | 유전적으로 변형된 광합성 생물들의 고처리량 스크리닝 | |
KR20200116084A (ko) | 발효 공정 | |
CN108504670B (zh) | 一种大肠杆菌冷休克助溶型表达质粒的构建方法及其应用 | |
CN116083398B (zh) | 分离的Cas13蛋白及其应用 | |
KR102409420B1 (ko) | 형질전환 생물체 선별용 마커 조성물, 형질전환 생물체 및 형질전환 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |