KR102439589B1 - 개선된 특성을 갖는 오메가-하이드록실라제-관련 융합 폴리펩티드 - Google Patents

개선된 특성을 갖는 오메가-하이드록실라제-관련 융합 폴리펩티드 Download PDF

Info

Publication number
KR102439589B1
KR102439589B1 KR1020177001306A KR20177001306A KR102439589B1 KR 102439589 B1 KR102439589 B1 KR 102439589B1 KR 1020177001306 A KR1020177001306 A KR 1020177001306A KR 20177001306 A KR20177001306 A KR 20177001306A KR 102439589 B1 KR102439589 B1 KR 102439589B1
Authority
KR
South Korea
Prior art keywords
seq
fatty acid
cyp153a
leu
arg
Prior art date
Application number
KR1020177001306A
Other languages
English (en)
Other versions
KR20170066306A (ko
Inventor
바오롱 주
안드레아스 더블유. 셔머
신디 창
Original Assignee
게노마티카 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 게노마티카 인코포레이티드 filed Critical 게노마티카 인코포레이티드
Priority to KR1020227029909A priority Critical patent/KR102663049B1/ko
Publication of KR20170066306A publication Critical patent/KR20170066306A/ko
Application granted granted Critical
Publication of KR102439589B1 publication Critical patent/KR102439589B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • C12N9/0077Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with a reduced iron-sulfur protein as one donor (1.14.15)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/18Carboxylic ester hydrolases (3.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6409Fatty acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/15Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced iron-sulfur protein as one donor, and incorporation of one atom of oxygen (1.14.15)
    • C12Y114/15003Alkane 1-monooxygenase (1.14.15.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/01Carboxylic ester hydrolases (3.1.1)
    • C12Y301/01005Lysophospholipase (3.1.1.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/02Thioester hydrolases (3.1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/02Thioester hydrolases (3.1.2)
    • C12Y301/02014Oleoyl-[acyl-carrier-protein] hydrolase (3.1.2.14), i.e. ACP-thioesterase
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

본 발명은 재조합 숙주 세포에서 발현되는 경우 개선된 오메가-하이드록실화 지방산 유도체 생산을 야기하는 오메가-하이드록실라제-관련 융합 폴리펩티드에 관한 것이다. 본 발명은 추가로, 오메가-하이드록실화 지방산 유도체의 생산을 위해 오메가-하이드록실라제-관련 융합 폴리펩티드를 발현하기 위한 미생물에 관한 것이다.

Description

개선된 특성을 갖는 오메가-하이드록실라제-관련 융합 폴리펩티드 {OMEGA-HYDROXYLASE-RELATED FUSION POLYPEPTIDES WITH IMPROVED PROPERTIES}
관련 출원에 대한 상호참조
본 출원은 2014년 6월 16일자로 출원된 U.S. 가특허원 제62/012,970호의 이익을 청구하며, 이의 전문은 본원에 참고로 포함된다.
서열 목록
본 출원은 ASCII 포맷으로 전자 제출된 서열 목록을 포함하며, 이는 전문이 본원에 참고로 포함된다. 2015년 6월 16일에 작성된 상기의 ASCII 복사본은 파일명을 LS00054PCT_SL.txt라고 하고, 크기는 484,554 바이트이다.
분야
본 발명은 재조합 숙주 세포에서 발현되는 경우 개선된 오메가-하이드록실화 지방산 유도체 생산을 초래하는 오메가-하이드록실라제-관련 융합 폴리펩티드에 관한 것이다. 본 발명은 추가로 오메가-하이드록실화 지방산 유도체의 생산을 위해 오메가-하이드록실라제-관련 융합 폴리펩티드를 발현하기 위한 미생물에 관한 것이기도 하다.
시토크롬 P450 모노옥시게나제(P450)는 효소의 다양한 그룹이다. 이들은 패밀리 및 서브패밀리로 분류된다. 이들이 40 퍼센트 이상의 아미노산 동일성을 공유하는 경우 동일한 패밀리에 속한다. 이들이 55 퍼센트 이상의 아미노산 동일성을 공유하는 경우 동일한 서브패밀리에 속한다. P450은 기질로서 지방산을 사용하며 하이드록실화 반응을 촉매한다. 박테리아는 알칸 분해 및 지방산 개질에 관련된 몇 가지 P450 시스템을 가지며 1000개 이상의 미생물 P450이 지금까지 공지되어 있다. 한 가지 특정 P450 서브패밀리가 cyp153A로서 공지되어 있으며, 여기서, 최초는 2001년에 아시네토박터 칼코아세티쿠스(Acinetobacter calcoaceticus)로부터 클로닝되었다. 그 이후로, 유사한 효소들이 스핀고모나스 종(Sphingomonas sp .) HXN200, 마이코박테리움 종(Mycobacterium sp .) HXN1500, 및 알카니보락스 보쿠멘시스(Alcanivorax borkumensis)와 같은 기타의 알칸-사용 종에서 동정되었다(문헌 참조; Van Bogaert et al. (2011) FEBS Journal 278:206-221). 박테리아성 CYP153A 서브패밀리로부터의 몇가지 P450은 높은 말단 위치선택성을 갖는 알칸 오메가-하이드록실라제(ω-하이드록실라제, ω-옥시게나제라고도 함)이다. CYP153A는 또한 산업적으로 관련된 오메가-하이드록실화(ω-하이드록실화) 지방족 화합물, 예를 들면, 1급 알콜, ω-하이드록실화 지방산 및 이관능성 지방산 유도체, 예를 들면, α,ω-디카복실산 및 α,ω-디올의 합성과 연관되었다(문헌 참조; Honda Malca et al. (2012) Chem . Commun. 48:5115-5117).
요약
본 발명은 숙주 세포에서 오메가-하이드록실화- 및 이관능성 지방산 유도체를 생산할 수 있는 오메가-하이드록실라제-관련 융합 폴리펩티드 및 이의 변이체를 제공한다. 보다 구체적으로, 본 발명은 오메가-하이드록실화- (ω-하이드록실화) 및 이관능성 지방산 유도체를 생산하는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체 및 ω-하이드록실화 지방산, ω-하이드록실화 지방 에스테르, α,ω-이산, α,ω-디에스테르, α,ω-디올 및 매크로락톤과 같은 이들로부터 유도된 화학물질을 포함한 이의 조성물을 제공한다. 또한, 이러한 조작된 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 포함하는 특이 CYP153A-환원효소 혼성 융합 핵산 및 단백질 서열 뿐만 아니라 재조합 숙주 세포 및 세포 배양물이 제공된다. 본 발명은 또한 ω-하이드록실화 및/또는 이관능성 지방산 유도체 또는 이의 조성물을 제조하기 위해 재조합 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체-발현 숙주 세포를 사용하는 방법을 제공한다.
본 발명의 하나의 측면은 지방산에서 ω-하이드록실화 (ω-OH) 지방산 또는 지방산 유도체으로의 전환을 촉매하는 CYP153A-환원효소 혼성 융합 폴리펩티드를 제공하며, 여기서, CYP153A-환원효소 혼성 융합 폴리펩티드는 서열번호 6의 폴리펩티드 서열에 대해 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. CYP153A-환원효소 혼성 융합 폴리펩티드 및 이의 변이체를 발현시키는 방법이 추가로 포함된다. 하나의 측면에서, CYP153A-환원효소 혼성 융합 폴리펩티드는 서열번호 6에 대해 적어도 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 가지며, 재조합 숙주 세포에서의 CYP153A-환원효소 혼성 융합 폴리펩티드의 발현은 야생형 CYP153A의 발현에 의해 생산된 역가와 비교하여 더 높은 역가의 ω-OH 지방산 또는 지방산 유도체 또는 이의 조성물을 야기한다. 하나의 측면에서, 재조합 숙주 세포는, CYP153A-환원효소 혼성 융합 폴리펩티드를 발현하기에 효과적인 조건하에서 탄소 공급원을 함유하는 배지에서 배양되는 경우, 상응하는 야생형 CYP153A를 발현하는 숙주 세포에 의해 생산된 ω-OH 지방산 또는 ω-OH 지방산 유도체 또는 이의 조성물의 역가보다 적어도 약 10% 더 큰 역가를 갖는 ω-OH 지방산 또는 ω-OH 지방산 유도체 또는 이의 조성물을 생산한다. 또 다른 측면에서, ω-OH 지방산 또는 ω-OH 지방산 유도체 또는 이의 조성물은 세포외에서 생산된다.
본 발명의 또 다른 측면은 서열번호 6에 대해 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖고 위치 796, 141, 231, 27, 82, 178, 309, 407, 415, 516 및/또는 666을 포함한 아미노산 위치에 적어도 하나의 돌연변이를 갖는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 제공하며, 여기서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 지방산에서 ω-OH 지방산으로의 전환을 촉매한다. CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 알라닌(A)이 발린(V)으로 치환(, 대체)된 위치 A796V; 발린이 이소류신(I)으로 치환된 위치 V141I; 발린(V)이 글루타민(Q)으로 치환된 위치 V141Q; 발린(V)이 글리신(G)으로 치환된 위치 V141G; 발린(V)이 메티오닌(M)으로 치환된 위치 V141M; 발린(V)이 류신(L)으로 치환된 위치 V141L; 발린(V)이 트레오닌(T)으로 치환된 위치 V141T; 알라닌(A)이 트레오닌(T)으로 치환된 위치 A231T; 아르기닌(R)이 리신(L)으로 치환된 위치 R27L; 아르기닌(R)이 아스파르트산(D)으로 치환된 위치 R82D; 아르기닌(R)이 아스파라긴(N)으로 치환된 위치 R178N; 아스파라긴(N)이 아르기닌(R)으로 치환된 위치 N309R; 아스파라긴(N)이 알라닌(A)으로 치환된 위치 N407A; 발린(V)이 아르기닌(R)으로 치환된 위치 V415R; 트레오닌(T)이 발린(V)으로 치환된 위치 T516V; 프롤린(P)이 알라닌(A)으로 치환된 위치 P666A; 및 프롤린(P)이 아스파르트산(D)으로 치환된 위치 P666D를 포함한 상기 위치들 중의 임의의 하나 이상에 돌연변이를 갖는다. CYP153A-환원효소 혼성 융합 폴리펩티드 변이체의 예는 서열번호 8, 서열번호 10, 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28 또는 서열번호 30, 서열번호 32, 서열번호 34, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42, 서열번호 44 및 서열번호 46을 포함한다. 하나의 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 혼성 cyp153A-RedRhF-타입 융합 단백질 변이체이다. 또 다른 실시형태에서, 재조합 숙주 세포에서 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 상응하는 숙주 세포에서 CYP153A-환원효소 혼성 융합 폴리펩티드의 발현에 의해 생산된 ω-OH 지방산 또는 ω-OH 지방산 유도체 또는 이의 조성물의 역가와 비교하여 더 높은 역가의 ω-OH 지방산 또는 ω-OH 지방산 유도체 또는 이의 조성물을 야기한다. 또 다른 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 A796V를 포함한 아미노산 위치 796에 돌연변이를 갖는다. 또 다른 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 A231T를 포함한 아미노산 위치 231에 돌연변이를 갖는다. 또 다른 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 V141I 및/또는 V141T를 포함한 아미노산 위치 141에 돌연변이를 갖는다. 본원에서, 재조합 숙주 세포에서 돌연변이 A796V, V141I, V141T 및/또는 A231T를 갖는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체의 발현은 CYP153A-환원효소 혼성 융합 폴리펩티드의 발현에 의해 생산된 ω-OH C12 또는 C16 지방산의 역가와 비교하여, 각각 더 높은 역가의 ω-OH C12 또는 C16 지방산을 야기한다.
본 발명은 상기한 바와 같은 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체(상기)를 발현하는 재조합 숙주 세포를 갖는 세포 배양물을 추가로 고려한다. ω-OH 지방산 또는 지방산 유도체 또는 이의 조성물은 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19 및 C20 ω-OH 지방산 또는 지방산 유도체 중의 하나 이상을 포함할 수 있다. ω-OH 지방산 또는 지방산 유도체 또는 이의 조성물은 포화 또는 불포화 ω-OH 지방산 또는 지방산 유도체를 포함할 수 있다. 또 다른 실시형태에서, ω-OH 지방산 또는 지방산 유도체 또는 이의 조성물은 C8 :1, C9 :1, C10 :1, C11:1, C12 :1, C13 :1, C14 :1, C15 :1, C16 :1, C17 :1, C18 :1, C19 :1 및 C20 :1 불포화 ω-OH 지방산 또는 지방산 유도체 중의 하나 이상을 포함할 수 있다. 또 다른 실시형태에서, ω-OH 지방산 또는 지방산 유도체 또는 이의 조성물은 ω-OH C12 및/또는 C16 및/또는 C16 :1 지방산 또는 지방산 유도체를 포함할 수 있다.
본 발명의 또 다른 측면은 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체(상기)를 발현하는 숙주 세포를 탄소 공급원과 배양하는 단계; 및 ω-OH 지방산 또는 ω-OH 지방산 유도체를 수확하는 단계를 포함하는, 역가 증가를 갖는 ω-OH 지방산 또는 지방산 유도체 또는 이의 조성물을 제조하는 방법을 제공한다. 하나의 측면에서, ω-OH 지방산 또는 지방산 유도체는 CYP153A-환원효소 혼성 융합 폴리펩티드-발현 숙주 세포에 의해 생산된 ω-OH 지방산 또는 지방산 유도체의 역가보다 적어도 약 20% 내지 30% 더 높다. 또 다른 측면에서, ω-OH 지방산 또는 지방산 유도체 또는 이의 조성물은 탄소 공급원으로부터 약 15g/L 내지 약 25g/L의 역가로 제조된다.
본 발명의 또 다른 측면은 V141I 및 A231T에 돌연변이를 갖는 서열번호 32에 대해 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 제공하며, 여기서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 지방산에서 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9 :1, C10 :1, C11 :1, C12:1, C13 :1, C14 :1, C15 :1, C16 :1, C17 :1, C18 :1, C19 :1 및/또는 C20 :1 지방산 또는 지방산 유도체 또는 이의 조성물로의 전환을 촉매한다. 본 발명의 또 다른 측면은 R27L, R82D, V141M, R178N 및 N407A에 돌연변이를 갖는 서열번호 34에 대해 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 제공하며, 여기서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 지방산에서 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9 :1, C10 :1, C11 :1, C12 :1, C13 :1, C14:1, C15 :1, C16 :1, C17 :1, C18 :1, C19 :1 및/또는 C20 :1 지방산 또는 지방산 유도체 또는 이의 조성물로의 전환을 촉매한다. 본 발명의 또 다른 측면은 P666A에 돌연변이를 갖는 서열번호 36에 대해 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 제공하며, 여기서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 지방산에서 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9 :1, C10:1, C11 :1, C12 :1, C13 :1, C14 :1, C15 :1, C16 :1, C17 :1, C18 :1, C19 :1 및/또는 C20 :1 지방산 또는 지방산 유도체 또는 이의 조성물로의 전환을 촉매한다. 본 발명의 또 다른 측면은 A796V에 돌연변이를 갖는 서열번호 38에 대해 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 제공하며, 여기서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 지방산에서 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9 :1, C10 :1, C11 :1, C12 :1, C13 :1, C14 :1, C15 :1, C16 :1, C17 :1, C18 :1, C19 :1 및/또는 C20 :1 지방산 또는 지방산 유도체 또는 이의 조성물로의 전환을 촉매한다. 본 발명의 또 다른 측면은 A796V, P666D 및 T516V에 돌연변이를 갖는 서열번호 40에 대해 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 제공하며, 여기서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 지방산에서 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9 :1, C10 :1, C11 :1, C12 :1, C13:1, C14 :1, C15 :1, C16 :1, C17 :1, C18 :1, C19 :1 및/또는 C20 :1 지방산 또는 지방산 유도체 또는 이의 조성물로의 전환을 촉매한다. 본 발명의 또 다른 측면은 V141I, A231T 및 A796V에 돌연변이를 갖는 서열번호 42에 대해 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 제공하며, 여기서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 지방산에서 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9 :1, C10 :1, C11 :1, C12 :1, C13 :1, C14 :1, C15 :1, C16 :1, C17 :1, C18 :1, C19:1 및/또는 C20 :1 지방산 또는 지방산 유도체 또는 이의 조성물로의 전환을 촉매한다. 본 발명의 또 다른 측면은 R27L, R82D, V141M, R178N, N407A 및 A796V에 돌연변이를 갖는 서열번호 44에 대해 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 제공하며, 여기서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 지방산에서 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8:1, C9 :1, C10 :1, C11 :1, C12 :1, C13 :1, C14 :1, C15 :1, C16 :1, C17 :1, C18 :1, C19 :1 및/또는 C20 :1 지방산 또는 지방산 유도체 또는 이의 조성물로의 전환을 촉매한다. 본 발명의 또 다른 측면은 V141T, A231T 및 A796V에 돌연변이를 갖는 서열번호 46에 대해 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 제공하며, 여기서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 지방산에서 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9 :1, C10 :1, C11 :1, C12 :1, C13 :1, C14:1, C15 :1, C16 :1, C17 :1, C18 :1, C19 :1 및/또는 C20 :1 지방산 또는 지방산 유도체 또는 이의 조성물로의 전환을 촉매한다.
본 발명은 상기 논의된 바와 같은 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체(상기)를 발현하는 재조합 숙주 세포를 추가로 고려한다. 하나의 실시형태에서, 재조합 숙주 세포는 상기 논의된 바와 같은 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체(상기) 및 EC 3.1.2.- 또는 EC 3.1.1.5 또는 EC 3.1.2.14의 티오에스테라제 폴리펩티드를 발현하며, 여기서, 재조합 숙주 세포는, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 발현하는데 효과적인 조건하에서 탄소 공급원을 함유하는 배지에서 배양되는 경우, 상응하는 CYP153A-환원효소 혼성 융합 폴리펩티드를 발현하는 숙주 세포에 의해 생산된 ω-OH 지방산 또는 이의 조성물의 역가보다 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 또는 적어도 30% 더 높은 역가를 갖는 ω-OH 지방산 또는 이의 조성물을 생산한다. 하나의 실시형태에서, ω-OH 지방산 또는 이의 조성물은 약 15 g/L 내지 약 25 g/L의 역가로 생산될 수 있다. 또 다른 실시형태에서, ω-OH 지방산 또는 이의 조성물은 세포외에서 생산된다.
하나의 측면에서, 본 발명은 재생가능한 공급원료로부터 탄소 공급원의 존재하에 발효 브로쓰에서 성장되는 경우 생체내에서 ω-OH 지방산 또는 지방산 유도체를 생산하는 재조합 미생물을 포함하며, 상기 미생물은 EC 3.1.2.- 또는 EC 3.1.1.5 또는 3.1.2.14의 티오에스테라제를 포함하는 폴리펩티드; 및 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 암호화하는 적어도 두 개의 핵산 서열을 발현하도록 조작된 경로를 갖고, 여기서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 서열번호 8, 서열번호 10, 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42, 서열번호 44 및 서열번호 46 중의 어느 하나에 대해 적어도 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 하나의 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 자족성(self-sufficient) CYP153A-RedRhF 혼성 융합 단백질 변이체이다.
본 발명의 또 다른 측면은 상기 논의된 바와 같은 재조합 숙주 세포(상기)를 포함한 세포 배양물을 제공하며, 여기서, 세포 배양물은 ω-OH 지방산 또는 이의 조성물을 생산한다. 하나의 실시형태에서, 세포 배양물은 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9 :1, C10 :1, C11 :1, C12 :1, C13 :1, C14 :1, C15:1, C16 :1, C17 :1, C18 :1, C19 :1 및/또는 C20 :1 지방산 또는 지방산 유도체 또는 이의 조성물 중의 하나 이상을 포함하는 ω-OH 지방산을 생산한다. 하나의 실시형태에서, 세포 배양물은 불포화 ω-OH C16 :1 지방산 또는 이의 조성물을 생산한다. 또 다른 실시형태에서, 세포 배양물은 포화 ω-OH C16 지방산 또는 이의 조성물을 생산한다. 하나의 실시형태에서, 세포 배양물은 불포화 ω-OH C12 :1 지방산 또는 이의 조성물을 생산한다. 또 다른 실시형태에서, 세포 배양물은 포화 ω-OH C12 지방산 또는 이의 조성물을 생산한다. 하나의 실시형태에서, 세포 배양물은 불포화 ω-OH C14 :1 지방산 또는 이의 조성물을 생산한다. 또 다른 실시형태에서, 세포 배양물은 포화 ω-OH C14 지방산 또는 이의 조성물을 생산한다. 하나의 실시형태에서, 세포 배양물은 불포화 ω-OH C18 :1 지방산 또는 이의 조성물을 생산한다. 또 다른 실시형태에서, 세포 배양물은 포화 ω-OH C18 지방산 또는 이의 조성물을 생산한다. 하나의 실시형태에서, 세포 배양물은 불포화 ω-OH C10 :1 지방산 또는 이의 조성물을 생산한다. 또 다른 실시형태에서, 세포 배양물은 포화 ω-OH C10 지방산 또는 이의 조성물을 생산한다. 하나의 실시형태에서, 세포 배양물은 불포화 ω-OH C8 :1 지방산 또는 이의 조성물을 생산한다. 또 다른 실시형태에서, 세포 배양물은 포화 ω-OH C8 지방산 또는 이의 조성물을 생산한다. 하나의 실시형태에서, 세포 배양물은 불포화 ω-OH C20 :1 지방산 또는 이의 조성물을 생산한다. 또 다른 실시형태에서, 세포 배양물은 포화 ω-OH C20 지방산 또는 이의 조성물을 생산한다. 또 다른 실시형태에서, 추가의 포화 또는 불포화 ω-OH 지방산 또는 이의 조성물은 재조합 숙주 세포에 의해 생산된다.
본 발명의 여전히 또 다른 측면은 숙주 세포(상기)를 탄소 공급원과 배양하는 단계; 및 ω-OH 지방산 또는 이의 조성물을 수확하는 단계를 포함하는, 역가 증가를 갖는 ω-OH 지방산을 제조하는 방법을 제공한다. 상기 방법은 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9 :1, C10 :1, C11 :1, C12 :1, C13 :1, C14:1, C15 :1, C16 :1, C17 :1, C18 :1, C19 :1 및/또는 C20 :1 지방산 또는 지방산 유도체 또는 이의 조성물인 ω-OH 지방산을 수확함을 고려한다. 하나의 실시형태에서, 수확된 ω-OH 지방산은 불포화 ω-OH C16 :1 지방산 또는 이의 조성물이다. 또 다른 실시형태에서, 수확된 ω-OH 지방산은 포화 ω-OH C16 지방산 또는 이의 조성물이다. 하나의 실시형태에서, 수확된 ω-OH 지방산은 불포화 ω-OH C12 :1 지방산 또는 이의 조성물이다. 또 다른 실시형태에서, 수확된 ω-OH 지방산은 포화 ω-OH C12 지방산 또는 이의 조성물이다. 하나의 실시형태에서, 수확된 ω-OH 지방산은 불포화 ω-OH C14:1 지방산 또는 이의 조성물이다. 또 다른 실시형태에서, 수확된 ω-OH 지방산은 포화 ω-OH C14 지방산 또는 이의 조성물이다. 하나의 실시형태에서, 수확된 ω-OH 지방산은 불포화 ω-OH C18 :1 지방산 또는 이의 조성물이다. 또 다른 실시형태에서, 수확된 ω-OH 지방산은 포화 ω-OH C18 지방산 또는 이의 조성물이다. 하나의 실시형태에서, 수확된 ω-OH 지방산은 불포화 ω-OH C10 :1 지방산 또는 이의 조성물이다. 또 다른 실시형태에서, 수확된 ω-OH 지방산은 포화 ω-OH C10 지방산 또는 이의 조성물이다. 하나의 실시형태에서, 수확된 ω-OH 지방산은 불포화 ω-OH C8 :1 지방산 또는 이의 조성물이다. 또 다른 실시형태에서, 수확된 ω-OH 지방산은 포화 ω-OH C8 지방산 또는 이의 조성물이다. 하나의 실시형태에서, 수확된 ω-OH 지방산은 불포화 ω-OH C20 :1 지방산 또는 이의 조성물이다. 또 다른 실시형태에서, 수확된 ω-OH 지방산은 포화 ω-OH C20 지방산 또는 이의 조성물이다. 또 다른 실시형태에서, 추가의 포화 또는 불포화 ω-OH 지방산 또는 이의 조성물은 본원에 기재된 방법으로 생산된다.
본 발명의 또 다른 측면은 서열번호 38에 대해 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖고 위치 9, 10, 11, 12, 13, 14, 27, 28, 56, 61, 111, 119, 140, 149, 154, 157, 162, 164, 204, 231, 233, 244, 254, 271, 273, 302, 309, 327, 407, 413, 477, 480, 481, 527, 544, 546, 557, 567, 591, 648, 649, 703, 706, 707, 708, 709, 710, 719, 720, 736, 741, 745, 747, 749, 757, 770, 771, 784를 포함한 아미노산 위치에 적어도 하나의 돌연변이를 갖는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 제공하며, 여기서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 지방산에서 ω-OH 지방산 또는 이의 조성물로의 전환을 촉매한다. CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 아스파르테이트(D)가 아스파라긴(N)으로 치환(, 대체)된 위치 D9N; 아스파르테이트(D)가 리신(K)으로 치환된 위치 D9K; 아스파르트산(D)이 티로신(Y)으로 치환된 위치 D10Y; 이소류신(I)이 류신(L)으로 치환된 위치 I11L; 글루타민(Q)이 트립토판(W)으로 치환된 위치 Q12W; 글루타민(Q)이 아르기닌(R)으로 치환된 위치 Q12R; 글루타민(Q)이 트레오닌(T)으로 치환된 위치 Q12T; 세린(S)이 리신(K)으로 치환된 위치 S13K; 아르기닌(R)이 페닐알라닌(F)으로 치환된 위치 R14F; 아르기닌(R)이 류신(L)으로 치환된 위치 R27L; 글루타민(Q)이 메티오닌(M)으로 치환된 위치 Q28M; 글루타민(Q)이 트레오닌(T)으로 치환된 위치 Q28T; 프롤린(P)이 글루타민(Q)으로 치환된 위치 P56Q; 아스파라긴(N)이 류신(L)으로 치환된 위치 N61L; 페닐알라닌(F)이 알라닌(A)으로 치환된 위치 F111A; 리신(K)이 아르기닌(R)으로 치환된 위치 K119R; 세린(S)이 아스파라긴(N)으로 치환된 위치 S140N; 프롤린(P)이 글리신(G)으로 치환된 위치 P149G; 프롤린(P)이 아르기닌(R)으로 치환된 위치 P149R; 발린(V)이 글리신(G)으로 치환된 위치 V154G; 세린(S)이 아르기닌(R)으로 치환된 위치 S157R; 발린(V)이 시스테인(C)으로 치환된 위치 V162C; 알라닌(A)이 아스파라긴(N)으로 치환된 위치 A164N; 글리신(G)이 발린(V)으로 치환된 위치 G204V; 알라닌(A)이 트립토판(W)으로 치환된 위치 A231W; 알라닌(A)이 티로신(Y)으로 치환된 위치 A231Y; 알라닌(A)이 발린(V)으로 치환된 위치 A231V; 세린(S)이 류신(L)으로 치환된 위치 S233L; 세린(S)이 발린(V)으로 치환된 위치 S233V; 알라닌(A)이 아르기닌(R)으로 치환된 위치 A244R; 아르기닌(R)이 글리신(G)으로 치환된 위치 R254G; 글루타메이트(E)가 아스파르테이트(D)로 치환된 위치 E271D; 프롤린(P)이 메티오닌(M)으로 치환된 위치 P273M; 트레오닌(T)이 메티오닌(M)으로 치환된 위치 T302M; 아스파라긴(N)이 세린(S)으로 치환된 위치 N309S; 프롤린(P)이 아스파르테이트(D)로 치환된 위치 P327D; 아스파라긴(N)이 글리신(G)으로 치환된 위치 N407G; 티로신(Y)이 아르기닌(R)으로 치환된 위치 Y413R; 프롤린(P)이 글리신(G)으로 치환된 위치 P477G; 이소류신(I)이 글리신(G)으로 치환된 위치 I480G; 글리신(G)이 이소류신(I)으로 치환된 위치 G481I; 아스파르테이트(D)가 글루타메이트(E)로 치환된 위치 D527E; 아스파르테이트(D)가 아스파라긴(N)으로 치환된 위치 D544N; 프롤린(P)이 글리신(G)으로 치환된 위치 P546G; 글루타메이트(E)가 아르기닌(R)으로 치환된 위치 E557R; 글루타메이트(E)가 트립토판(W)으로 치환된 위치 E557W; 글루타메이트(E)가 세린(S)으로 치환된 위치 E567S; 글루타메이트(E)가 글루타민(Q)으로 치환된 위치 E591Q; 발린(V)이 류신(L)으로 치환된 위치 V648L; 세린(S)이 이소류신(I)으로 치환된 위치 S649I; 류신(L)이 글리신(G)으로 치환된 위치 L703G; 류신(L)이 글루타메이트(E)로 치환된 위치 L706E; 류신(L)이 세린(S)으로 치환된 위치 L706S; 류신(L)이 히스티딘(H)으로 치환된 위치 L706H; 아스파르테이트(D)가 글루타메이트(E)로 치환된 위치 D707E; 프롤린(P)이 세린(S)으로 치환된 위치 P708S; 아스파르테이트(D)가 류신(L)으로 치환된 위치 D709L; 발린(V)이 시스테인(C)으로 치환된 위치 V710C; 발린(V)이 아르기닌(R)으로 치환된 위치 V710R; 발린(V)이 글루타민(Q)으로 치환된 위치 V710Q; 아르기닌(R)이 트립토판(W)으로 치환된 위치 R719W; 아스파르테이트(D)가 발린(V)으로 치환된 위치 D720V; 알라닌(A)이 발린(V)으로 치환된 위치 A736V; 아스파라긴(N)이 글리신(G)으로 치환된 위치 N741G; 프롤린(P)이 리신(K)으로 치환된 위치 P745K; 프롤린(P)이 아르기닌(R)으로 치환된 위치 P745R; 아스파르테이트(D)가 아스파라긴(N)으로 치환된 위치 D747N; 글루타메이트(E)가 류신(L)으로 치환된 위치 E749L; 글루타메이트(E)가 메티오닌(M)으로 치환된 위치 E749M; 글루타메이트(E)가 알라닌(A)으로 치환된 위치 E757A; 트레오닌(T)이 글리신(G)으로 치환된 위치 T770G; 발린(V)이 페닐알라닌(F)으로 치환된 위치 V771F; 및 메티오닌(M)이 이소류신(I)으로 치환된 위치 M784I를 포함한 상기 위치들 중의 하나 이상에 돌연변이를 갖는다. 하나의 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 혼성 cyp153A-RedRhF-타입 융합 단백질 변이체이다. 또 다른 실시형태에서, 재조합 숙주 세포에서 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 상응하는 숙주 세포에서 CYP153A-환원효소 혼성 융합 폴리펩티드의 발현에 의해 생산된 ω-OH 지방산의 역가와 비교하여 더 높은 역가의 ω-OH 지방산을 야기한다. 또 다른 실시형태에서, ω-OH 지방산은 ω-OH 지방산 조성물이다.
본 발명의 또 다른 측면은 서열번호 38에 대해 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖고 위치 747, 12, 327, 14, 61, 28, 13, 771, 119, 10, 11, 28, 745, 9, 770, 413, 784, 749, 233, 757, 및 703을 포함한 아미노산 위치에 적어도 하나의 돌연변이를 갖는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 제공하며, 여기서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 지방산에서 ω-OH 지방산으로의 전환을 촉매한다. CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 아스파르테이트(D)가 아스파라긴(N)으로 치환된 위치 D747N; 글루타민(Q)이 트립토판(W)으로 치환된 위치 Q12W; 글루타민(Q)이 아르기닌(R)으로 치환된 위치 Q12R; 글루타민(Q)이 트레오닌(T)으로 치환된 위치 Q12T; 프롤린(P)이 아스파르테이트(D)로 치환된 위치 P327D; 아르기닌(R)이 페닐알라닌(F)으로 치환된 위치 R14F; 아스파라긴(N)이 류신(L)으로 치환된 위치 N61L; 글루타민(Q)이 메티오닌(M)으로 치환된 위치 Q28M; 세린(S)이 리신(K)으로 치환된 위치 S13K; 발린(V)이 페닐알라닌(F)으로 치환된 위치 V771F; 리신(K)이 아르기닌(R)으로 치환된 위치 K119R; 아스파르트산(D)이 티로신(Y)으로 치환된 위치 D10Y; 이소류신(I)이 류신(L)으로 치환된 위치 I11L; 글루타민(Q)이 트레오닌(T)으로 치환된 위치 Q28T; 프롤린(P)이 아르기닌(R)으로 치환된 위치 P745R; 아스파르테이트(D)가 아스파라긴(N)으로 치환된 위치 D9N; 아스파르테이트(D)가 리신(K)으로 치환된 위치 D9K; 트레오닌(T)이 글리신(G)으로 치환된 위치 T770G; 티로신(Y)이 아르기닌(R)으로 치환된 위치 Y413R; 메티오닌(M)이 이소류신(I)으로 치환된 위치 M784I; 글루타메이트(E)가 류신(L)으로 치환된 위치 E749L; 세린(S)이 류신(L)으로 치환된 위치 S233L; 글루타메이트(E)가 알라닌(A)으로 치환된 위치 E757A; 및 류신(L)이 글리신(G)으로 치환된 위치 L703G를 포함한 상기 위치들 중의 하나 이상에 돌연변이를 갖는다. 하나의 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 혼성 cyp153A-RedRhF-타입 융합 단백질 변이체이다. 또 다른 실시형태에서, 재조합 숙주 세포에서 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 상응하는 숙주 세포에서 CYP153A-환원효소 혼성 융합 폴리펩티드의 발현에 의해 생산된 ω-OH 지방산의 역가와 비교하여 더 높은 역가의 ω-OH 지방산을 야기한다. 또 다른 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체(및 상응하는 폴리뉴클레오티드 서열)는 서열번호 47-96을 포함한다. 또 다른 실시형태에서, ω-OH 지방산은 ω-OH 지방산 조성물이다.
하나의 측면에서, 본 발명은 재생가능한 공급원료로부터 탄소 공급원의 존재하에 발효 브로쓰에서 성장되는 경우 생체내에서 ω-OH 지방산 또는 ω-OH 지방산 유도체를 생산하기 위한 재조합 미생물 또는 재조합 숙주 세포를 포함하며, 상기 미생물은 EC 3.1.2.- 또는 EC 3.1.1.5 또는 3.1.2.14의 티오에스테라제를 포함하는 폴리펩티드; 및 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 암호화하는 적어도 두 개의 핵산 서열을 발현하도록 조작된 경로를 갖고, 여기서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 서열번호 48, 서열번호 50, 서열번호 52, 서열번호 54, 서열번호 56 서열번호 58, 서열번호 60 서열번호 62, 서열번호 64, 서열번호 66, 서열번호 68, 서열번호 70, 서열번호 72, 서열번호 74, 서열번호 76, 서열번호 78, 서열번호 80, 서열번호 82, 서열번호 84, 서열번호 86, 서열번호 88, 서열번호 90, 서열번호 92, 서열번호 94, 및 서열번호 96 중의 어느 하나에 대해 적어도 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 하나의 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 자족성 CYP153A-RedRhF 혼성 융합 단백질 변이체이다.
본 발명의 또 다른 측면은 상기 논의된 바와 같은 재조합 숙주 세포(상기)를 포함하는 세포 배양물을 제공하며, 여기서, 세포 배양물은 ω-OH 지방산 또는 이의 조성물을 생산한다. 하나의 실시형태에서, 세포 배양물은 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9 :1, C10 :1, C11 :1, C12 :1, C13 :1, C14 :1, C15:1, C16 :1, C17 :1, C18 :1, C19 :1 및/또는 C20 :1 지방산 또는 지방산 유도체 또는 이의 조성물 중의 하나 이상을 포함하는 ω-OH 지방산을 생산한다. 하나의 실시형태에서, 세포 배양물은 불포화 ω-OH C16 :1 지방산 또는 이의 조성물을 생산한다. 또 다른 실시형태에서, 세포 배양물은 포화 ω-OH C16 지방산 또는 이의 조성물을 생산한다. 하나의 실시형태에서, 세포 배양물은 불포화 ω-OH C12 :1 지방산 또는 이의 조성물을 생산한다. 또 다른 실시형태에서, 세포 배양물은 포화 ω-OH C12 지방산 또는 이의 조성물을 생산한다. 하나의 실시형태에서, 세포 배양물은 불포화 ω-OH C14 :1 지방산 또는 이의 조성물을 생산한다. 또 다른 실시형태에서, 세포 배양물은 포화 ω-OH C14 지방산 또는 이의 조성물을 생산한다. 하나의 실시형태에서, 세포 배양물은 불포화 ω-OH C18 :1 지방산 또는 이의 조성물을 생산한다. 또 다른 실시형태에서, 세포 배양물은 포화 ω-OH C18 지방산 또는 이의 조성물을 생산한다. 하나의 실시형태에서, 세포 배양물은 불포화 ω-OH C10 :1 지방산 또는 이의 조성물을 생산한다. 또 다른 실시형태에서, 세포 배양물은 포화 ω-OH C10 지방산 또는 이의 조성물을 생산한다. 하나의 실시형태에서, 세포 배양물은 불포화 ω-OH C8 :1 지방산 또는 이의 조성물을 생산한다. 또 다른 실시형태에서, 세포 배양물은 포화 ω-OH C8 지방산 또는 이의 조성물을 생산한다. 하나의 실시형태에서, 세포 배양물은 불포화 ω-OH C20:1 지방산 또는 이의 조성물을 생산한다. 또 다른 실시형태에서, 세포 배양물은 포화 ω-OH C20 지방산 또는 이의 조성물을 생산한다. 또 다른 실시형태에서, 추가의 포화 또는 불포화 ω-OH 지방산 또는 이의 조성물은 재조합 숙주 세포에 의해 생산된다.
본 발명의 여전히 또 다른 측면은 숙주 세포(상기)를 탄소 공급원과 배양하는 단계; 및 ω-OH 지방산 또는 이의 조성물을 수확하는 단계를 포함하는, 역가 증가를 갖는 ω-OH 지방산을 제조하는 방법을 제공한다. 특히, 상기 방법은 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9 :1, C10 :1, C11 :1, C12:1, C13 :1, C14 :1, C15 :1, C16 :1, C17 :1, C18 :1, C19 :1 및/또는 C20 :1 지방산 또는 지방산 유도체 또는 이의 조성물을 제조함을 포함한다. 하나의 실시형태에서, 수확된 ω-OH 지방산은 불포화 ω-OH C16 :1 지방산 또는 이의 조성물이다. 또 다른 실시형태에서, 수확된 ω-OH 지방산은 포화 ω-OH C16 지방산 또는 이의 조성물이다. 하나의 실시형태에서, 수확된 ω-OH 지방산은 불포화 ω-OH C12 :1 지방산 또는 이의 조성물이다. 또 다른 실시형태에서, 수확된 ω-OH 지방산은 포화 ω-OH C12 지방산 또는 이의 조성물이다. 하나의 실시형태에서, 수확된 ω-OH 지방산은 불포화 ω-OH C14 :1 지방산 또는 이의 조성물이다. 또 다른 실시형태에서, 수확된 ω-OH 지방산은 포화 ω-OH C14 지방산 또는 이의 조성물이다. 하나의 실시형태에서, 수확된 ω-OH 지방산은 불포화 ω-OH C18 :1 지방산 또는 이의 조성물이다. 또 다른 실시형태에서, 수확된 ω-OH 지방산은 포화 ω-OH C18 지방산 또는 이의 조성물이다. 하나의 실시형태에서, 수확된 ω-OH 지방산은 불포화 ω-OH C10 :1 지방산 또는 이의 조성물이다. 또 다른 실시형태에서, 수확된 ω-OH 지방산은 포화 ω-OH C10 지방산 또는 이의 조성물이다. 하나의 실시형태에서, 수확된 ω-OH 지방산은 불포화 ω-OH C8 :1 지방산 또는 이의 조성물이다. 또 다른 실시형태에서, 수확된 ω-OH 지방산은 포화 ω-OH C8 지방산 또는 이의 조성물이다. 하나의 실시형태에서, 수확된 ω-OH 지방산은 불포화 ω-OH C20 :1 지방산 또는 이의 조성물이다. 또 다른 실시형태에서, 수확된 ω-OH 지방산은 포화 ω-OH C20 지방산 또는 이의 조성물이다. 하나의 실시형태에서, 수확된 ω-OH 지방산은 불포화 ω-OH C22 :1 지방산 또는 이의 조성물이다. 또 다른 실시형태에서, 수확된 ω-OH 지방산은 포화 ω-OH C22 지방산 또는 이의 조성물이다.
본 발명은 몇몇 바람직한 실시형태들을 예시하기 위한 작용을 하는 첨부된 도면을과 함께 판독할 때 가장 잘 이해된다. 그러나, 본 발명이 도면에 개시된 특정 실시형태들로 제한되지 않는 것으로 이해된다.
도 1은 재조합 미생물에서 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체 및 티오에스테라제 폴리펩티드를 발현시킨 결과로서, 예를 들면, ω-하이드록실화 C12 지방산 (ω-OH C12 FFA) 및/또는 ω-하이드록실화 C16 :1 지방산 (ω-OH C16 :1 FFA)과 같은 ω-하이드록실화 지방산 유도체의 제조를 위한 예시적인 생합성 경로의 개략적인 개요이다. FAB는 미생물에서의 지방산 생합성을 나타내고; fatB1은 캘리포니아만 월계수(Umbellularia californica)(캘리포니아만)으로부터의 중쇄 아실-ACP 티오에스테라제를 나타내고; fatA3은 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터의 장쇄 아실-ACP 티오에스테라제를 나타낸다.
도 2는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체의 발현의 결과로서의 ω-하이드록실화 지방산의 제조의 예를 제공한다. 변이체를 통한 ω-하이드록실화(ω-OH) 지방산의 제조를 예시하기 위해 부위 포화 돌연변이유발이 사용되었다. 도시된 그래프는 cyp153A(G307A, A796V)-Red450RhF의 아미노산 위치 141 및 309의 부위 포화 돌연변이유발로부터의 최고 히트를 보여준다. 도면은 총 지방산 화학종(총 FAS)(진회색 막대 참조); ω-하이드록시 헥사데센산(ω-OH C16:1)(담회색 막대 참조); 및 ω-하이드록시 지방산 퍼센트(% ω-OH FFA)(화살표 참조)를 나타낸다.
일반적인 개요
석유화학제품에 대한 우리의 의존도를 없애는 한 가지 방법은 미니어처(miniature) 생산 숙주로서 작용하는 환경 친화적인 미생물을 통해 ω-OH 지방산 유도체와 같은 지방산 유도체를 생산하는 것이다. 이러한 세포 숙주(, 재조합 숙주 세포 또는 미생물)는 재생가능한 공급원료(예컨대, 발효성 탄수화물, 바이오매스, 셀룰로스, 글리세롤, CO, CO2, )와 같은 재생가능한 공급원으로부터 ω-OH 지방산 유도체 및 이관능성 지방산 유도체를 생산하도록 조작된다. 이러한 ω-OH 지방산 유도체가 특수 화학물질, 중합체 및 향을 포함한 산업 제품을 위한 원료이다.
본 발명은 재조합 숙주 세포에서 발현되는 경우 ω-OH 지방산 유도체 조성물의 높은 역가, 수율 및/또는 생산성을 초래하는 CYP153A-환원효소 혼성 융합 폴리펩티드 및 이의 변이체를 포함하는 ω-하이드록실라제-관련 융합 폴리펩티드에 관한 것이다. 본원에서, 증진된 ω-OH 지방산 유도체 생합성은 지방산에서 ω-OH 지방산, 예를 들면, ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8 :1, C9 :1, C10 :1, C11 :1, C12 :1, C13 :1, C14 :1, C15 :1, C16 :1, C17 :1, C18 :1, C19 :1 및/또는 C20 :1 지방산 또는 지방산 유도체로의 반응을 촉매하는 CYP153A-환원효소 혼성 융합 폴리펩티드 또는 이의 변이체를 발현하도록 숙주 세포를 변형시킴으로써 달성된다. 본 발명은 CYP153A-환원효소 혼성 융합 폴리펩티드 및 이의 변이체를 발현하는 재조합 숙주 세포 또는 생산 균주를 포함한다. 하나의 측면에서, 본 발명은 P450 서브패밀리 cyp153A에 관한 것이다.
정의
본 명세서 및 첨부된 청구항에서 사용되는 바와 같이, 단수형 "a", "an" 및"the"는, 문맥이 명백히 달리 나타내지 않는 한, 복수 지시대상을 포함한다. 따라서, 예를 들면, "하나의 숙주 세포(a host cell)"에 대한 언급은 둘 이상의 이러한 숙주 세포를 포함하고, "하나의 지방 에스테르(a fatty ester)"에 대한 언급은 하나 이상의 지방 에스테르, 또는 에스테르의 혼합물을 포함하며, 하나의 핵산 서열(a nucleic acid 서열)"에 대한 언급은 하나 이상의 핵산 서열을 포함하고, "하나의 효소(an enzyme)"에 대한 언급은 하나 이상의 효소를 포함하는 등이다.
용어 "효소 분류(EC) 번호"는 특정 효소 활성을 나타내는 번호를 말한다. EC 번호는 효소 명명법의 시스템 하에서 이들이 촉매하는 반응에 따라 효소를 분류한다. EC 번호는 효소-촉매된 반응을 특정화한다. 예를 들면, 상이한 유기체들로부터의 상이한 효소들이 동일한 반응을 촉매하는 경우, 이들은 동일한 EC 번호를 갖는다. 또한, 상이한 단백질 폴드가 동일한 반응을 촉매할 수 있고, 따라서, 동일한 EC 번호(예컨대, 비상동성 동기능 효소, 또는 NISE)가 할당될 것이다. EC 번호는 생화학 및 분자생물학 국제 연합(IUBMB)의 명명 위원회에 의해 확립되며, 이의 설명은 월드 와이드 웹의 IUBMB 효소 명명 웹사이트에서 이용가능하다. 예를 들면, ω-하이드록실라제 또는 ω-옥시게나제 효소 활성을 포함한 시토크롬 P450 모노옥시게나제(P450) 효소 활성은 EC 1.14.15.3으로 분류된다. P450 효소 패밀리에 속하는 효소의 기능은 하나의 종으로부터 다음 종으로 대부분의 원핵생물에서 보존된다. 따라서, 상이한 미생물 종이 EC 1.14.15.3으로 분류된 동일한 효소 활성을 수행할 수 있다. EC 1.14.15.3에 의해 특성화된 효소 활성의 예는 본원에 논의된 바와 같은 CYP153A-환원효소 혼성 융합 폴리펩티드 또는 이의 변이체(상기)의 효소 활성이다.
용어 "오메가-하이드록실화 지방산" 또는 "ω-하이드록실화 지방산" 또는 "ω-하이드록시 지방산" 또는 "ω-하이드록실 지방산" 또는 "ω-OH 지방산" 또는 "ωOH 지방산"은 본원에서 상호교환 가능하게 사용되며, 지방산 대사로부터 기원하는 지방산을 나타내고 오메가(ω) 위치에 적어도 하나의 OH 그룹을 갖는다. 이러한 ω-하이드록실화 지방산의 예는 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9 :1, C10 :1, C11 :1, C12 :1, C13 :1, C14 :1, C15 :1, C16 :1, C17 :1, C18 :1, C19:1 및/또는 C20 :1 지방산이다. 하나의 실시형태에서, 이러한 ω-하이드록실화 지방산은 ω-OH C8 :0 지방산, ω-OH C10 :0 지방산, ω-OH C12 :0 지방산, ω-OH C14 :0 지방산, ω-OH C16 :0 지방산, ω-OH C18 :0 지방산, ω-OH C20 :0 지방산, ω-OH C8 :1 지방산, ω-OH C10 :1 지방산, ω-OH C12 :1 지방산, ω-OH C14 :1 지방산, ω-OH C16 :1 지방산, ω-OH C18 :1 지방산, ω-OH C20 :1 지방산 등이다. 미생물에서, ω-하이드록실화 지방산은 ω-하이드록실화 지방산 유도체, 예를 들면, ω-하이드록실화 지방 에스테르 뿐만 아니라 α,ω-이산, α,ω-디에스테르, 및 α,ω-디올을 포함한 이관능성 지방산 유도체를 제조하는데 사용될 수 있다. 그러한 점에서, 용어 "오메가-하이드록실화 지방산 유도체" 및 "ω-하이드록실화 지방산 유도체" 및 "ω-하이드록시 지방산 유도체" 및 "ω-하이드록실 지방산 유도체" 및 "α,ω-이관능성 지방산 유도체" 및 "ω-OH 지방산 유도체"는 지방산 대사로부터 기원하고 오메가 위치에 적어도 하나의 OH 그룹을 갖거나 오메가 위치에 적어도 하나의 OH 그룹을 갖는 중간체로부터 유도된 화학적 개체(chemical entity)를 나타낸다. 본원에서, "오메가(ω) 위치"는 이의 1차 관능기에 대해 반대쪽 단부에 있는 지방산 유도체의 말단 탄소 원자를 나타낸다. 이러한 ω-하이드록실화 지방산 유도체는 α,ω-이산; α,ω- 디에스테르; α,ω-디올 및 이의 유도된 화합물(예컨대, 매크로락톤)을 포함하지만, 이에 제한되지 않는다.
본원에 언급된 바와 같은 "ω-하이드록실화 지방산 조성물" 또는 "ω-OH 지방산 조성물"은 재조합 숙주 세포에 의해 생산되며 전형적으로 다양한 쇄 길이 및/또는 포화도 및/또는 분지 특성을 갖는 특정 유형의 ω-하이드록실화 지방산들의 혼합물을 포함한다. 유사하게, "ω-하이드록실화 지방산 유도체 조성물"은 재조합 숙주 세포에 의해 생산되며 전형적으로 다양한 쇄 길이 및/또는 포화도 및/또는 분지 특성을 갖는 특정 유형의 ω- 하이드록실화 지방산 유도체들(예컨대, 다양한 쇄 길이 및/또는 포화도 및/또는 분지 특성을 갖는 ω-하이드록실화 지방산; 다양한 쇄 길이 및/또는 포화도 및/또는 분지 특성을 갖는 ω-하이드록실화 지방 에스테르; 다양한 쇄 길이 및/또는 포화도 및/또는 분지 특성을 갖는 α,ω-이산; 다양한 쇄 길이 및/또는 포화도 및/또는 분지 특성을 갖는 α,ω-디에스테르; 다양한 쇄 길이 및/또는 포화도 및/또는 분지 특성을 갖는 α,ω-디올; 등)의 혼합물을 포함한다. 몇몇 경우에, ω-OH 지방산 유도체 조성물은 주로 한 가지 유형의 ω-OH 지방산 유도체, 예를 들면, 1,12-도데센디올, 또는 1,14-테트라데칸디올, 또는 16-하이드록시 헥사데칸산 메틸 에스테르, 또는 16-하이드록시 헥사데센산, 또는 15-하이드록시 펜타데칸산, EH는 15-하이드록시 펜타데센산, 또는 18-하이드록시 옥타데센산, 또는 이러한 지방산 유도체 중의 어느 것의 메틸 에스테르, 또는 기타를 포함한다. 여전히 또 다른 경우에, ω-OH 지방산 유도체 조성물은 특별하게 설계된 조성물을 제공하기 위해 하나 이상의 유형의 ω-OH 지방산 유도체들의 혼합물을 포함한다(예컨대, 동일한 조성물에서 약 20% 12-하이드록시 도데칸산 및 약 80% 1,14-14-하이드록시 테트라데칸산이 이러한 예를 제공한다).
용어 "수탁 번호" 또는 "NCBI 수탁 번호" 또는 "GenBank 수탁 번호"는 특정 핵산 서열을 표시하는 번호를 나타낸다. 당해 설명에 논의된 서열 수탁 번호는 U.S.A. 국립 보건원에 의해 운영되는 NCBI(미국 국립 생물공학 정보센터)에 의해 제공되는 데이터베이스로부터 그리고 (UniProtKB 수탁 번호라고도 하는) 스위스 생물정보학 연구소에 의해 제공되는 UniProt 지식베이스(UniProtKB) 및 Swiss-Prot 데이터베이스로부터 얻어졌다.
본원에서 사용되는 용어 "뉴클레오티드"는 헤테로사이클릭 염기, 당 및 하나 이상의 포스페이트 그룹으로 이루어진 폴리뉴클레오티드의 단량체 단위를 나타낸다. 자연적으로 발생하는 염기[구아닌(G), 아데닌(A), 시토신(C), 티민(T) 및 우라실(U)]은 전형적으로 퓨린 또는 피리미딘의 유도체이지만, 자연적으로 및 비-자연적으로 발생하는 염기 유사체(base analog)도 포함되는 것으로 이해하여야 한다. 자연적으로 발생하는 당은 펜토스(5-탄당)의 (DNA를 형성하는) 데옥시리보스 또는 (RNA를 형성하는) 리보스이지만, 자연적으로 및 비-자연적으로 발생하는 당 유사체도 포함되는 것으로 이해하여야 한다. 핵산은 전형적으로 핵산 또는 폴리뉴클레오티드를 형성하는 포스페이트 결합을 통해 연결되지만, 많은 다른 연결들(예를 들어, 포스포로티오에이트, 보라노포스페이트 등)이 당업계에 알려져 있다.
용어 "폴리뉴클레오티드"는 리보뉴클레오티드(RNA) 또는 데옥시리보뉴클레오티드(DNA)의 중합체를 나타내고, 이는 외가닥 또는 이중가닥일 수 있으며, 비-자연적 또는 변형된 뉴클레오티드를 함유할 수 있다. 용어 "폴리뉴클레오티드", "핵산 서열" 및 "뉴클레오티드 서열"은 어떠한 길이의 뉴클레오티드의 중합체 형태, RNA 또는 DNA 중 하나를 나타내는데 상호교환 가능하게 사용된다. 이들 용어는 분자의 일차 구조를 나타내며, 따라서 이중가닥 및 외가닥의 DNA, 및 이중가닥 및 외가닥의 RNA를 포함한다. 이 용어는 메틸화된 및/또는 캡핑된 폴리뉴클레오티드와 같지만 이로 제한되지 않는 변형된 폴리뉴클레오티드 및 뉴클레오티드 유사체로부터 만들어지는 RNA 또는 DNA 중 어느 하나의 유사체를 등가물로서 포함한다. 폴리뉴클레오티드는 플라스미드, 바이러스성, 염색체의, EST, cDNA, mRNA 및 rRNA를 포함하지만 이로 제한되지 않는 임의의 형태로 존재할 수 있다.
본원에서 사용되는 용어 "폴리펩티드" 및 "단백질"은 아미노산 잔기의 중합체를 나타내는데 상호교환 가능하게 사용된다. 용어 "재조합 폴리펩티드"는 재조합 기술에 의해 생성된 폴리펩티드를 나타내고, 여기서, 일반적으로 발현된 단백질을 암호화하는 DNA 또는 RNA는 숙주 세포를 형질전환하여 폴리펩티드를 생성하는데 사용되는 적합한 발현 벡터 내로 삽입된다. 유사하게, 용어 "재조합 폴리뉴클레오티드" 또는 "재조합 핵산" 또는 "재조합 DNA"는 당업계의 숙련가들에게 공지된 재조합 기술로 생산된다.
용어 "동족체" 및 "상동성"은 상응하는 폴리뉴클레오티드 또는 폴리펩티드 서열과 적어도 약 50퍼센트(%) 동일한 서열을 포함하는 폴리뉴클레오티드 또는 폴리펩티드를 나타낸다. 바람직하게는 상동성 폴리뉴클레오티드 또는 폴리펩티드는 상응하는 아미노산 서열 또는 폴리뉴클레오티드 서열과 적어도 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 약 99% 상동성인 폴리뉴클레오티드 서열 또는 아미노산 서열을 갖는다. 본원에서 사용되는 용어 서열 "상동성" 및 서열 "동일성"은 상호교환 가능하게 사용된다. 당업계의 통상의 숙련가는 둘 이상의 서열들 간의 상동성을 결정하는 방법을 잘 알고 있다. 간략하게, 두 서열들 간의 "상동성"의 계산은 다음과 같이 수행될 수 있다. 서열들은 최적의 비교 목적으로 정렬된다[예를 들어, 최적의 정렬을 위해 제1 및 제2 아미노산 또는 핵산 서열 중 하나 또는 둘 다에 갭(gap)이 도입될 수 있으며, 비교 목적을 위해 비-상동성 서열은 무시될 수 있다]. 하나의 바람직한 실시형태에서, 비교 목적을 위해 정렬된 제1 서열의 길이는 제2 서열의 길이의 적어도 약 30%, 바람직하게는 적어도 약 40%, 보다 바람직하게는 적어도 약 50%, 보다 더 바람직하게는 적어도 약 60%, 훨씬 더 바람직하게는 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%, 또는 약 100%이다. 그후, 제1 및 제2 서열의 상응하는 아미노산 위치 또는 뉴클레오티드 위치에 있는 아미노산 잔기 또는 뉴클레오티드를 비교한다. 제1 서열에서의 위치가 제2 서열에서의 상응하는 위치와 동일한 아미노산 잔기 또는 뉴클레오티드에 의해 점유되는 경우, 분자는 그 위치에서 동일하다. 두 서열들 간의 상동성 퍼센트는, 두 서열들의 최적의 정렬을 위해 도입될 필요가 있는 갭의 개수 및 각 갭의 길이를 고려한, 서열들에 의해 공유되는 동일한 위치의 개수의 함수이다. 두 서열들 간의 상동성 퍼센트의 결정 및 서열의 비교는 BLAST와 같은 수학적 알고리즘을 이용하여 달성될 수 있다(문헌 참조; Altschul et al. (1990) J. Mol. Biol . 215(3):403-410). 두 아미노산 서열들 간의 상동성 퍼센트 또한 Blossum 62 매트릭스 또는 PAM250 매트릭스 중 어느 하나, 그리고 16, 14, 12, 10, 8, 6 또는 4의 갭 중량(gap weight) 및 1, 2, 3, 4, 5 또는 6의 길이 중량(length weight)을 이용하는 GCG 소프트웨어 패키지의 GAP 프로그램에 통합된 Needleman 및 Wunsch 알고리즘을 사용하여 결정될 수 있다(문헌 참조; Needleman and Wunsch (1970) J. Mol . Biol. 48:444-453). 두 뉴클레오티드 서열들 간의 상동성 퍼센트 또한 NWSgapdna.CMP 매트릭스 그리고 40, 50, 60, 70 또는 80의 갭 중량 및 1, 2, 3, 4, 5 또는 6의 길이 중량을 이용하는 GCG 소프트웨어 패키지의 GAP 프로그램을 이용하여 결정될 수 있다. 당업계의 숙련가는 초기 상동성 계산을 수행할 수 있으며, 이에 따라 알고리즘 파라미터들을 조정할 수 있다. 바람직한 파라미터들의 세트(및, 당업자가, 분자가 청구항들의 상동성 제한 내에 있는지 여부를 결정하기 위해 어떤 파라미터들이 적용되어야 하는지에 대한 확신이 없는 경우에 사용되어야 하는 파라미터들의 세트)는 12의 갭 페널티(gap penalty), 4의 갭 확장 페널티 및 5의 프레임시프트 갭 페널티(frameshift gap penalty)를 갖는 Blossum 62 스코어링 매트릭스(scoring matrix)이다. 서열 정렬의 추가적인 방법들이 생물공학 분야에 알려져 있다(문헌 참조; 예컨대, Rosenberg (2005) BMC Bioinformatics 6:278; Altschul et al. (2005) FEBS J. 272(20):5101-5109).
용어 "저 엄격, 중간 엄격, 고 엄격, 또는 초고 엄격 조건 하에서 혼성화한다"는 혼성화 및 세척을 위한 조건을 설명한다. 혼성화 반응을 수행하기 위한 가이드는 문헌[참조; Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1 - 6.3.6]의 최신 프로토콜에서 찾을 수 있다. 수성 및 비수성 방법이 상기 참조문헌에 기재되어 있으며, 어느 하나의 방법이 사용될 수 있다. 본원에 언급된 구체적인 혼성화 조건은 다음과 같다: (1) 저 엄격 혼성화 조건 -- 약 45℃에서 6X 염화나트륨/시트르산나트륨(SSC)에 이어 적어도 50℃에서 0.2X SSC, 0.1% SDS로 2회 세척(세척의 온도는 저 엄격 조건의 경우 55℃로 상승될 수 있다); (2) 중간 엄격 혼성화 조건 -- 약 45℃에서 6X SSC에 이어 60℃에서 0.2X SSC, 0.1% SDS로 1회 이상 세척; (3) 고 엄격 혼성화 조건 -- 약 45℃에서 6X SSC에 이어 65℃에서 0.2.X SSC, 0.1% SDS로 1회 이상 세척; 및 (4) 초고 엄격 혼성화 조건 -- 65℃에서 0.5M 인산나트륨, 7% SDS에 이어 65℃에서 0.2X SSC, 1% SDS로 1회 이상 세척. 초고 엄격 조건(4)가 달리 명시되지 않는 한 바람직한 조건이다.
"내인성" 폴리펩티드는 부모 세포(또는 숙주 세포)의 게놈에 의해 암호화된 폴리펩티드를 나타낸다. "외인성" 폴리펩티드는 부모 세포의 게놈에 의해 암호화되지 않은 폴리펩티드를 나타낸다. 변이체 또는 돌연변이체 폴리펩티드가 외인성 폴리펩티드의 예이다. 따라서, 비자연적으로 발생하는 핵산 분자는 일단 세포에 도입되면 세포에 외인성인 것으로 간주된다. 자연적으로 발생하는 핵산 분자 또한 특정 세포에 외인성일 수 있다. 예를 들면, 세포 X로부터 단리된 전체 암호화 서열은 일단 그 암호화 서열이 세포 Y에 도입되면 X 및 Y가 동일한 세포 유형이더라도 세포 Y에 대해 외인성 핵산이다.
용어 "과발현된"은 유전자가 그 유전자에 대한 내인성 전사 속도에 비해 상승된 속도로 전사되게 함을 의미한다. 몇몇 예에서, 과발현은 또한 그 유전자에 대한 내인성 번역 속도에 비해 유전자의 상승된 번역 속도를 포함한다. 과발현에 대한 시험방법은 당업계에 널리 공지되어 있으며, 예를 들면, 전사된 RNA 수준은 rtPCR을 사용하여 평가될 수 있고 단백질 수준은 SDS page 겔 분석을 사용하여 평가될 수 있다.
용어 "이종(heterologous)"은 상이한 유기체, 상이한 세포 유형, 또는 상이한 종으로부터 유도됨을 의미한다. 본원에서 사용되는 바와 같이 이것은 소정의 유기체에서 자연적으로 존재하지 않는, 뉴클레오티드-, 폴리뉴클레오티드-, 폴리펩티드- 또는 단백질 서열을 나타낸다. 예를 들면, 시아노박테리아에 고유한 폴리뉴클레오티드 서열이 재조합 방법에 의해 대장균(E. coli)의 숙주 세포에 도입될 수 있으며, 그후 시아노박테리아로부터의 폴리뉴클레오티드는 대장균 세포(예컨대, 재조합 세포)에 대해 이종이다. 용어 "이종"은 또한 비-천연 상태(non-native state)로 재조합 숙주 세포에 존재하는 뉴클레오티드-, 폴리뉴클레오티드-, 폴리펩티드-, 또는 단백질 서열에 관해 사용될 수 있다. 예를 들면, "이종" 뉴클레오티드, 폴리뉴클레오티드, 폴리펩티드 또는 단백질 서열은 상응하는 야생형 숙주 세포에 자연적으로 존재하는 야생형 서열에 비해, 예를 들면, 발현의 수준에 있어서 또는 뉴클레오티드, 폴리뉴클레오티드, 폴리펩티드 또는 단백질의 서열에 있어서의 변형으로 변형될 수 있다.
본원에서 사용되는 바와 같이, 용어 폴리펩티드의 "단편"은 2개의 아미노산 잔기에서부터 1개의 아미노산 잔기를 뺀 전체 아미노산 서열에 이르는 크기 범위를 갖는 전장 폴리펩티드 또는 단백질의 더 짧은 부분을 나타낸다. 본 발명의 특정 실시형태에서, 단편은 폴리펩티드 또는 단백질의 도메인(예컨대, 기질 결합 도메인 또는 촉매 도메인)의 전체 아미노산 서열을 나타낸다.
용어 "돌연변이유발"은 유기체의 유전 정보가 안정한 방식으로 변화되는 과정을 나타낸다. 단백질 암호화 핵산 서열의 돌연변이유발은 돌연변이 단백질을 생성한다. 돌연변이유발은 또한 변형된 단백질 활성을 야기하는 비-암호화 핵산 서열의 변화를 나타낸다.
본원에서 사용되는 "돌연변이"는 유전자의 핵산 위치에서 또는 폴리펩티드 또는 단백질의 아미노산 위치에서의 영구적인 변화를 나타낸다. 돌연변이는 치환, 부가, 삽입, 및 결손을 포함한다. 예를 들면, 아미노산 위치에서의 돌연변이는 한 가지 유형의 아미노산의 다른 유형의 아미노산으로의 치환일 수 있다(예컨대, 세린(S)이 알라닌(A)으로 치환될 수 있고; 리신(L)이 트레오닌(T)으로 치환될 수 있고; ). 이와 같이, 폴리펩티드 또는 단백질은 하나의 아미노산이 다른 아미노산으로 치환된 하나 이상의 돌연변이를 가질 수 있다.
본원에서 사용되는 용어 "유전자"는 RNA 생성물 또는 단백질 생성물 중 어느 하나를 암호화하는 핵산 서열 뿐만 아니라 RNA 또는 단백질의 발현에 영향을 주는 작동가능하게-연결된 핵산 서열(예를 들면, 이러한 서열은 프로모터 또는 인핸서 서열을 포함하지만 이로 제한되지 않음) 또는 RNA 또는 단백질의 발현에 영향을 주는 서열을 암호화하는 작동가능하게-연결된 핵산 서열(예를 들면, 이러한 서열은 리보솜 결합 부위 또는 번역 조절 서열을 포함하지만 이로 제한되지 않음)을 나타낸다.
발현 조절 서열은 당업계에 공지되어 있으며, 예를 들면, 숙주 세포에서 폴리뉴클레오티드 서열의 발현을 위하여 제공되는 프로모터, 인핸서, 아데닐산중합반응 신호(polyadenylation signal), 전사 종결자(transcription terminator), 내부 리보솜 유입점(internal ribosome entry sites: IRES) 등을 포함한다. 발현 조절 서열은 구체적으로 전사에 관련된 세포성 단백질들과 상호작용한다(Maniatis et al. (1987) Science 236:1237-1245). 예시적인 발현 조절 서열들은, 예를 들면, 문헌[참조; Goeddel, Gene Expression Technology: Methods in Enzymology, Vol. 185, Academic Press, San Diego, Calif. (1990)]에 기재되어 있다. 본 발명의 방법에서, 발현 조절 서열은 폴리뉴클레오티드 서열과 작동가능하게 연결된다. "작동가능하게 연결된"이란 적절한 분자(예컨대, 전사 활성인자 단백질)가 발현 조절 서열(들)에 결합될 때 폴리뉴클레오티드 서열 및 발현 조절 서열이 유전자 발현을 허용하는 방식으로 연결되는 것을 의미한다. 작동가능하게 연결된 프로모터는, 전사 및 번역의 방향에 관하여, 선택된 폴리뉴클레오티드 서열의 상류에 위치된다. 작동가능하게 연결된 인핸서는 선택된 폴리뉴클레오티드의 상류, 내부 또는 하류에 위치될 수 있다.
본원에서 사용되는 용어 "벡터"는 이것이 연결된 다른 핵산, 폴리뉴클레오티드 서열을 수송할 수 있는 핵산 분자를 니타낸다. 유용한 벡터의 한 가지 유형은 에피솜(, 염색체외 복제를 할 수 있는 핵산)이다. 유용한 벡터는 이들이 연결되는 헥산의 자율 복제 및/또는 발현이 가능한 것이다. 당해 벡터가 작동가능하게 연결된 유전자의 발현을 지향할 수 있는 벡터를 본원에서 '발현 벡터"라고 한다. 일반적으로, 재조합 DNA 기술에서 유용한 발현 벡터는 종종 "플라스미드"의 형태로 되어 있으며, 이것은 일반적으로 이들의 벡터 형태에서 염색체에 결합되지 않는 원형 이중 가닥 DNA 루프를 나타낸다. 기타의 유용한 발현 벡터가 직선 형태로 제공되어 있다. 등가의 기능을 제공하고, 이후에 당업계에 알려지게 된 이러한 다른 형태들의 발현 벡터도 포함된다. 몇몇 실시형태에서, 재조합 벡터는 폴리뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 추가로 포함한다. 몇몇 실시형태에서, 프로모터는 발달적으로-조절된 프로모터, 세포소기관-특이적 프로모터, 조직-특이적 프로모터, 유도성 프로모터, 구성적 프로모터, 또는 세포-특이적 프로모터이다. 재조합 벡터는 전형적으로 폴리뉴클레오티드 서열에 작동가능하게 연결된 발현 조절 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; 폴리뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티; 폴리뉴클레오티드 서열에 작동가능하게 연결된 분비 서열; 및 폴리뉴클레오티드 서열에 작동가능하게 연결된 표적화 서열로부터 선택된 적어도 하나의 서열을 포함한다. 특정 실시형태에서, 뉴클레오티드 서열은 숙주 세포의 게놈 DNA에 안정적으로 삽입되며, 뉴클레오티드 서열의 발현은 조절된 프로모터 영역의 제어하에 있다. 본원에서 사용되는 바와 같은 발현 벡터는 숙주 세포에서 폴리뉴클레오티드 서열의 발현에 적합한 형태로 본원에 기재된 바와 같은 특정 폴리뉴클레오티드 서열을 포함한다. 발현 벡터의 설계는 형질전환되는 숙주 세포의 선택, 목적하는 폴리펩티드의 발현 수준 등과 같은 인자들에 따라 좌우될 수 있다는 것은 당업계의 숙련가들에 의해 인지될 것이다. 본원에 기재된 발현 벡터는 본원에 기재된 바와 같은 폴리뉴클레오티드 서열에 의해 암호화되는 융합 폴리펩티드를 포함한 폴리펩티드를 생산하기 위해 숙주 세포에 도입될 수 있다. 원핵생물, 예를 들면, 대장균에서 폴리펩티드를 암호화하는 유전자의 발현은 대부분 융합 또는 비-융합 폴리펩티드 중 어느 하나의 발현을 지향하는 구성적 또는 유도성 프로모터를 함유하는 벡터로 수행된다. 융합 벡터는 그 안에 암호화된 폴리펩티드에, 통상적으로 재조합 폴리펩티드의 아미노- 또는 카복시-말단에 다수의 아미노산을 부가한다. 이러한 융합 벡터는 전형적으로 재조합 폴리펩티드의 발현을 증가시키고; 재조합 폴리펩티드의 용해도를 증가시키고; 친화성 정제에서 리간드로서 작용함으로써 재조합 폴리펩티드의 정제를 돕는 것을 포함한 상기 세 가지 목적들 중의 하나 이상을 제공한다. 종종, 융합 발현 벡터에서, 융합 모이어티와 재조합 폴리펩티드의 접합점에 단백질분해 절단 부위(proteolytic cleavage site)가 도입된다. 이는 융합 폴리펩티드의 정제 이후에 융합 모이어티로부터 재조합 폴리펩티드의 분리를 가능하게 한다. 특정 실시형태에서, 본 발명의 폴리뉴클레오티드 서열은 박테리오파지 T5로부터 유도된 프로모터에 작동가능하게 연결된다.
특정 실시형태에서, 숙주 세포는 효모 세포이고, 발현 벡터는 효모 발현 벡터이다. 효모 S. 세레비시에(S. cerevisiae)에서의 발현을 위한 벡터의 예는 pYepSec1(문헌 참조; Baldari et al. (1987) EMBO J. 6:229-234); pMFa(문헌 참조; Kurjan et al. (1982) Cell 30:933-943); pJRY88(문헌 참조; Schultz et al. (1987) Gene 54: 113-123); pYES2(문헌 참조; Invitrogen Corp., San Diego, CA), 및 picZ(문헌 참조; Invitrogen Corp., San Diego, CA)를 포함한다. 또 다른 실시형태에서, 숙주 세포는 곤충 세포이고, 발현 벡터는 바큘로바이러스 발현 벡터이다. 배양된 곤충 세포(예컨대, Sf9 세포)에서 단백질의 발현을 위해 이용 가능한 바큘로바이러스 벡터는, 예를 들면, pAc 계열(문헌 참조; Smith et al. (1983) Mol . Cell Biol . 3:2156-2165) 및 pVL 계열(문헌 참조; Lucklow et al. (1989) Virology 170:31-39)를 포함한다. 또 다른 실시형태에서, 본원에 기재된 폴리뉴클레오티드 서열은 포유류 발현 벡터를 사용하여 포유류 세포에서 발현될 수 있다. 원핵 및 진핵 세포 둘 다에 대한 다른 적합한 발현계들이 당업계에 잘 알려져 있다; 문헌[참조, 예컨대, Sambrook et al., "Molecular Cloning: A Laboratory Manual," second edition, Cold Spring Harbor Laboratory, (1989)]을 참조한다.
본원에서 사용되는 용어 "CoA" 또는 "아실-CoA"는 조효소 A(CoA)의 4'-포스포판테티오닐 모이어티의 설프하이드릴 그룹과 알킬 쇄의 카보닐 탄소 사이에서 형성되는 아실 티오에스테르를 나타내며, 이는 화학식 R-C(O)S-CoA를 갖고, 여기서 R은 적어도 4개의 탄소원자를 갖는 임의의 알킬 그룹이다.
용어 "ACP"는 아실 운반 단백질을 의미한다. ACP는 지방산 생합성 동안 아실 중합체의 고도로 보존된 운반체이며, 여기서, 성장하는 쇄는 4'-포스포판테테인 모이어티의 말단 티올에서 티올 에스테르로서 합성 동안 결합된다. 단백질은 두 가지 형태, , 아포-ACP(지방산 생합성에서 불활성) 및 ACP 또는 홀로-ACP(지방산 생합성에서 활성)로 존재한다. 용어 "ACP" 및 "홀로-ACP"는 본원에서 상호교환 가능하게 사용되며, 단백질의 활성 형태를 나타낸다. 포스포판테테이닐트랜스퍼라제라고 불리는 효소가 불활성 아포-ACP에서 활성 홀로-ACP로의 전환에 관여한다. 보다 구체적으로, ACP는 불활성 아포-ACP 형태로 발현되고, 4'-포스포판테테인 모이어티는 홀로-ACP를 생산하기 위해 홀로-아실 운반 단백질 신타제(ACPS), 포스포판테테이닐트랜스퍼라제의 활성에 의해 ACP 상에서 보존된 세린 잔기에 후-번역되도록 부착되어야 한다.
본원에서 사용되는 용어 "아실-ACP"는 아실 운반 단백질(ACP)의 포스포판테테이닐 모이어티의 설프하이드릴 그룹과 알킬 쇄의 카보닐 탄소 사이에서 형성되는 아실 티오에스테르를 나타낸다. 몇몇 실시형태에서 ACP는 완전 포화된 아실-ACP의 합성에 있어서 중간체이다. 또 다른 실시형태에서 ACP는 불포화 아실-ACP의 합성에 있어서 중간체이다. 몇몇 실시형태에서, 탄소 쇄는 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 또는 26개의 탄소를 가질 것이다.
본원에서 사용되는 용어 "지방산 유도체"는 "지방산 또는 이의 유도체"라고 할 수 있는 "지방산" 또는 "지방산 유도체"를 의미한다. 용어 "지방산"은 화학식 RCOOH를 갖는 카복실산을 의미한다. R은 지방족 그룹, 바람직하게는 알킬 그룹을 나타낸다. R은 약 4 내지 약 22개 탄소원자를 포함할 수 있다. 지방산은 포화, 불포화, 또는 다중불포화될 수 있다. "지방산 유도체"는 생산 숙주 유기체(예컨대, 재조합 숙주 세포 또는 미생물)의 지방산 생합성 경로로부터 부분적으로 제조되는 생성물이다. "지방산 유도체"는 ACP, 아실-ACP 또는 아실-ACP 유도체로부터 부분적으로 제조되는 생성물을 포함한다. 예시적인 지방산 유도체는, 예를 들면, 아실-CoA, 지방산, 지방 알데히드, 단쇄 및 장쇄 알콜, 지방 알콜, 탄화수소, 에스테르(예컨대, 왁스,지방산 에스테르, 또는 지방 에스테르), 말단 올레핀, 내부 올레핀, 케톤 뿐만 아니라 ω-OH 지방산 및 α,ω-이산을 포함한 이의 ω-OH 지방산 유도체, 및 기타의 이관능성 화합물을 포함한다.
본원에서 사용되는 용어 "지방산 생합성 경로"는 지방산 및 이의 유도체를 생산하는 생합성 경로를 의미한다. 지방산 생합성 경로는 목적하는 특징을 갖는 지방산 유도체를 생산하는 추가의 효소를 포함할 수 있다.
지방산의 R 그룹은 직쇄 또는 측쇄일 수 있다. 측쇄는 하나 이상의 분지점을 가질 수 있고 환형 분지를 포함할 수 있다. 몇몇 실시형태에서, 측쇄 지방산은 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25, 또는 C26 측쇄 지방산이다. 또 다른 실시형태에서, 측쇄 지방산은 C6, C8, C10, C12, C13, C14, C15, C16, C17, C18, 또는 C20 측쇄 지방산이다. 특정 실시형태에서, 측쇄 지방산의 하이드록실(OH) 그룹은 오메가(ω) 위치에 있다. 특정 실시형태에서, 측쇄 지방산은 이소-지방산 또는 안테이소-지방산이다. 예시적인 실시형태에서, 측쇄 지방산은 이소-C7 :0-, 이소-C8 :0-, 이소-C9 :0-, 이소-C10 :0-, 이소-C11:0-, 이소-C12 :0-, 이소-C13 :0-, 이소-C14 :0-, 이소-C15 :0-, 이소-C16 :0-, 이소-C17 :0-, 이소-C18 :0-, 이소-C19 :0-, 이소-C20 :0, 안테이소-C7 :0-, 안테이소-C9 :0-, 안테이소-C11 :0-, 안테이소-C13 :0-, 안테이소-C15 :0-, 안테이소-C17 :0-, 및 안테이소-C19 :0 측쇄 지방산으로부터 선택된다.
지방산의 R 그룹은 포화 또는 불포화일 수 있다. 불포화된다면, R 그룹은 하나 또는 하나 이상의 불포화점을 가질 수 있다. 몇몇 실시형태에서, 불포화 지방산은 단일불포화 지방산이다. 특정 실시형태에서, 불포화 지방산은 C8 :1-, C9 :1-, C10:1-, C11 :1-, C12 :1-, C13 :1-, C14 :1-, C15 :1-, C16 :1-, C17 :1-, C18 :1-, C19 :1-, C20 :1-, C21 :1-, C22:1-, C23 :1-, C24 :1-, C25 :1-, 또는 C26 :1 불포화 지방산이다. 특정 실시형태에서, 불포화 지방산은 C8 :1, C10 :1, C12 :1, C14 :1, C16 :1, C18 :1, 또는 C20 :1이다. 또 다른 실시형태에서, 불포화 지방산은 오메가-7 위치에서 불포화된다. 특정 실시형태에서, 불포화 지방산은 시스 이중결합을 갖는다.
본원에서 사용되는 바와 같이, "재조합 숙주 세포" 또는 "조작된 숙주 세포"는 ω-하이드록실화 지방산 및 이관능성 지방산 유도체를 포함한 ω-하이드록실화 지방산 유도체를 생산하도록 변형된 숙주 세포, 예컨대, 미생물이다. 몇몇 실시형태에서, 재조합 숙주 세포는 하나 이상의 폴리뉴클레오티드를 포함하며, 각각의 폴리뉴클레오티드는 ω-하이드록실라제 생합성 효소 활성을 갖는 CYP153A-환원효소 혼성 융합 폴리펩티드 또는 이의 변이체를 암호화하고, 여기서, 재조합 숙주 세포는 폴리뉴클레오티드를 발현하는데 효과적인 조건하에서 탄소 공급원의 존재하에 배양되는 경우 ω-하이드록실화 지방산 및/또는 ω-하이드록실화 지방산 유도체 또는 이의 조성물을 생산한다.
본원에서 사용되는 용어 "클론"은 전형적으로 단일 공통 선조와 본질적으로 유전적으로 동일하고 이의 자손인 세포 또는 세포의 그룹, 예를 들면, 단일 박테리아성 세포에서 발생하는 클로닝된 박테리아성 콜로니의 박테리아를 나타낸다.
본원에서 사용되는 용어 "배양물"은 전형적으로 생존가능한 세포를 포함하는 액체 배지를 나타낸다. 하나의 실시형태에서, 배양물은 제어된 조건 하에서 사전설정된 배양 배지에서 번식하는 세포를 포함하는 배양물, 예를 들면, 선택된 탄소원 및/또는 질소를 포함하는 액체 배지에서 성장되는 재조합 숙주 세포의 배양물을 포함한다.
용어 "배양하는" 또는 "배양"은 액체 또는 고체 배지에서 적절한 조건 하에 세포(예컨대, 미생물 세포)의 개체군을 성장시키는 것을 나타낸다. 특정 실시형태에서, 배양은 기질에서 최종산물로의 발효성 생물전환을 나타낸다. 배양 배지는 잘 알려져 있으며, 이러한 배양 배지의 개별 성분들은 상업적 공급원으로부터, 예컨대, DIFCO 배지 및 BBL 배지 하에 이용 가능하다. 하나의 비제한적인 예에서, 수성 영양 배지는 이러한 배지의 10 g/L의 펩톤 및 10 g/L 효모 추출물을 포함하는, YP 배지와 같은 질소, 염 및 탄소의 복합원을 포함하는 "풍부한 배지(rich medium)"이다. 또한, 숙주 세포는, 예를 들면, U.S. 특허 제5,000,000호; 제5,028,539호; 제5,424,202호; 제5,482,846호; 제5,602,030호 및 제WO2010127318호에 기재된 방법에 따라 탄소를 효율적으로 동화시키고 탄소 공급원으로서 셀룰로스 물질을 사용하도록 조작될 수 있다. 또한, 숙주 세포는 수크로스가 탄소 공급원으로서 사용될 수 있도록 인버타제(invertase)를 발현시키도록 조작될 수 있다.
본원에서 사용되는 용어 "상기 이종 뉴클레오티드 서열을 발현하기에 효과적인 조건하에서"는 숙주 세포가 목적하는 지방산 유도체(예컨대, ω-OH 지방산 및/또는 ω-OH 지방산 유도체)를 생산하도록 하는 임의의 조건을 의미한다. 적합한 조건은, 예를 들면, 발효 조건을 포함한다.
본원에서 사용되는 바와 같이, 재조합 숙주 세포에서, 단백질, 예를 들면 효소의 "변형된" 또는 "변경된 수준의" 활성은 부모 또는 천연 숙주 세포에 비해 결정된 활성에서 하나 이상의 특징에 있어서의 차이를 나타낸다. 전형적으로 활성에 있어서의 차이는 변형된 활성을 갖는 재조합 숙주 세포와 상응하는 야생형 숙주 세포 사이에 결정된다(예컨대, 야생형 숙주 세포에 비해 재조합 숙주 세포의 배양물의 비교). 변형된 활성은, 예를 들면, 재조합 숙주 세포에 의해 발현된 단백질의 변형된 양(예컨대, 단백질을 암호화하는 DNA 서열의 증가되거나 감소된 수의 카피, 단백질을 암호화하는 증가되거나 감소된 수의 mRNA 전사체, 및/또는 mRNA로부터의 단백질의 증가되거나 감소된 양의 단백질 번역의 결과로서); 단백질의 구조에 있어서의 변화(예컨대, 기질 특이성의 변화, 관찰된 동적 파라미터의 변화를 야기하는 단백질의 암호화 서열에 대한 변화와 같은 1차 구조에의 변화); 및 단백질 안정성에 있어서의 변화(예컨대, 단백질의 증가되거나 감소된 분해)의 결과일 수 있다. 몇몇 실시형태에서, 폴리펩티드는 본원에 기재된 폴리펩티드 중의 어느 것의 돌연변이체 또는 변이체이다. 특정 예에서, 본원에 기재된 바와 같은 폴리펩티드에 대한 암호화 서열은 특정 숙주 세포에서 발현을 위해 최적화된 코돈이다. 예를 들면, 대장균에서의 발현을 위해, 하나 이상의 코돈이 최적화될 수 있다(문헌 참조; Grosjean et al. (1982) Gene 18:199-209).
본원에서 사용되는 용어 "조절 서열"은 전형적으로 궁극적으로 단백질의 발현을 조절하는 단백질을 암호화하는 DNA 서열에 작동가능하게-연결된, DNA의 염기 서열을 나타낸다. 조절 서열의 예는 RNA 프로모터 서열, 전사 인자 결합 서열, 전사 종결 서열, (인핸서 요소와 같은) 전사의 조절인자, RNA 안정성에 영향을 주는 뉴클레오티드 서열, 및 번역 조절 서열[예를 들면, 리보솜 결합 부위(예컨대, 원핵생물의 샤인-달가노 서열(Shine-Dalgarno sequence) 또는 진핵생물의 코작 서열(Kozak sequences), 개시 코돈, 종결 코돈]을 포함하지만, 이에 제한되지 않는다.
본원에서 사용되는 어구 "상기 뉴클레오티드 서열의 발현이 야생형 뉴클레오티드 서열에 비해 변형된다"는 내인성 뉴클레오티드 서열의 발현 및/또는 활성 또는 이종 또는 비-천연 폴리펩티드-암호화 뉴클레오티드 서열의 발현 및/또는 활성의 수준에 있어서의 증가 또는 감소를 의미한다.
본원에서 사용되는 어구 "CYP153A-환원효소 혼성 융합 폴리펩티드 서열 변이체의 활성이 CYP153A-환원효소 혼성 융합 폴리펩티드 서열(, 폴리펩티드 주형)의 활성에 비해 변형된다"는 발현된 폴리펩티드 서열 주형과 비교하여 발현된 폴리펩티드 서열 변이체의 활성 수준에 있어서의 증가 또는 감소를 의미한다. 폴리펩티드 주형은 핵산 주형(, DNA 주형 서열)에 의해 암호화된다. 폴리펩티드 서열 주형의 예는 cyp153A가 환원효소 도메인과 융합되어 있는 혼성 cyp153A-RedRhF 융합 단백질 서열이다. 폴리펩티드 서열 주형의 또 다른 예는 서열번호 6이다. 폴리펩티드 서열 주형의 또 다른 예는 서열번호 38이다. 임의의 폴리펩티드 서열은 변이체를 포함한 주형으로서 작용할 수 있다.
본원에서 사용되는 바와 같이, 폴리뉴클레오티드에 대해 용어 "발현하다"는 이것이 기능을 하도록 하는 것이다. 폴리펩티드(또는 단백질)을 암호화하는 폴리뉴클레오티드는, 발현되는 경우, 그 폴리펩티드(또는 단백질)를 생산하도록 전사 및 번역될 것이다. 본원에서 사용되는 용어 "과발현하다"는 동일한 조건하에서 상응하는 야생형 세포에서 정상적으로 발현되는 것보다 더 높은 농도로 세포에서 폴리뉴클레오티드 또는 폴리펩티드를 발현함(또는 발현되도록 함)을 의미한다. 또 다른 실시형태에서, 용어 "과발현"은 동일한 조건하에서 주형 폴리뉴클레오티드 또는 주형 폴리펩티드 서열을 발현하는 상응하는 세포에서 정상적으로 발현되는 것보다 더 높은 농도로 세포에서 폴리뉴클레오티드 또는 폴리펩티드를 발현함(또는 발현되도록 함)을 의미한다. 주형 폴리펩티드 서열의 예는 CYP153A-RedRhF-혼성 융합 폴리펩티드이다.
용어 "변경된 수준의 발현" 및 "변형된 수준의 발현"은 상호교환 가능하게 사용되며, 폴리뉴클레오티드, 폴리펩티드, 또는 지방산 유도체가 동일한 조건하에서 상응하는 야생형 세포의 농도에 비해 조작된 숙주 세포에서 상이한 농도로 존재함을 의미한다.
본원에서 사용되는 용어 "역가"는 숙주 세포 배양물의 단위 용적당 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 양을 나타낸다. 본원에 기재된 조성물 및 방법의 임의의 측면에서, ω-OH 지방산 및/또는 ω-OH 지방산 유도체는 약 25 mg/L, 약 50 mg/L, 약 75 mg/L, 약 100 mg/L, 약 125 mg/L, 약 150 mg/L, 약 175 mg/L, 약 200 mg/L, 약 225 mg/L, 약 250 mg/L, 약 275 mg/L, 약 300 mg/L, 약 325 mg/L, 약 350 mg/L, 약 375 mg/L, 약 400 mg/L, 약 425 mg/L, 약 450 mg/L, 약 475 mg/L, 약 500 mg/L, 약 525 mg/L, 약 550 mg/L, 약 575 mg/L, 약 600 mg/L, 약 625 mg/L, 약 650 mg/L, 약 675 mg/L, 약 700 mg/L, 약 725 mg/L, 약 750 mg/L, 약 775 mg/L, 약 800 mg/L, 약 825 mg/L, 약 850 mg/L, 약 875 mg/L, 약 900 mg/L, 약 925 mg/L, 약 950 mg/L, 약 975 mg/L, 약 1000 mg/L, 약 1050 mg/L, 약 1075 mg/L, 약 1100 mg/L, 약 1125 mg/L, 약 1150 mg/L, 약 1175 mg/L, 약 1200 mg/L, 약 1225 mg/L, 약 1250 mg/L, 약 1275 mg/L, 약 1300 mg/L, 약 1325 mg/L, 약 1350 mg/L, 약 1375 mg/L, 약 1400 mg/L, 약 1425 mg/L, 약 1450 mg/L, 약 1475 mg/L, 약 1500 mg/L, 약 1525 mg/L, 약 1550 mg/L, 약 1575 mg/L, 약 1600 mg/L, 약 1625 mg/L, 약 1650 mg/L, 약 1675 mg/L, 약 1700 mg/L, 약 1725 mg/L, 약 1750 mg/L, 약 1775 mg/L, 약 1800 mg/L, 약 1825 mg/L, 약 1850 mg/L, 약 1875 mg/L, 약 1900 mg/L, 약 1925 mg/L, 약 1950 mg/L, 약 1975 mg/L, 약 2000 mg/L (2g/L), 3g/L, 5g/L, 10g/L, 20g/L, 30g/L, 40g/L, 50g/L, 60g/L, 70g/L, 80g/L, 90g/L, 100g/L 또는 상기한 값들 중의 임의의 두 개에 의해 경계된 범위의 역가로 생산된다. 또 다른 실시형태에서, ω-OH 지방산 및/또는 ω-OH 지방산 유도체는 100g/L 초과, 200g/L 초과, 300g/L 초과, 또는 그 이상, 예를 들면, 500 g/L, 700 g/L, 1000 g/L, 1200 g/L, 1500 g/L, 또는 2000 g/L의 역가로 생산된다. 하나의 실시형태에서, 본 발명의 방법에 따라 재조합 숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 역가는 5g/L 내지 200g/L, 10g/L 내지 150g/L, 20g/L 내지 120g/L, 25g/L 내지 110g/L 및 30g/L 내지 100g/L이다.
본원에서 사용되는 용어 "숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 수율"은 투입된 탄소 공급원이 숙주 세포에서 생성물(, ω-OH 지방산 및/또는 ω-OH 지방산 유도체)로 전환되는 효율을 나타낸다. 본 발명의 방법에 따라 ω-OH 지방산 및/또는 ω-OH 지방산 유도체를 생산하도록 조작된 숙주 세포는 적어도 3%, 적어도 4%, 적어도 5%, 적어도 6%, 적어도 7%, 적어도 8%, 적어도 9%, 적어도 10%, 적어도 11%, 적어도 12%, 적어도 13%, 적어도 14%, 적어도 15%, 적어도 16%, 적어도 17%, 적어도 18%, 적어도 19%, 적어도 20 %, 적어도 21%, 적어도 22%, 적어도 23%, 적어도 24%, 적어도 25%, 적어도 26%, 적어도 27%, 적어도 28%, 적어도 29%, 또는 적어도 30% 또는 상기한 값들 중의 어느 두 가지에 의해 경계된 범위의 수율을 갖는다. 또 다른 실시형태에서, ω-OH 지방산 및/또는 ω-OH 지방산 유도체는 30%, 40%, 50%, 60%, 70%, 80%, 90% 초과 또는 그 이상의 수율로 생산된다. 대안적으로, 또는 추가로, 수율은 약 30% 이하, 약 27% 이하, 약 25% 이하, 또는 약 22% 이하이다. 따라서, 수율은 상기한 종점 중의 어느 두 가지에 의해 경계될 수 있다. 예를 들면, 본 발명의 방법에 따라 재조합 숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 수율은 5% 내지 15%, 10% 내지 25%, 10% 내지 22%, 15% 내지 27%, 18% 내지 22%, 20% 내지 28%, 20% 내지 30%, 25% 내지 40%, 또는 그 이상일 수 있다. 본 발명의 방법에 따라 재조합 숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 바람직한 수율의 예는 10% 내지 30%이다. 본 발명의 방법에 따라 재조합 숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 바람직한 수율의 또 다른 예는 10% 내지 40%이다. 본 발명의 방법에 따라 재조합 숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 바람직한 수율의 또 다른 예는 10% 내지 50%이다.
본원에서 사용되는 용어 "생산성"은 단위 시간당 숙주 세포 배양물의 단위 용적당 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 양을 나타낸다. 본원에 기재된 조성물 및 방법의 임의의 측면에서, 재조합 숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 생산성은 적어도 100 mg/L/시간, 적어도 200 mg/L/시간0, 적어도 300 mg/L/시간, 적어도 400 mg/L/시간, 적어도 500 mg/L/시간, 적어도 600 mg/L/시간, 적어도 700 mg/L/시간, 적어도 800 mg/L/시간, 적어도 900 mg/L/시간, 적어도 1000 mg/L/시간, 적어도 1100 mg/L/시간, 적어도 1200 mg/L/시간, 적어도 1300 mg/L/시간, 적어도 1400 mg/L/시간, 적어도 1500 mg/L/시간, 적어도 1600 mg/L/시간, 적어도 1700 mg/L/시간, 적어도 1800 mg/L/시간, 적어도 1900 mg/L/시간, 적어도 2000 mg/L/시간, 적어도 2100 mg/L/시간, 적어도 2200 mg/L/시간, 적어도 2300 mg/L/시간, 적어도 2400 mg/L/시간, 또는 적어도 2500 mg/L/시간이다. 또한, 생산성은 2500 mg/L/시간 이하, 2000 mg/L/OD600 이하, 1500 mg/L/OD600 이하, 120 mg/L/시간 이하, 1000 mg/L/시간 이하, 800 mg/L/시간 이하, 또는 600 mg/L/시간 이하일 수 있다. 따라서, 생산성은 상기 종점 중의 어느 두 가지에 의해 경계될 수 있다. 예를 들면, 생산성은 3 내지 30 mg/L/시간, 6 내지 20 mg/L/시간, 또는 15 내지 30 mg/L/시간일 수 있다. 본 발명의 방법에 따라 재조합 숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 바람직한 생산성은 500 mg/L/시간 내지 2500 mg/L/시간, 또는 700 mg/L/시간 내지 2000 mg/L/시간로부터 선택된다.
용어 "총 지방 화학종(FAS): 및 "총 지방산 생성물"은 국제 특허 출원 공보 제WO 2008/119082호에 기재된 바와 같이 GC-FID에 의해 평가되는 바와 같이 샘플에 존재하는 ω-OH 지방산 및 지방산의 총 양과 관련하여 본원에서 상호교환 가능하게 사용될 수 있다.
본원에서 사용되는 용어 "글루코스 이용률"은 그램/리터/시간(g/L/hr)으로 기록되는 단위 시간당 배양물에 사용되는 글루코스의 양을 의미한다.
용어 "재생가능한 공급원료로부터의 탄소 공급원"은, 단독으로 사용되거나 공급원과 관련하여 사용되는 경우, 유지화학물질(oleochemicals)(, 지방산, 지방산 에스테르, TAG, 하이드록시 지방산 등과 같은 식물 및 동물로부터의 정유) 및 석유화학물질(, 알칸, 알켄 등과 같은 석유로부터 유도된 화학물질)을 제외하고 탄소가 유래되는 (재생가능한 공급원료 및/또는 바이오매스 및/또는 노폐물을 포함하는) 임의의 생물학적 물질을 포함한다. 따라서, 본원에서 사용되는 바와 같은 용어 "재생가능한 공급원료로부터의 탄소 공급원"은 유지화학물질 및 석유화학물질로부터 유래된 탄소를 제외한다. 몇몇 실시형태에서, 탄소 공급원은 당류 또는 탄수화물(예컨대, 단당류, 이당류 또는 다당류)을 포함한다. 몇몇 실시형태에서, 탄소 공급원은 글루코스 및/또는 수크로스이다. 또 다른 실시형태에서, 탄소 공급원은 옥수수, 사탕수수 또는 목질계 바이오매스로부터의 탄수화물; 또는 글리세롤, 플루-가스, 합성-가스와 같은 노폐물; 또는 바이오매스 또는 천연 가스와 같은 유기 재료의 재형성물; 또는 광합성적으로 고정된(fixed photosynthetically) 이산화탄소와 같은 재생가능한 공급원료로부터 유도된다. 또 다른 실시형태에서, 바이오매스는 탄소 공급원으로 가공되고, 이것은 생물전환에 적합하다. 여전히 또 다른 실시형태에서, 바이오매스는 탄소 공급원으로의 추가적인 가공을 필요로 하지 않지만, 탄소 공급원으로서 바로 사용될 수 있다. 이러한 바이오매스의 예시적인 공급원은 스위치그래스와 같은 식물성 물질 또는 식생(vegetation)이다. 또 다른 예시적인 탄소 공급원은 동물성 물질[예컨대, 우분(cow manure)]과 같은 대사 노폐물을 포함한다. 추가의 예시적인 탄소의 공급원은 조류(algae) 및 다른 해양 식물을 포함한다. (바이오매스를 포함하는) 또 다른 탄소 공급원은 발효 폐기물, 발효 바이오매스, 글리세롤/글리세린, 목초, 짚, 목재, 오수, 쓰레기, 마니플 고체 폐기물, 셀룰로스 도시 폐기물 및 음식 쓰레기를 포함하지만 이로 제한되지 않는 산업, 농업, 임업 및 가정으로부터의 폐기물을 포함한다.
ω-OH 지방산 및 이의 유도체와 같은 생성물에 대해 본원에서 사용되는 용어 "단리된"은 세포 성분, 세포 배양 배지, 또는 화학적 또는 합성 전구체로부터 분리된 생성물을 나타낸다. 본원에 기재된 방법에 의해 생산된 지방산 및 이의 유도체(예컨대, ω-OH 지방산 및/또는 ω-OH 지방산 유도체)는 발효 브로쓰에서 뿐만 아니라 세포질에서도 비교적 비혼화성일 수 있다. 따라서, 지방산 및 이의 유도체는 세포내 또는 세포외에서 유기 상으로 수집될 수 있다.
본원에서 사용되는 용어 "정제하다", "정제된" 또는 "정제"는, 예를 들면, 단리 또는 분리에 의해 그 환경으로부터의 분자의 제거 또는 단리를 의미한다. "실질적으로 정제된" 분자는 이들이 연결된 다른 성분들로부터 적어도 약 60% 유리(예컨대, 적어도 약 70% 유리, 적어도 약 75% 유리, 적어도 약 85% 유리, 적어도 약 90% 유리, 적어도 약 95% 유리, 적어도 약 97% 유리, 적어도 약 99% 유리)된다. 본원에서 사용되는 바와 같이, 이들 용어는 또한 샘플로부터의 오염물의 제거를 나타낸다. 예를 들면, 오염물의 제거는 샘플에서 ω-OH 지방산 및/또는 ω-OH 지방산 유도체와 같은 지방산 유도체의 백분율의 증가를 초래할 수 있다. 예를 들면, 지방산 유도체가 재조합 숙주 세포에서 생산되는 경우, 지방산 유도체는 숙주 세포 단백질 또는 다른 숙주 세포 물질의 제거에 의해 정제될 수 있다. 정제 후, 샘플 중의 지방산 유도체의 백분율은 증가된다. 용어 "정제하다", "정제된" 또는 "정제"는 절대 순도를 필요로 하지 않는 상대적인 용어이다. 따라서, 예를 들면, 지방산 유도체가 재조합 숙주 세포에서 생산되는 경우, 정제된 지방산 유도체는 다른 세포 성분(예컨대, 핵산, 폴리펩티드, 지질, 탄수화물, 또는 기타의 탄화수소)으로부터 실질적으로 분리된 지방산 유도체이다.
오메가- 하이드록실화 지방산 및 지방산 유도체 생산
본 발명은 숙주 세포에서 ω-OH 지방산 및 ω-OH 지방산 유도체의 생산을 제공한다. ω-OH 지방산 생산은 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체의 발현의 결과로서 증진될 수 있다. CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 높은 역가로 ω-OH 지방산 유도체 및 조성물을 생산한다. 본원에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 ω-OH 지방산 유도체의 생산을 위해 생합성 경로에 관련되고; 이것은 단독으로 또는 다른 효소와 함께 사용될 수 있다. 예를 들면, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 조직된 생합성 경로에서 사용될 수 있으며, 여기서, 티오에스테라제(, 자연적으로 또는 이종으로 발현된) 효소가 아실-ACP를 지방산으로 전환시킨다. 그후, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 지방산을 ω-OH 지방산으로 전환시킬 수 있다(도 1 참조). 경로에서 추가의 효소는 ω-OH 지방산을 다른 이관능성 지방산 유도체, 예를 들면, α,ω-이산으로 전환시킬 수 있다.
보다 구체적으로, CYP153A-환원효소 혼성 융합 폴리펩티드는 서열번호 6에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖고 ω-OH 지방산 및 지방산 유도체의 생산을 위해 개선된 효소 활성을 갖는 변이체를 생성하기 위해 돌연변이를 도입하는 주형 서열로서 작용하는 폴리펩티드 서열이다. CYP153A-환원효소 혼성 융합 폴리펩티드는 자족성이며, 지방산에서 ω-OH 지방산으로의 반응을 촉매하는 ω-하이드록실라제 효소 활성을 갖는다. CYP153A-환원효소 혼성 융합 폴리펩티드의 예는 혼성 cyp153A-RedRhF-타입 융합 폴리펩티드이다. 하나의 실시형태에서, 용어 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 아미노산 위치 796, 141, 231, 27, 82, 178, 309, 407, 415, 516 및 666 또는 이의 조합에 돌연변이을 포함하지만 이에 제한되지 않는 이의 아미노산 서열에서 적어도 하나의 돌연변이를 갖는 변형된 CYP153A-환원효소 혼성 융합 폴리펩티드를 나타낸다. 재조합 숙주 세포에서 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체의 발현은, 상응하는 숙주 세포에서 CYP153A-환원효소 혼성 융합 폴리펩티드의 발현과 비교하는 경우, ω-OH 지방산 및/또는 ω-OH 지방산 유도체 또는 이의 조성물의 개선된 역가, 수율 및/또는 생산성을 초래한다.
CYP153A-환원효소 혼성 융합 폴리펩티드 변이체의 예는 알라닌이 발린으로 대체된 위치 796에 돌연변이를 갖는 서열번호 38이다. 이러한 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 서열번호 38에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 폴리펩티드 서열을 가지며, 이것은 또한 추가의 돌연변이 또는 추가의 변이체를 생성하는 주형 서열로서 작용한다. 유사하게, 이러한 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 자족성이며, 지방산에서 ω-OH 지방산으로의 반응을 촉매하는 ω-하이드록실라제 효소 활성을 갖는다. 하나의 실시형태에서, 용어 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 아미노산 위치 747, 12, 327, 14, 61, 28, 13, 771, 119, 10, 11, 28, 745, 9, 770, 413, 784, 749, 231, 233, 757 및 703 또는 이의 조합에서의 돌연변이를 포함하지만 이에 제한되지 않는 이의 아미노산 서열에서 적어도 하나의 추가의 돌연변이를 갖는 변형된 CYP153A-환원효소 혼성 융합 폴리펩티드를 나타낸다. 재조합 숙주 세포에서 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체의 발현은, 상응하는 숙주 세포에서 CYP153A-환원효소 혼성 융합 폴리펩티드(서열번호 6)의 발현과 비교하여, ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 개선된 역가, 수율 및/또는 생산성을 초래한다.
세포가 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체로 형질전환되는 경우 이것은 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 발현하는 세포(예컨대, 재조합 세포)이다. 하나의 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산의 역가 및/또는 수율은 CYP153A-환원효소 혼성 융합 폴리펩티드를 발현하는 상응하는 세포의 수율의 적어도 두 배이다. 대장균 (Escherichia coli)과 같은 숙주에서, ω-OH 지방산은 자연적으로 또는 이종으로 발현된 효소에 의해 이관능성 지방산 유도체로 전환될 수 있다. 또 다른 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은 CYP153A-환원효소 혼성 융합 폴리펩티드를 발현하는 상응하는 세포의 그것보다 적어도 약 2배, 적어도 약 3배, 적어도 약 4배, 적어도 약 5배, 적어도 약 6배, 적어도 약 7배, 적어도 약 8배, 적어도 약 9배, 또는 적어도 약 10배 더 높다. 하나의 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은 CYP153A-환원효소 혼성 융합 폴리펩티드를 발현하는 상응하는 세포의 그것보다 적어도 약 1퍼센트, 적어도 약 2퍼센트, 적어도 약 3퍼센트, 적어도 약 4퍼센트, 적어도 약 5퍼센트, 적어도 약 6퍼센트, 적어도 약 7퍼센트, 적어도 약 8퍼센트, 적어도 약 9퍼센트, 또는 적어도 약 10퍼센트 더 높다. 또 다른 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체의 발현으로 인해 재조합 세포에서 생산된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은 CYP153A-환원효소 혼성 융합 폴리펩티드를 발현하는 상응하는 세포의 그것보다 적어도 약 20퍼센트 내지 적어도 약 80퍼센트 더 높다. 몇몇 실시형태에서, 세포에 의해 생산된 ω-OH 지방산의 역가 및/또는 수율은 CYP153A-환원효소 혼성 융합 폴리펩티드를 발현하는 상응하는 세포의 그것보다 적어도 약 20퍼센트, 적어도 약 25퍼센트, 적어도 약 30퍼센트, 적어도 약 35퍼센트, 적어도 약 40퍼센트, 적어도 약 45퍼센트, 적어도 약 50퍼센트, 적어도 약 55퍼센트, 적어도 약 60퍼센트, 적어도 약 65퍼센트, 적어도 약 70퍼센트, 적어도 약 75퍼센트, 적어도 약 80퍼센트, 적어도 약 85퍼센트, 적어도 약 90퍼센트, 적어도 약 95퍼센트, 적어도 약 97퍼센트, 적어도 약 98퍼센트, 또는 적어도 약 100퍼센트 더 높다.
따라서, 본 발명은 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 발현하여 ω-OH 지방산 또는 이의 유도체를 생산하도록 조작된 재조합 숙주 세포를 제공한다. ω-OH 지방산의 생합성은 CYP153A-환원효소 혼성 융합 폴리펩티드-발현 숙주 세포, , 서열번호 6에 기반한 CYP153A-환원효소 혼성 융합 폴리펩티드(, 주형 폴리펩티드) 또는 동일한 효소 기능을 갖는 기타의 폴리펩티드를 발현하는 숙주 세포에 비해 증진된다. 각종 상이한 숙주 세포들이 본원에 기재된 바와 같은 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 발현하도록 변형될 수 있으며, 이것이 ω-OH 지방산 및 ω-OH 지방산 유도체 또는 이의 조성물의 증진된 생산에 적합한 재조합 숙주 세포를 야기한다. 생산되는 ω-OH 지방산의 예는 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9 :1, C10 :1, C11 :1, C12:1, C13 :1, C14 :1, C15 :1, C16 :1, C17 :1, C18 :1, C19 :1 및/또는 C20 :1 지방산이다. 하나의 실시형태에서, 이러한 ω-OH 지방산은 ω-OH C8 :0 지방산, ω-OH C10 :0 지방산, ω-OH C12:0 지방산, ω-OH C14 :0 지방산, ω-OH C16 :0 지방산, ω-OH C18 :0 지방산, ω-OH C20 :0 지방산, ω-OH C8 :1 지방산, ω-OH C10 :1 지방산, ω-OH C12 :1 지방산, ω-OH C14 :1 지방산, ω-OH C16 :1 지방산, ω-OH C18 :1 지방산, ω-OH C20 :1 지방산 등이다. 본원에 기재된 바와 같은 재조합 숙주 세포에서 사용하기에 적합한 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열을 포함하는 각종 세포들이 유전 물질의 공급원을 제공할 수 있는 것으로 이해된다.
경로 조작 및 효소 활성
지방산 합성은 박테리아 생합성 기구의 가장 잘 보존된 시스템들 중 하나이다. 지방산 신타제 (FAS) 다중-효소 복합체는 모든 박테리아 및 진핵생물에 존재한다. FAS 관련 유전자들의 대부분은 세포 성장 및 생존에 필수적이다. 진핵생물 및 박테리아 FAS는 본질적으로 동일한 타입의 생화학적 형질전환을 구현한다. 진핵생물에서, FAS는 FAS I라고 하며, 이의 촉매 도메인들의 대부분은 하나의 폴리펩티드 사슬(비-해리성)에 의해 암호화된다. 박테리아와 같은 원핵생물에서, FAS는 FAS II라고 하며, 이의 개개의 효소들 및 운반 단백질들은 별개의(해리성) 단백질에 대해 암호화하는 별도의 유전자에 의해 암호화된다. 이와 같이, FASII는 상당한 변동 및 뚜렷한 특이성을 갖는 복합 시스템이다.
FAS 경로에서의 효소와 함께 아실기 운반 단백질(ACP)이 원래의(native) 유기체에서 생산된 지방산의 길이, 포화도 및 분지화를 조절한다. 이 경로에서의 단계들이 아세틸-CoA 카복실라제(ACC) 유전자 패밀리 및 지방산 생합성(FAB)의 효소에 의해 촉매된다. 예를 들면, FAS 경로에 포함될 수 있는 효소는 AccABCD, FabD, FabH, FabG, FabA, FabZ, FabI, FabK, FabL, FabM, FabB, 및 FabF를 포함한다. 목적하는 생성물에 따라, 이러한 유전자들 중 하나 이상이 감쇠되거나 과발현될 수 있다. 이와 같이, 원핵생물은 글루코스 또는 다른 탄소 공급원과 같은 재생가능한 공급원료로부터의 지방산 유도체의 생성을 증가시키도록 조작되었다. 여기서 주요 목표는 박테리아 균주를 지방산 메틸 에스테르(FAMEs), 지방산 에틸 에스테르(FAEEs), 및 지방 알콜(FALC)을 포함한, 지방산 유도체 생산을 위한 미생물 공장(microbial factory)으로 전환시키기 위해 지방산 유도체들의 생산을 조절하는 주요 조절 효소의 활성을 증가시키는 것이다(예컨대, 본원에 참고로 포함된 U.S. 특허 제8,283,143호 참조).
본 발명은 ω-OH 지방산 및 ω-OH 지방산 유도체와 같은 바람직한 화합물의 생산을 위한 효소 경로를 변형시키기 위해 효소 기능의 폴리펩티드를 암호화하는 CYP153A-환원효소 혼성 융합 폴리뉴클레오티드를 동정한다. 본원에서 효소 수탁 번호(EC 번호)에 의해 동정되는 이러한 폴리펩티드들은 ω-OH 지방산 및 기타의 이관능성 분자, 예를 들면, α,ω-이산과 같은 ω-OH 지방산 유도체의 생산을 유도하는 지방산 경로들을 조작하는데 유용하다(도 1 참조).
하나의 실시형태에서, ω-OH 지방산 유도체를 생산하기 위해 글루코스와 같은 재생가능한 공급원료로부터 유도된 탄소 공급원을 사용하는 경로가 도 1에 도시되어 있다. 탄수화물(예컨대, 글루코스)은 원래의 유기체에 의해 아실-ACP와 같은 아실-티오에스테르로 전환된다(도 1의 단계 1 참조). 지방산 분해 효소 활성을 갖는 폴리펩티드에 대해 암호화하는 폴리뉴클레오티드는 목적하는 생성물에 따라 임의로 감쇠될 수 있다(이하 실시예 참조). 이러한 폴리펩티드의 비제한적인 예는 아실-CoA 합성효소(FadD) 및 아실-CoA 데하이드로게나제(FadE)이다. 표 1은 당업계에 공지된 방법에 따라 임의로 감쇠될 수 있는 다양한 지방산 분해 효소를 포함한, 대사 경로 내의 효소 활성(이하)의 광범위한 목록을 제공한다(예컨대, 상기 U.S. 특허 제8,283,143호 참조).
예를 들면, FadR(이하 표 1 참조)은 지방산 분해 및 지방산 생합성 경로에 관련된 주요 조절 인자이다(문헌 참조; Cronan et al., Mol . Microbiol ., 29(4): 937-943 (1998)). 대장균 효소 FadD(이하 표 1 참조) 및 지방산 수송 단백질 FadL은 지방산 흡수 시스템의 성분이다. FadL은 지방산의 박테리아 세포로의 수송을 매개하고, FadD는 아실-CoA 에스테르의 형성을 매개한다. 다른 탄소 공급원이 이용가능하지 않을 때, 외인성 지방산이 박테리아에 의해 흡수되고 아실-CoA 에스테르로 전환되며, 이것은 전사 인자 FadR에 결합할 수 있고, 지방산 수송(FadL), 활성화(FadD) 및 β-산화(FadA, FadB 및 FadE)를 담당하는 단백질을 암호화하는 fad 유전자의 발현을 저하시킬 수 있다. 대안적인 탄소 공급원들이 이용가능할 때, 박테리아가 아실-ACP로서 지방산을 합성하며, 이것이 인지질 합성에 사용되지만 β-산화에 대한 기질은 아니다. 따라서, 아실-CoA 및 아실-ACP는 둘 다 상이한 최종산물을 야기할 수 있는 지방산의 독립적인 공급원들이다(문헌 참조; Caviglia et al., J. Biol . Chem ., 279(12): 1163-1169 (2004)).
[표 1] : 효소 활성
Figure 112017005010255-pct00001
Figure 112017005010255-pct00002
Figure 112017005010255-pct00003
Figure 112017005010255-pct00004
Figure 112017005010255-pct00005
Figure 112017005010255-pct00006
Figure 112017005010255-pct00007
Figure 112017005010255-pct00008
Figure 112017005010255-pct00009
Figure 112017005010255-pct00010
Figure 112017005010255-pct00011
Figure 112017005010255-pct00012
Figure 112017005010255-pct00013
Figure 112017005010255-pct00014
Figure 112017005010255-pct00015
도 1은 아실-ACP와 같은 아실 티오에스테르가 전구물질 중간체로서 C12 또는 C16:1 지방산(FFA)으로 전환될 수 있는 예시적인 경로를 보여준다. 도 1의 단계 1에서, 티오에스테라제가 아실-ACP를 FFA로 전환시키는데 사용된다. 특정 실시형태에서, 티오에스테라제를 암호화하는 유전자는 tesA, 'tesA, tesB , fatB1, fatB2, fatB3, fatA1, 또는 fatA이다(또한 이 단계를 촉매하는데 사용될 수 있는 티오에스테라제의 효소 활성을 갖는 폴리펩티드를 보여주는 상기 표 1 참조). 단계 2에서, CYP153A-환원효소 혼성 융합 폴리펩티드 또는 이의 변이체가 지방산으로부터 ω-OH 지방산(ω-OH FFA)을 생성하는데 사용된다. 다른 이관능성 분자, 예를 들면 α,ω-이산 또는 다른 ω-OH 지방산 유도체가 경로에 존재하는 효소 관능기에 따라 경로의 다운스트림에서 생산될 수 있다.
CYP153A - 환원효소 혼성 융합 폴리펩티드
ω-하이드록실라제(또는 ω-옥시게나제)는 특정 비-햄(non-heme) 이철 옥시게나제(예컨대, 슈도모나스 퓨티다(Pseudomonas putida ) GPo1로부터의 alkB) 및 특정 햄-타입 P450 옥시게나제(예컨대, 마리노박터 아쿠애올레이(Marinobacter aquaeolei)로부터의 cyp153A와 같은 ω-하이드록실라제)를 포함한다. P450은 편재하여 분포된 효소이며, 높은 복잡성을 갖고 광범위한 활성을 나타낸다. 이들은 광범위하게 다양한 기질을 전환시키고 다양한 화학적 반응을 촉매하는 유전자들의 상과(superfamily)에 의해 암호화되는 단백질이다. Cyp153A는 ω-위치에 대해 높은 선택성을 갖는 탄화수소 쇄를 하이드록실화하는 가용성 박테리아 시토크롬 P450의 아과(sub-family)이다(문헌 참조; van Beilen et al. (2006) Appl. Environ. Microbiol . 72:59-65). cyp153A 패밀리의 구성원들, 예를 들면 마이코박테리움 종(Mycobacterium sp.) HXN-1500으로부터의 cyp153A6(문헌 참조; Funhoff et al. (2006) J. Bacteriol . 188:5220-5227), 마이코박테리움 마리눔(Mycobacterium marinum)으로부터의 cyp153A16 및 폴라로모나스 종(Polaromonas sp.) JS666으로부터의 cyp153A(문헌 참조; Scheps et al. (2011) Org . Biomol . Chem. 9:6727-6733) 뿐만 아니라 마리노박터 아쿠애올리(Marinobacter aquaeoli )로부터의 cyp153A(문헌 참조; Honda-Malca et al. (2012) Chem . Commun. 48:5115-5117)는 알칸, 지방산 또는 지방 알콜의 ω-위치를 선택적으로 하이드록실화하는 것으로 시험관내에서 나타났다. 아래 표 2A 및 2B는 ω-OH 지방산 및 ω-OH 지방산 유도체를 생산하는데 사용될 수 있는 ω-하이드록실라제 효소 활성을 갖는 효소 및 산화환원 파트너의 예를 보여준다.
[표 2A] : ω-하이드록실라제 효소 활성(P450)(EC 1.14.15.3)의 예
Figure 112017005010255-pct00016
Figure 112017005010255-pct00017
Figure 112017005010255-pct00018
[표 2B] : ω-하이드록실라제 효소 활성(P450)(EC 1.14.15.3)에 대한 산화환원 파트너의 예
Figure 112017005010255-pct00019
Figure 112017005010255-pct00020
모든 시토크롬 P450과 마찬가지로, Cyp153A ω-하이드록실라제는 이들의 촉매 활성을 위해 전자를 필요로 하며, 이것은 페레독신 및 페레독신 환원효소와 같은 특이 산화환원 단백질을 통해 제공된다. 이들은 cyp153A와 상호작용하는 별개의 단백질이다. 자족성 혼성(키메라성) cyp153A 옥시게나제(, 활성을 위해 별개의 페레독신 및 페레독신 환원효소 단백질을 필요로 하지 않는 옥시게나제)는 알카니보락스 보르쿠멘시스(Alcanivorax borkumensis) SK2로부터의 cyp153A(문헌 참조; Kubota et al. (2005) Biosci . Biotechnol . Biochem. 69:2421-2430; Fujita et al. (2009) Biosci . Biotechnol . Biochem. 73:1825-1830)를 플라빈 모노뉴클레오티드(FMN) 및 NADPH-결합 부위 및 [2FeS] 페레독신 중심을 포함하는 P450RhF로부터의 환원효소 도메인과 융합함으로써 이전에 생성되었다(문헌 참조; Hunter et al. (2005) FEBS Lett . 579:2215-2220). P450RhF는 I형 P450-융합된 PFOR에 속한다(문헌 참조; DeMot and Parret (2003) Trends Microbiol . 10: 502). 이러한 혼성 cyp153A-RedRhF 융합 단백질은 시험관내 생물형질전환에서 ω-위치에서 옥탄을 하이드록실화하고 또한 사이클로헥산 또는 부틸벤젠과 같은 다른 화합물을 하이드록실화하는 것으로 나타났다. 또 다른 자족성 혼성(키메라성) cyp153A 옥시게나제는 마리노박터 아쿠애올리(Marinobacter aquaeoli )로부터의 cyp153A를 P450RhF 및 P450-BM3으로부터의 환원효소 도메인과 융합시킴으로써 생성되었다(문헌 참조; Scheps et al. (2013) Microb . Biotechnol . 6:694-707). 천연 P450-환원효소 융합 단백질의 예가 아래 표 2C 및 2D에 나타내어져 있다.
[표 2C]: 자족성 ω-1, ω-2, ω-3-하이드록실라제 (EC 1.14.14.1) 융합 단백질의 예
Figure 112017005010255-pct00021
Figure 112017005010255-pct00022
[표 2D]: 자족성 I형 P450-융합된 PFOR 융합 단백질의 예
Figure 112017005010255-pct00023
탄화수소 쇄의 ω-위치에 대한 이들의 높은 선택성을 고려하면, cyp153A 계열 옥시게나제는 재생가능한 탄소 공급원으로부터 α,ω-이관능성 지방산 유도체를 생산하기 위한 적합한 후보물질의 우수한 예인 것으로 보인다. 이것은 상업적으로 실현가능한 공정들의 개발이 이러한 귀중한 화합물들을 생성할 수 있게 할 것이다. 그럼에도, 다른 시토크롬 P450과 마찬가지로, cyp153A 계열 단백질은 정제된 효소 또는 원 세포 용해물을 갖는 시험관내 실험에 또는 지방산 유도체 또는 탄화수소이 외인성으로 추가되는 휴지 세포 생물형질전환에 지금까지 대부분 적용되었다(문헌 참조; Kubota et al., Fujita et al., Honda-Malca et al., Scheps et al., supra). 그러나, 혼성 융합-사용 시험관내 과정 또는 휴지 세포 생물형질전환은 ω-하이드록시 지방산 유도체의 대규모의 비용-효율적인 생산에 도움이 되지 않는다. 당업계에서 널리 수용되는 지식은, 다수의 시토크롬 P450 뿐만 아니라 alkB-타입 ω-하이드록실라제가 재조합 미생물에서 기능적으로 발현하기가 쉽지 않은데, 그 이유는 효소가 종종 불활성이고 이들의 화학작용이 규명하기가 어렵기 때문이다. 사실상, 지금까지 시도된 지방산-유도체 이외의 재생가능한 탄소 공급원을 사용하는 유일한 생체내 작업에서는 alkB ω-하이드록실라제를 사용하였으며 높은 세포 밀도 발효에서 단지 낮은 역가의 ω-하이드록시 지방산 유도체를 달성하였다(WO2013/024114A2).
본 발명은 재생가능한 탄소 공급원으로부터 생체내에서 ω-하이드록시 지방산 유도체를 효율적으로 생산할 수 있는 CYP153A-환원효소 혼성 융합 단백질 변이체를 제공한다. 보다 구체적으로, 알라닌(A)이 위치 307에서 글리신(G)을 치환하는 CYP153A (G307A) P450 촉매 도메인의 혼성 융합 단백질을 암호화하는 마리노박터 아쿠애올리(Marinobacter aquaeoli )로부터의 유전자를 로도코쿠스 종(Rhodococcus sp.) NCIMB9784로부터의 P450RhF의 c-말단 FMN- 및 Fe/S-함유 환원효소 도메인을 암호화하는 유전자와 융합시켰다. 생성되는 폴리펩티드는 상응하는 핵산 서열(서열번호 5)을 갖는 CYP153A-RedRhF 혼성 융합 폴리펩티드(서열번호 6)이다. 이러한 CYP153A-환원효소 혼성 융합 단백질이 대장균에서 발현되는 경우, 글루코스 지방산 유도체와 같은 단순 탄소 공급원을 갖는 세포가 ω-하이드록시 지방산 유도체로 효율적으로 전환되었다(실시예 1 참조). 유사한 CYP153A-환원효소 혼성 융합 폴리펩티드를 생성하는데 사용될 수 있는 적합한 ω-하이드록실라제(EC 1.14.15.3) 및 이들의 산화환원 파트너에 대한 또 다른 예가 표 2A 및 2B에 열거되어 있다(상기 참조).
CYP153A - 환원효소 혼성 융합 폴리펩티드 변이체
본 발명은 숙주 세포에서 발현되는 경우 높은 역가, 수율 및/또는 생산성의 ω-하이드록실화 지방산 유도체 조성물을 야기하는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 동정한다. 본 발명의 비제한적인 실시예(이하 실시예 1-7 참조)에서 혼성 CYP153A(G307A)-RedRhF 융합 폴리펩티드(상기 참조)가 증가된 양의 ω-OH 지방산 및 ω-OH 지방산 유도체를 생산하도록 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 효율적으로 조작하는 주형으로서 사용되었다. 예를 들면, 이러한 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 글루코스와 같은 단순 탄소 공급원으로부터 생체내에서 도데칸산과 같은 화합물을 12-하이드록시 도데칸산으로 효율적으로 전환시킬 수 있다. 예를 들면, 재생가능한 공급원료로부터 유도되는 것과 같은 어떠한 단순 탄소 공급원도 적합하다. 조작된 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체(, 조작된 CYP153A-RedRhF 혼성 융합 폴리펩티드 변이체를 통해 예시됨)가 재생가능한 공급원료로부터 글루코스와 같은 탄소 공급원을 사용함으로써 대장균과 같은 숙주 세포에서 티오에스테라제와 공동-발현되는 경우 생체내에서 지방산을 ω-OH 지방산을 포함한 특정의 바람직한 화합물로 효율적으로 전환시킬 수 있는 것으로 나타났다(이하 실시예들 참조). 본 발명을 따름으로써, 다른 혼성 융합 폴리펩티드 변이체는 CYP153A 단백질을 암호화하는 유전자와 같은 돌연변이된 유전자를 c-말단 환원효소 도메인을 암호화하는 돌연변이된 유전자에 결합시킴으로써 조작될 수 있다(상기 표 2A 내지 2D 참조). 예를 들면, 유전자 둘 다(P5450 및 환원효소 도메인)를 돌연변이시키거나 하나의 유전자(P450 또는 환원효소 도메인)를 돌연변이시키는 변형이 본원에 포함된다. 이러한 지침에 따라, 유사한 융합 단백질 변이체들이 다른 타입의 ω-하이드록실라제로부터 생성될 수 있다.
따라서, 본 발명은 숙주 세포에서 발현되는 경우 높은 역가, 수율 및/또는 생산성의 ω-하이드록실화 지방산 유도체를 야기하는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체에 관한 것이다. CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 CYP153A 도메인 또는 환원효소 도메인 또는 둘 다에 하나 이상의 돌연변이를 갖는다. 하나의 실시형태에서, 본 발명은 서열번호 6에 대해 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖고 위치 27, 82, 141, 178, 231, 309, 407, 415, 516, 666 및/또는 796을 포함하는 아미노산 위치에 하나 이상의 돌연변이를 갖는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 제공하며, 여기서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 지방산에서 ω-OH 지방산으로의 전환을 촉매한다. 보다 구체적으로, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 아르기닌(R)이 리신(L)으로 치환된 R27L; 아르기닌(R)이 아스파르트산(D)으로 치환된 위치 R82D; 발린이 이소류신(I)으로 치환된 위치 V141I; 발린(V)이 글루타민(Q)으로 치환된 위치 V141Q; 발린(V)이 글리신(G)으로 치환된 위치 V141G; 발린(V)이 메티오닌(M)으로 치환된 위치 V141M; 발린(V)이 류신(L)으로 치환된 위치 V141L; 발린(V)이 트레오닌(T)으로 치환된 위치 V141T; 아르기닌(R)이 아스파라긴(N)으로 치환된 위치 R178N; 알라닌(A)이 트레오닌(T)으로 치환된 위치 A231T; 아스파라긴(N)이 아르기닌(R)으로 치환된 위치 N309R; 아스파라긴(N)이 알라닌(A)으로 치환된 위치 N407A; 발린(V)이 아르기닌(R)으로 치환된 위치 V415R; 트레오닌(T)이 발린(V)으로 치환된 위치 T516V; 프롤린(P)이 알라닌(A)으로 치환된 위치 P666A; 프롤린(P)이 아스파르트산(D)으로 치환된 위치 P666D; 및 알라닌(A)이 발린(V)으로 치환된 위치 A796V를 포함한 하나 이상의 상기 돌연변이를 갖는다. CYP153A-환원효소 혼성 융합 폴리펩티드 변이체의 예는 서열번호 8, 서열번호 10, 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28 또는 서열번호 30, 서열번호 32, 서열번호 34, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42, 서열번호 44 및 서열번호 46을 포함한다. 하나의 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 혼성 cyp153A-RedRhF-타입 융합 단백질 변이체이다. 또 다른 실시형태에서, 재조합 숙주 세포에서 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 상응하는 숙주 세포에서 CYP153A-환원효소 혼성 융합 폴리펩티드의 발현에 의해 생산된 ω-OH 지방산 또는 이의 조성물의 역가에 비해 더 높은 역가의 ω-OH 지방산 유도체 또는 이의 조성물을 야기한다. 또 다른 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 돌연변이 V141I 및/또는 V141T를 포함한 아미노산 위치 141에 돌연변이를 갖는다. 본원에서, 재조합 숙주 세포에서 돌연변이 V141I 또는 V141T를 갖는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체의 발현은 CYP153A-환원효소 혼성 융합 폴리펩티드의 발현에 의해 생산된 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9 :1, C10 :1, C11 :1, C12 :1, C13 :1, C14 :1, C15 :1, C16 :1, C17 :1, C18 :1, C19:1 및/또는 C20 :1 지방산의 역가에 비해 각각 더 높은 역가의 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9 :1, C10 :1, C11 :1, C12 :1, C13 :1, C14:1, C15 :1, C16 :1, C17 :1, C18 :1, C19 :1 및/또는 C20 :1 지방산을 야기한다. 하나의 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 돌연변이 V141I 및 A231T (서열번호 32)를 갖고, 티오에스테라제의 효소 기능을 갖는 숙주 세포에서 발현되는 경우 증가된 양의 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9 :1, C10 :1, C11 :1, C12 :1, C13 :1, C14 :1, C15 :1, C16 :1, C17 :1, C18 :1, C19 :1 및/또는 C20 :1 지방산을 생산한다. 또 다른 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 돌연변이 R27L, R82D, V141M, R178N 및 N407A (서열번호 34)를 갖고, 티오에스테라제의 효소 기능을 갖는 숙주 세포에서 발현되는 경우 증가된 양의 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8:1, C9 :1, C10 :1, C11 :1, C12 :1, C13 :1, C14 :1, C15 :1, C16 :1, C17 :1, C18 :1, C19 :1 및/또는 C20 :1 지방산을 생산한다. 또 다른 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 돌연변이 P666A (서열번호 36)를 갖고, 티오에스테라제의 효소 기능을 갖는 숙주 세포에서 발현되는 경우 증가된 양의 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9 :1, C10 :1, C11 :1, C12 :1, C13 :1, C14 :1, C15 :1, C16:1, C17 :1, C18 :1, C19 :1 및/또는 C20 :1 지방산을 생산한다. 또 다른 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 돌연변이 A796V (서열번호 38)를 갖고, 티오에스테라제의 효소 기능을 갖는 숙주 세포에서 발현되는 경우 증가된 양의 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9:1, C10 :1, C11 :1, C12 :1, C13 :1, C14 :1, C15 :1, C16 :1, C17 :1, C18 :1, C19 :1 및/또는 C20 :1 지방산을 생산한다. 또 다른 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 돌연변이 A796V, P666D 및 T516V (서열번호 40)를 갖고, 티오에스테라제의 효소 기능을 갖는 숙주 세포에서 발현되는 경우 증가된 양의 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9 :1, C10 :1, C11 :1, C12 :1, C13 :1, C14:1, C15 :1, C16 :1, C17 :1, C18 :1, C19 :1 및/또는 C20 :1 지방산을 생산한다. 또 다른 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 돌연변이 V141I, A231T 및 A796V (서열번호 42)를 갖고, 티오에스테라제의 효소 기능을 갖는 숙주 세포에서 발현되는 경우 증가된 양의 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9 :1, C10 :1, C11 :1, C12 :1, C13 :1, C14 :1, C15 :1, C16 :1, C17 :1, C18:1, C19 :1 및/또는 C20 :1 지방산을 생산한다. 또 다른 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 돌연변이 R27L, R82D, V141M, R178N, N407A 및 A796V (서열번호 44)를 갖고, 티오에스테라제의 효소 기능을 갖는 숙주 세포에서 발현되는 경우 증가된 양의 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9 :1, C10 :1, C11 :1, C12 :1, C13 :1, C14 :1, C15 :1, C16 :1, C17 :1, C18 :1, C19 :1 및/또는 C20 :1 지방산을 생산한다. 또 다른 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 돌연변이 V141T, A231T 및 A796V (서열번호 46)를 갖고, 티오에스테라제의 효소 기능을 갖는 숙주 세포에서 발현되는 경우 증가된 양의 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9 :1, C10:1, C11 :1, C12 :1, C13 :1, C14 :1, C15 :1, C16 :1, C17 :1, C18 :1, C19 :1 및/또는 C20 :1 지방산을 생산한다. 하나의 실시형태에서, 서열번호 32, 서열번호 34, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42, 서열번호 44 및 서열번호 46의 변이체는 서열번호 6과 비교하는 경우 증가된 양의 ω-OH 지방산 또는 지방산 유도체를 생산하였다. 하나의 실시형태에서, 이러한 ω-OH 지방산은 ω-OH C8 :0 지방산, ω-OH C10 :0 지방산, ω-OH C12 :0 지방산, ω-OH C14 :0 지방산, ω-OH C16 :0 지방산, ω-OH C18 :0 지방산, ω-OH C20 :0 지방산, ω-OH C8 :1 지방산, ω-OH C10 :1 지방산, ω-OH C12 :1 지방산, ω-OH C14:1 지방산, ω-OH C16 :1 지방산, ω-OH C18 :1 지방산, ω-OH C20 :1 지방산 등이다.
본 발명은 CYP153A-환원효소 혼성 융합-관련 폴리뉴클레오티드 및 폴리펩티드 변이체를 동정한다. CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 서열번호 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44 및 46을 포함한다. CYP153A-환원효소 혼성 융합 핵산 변이체(DNA 서열)는 서열번호 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45 및 47을 포함한다. 그러나, CYP153A-환원효소 혼성 융합 폴리뉴클레오티드 변이체에 대한 절대적인 서열 동일성이 필요한 것은 아님을 인지할 것이다. 예를 들면, 특정 폴리뉴클레오티드 서열에 있어서의 변화가 이루어질 수 있으며, 암호화된 폴리펩티드가 활성에 대해 스크리닝될 수 있다. 이러한 변화는 전형적으로, 예를 들면, 코돈 최적화를 통해서와 같은 보존적 돌연변이 및 잠재성 돌연변이를 포함한다. 변형된 또는 돌연변이된(, 돌연변이체) 폴리뉴클레오티드 및 암호화된 변이체 폴리펩티드는 당업계에 공지된 방법을 사용하여 야생형 또는 주형 폴리펩티드에 비해 증가된 촉매 활성, 증가된 안정성, 또는 감소된 억제(예컨대, 감소된 피드백 억제)를 포함하지만 이에 제한되지 않는 개선된 기능과 같은 목적하는 기능에 대해 스크리닝될 수 있다. 본 발명은 효소 분류(EC) 번호에 따라 본원에 기재된 지방산 생합성 경로의 다양한 단계(, 반응)에 관련된 효소 활성을 동정하며, 이러한 EC 번호에 의해 분류된 예시적인 폴리펩티드(예컨대, 특이 효소로서 기능하고 특이 효소 활성을 나타내는 것), 및 이러한 폴리펩티드를 암호화하는 예시적인 폴리뉴클레오티드를 제공한다. 서열 식별자 번호(상기 서열번호)에 의해 본원에 동정된 이러한 예시적인 폴리펩티드 및 폴리뉴클레오티드가 도 1에 나타낸 것과 같은 숙주 세포에서 지방산 경로를 조작하는데 유용하다. 그러나, 본원에 기재된 폴리펩티드 및 폴리뉴클레오티드는 예시적이며, 따라서, 비제한적임을 이해해야 한다. 본원에 기재된 예시적인 폴리펩티드의 동족체의 서열이, 예를 들면, 국립 생물공학 정보센터(NCBI)에 의해 제공되는 Entrez 데이터베이스, 스위스 생물정보학 연구소에 의해 제공되는 ExPasy 데이터베이스, 브라운슈바이크 공과 대학에 의해 제공되는 BRENDA 데이터베이스, 및 교토 대학과 도쿄 대학의 생물정보학 센터에 의해 제공된 KEGG 데이터베이스와 같은 데이터베이스를 사용하여 당업계의 숙련가들에게 이용 가능하며, 이들 모두는 월드 아이드 웹 상에서 이용 가능하다.
하나의 실시형태에서, 본 발명을 실시하는데 사용하기 위한 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 서열번호 8, 서열번호 10, 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28 또는 서열번호 30, 서열번호 32, 서열번호 34, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42, 서열번호 44 및 서열번호 46에 대해 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 몇몇 실시형태에서 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는, 알라닌(A)이 글리신(G)을 대체하는 마리노박터 아쿠애올레이(Marinobacter aquaeolei)로부터의 CYP153A (G307A) 폴리펩티드로부터 유도되고, 로도코쿠스 종(Rhodococcus sp .) NCIMB9784로부터의 P450RhF의 환원효소 도메인과 융합된다. 시토크롬 P450RhF는 자족성이고, 고도의 기질 무차별성(substrate promiscuity)을 나타내며 광범위한 관능 그룹을 촉매한다. 또 다른 실시형태에서, 본 발명을 실시하는데 사용하기 위한 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28 또는 서열번호 30, 서열번호 32, 서열번호 34, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42, 서열번호 44 또는 서열번호 46에 대해 적어도 약 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99% 서열 동일성을 갖고, 또한 본원에 기재된 유용한 특징들 및/또는 특성들을 야기하는 하나 이상의 치환을 포함할 수 있다. 또 다른 실시형태에서, 본 발명을 실시하는데 사용하기 위한 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 서열번호 8, 서열번호 10, 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28 또는 서열번호 30, 서열번호 32, 서열번호 34, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42, 서열번호 44 또는 서열번호 46에 대해 적어도 약 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91% 또는 90% 서열 동일성을 갖는다. 여전히 또 다른 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체의 P450 촉매 도메인은 마리노박터 아쿠애올레이(Marinobacter aquaeolei) 이외의 유기체로부터 유도된다. 이러한 다른 유기체는 아시네토박터 종(Acinetobacter sp.), 마이코박테리움 마리눔(Mycobacterium marinum), 폴라로모나스 종(Polaromonas sp.), 알카니보락스 보르쿠멘시스, 버크홀데리아 펀고룸(Burkholderia fungorum), 카울로박터 크레센투스(Caulobacter crescentus), 하이포모나스 넵투늄(Hyphomonas neptunium), 로도슈도모나스 팔루스트리스(Rhodopseudomonas palustris), 스핀고모나스 종(Sphingomonas sp.), 마이코박테리움 종(Mycobacterium sp.)을 포함하지만, 이에 제한되지 않는다. 여전히 또 다른 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체의 환원효소 도메인은 로도코쿠스 종(Rhodococcus sp.) 이외의 유기체로부터 유도된다. 이러한 다른 유기체는 로도코쿠스 에퀴(Rhodococcus equi), 아시네토박터 라디오레시스텐스(Acinetobacter radioresistens), 버크홀데리아 말레이(Burkholderia mallei), 버크홀데리아 말레이, 랄스토니아 유트로파(Ralstonia eutropha), 쿠프리아비두스 메탈리두란스(Cupriavidus metallidurans)를 포함하지만, 이에 제한되지 않는다.
관련된 실시형태에서, 본 발명은 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 11, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41, 서열번호 43, 서열번호 45 또는 서열번호 47에 대해 적어도 약 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99% 서열 동일성을 갖는 CYP153A-환원효소 혼성 융합 폴리뉴클레오티드 변이체를 포함한다. 몇몇 실시형태에서 핵산 서열은 본원에 기재된 바와 같은 개선된 특징들 및/또는 특성들을 초래하는 하나 이상의 치환을 갖는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 암호화한다. 또 다른 실시형태에서, 본 발명을 실시하는데 사용하기 위한 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 서열번호 7, 서열번호 9, 서열번호 11, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41, 서열번호 43, 서열번호 45 또는 서열번호 47에 대해 적어도 약 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91% 또는 90% 서열 동일성을 갖는 뉴클레오티드 서열에 의해 암호화된다. 또 다른 측면에서, 본 발명은 서열번호 7, 서열번호 9, 서열번호 11, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41, 서열번호 43, 서열번호 45 또는 서열번호 47에 상응하는 핵산 서열의 실질적으로 전체 길이에 걸쳐 엄격한 조건하에서 혼성화되는 핵산 서열에 의해 암호화된 아미노산 서열을 포함하는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체에 관한 것이다. 몇몇 실시형태에서 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 마리노박터 아쿠애올레이(Marinobacter aquaeolei)로부터 유도된다. 다른 실시형태에서, P450 혼성 융합 폴리펩티드는 아시네토박터 종, 마이코박테리움 마리눔, 폴라로모나스 종, 알카니보락스 보르쿠멘시스, 버크홀데리아 펀고룸, 카울로박터 크레센투스, 하이포모나스 넵투늄, 로도슈도모나스 팔루스트리스, 스핀고모나스 종, 마이코박테리움 종으로부터 유도된다.
추가의 CYP153A - 환원효소 혼성 융합 폴리펩티드 변이체
본 발명은 추가의 CYP153A-환원효소 혼성 융합-관련 폴리뉴클레오티드 및 폴리펩티드 변이체를 동정하며, 여기서, 변이체가 주형으로서 사용되었다. CYP153A-환원효소 혼성 융합 폴리펩티드 변이체 주형은 혼성 CYP153A(G307A)-RedRhF 융합 폴리펩티드를 기본으로 하며 돌연변이 A796V (서열번호 38)를 추가로 포함한다. cyp153A-Red450RhF 융합 단백질의 전체 포화 라이브러리를 구축하고 cyp153A(G307A)-Red450RhF(A796V)(서열번호 38)를 능가하는 개선을 나타낸 변이체에 대해 스크리닝하였다(실시예 7 참조). 돌연변이 G307A 및 A796V는 cyp153A의 ω-하이드록실라제 활성을 개선시키는 이로운 돌연변이이다(서열번호 38 참조). 생성된 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체가 표 11(이하)에 나타내어져 있다. 이러한 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 서열번호 38과 비교하는 경우 증가된 양의 ω-하이드록시 지방산(ω-OH FFA 역가)를 생산하며, 서열번호 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94 및 96을 포함한다. 이러한 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20 , C8 :1, C9 :1, C10 :1, C11 :1, C12 :1, C13 :1, C14 :1, C15 :1, C16 :1, C17 :1, C18 :1, C19 :1 및/또는 C20 :1 지방산 및/또는 지방산 유도체를 포함한 증가된 양의 ω-OH 지방산을 생산할 수 있다.
CYP153A-환원효소 혼성 융합 핵산 변이체(DNA 서열)는 서열번호 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93 및 95를 포함한다. 그러나, CYP153A-환원효소 혼성 융합 폴리뉴클레오티드 변이체에 대한 절대적인 서열 동일성이 필요한 것은 아님을 인지할 것이다. 예를 들면, 특정 폴리뉴클레오티드 서열에 있어서의 변화가 이루어질 수 있으며, 암호화된 폴리펩티드가 활성에 대해 스크리닝될 수 있다. 이러한 변화는 전형적으로, 예를 들면, 코돈 최적화를 통해서와 같은 보존적 돌연변이 및 잠재성 돌연변이를 포함한다. 변형된 또는 돌연변이된(즉, 돌연변이체) 폴리뉴클레오티드 및 암호화된 변이체 폴리펩티드는 당업계에 공지된 방법을 사용하여 야생형 또는 주형 폴리펩티드에 비해 증가된 촉매 활성, 증가된 안정성, 또는 감소된 억제(예컨대, 감소된 피드백 억제)를 포함하지만 이에 제한되지 않는 개선된 기능과 같은 목적하는 기능에 대해 스크리닝될 수 있다. 본 발명은 효소 분류(EC) 번호에 따라 본원에 기재된 지방산 생합성 경로의 다양한 단계(즉, 반응)에 관련된 효소 활성을 동정하며, 이러한 EC 번호에 의해 분류된 예시적인 폴리펩티드(예컨대, 특이 효소로서 기능하고 특이 효소 활성을 나타내는 것), 및 이러한 폴리펩티드를 암호화하는 예시적인 폴리뉴클레오티드를 제공한다. 서열 식별자 번호(상기 서열번호)에 의해 본원에 동정된 이러한 예시적인 폴리펩티드 및 폴리뉴클레오티드가 도 1에 나타낸 것과 같은 숙주 세포에서 지방산 경로를 조작하는데 유용하다. 그러나, 본원에 기재된 폴리펩티드 및 폴리뉴클레오티드는 예시적이며, 따라서, 비제한적임을 이해해야 한다. 본원에 기재된 예시적인 폴리펩티드의 동족체의 서열이, 예를 들면, 국립 생물공학 정보센터(NCBI)에 의해 제공되는 Entrez 데이터베이스, 스위스 생물정보학 연구소에 의해 제공되는 ExPasy 데이터베이스, 브라운슈바이크 공과 대학에 의해 제공되는 BRENDA 데이터베이스, 및 교토 대학과 도쿄 대학의 생물정보학 센터에 의해 제공된 KEGG 데이터베이스와 같은 데이터베이스를 사용하여 당업계의 숙련가들에게 이용 가능하며, 이들 모두는 월드 아이드 웹 상에서 이용 가능하다.
하나의 실시형태에서, 본 발명을 실시하는데 사용하기 위한 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 서열번호 48, 서열번호 50, 서열번호 52, 서열번호 54, 서열번호 56, 서열번호 58, 서열번호 60, 서열번호 62, 서열번호 64, 서열번호 66, 서열번호 68 또는 서열번호 70, 서열번호 72, 서열번호 74, 서열번호 76, 서열번호 78, 서열번호 80, 서열번호 82, 서열번호 84, 서열번호 86, 서열번호 88, 서열번호 90, 서열번호 92, 서열번호 94 및 서열번호 96에 대해 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 몇몇 실시형태에서 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 글리신(G)이 알라닌(A)으로 대체된 마리노박터 아쿠애올레이(Marinobacter aquaeolei)로부터의 CYP153A (G307A) 폴리펩티드로부터 유도되고, 로도코쿠스 종 NCIMB9784으로부터의 P450RhF의 환원효소 도메인과 융합되며, 알라닌(A)이 발린(V)으로 대체된 A796V의 부가 돌연변이를 포함한다. 시토크롬 P450RhF는 자족성이며, 고도의 기질 무차별성을 나타내며 광범위한 관능 그룹을 촉매한다. 또 다른 실시형태에서, 본 발명을 실시하는데 사용하기 위한 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 서열번호 38, 서열번호 48, 서열번호 50, 서열번호 52, 서열번호 54, 서열번호 56, 서열번호 58, 서열번호 60, 서열번호 62, 서열번호 64, 서열번호 66, 서열번호 68 또는 서열번호 70, 서열번호 72, 서열번호 74, 서열번호 76, 서열번호 78, 서열번호 80, 서열번호 82, 서열번호 84, 서열번호 86, 서열번호 88, 서열번호 90, 서열번호 92, 서열번호 94 또는 서열번호 96에 대해 적어도 약 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99% 서열 동일성을 갖고, 또한 본원에 기재된 바와 같은 유용한 특징들 및/또는 특성들을 야기하는 하나 이상의 치환을 포함할 수 있다. 또 다른 실시형태에서, 본 발명을 실시하는데 사용하기 위한 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 서열번호 48, 서열번호 50, 서열번호 52, 서열번호 54, 서열번호 56, 서열번호 58, 서열번호 60, 서열번호 62, 서열번호 64, 서열번호 66, 서열번호 68 또는 서열번호 70, 서열번호 72, 서열번호 74, 서열번호 76, 서열번호 78, 서열번호 80, 서열번호 82, 서열번호 84, 서열번호 86, 서열번호 88, 서열번호 90, 서열번호 92, 서열번호 94 또는 서열번호 96에 대해 적어도 약 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91% 또는 90% 서열 동일성을 갖는다. 여전히 또 다른 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체의 P450 촉매 도메인은 마리노박터 아쿠애올레이(Marinobacter aquaeolei) 이외의 유기체로부터 유도된다. 이러한 다른 유기체는 아시네토박터 종, 마이코박테리움 마리눔, 폴라로모나스 종, 알카니보락스 보르쿠멘시스, 버크홀데리아 펀고룸, 카울 로박터 크레센투스, 하이포모나스 넵투늄, 로도슈도모나스 팔루스트리스 , 스핀고모 나스 종, 마이코박테리움 종을 포함하지만, 이에 제한되지 않는다. 여전히 또 다른 실시형태에서, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체의 환원효소 도메인은 로도코쿠스 종 이외의 유기체로부터 유도된다. 이러한 다른 유기체는 로도코쿠스 에퀴 , 아시네토박터 라디오레시스텐스 , 버크홀데리아 말레이, 버크홀데리아 말레이, 랄스토니아 유트로파 , 쿠프리아비두스 메탈리두란스를 포함하지만, 이에 제한되지 않는다.
관련된 실시형태에서, 본 발명은 서열번호 47, 서열번호 49, 서열번호 51, 서열번호 53, 서열번호 55, 서열번호 57, 서열번호 59, 서열번호 61, 서열번호 63, 서열번호 65, 서열번호 67, 서열번호 69, 서열번호 71, 서열번호 73, 서열번호 75, 서열번호 77, 서열번호 79, 서열번호 81, 서열번호 83, 서열번호 85, 서열번호 87, 서열번호 89, 서열번호 91, 서열번호 93 또는 서열번호 95에 대해 적어도 약 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99% 서열 동일성을 갖는 CYP153A-환원효소 혼성 융합 폴리뉴클레오티드 변이체를 포함한다. 몇몇 실시형태에서 핵산 서열은 본원에 기재된 바와 같은 개선된 특징들 및/또는 특성들을 야기하는 하나 이상의 치환을 갖는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 암호화한다. 또 다른 관련된 실시형태에서, 본 발명을 실시하는데 사용하기 위한 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 서열번호 47, 서열번호 49, 서열번호 51, 서열번호 53, 서열번호 55, 서열번호 57, 서열번호 59, 서열번호 61, 서열번호 63, 서열번호 65, 서열번호 67, 서열번호 69, 서열번호 71, 서열번호 73, 서열번호 75, 서열번호 77, 서열번호 79, 서열번호 81, 서열번호 83, 서열번호 85, 서열번호 87, 서열번호 89, 서열번호 91, 서열번호 93 또는 서열번호 95에 대해 적어도 약 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91% 또는 90% 서열 동일성을 갖는 뉴클레오티드 서열에 의해 암호화된다. 또 다른 측면에서, 본 발명은 서열번호 47, 서열번호 49, 서열번호 51, 서열번호 53, 서열번호 55, 서열번호 57, 서열번호 59, 서열번호 61, 서열번호 63, 서열번호 65, 서열번호 67, 서열번호 69, 서열번호 71, 서열번호 73, 서열번호 75, 서열번호 77, 서열번호 79, 서열번호 81, 서열번호 83, 서열번호 85, 서열번호 87, 서열번호 89, 서열번호 91, 서열번호 93 또는 서열번호 95에 상응하는 핵산 서열의 실질적으로 전체 길이에 걸쳐 엄격한 조건하에서 혼성화되는 핵산 서열에 의해 암호화되는 아미노산 서열을 포함하는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체에 관한 것이다. 몇몇 실시형태에서 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 마리노박터 아쿠애올레이(Marinobacter aquaeolei) 종으로부터 유도된다. 다른 실시형태에서, P450 혼성 융합 폴리펩티드는 아시네토박터 종, 마이코박테리움 마리눔 , 폴라로모나스 종, 알카니보락스 보르쿠멘시스 , 버크홀데리아 펀고룸 , 카울로박터 크레센투스 , 하이포모 나스 넵투늄, 로도슈도모나스 팔루스트리스 , 스핀고모나스 종, 및 마이코박테리움 종으로부터 유도된다.
서열
아래 표에 나타낸 변이체는 혼성 시토크롬 P450 cyp153A16(G307A)-RedRhF 융합 단백질을 기본으로 한다.
[표]
Figure 112017005010255-pct00024
Figure 112017005010255-pct00025
Figure 112017005010255-pct00026
Figure 112017005010255-pct00027
Figure 112017005010255-pct00028
아래 표에 나타낸 변이체는 혼성 시토크롬 P450 cyp153A(G307A)-Red450RhF(A796V) 융합 단백질을 기본으로 한다.
[표]
Figure 112017005010255-pct00029
Figure 112017005010255-pct00030
Figure 112017005010255-pct00031
Figure 112017005010255-pct00032
Figure 112017005010255-pct00033
Figure 112017005010255-pct00034
변형 및 돌연변이
본원에서 사용되는 바와 같은 변이체 폴리펩티드는 적어도 하나의 아미노산에 의해 야생형 또는 주형 폴리펩티드와는 상이한 아미노산 서열을 갖는 폴리펩티드를 나타낸다. 예를 들면, 변이체(예컨대, 돌연변이체)는 알라닌, 발린, 류신, 및 이소류신과 같은 지방족 아미노산의 다른 지방족 아미노산으로의 대체; 세린의 트레오닌으로의 대체; 트레오닌의 세린으로의 대체; 아스파르트산 및 글루탐산과 같은 산성 잔기의 다른 산성 잔기로의 대체; 아스파라긴 및 글루타민과 같은 아미드 그룹을 갖는 잔기의 아미드 그룹을 갖는 다른 잔기로의 대체; 리신 및 아르기닌과 같은 염기성 잔기의 다른 염기성 잔기로의 교체; 및 페닐알라닌 및 티로신과 같은 방향족 잔기의 다른 방향족 잔기로의 대체를 포함하지만 이에 제한되지 않는 상기 보존적 아미노산 치환 중의 하나 이상을 가질 수 있다. 몇몇 실시형태에서, 변이체 폴리펩티드는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 99, 또는 그 이상의 아미노산 치환, 부가, 삽입, 또는 결실을 갖는다. 변이체 또는 돌연변이체로서 기능하는 폴리펩티드의 몇몇 바람직한 단편은 상응하는 야생형 폴리펩티드의 생물학적 기능(예컨대, 효소 활성)의 일부 또는 전부를 보유한다. 몇몇 실시형태에서, 단편은 상응하는 야생형 또는 주형 폴리펩티드의 생물학적 기능의 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 또는 적어도 98% 또는 그 이상을 보유한다. 또 다른 실시형태에서, 단편 또는 돌연변이체는 상응하는 야생형 또는 주형 폴리펩티드의 생물학적 기능의 약 100%를 보유한다. 또 다른 실시형태에서, 몇몇 단편은 상응하는 야생형 또는 주형 폴리펩티드에 비해 증가된 생물학적 기능을 나타낸다. 어떤 아미노산 잔기들이 생물학적 활성에 영향을 주지 않으면서 치환, 삽입, 또는 결실될 수 있는지를 결정하는 가이던스(guidance)는 당업계에 잘 알려진 컴퓨터 프로그램들, 예를 들면, LASERGENE 소프트웨어(DNASTAR, Inc., Madison, WI)를 이용하여 찾을 수 있다. 몇몇 실시형태에서, 단편은 상응하는 야생형 폴리펩티드 또는 주형 폴리펩티드에 비해 증가된 생물학적 기능을 나타낸다. 예를 들면, 단편은 상응하는 야생형 폴리펩티드 또는 주형 폴리펩티드에 비해 효소 활성에 있어서 적어도 10%, 적어도 25%, 적어도 50%, 적어도 75%, 또는 적어도 90% 개선을 나타낼 수 있다. 또 다른 실시형태에서, 단편은 상응하는 야생형 폴리펩티드 또는 주형 폴리펩티드에 비해 효소 활성에 있어서 적어도 100%, 적어도 200%, 또는 적어도 500% 개선을 나타낸다.
본원에 기재된 폴리펩티드는 폴리펩티드 기능에 실질적인 영향을 주지 않는 추가적인 보존적 또는 비-필수 아미노산 치환을 가질 수 있는 것으로 이해된다. 특정 치환이 용인되는지(, ω-하이드록실라제 효소 활성과 같은 목적하는 생물학적 기능에 부정적인 영향을 주지 않는지)의 여부는 당업계에 알려진 바와 같이 결정될 수 있다(문헌 참조; Bowie et al. (1990) Science, 247:1306-1310). 보존적 아미노산 치환은 아미노산 잔기가 유사한 측쇄를 갖는 아미노산 잔기로 대체된 것이다. 유사한 측쇄를 갖는 아미노산 잔기의 계열이 당업계에 정의되어 있다. 이러한 계열은 염기성 측쇄(예컨대, 리신, 아르기닌, 히스티딘), 산성 측쇄(예컨대, 아스파르트산, 글루탐산), 비하전된 극성 측쇄(예컨대, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 비극성 측쇄(예컨대, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지화 측쇄(예컨대, 트레오닌, 발린, 이소류신), 및 방향족 측쇄(예컨대, 티로신, 페닐알라닌, 트립토판, 히스티딘)를 갖는 아미노산을 포함한다.
변이체는 자연적으로 발생하거나 시험관내에서 생성될 수 있다. 특히, 이러한 변이체는 부위 지향 돌연변이(site directed mutagenesis), 무작위 화학적 돌연변이(random chemical mutagenesis), 엑소뉴클레아제 Ⅲ 결실 절차, 또는 표준 클로닝 기술과 같은 유전자 조작 기술들을 이용하여 생성될 수 있다. 대안적으로, 이러한 변이체, 돌연변이체, 단편, 유사체, 또는 유도체는 화학적 합성 또는 변형 절차들을 이용하여 생성될 수 있다. 변이체를 만드는 방법은 당업계에 잘 알려져 있다. 예를 들면, 변이체는 무작위 및 부위 지향 돌연변이를 이용함으로써 제조될 수 있다. 무작위 및 부위 지향 돌연변이는 일반적으로 당업계에 알려져 있다(예를 들면, Arnold(1993) Curr. Opin. Biotech. 4:450-455 참조). 무작위 돌연변이는 오류 유발 PCR(예를 들면, Leung et al. (1989) Technique 1:11-15; and Caldwell et al. (1992) PCR Methods Applic. 2:28-33 참조)을 이용하여 달성될 수 있다. 오류 유발 PCR에서, 실제 PCR은 DNA 폴리머라제의 복사 정확도(copying fidelity)가 낮은 조건하에서 수행되어, PCR 생성물의 전체 길이를 따라 높은 점 돌연변이율이 얻어지도록 한다. 간략하게, 이러한 절차에서, 돌연변이유발될 핵산(예컨대, P450 단백질 또는 P450 혼성 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열)은 PCR 생성물의 전체 길이를 따라 높은 점 돌연변이율을 달성하기 위하여 PCR 프라이머, 반응 완충제, MgCl2, MnCl2, Taq 폴리머라제, 및 적당한 농도의 dNTP와 혼합된다. 예를 들면, 반응은 돌연변이유발될 20 fmole의 핵산, 30 pmole의 각 PCR 프라이머, 50 mMKCl, 10 mM Tris HCl(pH 8.3), 0.01 % 젤라틴을 포함하는 반응 완충제, 7 mM MgCl2, 0.5 mM MnCl2, 5 단위의 Taq 폴리머라제, 0.2 mM dGTP, 0.2 mM dATP, 1 mM dCTP, 그리고 1 mM dTTP를 이용하여 수행될 수 있다. PCR은 94℃에서 1분, 45℃에서 1분, 그리고 72℃에서 1분의 30회 주기 동안 수행될 수 있다. 그러나, 당업자라면 이러한 파라미터들은 경우에 따라 변동될 수 있음을 이해할 것이다. 그후, 돌연변이유발된 핵산을 적절한 벡터로 클로닝하고, 돌연변이유발된 핵산에 의해 암호화되는 폴리펩티드의 활성을 평가한다. 부위 지향 돌연변이는 관심 있는 임의의 클로닝된 DNA에서 부위-특이적 돌연변이를 생성하기 위해 올리고뉴클레오티드-지향 돌연변이유발을 이용하여 달성될 수 있다. 올리고뉴클레오티드 돌연변이유발은 당업계에 기재되어 있다(예를 들면, Reidhaar-Olson et al. (1988) Science 241:53-57 참조). 간략하게, 이러한 절차들에서, 클로닝된 DNA 내로 도입될 하나 이상의 돌연변이를 지닌 복수의 이중 가닥 올리고뉴클레오티드를 합성하고, 돌연변이유발될 클로닝된 DNA(예컨대, P450 폴리펩티드 또는 P450 혼성 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열) 내로 삽입한다. 돌연변이유발된 DNA를 함유한 클론을 회수하고, 이들이 암호화하는 폴리펩티드의 활성을 평가한다.
변이체를 생성하는 또 다른 방법은 조립 PCR(assembly PCR)이다. 조립 PCR은 작은 DNA 단편들의 혼합물로부터의 PCR 생성물의 조립을 수반한다. 다수의 상이한 PCR 반응이 동일한 바이알에서 병행하여 일어나며, 일 반응의 생성물이 또 다른 반응의 생성물을 프라이밍한다(미국 특허 제5,965,408호 참조). 변이체를 생성하는 또 다른 방법은 유성(sexual) PCR 돌연변이유발이다. 유성 PCR 돌연변이유발에서는, 강제된 상동성 재조합이 서열 상동성에 기초한 DNA 분자의 무작위 단편화의 결과로서 시험관내에서 상이하지만 고도로 관련된 DNA 서열의 DNA 분자들 사이에 일어난다. 그후, PCR 반응의 프라이머 신장법(primer extension)에 의한 크로스오버(crossover)의 고정(fixation)이 후속된다. 유성 PCR 돌연변이유발은 당업계에 알려진 출간물에 기재되어 있다(예를 들면, Stemmer(1994) Proc. Natl. Acad. Sci., U.S.A. 91:10747-10751 참조). 변이체는 또한 생체내 돌연변이유발에 의해 생성될 수 있다. 몇몇 실시형태에서, 핵산 서열에서의 무작위 돌연변이는 DNA 보수 경로 중 하나 이상에서 돌연변이를 갖는 박테리아 균주, 예를 들면, 대장균 균주에서 서열을 증식시킴으로써 생성된다. 이러한 돌연변이유발 유전자 균주(mutator strain)는 야생형 균주보다 더 높은 무작위 돌연변이율을 갖는다. 이러한 균주들 중 하나에서의 DNA 서열(예컨대, P450 혼성 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열)의 증식은 결국 DNA 내에서 무작위 돌연변이를 생성할 것이다. 체내 돌연변이유발에 사용하기에 적합한 돌연변이유발 유전자 균주는 당업계의 공보(예를 들면, 국제 특허 출원 공개 공보 제WO 1991/016427호)에 기재되어 있다. 변이체는 또한 카세트 돌연변이유발을 이용하여 생성될 수 있다. 카세트 돌연변이유발에서는, 이중 가닥 DNA 분자의 작은 영역이 원래의 서열과는 상이한 합성 올리고뉴클레오티드 카세트로 대체된다. 올리고뉴클레오티드는 흔히 완전히 및/또는 부분적으로 무작위화된 원래의 서열을 함유한다. 반복 앙상블 돌연변이유발(recursive ensemble mutagenesis)이 또한 변이체를 생성하는데 사용될 수 있다. 반복 앙상블 돌연변이유발은 구성원들이 아미노산 서열에 있어서 상이한 표현형 관련 돌연변이체의 다양한 개체군을 생성하기 위해 개발된 단백질 조작(, 단백질 돌연변이유발)을 위한 알고리즘이다. 이 방법은 조합 카세트 돌연변이유발의 연속 라운드(successive rounds)를 제어하기 위해 피드백 메커니즘을 이용한다(예를 들면, Arkin et al. (1992) Proc. Natl. Acad. Sci., U.S.A. 89:7811-7815 참조). 몇몇 실시형태에서, 변이체는 지수 앙상블 돌연변이유발(exponential ensemble mutagenesis)을 이용하여 생성된다. 지수 앙상블 돌연변이유발은 높은 백분율의 독특한 기능성 돌연변이체를 갖는 조합 라이브러리(combinatorial libraries)를 생성하기 위한 공정이며, 잔기들의 작은 그룹들이 기능성 단백질을 야기하는 아미노산을 각각의 변경된 위치에서 식별하기 위해 병행하여 무작위화된다(예를 들면, Delegrave et al. (1993) Biotech. Res. 11:1548-1552 참조). 몇몇 실시형태에서, 변이체는 별개의 폴리펩티드를 암호화하는 복수의 핵산의 일부가 함께 융합되어 키메라 폴리펩티드를 암호화하는 키메라 핵산 서열을 생성하는 셔플링 절차(shuffling procedure)를 이용하여 생성된다(예를 들면, 미국 특허 제5,965,408호 및 제5,939,250호에 기재됨).
숙주 세포
재조합 숙주 세포에 의한 ω-OH 지방산 조성물의 생산을 증가시키는 계획은 제조 숙주에서 CYP153A-환원효소 혼성 융합 유전자 및 티오에스테라제 유전자를 발현시킴으로써 지방산 생합성 경로를 통해 증가된 플럭스를 포함한다. 본원에서 사용되는 용어 재조합 숙주 세포 또는 조작된 숙주 세포는 유전자 구성이, 예를 들면, 새로운 유전적 요소의 의도적인 도입 및/또는 숙주 세포에 자연적으로 존재하는 유전적 요소의 의도적인 변형에 의해 상응하는 야생형 숙주 세포에 비해 변경된 숙주 세포를 나타낸다. 이러한 재조합 숙주 세포의 자손 또한 이러한 새로운 및/또는 변형된 유전적 요소를 함유한다. 본원에 기재된 본 발명의 측면의 어느 것에 있어서, 숙주 세포는 식물 세포, 곤충 세포, 진균 세포(예컨대, 사상균, 예를 들면, 칸디다 종(Candida sp.), 또는 출아효모, 예를 들면, 사카로마이세스 종(Saccharomyces sp.)), 조류 세포 및 박테리아 세포로부터 선택될 수 있다. 하나의 실시형태에서, 재조합 숙주 세포는 재조합 미생물이다. 미생물인 숙주 세포의 예는 에스체리치아(Escherichia), 바실러스(Bacillus), 락토바실러스(Lactobacillus), 자이모모나스(Zymomonas), 로도코쿠스(Rhodococcus), 슈도모나스(Pseudomonas), 아스퍼길루스(Aspergillus), 트리코데르마(Trichoderma), 뉴로스포라(Neurospora), 푸사리움(Fusarium), 후미콜라(Humicola), 리조무코르(Rhizomucor), 클루이베로미세스(Kluyveromyces), 피치아(Pichia), 무코르(Mucor), 미셀리오프토라(Myceliophtora), 페니실리움(Penicillium), 파네로카에테(Phanerochaete), 플레우로투스(Pleurotus), 트라메테스(Trametes), 크리소스포리움(Chrysosporium), 사카로미세스(Saccharomyces), 스테노트로파모나스(Stenotrophamonas), 스키조사카로미세스(Schizosaccharomyces), 야로위아(Yarrowia), 또는 스트렙토마이세스(Streptomyces)로부터의 세포를 포함하지만, 이에 제한되지 않는다. 몇몇 실시형태에서, 숙주 세포는 그람-양성 박테리아 세포이다. 또 다른 실시형태에서, 숙주 세포는 그람-음성 박테리아 세포이다. 몇몇 실시형태에서, 숙주 세포는 대장균 세포이다. 몇몇 실시형태에서, 숙주 세포는 대장균 B 세포, 대장균 C 세포, 대장균 K 세포, 또는 대장균 W 세포이다. 또 다른 실시형태에서, 숙주 세포는 바실러스 렌투스(Bacillus lentus) 세포, 바실러스 브레비스(Bacillus brevis) 세포, 바실러스 스테아로서모필루스(Bacillus stearothermophilus) 세포, 바실러스 리체노포르미스(Bacillus lichenoformis) 세포, 바실러스 알칼로필루스(Bacillus alkalophilus) 세포, 바실러스 코아굴란스(Bacillus coagulans) 세포, 바실러스 키르쿨란스(Bacillus circulans) 세포, 바실러스 푸밀리스(Bacillus pumilis) 세포, 바실러스 투린지엔시스(Bacillus thuringiensis) 세포, 바실러스 클라우시(Bacillus clausii) 세포, 바실러스 메가테리움(Bacillus megaterium) 세포, 바실러스 서브틸리스(Bacillus subtilis) 세포, 또는 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens) 세포이다. 또 다른 실시형태에서, 숙주 세포는 트리코데르마 코닌지(Trichoderma koningii) 세포, 트리코데르마 비리데(Trichoderma viride) 세포, 트리코데르마 르에세이(Trichoderma reesei) 세포, 트리코데르마 롱기브라키아텀(Trichoderma longibrachiatum) 세포, 아스퍼길루스 아와모리(Aspergillus awamori) 세포, 아스퍼길루스 푸미가테스(Aspergillus fumigates) 세포, 아스퍼길루스 포에티두스(Aspergillus foetidus) 세포, 아스퍼길루스 니둘란스(Aspergillus nidulans) 세포, 아스퍼길루스 니게르(Aspergillus niger) 세포, 아스퍼길루스 오리재(Aspergillus oryzae) 세포, 후미콜라 인솔렌스(Humicola insolens) 세포, 후미콜라 라누기노세(Humicola lanuginose) 세포, 로도코쿠스오파쿠스(Rhodococcusopacus) 세포, 리조무코르미에헤이(Rhizomucormiehei) 세포, 또는 무코르미에헤이(Mucormichei) 세포이다. 또 다른 실시형태에서, 숙주 세포는 스트렙토마이세스 리비단스(Streptomyces lividans) 세포 또는 스트렙토마이세스 무리누스(Streptomyces murinus) 세포이다. 또 다른 실시형태에서, 숙주 세포는 악티노마이세테스(Actinomycetes) 세포이다. 몇몇 실시형태에서, 숙주 세포는 사카로마이세스 세레비시에(Saccharomyces cerevisiae) 세포이다.
또 다른 실시형태에서, 숙주 세포는 진핵 식물 세포, 조류 세포, 시아노박테리움 세포, 녹색-황 세균 세포, 녹색 비-황 세균 세포, 자색 황 세균 세포, 자색 비-황 세균 세포, 극한생물 세포, 효모 세포, 진균 세포, 본원에 기재된 유기체 중의 어느 것의 조작된 세포, 또는 합성 유기체이다. 몇몇 실시형태에서, 숙주 세포는 광-의존성이거나 탄소를 고정한다. 몇몇 실시형태에서, 숙주 세포는 독립영양적 활성을 갖는다. 몇몇 실시형태에서, 숙주 세포는 빛의 존재하에서와 같이, 광독립영양적 활성(photoautotrophic activity)을 갖는다. 몇몇 실시형태에서, 숙주 세포는 빛의 부재하에서 종속영양적 또는 혼합영양적이다. 특정 실시형태에서, 숙주 세포는 아라비돕시스 탈리아나(Arabidopsis thaliana), 파니쿰 비르가툼(Panicum virgatum), 미스칸투스 기간테우스(Miscanthus giganteus), 제아 메이스(Zea mays), 보트리오코쿠스 브라우니(Botryococcuse braunii), 클라미도모나스 레인하드티(Chlamydomonas reinhardtii), 두나리엘라 살리나(Dunaliela salina), 시네코코쿠스 종(Synechococcus Sp.) PCC 7002, 시네코코쿠스 종 PCC 7942, 시네코시스티 종 PCC 6803, 서모시네코코쿠스 엘롱게이트(Thermosynechococcus elongates) BP-1, 클로로비움 테피둠(Chlorobium tepidum), 클로로프렉수스 아우란티쿠스(Chlorojlexus auranticus), 크로마티움 비노숨(Chromatiumm vinosum), 로도스피릴룸 루브룸(Rhodospirillum rubrum), 로도박터 캡술라투스(Rhodobacter capsulatus), 로도슈도모나스 파루스리스(Rhodopseudomonas palusris), 클로스트리디움 융달리(Clostridium ljungdahlii), 클로스트리디움 서모셀룸(Clostridium thermocellum), 페니실리움 크리소게눔(Penicillium chrysogenum), 피치아파스토리스(Pichiapastoris), 사카로마이세스 세레비시에(Saccharomyces cerevisiae), 스키조사카로미세스 폼베(Schizosaccharomyces pombe), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 또는 자이모모나스 모빌리스(Zymomonas mobilis)로부터의 세포이다. 하나의 실시형태에서, 미생물 세포는 프로클로로코쿠스(Prochlorococcus), 시네코코쿠스, 시네코시스티스, 시아노테세(Cyanothece), 및 노스톡 펑크티포르메(Nostoc Punctiforme)를 포함하지만 이에 제한되지 않는 시아노박테리아로부터의 것이다. 또 다른 실시형태에서, 미생물 세포는 시네코코쿠스 엘롱가투스 PCC7942, 시네코시스티스 종 PCC6803, 및 시네코코쿠스 종 PCC7001을 포함하지만 이에 제한되지 않는 특정한 시아노박테리아 종으로부터의 것이다.
발현 벡터
몇몇 실시형태에서, 폴리뉴클레오티드(또는 유전자) 서열은 폴리뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함한 재조합 벡터에 의해 숙주 세포에 제공된다. 특정 실시형태에서, 프로모터는 발달적으로-조절된 프로모터, 세포소기관-특이적 프로모터, 조직-특이적 프로모터, 유도성 프로모터, 구성적 프로모터, 또는 세포-특이적 프로모터이다. 몇몇 실시형태에서, 재조합 벡터는 폴리뉴클레오티드 서열에 작동가능하게 연결된 발현 조절 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; 폴리뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티; 폴리뉴클레오티드 서열에 작동가능하게 연결된 분비 서열; 및 폴리뉴클레오티드 서열에 작동가능하게 연결된 표적화 서열로부터 선택된 적어도 하나의 서열을 포함한다. 본원에 기재된 발현 벡터는 숙주 세포에서 폴리뉴클레오티드 서열의 발현에 적합한 형태로 폴리뉴클레오티드 서열을 포함한다. 발현 벡터의 설계는 형질전환되는 숙주 세포의 선택, 목적하는 폴리펩티드의 발현 수준 등과 같은 인자들에 따라 좌우될 수 있다는 것은 당업계의 숙련가들에 의해 인지될 것이다. 본원에 기재된 발현 벡터는 본원에 기재된 바와 같은 폴리뉴클레오티드 서열에 의해 암호화되는 융합 폴리펩티드를 포함한 폴리펩티드를 생산하기 위해 숙주 세포에 도입될 수 있다(상기 참조). 원핵생물, 예를 들면, 대장균에서 폴리펩티드를 암호화하는 유전자의 발현은 대부분 융합 또는 비-융합 폴리펩티드 중 어느 하나의 발현을 지향하는 구성적 또는 유도성 프로모터를 함유하는 벡터로 수행된다. 융합 벡터는 그 안에 암호화된 폴리펩티드에, 통상적으로 재조합 폴리펩티드의 아미노- 또는 카복시-말단에 다수의 아미노산을 부가한다. 이러한 융합 벡터는 전형적으로 재조합 폴리펩티드의 발현을 증가시키고; 재조합 폴리펩티드의 용해도를 증가시키고; 친화성 정제에서 리간드로서 작용함으로써 재조합 폴리펩티드의 정제를 돕는 것을 포함한 상기 세 가지 목적들 중의 하나 이상을 제공한다. 종종, 융합 발현 벡터에서, 융합 모이어티와 재조합 폴리펩티드의 접합점에 단백질분해 절단 부위가 도입된다. 이는 융합 폴리펩티드의 정제 이후에 융합 모이어티로부터 재조합 폴리펩티드의 분리를 가능하게 한다. 이러한 효소, 및 이들의 동족 인식 서열(cognate recognition sequence)의 예는 Xa 인자, 트롬빈 및 엔테로키나제를 포함한다. 예시적인 융합 발현 벡터는 pGEX 벡터(문헌 참조; Pharmacia Biotech, Inc., Piscataway, NJ; Smith et al. (1988) Gene 67:31-40), pMAL 벡터(문헌 참조; New England Biolabs, Beverly, MA), 및 pRITS 벡터(문헌 참조; Pharmacia Biotech, Inc., Piscataway, N.J.)를 포함하고, 이들은 표적 재조합 폴리펩티드에 각각 글루타티온 S-트랜스퍼라제(GST), 말토스 E 결합 단백질, 또는 단백질 A를 융합시킨다.
유도성, 비-융합 대장균 발현 벡터의 예는 pTrc 벡터(문헌 참조; Amann et al. (1988) Gene 69:301-315) 및 pET 11d 벡터(문헌 참조; Studier et al., Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, Calif. (1990) 60-89)를 포함한다. pTrc 벡터로부터의 표적 유전자 발현은 혼성 trp-lac 융합 프로모터로부터의 숙주 RNA 폴리머라제 전사에 의존한다. pET 11d 벡터로부터의 표적 유전자 발현은 공동발현되는 바이러스성 RNA 폴리머라제(T7 gn1)에 의해 매개되는 T7 gn10-lac 융합 프로모터로부터의 전사에 의존한다. 이러한 바이러스성 폴리머라제는 lacUV 5 프로모터의 전사 조절하에서 T7 gn1 유전자를 보유하는 내재성 λ 프로파지(resident λ prophage)로부터 BL21(DE3) 또는 HMS174(DE3)와 같은 숙주 균주들에 의해 공급된다. 원핵 및 진핵 세포 둘 다에 대한 적합한 발현계이 당업계에 잘 공지되어 있다(예를 들면, 문헌 참조; Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual, second edition, Cold Spring Harbor Laboratory). 유도성, 비-융합 대장균 발현 벡터의 예는 pTrc 벡터(문헌 참조; Amann et al. (1988) Gene 69:301-315) 및 PET 11d 벡터(문헌 참조; Studier et al. (1990) Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA, pp. 60-89)를 포함한다. 특정 실시형태에서, 본 발명의 폴리뉴클레오티드 서열은 박테리오파지 T5로부터 유도되는 프로모터에 작동가능하게 연결된다. 하나의 실시형태에서, 숙주 세포는 효모 세포이다. 이러한 실시형태에서, 발현 벡터 효모 발현 벡터이다. 벡터는 외래(foreign) 핵산(예컨대, DNA)을 숙주 세포 내로 도입하기 위한 당업계에서 인정되는 다양한 기술들을 통해 원핵 또는 진핵 세포 내로 도입될 수 있다. 숙주 세포를 형질전환 또는 형질감염시키는 적절한 방법은, 예를 들면, Sambrook 에서 찾아볼 수 있다(상기 참조). 박테리아 세포의 안정적인 형질전환을 위하여, (사용되는 발현 벡터 및 형질전환 기술에 따라) 세포의 특정 부분이 발현 벡터를 흡수하고 복제하는 것으로 알려져 있다. 이러한 형질전환체를 동정하고 선택하기 위하여, 선택가능한 마커(예컨대, 항생제에 대한 내성)를 암호화하는 유전자가 관심 유전자와 함께 숙주 세포 내로 도입될 수 있다. 선택가능한 마커는 암피실린, 카나마이신, 클로람페니콜, 또는 테트라사이클린과 같지만 이로 제한되지 않는 약물에 대한 내성을 제공하는 것들을 포함한다. 선택가능한 마커를 암호화하는 핵산은 본원에 기재된 폴리펩티드를 암호화하는 벡터와 동일한 벡터에서 숙주 세포 내로 도입될 수 있거나, 또는 별개의 벡터에서 도입될 수 있다.
임의의 경로 조작
본 발명의 숙주 세포 또는 미생물은 효소 활성에 대한 특정 돌연변이의 효율성을 시험하기 위해 변경들을 함유하도록 유전적으로 조작되거나 변형된 숙주 균주 또는 숙주 세포(, 재조합 세포 또는 미생물)를 포함한다. 다양한 임의의 유전적 조정 및 변경이, 어떤 천연 효소 경로들이 원래 숙주 세포에 존재하는지에 따라 한 숙주 세포로부터 다른 숙주 세포로 상호교환가능하게 사용될 수 있다. 하나의 실시형태에서, 숙주 균주는 다른 생합성 폴리펩티드(예컨대, 효소)와 조합하여 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체의 발현을 시험하는데 사용될 수 있다. 숙주 균주는, 발효 성분, 탄소 공급원(예컨대, 공급원료), 온도, 압력, 감소된 배양 오염 조건, 및 산소 수준을 포함한 배양 조건들을 포함하지만 이로 제한되지 않는 특정 변수들을 시험하기 위해 다수의 유전적 변경을 포함할 수 있다.
하나의 실시형태에서, 숙주 균주는 임의의 fadEfhuA 결실을 포함한다. 아실-CoA 데하이드로게나제(FadE)는 지방산을 대사시키는데 중요한 효소이다. 이것은 지방산 이용에서 두 번째 단계(베타-산화)를 촉매하며, 이것은 지방산의 장쇄(아실-CoA)를 아세틸-CoA 분자로 분해시키는 공정이다. 보다 구체적으로, 박테리아에서 지방산 분해의 β-산화 사이클의 두번째 단계는 아실-CoA의 2-엔오일-CoA로의 산화이며, 이것은 FadE에 의해 촉매된다. 대장균에 FadE가 없는 경우, 이것은 탄소 공급원으로서 지방산에서 성장할 수 없지만, 아세테이트에서는 성장할 수 있다. 임의의 쇄 길이의 지방산을 이용하는 불가능성(inability)은 fadE 균주, FadE 기능이 파괴되는 fadE 돌연변이 균주의 보고된 표현형과 일치한다. fadE 유전자는 임의로 녹아웃(knock out)되거나 감쇠되어, 지방산 유도체 경로에서 중간체일 수 있는 아실-CoA가 세포에 누적될 수 있도록 보장하여 모든 아실-CoA가 지방산 유도체로 효율적으로 전환될 수 있도록 한다. 그러나, fadE 감쇠는 당이 탄소 공급원으로서 사용될 경우에 임의적인데, 그 이유는 이러한 조건하에서 FadE의 발현이 억제될 가능성이 있고, 이에 따라 FadE가 소량만 존재할 수 있으며 아실-CoA 기질에 대해 에스테르 신타제 또는 다른 효소과 효율적으로 경쟁할 수 없기 때문이다. FadE는 분해대사물 억제(catabolite repression)로 인해 억제된다. 대장균 및 많은 다른 미생물들은 지방산보다 당의 소모를 선호하므로, 두 공급원이 이용가능한 경우 fad 레귤론을 억제함으로써 당이 먼저 소모된다(문헌 참조; D. Clark, J Bacteriol . (1981) 148(2):521-6)). 게다가, 당의 부재 및 지방산의 존재는 FadE 발현을 유도한다. (FadE를 포함한) fad 레귤론에 의해 발현되는 단백질이 상향-조절되고 아실-CoA에 대해 효율적으로 경쟁할 것이기 때문에, 아실-CoA 중간체가 베타 산화 경로에 대해 손실될 수 있다. 따라서, fadE 유전자가 녹아웃되거나 감쇠되는 것이 유리할 수 있다. 대부분의 탄소 공급원들이 주로 당을 기본으로 하기 때문에, FadE를 감쇠시키는 것은 임의적이다. 유전자 fhuA는 TonA 단백질을 암호화하며, 이것은 대장균의 외막에서의 에너지-관련 운반체(energy-coupled transporter) 및 수용체이다(문헌 참조; V. Braun (2009) J Bacteriol . 191(11):3431-3436). 이의 결실은 임의적이다. fhuA 결실은 세포로 하여금 특정 발효 조건에 유리할 수 있는 파지 공격(phage attack)에 대해 더 내성있게 한다. 따라서, 발효 진행 동안 잠재적 오염을 겪기 쉬운 숙주 세포에서 fhuA를 결실시키는 것이 바람직할 수 있다.
또 다른 실시형태에서, 숙주 균주(상기 참조)는 또한 fadR , fabA , fabD , fabG, fabH , fabV , 및/또는 fabF를 포함하는 유전자들 중의 하나 이상의 임의의 과발현을 포함한다. 이러한 유전자의 예는 대장균으로부터의 fadR, 쥐티푸스균(Salmonella typhimurium)으로부터의 fabA(NP_460041), 쥐티푸스균으로부터의 fabD(NP_460164), 쥐티푸스균으로부터의 fabG(NP_460165), 쥐티푸스균으로부터의 fabH(NP_460163), 콜레라균(Vibrio cholera)으로부터의 fabV(YP_001217283), 및 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum)으로부터의 fabF(NP_350156)이다. 지방산 생합성에서의 조절제 및 효소를 암호화하는 이러한 유전자들 중 하나 이상의 과발현은 다양한 배양 조건하에서 ω-OH 지방산 및 이의 유도체를 포함하는 지방산 유도체 화합물의 역가를 증가시키는 역할을 할 수 있다.
또 다른 실시형태에서, 대장균 균주가 ω-OH 지방산 및 이의 유도체의 생산을 위한 숙주 세포로서 사용된다. 유사하게, 이들 숙주 세포는 fadR , fabA , fabD , fabG, fabH , fabV 및/또는 fabF를 포함하지만 이에 제한되지 않는 다양한 배양 조건하에서 지방산 유도체(예컨대, ω-OH 지방산 및 α,ω-이산 )와 같은 지방산 유도체 화합물의 역가를 추가로 증가 또는 강화시킬 수 있는 하나 이상의 생합성 유전자(, 지방산 생합성의 조절제 및 효소를 암호화하는 유전자)의 임의의 과발현을 제공한다. 유전적 변경의 예는 대장균으로부터의 fadR, 쥐티푸스균으로부터의 fabA(NP_460041), 쥐티푸스균으로부터의 fabD(NP_460164), 쥐티푸스균으로부터의 fabG(NP_460165), 쥐티푸스균으로부터의 fabH(NP_460163), 콜레라균으로부터의 fabV(YP_001217283), 및 클로스트리디움 아세토부틸리쿰으로부터의 fabF(NP_350156)를 포함한다. 몇몇 실시형태에서, 이러한 생합성 유전자를 운반하는 합성 오페론이, 다양한 배양 조건하에서 P450 발현을 시험하고/하거나 ω-OH 지방산 및 α,ω-이산 생산을 더욱 증대시키기 위해 세포에서 조작되고 발현될 수 있다. 이러한 합성 오페론은 하나 이상의 생합성 유전자를 함유한다. 조직된 오페론은, 특정 배양 조건을 시험하기 위해 지방산 유도체의 과발현을 촉진시키는데 사용될 수 있는 콜레라균으로부터의 fabV, 쥐티푸스균으로부터의 fabH, 쥐티푸스균으로부터의 fabD, 쥐티푸스균으로부터의 fabG, 쥐티푸스균으로부터의 fabA, 및/또는 로스트리디움 아세토부틸리쿰으로부터의 fabF를 포함하는 임의의 지방산 생합성 유전자를 함유할 수 있다. 이러한 합성 오페론의 한가지 장점은, ω-OH 지방산 유도체 생산률이 더욱 증가되거나 증대될 수 있다는 것이다.
몇몇 실시형태에서, ACP 및 생합성 효소(예컨대, ω-하이드록실라제, 티오에스테라제 )를 발현하는데 사용되는 숙주 세포 또는 미생물은 ω-OH 지방산, ω-OH 지방산 유도체, α,ω-이산 등과 같은 하나 이상의 특정 지방산 유도체(들)에 대한 생산을 증가시킬 수 있는 특정한 효소 활성을 포함하는 유전자를 추가로 발현할 것이다. 하나의 실시형태에서, 숙주 세포는 유전자를 과발현시킴으로써 증가될 수 있는 지방산의 생산을 위해 티오에스테라제 활성(E.C. 3.1.2.* 또는 E.C. 3.1. 2.14 또는 E.C. 3.1.1.5)을 갖는다. 또 다른 실시형태에서, 숙주 세포는 지방 에스테르의 생산을 위해 에스테르 신타제 활성(E.C. 2.3.1.75)을 갖는다. 또 다른 실시형태에서, 숙주 세포는 지방 알콜의 생산을 위해 아실-ACP 환원효소 (AAR) (E.C. 1.2.1.80) 활성 및/또는 알콜 데하이드로게나제 활성(E.C. 1.1.1.1.) 및/또는 지방 알콜 아실-CoA 환원효소(FAR)(E.C. 1.1.1.*) 활성 및/또는 카복실산 환원효소(CAR)(EC 1.2.99.6) 활성을 갖는다. 또 다른 실시형태에서, 숙주 세포는 지방 알데히드의 생산을 위해 아실-ACP 환원효소(AAR)(E.C. 1.2.1.80) 활성을 갖는다. 또 다른 실시형태에서, 숙주 세포는 알칸 및 알켄의 생산을 위해 아실-ACP 환원효소(AAR)(E.C. 1.2.1.80) 활성 및 데카보닐라제(ADC) 활성을 갖는다. 또 다른 실시형태에서, 숙주 세포는 지방 알콜의 생산을 위해 아실-CoA 환원효소(E.C. 1.2.1.50) 활성, 아실-CoA 신타제(FadD)(E.C. 2.3.1.86) 활성, 및 티오에스테라제(E.C. 3.1.2.* 또는 E.C. 3.1. 2.14 또는 E.C. 3.1.1.5) 활성을 갖는다. 또 다른 실시형태에서, 숙주 세포는 지방 에스테르의 생산을 위해 에스테르 신타제 활성(E.C. 2.3.1.75), 아실-CoA 신타제(FadD)(E.C. 2.3.1.86) 활성, 및 티오에스테라제(E.C. 3.1.2.* 또는 E.C. 3.1. 2.14 또는 E.C. 3.1.1.5) 활성을 갖는다. 또 다른 실시형태에서, 숙주 세포는 케톤의 생산을 위해 OleA 활성을 갖는다. 또 다른 실시형태에서, 숙주 세포는 내부 올레핀의 생산을 위해 OleBCD 활성을 갖는다. 또 다른 실시형태에서, 숙주 세포는 지방 알콜의 생산을 위해 아실-ACP 환원효소(AAR)(E.C. 1.2.1.80) 활성 및 알콜 데하이드로게나제 활성(E.C. 1.1.1.1.)을 갖는다. 또 다른 실시형태에서, 숙주 세포는 말단 올레핀을 제조하기 위해 티오에스테라제(E.C. 3.1.2.* 또는 E.C. 3.1. 2.14 또는 E.C. 3.1.1.5) 활성 및 데카복실라제 활성을 갖는다. 미생물 및 미생물 세포에서의 효소 활성의 발현은 U.S. 특허 제8,097,439호; 제8,110,093호; 제8,110,670호; 제8,183,028호; 제8,268,599호; 제8,283,143호; 제8,232,924호; 제8,372,610호; 및 제8,530,221호에 의해 교시되어 있으며, 이들은 본원에 참고로 포함되어 있다. 또 다른 실시형태에서, ACP 및 다른 생합성 효소를 발현하는데 사용되는 숙주 세포 또는 미생물은 ω-OH 지방산, ω-OH 지방산 유도체, 및 α,ω-이산과 같은 하나 이상의 특정 지방산 유도체(들)를 생산하기 위해 상향조절되거나 과발현된 특정 원래의 효소 활성을 포함할 것이다. 하나의 실시형태에서, 숙주 세포는 티오에스테라제 유전자를 과발현시킴으로써 증가될 수 있는 지방산의 생산을 위해 원래의 티오에스테라제(E.C. 3.1.2.* 또는 E.C. 3.1. 2.14 또는 E.C. 3.1.1.5) 활성을 갖는다.
본 발명은 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체 및 다른 생합성 효소를 암호화하는 유전자를 발현하는 숙주 균주 또는 미생물을 포함한다(상기 참조). 재조합 숙주 세포는 지방산 유도체, 예를 들면, ω-OH 지방산, ω-OH 지방산 유도체, α,ω-이산 및 이의 조성물 및 블렌드를 생산한다. 지방산 유도체는 전형적으로 배양 배지로부터 회수되고/되거나 숙주 세포로부터 단리된다. 하나의 실시형태에서, 지방산 유도체는 배양 배지로부터 회수된다(세포외). 또 다른 실시형태에서, 지방산 유도체는 숙주 세포로부터 단리된다(세포내). 또 다른 실시형태에서, 지방산 유도체는 배양 배지로부터 회수되고 숙주 세포로부터 단리된다. 숙주 세포에 의해 생산된 지방산 유도체 또는 조성물은 특정 지방산 유도체의 분포 뿐만 아니라 ω-OH 지방산 유도체, 예를 들면, ω-OH 지방산, ω-OH 지방 에스테르, α,ω-이산 등의 성분의 쇄 길이 및 포화도를 결정하기 위해 당업계에 공지된 방법, 예를 들면, GC-FID를 사용하여 분석될 수 있다.
배양 및 발효
본원에서 사용되는 용어 발효는 광범위하게는 숙주 세포에 의한 표적 물질로의 유기 물질의 전환, 예를 들면, 탄소 공급원을 포함하는 배지에서 재조합 숙주 세포의 배양물을 전파함으로써 ω-OH 지방산 또는 이의 유도체로의 재조합 숙주 세포에 의한 탄소 공급원의 전환을 나타낸다. 생산을 위해 허용되는 조건은 숙주 세포가 ω-OH 지방산과 같은 목적하는 생성물을 생산하도록 하는 임의의 조건을 나타낸다. 유사하게, 벡터의 폴리뉴클레오티드 서열이 발현되는 조건 또는 조건들은 숙주 세포가 폴리펩티드를 합성할 수 있도록 하는 임의의 조건을 의미한다. 적합한 조건은, 예를 들면, 발효 조건을 포함한다. 발효 조건은 온도 범위, 통기 수준, 공급 속도 및 배지 조성을 포함하지만 이에 제한되지 않는 다수의 파라미터를 포함할 수 있다. 이러한 조건들의 각각은, 개별적으로 및 조합하여, 숙주 세포가 자랄 수 있게 한다. 발효는 호기성, 혐기성, 또는 이의 변동(예를 들면 미호기성)일 수 있다. 예시적인 배양 배지는 브로스 또는 겔을 포함한다. 일반적으로, 배지는 숙주 세포에 의해 직접 대사될 수 있는 탄소 공급원을 포함한다. 또한, 효소는 동원(예컨대, 발효성 당으로의 전분 또는 셀룰로스의 해중합) 및 후속적인 탄소 공급원의 대사를 촉진시키기 위해 배지에서 사용될 수 있다.
소규모 생산을 위해, 조직된 숙주 세포를, 예를 들면, 약 100㎕, 200㎕, 300㎕, 400㎕, 500㎕, 1mL, 5 mL, 10 mL, 15 mL, 25 mL, 50 mL, 75 mL, 100 mL, 500 mL, 1 L, 2 L, 5 L, 또는 10 L의 배치에서 성장시키고; 발효시키며; 유도시켜 목적하는 폴리뉴클레오티드 서열, 예를 들면, P450 혼성 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열을 발현할 수 있다. 대규모 생산을 위해, 조작된 숙주 세포를 약 10 L, 100 L, 1000 L, 10,000 L, 100,000 L, 및 1,000,000 L 또는 그 이상의 배치에서 성장시키고; 발효시키며; 유도시켜 목적하는 폴리뉴클레오티드 서열을 발현할 수 있다. 대안적으로, 대규모 공급-배치 발효가 수행될 수 있다. 본원에 기재된 바와 같은 ω-OH 지방산, 이의 유도체 및 조성물은 재조합 숙주 세포 배양물의 세포외 환경에서 발견되며, 배양 배지로부터 쉽게 단리될 수 있다. ω-OH 지방산 또는 이의 유도체는 재조합 숙주 세포에 의해 분비되고, 세포외 환경으로 운반되거나 또는 재조합 숙주 세포 배양물의 세포외 환경으로 수동적으로 운반될 수 있다. ω-OH 지방산 또는 이의 유도체는 당업계에 공지된 일상적인 방법을 사용하여 재조합 숙주 세포 배양물로부터 단리된다.
재조합 숙주 세포로부터 유도되는 생성물
본원에서 사용되는 바와 같이, 모뎀 탄소 또는 fM의 분율은 각각 옥살산 표준 HOxI 및 HOxII로 알려져 있는 국립표준기술연구소(National Institute of Standards and Technology: NIST) 표준 물질(SRMs4990B 및 4990C)에 의해 정의된 것과 동일한 의미를 갖는다. 기본적인 정의는 (AD 1950을 기준으로) 14C /12C 동위원소 비율 HOxI의 0.95배와 관련된다. 이것은 붕괴-보정 산업혁명-전 목재(decay-corrected pre-Industrial Revolution wood)에 거의 등가이다. 현재 생존 생물권(living biosphere)(식물 재료)에 대하여, fM은 대략 1.1이다. 바이오생성물(예컨대, 본 발명에 따라 생산되는 ω-OH 지방산 및 유도체를 포함하는 지방산 유도체)은 생물학적으로 생산되는 유기 화합물을 포함한다. 특히, 본원의 지방산 생합성 경로를 이용하여 생산되는 지방산 유도체(예컨대, ω-OH 지방산 및 이의 유도체)는 재생가능한 공급원으로부터 생산되지 않았으며, 이를테면 새로운 물질의 조성물이다. 이러한 새로운 바이오생성물은 이중 탄소-동위원소 핑거프린팅(dual carbon-isotopic fingerprinting) 또는 14C 연대측정(dating)에 기초하여 석유화학의 탄소로부터 유도되는 유기 화합물과 구별될 수 있다. 추가적으로, 생물자원 탄소(biosourced carbon)의 특이적 공급원(예컨대, 글루코스 vs. 글리세롤)은 이중 탄소-동위원소 핑거프린팅에 의해 결정될 수 있다(예컨대, 미국 특허 제7,169,588호 참조). 석유 기반 유기 화합물로부터 바이오생성물을 구별하는 능력은 상업적으로 이러한 물질들을 추적하는데 유익하다. 예를 들면, 생물학적 기반 및 석유 기반 탄소 동위원소 프로파일 둘 다를 포함하는 유기 화합물 또는 화학물질은 석유 기반 물질만으로 만들어진 유기 화합물 및 화학물질과는 구별될 수 있다. 따라서, 본원의 바이오생성물은 이들의 특유한 탄소 동위원소 프로파일에 기초하여 상업적으로 후속되거나 추적될 수 있다. 바이오생성물은 각 샘플에서 안정적인 탄소 동위원소 비(13C/12C)를 비교함으로써 석유 기반 유기 화합물과 구별될 수 있다. 주어진 바이오생성물에서 13C/12C 비는 이산화탄소가 고정된 시간에 대기 중의 이산화탄소에서의 13C/12C 비의 결과이다. 이것은 또한 정확한 대사 경로를 반영한다. 국부적인 변이가 또한 일어난다. 석유, C3 식물(활엽), C4 식물(목초), 및 해양 탄산염(marine carbonate)이 모두 13C/12C 및 상응하는 δ13C 값에서 상당한 차이를 나타낸다. 또한, C3 및 C4 식물의 지질 물질은 대사 경로의 결과로서 동일한 식물의 탄수화물 성분으로부터 유도된 물질과 상이하게 분석한다. 측정의 정확도 내에서, 13C은 동위원소 분별 효과(fractionation effect)로 인하여 큰 변화를 나타내며, 바이오생성물에 대한 이의 가장 중요한 점은 광합성 메카니즘이다. 식물에서의 탄소 동위원소 비에 있어서의 차이의 주요 원인은 식물에서의 광합성 탄소 대사의 경로, 특히 1차 카복실화(, 대기 CO2의 초기 고정) 동안 일어나는 반응에 있어서의 차이와 밀접하게 관련된다. 식생(vegetation)의 크게 두 가지 부류는 C3[또는 캘빈-벤슨(Calvin-Benson)] 광합성 사이클을 병합하는 것 및 C4[또는 해치-슬랙(Hatch-Slack)] 광합성 사이클을 병합하는 것이다. C3 식물에서, 1차 CO2 고정 또는 카복실화 반응은 효소인 리불로스-1,5-디포스페이트 카복실라제를 수반하며, 첫번째 안정적인 생성물은 3-탄소 화합물이다. 경목(hardwood) 및 침엽수와 같은 C3 식물은 온대 기후 지역에서 우세하다. C4 식물에서, 또 다른 효소인 포스포엔올-피루베이트 카복실라제를 수반하는 부가적인 카복실화 반응이 1차 카복실화 반응이다. 첫번째 안정적인 탄소 화합물은 이후에 탈카복실화되는 4-탄소산(carbon acid)이다. 이렇게 하여 방출된 CO2는 C3 사이클에 의해 재고정된다. C4 식물의 예는 열대형 목초들, 옥수수, 및 사탕수수이다. C4 및 C3 식물 둘 다는 광범위한 13C/12C 동위원소 비를 나타내지만, 전형적인 값은 C4 식물에 대해 약 -7 내지 약 -13 per mil이고, C3 식물에 대해 약 -19 내지 약 -27 per mil이다(예컨대, 문헌 참조; Stuiver et al. (1977) Radiocarbon 19:355). 석탄 및 석유는 일반적으로 이 후자의 범위에 속한다. 13C 측정 척도는 본래 PDB(Pee Dee Belemnite) 석회암에 의해 제로 세트(zero set)로 정의되며, 여기서 값은 이 재료로부터 천분율(parts per thousand) 편차로 주어진다. δ13C 값은 천분율(퍼밀), 약어로는 ‰로 표현되고, 아래와 같이 계산된다:
δ13C(‰) = [(13C/12C) 샘플 - (13C/12C) 표준/ (13C/12C) 표준×1000
PDB 표준 물질(RM)이 고갈되었기 때문에, 일련의 대안적인 RM이 IAEA, USGS, NIST 및 다른 선택된 국제 동위원소 실험실들과 협력하여 개발되었다. PDB로부터의 퍼밀 편차(per mil deviation)에 대한 표기는 δ13C이다. 질량 44, 45 및 46의 분자 이온에 대한 고정밀 안정 비율 질량 분석법(high precision stable ratio mass spectrometry)(IRMS)으로 CO2에 대해 측정이 이루어진다. 본원에 기재된 조성물은, 예를 들면, 지방산 유도체 생성물을 포함한, 본원에 기재된 방법들 중 어느 하나에 의해 생산되는 바이오생성물을 포함한다. 구체적으로, 바이오생성물은 약 -28 이상, 약 -27 이상, -20 이상, -18 이상, -15 이상, -13 이상, -10 이상, 또는 -8 이상의 δ13C를 가질 수 있다. 예를 들면, 바이오생성물은 약 -30 내지 약 -15, 약 -27 내지 약 -19, 약 -25 내지 약 -21, 약 -15 내지 약 -5, 약 -13 내지 약 -7, 또는 약 -13 내지 약 -10의 δ13C를 가질 수 있다. 또 다른 경우에, 바이오생성물은 약 -10, -11, -12, 또는 -12.3의 δ13C를 가질 수 있다. 본 방법에 따라 생산된 바이오생성물은 또한 각 화합물에서 14C의 양을 비교함으로써 석유 기반 유기 화합물과 구별될 수 있다. 14C는 핵 반감기가 5730년이기 때문에, 더 오래된 탄소를 함유한 석유 기반 연료가 더 새로운 탄소를 함유한 바이오생성물과 구별될 수 있다(예컨대, 문헌 참조; Currie, Source Apportionment of Atmospheric Particles, Characterization of Environmental Particles, J. Buffle and H. P. van Leeuwen, Eds., 1 of Vol. I of the IUPAC Environmental Analytical Chemistry Series (Lewis Publishers, Inc.) 3-74, (1992)). 방사성탄소 연대측정법(radiocarbon dating)의 기본적인 가정은 대기 중의 14C 농도의 항상성은 살아있는 유기체에서 14C의 항상성을 유도한다는 것이다. 그러나, 1950년 이후부터의 대기권 핵실험 및 1850년 이후부터의 화석 연료의 연소로 인하여, 14C는 제2의, 지구화학적인 시간 특성을 얻었다. 대기 CO2 중에서 및 이에 따라 생물권(living biosphere) 중에서의 이의 농도는 1960년대 중반의 핵실험 피크에서 거의 배가되었다. 이후, 약 1.2 x 10-12의 정상-상태 우주기원(steady-state cosmogenic)(대기) 기준 동위원소 비(14C/12C)로 점진적으로 복귀되었으며, 대략적인 이완 "반-감기"(approximate relaxation "half-life")는 7년 내지 10년이었다. 이 후자의 반감기가 문자 그대로 받아들여져야 하는 것은 아니며; 그보다는 핵무기 시대의 시작 이후로 대기권 및 생물권의 14C의 변이성을 추적하기 위해 상세한 대기 핵 투입/붕괴의 함수(detailed atmospheric nuclear input/decay function)를 사용하여야 한다. 이는 최근 생물권 탄소의 매년 연대측정의 가능성(promise of annual dating)을 지속하는 후자의 생물권 14C 시간 특성이다. 14C는 가속기 질량 분광 분석(accelerator mass spectrometry: AMS)에 의해 측정될 수 있으며, 결과는 현대 탄소의 분율(fM)의 단위로 주어진다. fM은 국립표준기술연구소(NIST) 표준 물질(SRM) 4990B 및 4990C에 의해 정의된다. 본원에서 사용되는 바와 같이, 현대 탄소의 분율 또는 fM은 각각 옥살산 표준 HOxI 및 HOxII로 알려져 있는 국립표준기술연구소(NIST) 표준 물질(SRM) 4990B 및 4990C에 의해 정의된 바와 동일한 의미를 갖는다. 기본적인 정의는 (AD 1950을 기준으로) 14C/12C 동위원소 비 HOxI의 0.95배와 관련된다. 이것은 붕괴-보정 산업혁명-전 목재에 거의 등가이다. 현재 생존 생물권(식물 재료)에 대하여, fM은 대략 1.1이다. 본원에 기재된 조성물은 적어도 약 1의 fM14C를 가질 수 있는 바이오생성물을 포함한다. 예를 들면, 본 발명의 바이오생성물은 적어도 약 1.01의 fM14C, 약 1 내지 약 1.5의 fM14C, 약 1.04 내지 약 1.18의 fM14C, 또는 약 1.111 내지 약 1.124의 fM14C를 가질 수 있다.
14C의 또 다른 척도는 현대 탄소 백분율 (percent of modern carbon; pMC)로 알려져 있다. 14C 연대를 이용하는 고고학자 또는 지질학자의 경우, AD 1950년은 0의 해(zero years old)와 같다. 이것은 또한 100 pMC를 나타낸다. 대기 중의 핵무기 탄소(bomb carbon)는 열-핵무기의 피크에서 1963년의 통상 수준의 거의 두 배에 달하였다. 대기권 내의 이의 분포는 이의 출연 이후로 비슷해졌으며, 이는 AD 1950년 이후로 살아있는 식물 및 동물에 대하여 100 pMC보다 더 큰 값을 나타낸다. 이것은 시간 경과에 따라 점차 감소하였으며, 오늘날의 값은 107.5 pMC 부근이다. 이것은 옥수수와 같은 신선한 바이오매스 물질이 107.5 pMC 부근의 14C 시그너처(signature)를 제공한다는 것을 의미한다. 석유 기반 화합물은 0의 pMC 값을 가질 것이다. 오늘날의 탄소와 화석 탄소의 조합은 오늘날의 pMC 함량의 희석을 초래할 것이다. 107.5 pMC가 오늘날의 바이오매스 물질의 14C 함량을 나타내고 0 pMC가 석유 기반 생성물의 14C 함량을 나타낸다고 가정함으로써, 그 물질에 대해 측정된 pMC 값은 두 성분 유형의 비율을 반영할 것이다. 예를 들면, 오늘날의 대두로부터 100% 유도된 물질은 107.5 pMC 부근의 방사성탄소 시그니처를 제공할 것이다. 그 물질이 석유 기반 생성물로 50% 희석되었다면, 이는 대략 54 pMC의 방사성탄소 시그너처를 제공할 것이다. 생물학적 기반 탄소 함량은 100%를 107.5 pMC와 같다고 하고 0%를 0 pMC와 같다고 할당함으로써 유도된다. 예를 들면, 99 pMC로 측정된 샘플은 93%의 등가의 생물학적 기반 탄소 함량을 제공할 것이다. 이 값을 평균 생물학적 기반 탄소 결과라고 하며, 오늘날의 생물학적 물질 또는 석유 기반 물질 중 어느 하나로부터 비롯된 분석된 물질 내의 모든 성분을 추정한다. 본원에 기재된 바와 같은 하나 이상의 지방산 유도체를 포함하는 바이오생성물은 적어도 약 50, 60, 70, 75, 80, 85, 90, 95, 96, 97, 98, 99 또는 100의 pMC를 가질 수 있다. 또 다른 경우에, 본원에 기재된 지방산 유도체는 약 50 내지 약 100; 약 60 내지 약 100; 약 70 내지 약 100; 약 80 내지 약 100; 약 85 내지 약 100; 약 87 내지 약 98; 또는 약 90 내지 약 95의 pMC를 가질 수 있다. 또 다른 경우에, 본원에 기재된 지방산 유도체는 약 90, 91, 92, 93, 94, 또는 94.2의 pMC를 가질 수 있다.
실시예
다음의 구체적인 실시예들은 본 발명을 예시하기 위한 것이며, 청구항의 범위를 제한하는 것으로 해석되어서는 안 된다.
프로토콜 및 방법
라이브러리 스크리닝
본원에 기재된 모든 프로토콜은 배양물을 성장시키기 위한 96 웰 플레이트-마스터 블럭-2mL 시스템(Greiner Bio-One, Monroe, NC 또는 Corning, Amsterdam, The Netherlands), 및 배양 브로스로부터 지방산 화학종을 추출하기 위한 플레이트(Costar, Inc.)에 의존한다. 아래에 제공된 프로토콜들은 발효 조건의 예들이다. 대안적인 프로토콜이 지방산 화학종 생산을 평가하는데 사용될 수 있다.
32 o C Plim 배양 프로토콜
(96 웰 플레이트에서 성장하는 LB 배양물로부터의) 30㎕ LB 배양물을 사용하여 290㎕ Plim 배지(표 2)에 접종하였으며, 그후 이를 32℃에서 진탕시키면서 대략 16시간 동안 항온처리하였다. 밤샘 시드(overnight seed) 40㎕를 사용하여 360㎕ Plim 배지에 접종하였다. 32℃에서 2시간 동안 성장시킨 후, 배양물을 IPTG(최종 농도 1 mM)로 유도하였다(아래 표 3). 그후, 달리 주지되지 않는다면 20시간 동안 진탕시키면서 32℃에서 배양물을 항온처리하고, 그후 이들을 아래에 상세된 표준 추출 프로토콜에 따라 추출하였다.
35 o C Nlim 배양 프로토콜
(96 웰 플레이트에서 성장하는 LB 배양물로부터의) 40㎕ LB 배양물을 사용하여 360㎕ LB 배지(아래 표 3)에 접종하였으며, 그후 이를 32℃에서 진탕시키면서 대략 4시간 동안 항온처리하였다. LB 시드 40㎕를 사용하여 360㎕ Nlim 배지에 접종하였다. 32℃에서 2시간 동안 35℃에서 성장시킨 후, 배양물을 IPTG(최종 농도 1 mM)로 유도하였다(아래 표 3). 그후, 달리 주지되지 않는다면 20시간 동안 진탕시키면서 35℃에서 배양물을 항온처리하고, 그후 이들을 아래에 상세된 표준 추출 프로토콜에 따라 추출하였다.
[표 3] : 배지 명칭 및 제형
Figure 112017005010255-pct00035
지방산 화학종 표준 추출 프로토콜
추출되어지는 각 웰에 80㎕의 1M HCl에 이어 400㎕의 부틸 아세테이트(내부 표준으로서 500mg/L 펜타데칸올을 가짐)를 가하였다. 그후, 96 웰 플레이트를 플레이트 밀봉기(ALPS-300 히터; Abgene, ThermoScientific, Rockford, IL)를 사용하여 가열-밀봉하고, MIXMATE 혼합기(Eppendorf, Hamburg, Germany)를 사용하여 2000rpm에서 15분 동안 진탕시켰다. 진탕시킨 후, 플레이트를 실온에서 4500rpm에서 10분 동안 원심분리하여(Allegra X-15R, rotor SX4750A, Beckman Coulter, Brea, CA) 수성 층과 유기 층을 분리하였다. 100㎕의 유기 층을 96 웰 플레이트(폴리프로필렌, Corning, Amsterdam, The Netherlands)로 옮기고 100uL의 BSTFA로 유도체화하였다. 후속적으로 플레이트를 가열 밀봉하고, w-OH FFA 방법을 사용하여 GC-FID에 의해 평가할 때까지 -20℃에서 저장하였으며, 상기 방법은 다음과 같이 수행하였다: 1㎕의 샘플을 1-20 스플릿을 지닌 불꽃 이온화 검출기(FID)를 갖는 Agilent 7890A GC Ultra 장치(Agilent, Santa Clara, CA)에서 분석 컬럼(DB-1, 10m×180㎛×0.2㎛ 필름 두께, JW 121-101A로부터 이용가능함)에 주 입하였다. C10 내지 C18 지방산 및 ω-하이드록실화 지방산을 검출하고 정량하도록 기기를 설정하였다. 상기에 상세된 프로토콜은 표준 조건을 나타내며, 이것은분석 결과를 최적화하기 위해 필요에 따라 변경될 수 있다.
오류 유발 라이브러리 구축
당업계의 숙련가들에게 공지된 표준 기법들을 사용하여 오류 유발 라이브러리를 제조하였다. 하나의 예에서, 벡터 골격은 벡터에서 제한 엔도뉴클레아제를 사용하여 제조되는 반면 DNA 삽입체에 있어서의 다양성의 발생은 미스매치된 뉴클레오티드의 삽입을 유리하게 하는 조건하에서 DNA 주형으로부터 PCR 증폭에 의해 생성되었다. 하나의 접근법에서, 다양성을 갖는 DNA 삽입체 및 벡터 골격의 클로닝은 제조자의 프로토콜에 따라 INFUSION 클로닝 시스템(Clontech Laboratories, Inc., Mountain View, CA)을 사용하여 수행하였다.
포화 라이브러리 구축
당업계의 숙련가들에게 공지된 표준 기법들을 사용하여 포화 라이브러리를 제조하였다. 하나의 예에서, 벡터 골격은 벡터에서 제한 엔도뉴클레아제를 사용하여 제조되는 반면 DNA 삽입체에 있어서의 다양성의 발생은 변성 프라이머(degenerate primer)를 사용하여 생성되었다. 하나의 접근법에서, 다양성을 갖는 DNA 삽입체 및 벡터 골격의 클로닝은 제조자의 프로토콜에 따라 INFUSION 클로닝 시스템(Clontech Laboratories, Inc., Mountain View, CA)을 사용하여 수행하였다.
조합 라이브러리 구축
유익한 것으로 확인된 돌연변이들을 조합하여 ω-OH 지방산 유도체 화학종의 생산에 있어서 추가의 개선을 갖는 CYP153-환원효소 혼성 융합 폴리펩티드 변이체(예컨대, 혼성 CYP153A-RedRhF 단백질 변이체)를 제공하였다. 당업계의 숙련가들에게 공지된 표준 기법들을 사용하여 조합 라이브러리를 제조하였다. 하나의 예에서, 벡터 골격은 벡터에서 제한 엔도뉴클레아제를 사용하여 제조되는 반면 DNA 삽입체에 있어서의 다양성의 발생은 목적하는 돌연변이를 도입하기 위해 프라이머를 사용하여 생성되었다. 상기한 바와 같이, 하나의 접근법에서, 다양성을 갖는 DNA 삽입체 및 벡터 골격의 클로닝은 제조자의 프로토콜에 따라 INFUSION 클로닝 시스템(Clontech Laboratories, Inc., Mountain View, CA)을 사용하여 수행하였다. 조합 라이브러리는 전달 PCR(tPCR) 프로토콜을 사용하여 생성될 수 있다(문헌 참조; Erijman et al. (2011) J. Structural Bio.175:171-177).
라이브러리 스크리닝
일단 라이브러리 다양성이 오류-유발, 포화 라이브러리 또는 조합 라이브러리에서 생성되었다면, 이것을 상기한 방법들 중의 하나를 사용하여 스크링하였다. 두 가지 타입의 히트(hit)가 확인되었다: (1) 증가된 양의 ω-하이드록시 지방산(ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환. 각 히트 내의 혼성 cyp153A-RedRhF 단백질 변이체에서의 돌연변이는 당업계의 숙련가들에 의해 이용되는 표준 기술들을 사용하여 서열화함으로써 확인하였다. 아래 표 5, 6 및 7은 포화 라이브러리에서 유익한 것으로 확인된 돌연변이(히트)를 열거한다.
실시예 1: 라이브러리 스크리닝을 위한 균주 및 플라스미드 작제
당해 실시예는 포화 또는 조합 돌연변이유발 라이브러리 스크리닝을 위해 작제된 균주 및 플라스미드를 설명한다.
마리노박터 아쿠에올리(Marinobacter aquaeoli)로부터의 CYP153A(G307A) P450 촉매 단백질 및 로도코쿠스 종(Rhodococcus sp.) NCIMB9784로부터의 P450RhF의 c-말단 FMN- 및 Fe/S-함유 환원효소 도메인으로 만들어진 혼성-융합 단백질을 암호화하는 유전자를 다음과 같이 생성하였다: cyp165A(G307A)_Maqu 유전자를 게놈 DNA로부터 증폭시키고, 크로스-오버 PCR에 의해 코돈-최적화된 합성 P450RhF 환원효소 도메인과 융합하였다. 생성된 융합 유전자(서열번호 5)를 이의 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되도록 pACYC-유도체(, p15A 복제단위, 카나마이신 내성 마커)로 클로닝하였다. 플라스미드를 pEP125라고 명명하였다(표 4 참조, 하기).
혼성 cyp153A(G307A)-Red450RhF 융합 단백질을 암호화하는 유전자를 또한 pEP125로부터 증폭시키고 이의 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되도록 pCL1920-유도체 벡터(SC101 복제단위, 스펙티노마이신 내성 마커)로 클로닝하였으며, 이것은 식물 티오에스테라제(fatB1), 3-케토-아실-ACP 신타제의 변이체(fabB) 및 전사 조절인자(fadR)를 암호화하는 유전자와 오페론을 형성하였다. 플라스미드를 pLC81이라고 명명하였다(표 4 참조, 이하).
추가의 플라스미드를 다음과 같이 생성하였다: 움벨룰라리아 칼리포르니카(Umbellularia californica)로부터의 식물 티오에스테라제(fatB1)를 암호화하는 유전자를 코돈-최적화된 DNA로서 합성하고, pCL1920-유도체 벡터(SC101 복제단위, 스펙티노마이신 내성 마커)로 클로닝하여, 이의 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되도록 하며, 이것은 아세틸-CoA 카복실라제(accDACB), 비오틴 리가제(birA) 및 아실-운반 단백질을 암호화하는 오페론을 형성하였다. 플라스미드를 pNH305라고 명명하였다(표 4 참조, 이하). 플라스미드 pAS033은 pNH305에서 fatB1을 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터의 코돈-최적화된 합성 식물 티오에스테라제(fatA3)로 대체함으로써 생성하였다(표 4 참조, 아래). 플라스미드 pEP146은 pLC81에서 fatB1을 아라비돕시스 탈리아나로부터의 코돈-최적화된 합성 식물 티오에스테라제(fatA3)로 대체함으로써 생성하였다(표 4 참조, 이하). pEP146은 또한 플라스미드 암호화된 repA 단백질에 돌연변이를 지녔다.
플라스미드 형질전환을 위해 사용되는 기본 균주는 GLP077 및 BZ128이었다. 간략하게, 기본 균주 GLPH077의 게놈은 다음과 같이 조작하였다: 아실-CoA 데하이드로게나제(fadE) 유전자를 결실시키고, 전사 조절인자(fadR) 및 합성 지방산 생합성 오페론을 과발현시켰다. 간략하게, 기본 균주 BZ128의 게놈은 다음과 같이 조작하였다: fadE(아실-CoA 데하이드로게나제) 유전자를 결실시키고, 합성 지방산 생합성 오페론, β-하이드록시 지방 아실-ACP 데하이드라타제(fabZ) 및 티오에스테라제의 변이체(tesA)를 과발현시켰다. 또한, 균주를 미리 트랜스포존 뿐만 아니라 N-메틸-N'-니트로-N-니트로소구아니딘(NTG) 돌연변이유발 및 스크리닝에 적용시켰다.
[표 4] : 라이브러리 스크리닝을 위해 사용되는 플라스미드
Figure 112017005010255-pct00036
혼성 cyp153A(G307A)-Red450RhF 융합 단백질을 숙주 세포에서의 발현이 ω-OH 지방산 유도체를 생산할 수 있는지 여부를 알아보기 위해 시험하였다. 서열번호 5를 발현하는 미생물은 글루코스로부터 1 g/L 초과의 ω-OH 지방산 유도체를 생산할 수 있었다. 따라서, 이러한 조작된 효소를 추가의 진화 연구를 위해 선택하였다.
실시예 2: cyp153A ( G307A )- Red450RhF 융합 단백질의 P450 촉매 도메인의 포화 라이브러리
cyp153A-Red450RhF 융합 단백질의 P450 촉매 도메인의 전체 포화 라이브러리를 구축하고, cyp153A(G307A)-Red450RhF(, 주형 폴리펩티드)를 능가하는 개선을 나타낸 변이체에 대해 스크리닝하였다. G307A(, 위치 307에서 알라닌 잔기가 글리신으로 대체됨)는 cyp153A의 ω-하이드록실라제 활성을 개선시키는 유익한 돌연변이이다(문헌 참조; Honda Malca et al. (2012) Chem . Commun . 48:5115). 히트에 대한 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산(ωOH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다.
당업계의 숙련가들에게 공지된 표준 기법들이 포화 라이브러리를 제조하는데 사용되었다. 플라스미드 pEP125 및 pLC81(상기 표 4 참조)을 사용하여 전체 포화 라이브러리를 만들었다. 세 가지 포화 라이브러리를 스크리닝하였다: 첫번째 라이브러리를 위해 pEP125를 pNH305와 함께 균주 GLPH077로 형질전환시키고, 두번째 라이브러리를 위해 pLC81을 BZ128로 형질전환시키고, 세번째 라이브러리를 위해 pEP125를 pAS.033과 함께 GLPH077 균주로 형질전환시켰다. 첫번째 및 두번째 라이브러리를 특히 ω-하이드록시 도데칸산 형성에서 개선된 변이체에 대해 스크리닝하고 세 라이브러리를 특히 ω-하이드록시 헥사데센산 형성에 있어서 개선된 변이체에 대해 스크리닝하였다. 라이브러리는 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다. 개선된 변이체들이 아래 표 5 내지 7에 나타내어져 있다(이하). 특히, 위치 141의 변이체가 다수회 동정되었으며, ω-하이드록시 도데칸산 및 ω-하이드록시 헥사데센산 형성 둘 다에 대해 상당히 개선된 효소인 것으로 밝혀졌다.
[표 5] : cyp153A(G307A)-Red450RhF의 촉매 도메인의 첫번째 부위 포화 라이브러리로부터의 개선된 변이체의 요약.
Figure 112017005010255-pct00037
Figure 112017005010255-pct00038
FIOC: 대조군을 능가한 배가 개선; 대조군은 굵게 표시됨
[표 6] : cyp153A(G307A)-Red450RhF의 촉매 도메인의 두번째 부위 포화 라이브러리로부터의 개선된 변이체의 요약.
Figure 112017005010255-pct00039
Figure 112017005010255-pct00040
Figure 112017005010255-pct00041
[표 7] : cyp153A(G307A)-Red450RhF의 촉매 도메인의 세번째 부위 포화 라이브러리로부터의 개선된 변이체의 요약.
Figure 112017005010255-pct00042
Figure 112017005010255-pct00043
FIOC: 대조군을 능가한 배가 개선; 대조군은 굵게 표시됨
실시예 3: cyp153A ( G307A )- Red450RhF 융합 단백질의 환원효소 도메인의 부분 부위 포화 라이브러리
혼성 cyp153A-Red450RhF 융합 단백질의 환원효소 도메인의 부분 포화 라이브러리(매 열번째 아미노산마다 돌연변이됨)를 구축하고, 촉매 P450 cyp153A 도메인의 부위 포화 돌연변이유발 라이브러리에서 동정된 변이체인 cyp153A(V141I, A231T, G307A)-Red450RhF (서열번호 32)를 능가하는 개선을 나타낸 변이체에 대해 스크리닝하였다. 히트에 대한 선택 기준은 (1) 증가된 양의 ω-하이드록시 도데칸산(ωOH FFA 역가); 및/또는 (2) 도데칸산에서 ω-하이드록시 도데칸산으로의 증가된 전환이었다.
당업계의 숙련가들에게 공지된 표준 기법들을 사용하여 포화 라이브러리를 제조하였다. 라이브러리를 위해, cyp153A(V141I, A231T, G307A)-Red450RhF를 갖는 pLC81을 BZ128로 형질전환시켰다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다. 개선된 변이체가 표 8에 나타내어져 있다. 특히 변이체 A796V (서열번호 42) 및 P666A가 상당히 개선된 효소들이었다.
[표 8] : cyp153A(V141I A231T G307A)-Red450RhF의 환원효소 도메인의 부분 포화 라이브러리로부터의 개선된 변이체의 요약
Figure 112017005010255-pct00044
실시예 4: cyp153A ( G307A )- Red450RhF 융합 단백질의 환원효소 도메인의 조합 라이브러리
환원효소 도메인의 부분 포화 라이브러리(실시예 3)에서 동정된 유리한 돌연변이가 cyp153A(G307A)-Red450RhF 융합 단백질을 더욱 개선시키기 위한 조합 라이브러리의 기본이었다. 선택 기준은 (1) 증가된 양의 ω-하이드록시 도데칸산 (ωOH FFA 역가); 및/또는 (2) 도데칸산에서 ω-하이드록시 도데칸산으로의 증가된 전환이었다.
조합 라이브러리를 cyp153A(V141I, A231T, G307A)-Red450RhF (서열번호 32)를 갖는 pLC81에서 작제하고 BZ128로 형질전환시켰다. 당업계의 숙련가들에게 공지된 표준 기술들을 사용하여 조합 라이브러리를 제조하였다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다. 개선된 변이체가 아래 표 9에 나타내어져 있다.
[표 9] : cyp153A(V141I, A231T, G307A)-Red450RhF의 환원효소 도메인의 조합 라이브러리로부터의 개선된 변이체의 요약
Figure 112017005010255-pct00045
실시예 5: cyp153A ( G307A )- Red450RhF 융합 단백질의 촉매성 및 환원효소 도메인의 조합 라이브러리
포화 라이브러리(실시예 2 및 3)에서 동정된 유리한 돌연변이가 cyp153A(G307A)-Red450RhF 융합 단백질을 더욱 개선시키기 위한 조합 라이브러리의 기본이었다. 선택 기준은 (1) 증가된 양의 ω-하이드록시 도데칸산 (ωOH FFA 역가); 및/또는 (2) 도데칸산에서 ω-하이드록시 도데칸산으로의 증가된 전환이었다. 조합 라이브러리를 pLC81에서 작제하고 BZ128로 형질전환시켰다. 당업계의 숙련가들에게 공지된 표준 기술들을 사용하여 조합 라이브러리를 제조하였다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다. 최선으로 개선된 두 가지 변이체가 아래 표 10에 나타내어져 있다.
[표 10] : cyp153A(G307A)-Red450RhF의 조합 라이브러리로부터의 최선으로 개선된 변이체
Figure 112017005010255-pct00046
실시예 6: cyp153A ( G307A , A796V )- Red450RhF의 위치 141 및 309의 부위 포화 돌연변이유발
위치 141에서의 변화가 기질 특이성에 영향을 미쳤음을 주지하였다. 따라서, 이러한 두 개의 위치의 부위 포화 돌연변이유발을 cyp153A(G307A, A796V)-Red450RhF에서 수행하였다. 히트에 대한 선택 기준은 (1) 증가된 양의 ω-하이드록시 헥사데센산; 및/또는 (2) 헥사데센산에서 ω-하이드록시 헥사데센산으로의 증가된 전환이었다.
라이브러리를 위해, cyp153A(G307A A796V)-Red450RhF (서열번호 38)를 갖는 pEP146을 BZ128로 형질전환시켰다. 당업계의 숙련가들에게 공지된 표준 기술들을 사용하여 부위 포화 라이브러리를 제조하였다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다. 개선된 변이체들이 도 2에 나타내어져 있다. 특히, V141T (서열번호 46)를 갖는 변이체는 가장 높은 ω-하이드록시 헥사데센산 역가 및 헥사데센산으로부터의 가장 높은 전환을 나타내었다.
실시예 7: cyp153A ( G307A )- Red450RhF (A796V) 융합 단백질의 포화 라이브러리
cyp153A-Red450RhF 융합 단백질의 전체 포화 라이브러리를 구축하고, cyp153A(G307A)-Red450RhF(A796V)(, 주형 폴리펩티드)를 능가하는 개선을 나타낸 변이체에 대해 스크리닝하였다. G307A (즉, 알라닌 잔기가 위치 307에서 글리신으로 대체됨) 및 A796V (, 발린 잔기가 위치 796에서 알라닌으로 대체됨)가 cyp153A의 ω-하이드록실라제 활성을 개선시키는 유익한 돌연변이이다(위 참조). 히트에 대한 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산 (ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다.
당업계의 숙련가들에게 공지된 표준 기술들을 사용하여 포화 라이브러리를 제조하였다. 플라스미드 pEP302를 사용하여 pEP146(표 4 참조)의 유도체인 전체 포화 라이브러리를 만들었으며, 여기서, 유전자의 순서를 변경시키고(fatA3-fadB-fadR-cyp153A(G307A)-Red450RhF(A796V)) 마지막 유전자를 별도의 프로모터로부터 발현시켰다. 라이브러리를 균주 stNH1525로 형질전환시켰다. 간략하게, 기본 균주 stNH1525의 게놈을 다음과 같이 조작하였다: fadE (아실-CoA 데하이드로게나제) 유전자를 결실시키고, 합성 지방산 생합성 오페론을 과발현시켰다. 또한, 균주를 미리 트랜스포존 뿐만 아니라 N-메틸-N'-니트로-N-니트로소구아니딘(NTG) 돌연변이유발 및 스크리닝에 적용시켰다.
라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝시켰다. 개선된 변이체, 특히, ω-하이드록시 헥사데칸산 및 ω-하이드록시 헥사데센산 형성을 상당히 개선시킨 변이체가 아래 표 11에 나타내어져 있다.
[표 11] : cyp153A(G307A)-Red450RhF(A976V)의 부위 포화 라이브러리로부터의 개선된 변이체의 요약
Figure 112017005010255-pct00047
Figure 112017005010255-pct00048
Figure 112017005010255-pct00049
당업계의 숙련가에게 자명한 바와 같이, 상기 측면들 및 실시형태들의 다양한 변형들 및 변경들이 본 발명의 취지 및 범위를 벗어나지 않고 행해질 수 있다. 이러한 변형들 및 변경들은 본 발명의 범위 내에 있다.
<110> LS9, Inc. <120> OMEGA-HYDROXYLASE-RELATED FUSION POLYPEPTIDES WITH IMPROVED PROPERTIES <130> LS00054P <160> 46 <170> KoPatentIn 3.0 <210> 1 <211> 1413 <212> DNA <213> Marinobacter aquaeolei <400> 1 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgg cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt taa 1413 <210> 2 <211> 470 <212> PRT <213> Marinobacter aquaeolei <400> 2 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Gly Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser 465 470 <210> 3 <211> 1413 <212> DNA <213> Marinobacter aquaeolei <400> 3 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt taa 1413 <210> 4 <211> 470 <212> PRT <213> Marinobacter aquaeolei <400> 4 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser 465 470 <210> 5 <211> 2400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 5 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 2400 <210> 6 <211> 799 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 6 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 7 <211> 2400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 7 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagct gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 2400 <210> 8 <211> 799 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 8 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 9 <211> 2400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 9 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tgggacgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 2400 <210> 10 <211> 799 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 10 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Asp Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 11 <211> 2400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 11 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 atcgaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 2400 <210> 12 <211> 799 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 12 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Ile Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 13 <211> 2400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 13 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 caggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 2400 <210> 14 <211> 799 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 14 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Gln Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 15 <211> 2400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 15 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 ggggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 2400 <210> 16 <211> 799 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 16 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Gly Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 17 <211> 2400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 17 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 atggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 2400 <210> 18 <211> 799 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 18 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Met Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 19 <211> 2400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 19 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 ctggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 2400 <210> 20 <211> 799 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 20 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Leu Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 21 <211> 2400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 21 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 2400 <210> 22 <211> 799 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 22 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Thr Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 23 <211> 2400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 23 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc aaacaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 2400 <210> 24 <211> 799 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 24 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Asn Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 25 <211> 2400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 25 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggccgggat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 2400 <210> 26 <211> 799 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 26 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Arg Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 27 <211> 2400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 27 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcggcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 2400 <210> 28 <211> 799 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 28 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 29 <211> 2400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 29 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg ggcgtcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 2400 <210> 30 <211> 799 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 30 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Arg His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 31 <211> 2400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 31 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 atcgaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt acagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 2400 <210> 32 <211> 799 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 32 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Ile Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Thr Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 33 <211> 2400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 33 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagct gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tgggacgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 atggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc aaacaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcgcggat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 2400 <210> 34 <211> 799 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 34 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Asp Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Met Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Asn Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Ala Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 35 <211> 2400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 35 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcggcggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400 2400 <210> 36 <211> 799 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 36 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Ala Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu 785 790 795 <210> 37 <211> 2400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 37 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400 2400 <210> 38 <211> 799 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 38 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu 785 790 795 <210> 39 <211> 2400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 39 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaagtcct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcggacgg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400 2400 <210> 40 <211> 799 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 40 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Val Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Asp Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu 785 790 795 <210> 41 <211> 2400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 41 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 atcgaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt acagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400 2400 <210> 42 <211> 799 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 42 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Ile Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Thr Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu 785 790 795 <210> 43 <211> 2400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 43 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagct gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tgggacgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 atggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc aaacaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcgcggat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400 2400 <210> 44 <211> 799 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 44 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Asp Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Met Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Asn Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Ala Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu 785 790 795 <210> 45 <211> 2400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 45 atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60 agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120 aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180 aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240 tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300 cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360 cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420 acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480 ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540 gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600 gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660 ctggttgagt ggtcggacag aatggcaggt acagcatcgg ccaccggcgg ggagtttgcc 720 gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780 cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840 ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900 ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960 gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020 ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080 gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140 tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200 gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260 aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320 aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380 aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440 ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500 gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560 acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620 ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680 ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740 cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800 ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860 ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920 ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980 cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040 ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100 tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160 tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220 aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280 ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340 cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400 2400 <210> 46 <211> 799 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 46 Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile 1 5 10 15 Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu 20 25 30 Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro 35 40 45 Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala 50 55 60 Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln 65 70 75 80 Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr 85 90 95 Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu 100 105 110 Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro 115 120 125 Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Thr Glu Met Phe 130 135 140 Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln 145 150 155 160 Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg 165 170 175 Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe 180 185 190 Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala 195 200 205 Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp 210 215 220 Ser Asp Arg Met Ala Gly Thr Ala Ser Ala Thr Gly Gly Glu Phe Ala 225 230 235 240 Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe 245 250 255 Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu 260 265 270 Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys 275 280 285 Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu 290 295 300 Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu 305 310 315 320 Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys 325 330 335 Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr 340 345 350 Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly 355 360 365 Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser 370 375 380 Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile 385 390 395 400 Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His 405 410 415 Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp 420 425 430 Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro 435 440 445 Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val 450 455 460 Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile 465 470 475 480 Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg 485 490 495 Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala 500 505 510 Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu 515 520 525 Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp 530 535 540 Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly 545 550 555 560 Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg 565 570 575 Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His 580 585 590 Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met 595 600 605 Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys 610 615 620 Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His 625 630 635 640 Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp 645 650 655 Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala 660 665 670 Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn 675 680 685 Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala 690 695 700 Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp 705 710 715 720 Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala 725 730 735 Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu 740 745 750 Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg 755 760 765 Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met 770 775 780 Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu 785 790 795

Claims (47)

  1. 서열번호 6에 대해 적어도 90% 서열 동일성을 포함하고, 796, 141, 27, 178, 309, 407, 및 415 로 이루어진 그룹으로부터 선택된 아미노산 위치에 적어도 하나의 돌연변이를 가지는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체로서,
    상기 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매하고,
    상기 돌연변이는 A796V, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R178N, N309R, N407A, 및 V415R 로 이루어진 그룹으로부터 선택되는, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체.
  2. 청구항 1에 있어서,
    상기 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체가 혼성 cyp153A-RedRhF 융합 단백질 변이체인, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체.
  3. 삭제
  4. 청구항 1에 있어서,
    재조합 숙주 세포에서 상기 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체의 발현이 서열번호 6의 CYP153A-환원효소 혼성 융합 폴리펩티드의 발현에 의해 생산되는 오메가-하이드록실화 지방산의 역가와 비교하여 더 높은 역가의 오메가-하이드록실화 지방산을 야기하는, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체.
  5. 청구항 1에 있어서,
    서열번호 8, 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30, 서열번호 38, 서열번호 40, 서열번호 42, 서열번호 44, 및 서열번호 46 중의 어느 하나를 포함하는, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체.
  6. 청구항 1에 있어서,
    (a) V141I 및 A231T에 돌연변이를 갖고, 서열번호 32를 포함하는;
    (b) R27L, R82D, V141M, R178N 및 N407A에 돌연변이를 갖고, 서열번호 34를 포함하는;
    (c) A796V에 돌연변이를 갖고, 서열번호 38을 포함하는;
    (d) A796V, P666D 및 T516V에 돌연변이를 갖고, 서열번호 40을 포함하는;
    (e) V141I, A231T 및 A796V에 돌연변이를 갖고, 서열번호 42를 포함하는;
    (f) R27L, R82D, V141M, R178N, N407A 및 A796V에 돌연변이를 갖고, 서열번호 44를 포함하는; 또는
    (g) V141T, A231T 및 A796V에 돌연변이를 갖고, 서열번호 46을 포함하는, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체.
  7. 청구항 6에 있어서,
    상기 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체가 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매하는, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체.
  8. 청구항 1, 2, 4 내지 7 중의 어느 한 항의 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 발현하고, EC 3.1.2.-, EC 3.1.1.5 또는 EC 3.1.2.14의 티오에스테라제 폴리펩티드를 추가로 발현하는, 재조합 숙주 세포.
  9. 청구항 8에 있어서,
    탄소 공급원을 함유하는 배지에서 배양되는 경우, 상응하는 CYP153A-환원효소 혼성 융합 폴리펩티드를 발현하는 숙주 세포에 의해 생산되는 오메가-하이드록실화 지방산 조성물의 역가보다 적어도 10% 더 큰, 적어도 15% 더 큰, 적어도 20% 더 큰, 적어도 25% 더 큰, 또는 적어도 30% 더 큰 역가로 오메가-하이드록실화 지방산 조성물을 생산하는, 재조합 숙주 세포.
  10. 청구항 9에 있어서,
    상기 오메가-하이드록실화 지방산이 세포내로 또는 세포외로 생산되는, 재조합 숙주 세포.
  11. 청구항 8의 재조합 숙주 세포를 포함하는, 세포 배양물.
  12. 청구항 11에 있어서,
    상기 오메가-하이드록실화 지방산이 C12, C16 및 C16:1 오메가-하이드록실화 지방산 중의 하나 이상을 포함하는, 세포 배양물.
  13. 청구항 12에 있어서,
    상기 오메가-하이드록실화 지방산이
    (a) 불포화 오메가-하이드록실화 C16:1 지방산; 또는
    (b) 포화 오메가-하이드록실화 C12 지방산을 포함하는, 세포 배양물.
  14. i. 청구항 8의 숙주 세포를 탄소 공급원과 함께 배양하는 단계; 및
    ii. 오메가-하이드록실화 지방산을 수확하는 단계를 포함하는, 역가의 증가를 갖는 오메가-하이드록실화 지방산을 생산하는 방법.
  15. 청구항 14에 있어서,
    상기 오메가-하이드록실화 지방산이 포화 오메가-하이드록실화 지방산, 또는 불포화 오메가-하이드록실화 지방산인 방법.
  16. 재생가능한 공급원료로부터 탄소 공급원의 존재하에 발효 브로쓰에서 성장되는 경우 생체내에서 오메가-하이드록실화 지방산 유도체를 생산하기 위한 재조합 미생물로서,
    상기 미생물은
    (i) EC 3.1.2.-, EC 3.1.1.5, 또는 EC 3.1.2.14의 티오에스테라제; 및
    (ii) 청구항 1의 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 포함하는 폴리펩티드를 암호화하는 적어도 두 개의 핵산 서열을 발현하도록 조작된 경로를 포함하고,
    상기 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 서열번호 8, 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30, 서열번호 38, 서열번호 40, 서열번호 42, 서열번호 44 및 서열번호 46 중의 어느 하나에 대해 적어도 90% 서열 동일성을 갖는, 재조합 미생물.
  17. 청구항 16에 있어서,
    상기 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체가 자족성(self-sufficient) CYP153A-RedRhF 혼성 융합 단백질 변이체인, 재조합 미생물.
  18. 삭제
  19. 서열번호 38에 대해 적어도 90% 서열 동일성을 포함하고, 747, 12, 327, 14, 61, 28, 13, 771, 119, 10, 11, 28, 745, 9, 770, 413, 784, 749, 231, 233, 244, 757 및 703으로 이루어진 그룹으로부터 선택된 아미노산 위치에 적어도 하나의 돌연변이를 갖는 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체로서,
    상기 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매하고,
    상기 돌연변이가 D747N, Q12W, Q12T, Q12R, P327D, R14F, N61L, Q28M, S13K, V771F, K119R, D10Y, I11L, Q28T, P745R, D9N, D9K, T770G, Y413R, M784I, E749L, A231Y, S233L, A244R, E757A, 및 L703G로 이루어진 그룹으로부터 선택되는, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체.
  20. 청구항 19에 있어서,
    상기 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체가 혼성 cyp153A-RedRhF 융합 단백질 변이체인, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체.
  21. 청구항 19에 있어서,
    재조합 숙주 세포에서 상기 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체의 발현이 서열번호 38의 CYP153A-환원효소 혼성 융합 폴리펩티드의 발현에 의해 생산되는 오메가-하이드록실화 지방산의 역가와 비교하여 더 높은 역가의 오메가-하이드록실화 지방산을 야기하는, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체.
  22. 청구항 19에 있어서,
    서열번호 48, 서열번호 50, 서열번호 52, 서열번호 54, 서열번호 56, 서열번호 58, 서열번호 60, 서열번호 62, 서열번호 64, 서열번호 66, 서열번호 68, 서열번호 70, 서열번호 72, 서열번호 74, 서열번호 76, 서열번호 78, 서열번호 80, 서열번호 82, 서열번호 84, 서열번호 86, 서열번호 88, 서열번호 90, 서열번호 92, 서열번호 94, 및 서열번호 96 중의 어느 하나를 포함하는, CYP153A-환원효소 혼성 융합 폴리펩티드 변이체.
  23. 청구항 19 내지 22 중의 어느 한 항의 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 발현하고, EC 3.1.2.-, EC 3.1.1.5 또는 EC 3.1.2.14의 티오에스테라제 폴리펩티드를 추가로 발현하는, 재조합 숙주 세포.
  24. 청구항 23에 있어서,
    탄소 공급원을 함유하는 배지에서 배양되는 경우, 상응하는 CYP153A-환원효소 혼성 융합 폴리펩티드를 발현하는 숙주 세포에 의해 생산되는 오메가-하이드록실화 지방산 조성물의 역가보다 적어도 10% 더 큰, 적어도 15% 더 큰, 적어도 20% 더 큰, 적어도 25% 더 큰, 또는 적어도 30% 더 큰 역가로 오메가-하이드록실화 지방산 조성물을 생산하는, 재조합 숙주 세포.
  25. 청구항 24에 있어서,
    상기 오메가-하이드록실화 지방산이 세포내로 또는 세포외로 생산되는, 재조합 숙주 세포.
  26. 청구항 23의 재조합 숙주세포를 포함하는, 세포 배양물.
  27. 청구항 26에 있어서,
    상기 오메가-하이드록실화 지방산이 C12, C16 및 C16:1 오메가-하이드록실화 지방산 중의 하나 이상을 포함하는, 세포 배양물.
  28. 청구항 27에 있어서,
    상기 오메가-하이드록실화 지방산이
    (a) 불포화 오메가-하이드록실화 C16:1 지방산; 또는
    (b) 포화 오메가-하이드록실화 C12 지방산을 포함하는, 세포 배양물.
  29. i. 청구항 23의 숙주 세포를 탄소 공급원과 함께 배양하는 단계; 및
    ii. 오메가-하이드록실화 지방산을 수확하는 단계를 포함하는, 역가의 증가를 갖는 오메가-하이드록실화 지방산을 생산하는 방법.
  30. 청구항 29에 있어서,
    상기 오메가-하이드록실화 지방산이 포화 오메가-하이드록실화 지방산, 또는 불포화 오메가-하이드록실화 지방산인 방법.
  31. 재생가능한 공급원료로부터 탄소 공급원의 존재하에 발효 브로쓰에서 성장되는 경우 생체내에서 오메가-하이드록실화 지방산 유도체를 생산하기 위한 재조합 미생물로서,
    상기 미생물은
    (i) EC 3.1.2.-, EC 3.1.1.5, 또는 EC 3.1.2.14의 티오에스테라제; 및
    (ii) 청구항 19의 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체를 포함하는 폴리펩티드를 암호화하는 적어도 두 개의 핵산 서열을 발현하도록 조작된 경로를 포함하고,
    상기 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체는 서열번호 48, 서열번호 50, 서열번호 52, 서열번호 54, 서열번호 56, 서열번호 58, 서열번호 60, 서열번호 62, 서열번호 64, 서열번호 66, 서열번호 68, 서열번호 70, 서열번호 72, 서열번호 74, 서열번호 76, 서열번호 78, 서열번호 80, 서열번호 82, 서열번호 84, 서열번호 86, 서열번호 88, 서열번호 90, 서열번호 92, 서열번호 94, 및 서열번호 96 중의 어느 하나에 대해 적어도 90% 서열 동일성을 갖는, 재조합 미생물.
  32. 청구항 31에 있어서,
    상기 CYP153A-환원효소 혼성 융합 폴리펩티드 변이체가 자족성(self-sufficient) CYP153A-RedRhF 혼성 융합 단백질 변이체인, 재조합 미생물.
  33. 삭제
  34. 삭제
  35. 삭제
  36. 삭제
  37. 삭제
  38. 삭제
  39. 삭제
  40. 삭제
  41. 삭제
  42. 삭제
  43. 삭제
  44. 삭제
  45. 삭제
  46. 삭제
  47. 삭제
KR1020177001306A 2014-06-16 2015-08-13 개선된 특성을 갖는 오메가-하이드록실라제-관련 융합 폴리펩티드 KR102439589B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020227029909A KR102663049B1 (ko) 2014-06-16 2015-08-13 개선된 특성을 갖는 오메가-하이드록실라제-관련 융합 폴리펩티드

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462012970P 2014-06-16 2014-06-16
US62/012,970 2014-06-16
PCT/US2015/036078 WO2015195697A1 (en) 2014-06-16 2015-06-16 Omega-hydroxylase-related fusion polypeptides with improved properties

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020227029909A Division KR102663049B1 (ko) 2014-06-16 2015-08-13 개선된 특성을 갖는 오메가-하이드록실라제-관련 융합 폴리펩티드

Publications (2)

Publication Number Publication Date
KR20170066306A KR20170066306A (ko) 2017-06-14
KR102439589B1 true KR102439589B1 (ko) 2022-09-06

Family

ID=53491691

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020227029909A KR102663049B1 (ko) 2014-06-16 2015-08-13 개선된 특성을 갖는 오메가-하이드록실라제-관련 융합 폴리펩티드
KR1020177001306A KR102439589B1 (ko) 2014-06-16 2015-08-13 개선된 특성을 갖는 오메가-하이드록실라제-관련 융합 폴리펩티드

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020227029909A KR102663049B1 (ko) 2014-06-16 2015-08-13 개선된 특성을 갖는 오메가-하이드록실라제-관련 융합 폴리펩티드

Country Status (14)

Country Link
US (3) US11441130B2 (ko)
EP (2) EP3690035A3 (ko)
JP (3) JP6826435B2 (ko)
KR (2) KR102663049B1 (ko)
CN (2) CN106604990B (ko)
AU (2) AU2015277261B2 (ko)
BR (1) BR112016029235B1 (ko)
CA (1) CA2951925A1 (ko)
ES (1) ES2803560T3 (ko)
MX (1) MX2016016565A (ko)
MY (1) MY198268A (ko)
PL (1) PL3087179T3 (ko)
SI (1) SI3087179T1 (ko)
WO (1) WO2015195697A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY197101A (en) 2013-06-14 2023-05-24 Genomatica Inc Methods of producing omega-hydroxylated fatty acid derivatives
EP3690035A3 (en) * 2014-06-16 2020-10-21 Genomatica, Inc. Omega-hydroxylase-related fusion polypeptides with improved properties
WO2017101987A1 (en) * 2015-12-15 2017-06-22 REG Life Sciences, LLC Omega-hydroxylase-related fusion polypeptide variants with improved properties
EP3607059A2 (en) 2017-04-03 2020-02-12 Genomatica, Inc. Thioesterase variants having improved activity for the production of medium-chain fatty acid derivatives

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009005687A (ja) 2007-05-25 2009-01-15 Kobe Tennenbutsu Kagaku Kk Cyp153による芳香族化合物の製造方法
WO2013135650A1 (de) 2012-03-12 2013-09-19 Evonik Industries Ag Enzymatische omega-oxidation und -aminierung von fettsäuren

Family Cites Families (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1305083C (en) 1987-02-18 1992-07-14 Yoshiharu Kimura Microorganism belonging to genus rhodococcus, and a process for producing alkene derivative and unsaturated fatty acid
US5028539A (en) 1988-08-31 1991-07-02 The University Of Florida Ethanol production using engineered mutant E. coli
US5482846A (en) 1988-08-31 1996-01-09 University Of Florida Ethanol production in Gram-positive microbes
US5424202A (en) 1988-08-31 1995-06-13 The University Of Florida Ethanol production by recombinant hosts
US5000000A (en) 1988-08-31 1991-03-19 University Of Florida Ethanol production by Escherichia coli strains co-expressing Zymomonas PDC and ADH genes
AU7791991A (en) 1990-04-24 1991-11-11 Stratagene Methods for phenotype creation from multiple gene populations
US5602030A (en) 1994-03-28 1997-02-11 University Of Florida Research Foundation Recombinant glucose uptake system
US6428767B1 (en) 1995-05-12 2002-08-06 E. I. Du Pont De Nemours And Company Method for identifying the source of carbon in 1,3-propanediol
US5965408A (en) 1996-07-09 1999-10-12 Diversa Corporation Method of DNA reassembly by interrupting synthesis
US5939250A (en) 1995-12-07 1999-08-17 Diversa Corporation Production of enzymes having desired activities by mutagenesis
RU2352549C2 (ru) 2002-04-29 2009-04-20 Дау Глобал Текнолоджиз Инк. Интегрированные химические способы промышленного применения растительных масел из семян
US20080220419A1 (en) 2004-11-10 2008-09-11 Marine Biotechnology Institute Co., Ltd. Method of Isolating P450 Gene
US20100242345A1 (en) 2006-05-19 2010-09-30 LS9, Inc Production of fatty acids & derivatives thereof
CA2650773C (en) 2006-05-19 2014-12-02 Jay D. Keasling Microorganisms transformed with acetyl-coa carboxylase and wax synthase for production of fatty acid derivatives
US8110670B2 (en) 2006-05-19 2012-02-07 Ls9, Inc. Enhanced production of fatty acid derivatives
WO2008046106A2 (en) 2006-10-13 2008-04-17 Elevance Renewable Sciences, Inc. Synthesis of terminal alkenes from internal alkenes via olefin metathesis
DK2121546T3 (en) 2006-10-13 2018-03-12 Elevance Renewable Sciences Process for preparing omega-dicarboxylic acid olefin derivative by metathesis
US8110093B2 (en) 2007-03-14 2012-02-07 Ls9, Inc. Process for producing low molecular weight hydrocarbons from renewable resources
CA3035878C (en) 2007-03-28 2023-01-03 REG Life Sciences, LLC Enhanced production of fatty acid derivatives
US20080293060A1 (en) 2007-04-23 2008-11-27 Ls9, Inc. Methods and Compositions for Identification of Hydrocarbon Response, Transport and Biosynthesis Genes
EP2160460B1 (en) 2007-05-22 2017-08-02 REG Life Sciences, LLC Hydrocarbon-producing genes and methods of their use
WO2009009391A2 (en) 2007-07-06 2009-01-15 Ls9, Inc. Systems and methods for the production of fatty esters
FR2921362B1 (fr) 2007-09-20 2012-09-21 Arkema France Procede de synthese d'acides gras omega-insatures
CN101802208B (zh) 2007-09-27 2016-05-18 Reg生命科学有限责任公司 通过提取式发酵减少原料中杂质的毒性作用
TWI351779B (en) 2007-12-03 2011-11-01 Advance Smart Ind Ltd Apparatus and method for correcting residual capac
WO2009085278A1 (en) 2007-12-21 2009-07-09 Ls9, Inc. Methods and compositions for producing olefins
CN102027109B (zh) 2008-05-16 2016-01-06 Reg生命科学有限责任公司 产生碳氢化合物的方法和组合物
WO2009142983A1 (en) 2008-05-23 2009-11-26 Alliant Techsystems Inc. Broadband patch antenna and antenna system
US8273694B2 (en) 2008-07-28 2012-09-25 Jeffrey A Brown Synthetic compositions obtained from algae
WO2010021711A1 (en) 2008-08-18 2010-02-25 Ls9, Inc. Systems and methods for the production of mixed fatty esters
KR101258347B1 (ko) 2008-08-28 2013-04-30 미쓰이 가가쿠 가부시키가이샤 올레핀의 제조 방법
EP2352824B1 (en) 2008-10-07 2015-09-02 REG Life Sciences, LLC Method and compositions for producing fatty aldehydes
KR101700296B1 (ko) 2008-10-28 2017-01-26 알이지 라이프 사이언시스, 엘엘씨 지방족 알코올들을 생산하기 위한 방법들과 조성물들
US7989875B2 (en) 2008-11-24 2011-08-02 Nxp B.V. BiCMOS integration of multiple-times-programmable non-volatile memories
EP3564345A1 (en) 2008-12-23 2019-11-06 REG Life Sciences, LLC Methods and compositions related to thioesterase enzymes
US8071799B2 (en) 2009-01-29 2011-12-06 Energy & Environmental Research Center Foundation Chain-selective synthesis of fuel components and chemical feedstocks
EP2417246A4 (en) 2009-04-10 2015-11-04 Reg Life Sciences Llc PRODUCTION OF FATTY ACID DERIVATIVES
WO2010126891A1 (en) 2009-04-27 2010-11-04 Ls9, Inc. Production of fatty acid esters
EP2424989A2 (en) 2009-05-01 2012-03-07 The Regents of The University of California Product of fatty acid esters from biomass polymers
ES2707747T3 (es) 2009-09-25 2019-04-04 Reg Life Sciences Llc Producción de derivados de ácidos grasos
US8809563B2 (en) 2009-11-09 2014-08-19 Exxonmobil Chemical Patents Inc. Metathesis catalyst and process for use thereof
US8237003B2 (en) 2009-11-09 2012-08-07 Exxonmobil Chemical Patents Inc. Metathesis catalyst and process for use thereof
US8361769B1 (en) 2009-11-16 2013-01-29 U.S. Department Of Energy Regioselective alkane hydroxylation with a mutant CYP153A6 enzyme
US20110124071A1 (en) 2009-11-17 2011-05-26 LS9, Inc Methods and compositions for producing hydrocarbons
US8530221B2 (en) 2010-01-14 2013-09-10 Ls9, Inc. Production of branched chain fatty acids and derivatives thereof in recombinant microbial cells
AR084377A1 (es) 2010-04-08 2013-05-15 Ls9 Inc Metodos y composiciones relacionados con enzimas de alcohol graso biosintetico
AU2011257983B2 (en) 2010-05-28 2016-02-11 Corbion Biotech, Inc. Food compositions comprising tailored oils
US8372610B2 (en) 2010-09-15 2013-02-12 Ls9, Inc. Production of odd chain fatty acid derivatives in recombinant microbial cells
WO2012071439A1 (en) 2010-11-22 2012-05-31 The Regents Of The University Of California Host cells and methods for producing diacid compounds
KR101964965B1 (ko) 2011-02-02 2019-04-03 테라비아 홀딩스 인코포레이티드 재조합 유지성 미생물로부터 생산된 맞춤 오일
CA2841796C (en) 2011-07-06 2021-06-29 Verdezyne, Inc. Biological methods for preparing a fatty dicarboxylic acid
DE102011110946A1 (de) 2011-08-15 2016-01-21 Evonik Degussa Gmbh Biotechnologisches Syntheseverfahren von omegafunktionalisierten Carbonsäuren und Carbonsäure-Estern aus einfachen Kohlenstoffquellen
FR3003577B1 (fr) 2013-03-19 2016-05-06 Ferropem Inoculant a particules de surface
MY197101A (en) 2013-06-14 2023-05-24 Genomatica Inc Methods of producing omega-hydroxylated fatty acid derivatives
EP3690035A3 (en) * 2014-06-16 2020-10-21 Genomatica, Inc. Omega-hydroxylase-related fusion polypeptides with improved properties
WO2017101987A1 (en) 2015-12-15 2017-06-22 REG Life Sciences, LLC Omega-hydroxylase-related fusion polypeptide variants with improved properties

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009005687A (ja) 2007-05-25 2009-01-15 Kobe Tennenbutsu Kagaku Kk Cyp153による芳香族化合物の製造方法
WO2013135650A1 (de) 2012-03-12 2013-09-19 Evonik Industries Ag Enzymatische omega-oxidation und -aminierung von fettsäuren

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Microbial Biotechnology, 2013, Vol.6, No.6, pp.694-707

Also Published As

Publication number Publication date
JP6826435B2 (ja) 2021-02-03
MX2016016565A (es) 2017-04-25
JP2020036610A (ja) 2020-03-12
CA2951925A1 (en) 2015-12-23
MY198268A (en) 2023-08-18
US20230167419A1 (en) 2023-06-01
CN106604990A (zh) 2017-04-26
WO2015195697A1 (en) 2015-12-23
KR20170066306A (ko) 2017-06-14
US20170145390A1 (en) 2017-05-25
BR112016029235A2 (pt) 2018-07-10
US11421206B2 (en) 2022-08-23
KR102663049B1 (ko) 2024-05-13
AU2021202194A1 (en) 2021-05-06
JP2017518060A (ja) 2017-07-06
JP2022023237A (ja) 2022-02-07
CN106604990B (zh) 2022-04-05
EP3690035A3 (en) 2020-10-21
AU2015277261A1 (en) 2017-02-02
KR20220124292A (ko) 2022-09-13
EP3087179A1 (en) 2016-11-02
WO2015195697A9 (en) 2016-02-25
ES2803560T3 (es) 2021-01-27
SI3087179T1 (sl) 2020-10-30
US11441130B2 (en) 2022-09-13
EP3087179B1 (en) 2020-04-08
CN114605558A (zh) 2022-06-10
AU2015277261B2 (en) 2021-02-18
BR112016029235B1 (pt) 2023-11-28
EP3690035A2 (en) 2020-08-05
US20200370024A1 (en) 2020-11-26
PL3087179T3 (pl) 2020-09-21

Similar Documents

Publication Publication Date Title
JP7094343B2 (ja) 改良された特性を有するアシル-acpレダクターゼ
JP7004500B2 (ja) ω-ヒドロキシル化脂肪酸誘導体を生産する方法
JP7458358B2 (ja) 改良された特性を有するω-ヒドロキシラーゼ関連融合ポリペプチドバリアント
US11421206B2 (en) Omega-hydroxylase-related fusion polypeptides with improved properties

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
A107 Divisional application of patent
GRNT Written decision to grant