KR102068678B1 - crtE 또는 crtB 돌연변이 유전자 및 이의 용도 - Google Patents
crtE 또는 crtB 돌연변이 유전자 및 이의 용도 Download PDFInfo
- Publication number
- KR102068678B1 KR102068678B1 KR1020180077788A KR20180077788A KR102068678B1 KR 102068678 B1 KR102068678 B1 KR 102068678B1 KR 1020180077788 A KR1020180077788 A KR 1020180077788A KR 20180077788 A KR20180077788 A KR 20180077788A KR 102068678 B1 KR102068678 B1 KR 102068678B1
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- ala
- ser
- glu
- val
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1085—Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P5/00—Preparation of hydrocarbons or halogenated hydrocarbons
- C12P5/02—Preparation of hydrocarbons or halogenated hydrocarbons acyclic
- C12P5/026—Unsaturated compounds, i.e. alkenes, alkynes or allenes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y205/00—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
- C12Y205/01—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
- C12Y205/01029—Geranylgeranyl diphosphate synthase (2.5.1.29)
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Mycology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 crtE 또는 crtB 돌연변이 유전자 및 이의 용도에 관한 것이다. 본 발명에 따른 서열번호 11로 표시되는 crtE 돌연변이 유전자, 서열번호 15로 표시되는 crtE 돌연변이 유전자 및/또는 서열번호 42로 표시되는 crtB 돌연변이 유전자를 효모 균주에 도입함으로써 라이코펜을 생산하지 않는 미생물에서 라이코펜을 대량 생산할 수 있다.
Description
본 발명은 crtE 또는 crtB 돌연변이 유전자 및 이의 용도에 관한 것이다.
라이코펜은 강한 항산화제로 알려진 카로티노이드계 색소로서, 항산화 효과 및 항암 효과가 뛰어나 건강보조제 등 식품산업, 가축 사료 등 사료 산업, 또는 코스메틱 산업 등 그 활용 분야가 다양하다.
상기 라이코펜은 토마토 등 라이코펜을 함유하고 있는 식물에서 추출하는 방식에 의해 가장 많이 생산되고 있으나, 이러한 방식은 대량 생산에 한계가 있다. 또한, 라이코펜은 식품, 사료 산업에 활용됨에 따라 화학적 합성에 의한 라이코펜 생산은 선호되지 않는다. 따라서, 미생물을 이용한 생물공정에 의한 라이코펜 생산이 각광받고 있다(Han-Kyul Kim, et al., 2015).
최근 생물공정을 통한 라이코펜의 생산은 대장균과 같은 박테리아를 기반으로 많이 진행되고 있다. 그러나, 이들은 대부분 병원성을 가지거나 고농도의 포도당에 대해 내성이 부족하고 내산성이 약하여 산업스케일로 물질을 생산하는 데에는 한계가 있다.
한편, 본 발명에서 사용된 효모 균주인 사카로마이세스 세레비지애(Saccharomyces cerevisiae)는 그라스(GRAS)로 분류된 미생물로서, 식품산업에서의 사용에 있어 안전하다고 판단되며, 앞선 박테리아 기반의 생산에 대해 장점을 갖는다.
Han-Kyul Kim, et al., 2015. Method Development and Analysis of Carotenoid Compositions in Various Tomatoes. Korean Journal of Environmental Agriculture. 34(3): 196-203.
이에, 본 발명자들은 대장균과 같은 박테리아에서 라이코펜을 생산할 때 발생되는 문제점을 해결하기 위해 지속적으로 연구하던 중, crtE 돌연변이 유전자 또는 crtB 돌연변이 유전자를 효모 균주에 도입할 경우, 라이코펜의 다량 생산이 가능함을 확인함으로써 본 발명을 완성하였다.
본 발명의 목적은 crtE 돌연변이 유전자 및 crtB 돌연변이 유전자를 제공하는 것이다. 또한, 상기 유전자가 도입되어 라이코펜 생산능이 향상된 형질전환된 미생물을 제공하는 것이다. 또한, 상기 미생물을 이용한 라이코펜을 생산하는 방법을 제공하는 것이다.
본 발명의 목적은 서열번호 2의 아미노산 서열을 갖는 CrtE에서 136, 155, 258 및 279번째 위치의 아미노산이 다른 아미노산으로 치환된 CrtE 변이체를 제공하는 것이다.
또한, 서열번호 2의 아미노산 서열을 갖는 CrtE에서 86, 121 및 249번째 위치의 아미노산이 다른 아미노산으로 치환된 CrtE 변이체를 제공하는 것이다.
또한, 서열번호 4의 아미노산 서열을 갖는 CrtB에서 287번째 위치의 아미노산이 다른 아미노산으로 치환된 CrtB 변이체를 제공하는 것이다.
또한, 상기 CrtE 변이체 및 상기 CrtB 변이체가 도입된 라이코펜 생산능이 향상된 형질전환된 미생물을 제공하는 것이다.
또한, 형질전환된 미생물을 배양하는 단계; 및 생성된 라이코펜을 회수하는 단계를 포함하는 라이코펜의 생산 방법을 제공하는 것이다.
본 발명에 따른 서열번호 11로 표시되는 crtE 돌연변이 유전자, 서열번호 15로 표시되는 crtE 돌연변이 유전자 및/또는 서열번호 42로 표시되는 crtB 돌연변이 유전자를 효모 균주에 도입함으로써 라이코펜을 생산하지 않는 미생물에서 라이코펜을 대량 생산할 수 있다.
도 1은 본 발명에 따른 돌연변이 유전자 제작 과정을 나타낸 것이다.
도 2a는 crtEM1 및 crtEM18의 crtE에서 돌연변이 위치를 나타낸 것이다.
도 2b는 선별된 crtE 돌연변이 유전자를 포함하는 균주의 생장을 나타낸 것이다.
도 2c 및 도 2d는 선별된 crtE 돌연변이 유전자를 포함하는 균주에서의 라이코펜 생산능을 나타낸 것이다.
도 3a 내지 도 3c는 crtE 돌연변이 유전자 서열 조합에 의한 라이코펜 생산능을 나타낸 것이다
도 4a는 crtBM1의 crtB의 돌연변이 위치를 나타낸 것이다.
도 4b는 선별된 crtB 돌연변이 유전자를 포함하는 균주의 생장을 나타낸 것이다.
도 4c 및 도 4d는 선별된 crtB 돌연변이 유전자를 포함하는 균주에서의 라이코펜 생산능을 나타낸 것이다.
도 5a 내지 도 5c는 선별된 crtBM1 유전자와 이의 돌연변이 M1-1, M1-2 및 M1-3를 포함하는 균주에서의 라이코펜 생산능을 나타낸 것이다.
도 2a는 crtEM1 및 crtEM18의 crtE에서 돌연변이 위치를 나타낸 것이다.
도 2b는 선별된 crtE 돌연변이 유전자를 포함하는 균주의 생장을 나타낸 것이다.
도 2c 및 도 2d는 선별된 crtE 돌연변이 유전자를 포함하는 균주에서의 라이코펜 생산능을 나타낸 것이다.
도 3a 내지 도 3c는 crtE 돌연변이 유전자 서열 조합에 의한 라이코펜 생산능을 나타낸 것이다
도 4a는 crtBM1의 crtB의 돌연변이 위치를 나타낸 것이다.
도 4b는 선별된 crtB 돌연변이 유전자를 포함하는 균주의 생장을 나타낸 것이다.
도 4c 및 도 4d는 선별된 crtB 돌연변이 유전자를 포함하는 균주에서의 라이코펜 생산능을 나타낸 것이다.
도 5a 내지 도 5c는 선별된 crtBM1 유전자와 이의 돌연변이 M1-1, M1-2 및 M1-3를 포함하는 균주에서의 라이코펜 생산능을 나타낸 것이다.
본 발명은 일 측면으로, 서열번호 2의 아미노산 서열을 갖는 CrtE에서 136, 155, 258 및 279번째 위치의 아미노산이 다른 아미노산으로 치환된 CrtE 변이체를 제공한다.
상기 CrtE는 파네실 피로인산(frnesyl pyrophosphate, FPP)에서 제라닐제라닐 피로인산(geranylgeranyl pyrophosphate, GGPP)으로 전환하는 효소일 수 있다. 상기 CrtE는 잔토필로마이세스 덴드로로스(Xanthophyllomyces dendrorhous) 유래일 수 있으나 이에 제한되는 것은 아니다. 또한, 상기 CrtE는 서열번호 2의 아미노산 서열을 갖고, 서열번호 1의 염기서열에 의해 코딩될 수 있다.
상기 CrtE 변이체는 상기 서열번호 2의 아미노산 서열을 갖는 CrtE에서 136번째 위치의 세린, 155번째 위치의 트레오닌, 258번째 위치의 아스파라긴 및 279번째 위치의 히스티딘이 하기 아미노산 중 선택되는 어느 하나의 다른 아미노산으로 치환될 수 있다: 아르기닌(Arg), 히스티딘(His), 리신(Lys), 아스파르트산(Asp), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro) 및 시스테인(Cys). 바람직하게는, 서열번호 2의 136번째 위치의 세린은 트레오닌으로 치환될 수 있으며, 155번째 위치의 트레오닌은 세린으로 치환될 수 있다. 또한, 서열번호 2의 258번째 위치의 아스파라긴은 이소류신으로 치환될 수 있고, 279번째 위치의 히스티딘은 아르기닌으로 치환될 수 있다.
상기 CrtE 변이체는 서열번호 12의 아미노산 서열을 갖는 폴리펩티드일 수 있으며, 서열번호 11의 염기서열에 의해 코딩될 수 있다. 이때, 서열번호 11의 염기서열은 서열번호 1에서 264번째 위치의 구아닌, 406번째 위치의 티민, 463번째 위치의 아데닌, 773번째 위치의 아데닌 및 836번째 위치의 아데닌이 하기 염기 중 선택되는 어느 하나의 다른 염기로 치환될 수 있다: 아데닌(A), 구아닌(G), 사이토신(C) 및 티민(T). 바람직하게는, 서열번호 1의 264 및 406번째 위치의 염기는 아데닌으로 치환될 수 있고, 463 및 773번재 위치의 염기는 티민으로 치환될 수 있으며, 836번째 위치의 염기는 구아닌으로 치환될 수 있다.
또한, 본 발명은 서열번호 2의 아미노산 서열을 갖는 CrtE에서 86, 121 및 249번째 위치의 아미노산이 다른 아미노산으로 치환된 CrtE 변이체를 제공한다.
상기 CrtE 변이체는 상기 서열번호 2의 아미노산 서열을 갖는 CrtE에서 86번째 위치의 세린, 121번째 위치의 이소류신 및 249번째 위치의 아스파라긴이 하기 아미노산 중 선택되는 어느 하나의 다른 아미노산으로 치환될 수 있다: 아르기닌(Arg), 히스티딘(His), 리신(Lys), 아스파르트산(Asp), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro) 및 시스테인(Cys). 바람직하게는, 서열번호 2의 86번째 위치의 세린은 트레오닌으로 치환될 수 있고, 121번째 위치의 이소류신은 발린으로 치환될 수 있으며, 249번째 위치의 아스파라긴은 세린으로 치환될 수 있다.
상기 CrtE 변이체는 서열번호 16의 아미노산 서열을 갖는 폴리펩티드일 수 있으며, 서열번호 15의 염기서열에 의해 코딩될 수 있다. 이때, 서열번호 15의 염기서열은 서열번호 1에서 256번째 위치의 티민, 361번째 위치의 아데닌 및 746번째 위치의 아데닌이 하기 염기 중 선택되는 어느 하나의 다른 염기로 치환될 수 있다. 바람직하게는, 서열번호 1의 256번째 위치의 염기는 아데닌으로 치환될 수 있고, 361 및 746번째 위치의 염기는 구아닌으로 치환될 수 있다.
또한, 본 발명은 서열번호 4의 아미노산 서열을 갖는 CrtB에서 287번째 위치의 아미노산이 다른 아미노산으로 치환된 CrtB 변이체를 제공한다.
상기 CrtB는 제라닐제라닐 피로인산에서 파이토엔(phytoene)으로 전환하는 효소일 수 있다. 상기 CrtB는 판토에아 아글로메란스(Pantoea agglomerans) 유래일 수 있으나 이에 제한되는 것은 아니다. 또한, 상기 CrtB는 서열번호 4의 아미노산 서열을 갖고, 서열번호 3의 염기서열에 의해 코딩될 수 있다.
상기 CrtB 변이체는 상기 서열번호 4의 아미노산 서열을 갖는 CrtB에서 287번째 위치의 글리신이 하기 아미노산 중 선택되는 어느 하나의 다른 아미노산으로 치환될 수 있다: 아르기닌(Arg), 히스티딘(His), 리신(Lys), 아스파르트산(Asp), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro) 및 시스테인(Cys). 바람직하게는, 서열번호 4의 287번째 위치의 글리신은 발린으로 치환될 수 있다.
상기 CrtB 변이체는 서열번호 43의 아미노산 서열을 갖는 폴리펩티드일 수 있으며, 서열번호 42의 염기서열에 의해 코딩될 수 있다. 이때, 서열번호 42의 염기서열은 서열번호 3에서 16번째 위치의 사이토신, 616번째 위치의 사이토신 및 860번째 위치의 구아닌이 하기 염기 중 선택되는 어느 하나의 다른 염기로 치환될 수 있다: 아데닌(A), 구아닌(G), 사이토신(C) 및 티민(T). 바람직하게는, 서열번호 3의 16 및 860번째 위치의 염기는 티민으로 치환될 수 있고, 616번째 위치의 염기는 아데닌으로 치환될 수 있다.
본 발명은 다른 측면으로, 서열번호 12 또는 서열번호 16의 아미노산 서열을 갖는 CrtE 변이체를 코딩하는 유전자가 도입된 라이코펜 생산능이 향상된 형질전환된 미생물을 제공한다. 이때, 상기 서열번호 12의 아미노산 서열을 갖는 CrtE 변이체는 서열번호 11의 염기서열에 의해 코딩될 수 있고, 상기 서열번호 16의 아미노산 서열을 갖는 CrtE 변이체는 서열번호 15의 염기서열에 의해 코딩될 수 있다.
상기 미생물에는 서열번호 4 또는 서열번호 43의 아미노산 서열을 갖는 CrtB를 코딩하는 유전자 및 서열번호 6의 아미노산 서열을 갖는 CrtI를 코딩하는 유전자가 도입될 수 있다. 이때, 상기 서열번호 6의 아미노산 서열을 갖는 CrtI는 서열번호 5의 염기서열에 의해 코딩될 수 있다.
본 발명의 일 실시예에서는, 선별된 돌연변이 유전자 crtEM1(서열번호 11), crtEM3(서열번호 13) 및 crtEM18(서열번호 15)를 균주에 도입하였다. 그 결과, 서열번호 2의 아미노산 서열을 갖는 CrtE에서 136, 155, 258 및 279번째 위치의 아미노산이 치환된 변이체 CrtEM1(서열번호 12)와 86, 121 및 249번째 위치의 아미노산이 치환된 변이체 CrtEM18(서열번호 16)에서 가장 높은 라이코펜 생산량을 나타내었다. 이를 통해, 라이코펜 생산능이 향상된 형질전환된 미생물을 수득하였다.
또한, 본 발명은 서열번호 43의 아미노산 서열을 갖는 CrtB 변이체를 코딩하는 유전자가 도입된 라이코펜 생산능이 향상된 형질전환된 미생물을 제공한다. 이때, 상기 서열번호 43의 아미노산 서열을 갖는 CrtB 변이체는 서열번호 42의 염기서열에 의해 코딩될 수 있다.
상기 미생물에는 서열번호 2, 서열번호 12 또는 서열번호 16의 아미노산 서열을 갖는 CrtE를 코딩하는 유전자 및 서열번호 6의 아미노산 서열을 갖는 CrtI를 코딩하는 유전자가 도입될 수 있다.
본 발명의 일 실시예에서는, 선별된 돌연변이 유전자 crtBM1(서열번호 42), crtBM1-1(서열번호 44), crtBM1 -2(서열번호 46) 및 crtBM1 - 3(서열번호 48)를 균주에 도입하였다. 그 결과, 서열번호 4의 아미노산 서열을 갖는 CrtB에서 287번째 위치의 아미노산이 다른 아미노산으로 치환된 변이체 CrtBM1(서열번호 43)에서 가장 높은 라이코펜 생산량을 나타내었다. 이를 통해, 라이코펜 생산능이 향상된 형질전환된 미생물을 수득하였다.
본 명세서 사용한 용어, "라이코펜 생산능이 향상된 형질전환된 미생물"은 본 발명의 목적상 라이코펜을 과량 생산할 수 있도록 형질전환된 미생물을 의미한다. 상기 미생물의 일 구체예로는 자이모모나스(Zymomonas), 에스케리키아(Escherichia), 슈도모나스(Pseudomonas), 알칼리제네스(Alcaligenes), 살모넬라(Salmonella), 시겔라(Shigella), 버크홀데리아(Burkholderia), 올리고트로파(Oligotropha), 클렙시엘라(Klebsiella), 피치아(Pichia), 칸디아(Candida), 한세눌라(Hansenula), 사카로마이세스(Saccharomyces), 또는 클루이베로마이세스(Kluyveromyces) 속에 속하는 미생물일 수 있다. 바람직하게, 상기 라이코펜 생산능이 향상된 형질전환된 미생물은 사카로마이세스 세레비지애일 수 있다.
상기 형질전환은 라이코펜 과량 생산에 적합하도록 미생물 내의 유전자를 불활성화시키거나, 새로운 유전자가 도입된 것일 수 있다. 이때, 유전자를 불활성화시키는 방법은 목적 유전자의 일부 또는 전부 결손, 유전자의 일부를 치환하거나 유전자의 외부 핵산을 도입한 것일 수 있다. 변형대상이 되는 유전자는 미생물의 물질대사 경로에 작용하는 효소일 수 있다.
본 명세서에서 사용한 용어, "형질전환"은 표적 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 숙주세포 내에 도입하여 숙주세포 내에서 상기 폴리뉴클레오티드가 코딩하는 단백질이 발현할 수 있도록 하는 것을 의미한다. 상기 폴리뉴클레오티드는 숙주세포 내로 도입되어 발현될 수 있는 것이면, 어떠한 형태로 도입되는 것이든 상관없다. 예를 들면, 상기 폴리뉴클레오티드는, 자체적으로 발현되는데 필요한 모든 요소를 포함하는 유전자 구조체인 발현 카세트(expression cassette)의 형태로 숙주세포에 도입될 수 있다. 상기 발현 카세트는 통상 상기 폴리뉴클레오티드에 작동 가능하게 연결되어 있는 프로모터(promoter), 전사 종결신호, 리보좀 결합부위 및 번역 종결신호를 포함한다. 상기 발현 카세트는 자체 복제가 가능한 발현벡터 형태일 수 있다. 또한, 상기 폴리뉴클레오티드는 그 자체의 형태로 숙주세포에 도입되어, 숙주세포에서 발현에 필요한 서열과 작동 가능하게 연결되어 있는 것일 수도 있다.
또한, 상기에서 용어 "작동 가능하게 연결"된 것이란, 본 발명의 목적 단백질을 코딩하는 폴리뉴클레오티드의 전사를 개시 및 매개하도록 하는 프로모터 서열과 상기 유전자 서열이 기능적으로 연결되어 있는 것을 의미한다.
본 발명은 또 다른 측면으로, 형질전환된 미생물을 배양하는 단계; 및 생성된 라이코펜을 회수하는 단계를 포함하는 라이코펜의 생산 방법을 제공한다.
상기 형질전환된 미생물은 서열번호 12 또는 서열번호 16의 아미노산 서열을 갖는 CrtE 변이체를 코딩하는 유전자가 도입된 라이코펜 생산능이 향상된 형질전환된 균주일 수 있다. 이때, 상기 미생물은 서열번호 4 또는 서열번호 43의 아미노산 서열을 갖는 CrtB를 코딩하는 유전자 및 서열번호 6의 아미노산 서열을 갖는 CrtI를 코딩하는 유전자가 추가적으로 도입될 수 있다.
또한, 상기 형질전환된 미생물은 서열번호 43의 아미노산 서열을 갖는 CrtB 변이체를 코딩하는 유전자가 도입된 라이코펜 생산능이 향상된 형질전환된 균주일 수 있다. 이때, 상기 미생물은 서열번호 2, 서열번호 12 또는 서열번호 16의 아미노산 서열을 갖는 CrtE를 코딩하는 유전자, 및 서열번호 6의 아미노산 서열을 갖는 CrtI를 코딩하는 유전자가 추가적으로 도입될 수 있다.
또한, 상기 형질전환된 미생물은 crtE, crtB, crtI 및 tHMG1 유전자가 도입된 균주일 수 있고, OLE1 유전자가 추가적으로 도입된 균주일 수 있으며, DPP1 및 LPP1 유전자가 결손된 추가적으로 결손된 균주일 수 있다.
상기 tHMG1은 메발로네이트 경로(Mevalonate pathway)의 율속단계 효소인 HMG1의 돌연변이일 수 있으며, 아세틸보조효소 A(acetyl-CoA)에서 메발론산염(mevalonate)으로 전환하는 효소일 수 있다. 상기 tHMG1은 서열번호 51의 아미노산 서열을 갖는 폴리펩티드일 수 있으며, 서열번호 50의 염기서열에 의해 코딩될 수 있다.
상기 OLE1은 단일불포화지방산을 증가시키는 델타지방산불포화 효소일 수 있다. 이때, OLE1 과발현 플라스미드의 형태로 미생물에 도입될 수 있다. 상기 OLE1은 서열번호 53의 아미노산 서열을 갖는 폴리펩티드일 수 있으며, 서열번호 52의 염기서열에 의해 코딩될 수 있다.
또한, 상기 DPP1 및 LPP1은 파네솔(farnesol) 합성에 관여하는 유전자로서, 본 발명에서는 라이코펜 생산에 있어 경쟁대사산물인 파네솔의 합성 경로를 차단하기 위하여 상기 DPP1 및 LPP1 유전자를 미생물에서 결손시킬 수 있다.
또한, 상기 LDH1은 지질체 가수분해효소로서, 본 발명은 형질전환된 미생물에 의해 생산된 라이코펜의 축적 가능한 지질체를 증가시키기 위하여 상기 LDH1을 코딩하는 유전자의 활성을 억제시킬 수 있다. 상기 억제는 유전자의 치환, 첨가 또는 결실을 통해 수행될 수 있다.
본 발명의 미생물의 배양에 사용되는 배지 및 기타 배양 조건은 통상의 사카로마이세스 속 미생물의 배양에 사용되는 배지라면 특별한 제한 없이 어느 것이나 사용할 수 있으나, 구체적으로는 본 발명의 미생물을 적당한 탄소원, 질소원, 인원, 무기화합물, 아미노산 및/또는 비타민 등을 함유한 통상의 배지 내에서 호기성 조건 하에서 온도, pH 등을 조절하면서 배양할 수 있다.
탄소원의 예로는 수크로오스 또는 글루코오스가 포함될 수 있고, 수크로오스를 다량으로 포함한 당밀 또한 탄소원으로 이용될 수 있으며, 그 외의 적적량의 탄소원이 다양하게 이용될 수 있다.
질소원의 예로는 펩톤, 효모 추출물, 육즙, 맥아 추출물, 옥수수 침지액, 및 대두밀과 같은 유기 질소원 및 요소, 황산암모늄, 염화암모늄, 인산암모늄, 탄산안모늄, 및 질산암모늄과 같은 무기질소원이 포함될 수 있다. 이들 질소원은 단독 또는 조합되어 사용될 수 있다. 상기 배지에는 인원으로서 인산이수소칼륨, 인산수소이칼륨 및 대응되는 소듐-함유 염이 포함될 수 있다. 또한, 황산마그네슘 또는 황산 철과 같은 금속염을 포함할 수 있다. 그 외에 아미노산, 비타민 및 적절한 전구체 등이 포함될 수 있다.
배양 중에 수산화암모늄, 수산화칼륨, 암모니아, 인산 및 황산과 같은 화합물을 배양물에 적절한 방식으로 첨가하여, 배양물의 pH를 조정할 수 있다. 또한 배양 중에는 지방산 폴리클리콜 에스테르와 같은 소포제를 사용하여 기포 생성을 억제할 수 있다. 또한 배양물의 호기 상태를 유지하기 위하여, 배양물 내로 산소 또는 산소 함유 기체를 주입하거나 혐기 및 미호기 상태를 유지하기 위해 기체의 주입 없이 혹은 질소, 수소 또는 이산화탄소 가스를 주입할 수 있다.
본 발명에서 사용한 용어, "배양"은 미생물을 적당히 인공적으로 조절한 환경조건에서 생육시키는 것을 의미한다. 본 발명에서 미생물을 배양하는 방법은 당업계에 널리 알려져 있는 방법을 이용하여 수행할 수 있다.
상기 배양은 0℃ 내지 40℃, 5℃ 내지 38℃, 10℃ 내지 36℃, 20℃ 내지 30℃, 바람직하게는 25℃ 내지 30℃의 온도에서 수행될 수 있다.
본 명세서에서 사용한 용어, "Error-prone PCR"은 특정 유전자의 염기서열을 PCR로 증폭시킬 때 생길 수 있는 점 돌연변이(point mutation)를 인위적으로 많이 일으킴으로써 특정 단백질의 아미노산 서열을 무작위로 변경시키는 돌연변이 기법이다. 즉, 유전자를 PCR로 증폭시킬 때 DNA 복제의 정확도가 낮아져서 일부 위치에서 돌연변이가 일어나는 것을 이용하는 것이다.
본 발명에서, 배양은 SC(synthetic complete) 배지에서 수행될 수 있다. 상기 배지는 1 g/L 내지 50 g/L, 5 g/L 내지 45 g/L, 10 g/L 내지 30 g/L, 바람직하게는 10 g/L 내지 40 g/L의 포도당을 포함할 수 있다. 본 발명의 일 실시예에서는, 20 g/L의 포도당을 포함하는 SC-Ura 배지에서 crtE 또는 crtB 돌연변이 유전자를 포함하는 균주를 배양하였다.
본 발명의 라이코펜을 생산하는 방법은, 상기 미생물의 배양에 따른 배지 또는 상기 미생물로부터 라이코펜을 회수하는 단계를 포함할 수 있다. 미생물 또는 배지로부터 라이코펜을 회수하는 방법은 당업계에 알려진 방법, 예컨대 원심분리, 여과, 음이온 교환 크로마토그래피, 결정화 및 HPLC 등이 사용될 수 있으나, 이들 예에 한정되는 것은 아니다.
이하, 본 발명을 하기 실시예에 의하여 더욱 상세하게 설명한다. 단, 하기 실시예는 본 발명을 예시하기 위한 것일 뿐, 본 발명의 범위가 이들만으로 한정되는 것은 아니다.
실시예
1. 돌연변이 유전자 제작 및 선별
돌연변이 목적 유전자인 파이토엔 합성 효소 crtB 및 GGPP 합성 효소 crtE를 각각 p414GPD, p415GPD 플라스미드의 다중 제한효소 클로닝 부위(multi cloning site, MCS)에 클로닝하여 p414GPD-crtB 및 p415GPD-crtE를 제작하였다. 이후, P TDH3 (서열번호 7)의 마지막 서열 40mer와 T CYC1 (서열번호 9)의 앞쪽 서열 40mer에 해당하는 프라이머를 각각 Forward 프라이머(서열번호 8)와 Reverse 프라이머(서열번호 10)로 제작하였다.
상기 플라스미드 및 프라이머를 가지고 Error-prone PCR을 수행하였고, 그 결과를 하기 표 1에 나타내었다.
Template | 1 ㎕ |
Forward primer | 2 ㎕ |
Reverse primer | 2 ㎕ |
10× buffer for Taq(Biofact) | 5 ㎕ |
dNTP | 1 ㎕ |
5 mM MgCl2 | 5 ㎕ |
5 mM MnCl2 | 5 ㎕ |
Taq polymerase(Biofact) | 0.5 ㎕ |
3DW | 28.5 ㎕ |
Total | 50 ㎕ |
p416GPD에 제한효소인 BamHI 및 XhoI를 1시간 동안 처리한 후, 80℃에서 5분 동안 보관하여 효소를 불활성화하였고 이를 얼음에서 식혔다. 리튬 아세테이트(LioAC)/폴리에틸렌글라이콜(PEG) 방법을 이용하여, 상기 제한효소를 처리한 결과물과 PCR 결과물을 함께 효모 균주인 사카로마이세스 세레비지애에 도입한 후, 이를 SC-Ura 고체 배지에 도말하였다. 이때, crtE를 돌연변이 목적 유전자로 하는 경우 crtB와 crtI가 유전체에 삽입된 효모 균주[CENΔΔBI]를 사용하였고, crtB를 돌연변이 목적 유전자로 하는 경우 crtE와 crtI가 유전체에 삽입된 효모 균주[CENΔΔEI]를 사용하였다. 상기 균주를 30℃ 인큐베이터에서 키워 생성된 가장 붉은색을 보이는 콜로니를 육안으로 우선 선별하였다. 이후, 상기 선별된 콜로니를 새로운 SC-Ura 고체 배지에서 자라게 하였다.
50 ml 플라스크에 존재하는 5 ml의 SC-Ura 액체 배지에 선별된 콜로니를 1차 접종하여 24시간 동안 배양하엿다. 이후, 초기접종 농도 O.D600=0.2가 되었을 때, 100 ml의 플라스크에 존재하는 10 ml의 SC-Ura 배지에 2차 접종하였다. 이후, 24시간마다 O.D600을 측정하였고, 120시간이 지났을 때 마지막으로 O.D600 측정과 함께 2배수로 4 ml씩 샘플링하여 세트 1 및 세트 2를 제조하였다. 상기 제조된 세트를 측정시까지 -80℃에서 보관하였다.
샘플 세트 1은 1 ml의 3차 증류수로 세척하여 60℃의 오븐에서 3일 동안 건조시킨 후 세포건조무게를 측정하였다. 샘플 세트 2는 1 ml의 3차수로 세척하여 1 ml의 3N HCl로 재현탁한 후 5분 동안 끓이고 얼음에서 식혔다. 이를 원심분리하여 상층액을 제거한 후, 1 ml의 아세톤에 볼텍싱(vortexing)하여 라이코펜을 추출하고 다시 원심분리하였다. 아세톤에 녹아 있는 라이코펜은 분광광도계를 이용하여 470 nm에서 측정하였고, Standard와 비교측정하였다. Zymoprep. kit(ZYMORESEARCH)를 이용하여 높은 라이코펜 생산량을 보인 콜로니에서 라이코펜 생산을 위한 효소 활성이 증대된 목적 유전자가 포함된 플라스미드를 분리하였다. crtB 및 crtE 돌연변이 유전자를 시퀀싱(sequencing)하여 유전자 정보 서열을 수득하였다. 각 돌연변이 유전자의 변화가 있는 서열만을 조합하여 새로운 돌연변이를 제작하고, 이들의 라이코펜 생산량을 확인하여 최종적으로 선별하였다. 상기 돌연변이 유전자 제작 과정은 도 1에 나타내었다.
실험예
1.
crtE
돌연변이 유전자의
라이코펜
생산능
확인
1.1.
crtE
방향 진화
crtE의 육안으로 선별된 M1, M3, M5, M15 및 M18 돌연변이 유전자가 포함된 플라스미드를 crtE 돌연변이 선별용 균주[CENΔΔBI]에 도입하였다. 상기 균주를 20g/L의 포도당을 포함하는 SC-Ura 배지에서 배양하여 라이코펜 추출하였다. 그 결과를 도 2a 내지 도 2d에 나타내었다.
도 2a 내지 도 2d에 나타나는 바와 같이, 5개의 돌연변이 중 crtEM1을 포함하는 균주가 22.78 mg/L(5.37 mg/g DCW), crtEM18을 포함하는 균주가 33.18 mg/L(8.28 mg/g DCW)의 라이코펜 생산량을 보였다. 이는 야생형 유전자에 비해 각각 약 1.7배 및 2.5배 증가한 것이다. Zymoprep. kit를 이용하여 상기 두 균주에서 플라스미드를 수득하였고, 이를 시퀀싱하여 돌연변이를 도 2a와 같이 확인하였다.
1.2.
crtE
라이코펜
생산성 향상에 특이적인 유전서열 확인
crtEM1 돌연변이 서열은 순서대로 M1-1, M1-2, M1-3, M1-4 및 M1-5로 명명하였고, crtEM18의 돌연변이 서열은 순서대로 M18-1, M18-2 및 M18-3으로 명명하였다. crtEM18의 세 가지 돌연변이 서열에 대한 overlap PCR 프라이머를 제작하였고, 이에 해당하는 염기서열을 서열번호 31 내지 36에 나타내었다. 이를 바탕으로 라이코펜 생산 증가에 관여하는 특정 돌연변이 서열을 확인하고자 여러 돌연변이 서열의 조합을 만들었고 이를 하기 표 2에 나타내었다.
mutant | Mutation on gene | Mutation on protein |
crtEM1 | M1-1 : G264A (GTG→GTA) M1-2 : T406A (TCC→ACC) M1-3 : A463T (ACT→TCT) M1-4 : A773T(AAT→ATT) M1-5 : A836G (CAT→CGT) |
M1-1 : 88 Val→Val M1-2 : 136 Ser→Thr M1-3 : 155 Thr→Ser M1-4 : 258 Asn→Ile M1-5 : 279 His→Arg |
crtEM3 | G1005T | 335 Arg→Ser |
crtEM18 | M18-1: T256A (TCG→ACG) M18-2: A361G (ATA→GTA) M18-3: A746G (AAC→AGC) |
86 Ser→Thr 121 Ile→Val 249 Asn→Ser |
crtEMA1 | T256A (TCG→ACG) G264A (GTG→GTA) T406A (TCC→ACC) A463T (ACT→TCT) A773T(AAT→ATT) A836G (CAT→CGT) |
86 Ser→Thr 88 Val→Val 136 Ser→Thr 155 Thr→Ser 258 Asn→Ile 279 His→Arg |
crtEMA2 | A361G (ATA→GTA) G264A (GTG→GTA) T406A (TCC→ACC) A463T (ACT→TCT) A773T(AAT→ATT) A836G (CAT→CGT) |
121 Ile→Val 88 Val→Val 136 Ser→Thr 155 Thr→Ser 258 Asn→Ile 279 His→Arg |
crtEMA3 | A746G (AAC→AGC) G264A (GTG→GTA) T406A (TCC→ACC) A463T (ACT→TCT) A773T(AAT→ATT) A836G (CAT→CGT) |
249 Asn→Ser 88 Val→Val 136 Ser→Thr 155 Thr→Ser 258 Asn→Ile 279 His→Arg |
crtEMB1 | G264A (GTG→GTA) A361G (ATA→GTA) A746G (AAC→AGC) |
88 Val→Val 121 Ile→Val 249 Asn→Ser |
crtEMB2 | T406A (TCC→ACC) A463T (ACT→TCT) A361G (ATA→GTA) A746G (AAC→AGC) |
136 Ser→Thr 155 Thr→Ser 121 Ile→Val 249 Asn→Ser |
crtEMB3 | A773T(AAT→ATT) A836G (CAT→CGT) A361G (ATA→GTA) A746G (AAC→AGC) |
258 Asn→Ile 279 His→Arg 121 Ile→Val 249 Asn→Ser |
crtEMC | G264A (GTG→GTA) T406A (TCC→ACC) A463T (ACT→TCT) A773T(AAT→ATT) A836G (CAT→CGT) T256A (TCG→ACG) A361G (ATA→GTA) A746G (AAC→AGC) |
88 Val→Val 136 Ser→Thr 155 Thr→Ser 258 Asn→Ile 279 His→Arg 86 Ser→Thr 121 Ile→Val 249 Asn→Ser |
crtBM1 | C16T (CTG→TTG) C616A (CGG→AGG) G860T (GGG→GTG) |
6 Leu→Leu 216 Arg→Arg 287 Gly→Val |
crtBM1 -1 | C16T (CTG→TTG) | 6 Leu→Leu |
crtBM1 -2 | C616A (CGG→AGG) | 216 Arg→Arg |
crtBM1 -3 | G860T (GGG→GTG) | 287 Gly→Val |
이를 모두 적당한 주형과 프라이머(서열번호 31 내지 36)로 PCR을 수행하여 절편을 만들고, 이를 overlap PCR 후 BamHI 및 SalI로 잘라 p416GPD(URA3, P TDH3 , T CYC1 를 포함하는 플라스미드, Mumberg et al., 1995)에 클로닝 하였다. 이후, 상기 제조된 플라스미드를 균주[CENΔΔBI]에 도입하였다. 각 돌연변이를 포함하는 균주를 3배수로 SC-Ura 배지에서 배양하였다. 그 결과를 도 3a 내지 도 3c에 나타내었다.
도 3a 내지 도 3c에 나타난 바와 같이, crtEMB2가 38.44 mg/L(8.74 mg/g DCW)로 가장 많은 라이코펜을 생산하였다. 이는 야생형 crtE에 비해 약 2.9배의 생산량이 증가한 것이다.
실험예
2.
crtB
돌연변이 유전자의
라이코펜
생산능
확인
2.1.
crtB
방향 진화
crtB의 돌연변이 유전자를 포함한 균주에서 육안으로 선별된 M1, M2, M3, M4, M5, M6 및 M7 유전자가 포함된 플라스미드를 crtB 돌연변이 선별용 균주[CENΔΔEI]에 도입하였다. 상기 균주를 20g/L의 포도당을 포함하는 SC-Ura 배지에서 배양하여 라이코펜을 추출하였다. 그 결과를 도 4a 내지 도 4d에 나타내었다.
도 4a 내지 도 4d에 나타난 바와 같이, 7개의 돌연변이 중 crtBM1을 포함하는 균주가 45.16 mg/L(12.8 mg/g DCW)로 가장 많은 라이코펜을 생산하였다. 이는 야생형에 비해 생산량이 약 1.5배 증가한 것이다. Zymoprep. kit를 이용하여 M1만 시퀀싱한 결과 돌연변이를 도 4a와 같이 확인하였다.
2.2.
crtBM1
라이코펜
생산성 향상에 특이적인 유전서열 확인
M1 돌연변이 서열을 순서대로 M1-1, M1-2 및 M1-3으로 명명하였다. 상기 3개의 M1 돌연변이 서열에 대한 overlap PCR 프라이머를 제작하였고, 이에 해당하는 염기서열을 서열번호 37 내지 41에 나타내었다. 이를 바탕으로 라이코펜 생산 증가에 관여하는 특정 돌연변이 서열을 확인하기 위해, 각 돌연변이 서열이 하나씩만 들어간 돌연변이 유전자를 overlap PCR을 이용하여 제작하였다. 이를 EcoRI 및 XhoI으로 잘라 p416GPD 플라스미드에 클로닝하였다. 각각의 플라스미드를 효모 균주[CENΔΔEI]에 도입하였다. 20g/L의 포도당을 포함하는 SC-Ura 배지에서 배양하여 라이코펜 생산량을 확인하였다. 그 결과를 도 5a 내지 도 5c에 나타내었다.
도 5a 내지 도 5c에 나타난 바와 같이, 3개의 돌연변이 유전자 중 M1-3만이 50.66 mg/L(14.11 mg/g DCW)로 crtBM1과 비슷한 라이코펜 생산량을 보였다. 또한, M1-1 및 M1-2는 야생형 crtB 유전자를 포함하는 경우와 비슷한 라이코펜 생산량을 보였다. crtBM1을 포함한 균주에서 가장 많은 라이코펜을 생산하였으므로 crtBM1을 최종적인 돌연변이 유전자로 선별하였다.
<110> Seoul National University R&DB Foundation
<120> MUTANT GENES crtE OR crtB, AND USE THEREOF
<130> FPD/201710-0009
<160> 53
<170> KoPatentIn 3.0
<210> 1
<211> 1131
<212> DNA
<213> Artificial Sequence
<220>
<223> crtE nucleic acid sequence
<400> 1
atggattacg cgaacatcct cacagcaatt ccactcgagt ttactcctca ggatgatatc 60
gtgctccttg aaccgtatca ctacctagga aagaaccctg gaaaagaaat tcgatcacaa 120
ctcatcgagg ctttcaacta ttggttggat gtcaagaagg aggatctcga ggtcatccag 180
aacgttgttg gcatgctaca taccgctagc ttattaatgg acgatgtgga ggattcatcg 240
gtcctcaggc gtgggtcgcc tgtggcccat ctaatttacg ggattccgca gacaataaac 300
actgcaaact acgtctactt tctggcttat caagagatct tcaagcttcg cccaacaccg 360
atacccatgc ctgtaattcc tccttcatct gcttcgcttc aatcatccgt ctcctctgca 420
tcctcctcct cctcggcctc gtctgaaaac gggggcacgt caactcctaa ttcgcagatt 480
ccgttctcga aagatacgta tcttgataaa gtgatcacag acgagatgct ttccctccat 540
agagggcaag gcctggagct attctggaga gatagtctga cgtgtcctag cgaagaggaa 600
tatgtgaaaa tggttcttgg aaagacggga ggtttgttcc gtatagcggt cagattgatg 660
atggcaaagt cagaatgtga catagacttt gtccagcttg tcaacttgat ctcaatatac 720
ttccagatca gggatgacta tatgaacctt cagtcttctg agtatgccca taataagaat 780
tttgcagagg acctcacaga aggaaaattc agttttccca ctatccactc gattcatgcc 840
aacccctcat cgagactcgt catcaatacg ttgcagaaga aatcgacctc tcctgagatc 900
cttcaccact gtgtaaacta catgcgcaca gaaacccact cattcgaata tactcaggaa 960
gtcctcaaca ccttgtcagg tgcactcgag agagaactag gaaggcttca aggagagttc 1020
gcagaagcta actcaaagat tgatcttgga gacgtagagt cggaaggaag aacggggaag 1080
aacgtcaaat tggaagcgat cctgaaaaag ctagccgata tccctctgtg a 1131
<210> 2
<211> 376
<212> PRT
<213> Artificial Sequence
<220>
<223> crtE amino acid sequence
<400> 2
Met Asp Tyr Ala Asn Ile Leu Thr Ala Ile Pro Leu Glu Phe Thr Pro
1 5 10 15
Gln Asp Asp Ile Val Leu Leu Glu Pro Tyr His Tyr Leu Gly Lys Asn
20 25 30
Pro Gly Lys Glu Ile Arg Ser Gln Leu Ile Glu Ala Phe Asn Tyr Trp
35 40 45
Leu Asp Val Lys Lys Glu Asp Leu Glu Val Ile Gln Asn Val Val Gly
50 55 60
Met Leu His Thr Ala Ser Leu Leu Met Asp Asp Val Glu Asp Ser Ser
65 70 75 80
Val Leu Arg Arg Gly Ser Pro Val Ala His Leu Ile Tyr Gly Ile Pro
85 90 95
Gln Thr Ile Asn Thr Ala Asn Tyr Val Tyr Phe Leu Ala Tyr Gln Glu
100 105 110
Ile Phe Lys Leu Arg Pro Thr Pro Ile Pro Met Pro Val Ile Pro Pro
115 120 125
Ser Ser Ala Ser Leu Gln Ser Ser Val Ser Ser Ala Ser Ser Ser Ser
130 135 140
Ser Ala Ser Ser Glu Asn Gly Gly Thr Ser Thr Pro Asn Ser Gln Ile
145 150 155 160
Pro Phe Ser Lys Asp Thr Tyr Leu Asp Lys Val Ile Thr Asp Glu Met
165 170 175
Leu Ser Leu His Arg Gly Gln Gly Leu Glu Leu Phe Trp Arg Asp Ser
180 185 190
Leu Thr Cys Pro Ser Glu Glu Glu Tyr Val Lys Met Val Leu Gly Lys
195 200 205
Thr Gly Gly Leu Phe Arg Ile Ala Val Arg Leu Met Met Ala Lys Ser
210 215 220
Glu Cys Asp Ile Asp Phe Val Gln Leu Val Asn Leu Ile Ser Ile Tyr
225 230 235 240
Phe Gln Ile Arg Asp Asp Tyr Met Asn Leu Gln Ser Ser Glu Tyr Ala
245 250 255
His Asn Lys Asn Phe Ala Glu Asp Leu Thr Glu Gly Lys Phe Ser Phe
260 265 270
Pro Thr Ile His Ser Ile His Ala Asn Pro Ser Ser Arg Leu Val Ile
275 280 285
Asn Thr Leu Gln Lys Lys Ser Thr Ser Pro Glu Ile Leu His His Cys
290 295 300
Val Asn Tyr Met Arg Thr Glu Thr His Ser Phe Glu Tyr Thr Gln Glu
305 310 315 320
Val Leu Asn Thr Leu Ser Gly Ala Leu Glu Arg Glu Leu Gly Arg Leu
325 330 335
Gln Gly Glu Phe Ala Glu Ala Asn Ser Lys Ile Asp Leu Gly Asp Val
340 345 350
Glu Ser Glu Gly Arg Thr Gly Lys Asn Val Lys Leu Glu Ala Ile Leu
355 360 365
Lys Lys Leu Ala Asp Ile Pro Leu
370 375
<210> 3
<211> 930
<212> DNA
<213> Artificial Sequence
<220>
<223> crtB nucleic acid sequence
<400> 3
atgagccaac cgccgctgct tgaccacgcc acgcagacca tggccaacgg ctcgaaaagt 60
tttgccaccg ctgcgaagct gttcgacccg gccacccgcc gtagcgtgct gatgctctac 120
acctggtgcc gccactgcga tgacgtcatt gacgaccaga cccacggctt cgccagcgag 180
gccgcggcgg aggaggaggc cacccagcgc ctggcccggc tgcgcacgct gaccctggcg 240
gcgtttgaag gggccgagat gcaggatccg gccttcgctg cctttcagga ggtggcgctg 300
acccacggta ttacgccccg catggcgctc gatcacctcg acggctttgc gatggacgtg 360
gctcagaccc gctatgtcac ctttgaggat acgctgcgct actgctatca cgtggcgggc 420
gtggtgggtc tgatgatggc cagggtgatg ggcgtgcggg atgagcgggt gctggatcgc 480
gcctgcgatc tggggctggc cttccagctg acgaatatcg cccgggatat tattgacgat 540
gcggctattg accgctgcta tctgcccgcc gagtggctgc aggatgccgg gctgaccccg 600
gagaactatg ccgcgcggga gaatcgggcc gcgctggcgc gggtggcgga gcggcttatt 660
gatgccgcag agccgtacta catctcctcc caggccgggc tacacgatct gccgccgcgc 720
tgcgcctggg cgatcgccac cgcccgcagc gtctaccggg agatcggtat taaggtaaaa 780
gcggcgggag gcagcgcctg ggatcgccgc cagcacacca gcaaaggtga aaaaattgcc 840
atgctgatgg cggcaccggg gcaggttatt cgggcgaaga cgacgagggt gacgccgcgt 900
ccggccggtc tttggcagcg tcccgtttag 930
<210> 4
<211> 309
<212> PRT
<213> Artificial Sequence
<220>
<223> crtB amino acid sequence
<400> 4
Met Ser Gln Pro Pro Leu Leu Asp His Ala Thr Gln Thr Met Ala Asn
1 5 10 15
Gly Ser Lys Ser Phe Ala Thr Ala Ala Lys Leu Phe Asp Pro Ala Thr
20 25 30
Arg Arg Ser Val Leu Met Leu Tyr Thr Trp Cys Arg His Cys Asp Asp
35 40 45
Val Ile Asp Asp Gln Thr His Gly Phe Ala Ser Glu Ala Ala Ala Glu
50 55 60
Glu Glu Ala Thr Gln Arg Leu Ala Arg Leu Arg Thr Leu Thr Leu Ala
65 70 75 80
Ala Phe Glu Gly Ala Glu Met Gln Asp Pro Ala Phe Ala Ala Phe Gln
85 90 95
Glu Val Ala Leu Thr His Gly Ile Thr Pro Arg Met Ala Leu Asp His
100 105 110
Leu Asp Gly Phe Ala Met Asp Val Ala Gln Thr Arg Tyr Val Thr Phe
115 120 125
Glu Asp Thr Leu Arg Tyr Cys Tyr His Val Ala Gly Val Val Gly Leu
130 135 140
Met Met Ala Arg Val Met Gly Val Arg Asp Glu Arg Val Leu Asp Arg
145 150 155 160
Ala Cys Asp Leu Gly Leu Ala Phe Gln Leu Thr Asn Ile Ala Arg Asp
165 170 175
Ile Ile Asp Asp Ala Ala Ile Asp Arg Cys Tyr Leu Pro Ala Glu Trp
180 185 190
Leu Gln Asp Ala Gly Leu Thr Pro Glu Asn Tyr Ala Ala Arg Glu Asn
195 200 205
Arg Ala Ala Leu Ala Arg Val Ala Glu Arg Leu Ile Asp Ala Ala Glu
210 215 220
Pro Tyr Tyr Ile Ser Ser Gln Ala Gly Leu His Asp Leu Pro Pro Arg
225 230 235 240
Cys Ala Trp Ala Ile Ala Thr Ala Arg Ser Val Tyr Arg Glu Ile Gly
245 250 255
Ile Lys Val Lys Ala Ala Gly Gly Ser Ala Trp Asp Arg Arg Gln His
260 265 270
Thr Ser Lys Gly Glu Lys Ile Ala Met Leu Met Ala Ala Pro Gly Gln
275 280 285
Val Ile Arg Ala Lys Thr Thr Arg Val Thr Pro Arg Pro Ala Gly Leu
290 295 300
Trp Gln Arg Pro Val
305
<210> 5
<211> 1749
<212> DNA
<213> Artificial Sequence
<220>
<223> crtI nucleic acid sequence
<400> 5
atgggaaaag aacaagatca ggataaaccc acagctatca tcgtgggatg tggtatcggt 60
ggaatcgcca ctgccgctcg tcttgctaaa gaaggtttcc aggtcacggt gttcgagaag 120
aacgactact ccggaggtcg atgctcttta atcgagcgag atggttatcg attcgatcag 180
gggcccagtt tgctgctctt gccagatctc ttcaagcaga cattcgaaga tttgggagag 240
aagatggaag attgggtcga tctcatcaag tgtgaaccca actatgtttg ccacttccac 300
gatgaagaga ctttcactct ttcaaccgac atggcgttgc tcaagcggga agtcgagcgt 360
tttgaaggca aagatggatt tgatcggttc ttgtcgttta tccaagaagc ccacagacat 420
tacgagcttg ctgtcgttca cgtcctgcag aagaacttcc ctggcttcgc agcattctta 480
cggctacagt tcattggcca aatcctggct cttcacccct tcgagtctat ctggacaaga 540
gtttgtcgat atttcaagac cgacagatta cgaagagtct tctcgtttgc agtgatgtac 600
atgggtcaaa gcccatacag tgcgcccgga acatattcct tgctccaata caccgaattg 660
accgagggca tctggtatcc gagaggaggc ttttggcagg ttcctaatac tcttcttcag 720
atcgtcaagc gcaacaatcc ctcagccaag ttcaatttca acgctccagt ttcccaggtt 780
cttctctctc ctgccaagga ccgagcgact ggtgttcgac ttgaatccgg cgaggaacat 840
cacgccgatg ttgtgattgt caatgctgac ctcgtttacg cctccgagca cttgattcct 900
gacgatgcca gaaacaagat tggccaactg ggtgaagtca agagaagttg gtgggctgac 960
ttagttggtg gaaagaagct caagggaagt tgcagtagtt tgagcttcta ctggagcatg 1020
gaccgaatcg tggacggtct gggcggacac aatatcttct tggccgagga cttcaaggga 1080
tcattcgaca caatcttcga ggagttgggt ctcccagccg atccttcctt ttacgtgaac 1140
gttccctcgc gaatcgatcc ttctgccgct cccgaaggca aagatgctat cgtcattctt 1200
gtgccgtgtg gccatatcga cgcttcgaac cctcaagatt acaacaagct tgttgctcgg 1260
gcaaggaagt ttgtgatcca cacgctttcc gccaagcttg gacttcccga ctttgaaaaa 1320
atgattgtgg cagagaaggt tcacgatgct ccctcttggg agaaagaatt caacctcaag 1380
gacggaagca tcttgggact ggctcacaac tttatgcaag ttcttggttt caggccgagc 1440
accagacatc ccaagtatga caagttgttc tttgtcgggg cttcgactca tcccggaact 1500
ggggttccca tcgtcttggc tggagccaag ttaactgcca accaagttct cgaatccttt 1560
gaccgatccc cagctccaga tcccaatatg tcactctccg taccatatgg aaaacctctc 1620
aaatcaaatg gaacgggtat cgattctcag gtccagctga agttcatgga tttggagaga 1680
tgggtatacc ttttggtatt gttgattggg gccgtgatcg ctcgatccgt tggtgttctt 1740
gctttctga 1749
<210> 6
<211> 582
<212> PRT
<213> Artificial Sequence
<220>
<223> crtI amino acid sequence
<400> 6
Met Gly Lys Glu Gln Asp Gln Asp Lys Pro Thr Ala Ile Ile Val Gly
1 5 10 15
Cys Gly Ile Gly Gly Ile Ala Thr Ala Ala Arg Leu Ala Lys Glu Gly
20 25 30
Phe Gln Val Thr Val Phe Glu Lys Asn Asp Tyr Ser Gly Gly Arg Cys
35 40 45
Ser Leu Ile Glu Arg Asp Gly Tyr Arg Phe Asp Gln Gly Pro Ser Leu
50 55 60
Leu Leu Leu Pro Asp Leu Phe Lys Gln Thr Phe Glu Asp Leu Gly Glu
65 70 75 80
Lys Met Glu Asp Trp Val Asp Leu Ile Lys Cys Glu Pro Asn Tyr Val
85 90 95
Cys His Phe His Asp Glu Glu Thr Phe Thr Leu Ser Thr Asp Met Ala
100 105 110
Leu Leu Lys Arg Glu Val Glu Arg Phe Glu Gly Lys Asp Gly Phe Asp
115 120 125
Arg Phe Leu Ser Phe Ile Gln Glu Ala His Arg His Tyr Glu Leu Ala
130 135 140
Val Val His Val Leu Gln Lys Asn Phe Pro Gly Phe Ala Ala Phe Leu
145 150 155 160
Arg Leu Gln Phe Ile Gly Gln Ile Leu Ala Leu His Pro Phe Glu Ser
165 170 175
Ile Trp Thr Arg Val Cys Arg Tyr Phe Lys Thr Asp Arg Leu Arg Arg
180 185 190
Val Phe Ser Phe Ala Val Met Tyr Met Gly Gln Ser Pro Tyr Ser Ala
195 200 205
Pro Gly Thr Tyr Ser Leu Leu Gln Tyr Thr Glu Leu Thr Glu Gly Ile
210 215 220
Trp Tyr Pro Arg Gly Gly Phe Trp Gln Val Pro Asn Thr Leu Leu Gln
225 230 235 240
Ile Val Lys Arg Asn Asn Pro Ser Ala Lys Phe Asn Phe Asn Ala Pro
245 250 255
Val Ser Gln Val Leu Leu Ser Pro Ala Lys Asp Arg Ala Thr Gly Val
260 265 270
Arg Leu Glu Ser Gly Glu Glu His His Ala Asp Val Val Ile Val Asn
275 280 285
Ala Asp Leu Val Tyr Ala Ser Glu His Leu Ile Pro Asp Asp Ala Arg
290 295 300
Asn Lys Ile Gly Gln Leu Gly Glu Val Lys Arg Ser Trp Trp Ala Asp
305 310 315 320
Leu Val Gly Gly Lys Lys Leu Lys Gly Ser Cys Ser Ser Leu Ser Phe
325 330 335
Tyr Trp Ser Met Asp Arg Ile Val Asp Gly Leu Gly Gly His Asn Ile
340 345 350
Phe Leu Ala Glu Asp Phe Lys Gly Ser Phe Asp Thr Ile Phe Glu Glu
355 360 365
Leu Gly Leu Pro Ala Asp Pro Ser Phe Tyr Val Asn Val Pro Ser Arg
370 375 380
Ile Asp Pro Ser Ala Ala Pro Glu Gly Lys Asp Ala Ile Val Ile Leu
385 390 395 400
Val Pro Cys Gly His Ile Asp Ala Ser Asn Pro Gln Asp Tyr Asn Lys
405 410 415
Leu Val Ala Arg Ala Arg Lys Phe Val Ile His Thr Leu Ser Ala Lys
420 425 430
Leu Gly Leu Pro Asp Phe Glu Lys Met Ile Val Ala Glu Lys Val His
435 440 445
Asp Ala Pro Ser Trp Glu Lys Glu Phe Asn Leu Lys Asp Gly Ser Ile
450 455 460
Leu Gly Leu Ala His Asn Phe Met Gln Val Leu Gly Phe Arg Pro Ser
465 470 475 480
Thr Arg His Pro Lys Tyr Asp Lys Leu Phe Phe Val Gly Ala Ser Thr
485 490 495
His Pro Gly Thr Gly Val Pro Ile Val Leu Ala Gly Ala Lys Leu Thr
500 505 510
Ala Asn Gln Val Leu Glu Ser Phe Asp Arg Ser Pro Ala Pro Asp Pro
515 520 525
Asn Met Ser Leu Ser Val Pro Tyr Gly Lys Pro Leu Lys Ser Asn Gly
530 535 540
Thr Gly Ile Asp Ser Gln Val Gln Leu Lys Phe Met Asp Leu Glu Arg
545 550 555 560
Trp Val Tyr Leu Leu Val Leu Leu Ile Gly Ala Val Ile Ala Arg Ser
565 570 575
Val Gly Val Leu Ala Phe
580
<210> 7
<211> 644
<212> DNA
<213> Artificial Sequence
<220>
<223> P_TDH3 nucleic acid sequence
<400> 7
tcattatcaa tactcgccat ttcaaagaat acgtaaataa ttaatagtag tgattttcct 60
aactttattt agtcaaaaaa ttagcctttt aattctgctg taacccgtac atgcccaaaa 120
tagggggcgg gttacacaga atatataaca tcgtaggtgt ctgggtgaac agtttattcc 180
tggcatccac taaatataat ggagcccgct ttttaagctg gcatccagaa aaaaaaagaa 240
tcccagcacc aaaatattgt tttcttcacc aaccatcagt tcataggtcc attctcttag 300
cgcaactaca gagaacaggg gcacaaacag gcaaaaaacg ggcacaacct caatggagtg 360
atgcaacctg cctggagtaa atgatgacac aaggcaattg acccacgcat gtatctatct 420
cattttctta caccttctat taccttctgc tctctctgat ttggaaaaag ctgaaaaaaa 480
aggttgaaac cagttccctg aaattattcc cctacttgac taataagtat ataaagacgg 540
taggtattga ttgtaattct gtaaatctat ttcttaaact tcttaaattc tacttttata 600
gttagtcttt tttttagttt taaaacacca gaacttagtt tcga 644
<210> 8
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> error-prone forward primer (P_TDH3 40 mer homologous primer)
<400> 8
gtcttttttt tagttttaaa acaccagaac ttagtttcga 40
<210> 9
<211> 248
<212> DNA
<213> Artificial Sequence
<220>
<223> T_CYC1 nucleic acid sequence
<400> 9
tcatgtaatt agttatgtca cgcttacatt cacgccctcc ccccacatcc gctctaaccg 60
aaaaggaagg agttagacaa cctgaagtct aggtccctat ttattttttt atagttatgt 120
tagtattaag aacgttattt atatttcaaa tttttctttt ttttctgtac agacgcgtgt 180
acgcatgtaa cattatactg aaaaccttgc ttgagaaggt tttgggacgc tcgaaggctt 240
taatttgc 248
<210> 10
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> error-prone reverse primer (T_CYC1 40 mer homologous primer)
<400> 10
ggagggcgtg aatgtaagcg tgacataact aattacatga 40
<210> 11
<211> 1131
<212> DNA
<213> Artificial Sequence
<220>
<223> crtEM1 nucleic acid sequence
<400> 11
atggattacg cgaacatcct cacagcaatt ccactcgagt ttactcctca ggatgatatc 60
gtgctccttg aaccgtatca ctacctagga aagaaccctg gaaaagaaat tcgatcacaa 120
ctcatcgagg ctttcaacta ttggttggat gtcaagaagg aggatctcga ggtcatccag 180
aacgttgttg gcatgctaca taccgctagc ttattaatgg acgatgtgga ggattcatcg 240
gtcctcaggc gtgggtcgcc tgtagcccat ctaatttacg ggattccgca gacaataaac 300
actgcaaact acgtctactt tctggcttat caagagatct tcaagcttcg cccaacaccg 360
atacccatgc ctgtaattcc tccttcatct gcttcgcttc aatcaaccgt ctcctctgca 420
tcctcctcct cctcggcctc gtctgaaaac gggggcacgt catctcctaa ttcgcagatt 480
ccgttctcga aagatacgta tcttgataaa gtgatcacag acgagatgct ttccctccat 540
agagggcaag gcctggagct attctggaga gatagtctga cgtgtcctag cgaagaggaa 600
tatgtgaaaa tggttcttgg aaagacggga ggtttgttcc gtatagcggt cagattgatg 660
atggcaaagt cagaatgtga catagacttt gtccagcttg tcaacttgat ctcaatatac 720
ttccagatca gggatgacta tatgaacctt cagtcttctg agtatgccca tattaagaat 780
tttgcagagg acctcacaga aggaaaattc agttttccca ctatccactc gattcgtgcc 840
aacccctcat cgagactcgt catcaatacg ttgcagaaga aatcgacctc tcctgagatc 900
cttcaccact gtgtaaacta catgcgcaca gaaacccact cattcgaata tactcaggaa 960
gtcctcaaca ccttgtcagg tgcactcgag agagaactag gaaggcttca aggagagttc 1020
gcagaagcta actcaaagat tgatcttgga gacgtagagt cggaaggaag aacggggaag 1080
aacgtcaaat tggaagcgat cctgaaaaag ctagccgata tccctctgtg a 1131
<210> 12
<211> 376
<212> PRT
<213> Artificial Sequence
<220>
<223> crtEM1 amino acid sequence
<400> 12
Met Asp Tyr Ala Asn Ile Leu Thr Ala Ile Pro Leu Glu Phe Thr Pro
1 5 10 15
Gln Asp Asp Ile Val Leu Leu Glu Pro Tyr His Tyr Leu Gly Lys Asn
20 25 30
Pro Gly Lys Glu Ile Arg Ser Gln Leu Ile Glu Ala Phe Asn Tyr Trp
35 40 45
Leu Asp Val Lys Lys Glu Asp Leu Glu Val Ile Gln Asn Val Val Gly
50 55 60
Met Leu His Thr Ala Ser Leu Leu Met Asp Asp Val Glu Asp Ser Ser
65 70 75 80
Val Leu Arg Arg Gly Ser Pro Val Ala His Leu Ile Tyr Gly Ile Pro
85 90 95
Gln Thr Ile Asn Thr Ala Asn Tyr Val Tyr Phe Leu Ala Tyr Gln Glu
100 105 110
Ile Phe Lys Leu Arg Pro Thr Pro Ile Pro Met Pro Val Ile Pro Pro
115 120 125
Ser Ser Ala Ser Leu Gln Ser Thr Val Ser Ser Ala Ser Ser Ser Ser
130 135 140
Ser Ala Ser Ser Glu Asn Gly Gly Thr Ser Ser Pro Asn Ser Gln Ile
145 150 155 160
Pro Phe Ser Lys Asp Thr Tyr Leu Asp Lys Val Ile Thr Asp Glu Met
165 170 175
Leu Ser Leu His Arg Gly Gln Gly Leu Glu Leu Phe Trp Arg Asp Ser
180 185 190
Leu Thr Cys Pro Ser Glu Glu Glu Tyr Val Lys Met Val Leu Gly Lys
195 200 205
Thr Gly Gly Leu Phe Arg Ile Ala Val Arg Leu Met Met Ala Lys Ser
210 215 220
Glu Cys Asp Ile Asp Phe Val Gln Leu Val Asn Leu Ile Ser Ile Tyr
225 230 235 240
Phe Gln Ile Arg Asp Asp Tyr Met Asn Leu Gln Ser Ser Glu Tyr Ala
245 250 255
His Ile Lys Asn Phe Ala Glu Asp Leu Thr Glu Gly Lys Phe Ser Phe
260 265 270
Pro Thr Ile His Ser Ile Arg Ala Asn Pro Ser Ser Arg Leu Val Ile
275 280 285
Asn Thr Leu Gln Lys Lys Ser Thr Ser Pro Glu Ile Leu His His Cys
290 295 300
Val Asn Tyr Met Arg Thr Glu Thr His Ser Phe Glu Tyr Thr Gln Glu
305 310 315 320
Val Leu Asn Thr Leu Ser Gly Ala Leu Glu Arg Glu Leu Gly Arg Leu
325 330 335
Gln Gly Glu Phe Ala Glu Ala Asn Ser Lys Ile Asp Leu Gly Asp Val
340 345 350
Glu Ser Glu Gly Arg Thr Gly Lys Asn Val Lys Leu Glu Ala Ile Leu
355 360 365
Lys Lys Leu Ala Asp Ile Pro Leu
370 375
<210> 13
<211> 1131
<212> DNA
<213> Artificial Sequence
<220>
<223> crtEM3 nucleic acid sequence
<400> 13
atggattacg cgaacatcct cacagcaatt ccactcgagt ttactcctca ggatgatatc 60
gtgctccttg aaccgtatca ctacctagga aagaaccctg gaaaagaaat tcgatcacaa 120
ctcatcgagg ctttcaacta ttggttggat gtcaagaagg aggatctcga ggtcatccag 180
aacgttgttg gcatgctaca taccgctagc ttattaatgg acgatgtgga ggattcatcg 240
gtcctcaggc gtgggtcgcc tgtggcccat ctaatttacg ggattccgca gacaataaac 300
actgcaaact acgtctactt tctggcttat caagagatct tcaagcttcg cccaacaccg 360
atacccatgc ctgtaattcc tccttcatct gcttcgcttc aatcatccgt ctcctctgca 420
tcctcctcct cctcggcctc gtctgaaaac gggggcacgt caactcctaa ttcgcagatt 480
ccgttctcga aagatacgta tcttgataaa gtgatcacag acgagatgct ttccctccat 540
agagggcaag gcctggagct attctggaga gatagtctga cgtgtcctag cgaagaggaa 600
tatgtgaaaa tggttcttgg aaagacggga ggtttgttcc gtatagcggt cagattgatg 660
atggcaaagt cagaatgtga catagacttt gtccagcttg tcaacttgat ctcaatatac 720
ttccagatca gggatgacta tatgaacctt cagtcttctg agtatgccca taataagaat 780
tttgcagagg acctcacaga aggaaaattc agttttccca ctatccactc gattcatgcc 840
aacccctcat cgagactcgt catcaatacg ttgcagaaga aatcgacctc tcctgagatc 900
cttcaccact gtgtaaacta catgcgcaca gaaacccact cattcgaata tactcaggaa 960
gtcctcaaca ccttgtcagg tgcactcgag agagaactag gaagtcttca aggagagttc 1020
gcagaagcta actcaaagat tgatcttgga gacgtagagt cggaaggaag aacggggaag 1080
aacgtcaaat tggaagcgat cctgaaaaag ctagccgata tccctctgtg a 1131
<210> 14
<211> 376
<212> PRT
<213> Artificial Sequence
<220>
<223> crtEM3 amino acid sequence
<400> 14
Met Asp Tyr Ala Asn Ile Leu Thr Ala Ile Pro Leu Glu Phe Thr Pro
1 5 10 15
Gln Asp Asp Ile Val Leu Leu Glu Pro Tyr His Tyr Leu Gly Lys Asn
20 25 30
Pro Gly Lys Glu Ile Arg Ser Gln Leu Ile Glu Ala Phe Asn Tyr Trp
35 40 45
Leu Asp Val Lys Lys Glu Asp Leu Glu Val Ile Gln Asn Val Val Gly
50 55 60
Met Leu His Thr Ala Ser Leu Leu Met Asp Asp Val Glu Asp Ser Ser
65 70 75 80
Val Leu Arg Arg Gly Ser Pro Val Ala His Leu Ile Tyr Gly Ile Pro
85 90 95
Gln Thr Ile Asn Thr Ala Asn Tyr Val Tyr Phe Leu Ala Tyr Gln Glu
100 105 110
Ile Phe Lys Leu Arg Pro Thr Pro Ile Pro Met Pro Val Ile Pro Pro
115 120 125
Ser Ser Ala Ser Leu Gln Ser Ser Val Ser Ser Ala Ser Ser Ser Ser
130 135 140
Ser Ala Ser Ser Glu Asn Gly Gly Thr Ser Thr Pro Asn Ser Gln Ile
145 150 155 160
Pro Phe Ser Lys Asp Thr Tyr Leu Asp Lys Val Ile Thr Asp Glu Met
165 170 175
Leu Ser Leu His Arg Gly Gln Gly Leu Glu Leu Phe Trp Arg Asp Ser
180 185 190
Leu Thr Cys Pro Ser Glu Glu Glu Tyr Val Lys Met Val Leu Gly Lys
195 200 205
Thr Gly Gly Leu Phe Arg Ile Ala Val Arg Leu Met Met Ala Lys Ser
210 215 220
Glu Cys Asp Ile Asp Phe Val Gln Leu Val Asn Leu Ile Ser Ile Tyr
225 230 235 240
Phe Gln Ile Arg Asp Asp Tyr Met Asn Leu Gln Ser Ser Glu Tyr Ala
245 250 255
His Asn Lys Asn Phe Ala Glu Asp Leu Thr Glu Gly Lys Phe Ser Phe
260 265 270
Pro Thr Ile His Ser Ile His Ala Asn Pro Ser Ser Arg Leu Val Ile
275 280 285
Asn Thr Leu Gln Lys Lys Ser Thr Ser Pro Glu Ile Leu His His Cys
290 295 300
Val Asn Tyr Met Arg Thr Glu Thr His Ser Phe Glu Tyr Thr Gln Glu
305 310 315 320
Val Leu Asn Thr Leu Ser Gly Ala Leu Glu Arg Glu Leu Gly Ser Leu
325 330 335
Gln Gly Glu Phe Ala Glu Ala Asn Ser Lys Ile Asp Leu Gly Asp Val
340 345 350
Glu Ser Glu Gly Arg Thr Gly Lys Asn Val Lys Leu Glu Ala Ile Leu
355 360 365
Lys Lys Leu Ala Asp Ile Pro Leu
370 375
<210> 15
<211> 1131
<212> DNA
<213> Artificial Sequence
<220>
<223> crtEM18 nucleic acid sequence
<400> 15
atggattacg cgaacatcct cacagcaatt ccactcgagt ttactcctca ggatgatatc 60
gtgctccttg aaccgtatca ctacctagga aagaaccctg gaaaagaaat tcgatcacaa 120
ctcatcgagg ctttcaacta ttggttggat gtcaagaagg aggatctcga ggtcatccag 180
aacgttgttg gcatgctaca taccgctagc ttattaatgg acgatgtgga ggattcatcg 240
gtcctcaggc gtgggacgcc tgtggcccat ctaatttacg ggattccgca gacaataaac 300
actgcaaact acgtctactt tctggcttat caagagatct tcaagcttcg cccaacaccg 360
gtacccatgc ctgtaattcc tccttcatct gcttcgcttc aatcatccgt ctcctctgca 420
tcctcctcct cctcggcctc gtctgaaaac gggggcacgt caactcctaa ttcgcagatt 480
ccgttctcga aagatacgta tcttgataaa gtgatcacag acgagatgct ttccctccat 540
agagggcaag gcctggagct attctggaga gatagtctga cgtgtcctag cgaagaggaa 600
tatgtgaaaa tggttcttgg aaagacggga ggtttgttcc gtatagcggt cagattgatg 660
atggcaaagt cagaatgtga catagacttt gtccagcttg tcaacttgat ctcaatatac 720
ttccagatca gggatgacta tatgagcctt cagtcttctg agtatgccca taataagaat 780
tttgcagagg acctcacaga aggaaaattc agttttccca ctatccactc gattcatgcc 840
aacccctcat cgagactcgt catcaatacg ttgcagaaga aatcgacctc tcctgagatc 900
cttcaccact gtgtaaacta catgcgcaca gaaacccact cattcgaata tactcaggaa 960
gtcctcaaca ccttgtcagg tgcactcgag agagaactag gaaggcttca aggagagttc 1020
gcagaagcta actcaaagat tgatcttgga gacgtagagt cggaaggaag aacggggaag 1080
aacgtcaaat tggaagcgat cctgaaaaag ctagccgata tccctctgtg a 1131
<210> 16
<211> 376
<212> PRT
<213> Artificial Sequence
<220>
<223> crtEM18 amino acid sequence
<400> 16
Met Asp Tyr Ala Asn Ile Leu Thr Ala Ile Pro Leu Glu Phe Thr Pro
1 5 10 15
Gln Asp Asp Ile Val Leu Leu Glu Pro Tyr His Tyr Leu Gly Lys Asn
20 25 30
Pro Gly Lys Glu Ile Arg Ser Gln Leu Ile Glu Ala Phe Asn Tyr Trp
35 40 45
Leu Asp Val Lys Lys Glu Asp Leu Glu Val Ile Gln Asn Val Val Gly
50 55 60
Met Leu His Thr Ala Ser Leu Leu Met Asp Asp Val Glu Asp Ser Ser
65 70 75 80
Val Leu Arg Arg Gly Thr Pro Val Ala His Leu Ile Tyr Gly Ile Pro
85 90 95
Gln Thr Ile Asn Thr Ala Asn Tyr Val Tyr Phe Leu Ala Tyr Gln Glu
100 105 110
Ile Phe Lys Leu Arg Pro Thr Pro Val Pro Met Pro Val Ile Pro Pro
115 120 125
Ser Ser Ala Ser Leu Gln Ser Ser Val Ser Ser Ala Ser Ser Ser Ser
130 135 140
Ser Ala Ser Ser Glu Asn Gly Gly Thr Ser Thr Pro Asn Ser Gln Ile
145 150 155 160
Pro Phe Ser Lys Asp Thr Tyr Leu Asp Lys Val Ile Thr Asp Glu Met
165 170 175
Leu Ser Leu His Arg Gly Gln Gly Leu Glu Leu Phe Trp Arg Asp Ser
180 185 190
Leu Thr Cys Pro Ser Glu Glu Glu Tyr Val Lys Met Val Leu Gly Lys
195 200 205
Thr Gly Gly Leu Phe Arg Ile Ala Val Arg Leu Met Met Ala Lys Ser
210 215 220
Glu Cys Asp Ile Asp Phe Val Gln Leu Val Asn Leu Ile Ser Ile Tyr
225 230 235 240
Phe Gln Ile Arg Asp Asp Tyr Met Ser Leu Gln Ser Ser Glu Tyr Ala
245 250 255
His Asn Lys Asn Phe Ala Glu Asp Leu Thr Glu Gly Lys Phe Ser Phe
260 265 270
Pro Thr Ile His Ser Ile His Ala Asn Pro Ser Ser Arg Leu Val Ile
275 280 285
Asn Thr Leu Gln Lys Lys Ser Thr Ser Pro Glu Ile Leu His His Cys
290 295 300
Val Asn Tyr Met Arg Thr Glu Thr His Ser Phe Glu Tyr Thr Gln Glu
305 310 315 320
Val Leu Asn Thr Leu Ser Gly Ala Leu Glu Arg Glu Leu Gly Arg Leu
325 330 335
Gln Gly Glu Phe Ala Glu Ala Asn Ser Lys Ile Asp Leu Gly Asp Val
340 345 350
Glu Ser Glu Gly Arg Thr Gly Lys Asn Val Lys Leu Glu Ala Ile Leu
355 360 365
Lys Lys Leu Ala Asp Ile Pro Leu
370 375
<210> 17
<211> 1131
<212> DNA
<213> Artificial Sequence
<220>
<223> crtEMA1 nucleic acid sequence
<400> 17
atggattacg cgaacatcct cacagcaatt ccactcgagt ttactcctca ggatgatatc 60
gtgctccttg aaccgtatca ctacctagga aagaaccctg gaaaagaaat tcgatcacaa 120
ctcatcgagg ctttcaacta ttggttggat gtcaagaagg aggatctcga ggtcatccag 180
aacgttgttg gcatgctaca taccgctagc ttattaatgg acgatgtgga ggattcatcg 240
gtcctcaggc gtgggacgcc tgtagcccat ctaatttacg ggattccgca gacaataaac 300
actgcaaact acgtctactt tctggcttat caagagatct tcaagcttcg cccaacaccg 360
atacccatgc ctgtaattcc tccttcatct gcttcgcttc aatcaaccgt ctcctctgca 420
tcctcctcct cctcggcctc gtctgaaaac gggggcacgt catctcctaa ttcgcagatt 480
ccgttctcga aagatacgta tcttgataaa gtgatcacag acgagatgct ttccctccat 540
agagggcaag gcctggagct attctggaga gatagtctga cgtgtcctag cgaagaggaa 600
tatgtgaaaa tggttcttgg aaagacggga ggtttgttcc gtatagcggt cagattgatg 660
atggcaaagt cagaatgtga catagacttt gtccagcttg tcaacttgat ctcaatatac 720
ttccagatca gggatgacta tatgaacctt cagtcttctg agtatgccca tattaagaat 780
tttgcagagg acctcacaga aggaaaattc agttttccca ctatccactc gattcgtgcc 840
aacccctcat cgagactcgt catcaatacg ttgcagaaga aatcgacctc tcctgagatc 900
cttcaccact gtgtaaacta catgcgcaca gaaacccact cattcgaata tactcaggaa 960
gtcctcaaca ccttgtcagg tgcactcgag agagaactag gaaggcttca aggagagttc 1020
gcagaagcta actcaaagat tgatcttgga gacgtagagt cggaaggaag aacggggaag 1080
aacgtcaaat tggaagcgat cctgaaaaag ctagccgata tccctctgtg a 1131
<210> 18
<211> 376
<212> PRT
<213> Artificial Sequence
<220>
<223> crtEMA1 amino acid sequence
<400> 18
Met Asp Tyr Ala Asn Ile Leu Thr Ala Ile Pro Leu Glu Phe Thr Pro
1 5 10 15
Gln Asp Asp Ile Val Leu Leu Glu Pro Tyr His Tyr Leu Gly Lys Asn
20 25 30
Pro Gly Lys Glu Ile Arg Ser Gln Leu Ile Glu Ala Phe Asn Tyr Trp
35 40 45
Leu Asp Val Lys Lys Glu Asp Leu Glu Val Ile Gln Asn Val Val Gly
50 55 60
Met Leu His Thr Ala Ser Leu Leu Met Asp Asp Val Glu Asp Ser Ser
65 70 75 80
Val Leu Arg Arg Gly Thr Pro Val Ala His Leu Ile Tyr Gly Ile Pro
85 90 95
Gln Thr Ile Asn Thr Ala Asn Tyr Val Tyr Phe Leu Ala Tyr Gln Glu
100 105 110
Ile Phe Lys Leu Arg Pro Thr Pro Ile Pro Met Pro Val Ile Pro Pro
115 120 125
Ser Ser Ala Ser Leu Gln Ser Thr Val Ser Ser Ala Ser Ser Ser Ser
130 135 140
Ser Ala Ser Ser Glu Asn Gly Gly Thr Ser Ser Pro Asn Ser Gln Ile
145 150 155 160
Pro Phe Ser Lys Asp Thr Tyr Leu Asp Lys Val Ile Thr Asp Glu Met
165 170 175
Leu Ser Leu His Arg Gly Gln Gly Leu Glu Leu Phe Trp Arg Asp Ser
180 185 190
Leu Thr Cys Pro Ser Glu Glu Glu Tyr Val Lys Met Val Leu Gly Lys
195 200 205
Thr Gly Gly Leu Phe Arg Ile Ala Val Arg Leu Met Met Ala Lys Ser
210 215 220
Glu Cys Asp Ile Asp Phe Val Gln Leu Val Asn Leu Ile Ser Ile Tyr
225 230 235 240
Phe Gln Ile Arg Asp Asp Tyr Met Asn Leu Gln Ser Ser Glu Tyr Ala
245 250 255
His Ile Lys Asn Phe Ala Glu Asp Leu Thr Glu Gly Lys Phe Ser Phe
260 265 270
Pro Thr Ile His Ser Ile Arg Ala Asn Pro Ser Ser Arg Leu Val Ile
275 280 285
Asn Thr Leu Gln Lys Lys Ser Thr Ser Pro Glu Ile Leu His His Cys
290 295 300
Val Asn Tyr Met Arg Thr Glu Thr His Ser Phe Glu Tyr Thr Gln Glu
305 310 315 320
Val Leu Asn Thr Leu Ser Gly Ala Leu Glu Arg Glu Leu Gly Arg Leu
325 330 335
Gln Gly Glu Phe Ala Glu Ala Asn Ser Lys Ile Asp Leu Gly Asp Val
340 345 350
Glu Ser Glu Gly Arg Thr Gly Lys Asn Val Lys Leu Glu Ala Ile Leu
355 360 365
Lys Lys Leu Ala Asp Ile Pro Leu
370 375
<210> 19
<211> 1131
<212> DNA
<213> Artificial Sequence
<220>
<223> crtEMA2 nucleic acid sequence
<400> 19
atggattacg cgaacatcct cacagcaatt ccactcgagt ttactcctca ggatgatatc 60
gtgctccttg aaccgtatca ctacctagga aagaaccctg gaaaagaaat tcgatcacaa 120
ctcatcgagg ctttcaacta ttggttggat gtcaagaagg aggatctcga ggtcatccag 180
aacgttgttg gcatgctaca taccgctagc ttattaatgg acgatgtgga ggattcatcg 240
gtcctcaggc gtgggtcgcc tgtagcccat ctaatttacg ggattccgca gacaataaac 300
actgcaaact acgtctactt tctggcttat caagagatct tcaagcttcg cccaacaccg 360
gtacccatgc ctgtaattcc tccttcatct gcttcgcttc aatcaaccgt ctcctctgca 420
tcctcctcct cctcggcctc gtctgaaaac gggggcacgt catctcctaa ttcgcagatt 480
ccgttctcga aagatacgta tcttgataaa gtgatcacag acgagatgct ttccctccat 540
agagggcaag gcctggagct attctggaga gatagtctga cgtgtcctag cgaagaggaa 600
tatgtgaaaa tggttcttgg aaagacggga ggtttgttcc gtatagcggt cagattgatg 660
atggcaaagt cagaatgtga catagacttt gtccagcttg tcaacttgat ctcaatatac 720
ttccagatca gggatgacta tatgaacctt cagtcttctg agtatgccca tattaagaat 780
tttgcagagg acctcacaga aggaaaattc agttttccca ctatccactc gattcgtgcc 840
aacccctcat cgagactcgt catcaatacg ttgcagaaga aatcgacctc tcctgagatc 900
cttcaccact gtgtaaacta catgcgcaca gaaacccact cattcgaata tactcaggaa 960
gtcctcaaca ccttgtcagg tgcactcgag agagaactag gaaggcttca aggagagttc 1020
gcagaagcta actcaaagat tgatcttgga gacgtagagt cggaaggaag aacggggaag 1080
aacgtcaaat tggaagcgat cctgaaaaag ctagccgata tccctctgtg a 1131
<210> 20
<211> 376
<212> PRT
<213> Artificial Sequence
<220>
<223> crtEMA2 amino acid sequence
<400> 20
Met Asp Tyr Ala Asn Ile Leu Thr Ala Ile Pro Leu Glu Phe Thr Pro
1 5 10 15
Gln Asp Asp Ile Val Leu Leu Glu Pro Tyr His Tyr Leu Gly Lys Asn
20 25 30
Pro Gly Lys Glu Ile Arg Ser Gln Leu Ile Glu Ala Phe Asn Tyr Trp
35 40 45
Leu Asp Val Lys Lys Glu Asp Leu Glu Val Ile Gln Asn Val Val Gly
50 55 60
Met Leu His Thr Ala Ser Leu Leu Met Asp Asp Val Glu Asp Ser Ser
65 70 75 80
Val Leu Arg Arg Gly Ser Pro Val Ala His Leu Ile Tyr Gly Ile Pro
85 90 95
Gln Thr Ile Asn Thr Ala Asn Tyr Val Tyr Phe Leu Ala Tyr Gln Glu
100 105 110
Ile Phe Lys Leu Arg Pro Thr Pro Val Pro Met Pro Val Ile Pro Pro
115 120 125
Ser Ser Ala Ser Leu Gln Ser Thr Val Ser Ser Ala Ser Ser Ser Ser
130 135 140
Ser Ala Ser Ser Glu Asn Gly Gly Thr Ser Ser Pro Asn Ser Gln Ile
145 150 155 160
Pro Phe Ser Lys Asp Thr Tyr Leu Asp Lys Val Ile Thr Asp Glu Met
165 170 175
Leu Ser Leu His Arg Gly Gln Gly Leu Glu Leu Phe Trp Arg Asp Ser
180 185 190
Leu Thr Cys Pro Ser Glu Glu Glu Tyr Val Lys Met Val Leu Gly Lys
195 200 205
Thr Gly Gly Leu Phe Arg Ile Ala Val Arg Leu Met Met Ala Lys Ser
210 215 220
Glu Cys Asp Ile Asp Phe Val Gln Leu Val Asn Leu Ile Ser Ile Tyr
225 230 235 240
Phe Gln Ile Arg Asp Asp Tyr Met Asn Leu Gln Ser Ser Glu Tyr Ala
245 250 255
His Ile Lys Asn Phe Ala Glu Asp Leu Thr Glu Gly Lys Phe Ser Phe
260 265 270
Pro Thr Ile His Ser Ile Arg Ala Asn Pro Ser Ser Arg Leu Val Ile
275 280 285
Asn Thr Leu Gln Lys Lys Ser Thr Ser Pro Glu Ile Leu His His Cys
290 295 300
Val Asn Tyr Met Arg Thr Glu Thr His Ser Phe Glu Tyr Thr Gln Glu
305 310 315 320
Val Leu Asn Thr Leu Ser Gly Ala Leu Glu Arg Glu Leu Gly Arg Leu
325 330 335
Gln Gly Glu Phe Ala Glu Ala Asn Ser Lys Ile Asp Leu Gly Asp Val
340 345 350
Glu Ser Glu Gly Arg Thr Gly Lys Asn Val Lys Leu Glu Ala Ile Leu
355 360 365
Lys Lys Leu Ala Asp Ile Pro Leu
370 375
<210> 21
<211> 1131
<212> DNA
<213> Artificial Sequence
<220>
<223> crtEMA3 nucleic acid sequence
<400> 21
atggattacg cgaacatcct cacagcaatt ccactcgagt ttactcctca ggatgatatc 60
gtgctccttg aaccgtatca ctacctagga aagaaccctg gaaaagaaat tcgatcacaa 120
ctcatcgagg ctttcaacta ttggttggat gtcaagaagg aggatctcga ggtcatccag 180
aacgttgttg gcatgctaca taccgctagc ttattaatgg acgatgtgga ggattcatcg 240
gtcctcaggc gtgggtcgcc tgtagcccat ctaatttacg ggattccgca gacaataaac 300
actgcaaact acgtctactt tctggcttat caagagatct tcaagcttcg cccaacaccg 360
atacccatgc ctgtaattcc tccttcatct gcttcgcttc aatcaaccgt ctcctctgca 420
tcctcctcct cctcggcctc gtctgaaaac gggggcacgt catctcctaa ttcgcagatt 480
ccgttctcga aagatacgta tcttgataaa gtgatcacag acgagatgct ttccctccat 540
agagggcaag gcctggagct attctggaga gatagtctga cgtgtcctag cgaagaggaa 600
tatgtgaaaa tggttcttgg aaagacggga ggtttgttcc gtatagcggt cagattgatg 660
atggcaaagt cagaatgtga catagacttt gtccagcttg tcaacttgat ctcaatatac 720
ttccagatca gggatgacta tatgagcctt cagtcttctg agtatgccca tattaagaat 780
tttgcagagg acctcacaga aggaaaattc agttttccca ctatccactc gattcgtgcc 840
aacccctcat cgagactcgt catcaatacg ttgcagaaga aatcgacctc tcctgagatc 900
cttcaccact gtgtaaacta catgcgcaca gaaacccact cattcgaata tactcaggaa 960
gtcctcaaca ccttgtcagg tgcactcgag agagaactag gaaggcttca aggagagttc 1020
gcagaagcta actcaaagat tgatcttgga gacgtagagt cggaaggaag aacggggaag 1080
aacgtcaaat tggaagcgat cctgaaaaag ctagccgata tccctctgtg a 1131
<210> 22
<211> 376
<212> PRT
<213> Artificial Sequence
<220>
<223> crtEMA3 amino acid sequence
<400> 22
Met Asp Tyr Ala Asn Ile Leu Thr Ala Ile Pro Leu Glu Phe Thr Pro
1 5 10 15
Gln Asp Asp Ile Val Leu Leu Glu Pro Tyr His Tyr Leu Gly Lys Asn
20 25 30
Pro Gly Lys Glu Ile Arg Ser Gln Leu Ile Glu Ala Phe Asn Tyr Trp
35 40 45
Leu Asp Val Lys Lys Glu Asp Leu Glu Val Ile Gln Asn Val Val Gly
50 55 60
Met Leu His Thr Ala Ser Leu Leu Met Asp Asp Val Glu Asp Ser Ser
65 70 75 80
Val Leu Arg Arg Gly Ser Pro Val Ala His Leu Ile Tyr Gly Ile Pro
85 90 95
Gln Thr Ile Asn Thr Ala Asn Tyr Val Tyr Phe Leu Ala Tyr Gln Glu
100 105 110
Ile Phe Lys Leu Arg Pro Thr Pro Ile Pro Met Pro Val Ile Pro Pro
115 120 125
Ser Ser Ala Ser Leu Gln Ser Thr Val Ser Ser Ala Ser Ser Ser Ser
130 135 140
Ser Ala Ser Ser Glu Asn Gly Gly Thr Ser Ser Pro Asn Ser Gln Ile
145 150 155 160
Pro Phe Ser Lys Asp Thr Tyr Leu Asp Lys Val Ile Thr Asp Glu Met
165 170 175
Leu Ser Leu His Arg Gly Gln Gly Leu Glu Leu Phe Trp Arg Asp Ser
180 185 190
Leu Thr Cys Pro Ser Glu Glu Glu Tyr Val Lys Met Val Leu Gly Lys
195 200 205
Thr Gly Gly Leu Phe Arg Ile Ala Val Arg Leu Met Met Ala Lys Ser
210 215 220
Glu Cys Asp Ile Asp Phe Val Gln Leu Val Asn Leu Ile Ser Ile Tyr
225 230 235 240
Phe Gln Ile Arg Asp Asp Tyr Met Ser Leu Gln Ser Ser Glu Tyr Ala
245 250 255
His Ile Lys Asn Phe Ala Glu Asp Leu Thr Glu Gly Lys Phe Ser Phe
260 265 270
Pro Thr Ile His Ser Ile Arg Ala Asn Pro Ser Ser Arg Leu Val Ile
275 280 285
Asn Thr Leu Gln Lys Lys Ser Thr Ser Pro Glu Ile Leu His His Cys
290 295 300
Val Asn Tyr Met Arg Thr Glu Thr His Ser Phe Glu Tyr Thr Gln Glu
305 310 315 320
Val Leu Asn Thr Leu Ser Gly Ala Leu Glu Arg Glu Leu Gly Arg Leu
325 330 335
Gln Gly Glu Phe Ala Glu Ala Asn Ser Lys Ile Asp Leu Gly Asp Val
340 345 350
Glu Ser Glu Gly Arg Thr Gly Lys Asn Val Lys Leu Glu Ala Ile Leu
355 360 365
Lys Lys Leu Ala Asp Ile Pro Leu
370 375
<210> 23
<211> 1131
<212> DNA
<213> Artificial Sequence
<220>
<223> crtEMB1 nucleic acid sequence
<400> 23
atggattacg cgaacatcct cacagcaatt ccactcgagt ttactcctca ggatgatatc 60
gtgctccttg aaccgtatca ctacctagga aagaaccctg gaaaagaaat tcgatcacaa 120
ctcatcgagg ctttcaacta ttggttggat gtcaagaagg aggatctcga ggtcatccag 180
aacgttgttg gcatgctaca taccgctagc ttattaatgg acgatgtgga ggattcatcg 240
gtcctcaggc gtgggtcgcc tgtagcccat ctaatttacg ggattccgca gacaataaac 300
actgcaaact acgtctactt tctggcttat caagagatct tcaagcttcg cccaacaccg 360
gtacccatgc ctgtaattcc tccttcatct gcttcgcttc aatcatccgt ctcctctgca 420
tcctcctcct cctcggcctc gtctgaaaac gggggcacgt caactcctaa ttcgcagatt 480
ccgttctcga aagatacgta tcttgataaa gtgatcacag acgagatgct ttccctccat 540
agagggcaag gcctggagct attctggaga gatagtctga cgtgtcctag cgaagaggaa 600
tatgtgaaaa tggttcttgg aaagacggga ggtttgttcc gtatagcggt cagattgatg 660
atggcaaagt cagaatgtga catagacttt gtccagcttg tcaacttgat ctcaatatac 720
ttccagatca gggatgacta tatgagcctt cagtcttctg agtatgccca taataagaat 780
tttgcagagg acctcacaga aggaaaattc agttttccca ctatccactc gattcatgcc 840
aacccctcat cgagactcgt catcaatacg ttgcagaaga aatcgacctc tcctgagatc 900
cttcaccact gtgtaaacta catgcgcaca gaaacccact cattcgaata tactcaggaa 960
gtcctcaaca ccttgtcagg tgcactcgag agagaactag gaaggcttca aggagagttc 1020
gcagaagcta actcaaagat tgatcttgga gacgtagagt cggaaggaag aacggggaag 1080
aacgtcaaat tggaagcgat cctgaaaaag ctagccgata tccctctgtg a 1131
<210> 24
<211> 376
<212> PRT
<213> Artificial Sequence
<220>
<223> crtEMB1 amino acid sequence
<400> 24
Met Asp Tyr Ala Asn Ile Leu Thr Ala Ile Pro Leu Glu Phe Thr Pro
1 5 10 15
Gln Asp Asp Ile Val Leu Leu Glu Pro Tyr His Tyr Leu Gly Lys Asn
20 25 30
Pro Gly Lys Glu Ile Arg Ser Gln Leu Ile Glu Ala Phe Asn Tyr Trp
35 40 45
Leu Asp Val Lys Lys Glu Asp Leu Glu Val Ile Gln Asn Val Val Gly
50 55 60
Met Leu His Thr Ala Ser Leu Leu Met Asp Asp Val Glu Asp Ser Ser
65 70 75 80
Val Leu Arg Arg Gly Ser Pro Val Ala His Leu Ile Tyr Gly Ile Pro
85 90 95
Gln Thr Ile Asn Thr Ala Asn Tyr Val Tyr Phe Leu Ala Tyr Gln Glu
100 105 110
Ile Phe Lys Leu Arg Pro Thr Pro Val Pro Met Pro Val Ile Pro Pro
115 120 125
Ser Ser Ala Ser Leu Gln Ser Ser Val Ser Ser Ala Ser Ser Ser Ser
130 135 140
Ser Ala Ser Ser Glu Asn Gly Gly Thr Ser Thr Pro Asn Ser Gln Ile
145 150 155 160
Pro Phe Ser Lys Asp Thr Tyr Leu Asp Lys Val Ile Thr Asp Glu Met
165 170 175
Leu Ser Leu His Arg Gly Gln Gly Leu Glu Leu Phe Trp Arg Asp Ser
180 185 190
Leu Thr Cys Pro Ser Glu Glu Glu Tyr Val Lys Met Val Leu Gly Lys
195 200 205
Thr Gly Gly Leu Phe Arg Ile Ala Val Arg Leu Met Met Ala Lys Ser
210 215 220
Glu Cys Asp Ile Asp Phe Val Gln Leu Val Asn Leu Ile Ser Ile Tyr
225 230 235 240
Phe Gln Ile Arg Asp Asp Tyr Met Ser Leu Gln Ser Ser Glu Tyr Ala
245 250 255
His Asn Lys Asn Phe Ala Glu Asp Leu Thr Glu Gly Lys Phe Ser Phe
260 265 270
Pro Thr Ile His Ser Ile His Ala Asn Pro Ser Ser Arg Leu Val Ile
275 280 285
Asn Thr Leu Gln Lys Lys Ser Thr Ser Pro Glu Ile Leu His His Cys
290 295 300
Val Asn Tyr Met Arg Thr Glu Thr His Ser Phe Glu Tyr Thr Gln Glu
305 310 315 320
Val Leu Asn Thr Leu Ser Gly Ala Leu Glu Arg Glu Leu Gly Arg Leu
325 330 335
Gln Gly Glu Phe Ala Glu Ala Asn Ser Lys Ile Asp Leu Gly Asp Val
340 345 350
Glu Ser Glu Gly Arg Thr Gly Lys Asn Val Lys Leu Glu Ala Ile Leu
355 360 365
Lys Lys Leu Ala Asp Ile Pro Leu
370 375
<210> 25
<211> 1131
<212> DNA
<213> Artificial Sequence
<220>
<223> crtEMB2 nucleic acid sequence
<400> 25
atggattacg cgaacatcct cacagcaatt ccactcgagt ttactcctca ggatgatatc 60
gtgctccttg aaccgtatca ctacctagga aagaaccctg gaaaagaaat tcgatcacaa 120
ctcatcgagg ctttcaacta ttggttggat gtcaagaagg aggatctcga ggtcatccag 180
aacgttgttg gcatgctaca taccgctagc ttattaatgg acgatgtgga ggattcatcg 240
gtcctcaggc gtgggtcgcc tgtggcccat ctaatttacg ggattccgca gacaataaac 300
actgcaaact acgtctactt tctggcttat caagagatct tcaagcttcg cccaacaccg 360
gtacccatgc ctgtaattcc tccttcatct gcttcgcttc aatcaaccgt ctcctctgca 420
tcctcctcct cctcggcctc gtctgaaaac gggggcacgt catctcctaa ttcgcagatt 480
ccgttctcga aagatacgta tcttgataaa gtgatcacag acgagatgct ttccctccat 540
agagggcaag gcctggagct attctggaga gatagtctga cgtgtcctag cgaagaggaa 600
tatgtgaaaa tggttcttgg aaagacggga ggtttgttcc gtatagcggt cagattgatg 660
atggcaaagt cagaatgtga catagacttt gtccagcttg tcaacttgat ctcaatatac 720
ttccagatca gggatgacta tatgagcctt cagtcttctg agtatgccca taataagaat 780
tttgcagagg acctcacaga aggaaaattc agttttccca ctatccactc gattcatgcc 840
aacccctcat cgagactcgt catcaatacg ttgcagaaga aatcgacctc tcctgagatc 900
cttcaccact gtgtaaacta catgcgcaca gaaacccact cattcgaata tactcaggaa 960
gtcctcaaca ccttgtcagg tgcactcgag agagaactag gaaggcttca aggagagttc 1020
gcagaagcta actcaaagat tgatcttgga gacgtagagt cggaaggaag aacggggaag 1080
aacgtcaaat tggaagcgat cctgaaaaag ctagccgata tccctctgtg a 1131
<210> 26
<211> 376
<212> PRT
<213> Artificial Sequence
<220>
<223> crtEMB2 amino acid sequence
<400> 26
Met Asp Tyr Ala Asn Ile Leu Thr Ala Ile Pro Leu Glu Phe Thr Pro
1 5 10 15
Gln Asp Asp Ile Val Leu Leu Glu Pro Tyr His Tyr Leu Gly Lys Asn
20 25 30
Pro Gly Lys Glu Ile Arg Ser Gln Leu Ile Glu Ala Phe Asn Tyr Trp
35 40 45
Leu Asp Val Lys Lys Glu Asp Leu Glu Val Ile Gln Asn Val Val Gly
50 55 60
Met Leu His Thr Ala Ser Leu Leu Met Asp Asp Val Glu Asp Ser Ser
65 70 75 80
Val Leu Arg Arg Gly Ser Pro Val Ala His Leu Ile Tyr Gly Ile Pro
85 90 95
Gln Thr Ile Asn Thr Ala Asn Tyr Val Tyr Phe Leu Ala Tyr Gln Glu
100 105 110
Ile Phe Lys Leu Arg Pro Thr Pro Val Pro Met Pro Val Ile Pro Pro
115 120 125
Ser Ser Ala Ser Leu Gln Ser Thr Val Ser Ser Ala Ser Ser Ser Ser
130 135 140
Ser Ala Ser Ser Glu Asn Gly Gly Thr Ser Ser Pro Asn Ser Gln Ile
145 150 155 160
Pro Phe Ser Lys Asp Thr Tyr Leu Asp Lys Val Ile Thr Asp Glu Met
165 170 175
Leu Ser Leu His Arg Gly Gln Gly Leu Glu Leu Phe Trp Arg Asp Ser
180 185 190
Leu Thr Cys Pro Ser Glu Glu Glu Tyr Val Lys Met Val Leu Gly Lys
195 200 205
Thr Gly Gly Leu Phe Arg Ile Ala Val Arg Leu Met Met Ala Lys Ser
210 215 220
Glu Cys Asp Ile Asp Phe Val Gln Leu Val Asn Leu Ile Ser Ile Tyr
225 230 235 240
Phe Gln Ile Arg Asp Asp Tyr Met Ser Leu Gln Ser Ser Glu Tyr Ala
245 250 255
His Asn Lys Asn Phe Ala Glu Asp Leu Thr Glu Gly Lys Phe Ser Phe
260 265 270
Pro Thr Ile His Ser Ile His Ala Asn Pro Ser Ser Arg Leu Val Ile
275 280 285
Asn Thr Leu Gln Lys Lys Ser Thr Ser Pro Glu Ile Leu His His Cys
290 295 300
Val Asn Tyr Met Arg Thr Glu Thr His Ser Phe Glu Tyr Thr Gln Glu
305 310 315 320
Val Leu Asn Thr Leu Ser Gly Ala Leu Glu Arg Glu Leu Gly Arg Leu
325 330 335
Gln Gly Glu Phe Ala Glu Ala Asn Ser Lys Ile Asp Leu Gly Asp Val
340 345 350
Glu Ser Glu Gly Arg Thr Gly Lys Asn Val Lys Leu Glu Ala Ile Leu
355 360 365
Lys Lys Leu Ala Asp Ile Pro Leu
370 375
<210> 27
<211> 1131
<212> DNA
<213> Artificial Sequence
<220>
<223> crtEMB3 nucleic acid sequence
<400> 27
atggattacg cgaacatcct cacagcaatt ccactcgagt ttactcctca ggatgatatc 60
gtgctccttg aaccgtatca ctacctagga aagaaccctg gaaaagaaat tcgatcacaa 120
ctcatcgagg ctttcaacta ttggttggat gtcaagaagg aggatctcga ggtcatccag 180
aacgttgttg gcatgctaca taccgctagc ttattaatgg acgatgtgga ggattcatcg 240
gtcctcaggc gtgggtcgcc tgtggcccat ctaatttacg ggattccgca gacaataaac 300
actgcaaact acgtctactt tctggcttat caagagatct tcaagcttcg cccaacaccg 360
gtacccatgc ctgtaattcc tccttcatct gcttcgcttc aatcatccgt ctcctctgca 420
tcctcctcct cctcggcctc gtctgaaaac gggggcacgt caactcctaa ttcgcagatt 480
ccgttctcga aagatacgta tcttgataaa gtgatcacag acgagatgct ttccctccat 540
agagggcaag gcctggagct attctggaga gatagtctga cgtgtcctag cgaagaggaa 600
tatgtgaaaa tggttcttgg aaagacggga ggtttgttcc gtatagcggt cagattgatg 660
atggcaaagt cagaatgtga catagacttt gtccagcttg tcaacttgat ctcaatatac 720
ttccagatca gggatgacta tatgagcctt cagtcttctg agtatgccca tattaagaat 780
tttgcagagg acctcacaga aggaaaattc agttttccca ctatccactc gattcgtgcc 840
aacccctcat cgagactcgt catcaatacg ttgcagaaga aatcgacctc tcctgagatc 900
cttcaccact gtgtaaacta catgcgcaca gaaacccact cattcgaata tactcaggaa 960
gtcctcaaca ccttgtcagg tgcactcgag agagaactag gaaggcttca aggagagttc 1020
gcagaagcta actcaaagat tgatcttgga gacgtagagt cggaaggaag aacggggaag 1080
aacgtcaaat tggaagcgat cctgaaaaag ctagccgata tccctctgtg a 1131
<210> 28
<211> 376
<212> PRT
<213> Artificial Sequence
<220>
<223> crtEMB3 amino acid sequence
<400> 28
Met Asp Tyr Ala Asn Ile Leu Thr Ala Ile Pro Leu Glu Phe Thr Pro
1 5 10 15
Gln Asp Asp Ile Val Leu Leu Glu Pro Tyr His Tyr Leu Gly Lys Asn
20 25 30
Pro Gly Lys Glu Ile Arg Ser Gln Leu Ile Glu Ala Phe Asn Tyr Trp
35 40 45
Leu Asp Val Lys Lys Glu Asp Leu Glu Val Ile Gln Asn Val Val Gly
50 55 60
Met Leu His Thr Ala Ser Leu Leu Met Asp Asp Val Glu Asp Ser Ser
65 70 75 80
Val Leu Arg Arg Gly Ser Pro Val Ala His Leu Ile Tyr Gly Ile Pro
85 90 95
Gln Thr Ile Asn Thr Ala Asn Tyr Val Tyr Phe Leu Ala Tyr Gln Glu
100 105 110
Ile Phe Lys Leu Arg Pro Thr Pro Val Pro Met Pro Val Ile Pro Pro
115 120 125
Ser Ser Ala Ser Leu Gln Ser Ser Val Ser Ser Ala Ser Ser Ser Ser
130 135 140
Ser Ala Ser Ser Glu Asn Gly Gly Thr Ser Thr Pro Asn Ser Gln Ile
145 150 155 160
Pro Phe Ser Lys Asp Thr Tyr Leu Asp Lys Val Ile Thr Asp Glu Met
165 170 175
Leu Ser Leu His Arg Gly Gln Gly Leu Glu Leu Phe Trp Arg Asp Ser
180 185 190
Leu Thr Cys Pro Ser Glu Glu Glu Tyr Val Lys Met Val Leu Gly Lys
195 200 205
Thr Gly Gly Leu Phe Arg Ile Ala Val Arg Leu Met Met Ala Lys Ser
210 215 220
Glu Cys Asp Ile Asp Phe Val Gln Leu Val Asn Leu Ile Ser Ile Tyr
225 230 235 240
Phe Gln Ile Arg Asp Asp Tyr Met Ser Leu Gln Ser Ser Glu Tyr Ala
245 250 255
His Ile Lys Asn Phe Ala Glu Asp Leu Thr Glu Gly Lys Phe Ser Phe
260 265 270
Pro Thr Ile His Ser Ile Arg Ala Asn Pro Ser Ser Arg Leu Val Ile
275 280 285
Asn Thr Leu Gln Lys Lys Ser Thr Ser Pro Glu Ile Leu His His Cys
290 295 300
Val Asn Tyr Met Arg Thr Glu Thr His Ser Phe Glu Tyr Thr Gln Glu
305 310 315 320
Val Leu Asn Thr Leu Ser Gly Ala Leu Glu Arg Glu Leu Gly Arg Leu
325 330 335
Gln Gly Glu Phe Ala Glu Ala Asn Ser Lys Ile Asp Leu Gly Asp Val
340 345 350
Glu Ser Glu Gly Arg Thr Gly Lys Asn Val Lys Leu Glu Ala Ile Leu
355 360 365
Lys Lys Leu Ala Asp Ile Pro Leu
370 375
<210> 29
<211> 1131
<212> DNA
<213> Artificial Sequence
<220>
<223> crtEMC nucleic acid sequence
<400> 29
atggattacg cgaacatcct cacagcaatt ccactcgagt ttactcctca ggatgatatc 60
gtgctccttg aaccgtatca ctacctagga aagaaccctg gaaaagaaat tcgatcacaa 120
ctcatcgagg ctttcaacta ttggttggat gtcaagaagg aggatctcga ggtcatccag 180
aacgttgttg gcatgctaca taccgctagc ttattaatgg acgatgtgga ggattcatcg 240
gtcctcaggc gtgggacgcc tgtagcccat ctaatttacg ggattccgca gacaataaac 300
actgcaaact acgtctactt tctggcttat caagagatct tcaagcttcg cccaacaccg 360
gtacccatgc ctgtaattcc tccttcatct gcttcgcttc aatcaaccgt ctcctctgca 420
tcctcctcct cctcggcctc gtctgaaaac gggggcacgt catctcctaa ttcgcagatt 480
ccgttctcga aagatacgta tcttgataaa gtgatcacag acgagatgct ttccctccat 540
agagggcaag gcctggagct attctggaga gatagtctga cgtgtcctag cgaagaggaa 600
tatgtgaaaa tggttcttgg aaagacggga ggtttgttcc gtatagcggt cagattgatg 660
atggcaaagt cagaatgtga catagacttt gtccagcttg tcaacttgat ctcaatatac 720
ttccagatca gggatgacta tatgagcctt cagtcttctg agtatgccca tattaagaat 780
tttgcagagg acctcacaga aggaaaattc agttttccca ctatccactc gattcgtgcc 840
aacccctcat cgagactcgt catcaatacg ttgcagaaga aatcgacctc tcctgagatc 900
cttcaccact gtgtaaacta catgcgcaca gaaacccact cattcgaata tactcaggaa 960
gtcctcaaca ccttgtcagg tgcactcgag agagaactag gaaggcttca aggagagttc 1020
gcagaagcta actcaaagat tgatcttgga gacgtagagt cggaaggaag aacggggaag 1080
aacgtcaaat tggaagcgat cctgaaaaag ctagccgata tccctctgtg a 1131
<210> 30
<211> 376
<212> PRT
<213> Artificial Sequence
<220>
<223> crtEMC amino acid sequence
<400> 30
Met Asp Tyr Ala Asn Ile Leu Thr Ala Ile Pro Leu Glu Phe Thr Pro
1 5 10 15
Gln Asp Asp Ile Val Leu Leu Glu Pro Tyr His Tyr Leu Gly Lys Asn
20 25 30
Pro Gly Lys Glu Ile Arg Ser Gln Leu Ile Glu Ala Phe Asn Tyr Trp
35 40 45
Leu Asp Val Lys Lys Glu Asp Leu Glu Val Ile Gln Asn Val Val Gly
50 55 60
Met Leu His Thr Ala Ser Leu Leu Met Asp Asp Val Glu Asp Ser Ser
65 70 75 80
Val Leu Arg Arg Gly Thr Pro Val Ala His Leu Ile Tyr Gly Ile Pro
85 90 95
Gln Thr Ile Asn Thr Ala Asn Tyr Val Tyr Phe Leu Ala Tyr Gln Glu
100 105 110
Ile Phe Lys Leu Arg Pro Thr Pro Val Pro Met Pro Val Ile Pro Pro
115 120 125
Ser Ser Ala Ser Leu Gln Ser Thr Val Ser Ser Ala Ser Ser Ser Ser
130 135 140
Ser Ala Ser Ser Glu Asn Gly Gly Thr Ser Ser Pro Asn Ser Gln Ile
145 150 155 160
Pro Phe Ser Lys Asp Thr Tyr Leu Asp Lys Val Ile Thr Asp Glu Met
165 170 175
Leu Ser Leu His Arg Gly Gln Gly Leu Glu Leu Phe Trp Arg Asp Ser
180 185 190
Leu Thr Cys Pro Ser Glu Glu Glu Tyr Val Lys Met Val Leu Gly Lys
195 200 205
Thr Gly Gly Leu Phe Arg Ile Ala Val Arg Leu Met Met Ala Lys Ser
210 215 220
Glu Cys Asp Ile Asp Phe Val Gln Leu Val Asn Leu Ile Ser Ile Tyr
225 230 235 240
Phe Gln Ile Arg Asp Asp Tyr Met Ser Leu Gln Ser Ser Glu Tyr Ala
245 250 255
His Ile Lys Asn Phe Ala Glu Asp Leu Thr Glu Gly Lys Phe Ser Phe
260 265 270
Pro Thr Ile His Ser Ile Arg Ala Asn Pro Ser Ser Arg Leu Val Ile
275 280 285
Asn Thr Leu Gln Lys Lys Ser Thr Ser Pro Glu Ile Leu His His Cys
290 295 300
Val Asn Tyr Met Arg Thr Glu Thr His Ser Phe Glu Tyr Thr Gln Glu
305 310 315 320
Val Leu Asn Thr Leu Ser Gly Ala Leu Glu Arg Glu Leu Gly Arg Leu
325 330 335
Gln Gly Glu Phe Ala Glu Ala Asn Ser Lys Ile Asp Leu Gly Asp Val
340 345 350
Glu Ser Glu Gly Arg Thr Gly Lys Asn Val Lys Leu Glu Ala Ile Leu
355 360 365
Lys Lys Leu Ala Asp Ile Pro Leu
370 375
<210> 31
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> crtE overlap1 forward primer
<400> 31
ctcaggcgtg ggacgcctgt agcccatcta attta 35
<210> 32
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> crtE overlap1 reverse primer
<400> 32
taaattagat gggctacagg cgtcccacgc ctgag 35
<210> 33
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> crtE overlap2 forward primer
<400> 33
gcttcgccca acaccggtac ccatgcctgt aattc 35
<210> 34
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> crtE overlap2 reverse primer
<400> 34
gaattacagg catgggtacc ggtgttgggc gaagc 35
<210> 35
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> crtE overlap3 forward primer
<400> 35
gatcagggat gactatatga gccttcagtc ttctg 35
<210> 36
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> crtE overlap3 reverse primer
<400> 36
cagaagactg aaggctcata tagtcatccc tgatc 35
<210> 37
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> crtB overlap EcoRI forward primer
<400> 37
gcggaattca tgagccaacc gccgttgctt gacca 35
<210> 38
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> crtB overlap2 forward primer
<400> 38
gaactatgcc gcgagggaga atcgggccgc 30
<210> 39
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> crtB overlap2 reverse primer
<400> 39
gcggcccgat tctccctcgc ggcatagttc 30
<210> 40
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> crtB overlap3 forward primer
<400> 40
gatggcggca ccggtgcagg ttattcgggc 30
<210> 41
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> crtB overlap3 reverse primer
<400> 41
gcccgaataa cctgcaccgg tgccgccatc 30
<210> 42
<211> 930
<212> DNA
<213> Artificial Sequence
<220>
<223> crtBM1 nucleic acid sequence
<400> 42
atgagccaac cgccgttgct tgaccacgcc acgcagacca tggccaacgg ctcgaaaagt 60
tttgccaccg ctgcgaagct gttcgacccg gccacccgcc gtagcgtgct gatgctctac 120
acctggtgcc gccactgcga tgacgtcatt gacgaccaga cccacggctt cgccagcgag 180
gccgcggcgg aggaggaggc cacccagcgc ctggcccggc tgcgcacgct gaccctggcg 240
gcgtttgaag gggccgagat gcaggatccg gccttcgctg cctttcagga ggtggcgctg 300
acccacggta ttacgccccg catggcgctc gatcacctcg acggctttgc gatggacgtg 360
gctcagaccc gctatgtcac ctttgaggat acgctgcgct actgctatca cgtggcgggc 420
gtggtgggtc tgatgatggc cagggtgatg ggcgtgcggg atgagcgggt gctggatcgc 480
gcctgcgatc tggggctggc cttccagctg acgaatatcg cccgggatat tattgacgat 540
gcggctattg accgctgcta tctgcccgcc gagtggctgc aggatgccgg gctgaccccg 600
gagaactatg ccgcgaggga gaatcgggcc gcgctggcgc gggtggcgga gcggcttatt 660
gatgccgcag agccgtacta catctcctcc caggccgggc tacacgatct gccgccgcgc 720
tgcgcctggg cgatcgccac cgcccgcagc gtctaccggg agatcggtat taaggtaaaa 780
gcggcgggag gcagcgcctg ggatcgccgc cagcacacca gcaaaggtga aaaaattgcc 840
atgctgatgg cggcaccggt gcaggttatt cgggcgaaga cgacgagggt gacgccgcgt 900
ccggccggtc tttggcagcg tcccgtttag 930
<210> 43
<211> 309
<212> PRT
<213> Artificial Sequence
<220>
<223> crtBM1 amino acid sequence
<400> 43
Met Ser Gln Pro Pro Leu Leu Asp His Ala Thr Gln Thr Met Ala Asn
1 5 10 15
Gly Ser Lys Ser Phe Ala Thr Ala Ala Lys Leu Phe Asp Pro Ala Thr
20 25 30
Arg Arg Ser Val Leu Met Leu Tyr Thr Trp Cys Arg His Cys Asp Asp
35 40 45
Val Ile Asp Asp Gln Thr His Gly Phe Ala Ser Glu Ala Ala Ala Glu
50 55 60
Glu Glu Ala Thr Gln Arg Leu Ala Arg Leu Arg Thr Leu Thr Leu Ala
65 70 75 80
Ala Phe Glu Gly Ala Glu Met Gln Asp Pro Ala Phe Ala Ala Phe Gln
85 90 95
Glu Val Ala Leu Thr His Gly Ile Thr Pro Arg Met Ala Leu Asp His
100 105 110
Leu Asp Gly Phe Ala Met Asp Val Ala Gln Thr Arg Tyr Val Thr Phe
115 120 125
Glu Asp Thr Leu Arg Tyr Cys Tyr His Val Ala Gly Val Val Gly Leu
130 135 140
Met Met Ala Arg Val Met Gly Val Arg Asp Glu Arg Val Leu Asp Arg
145 150 155 160
Ala Cys Asp Leu Gly Leu Ala Phe Gln Leu Thr Asn Ile Ala Arg Asp
165 170 175
Ile Ile Asp Asp Ala Ala Ile Asp Arg Cys Tyr Leu Pro Ala Glu Trp
180 185 190
Leu Gln Asp Ala Gly Leu Thr Pro Glu Asn Tyr Ala Ala Arg Glu Asn
195 200 205
Arg Ala Ala Leu Ala Arg Val Ala Glu Arg Leu Ile Asp Ala Ala Glu
210 215 220
Pro Tyr Tyr Ile Ser Ser Gln Ala Gly Leu His Asp Leu Pro Pro Arg
225 230 235 240
Cys Ala Trp Ala Ile Ala Thr Ala Arg Ser Val Tyr Arg Glu Ile Gly
245 250 255
Ile Lys Val Lys Ala Ala Gly Gly Ser Ala Trp Asp Arg Arg Gln His
260 265 270
Thr Ser Lys Gly Glu Lys Ile Ala Met Leu Met Ala Ala Pro Val Gln
275 280 285
Val Ile Arg Ala Lys Thr Thr Arg Val Thr Pro Arg Pro Ala Gly Leu
290 295 300
Trp Gln Arg Pro Val
305
<210> 44
<211> 930
<212> DNA
<213> Artificial Sequence
<220>
<223> crtBM1-1 nucleic acid sequence
<400> 44
atgagccaac cgccgttgct tgaccacgcc acgcagacca tggccaacgg ctcgaaaagt 60
tttgccaccg ctgcgaagct gttcgacccg gccacccgcc gtagcgtgct gatgctctac 120
acctggtgcc gccactgcga tgacgtcatt gacgaccaga cccacggctt cgccagcgag 180
gccgcggcgg aggaggaggc cacccagcgc ctggcccggc tgcgcacgct gaccctggcg 240
gcgtttgaag gggccgagat gcaggatccg gccttcgctg cctttcagga ggtggcgctg 300
acccacggta ttacgccccg catggcgctc gatcacctcg acggctttgc gatggacgtg 360
gctcagaccc gctatgtcac ctttgaggat acgctgcgct actgctatca cgtggcgggc 420
gtggtgggtc tgatgatggc cagggtgatg ggcgtgcggg atgagcgggt gctggatcgc 480
gcctgcgatc tggggctggc cttccagctg acgaatatcg cccgggatat tattgacgat 540
gcggctattg accgctgcta tctgcccgcc gagtggctgc aggatgccgg gctgaccccg 600
gagaactatg ccgcgcggga gaatcgggcc gcgctggcgc gggtggcgga gcggcttatt 660
gatgccgcag agccgtacta catctcctcc caggccgggc tacacgatct gccgccgcgc 720
tgcgcctggg cgatcgccac cgcccgcagc gtctaccggg agatcggtat taaggtaaaa 780
gcggcgggag gcagcgcctg ggatcgccgc cagcacacca gcaaaggtga aaaaattgcc 840
atgctgatgg cggcaccggg gcaggttatt cgggcgaaga cgacgagggt gacgccgcgt 900
ccggccggtc tttggcagcg tcccgtttag 930
<210> 45
<211> 309
<212> PRT
<213> Artificial Sequence
<220>
<223> crtBM1-1 amino acid sequence
<400> 45
Met Ser Gln Pro Pro Leu Leu Asp His Ala Thr Gln Thr Met Ala Asn
1 5 10 15
Gly Ser Lys Ser Phe Ala Thr Ala Ala Lys Leu Phe Asp Pro Ala Thr
20 25 30
Arg Arg Ser Val Leu Met Leu Tyr Thr Trp Cys Arg His Cys Asp Asp
35 40 45
Val Ile Asp Asp Gln Thr His Gly Phe Ala Ser Glu Ala Ala Ala Glu
50 55 60
Glu Glu Ala Thr Gln Arg Leu Ala Arg Leu Arg Thr Leu Thr Leu Ala
65 70 75 80
Ala Phe Glu Gly Ala Glu Met Gln Asp Pro Ala Phe Ala Ala Phe Gln
85 90 95
Glu Val Ala Leu Thr His Gly Ile Thr Pro Arg Met Ala Leu Asp His
100 105 110
Leu Asp Gly Phe Ala Met Asp Val Ala Gln Thr Arg Tyr Val Thr Phe
115 120 125
Glu Asp Thr Leu Arg Tyr Cys Tyr His Val Ala Gly Val Val Gly Leu
130 135 140
Met Met Ala Arg Val Met Gly Val Arg Asp Glu Arg Val Leu Asp Arg
145 150 155 160
Ala Cys Asp Leu Gly Leu Ala Phe Gln Leu Thr Asn Ile Ala Arg Asp
165 170 175
Ile Ile Asp Asp Ala Ala Ile Asp Arg Cys Tyr Leu Pro Ala Glu Trp
180 185 190
Leu Gln Asp Ala Gly Leu Thr Pro Glu Asn Tyr Ala Ala Arg Glu Asn
195 200 205
Arg Ala Ala Leu Ala Arg Val Ala Glu Arg Leu Ile Asp Ala Ala Glu
210 215 220
Pro Tyr Tyr Ile Ser Ser Gln Ala Gly Leu His Asp Leu Pro Pro Arg
225 230 235 240
Cys Ala Trp Ala Ile Ala Thr Ala Arg Ser Val Tyr Arg Glu Ile Gly
245 250 255
Ile Lys Val Lys Ala Ala Gly Gly Ser Ala Trp Asp Arg Arg Gln His
260 265 270
Thr Ser Lys Gly Glu Lys Ile Ala Met Leu Met Ala Ala Pro Gly Gln
275 280 285
Val Ile Arg Ala Lys Thr Thr Arg Val Thr Pro Arg Pro Ala Gly Leu
290 295 300
Trp Gln Arg Pro Val
305
<210> 46
<211> 930
<212> DNA
<213> Artificial Sequence
<220>
<223> crtBM1-2 nucleic acid sequence
<400> 46
atgagccaac cgccgctgct tgaccacgcc acgcagacca tggccaacgg ctcgaaaagt 60
tttgccaccg ctgcgaagct gttcgacccg gccacccgcc gtagcgtgct gatgctctac 120
acctggtgcc gccactgcga tgacgtcatt gacgaccaga cccacggctt cgccagcgag 180
gccgcggcgg aggaggaggc cacccagcgc ctggcccggc tgcgcacgct gaccctggcg 240
gcgtttgaag gggccgagat gcaggatccg gccttcgctg cctttcagga ggtggcgctg 300
acccacggta ttacgccccg catggcgctc gatcacctcg acggctttgc gatggacgtg 360
gctcagaccc gctatgtcac ctttgaggat acgctgcgct actgctatca cgtggcgggc 420
gtggtgggtc tgatgatggc cagggtgatg ggcgtgcggg atgagcgggt gctggatcgc 480
gcctgcgatc tggggctggc cttccagctg acgaatatcg cccgggatat tattgacgat 540
gcggctattg accgctgcta tctgcccgcc gagtggctgc aggatgccgg gctgaccccg 600
gagaactatg ccgcgaggga gaatcgggcc gcgctggcgc gggtggcgga gcggcttatt 660
gatgccgcag agccgtacta catctcctcc caggccgggc tacacgatct gccgccgcgc 720
tgcgcctggg cgatcgccac cgcccgcagc gtctaccggg agatcggtat taaggtaaaa 780
gcggcgggag gcagcgcctg ggatcgccgc cagcacacca gcaaaggtga aaaaattgcc 840
atgctgatgg cggcaccggg gcaggttatt cgggcgaaga cgacgagggt gacgccgcgt 900
ccggccggtc tttggcagcg tcccgtttag 930
<210> 47
<211> 309
<212> PRT
<213> Artificial Sequence
<220>
<223> crtBM1-2 amino acid sequence
<400> 47
Met Ser Gln Pro Pro Leu Leu Asp His Ala Thr Gln Thr Met Ala Asn
1 5 10 15
Gly Ser Lys Ser Phe Ala Thr Ala Ala Lys Leu Phe Asp Pro Ala Thr
20 25 30
Arg Arg Ser Val Leu Met Leu Tyr Thr Trp Cys Arg His Cys Asp Asp
35 40 45
Val Ile Asp Asp Gln Thr His Gly Phe Ala Ser Glu Ala Ala Ala Glu
50 55 60
Glu Glu Ala Thr Gln Arg Leu Ala Arg Leu Arg Thr Leu Thr Leu Ala
65 70 75 80
Ala Phe Glu Gly Ala Glu Met Gln Asp Pro Ala Phe Ala Ala Phe Gln
85 90 95
Glu Val Ala Leu Thr His Gly Ile Thr Pro Arg Met Ala Leu Asp His
100 105 110
Leu Asp Gly Phe Ala Met Asp Val Ala Gln Thr Arg Tyr Val Thr Phe
115 120 125
Glu Asp Thr Leu Arg Tyr Cys Tyr His Val Ala Gly Val Val Gly Leu
130 135 140
Met Met Ala Arg Val Met Gly Val Arg Asp Glu Arg Val Leu Asp Arg
145 150 155 160
Ala Cys Asp Leu Gly Leu Ala Phe Gln Leu Thr Asn Ile Ala Arg Asp
165 170 175
Ile Ile Asp Asp Ala Ala Ile Asp Arg Cys Tyr Leu Pro Ala Glu Trp
180 185 190
Leu Gln Asp Ala Gly Leu Thr Pro Glu Asn Tyr Ala Ala Arg Glu Asn
195 200 205
Arg Ala Ala Leu Ala Arg Val Ala Glu Arg Leu Ile Asp Ala Ala Glu
210 215 220
Pro Tyr Tyr Ile Ser Ser Gln Ala Gly Leu His Asp Leu Pro Pro Arg
225 230 235 240
Cys Ala Trp Ala Ile Ala Thr Ala Arg Ser Val Tyr Arg Glu Ile Gly
245 250 255
Ile Lys Val Lys Ala Ala Gly Gly Ser Ala Trp Asp Arg Arg Gln His
260 265 270
Thr Ser Lys Gly Glu Lys Ile Ala Met Leu Met Ala Ala Pro Gly Gln
275 280 285
Val Ile Arg Ala Lys Thr Thr Arg Val Thr Pro Arg Pro Ala Gly Leu
290 295 300
Trp Gln Arg Pro Val
305
<210> 48
<211> 930
<212> DNA
<213> Artificial Sequence
<220>
<223> crtBM1-3 nucleic acid sequence
<400> 48
atgagccaac cgccgctgct tgaccacgcc acgcagacca tggccaacgg ctcgaaaagt 60
tttgccaccg ctgcgaagct gttcgacccg gccacccgcc gtagcgtgct gatgctctac 120
acctggtgcc gccactgcga tgacgtcatt gacgaccaga cccacggctt cgccagcgag 180
gccgcggcgg aggaggaggc cacccagcgc ctggcccggc tgcgcacgct gaccctggcg 240
gcgtttgaag gggccgagat gcaggatccg gccttcgctg cctttcagga ggtggcgctg 300
acccacggta ttacgccccg catggcgctc gatcacctcg acggctttgc gatggacgtg 360
gctcagaccc gctatgtcac ctttgaggat acgctgcgct actgctatca cgtggcgggc 420
gtggtgggtc tgatgatggc cagggtgatg ggcgtgcggg atgagcgggt gctggatcgc 480
gcctgcgatc tggggctggc cttccagctg acgaatatcg cccgggatat tattgacgat 540
gcggctattg accgctgcta tctgcccgcc gagtggctgc aggatgccgg gctgaccccg 600
gagaactatg ccgcgcggga gaatcgggcc gcgctggcgc gggtggcgga gcggcttatt 660
gatgccgcag agccgtacta catctcctcc caggccgggc tacacgatct gccgccgcgc 720
tgcgcctggg cgatcgccac cgcccgcagc gtctaccggg agatcggtat taaggtaaaa 780
gcggcgggag gcagcgcctg ggatcgccgc cagcacacca gcaaaggtga aaaaattgcc 840
atgctgatgg cggcaccggt gcaggttatt cgggcgaaga cgacgagggt gacgccgcgt 900
ccggccggtc tttggcagcg tcccgtttag 930
<210> 49
<211> 309
<212> PRT
<213> Artificial Sequence
<220>
<223> crtBM1-3 amino acid sequence
<400> 49
Met Ser Gln Pro Pro Leu Leu Asp His Ala Thr Gln Thr Met Ala Asn
1 5 10 15
Gly Ser Lys Ser Phe Ala Thr Ala Ala Lys Leu Phe Asp Pro Ala Thr
20 25 30
Arg Arg Ser Val Leu Met Leu Tyr Thr Trp Cys Arg His Cys Asp Asp
35 40 45
Val Ile Asp Asp Gln Thr His Gly Phe Ala Ser Glu Ala Ala Ala Glu
50 55 60
Glu Glu Ala Thr Gln Arg Leu Ala Arg Leu Arg Thr Leu Thr Leu Ala
65 70 75 80
Ala Phe Glu Gly Ala Glu Met Gln Asp Pro Ala Phe Ala Ala Phe Gln
85 90 95
Glu Val Ala Leu Thr His Gly Ile Thr Pro Arg Met Ala Leu Asp His
100 105 110
Leu Asp Gly Phe Ala Met Asp Val Ala Gln Thr Arg Tyr Val Thr Phe
115 120 125
Glu Asp Thr Leu Arg Tyr Cys Tyr His Val Ala Gly Val Val Gly Leu
130 135 140
Met Met Ala Arg Val Met Gly Val Arg Asp Glu Arg Val Leu Asp Arg
145 150 155 160
Ala Cys Asp Leu Gly Leu Ala Phe Gln Leu Thr Asn Ile Ala Arg Asp
165 170 175
Ile Ile Asp Asp Ala Ala Ile Asp Arg Cys Tyr Leu Pro Ala Glu Trp
180 185 190
Leu Gln Asp Ala Gly Leu Thr Pro Glu Asn Tyr Ala Ala Arg Glu Asn
195 200 205
Arg Ala Ala Leu Ala Arg Val Ala Glu Arg Leu Ile Asp Ala Ala Glu
210 215 220
Pro Tyr Tyr Ile Ser Ser Gln Ala Gly Leu His Asp Leu Pro Pro Arg
225 230 235 240
Cys Ala Trp Ala Ile Ala Thr Ala Arg Ser Val Tyr Arg Glu Ile Gly
245 250 255
Ile Lys Val Lys Ala Ala Gly Gly Ser Ala Trp Asp Arg Arg Gln His
260 265 270
Thr Ser Lys Gly Glu Lys Ile Ala Met Leu Met Ala Ala Pro Val Gln
275 280 285
Val Ile Arg Ala Lys Thr Thr Arg Val Thr Pro Arg Pro Ala Gly Leu
290 295 300
Trp Gln Arg Pro Val
305
<210> 50
<211> 1578
<212> DNA
<213> Artificial Sequence
<220>
<223> tHMG1 nucleic acid sequence
<400> 50
atggaccaat tggtgaagac tgaagtcacc aagaagtctt ttactgctcc tgtacaaaag 60
gcttctacac cagttttaac caataaaaca gtcatttctg gatcgaaagt caaaagttta 120
tcatctgcgc aatcgagctc atcaggacct tcatcatcta gtgaggaaga tgattcccgc 180
gatattgaaa gcttggataa gaaaatacgt cctttagaag aattagaagc attattaagt 240
agtggaaata caaaacaatt gaagaacaaa gaggtcgctg ccttggttat tcacggtaag 300
ttacctttgt acgctttgga gaaaaaatta ggtgatacta cgagagcggt tgcggtacgt 360
aggaaggctc tttcaatttt ggcagaagct cctgtattag catctgatcg tttaccatat 420
aaaaattatg actacgaccg cgtatttggc gcttgttgtg aaaatgttat aggttacatg 480
cctttgcccg ttggtgttat aggccccttg gttatcgatg gtacatctta tcatatacca 540
atggcaacta cagagggttg tttggtagct tctgccatgc gtggctgtaa ggcaatcaat 600
gctggcggtg gtgcaacaac tgttttaact aaggatggta tgacaagagg cccagtagtc 660
cgtttcccaa ctttgaaaag atctggtgcc tgtaagatat ggttagactc agaagaggga 720
caaaacgcaa ttaaaaaagc ttttaactct acatcaagat ttgcacgtct gcaacatatt 780
caaacttgtc tagcaggaga tttactcttc atgagattta gaacaactac tggtgacgca 840
atgggtatga atatgatttc taagggtgtc gaatactcat taaagcaaat ggtagaagag 900
tatggctggg aagatatgga ggttgtctcc gtttctggta actactgtac cgacaaaaaa 960
ccagctgcca tcaactggat cgaaggtcgt ggtaagagtg tcgtcgcaga agctactatt 1020
cctggtgatg ttgtcagaaa agtgttaaaa agtgatgttt ccgcattggt tgagttgaac 1080
attgctaaga atttggttgg atctgcaatg gctgggtctg ttggtggatt taacgcacat 1140
gcagctaatt tagtgacagc tgttttcttg gcattaggac aagatcctgc acaaaatgtc 1200
gaaagttcca actgtataac attgatgaaa gaagtggacg gtgatttgag aatttccgta 1260
tccatgccat ccatcgaagt aggtaccatc ggtggtggta ctgttctaga accacaaggt 1320
gccatgttgg acttattagg tgtaagaggc ccacatgcta ccgctcctgg taccaacgca 1380
cgtcaattag caagaatagt tgcctgtgcc gtcttggcag gtgaattatc cttatgtgct 1440
gccctagcag ccggccattt ggttcaaagt catatgaccc acaacaggaa acctgctgaa 1500
ccaacaaaac ctaacaattt ggacgccact gatataaatc gtttgaaaga tgggtccgtc 1560
acctgcatta aatcctaa 1578
<210> 51
<211> 525
<212> PRT
<213> Artificial Sequence
<220>
<223> tHMG1 amino acid sequence
<400> 51
Met Asp Gln Leu Val Lys Thr Glu Val Thr Lys Lys Ser Phe Thr Ala
1 5 10 15
Pro Val Gln Lys Ala Ser Thr Pro Val Leu Thr Asn Lys Thr Val Ile
20 25 30
Ser Gly Ser Lys Val Lys Ser Leu Ser Ser Ala Gln Ser Ser Ser Ser
35 40 45
Gly Pro Ser Ser Ser Ser Glu Glu Asp Asp Ser Arg Asp Ile Glu Ser
50 55 60
Leu Asp Lys Lys Ile Arg Pro Leu Glu Glu Leu Glu Ala Leu Leu Ser
65 70 75 80
Ser Gly Asn Thr Lys Gln Leu Lys Asn Lys Glu Val Ala Ala Leu Val
85 90 95
Ile His Gly Lys Leu Pro Leu Tyr Ala Leu Glu Lys Lys Leu Gly Asp
100 105 110
Thr Thr Arg Ala Val Ala Val Arg Arg Lys Ala Leu Ser Ile Leu Ala
115 120 125
Glu Ala Pro Val Leu Ala Ser Asp Arg Leu Pro Tyr Lys Asn Tyr Asp
130 135 140
Tyr Asp Arg Val Phe Gly Ala Cys Cys Glu Asn Val Ile Gly Tyr Met
145 150 155 160
Pro Leu Pro Val Gly Val Ile Gly Pro Leu Val Ile Asp Gly Thr Ser
165 170 175
Tyr His Ile Pro Met Ala Thr Thr Glu Gly Cys Leu Val Ala Ser Ala
180 185 190
Met Arg Gly Cys Lys Ala Ile Asn Ala Gly Gly Gly Ala Thr Thr Val
195 200 205
Leu Thr Lys Asp Gly Met Thr Arg Gly Pro Val Val Arg Phe Pro Thr
210 215 220
Leu Lys Arg Ser Gly Ala Cys Lys Ile Trp Leu Asp Ser Glu Glu Gly
225 230 235 240
Gln Asn Ala Ile Lys Lys Ala Phe Asn Ser Thr Ser Arg Phe Ala Arg
245 250 255
Leu Gln His Ile Gln Thr Cys Leu Ala Gly Asp Leu Leu Phe Met Arg
260 265 270
Phe Arg Thr Thr Thr Gly Asp Ala Met Gly Met Asn Met Ile Ser Lys
275 280 285
Gly Val Glu Tyr Ser Leu Lys Gln Met Val Glu Glu Tyr Gly Trp Glu
290 295 300
Asp Met Glu Val Val Ser Val Ser Gly Asn Tyr Cys Thr Asp Lys Lys
305 310 315 320
Pro Ala Ala Ile Asn Trp Ile Glu Gly Arg Gly Lys Ser Val Val Ala
325 330 335
Glu Ala Thr Ile Pro Gly Asp Val Val Arg Lys Val Leu Lys Ser Asp
340 345 350
Val Ser Ala Leu Val Glu Leu Asn Ile Ala Lys Asn Leu Val Gly Ser
355 360 365
Ala Met Ala Gly Ser Val Gly Gly Phe Asn Ala His Ala Ala Asn Leu
370 375 380
Val Thr Ala Val Phe Leu Ala Leu Gly Gln Asp Pro Ala Gln Asn Val
385 390 395 400
Glu Ser Ser Asn Cys Ile Thr Leu Met Lys Glu Val Asp Gly Asp Leu
405 410 415
Arg Ile Ser Val Ser Met Pro Ser Ile Glu Val Gly Thr Ile Gly Gly
420 425 430
Gly Thr Val Leu Glu Pro Gln Gly Ala Met Leu Asp Leu Leu Gly Val
435 440 445
Arg Gly Pro His Ala Thr Ala Pro Gly Thr Asn Ala Arg Gln Leu Ala
450 455 460
Arg Ile Val Ala Cys Ala Val Leu Ala Gly Glu Leu Ser Leu Cys Ala
465 470 475 480
Ala Leu Ala Ala Gly His Leu Val Gln Ser His Met Thr His Asn Arg
485 490 495
Lys Pro Ala Glu Pro Thr Lys Pro Asn Asn Leu Asp Ala Thr Asp Ile
500 505 510
Asn Arg Leu Lys Asp Gly Ser Val Thr Cys Ile Lys Ser
515 520 525
<210> 52
<211> 1533
<212> DNA
<213> Artificial Sequence
<220>
<223> OLE1 nucleic acid sequence
<400> 52
atgccaactt ctggaactac tattgaattg attgacgacc aatttccaaa ggatgactct 60
gccagcagtg gcattgtcga cgaagtcgac ttaacggaag ctaatatttt ggctactggt 120
ttgaataaga aagcaccaag aattgtcaac ggttttggtt ctttaatggg ctccaaggaa 180
atggtttccg tggaattcga caagaaggga aacgaaaaga agtccaattt ggatcgtctg 240
ctagaaaagg acaaccaaga aaaagaagaa gctaaaacta aaattcacat ctccgaacaa 300
ccatggactt tgaataactg gcaccaacat ttgaactggt tgaacatggt tcttgtttgt 360
ggtatgccaa tgattggttg gtactttgct ctctctggta aagtgccttt gcatttaaac 420
gttttccttt tctccgtttt ctactacgct gtcggtggtg tttctattac tgccggttac 480
catagattat ggtctcacag atcttactcc gctcactggc cattgagatt attctacgct 540
atcttcggtt gtgcttccgt tgaagggtcc gctaaatggt ggggccactc tcacagaatt 600
caccatcgtt acactgatac cttgagagat ccttatgacg ctcgtagagg tctatggtac 660
tcccacatgg gatggatgct tttgaagcca aatccaaaat acaaggctag agctgatatt 720
accgatatga ctgatgattg gaccattaga ttccaacaca gacactacat cttgttgatg 780
ttgttaaccg ctttcgtcat tccaactctt atctgtggtt actttttcaa cgactatatg 840
ggtggtttga tctatgccgg ttttattcgt gtctttgtca ttcaacaagc taccttttgc 900
attaactcct tggctcatta catcggtacc caaccattcg atgacagaag aacccctcgt 960
gacaactgga ttactgccat tgttactttc ggtgaaggtt accataactt ccaccacgaa 1020
ttcccaactg attacagaaa cgctattaag tggtaccaat acgacccaac taaggttatc 1080
atctatttga cttctttagt tggtctagca tacgacttga agaaattctc tcaaaatgct 1140
attgaagaag ccttgattca acaagaacaa aagaagatca ataaaaagaa ggctaagatt 1200
aactggggtc cagttttgac tgatttgcca atgtgggaca aacaaacctt cttggctaag 1260
tctaaggaaa acaagggttt ggttatcatt tctggtattg ttcacgacgt atctggttat 1320
atctctgaac atccaggtgg tgaaacttta attaaaactg cattaggtaa ggacgctacc 1380
aaggctttca gtggtggtgt ctaccgtcac tcaaatgccg ctcaaaatgt cttggctgat 1440
atgagagtgg ctgttatcaa ggaaagtaag aactctgcta ttagaatggc tagtaagaga 1500
ggtgaaatct acgaaactgg taagttcttt taa 1533
<210> 53
<211> 510
<212> PRT
<213> Artificial Sequence
<220>
<223> OLE1 amino acid sequence
<400> 53
Met Pro Thr Ser Gly Thr Thr Ile Glu Leu Ile Asp Asp Gln Phe Pro
1 5 10 15
Lys Asp Asp Ser Ala Ser Ser Gly Ile Val Asp Glu Val Asp Leu Thr
20 25 30
Glu Ala Asn Ile Leu Ala Thr Gly Leu Asn Lys Lys Ala Pro Arg Ile
35 40 45
Val Asn Gly Phe Gly Ser Leu Met Gly Ser Lys Glu Met Val Ser Val
50 55 60
Glu Phe Asp Lys Lys Gly Asn Glu Lys Lys Ser Asn Leu Asp Arg Leu
65 70 75 80
Leu Glu Lys Asp Asn Gln Glu Lys Glu Glu Ala Lys Thr Lys Ile His
85 90 95
Ile Ser Glu Gln Pro Trp Thr Leu Asn Asn Trp His Gln His Leu Asn
100 105 110
Trp Leu Asn Met Val Leu Val Cys Gly Met Pro Met Ile Gly Trp Tyr
115 120 125
Phe Ala Leu Ser Gly Lys Val Pro Leu His Leu Asn Val Phe Leu Phe
130 135 140
Ser Val Phe Tyr Tyr Ala Val Gly Gly Val Ser Ile Thr Ala Gly Tyr
145 150 155 160
His Arg Leu Trp Ser His Arg Ser Tyr Ser Ala His Trp Pro Leu Arg
165 170 175
Leu Phe Tyr Ala Ile Phe Gly Cys Ala Ser Val Glu Gly Ser Ala Lys
180 185 190
Trp Trp Gly His Ser His Arg Ile His His Arg Tyr Thr Asp Thr Leu
195 200 205
Arg Asp Pro Tyr Asp Ala Arg Arg Gly Leu Trp Tyr Ser His Met Gly
210 215 220
Trp Met Leu Leu Lys Pro Asn Pro Lys Tyr Lys Ala Arg Ala Asp Ile
225 230 235 240
Thr Asp Met Thr Asp Asp Trp Thr Ile Arg Phe Gln His Arg His Tyr
245 250 255
Ile Leu Leu Met Leu Leu Thr Ala Phe Val Ile Pro Thr Leu Ile Cys
260 265 270
Gly Tyr Phe Phe Asn Asp Tyr Met Gly Gly Leu Ile Tyr Ala Gly Phe
275 280 285
Ile Arg Val Phe Val Ile Gln Gln Ala Thr Phe Cys Ile Asn Ser Leu
290 295 300
Ala His Tyr Ile Gly Thr Gln Pro Phe Asp Asp Arg Arg Thr Pro Arg
305 310 315 320
Asp Asn Trp Ile Thr Ala Ile Val Thr Phe Gly Glu Gly Tyr His Asn
325 330 335
Phe His His Glu Phe Pro Thr Asp Tyr Arg Asn Ala Ile Lys Trp Tyr
340 345 350
Gln Tyr Asp Pro Thr Lys Val Ile Ile Tyr Leu Thr Ser Leu Val Gly
355 360 365
Leu Ala Tyr Asp Leu Lys Lys Phe Ser Gln Asn Ala Ile Glu Glu Ala
370 375 380
Leu Ile Gln Gln Glu Gln Lys Lys Ile Asn Lys Lys Lys Ala Lys Ile
385 390 395 400
Asn Trp Gly Pro Val Leu Thr Asp Leu Pro Met Trp Asp Lys Gln Thr
405 410 415
Phe Leu Ala Lys Ser Lys Glu Asn Lys Gly Leu Val Ile Ile Ser Gly
420 425 430
Ile Val His Asp Val Ser Gly Tyr Ile Ser Glu His Pro Gly Gly Glu
435 440 445
Thr Leu Ile Lys Thr Ala Leu Gly Lys Asp Ala Thr Lys Ala Phe Ser
450 455 460
Gly Gly Val Tyr Arg His Ser Asn Ala Ala Gln Asn Val Leu Ala Asp
465 470 475 480
Met Arg Val Ala Val Ile Lys Glu Ser Lys Asn Ser Ala Ile Arg Met
485 490 495
Ala Ser Lys Arg Gly Glu Ile Tyr Glu Thr Gly Lys Phe Phe
500 505 510
Claims (14)
- 삭제
- 삭제
- 삭제
- 삭제
- 서열번호 4의 아미노산 서열로 이루어진 CrtB에서 287번째 위치의 글리신(Gly)이 발린(Val)으로 치환된 CrtB 변이체.
- 제5항에 있어서,
상기 CrtB 변이체는 서열번호 43의 아미노산 서열로 이루어진 폴리펩티드인 것을 특징으로 하는, CrtB 변이체. - 삭제
- 삭제
- 삭제
- 서열번호 43의 아미노산 서열로 이루어진 CrtB 변이체를 코딩하는 유전자가 도입된 라이코펜 생산능이 향상된 형질전환된 미생물.
- 제10항에 있어서,
상기 CrtB 변이체를 코딩하는 유전자가 서열번호 42의 염기서열로 이루어진 것을 특징으로 하는, 형질전환된 미생물. - 제10항에 있어서,
상기 미생물은 서열번호 2, 서열번호 12 또는 서열번호 16 의 아미노산 서열로 이루어진 CrtE를 코딩하는 유전자, 및 서열번호 6의 아미노산 서열로 이루어진 CrtI를 코딩하는 유전자가 추가적으로 도입된 것을 특징으로 하는, 형질전환된 미생물. - 제10항 내지 제12항 중 어느 한 항에 있어서,
상기 미생물은 사카로마이세스 세레비지애인 것을 특징으로 하는, 형질전환된 미생물. - 제10항 내지 제12항 중 어느 한 항에 따른 미생물을 배양하는 단계; 및
생성된 라이코펜을 회수하는 단계를 포함하는 라이코펜의 생산 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180077788A KR102068678B1 (ko) | 2018-07-04 | 2018-07-04 | crtE 또는 crtB 돌연변이 유전자 및 이의 용도 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180077788A KR102068678B1 (ko) | 2018-07-04 | 2018-07-04 | crtE 또는 crtB 돌연변이 유전자 및 이의 용도 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200004648A KR20200004648A (ko) | 2020-01-14 |
KR102068678B1 true KR102068678B1 (ko) | 2020-01-21 |
Family
ID=69152966
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180077788A KR102068678B1 (ko) | 2018-07-04 | 2018-07-04 | crtE 또는 crtB 돌연변이 유전자 및 이의 용도 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102068678B1 (ko) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101441613B1 (ko) * | 2007-05-04 | 2014-09-26 | 아미코젠주식회사 | 재조합 대장균을 이용한 라이코펜 생산 방법 |
KR20100050634A (ko) * | 2008-11-06 | 2010-05-14 | 부경대학교 산학협력단 | 라이코펜 생합성에 관여하는 유전자를 포함하는 효모 재조합 벡터, 및 상기 재조합 벡터로 형질전환된 효모 |
-
2018
- 2018-07-04 KR KR1020180077788A patent/KR102068678B1/ko active IP Right Grant
Non-Patent Citations (2)
Title |
---|
NCBI Genbank WP_020503292.1 (2018.04.23.) |
W. Xie 등, Metabolic Engineering, Vol.30, p.69-78 (2015)* |
Also Published As
Publication number | Publication date |
---|---|
KR20200004648A (ko) | 2020-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI608097B (zh) | 用於製造乳酸之微生物及使用該微生物製造乳酸的方法 | |
JP6195668B2 (ja) | L−リジン生産能が向上した微生物、及びそれを利用してl−リジンを生産する方法 | |
CN106459881B (zh) | 乳酸生产率提高的微生物和使用其生产乳酸的方法 | |
US20120122169A1 (en) | Mutant yqhd enzyme for the production of a biochemical by fermentation | |
Li et al. | Construction of an efficient mutant strain of Trichosporonoides oedocephalis with HOG1 gene deletion for production of erythritol | |
KR102112286B1 (ko) | 내산성 관련 유전자 및 이를 포함하는 메탄자화균 | |
JP2020526213A (ja) | エクトイン産生酵母 | |
KR20180127239A (ko) | 헴, 코프로포르피린 iii 및 우로포르피린 iii의 생산능력이 향상된 재조합 미생물 및 이를 이용한 헴, 코프로포르피린 iii 및 우로포르피린 iii의 생산방법 | |
CN105296371A (zh) | 具有改进的生产力的酵母和产生产物的方法 | |
WO2009065777A1 (en) | Dicarboxylic acid production in a filamentous fungus | |
KR102068678B1 (ko) | crtE 또는 crtB 돌연변이 유전자 및 이의 용도 | |
KR102235545B1 (ko) | 라이코펜을 생산하는 형질전환된 미생물 및 이를 이용하여 라이코펜을 생산하는 방법 | |
KR101760219B1 (ko) | L-라이신 생산능이 향상된 미생물 및 이를 이용한 l-라이신 생산방법 | |
KR101768390B1 (ko) | L-라이신 생산능이 향상된 미생물 및 이를 이용한 l-라이신 생산방법 | |
CN107109357A (zh) | 能生产o‑琥珀酰高丝氨酸或琥珀酸的微生物和用其生产琥珀酸或o‑琥珀酰高丝氨酸方法 | |
KR101686899B1 (ko) | 신규한 클루이베로마이세스 막시아누스 mj1 및 이의 용도 | |
CN111676205B (zh) | L-赖氨酸生产力提高的微生物和利用其生产l-赖氨酸的方法 | |
KR102613937B1 (ko) | 갈락토스 이용에 관여하는 모든 유전자가 결손된 효모 균주 및 이를 이용한 재조합 단백질 생산방법 | |
CN110869503A (zh) | 甲硫氨酸生产酵母 | |
CN112662696B (zh) | 一种生物合成对豆香酸的工程蓝细菌及其制备方法 | |
JP6020875B2 (ja) | グルタチオンの製造方法 | |
WO2012103263A2 (en) | Compositions and methods for malate and fumarate production | |
TWI659101B (zh) | 具有增進乳酸生產力之微生物及使用該微生物生產乳酸之方法 | |
EP3309247A1 (en) | Microorganism having improved production of lactic acid and method for producing lactic acid by using same | |
WO2023020634A1 (zh) | 超氧化物歧化酶在制备lcda中的应用及过表达其的基因工程菌 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GRNT | Written decision to grant |