KR20230138333A

KR20230138333A - 헤마토코쿠스 플루비알리스 유래의 제라닐제라닐 피로포스페이트 신타아제를 포함하는 카로티노이드 또는 이를 전구체로 하는 물질 생산 미생물 및 이를 이용한 카로티노이드 또는 레티노이드 생산방법

Info

Publication number: KR20230138333A
Application number: KR1020220036258A
Authority: KR
Inventors: 이동필; 박혜민; 이베드로; 김재응
Original assignee: 씨제이제일제당 (주)
Priority date: 2022-03-23
Filing date: 2022-03-23
Publication date: 2023-10-05
Also published as: WO2023182583A1

Abstract

본 출원은 헤마토코쿠스 플루비알리스(Haematococcus pluvialis) 유래의 제라닐제라닐 피로포스페이트 신타아제(Geranylgeranyl pyrophosphate synthase)를 발현하는, 카로티노이드 또는 이를 전구체로 하는 물질의 생산능을 갖는 야로위아 속 미생물; 이를 이용한 카로티노이드 또는 이를 전구체로 하는 물질 생산방법; 카로티노이드 또는 이를 전구체로 하는 물질 생산용 조성물; 및 상기 야로위아 속 미생물 또는 이의 배양물의 카로티노이드 또는 이를 전구체로 하는 물질 생산 용도에 관한 것이다.

Description

헤마토코쿠스 플루비알리스 유래의 제라닐제라닐 피로포스페이트 신타아제를 포함하는 카로티노이드 또는 이를 전구체로 하는 물질 생산 미생물 및 이를 이용한 카로티노이드 또는 레티노이드 생산방법 {Microorganism comprising Geranylgeranyl pyrophosphate synthase derived from Haematococcus pluvialis, for producing carotenoid or compound in which a precursor thereof is carotenoid, and method using the same}

카로티노이드 및 레티노이드는 식물 및 동물에서 다양한 기능을 발휘함에 따라, 식품, 사료 등 다방면의 산업 분야에서 이용되고 있다. 그 중에서도 베타카로틴과 같은 카로티노이드는 자유라디칼 제거, 동물에서 비타민 A의 모체, 척추동물의 면역시스템 증강, 및 폐암 위험성 감소와 같은 기능이 보고된 물질이며, 레티노이드는 비타민 A인 레티놀과 화학적으로 연관된 물질군으로서 화장품, 피부질환 치료제 등으로도 사용되기도 한다.

그러나, 이러한 장점에도 불구하고, 카로티노이드(예를 들어, 베타카로틴) 및 레티노이드(예를 들어, 레티놀)은 동물의 체내에서 합성되지 않거나 합성량이 부족하다. 또한, 변이된 미생물을 이용하여 산업적 생산을 도모하더라도(미국등록특허 제7745170호), 여전히 이들을 고순도로 생산하는 것이 어려운 실정이다.

일 예로, 카로티노이드 또는 레티노이드를 생산하는 미생물을 제작하는 과정에서 스쿠알렌(C30) 등이 부산물로 함께 생산될 수 있다. 그러므로, 카로티노이드 또는 레티노이드를 효율적으로 생산하는 데에 기여하는 제라닐제라닐 피로포스페이트 신타아제 발굴이 이들의 생성량 증대 및 경쟁경로에서 생성되는 스쿠알렌 감소를 위해 필수적이다.

본 출원의 하나의 목적은 헤마토코쿠스 플루비알리스 유래의 제라닐제라닐 피로포스페이트 신타아제를 발현하는, 카로티노이드 또는 이를 전구체로 하는 물질의 생산능을 갖는 야로위아 속 미생물을 제공하는 것이다.

본 출원의 다른 하나의 목적은 상기 야로위아 속 미생물을 이용한 카로티노이드 또는 이를 전구체로 하는 물질 생산방법을 제공하는 것이다.

본 출원의 또 다른 하나의 목적은 상기 야로위아 속 미생물 또는 이의 배양물을 포함하는 카로티노이드 또는 이를 전구체로 하는 물질 생산용 조성물을 제공하는 것이다.

본 출원의 또 다른 하나의 목적은 상기 야로위아 속 미생물 또는 이의 배양물의 카로티노이드 또는 이를 전구체로 하는 물질 생산 용도를 제공하는 것이다.

이를 구체적으로 설명하면 다음과 같다. 한편, 본 출원에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시 형태에도 적용될 수 있다. 즉, 본 출원에서 개시된 다양한 요소들의 모든 조합이 본 출원의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 출원의 범주가 제한된다고 볼 수 없다. 또한, 본 명세서 전체에 걸쳐 다수의 논문 및 특허문헌이 참조되고 그 인용이 표시되어 있다. 인용된 논문 및 특허문헌의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 출원이 속하는 기술 분야의 수준 및 본 출원의 내용이 보다 명확하게 설명된다.

본 출원의 일 양태는 헤마토코쿠스 플루비알리스(Haematococcus pluvialis) 유래의 제라닐제라닐 피로포스페이트 신타아제(Geranylgeranyl pyrophosphate synthase)를 발현하는, 카로티노이드 또는 이를 전구체로 하는 물질의 생산능을 갖는, 야로위아 속 미생물을 제공한다.

본 출원에서 "제라닐제라닐 피로포스페이트 신타아제(Geranylgeranyl pyrophosphate synthase)"는 제라닐제라닐 피로포스페이트(Geranylgeranyl pyrophosphate; GGPP)의 합성을 촉매할 수 있는 효소이다. 상기 제라넬제라닐 피로포스페이트 신타아제의 기질은 이소펜테닐 피로포스페이트(isopentenyl pyrophosphate; IPP) 및 디메틸알릴 피로포스페이트(dimethylallyl pyrophosphate; DMAPP)일 수 있다. 상기 제라닐제라닐 피로포스페이트 신타아제는 'GGS', 'GGPPS', 'GGPS', 'GGPPS1' 또는 '제라닐제라닐 피로포스페이트 신타아제 활성을 갖는 폴리펩티드'로도 명명될 수 있다.

일 구현 예로, 본 출원의 미생물은 외래 단백질인 헤마토코쿠스 플루비알리스 유래의 제라닐제라닐 피로포스페이트 신타아제 단백질을 포함하거나 발현하는 야로위아 속 미생물로서, 카로티노이드 또는 이를 전구체로 하는 물질의 생산능을 갖는 것일 수 있다.

본 출원의 GGPPS 단백질의 아미노산 서열은 GGPPS 유전자에 의해 코딩되는 제라닐제라닐 피로포스페이트 신타아제 활성을 갖는 단백질 서열일 수 있다. 상기 아미노산 서열은 공지의 데이터 베이스인 NCBI의 GenBank 등 다양한 데이터 베이스에서 그 서열을 얻을 수 있으나, 이에 제한되지 않는다.

일 구현 예로, 본 출원의 GGPPS 단백질은 헤마토코쿠스 플루비알리스(Haematococcus pluvialis) 유래일 수 있고, 이와 동일한 서열 또는 활성을 갖는 한 본 출원에 포함된다.

일 구현 예로, 본 출원의 GGPPS 단백질은 서열번호 103 또는 이와 80% 이상의 상동성 또는 동일성을 갖는 아미노산 서열을 포함하거나, 가지거나, 이루어지거나, 상기 아미노산 서열로 필수적으로 이루어지는(essentially consisting of) 것일 수 있다.

또한, 본 출원의 GGPPS 단백질의 일 구현 예를 서열번호 103를 포함하는 단백질로 기재하였으나, 서열번호 103의 아미노산 서열 앞뒤로의 무의미한 서열 추가 또는 자연적으로 발생할 수 있는 돌연변이, 또는 이의 잠재성 돌연변이(silent mutation)를 제외하는 것이 아니며, 상기 아미노산 서열을 포함하는 단백질과 서로 동일 또는 상응하는 활성을 가지는 경우라면 본 출원의 GGPPS 단백질에 해당됨은 당업자에게 자명하다.

구체적으로, 본 출원의 GGPPS 단백질은 서열번호 103의 아미노산 서열을 포함하거나, 또는 서열번호 103의 아미노산 서열과 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 상동성 또는 동일성을 가지는 아미노산 서열을 포함할 수 있다. 또한, 상기 상동성 또는 동일성을 가지며, 상기 단백질에 상응하는 효능을 나타내는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 가지더라도 본 출원의 범위 내에 포함됨은 자명하다.

본 출원에서 '특정 서열번호로 기재된 아미노산 서열을 포함하는 폴리펩티드 또는 단백질', '특정 서열번호로 기재된 아미노산 서열로 이루어진 폴리펩티드 또는 단백질' 또는 '특정 서열번호로 기재된 아미노산 서열을 갖는 폴리펩티드 또는 단백질'라고 기재되어 있더라도, 해당 서열번호의 아미노산 서열로 이루어진 폴리펩티드와 동일 혹은 상응하는 활성을 가지는 경우라면, 일부 서열이 결실, 변형, 치환, 보존적 치환 또는 부가된 아미노산 서열을 갖는 단백질도 본 출원에서 사용될 수 있음은 자명하다. 예를 들어, 상기 아미노산 서열 N-말단, 내부, 그리고/또는 C-말단에 단백질의 기능을 변경하지 않는 서열 추가, 자연적으로 발생할 수 있는 돌연변이, 이의 잠재성 돌연변이 (silent mutation) 또는 보존적 치환을 가지는 경우이다.

상기 "보존적 치환(conservative substitution)"은 한 아미노산을 유사한 구조적 및/또는 화학적 성질을 갖는 또 다른 아미노산으로 치환시키는 것을 의미한다. 이러한 아미노산 치환은 일반적으로 잔기의 극성, 전하, 용해도, 소수성, 친수성 및/또는 양친매성(amphipathic nature)에서의 유사성에 근거하여 발생할 수 있다. 통상적으로, 보존적 치환은 폴리펩티드의 활성에 거의 영향을 미치지 않거나 또는 영향을 미치지 않을 수 있다.

본 출원에서 용어, '상동성 (homology)' 또는 '동일성 (identity)'은 두 개의 주어진 아미노산 서열 또는 염기 서열 상호간 동일 또는 유사한 정도를 의미하며 백분율로 표시될 수 있다. 용어 상동성 및 동일성은 종종 상호교환적으로 이용될 수 있다.

보존된(conserved) 폴리뉴클레오티드 또는 폴리펩티드의 서열 상동성 또는 동일성은 표준 배열 알고리즘에 의해 결정되며, 사용되는 프로그램에 의해 확립된 디폴트 갭 페널티가 함께 이용될 수 있다. 실질적으로, 상동성을 갖거나(homologous) 또는 동일한(identical) 서열은 일반적으로 서열 전체 또는 전체-길이의 적어도 약 50%, 60%, 70%, 80% 또는 90%에 해당하는 일부분과 중간 또는 높은 엄격한 조건(stringent conditions)에서 하이브리드할 수 있다. 하이브리드화에는 폴리뉴클레오티드에서 일반 코돈 또는 코돈 축퇴성을 고려한 코돈을 함유하는 폴리뉴클레오티드와의 하이브리드화 역시 포함됨이 자명하다.

임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는, 예를 들어, Pearson et al (1988) [Proc. Natl. Acad. Sci. USA 85]: 2444에서와 같은 디폴트 파라미터를 이용하여 "FASTA" 프로그램과 같은 공지의 컴퓨터 알고리즘을 이용하여 결정될 수 있다. 또는, EMBOSS 패키지의 니들만 프로그램(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277)(버전 5.0.0 또는 이후 버전)에서 수행되는 바와 같은, 니들만-운치(Needleman-Wunsch) 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)이 사용되어 결정될 수 있다(GCG 프로그램 패키지 (Devereux, J., et al, Nucleic Acids Research 12: 387 (1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [ET AL, J MOLEC BIOL 215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop, [ED.,] Academic Press, San Diego,1994, 및 [CARILLO ETA/.](1988) SIAM J Applied Math 48: 1073을 포함한다). 예를 들어, 국립 생물공학 정보 데이터베이스 센터의 BLAST, 또는 ClustalW를 이용하여 상동성, 유사성 또는 동일성을 결정할 수 있다.

폴리뉴클레오티드 또는 폴리펩티드의 상동성, 유사성 또는 동일성은, 예를 들어, Smith and Waterman, Adv. Appl. Math (1981) 2:482 에 공지된 대로, 예를 들면, Needleman et al. (1970), J Mol Biol. 48:443과 같은 GAP 컴퓨터 프로그램을 이용하여 서열 정보를 비교함으로써 결정될 수 있다. 요약하면, GAP 프로그램은 두 서열 중 더 짧은 것에서의 기호의 전체 수로, 유사한 배열된 기호(즉, 뉴클레오티드 또는 아미노산)의 수를 나눈 값으로 정의할 수 있다. GAP 프로그램을 위한 디폴트 파라미터는 (1) 이진법 비교 매트릭스(동일성을 위해 1 그리고 비-동일성을 위해 0의 값을 함유함) 및 Schwartz and Dayhoff, eds., Atlas Of Protein Sequence And Structure, National Biomedical Research Foundation, pp. 353-358 (1979)에 의해 개시된 대로, Gribskov et al(1986) Nucl. Acids Res. 14: 6745의 가중된 비교 매트릭스 (또는 EDNAFULL (NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스); (2) 각 갭을 위한 3.0의 페널티 및 각 갭에서 각 기호를 위한 추가의 0.10 페널티 (또는 갭 개방 패널티 10, 갭 연장 패널티 0.5); 및 (3) 말단 갭을 위한 무 페널티를 포함할 수 있다.

또한, 임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는 정의된 엄격한 조건하에서 써던 혼성화 실험에 의해 서열을 비교함으로써 확인할 수 있으며, 정의되는 적절한 혼성화 조건은 해당 기술 범위 내이고, 당업자에게 잘 알려진 방법(예컨대, J. Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor, New York, 1989; F.M. Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York)으로 결정될 수 있다.

본 출원에서 단백질의 발현은 미생물 내로 단백질을 코딩하는 유전자(폴리뉴클레오티드)를 도입하거나 또는 단백질의 주입에 의한 것일 수 있으나, 이에 제한되지 않는다.

일 구현 예로, 본 출원의 미생물은 헤마토코쿠스 플루비알리스(Haematococcus pluvialis) 유래의 제라닐제라닐 피로포스페이트 신타아제 유전자가 도입된 것일 수 있다. 또한, 제라닐제라닐 피로포스페이트 신타아제 유전자 도입은 상기 도입 후 추가적으로 이의 활성을 강화하는 것도 포함할 수 있다.

본 출원에서, 제라닐제라닐 피로포스페이트 신타아제 유전자'는 'ggs', 'ggpps', 'ggps', 'GGS 유전자', 'GGPPS 유전자', 'GGPS 유전자'. '제라닐제라닐 피로포스페이트 신타아제를 코딩하는 유전자', '제라닐제라닐 피로포스페이트 신타아제를 코딩하는 폴리뉴클레오티드', 또는 '제라닐제라닐 피로포스페이트 신타아제 활성을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드'와 혼용되어 사용될 수 있다.

상기 제라닐제라닐 피로포스페이트 신타아제 유전자는 공지의 데이터 베이스인 NCBI의 GenBank 등 다양한 데이터 베이스에서 그 서열을 얻을 수 있으나, 이에 제한되지 않는다.

일 구현 예로, 헤마토코쿠스 플루비알리스(Haematococcus pluvialis) 유래의 제라닐제라닐 피로포스페이트 신타아제 유전자는 서열번호 1의 염기서열을 포함하거나, 가지거나, 또는 이루어지는 것일 수 있으나, 이에 제한되지 않는다.

일 구현 예로, 서열번호 1의 염기서열로 구성되는 제라닐제라닐 피로포스페이트 신타아제 유전자는 야로위아 속 미생물 또는 보다 구체적으로 야로위아 리폴리티카에 적합하도록 코돈 최적화된 것일 수 있다.

본 출원에서 용어, "폴리뉴클레오티드"는 뉴클레오티드 단위체(monomer)가 공유결합에 의해 길게 사슬모양으로 이어진 뉴클레오티드의 중합체(polymer)로 일정한 길이 이상의 DNA 가닥이다.

상기 폴리뉴클레오티드 또는 유전자는 코돈의 축퇴성(degeneracy)으로 인하여 또는 상기 제라닐제라닐 피로포스페이트 신타아제 폴리펩티드를 발현시키고자 하는 생물에서 선호되는 코돈을 고려하여, 폴리펩티드의 아미노산 서열을 변화시키지 않는 범위 내에서 코딩 영역에 다양한 변형이 이루어질 수 있다. 상기 폴리뉴클레오티드 또는 유전자는 예를 들면 서열번호 1의 염기서열을 포함할 수 있으며, 이와 상동성 또는 동일성이 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상인 염기서열로 이루어질 수 있으나, 이에 제한되지 않는다.

또한, 본 출원의 폴리뉴클레오티드 또는 유전자는 공지의 유전자 서열로부터 제조될 수 있는 프로브, 예를 들면, 상기 염기 서열의 전체 또는 일부에 대한 상보 서열과 엄격한 조건 하에 하이드리드화하여, 서열번호 103의 아미노산 서열을 코딩하는 서열이라면 제한없이 포함될 수 있다. 상기 “엄격한 조건(stringent condition)”이란 폴리뉴클레오티드 간의 특이적 혼성화를 가능하게 하는 조건을 의미한다. 이러한 조건은 문헌(예컨대, J. Sambrook et al., 상동)에 구체적으로 기재되어 있다. 예를 들어, 상동성 또는 동일성이 높은 폴리뉴클레오티드끼리, 40% 이상, 구체적으로 90% 이상, 보다 구체적으로 95% 이상, 96% 이상, 97% 이상, 98% 이상, 더욱 구체적으로 99% 이상의 상동성 또는 동일성을 갖는 폴리뉴클레오티드끼리 하이브리드화하고, 그보다 상동성 또는 동일성이 낮은 폴리뉴클레오티드끼리 하이브리드화하지 않는 조건, 또는 통상의 써던 하이브리드화(southern hybridization)의 세척 조건인 60℃, 1×SSC, 0.1% SDS, 구체적으로 60℃, 0.1×SSC, 0.1% SDS, 보다 구체적으로 68℃, 0.1×SSC, 0.1% SDS에 상당하는 염 농도 및 온도에서, 1회, 구체적으로 2회 내지 3회 세정하는 조건을 열거할 수 있다.

혼성화는 비록 혼성화의 엄격도에 따라 염기 간의 미스매치(mismatch)가 가능할지라도, 두 개의 핵산이 상보적 서열을 가질 것을 요구한다. 용어, “상보적”은 서로 혼성화가 가능한 뉴클레오티드 염기 간의 관계를 기술하는데 사용된다. 예를 들면, DNA에 관하여, 아데닌은 티민에 상보적이며 시토신은 구아닌에 상보적이다. 따라서, 본 출원의 폴리뉴클레오티드는 또한 실질적으로 유사한 핵산 서열뿐만 아니라 전체 서열에 상보적인 단리된 핵산 단편을 포함할 수 있다.

구체적으로, 상동성 또는 동일성을 가지는 폴리뉴클레오티드는 55 ℃의 Tm 값에서 혼성화 단계를 포함하는 혼성화 조건을 사용하고 상술한 조건을 사용하여 탐지할 수 있다. 또한, 상기 Tm 값은 60 ℃, 63 ℃ 또는 65 ℃일 수 있으나, 이에 제한되는 것은 아니고 그 목적에 따라 당업자에 의해 적절히 조절될 수 있다.

폴리뉴클레오티드를 혼성화하는 적절한 엄격도는 폴리뉴클레오티드의 길이 및 상보성 정도에 의존하고 변수는 해당기술분야에 잘 알려져 있다(Sambrook et al., supra, 9.50-9.51, 11.7-11.8 참조).

일 구현 예로, 본 출원의 미생물은 본 출원의 헤마토코쿠스 플루비알리스 유래의 제라닐제라닐 피로포스페이트 신타아제 유전자 또는 헤마토코쿠스 플루비알리스 유래의 제라닐제라닐 피로포스페이트 신타아제를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 포함할 수 있다.

본 출원의 벡터는 적합한 숙주 내에서 목적 폴리펩티드를 발현시킬 수 있도록 적합한 발현조절영역(또는 발현조절서열)에 작동 가능하게 연결된 상기 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드의 염기서열을 포함하는 DNA 제조물을 포함할 수 있다. 상기 발현조절영역은 전사를 개시할 수 있는 프로모터, 그러한 전사를 조절하기 위한 임의의 오퍼레이터 서열, 적합한 mRNA 리보좀 결합부위를 코딩하는 서열, 및 전사 및 해독의 종결을 조절하는 서열을 포함할 수 있다. 벡터는 적당한 숙주세포 내로 형질전환된 후, 숙주 게놈과 무관하게 복제되거나 기능할 수 있으며, 게놈 그 자체에 통합될 수 있다.

본 출원에서 사용되는 벡터는 특별히 한정되지 않으며, 당업계에 알려진 임의의 벡터를 이용할 수 있다. 통상 사용되는 벡터의 예로는 천연 상태이거나 재조합된 상태의 플라스미드, 코스미드, 바이러스 및 박테리오파지를 들 수 있다. 예를 들어, 파지 벡터 또는 코스미드 벡터로서 pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, 및 Charon21A 등을 사용할 수 있으며, 플라스미드 벡터로서 pDZ계, pBR계, pUC계, pBluescriptII계, pGEM계, pTZ계, pCL계 및 pET계 등을 사용할 수 있다. 구체적으로는 pDZ, pDC, pDCM2(대한민국 공개특허공보 제10-2020-0136813호), pACYC177, pACYC184, pCL, pECCG117, pUC19, pBR322, pMW118, pCC1BAC, pIMR53 벡터 등을 사용할 수 있다.

일례로 세포 내 염색체 삽입용 벡터를 통해 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드를 염색체 내로 삽입할 수 있다. 상기 폴리뉴클레오티드의 염색체 내로의 삽입은 당업계에 알려진 임의의 방법, 예를 들면, 상동재조합(homologous recombination)에 의하여 이루어질 수 있으나, 이에 한정되지는 않는다. 상기 염색체 삽입 여부를 확인하기 위한 선별 마커(selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 벡터로 형질전환된 세포를 선별, 즉 목적 핵산 분자의 삽입 여부를 확인하기 위한 것으로, 약물 내성, 영양 요구성, 세포 독성제에 대한 내성 또는 표면 폴리펩티드의 발현과 같은 선택가능 표현형을 부여하는 마커들이 사용될 수 있다. 선택제(selective agent)가 처리된 환경에서는 선별 마커를 발현하는 세포만 생존하거나 다른 표현 형질을 나타내므로, 형질전환된 세포를 선별할 수 있다.

본 출원에서 용어 "형질전환"은 표적 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 숙주세포 혹은 미생물 내에 도입하여 숙주세포 내에서 상기 폴리뉴클레오티드가 코딩하는 폴리펩티드가 발현할 수 있도록 하는 것을 의미한다. 형질전환된 폴리뉴클레오티드는 숙주세포 내에서 발현될 수 있기만 한다면, 숙주세포의 염색체 내에 삽입되어 위치하거나 염색체 외에 위치하거나 상관없이 이들 모두를 포함할 수 있다. 또한, 상기 폴리뉴클레오티드는 목적 폴리펩티드를 코딩하는 DNA 및/또는 RNA를 포함한다. 상기 폴리뉴클레오티드는 숙주세포 내로 도입되어 발현될 수 있는 것이면, 어떠한 형태로도 도입될 수 있다. 예를 들면, 상기 폴리뉴클레오티드는 자체적으로 발현되는데 필요한 모든 요소를 포함하는 유전자 구조체인 발현 카세트(expression cassette)의 형태로 숙주세포에 도입될 수 있다. 상기 발현 카세트는 통상 상기 폴리뉴클레오티드에 작동 가능하게 연결되어 있는 프로모터(promoter), 전사 종결신호, 리보좀 결합부위 및 번역 종결신호를 포함할 수 있다. 상기 발현 카세트는 자체 복제가 가능한 발현 벡터 형태일 수 있다. 또한, 상기 폴리뉴클레오티드는 그 자체의 형태로 숙주세포에 도입되어 숙주세포에서 발현에 필요한 서열과 작동 가능하게 연결되어 있는 것일 수도 있으며, 이에 제한되지 않는다.

또한, 상기에서 용어 "작동 가능하게 연결"된 것이란 본 출원의 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드의 전사를 개시 및 매개하도록 하는 프로모터 서열과 상기 폴리뉴클레오티드 서열이 기능적으로 연결되어 있는 것을 의미한다.

일 구현 예로, 본 출원의 헤마토코쿠스 플루비알리스 유래 GGPPS를 발현하는 야로위아 속 미생물에서 이를 발현하지 않는 야로위아 속 미생물에 비해 제라닐제라닐 피로포스페이트 신타아제 활성이 강화된 것일 수 있으나, 이에 제한되지 않는다.

일 구현 예로, 본 출원의 헤마토코쿠스 플루비알리스 유래의 GGPPS 유전자가 도입된 야로위아 속 미생물에서 헤마토코쿠스 플루비알리스 유래의 GGPPS 유전자가 도입되지 않은 야로위아 속 미생물에 비해 제라닐제라닐 피로포스페이트 신타아제 활성이 강화된 것일 수 있으나, 이에 제한되지 않는다.

일 구현 예로, 본 출원의 헤마토코쿠스 플루비알리스 유래의 GGPPS 유전자에 의해 코딩되는 제라닐제라닐 피로포스페이트 신타아제가 도입된 야로위아 속 미생물은 크산토필마로마이세스 덴드로로스(Xanthophyllomyces dendrorhous) 유래의 crtE 또는 이의 변이 유전자 crtEM1, 사카로마이세스 세레비지에(Saccharomyces cerevisiae) 유래의 BTS1 유전자, 또는 야로위아 리폴리티카(Yarrowia lipolytica) 유래 GGS1 유전자에 의해 코딩되는 제라닐제라닐 피로포스페이트 신타아제가 도입된 야로위아 속 미생물에 비해 제라닐제라닐 피로포스페이트 신타아제 활성이 강화된 것일 수 있으나, 이에 제한되지 않는다.

본 출원에서 용어, "야로위아 속 미생물" 또는 "야로위아 속 균주"는 야로위아 속 야생형 미생물이나 자연적 또는 인위적으로 유전적 변형이 일어난 야로위아 속 미생물을 모두 포함하며, 외부 유전자가 삽입되거나 내재적 유전자의 활성이 강화되거는 등의 원인으로 인해서 특정 기작이 강화된 야로위아 속 미생물로서, 카로티노이드 또는 이를 전구체로 하는 물질의 생산을 위하여 헤마토코쿠스 플루비알리스 유래의 GGPPS 유전자를 포함하는 야로위아 속 미생물일 수 있다.

본 출원의 미생물은 본 출원의 GGPPS 단백질, 상기 GGPPS 단백질을 코딩하는 GGPS 유전자 또는 폴리뉴클레오티드, 또는 상기 유전자 또는 폴리뉴클레오티드를 포함하는 벡터 중 어느 하나 이상을 포함하는 미생물; 본 출원의 헤마토코쿠스 플루비알리스 유래의 GGPPS 단백질 또는 GGPPS 유전자를 발현하도록 변형된 미생물; 본 출원의 헤마토코쿠스 플루비알리스 유래의 GGPPS 단백질 또는 GGPPS 유전자를 발현하는 미생물(예컨대, 재조합 균주); 또는 본 출원의 헤마토코쿠스 플루비알리스 유래의 GGPPS 활성을 갖는 균주 (예컨대, 재조합 균주)일 수 있으나, 이에 제한되지 않는다.

본 출원의 균주는 자연적으로 제라닐제라닐 피로포스페이트 신타아제, 또는 카로티노이드 또는 이를 전구체로 하는 물질의 생산능을 가지고 있는 미생물; 또는 제라닐제라닐 피로포스페이트 신타아제, 또는 카로티노이드 또는 이를 전구체로 하는 물질의 생산능이 없는 모균주에 본 출원의 헤마토코쿠스 플루비알리스 유래의 GGPPS 단백질, 유전자, 폴리뉴클레오티드, 또는 이를 포함하는 벡터가 도입되어 제라닐제라닐 피로포스페이트 신타아제 및 카로티노이드 또는 이를 전구체로 하는 물질의 생산능이 강화되거나 부여된 미생물일 수 있으나 이에 제한되지 않는다.

일 예로, 본 출원의 균주는 본 출원의 헤마토코쿠스 플루비알리스 유래의 GGPPS 단백질, 유전자, 폴리뉴클레오티드, 또는 이를 포함하는 벡터로 형질전환되어, 카로티노이드 또는 이를 전구체로 하는 물질을 생산할 수 있거나 생산능이 증가된 미생물을 모두 포함할 수 있다. 예를 들어, 본 출원의 균주는 천연의 야생형 미생물 또는 카로티노이드 또는 이를 전구체로 하는 물질을 생산하는 미생물에 본 출원의 헤마토코쿠스 플루비알리스 유래의 GGPPS가 발현되어, 카로티노이드 또는 이를 전구체로 하는 물질 생산능이 증가된 재조합 균주일 수 있다. 상기 카로티노이드 또는 이를 전구체로 하는 물질 생산능이 증가된 재조합 균주는, 천연의 야생형 미생물 또는 제라닐제라닐 피로포스페이트 신타아제 비변형 미생물 (즉, 야생형 제라닐제라닐 피로포스페이트 신타아제 유전자(서열번호 11)를 포함하는 야로위아 속 미생물 또는 헤마토코쿠스 플루비알리스 유래의 제라닐제라닐 피로포스페이트 신타아제 유전자(서열번호 1)가 도입되지 않는 야로위아 속 미생물)에 비하여 카로티노이드 또는 이를 전구체로 하는 물질 생산능이 증가된 미생물일 수 있으나, 이에 제한되는 것은 아니다.

일 예로, 본 출원의 카로티노이드 또는 이를 전구체로 하는 물질 생산능이 증가된 균주는 헤마토코쿠스 플루비알리스 유래의 GGPPS(일 예로, 서열번호 103)를 포함하지 않거나; 크산토필마로마이세스 덴드로로스 유래의 CrtE 또는 이의 변이형 CrtEM1, 사카로마이세스 세레비지에(Saccharomyces cerevisiae) 유래의 BTS1, 또는 야로위아 리폴리티카(Yarrowia lipolytica) GGS1을 포함하는 야로위아 속 미생물과 비교하여 카로티노이드 또는 이를 전구체로 하는 물질의 생산능이 증가된 미생물일 수 있으나, 이에 제한되지 않는다. 그 예로, 상기 카로티노이드 또는 이를 전구체로 하는 물질 생산능의 증가 여부를 비교하는 대상 균주인, 비변형 미생물은 CC08-1023균주 일 수 있으나, 이에 제한되지 않는다.

일 예로, 상기 생산능이 증가된 재조합 균주는 변이 전 모균주 또는 비변형 미생물의 베타카로틴 또는 레티놀 생산능에 비하여 약 0.001% 이상 또는 0.01% 이상 베타카로틴 또는 레티놀 생산능이 높아진 것일 수 있으나, 변이 전 모균주 또는 비변형 미생물의 생산능에 비해 +값의 증가량을 갖는 한, 이에 제한되지 않는다. 상기 용어 "약(about)"은 ±0.5, ±0.4, ±0.3, ±0.2, ±0.1 등을 모두 포함하는 범위로, 약 이란 용어 뒤에 나오는 수치와 동등하거나 유사한 범위의 수치를 모두 포함하나, 이에 제한되지 않는다.

본 출원에서 용어, "비변형 미생물"은 미생물에 자연적으로 발생할 수 있는 돌연변이를 포함하는 균주를 제외하는 것이 아니며, 야생형 균주 또는 천연형 균주 자체이거나, 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화되기 전 균주를 의미할 수 있다. 예를 들어, 상기 비변형 미생물은 본 명세서에 기재된 헤마토코쿠스 플루비알리스 유래의 GGPPS가 발현되지 않거나 도입되기 전의 균주를 의미할 수 있다. 상기 "비변형 미생물"은 "변형 전 균주", "변형 전 미생물", "비변이 균주", "비변형 균주", "비변이 미생물" 또는 "기준 미생물"과 혼용될 수 있다.

본 출원의 미생물은 야로위아 속일 수 있고, 구체적으로는 야로위아 리폴리티카(Yarrowia lipolytica)일 수 있으나, 이에 제한되지 않는다.

본 출원의 미생물에서 폴리뉴클레오티드의 일부 또는 전체의 변형은 (a) 미생물 내 염색체 삽입용 벡터를 이용한 상동 재조합 또는 유전자가위 (engineered nuclease, e.g., CRISPR-Cas9)을 이용한 유전체 교정 및/또는 (b) 자외선 및 방사선 등과 같은 빛 및/또는 화학물질 처리에 의해 유도될 수 있으나 이에 제한되지 않는다. 상기 유전자 일부 또는 전체의 변형 방법에는 DNA 재조합 기술에 의한 방법이 포함될 수 있다. 예를 들면, 목적 유전자와 상동성이 있는 뉴클레오티드 서열을 포함하는 뉴클레오티드 서열 또는 벡터를 상기 미생물에 주입하여 상동 재조합(homologous recombination)이 일어나게 함으로써 유전자 일부 또는 전체의 결손이 이루어질 수 있다. 상기 주입되는 뉴클레오티드 서열 또는 벡터는 우성 선별 마커를 포함할 수 있으나, 이에 제한되는 것은 아니다.

본 출원의 미생물은 라이코펜 사이클라제/파이토엔 신타아제(lycopene cyclase/phytoene synthase, crtYB), 파이토엔 디새튜라아제(phytoene desaturase, crtI) 및 베타카로틴 15, 15'-옥시게나제(beta-carotene 15,15'-oxygenase; BLH) 단백질을 코딩하는 폴리뉴클레오티드를 포함하도록 변형된 야로위아 속 미생물일 수 있다.

본 출원의 미생물은 라이코펜 사이클라제/파이토엔 신타아제(lycopene cyclase/phytoene synthase, crtYB) 및 파이토엔 디새튜라아제(phytoene desaturase, crtI) 단백질을 코딩하는 폴리뉴클레오티드를 더 포함하도록 변형되어, 이들 단백질 활성을 나타내는 미생물 또는 이들 단백질 활성이 강화된 미생물일 수 있다. 상기 라이코펜 사이클라제/파이토엔 신타아제 또는 파이토엔 디새튜라아제는 크산토필로마이세스 덴드로하우스(Xanthophyllomyces dendrorhous) 유래의 단백질일 수 있으나 이에 제한되지 않는다. 일 구현 예로 상기 라이코펜 사이클라제/파이토엔 신타아제 또는 파이토엔 디새튜라아제를 코딩하는 폴리뉴클레오티드는 각각 NCBI(National Center for Biotechnology Information Search database)에 등록되어 있는 염기서열(GenBank: AY177204.1 또는 GenBank: AY177424.1)에 근거하여 가지거나 포함하는 것일 수 있다. 일 구현 예로 상기 라이코펜 사이클라제/파이토엔 신타아제 또는 파이토엔 디새튜라아제를 코딩하는 폴리뉴클레오티드는 각각 서열번호 71 또는 서열번호 72를 가지거나 포함하는 것일 수 있다. 상기 폴리뉴클레오티드는 코돈의 축퇴성(degeneracy) 또는 본 출원의 폴리펩티드를 발현시키고자 하는 미생물에서 선호되는 코돈을 고려하여, 아미노산 서열을 변화시키지 않는 범위 내에서 코딩 영역에 다양한 변형이 이루어질 수 있다. 구체적으로, 상기 폴리뉴클레오티드는 서열번호 71 또는 서열번호 72의 서열과 상동성 또는 동일성이 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열을 가지거나 포함하거나, 또는 서열번호 71 또는 서열번호 72의 서열과 상동성 또는 동일성이 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열로 이루어지거나 필수적으로 이루어질 수 있으나, 이에 제한되지 않는다.

본 출원의 미생물은 베타카로틴 15, 15'-옥시게나제(beta-carotene 15,15'-oxygenase; BLH) 단백질을 코딩하는 폴리뉴클레오티드를 더 포함하도록 변형되어, 이들 단백질 활성을 나타내는 미생물 또는 이들 단백질 활성이 강화된 미생물일 수 있으나, 이에 제한되지 않는다. 상기 베타카로틴 15, 15'-옥시게나제는 해양세균 66A03(Uncultured marine bacterium 66A03) 유래의 단백질일 수 있으나, 이에 제한되지 않는다. 일 구현 예로 상기 베타카로틴 15, 15'-옥시게나제를 코딩하는 폴리뉴클레오티드는 UniProtKB(UniProt Knowledgebase)에 등록되어 있는 아미노산 서열(Q4PNI0)에 근거하여 가지거나 포함하는 것일 수 있다. 일 구현 예로 상기 베타카로틴 15, 15'-옥시게나제를 코딩하는 폴리뉴클레오티드는 서열번호 13의 서열을 가지거나 포함하는 것일 수 있다. 상기 폴리뉴클레오티드는 코돈의 축퇴성(degeneracy) 또는 본 출원의 폴리펩티드를 발현시키고자 하는 미생물에서 선호되는 코돈을 고려하여, 아미노산 서열을 변화시키지 않는 범위 내에서 코딩 영역에 다양한 변형이 이루어질 수 있다. 구체적으로, 상기 폴리뉴클레오티드는 서열번호 13의 서열과 상동성 또는 동일성이 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열을 가지거나 포함하거나, 또는 서열번호 13의 서열과 상동성 또는 동일성이 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열로 이루어지거나 필수적으로 이루어질 수 있으나, 이에 제한되지 않는다.

본 출원에서 용어, 폴리펩티드 활성의 "강화"는, 폴리펩티드의 활성이 내재적 활성에 비하여 증가되는 것을 의미한다. 상기 강화는 활성화(activation), 상향조절(up-regulation), 과발현(overexpression), 증가(increase) 등의 용어와 혼용될 수 있다. 여기서 활성화, 강화, 상향조절, 과발현, 증가는 본래 가지고 있지 않았던 활성을 나타내게 되는 것, 또는 내재적 활성 또는 변형 전 활성에 비하여 향상된 활성을 나타내게 되는 것을 모두 포함할 수 있다. 상기 "내재적 활성"은 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화하는 경우, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성을 의미한다. 이는 "변형 전 활성"과 혼용되어 사용될 수 있다. 폴리펩티드의 활성이 내재적 활성에 비하여 "강화", "상향조절", "과발현" 또는 "증가"한다는 것은, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성 및/또는 농도(발현량)에 비하여 향상된 것을 의미한다.

상기 강화는 외래의 폴리펩티드 또는 유전자를 도입하거나, 내재적인 폴리펩티드의 활성 강화 및/또는 농도(발현량)를 통해 달성할 수 있다. 상기 폴리펩티드의 활성의 강화 여부는 해당 폴리펩티드의 활성 정도, 발현량 또는 해당 폴리펩티드로부터 배출되는 산물의 양의 증가로부터 확인할 수 있다.

상기 폴리펩티드의 활성의 강화는 당해 분야에 잘 알려진 다양한 방법의 적용이 가능하며, 목적 폴리펩티드의 활성을 변형전 미생물보다 강화시킬 수 있는 한, 제한되지 않는다. 구체적으로, 분자생물학의 일상적 방법인 당업계의 통상의 기술자에게 잘 알려진 유전자 공학 및/또는 단백질 공학을 이용한 것일 수 있으나, 이로 제한되지 않는다(예컨대, Sitnicka et al. Functional Analysis of Genes. Advances in Cell Biology. 2010, Vol. 2. 1-16, Sambrook et al. Molecular Cloning 2012 등).

구체적으로, 본 출원의 폴리펩티드 활성의 강화는

1) 폴리펩티드를 코딩하는 폴리뉴클레오티드의 세포 내 카피수 증가;

2) 폴리펩티드를 코딩하는 염색체상의 유전자 발현조절영역을 활성이 강력한 서열로 교체;

3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열의 변형;

4) 폴리펩티드 활성이 강화되도록 상기 폴리펩티드의 아미노산 서열의 변형;

5) 폴리펩티드 활성이 강화되도록 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열의 변형 (예를 들어, 폴리펩티드의 활성이 강화되도록 변형된 폴리펩티드를 코딩하도록 상기 폴리펩티드 유전자의 폴리뉴클레오티드 서열의 변형);

6) 폴리펩티드의 활성을 나타내는 외래 폴리펩티드 또는 이를 코딩하는 외래 폴리뉴클레오티드의 도입;

7) 폴리펩티드를 암호화하는 폴리뉴클레오티드의 코돈 최적화;

8) 폴리펩티드의 삼차구조를 분석하여 노출 부위를 선택하여 변형하거나 화학적으로 수식; 또는

9) 상기 1) 내지 8) 중 선택된 2 이상의 조합일 수 있으나, 이에, 특별히 제한되는 것은 아니다.

보다 구체적으로,

상기 1) 폴리펩티드를 코딩하는 폴리뉴클레오티드의 세포 내 카피수 증가는, 해당 폴리펩티드를 코딩하는 폴리뉴클레오티드가 작동가능하게 연결된, 숙주와 무관하게 복제되고 기능할 수 있는 벡터의 숙주세포 내로의 도입에 의해 달성되는 것일 수 있다. 또는, 해당 폴리펩티드를 코딩하는 폴리뉴클레오티드가 숙주세포 내의 염색체 내에 1 카피 또는 2 카피 이상 도입에 의해 달성되는 것일 수 있다. 상기 염색체 내에 도입은 숙주세포 내의 염색체 내로 상기 폴리뉴클레오티드를 삽입시킬 수 있는 벡터가 숙주세포 내에 도입됨으로써 수행될 수 있으나, 이에 제한되지 않는다. 상기 벡터는 전술한 바와 같다.

상기 2) 폴리펩티드를 코딩하는 염색체상의 유전자 발현조절영역(또는 발현조절서열)을 활성이 강력한 서열로 교체는, 예를 들면, 상기 발현조절영역의 활성을 더욱 강화하도록 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 강한 활성을 가지는 서열로의 교체일 수 있다. 상기 발현조절영역은, 특별히 이에 제한되지 않으나 프로모터, 오퍼레이터 서열, 리보좀 결합 부위를 코딩하는 서열, 그리고 전사 및 해독의 종결을 조절하는 서열 등을 포함할 수 있다. 일 예로, 본래의 프로모터를 강력한 프로모터로 교체시키는 것일 수 있으나, 이에 제한되지 않는다.

공지된 강력한 프로모터의 예에는 CJ1 내지 CJ7 프로모터(미국등록특허 US 7662943 B2), lac 프로모터, trp 프로모터, trc 프로모터, tac 프로모터, 람다 파아지 PR 프로모터, PL 프로모터, tet 프로모터, gapA 프로모터, SPL7 프로모터, SPL13(sm3) 프로모터(미국등록특허 US 10584338 B2), O2 프로모터(미국등록특허 US 10273491 B2), tkt 프로모터, yccA 프로모터, TEFINt 프로모터 등이 있으나, 이에 제한되지 않는다.

상기 3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열 변형은, 예를 들면, 내재적 개시코돈에 비해 폴리펩티드 발현율이 더 높은 다른 개시코돈을 코딩하는 염기 서열로 치환하는 것일 수 있으나, 이에 제한되지 않는다.

상기 4) 및 5)의 아미노산 서열 또는 폴리뉴클레오티드 서열의 변형은, 폴리펩티드의 활성을 강화하도록 상기 폴리펩티드의 아미노산 서열 또는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 강한 활성을 갖도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열 또는 활성이 증가하도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열로의 교체일 수 있으나, 이에 한정되는 것은 아니다. 상기 교체는 구체적으로 상동재조합에 의하여 폴리뉴클레오티드를 염색체내로 삽입함으로써 수행될 수 있으나, 이에 제한되지 않는다. 이때 사용되는 벡터는 염색체 삽입 여부를 확인하기 위한 선별 마커 (selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 전술한 바와 같다.

상기 6) 폴리펩티드의 활성을 나타내는 외래 폴리뉴클레오티드의 도입은, 상기 폴리펩티드와 동일/유사한 활성을 나타내는 폴리펩티드를 코딩하는 외래 폴리뉴클레오티드의 숙주세포 내 도입일 수 있다. 상기 외래 폴리뉴클레오티드는 상기 폴리펩티드와 동일/유사한 활성을 나타내는 한 그 유래나 서열에 제한이 없다. 상기 도입에 이용되는 방법은 공지된 형질전환 방법을 당업자가 적절히 선택하여 수행될 수 있으며, 숙주 세포 내에서 상기 도입된 폴리뉴클레오티드가 발현됨으로써 폴리펩티드가 생성되어 그 활성이 증가될 수 있다.

상기 7) 폴리펩티드를 암호화하는 폴리뉴클레오티드의 코돈 최적화는, 내재 폴리뉴클레오티드가 숙주세포 내에서 전사 또는 번역이 증가하도록 코돈 최적화한 것이거나, 또는 외래 폴리뉴클레오티드가 숙주세포 내에서 최적화된 전사, 번역이 이루어지도록 이의 코돈을 최적화한 것일 수 있다.

상기 8) 폴리펩티드의 삼차구조를 분석하여 노출 부위를 선택하여 변형하거나 화학적으로 수식하는 것은, 예를 들어 분석하고자 하는 폴리펩티드의 서열정보를 기지 단백질들의 서열정보가 저장된 데이터베이스와 비교함으로써 서열의 유사성 정도에 따라 주형 단백질 후보를 결정하고 이를 토대로 구조를 확인하여, 변형하거나 화학적으로 수식할 노출 부위를 선택하여 변형 또는 수식하는 것일 수 있다.

이와 같은 폴리펩티드 활성의 강화는, 상응하는 폴리펩티드의 활성 또는 농도 발현량이 야생형이나 변형 전 미생물 균주에서 발현된 폴리펩티드의 활성 또는 농도를 기준으로 하여 증가되거나, 해당 폴리펩티드로부터 생산되는 산물의 양의 증가되는 것일 수 있으나, 이에 제한되는 것은 아니다.

일 구현 예로, 본 출원의 미생물은 헤마토코쿠스 플루비알리스 유래의 GGPPS 유전자를 도입함으로써 GGPPS 활성이 강화된 것일 수 있으나, 이에 제한되지 않는다.

본 출원의 미생물은 카로티노이드 또는 이를 전구체로 하는 물질 생산능을 갖는 것일 수 있다.

본 출원에서 용어 "카로티노이드"는 과일 및 야채에서 노란색 등의 색을 내게 하는 테트라테르펜(tetraterpene) 또는 이의 유도체를 의미한다.

일 구현 예로, 상기 카로티노이드는 크산토필(xanthophyll), 카로틴(carotene), 알파카로틴(alpha-carotene), 베타카로틴(beta-carotene), 감마카로틴(gamma-carotene), 피토엔(phytoene), 피토플루엔(phytofluene), 뉴로스포렌(neurosporene), 루테인(lutein), 라이코펜(lycopene), 제아잔틴(Zeaxanthin), 캡산틴(Capsanthin), 칸타잔틴(Canthaxanthin), 및 아스타잔틴(Astaxanthin)으로 구성되는 군에서 선택되는 어느 하나 이상일 수 있으나, 이에 제한되지 않는다.

일 구현 예로, 상기 카로티노이드를 전구체로 하는 물질은 레티노이드일 수 있으나, 이에 제한되지 않는다.

본 출원에서 용어 "레티노이드"는 화학적으로 비타민 A군 또는 이와 화학적으로 연관된 화합물군을 의미한다.

일 구현 예로, 상기 레티노이드는 레티놀, 레티날, 레티노산, 및 레티닐 에스터로 구성되는 군에서 선택되는 어느 하나일 수 있으나, 이에 제한되지 않는다.

일 구현 예로, 본 출원의 미생물은 부산물 생산능이 감소된 것일 수 있으나, 이에 제한되지 않는다.

본 출원에서 부산물은 카로티노이드 또는 이를 전구체로 하는 물질 생산 시, 이들을 제외한 모든 물질을 의미할 수 있다. 일 예로, 베타카로틴 생산 시 발생하는 대표적인 부산물은 스쿠알렌일 수 있다.

본 출원에서 "스쿠알렌"은 불포화 탄화수소(C₃₀H₅₀)로서, 스테로이드 호르몬, 비타민 D 등의 생합성에도 이용되는 물질이다. 본 출원의 미생물은 베타카로틴 생산 경로에서 생성되는 부산물을 감소시킨 것일 수 있으며, 구체적으로 스쿠알렌 생산을 감소시킨 것일 수 있으나, 이에 제한되지 않는다.

본 출원의 다른 하나의 양태는 본 출원의 야로위아 속 미생물을 배지에서 배양하는 단계를 포함하는 카로티노이드 또는 이를 전구체로 하는 물질 생산방법을 제공한다.

상기 미생물, 카로티노이드, 이를 전구체로 하는 물질은 다른 양태에서 설명한 바와 같다.

본 출원에서, 용어 "배양"은 본 출원의 야로위아 속 미생물을 적당히 조절된 환경 조건에서 생육시키는 것을 의미한다. 본 출원에서, 배양과정은 당업계에 알려진 적당한 배지와 배양조건에 따라 이루어질 수 있다. 이러한 배양 과정은 선택되는 균주에 따라 당업자가 용이하게 조정하여 사용할 수 있다. 구체적으로 상기 배양은 회분식, 연속식 및/또는 유가식일 수 있으나, 이에 제한되는 것은 아니다.

본 출원의 야로위아 속 미생물을 적당한 탄소원, 질소원, 인원, 무기화합물, 아미노산 및/또는 비타민 등을 함유한 통상의 배지 내에서 호기성 조건 하에서 온도, pH 등을 조절하면서 배양할 수 있다.

본 출원의 배양에서 배양온도는 20 내지 35

구체적으로는 25 내지 35

를 유지할 수 있고, 약 10 내지 160 시간, 약 20 시간 내지 130 시간, 약 24 시간 내지 120 시간, 약 36 시간 내지 120 시간, 약 48시간 내지 120시간, 약 48 시간, 약 72 시간, 또는 약 120 시간 동안 배양할 수 있으나, 이에 한정되는 것은 아니다.

본 출원의 배양에 의하여 생산된 카로티노이드 또는 이를 전구체로 하는 물질은 배지 중으로 분비되거나 미생물 내에 잔류할 수 있다.

본 출원의 카로티노이드 또는 이를 전구체로 하는 물질 생산방법은, 본 출원의 야로위아 속 미생물을 준비하는 단계, 상기 미생물을 배양하기 위한 배지를 준비하는 단계, 또는 이들의 조합(순서에 무관, in any order)을, 예를 들어, 상기 배양하는 단계 이전에, 추가로 포함할 수 있다.

본 출원의 카로티노이드 또는 이를 전구체로 하는 물질 생산방법은, 상기 야로위아 속 미생물 배양에 따른 배지(배양이 수행된 배지) 또는 본 출원의 야로위아 속 미생물로부터 카로티노이드 또는 이를 전구체로 하는 물질을 회수하는 단계를 추가로 포함할 수 있다. 상기 회수하는 단계는 상기 배양하는 단계 이후에 추가로 포함될 수 있다.

상기 회수는 본 출원의 미생물의 배양 방법, 예를 들어 회분식, 연속식 또는 유가식 배양 방법 등에 따라 당해 기술 분야에 공지된 적합한 방법을 이용하여 목적하는 레티놀을 수집(collect)하는 것일 수 있다. 예를 들어, 원심분리, 여과, 결정화 단백질 침전제에 의한 처리(염석법), 추출, 세포 파쇄, 초음파 파쇄, 한외여과, 투석법, 분자체 크로마토그래피(겔여과), 흡착크로마토그래피, 이온교환 크로마토그래피, 친화도 크로마토그래피 등의 각종 크로마토그래피, HPLC 또는 이들의 방법을 조합하여 사용될 수 있으며, 당해 분야에 공지된 적합한 방법을 이용하여 배지 또는 미생물로부터 목적하는 레티놀을 회수할 수 있다.

또한, 본 출원의 카로티노이드 또는 이를 전구체로 하는 물질 생산방법은, 추가적으로 정제 단계를 포함할 수 있다. 상기 정제는 당해 기술분야에 공지된 적합한 방법을 이용하여, 수행할 수 있다. 일 예에서, 본 출원의 카로티노이드 또는 이를 전구체로 하는 물질 생산방법이 회수 단계와 정제 단계를 모두 포함하는 경우, 상기 회수 단계와 정제 단계는 순서에 상관없이 이시적(또는 연속적)으로 수행되거나, 동시에 또는 하나의 단계로 통합되어 수행될 수 있으나, 이에 제한되는 것은 아니다.

본 출원의 카로티노이드의 생산방법은 본 출원의 미생물이 생산한 베타카로틴을 베타카로틴 이외의 카로티노이드로 전환하는 단계를 추가로 포함할 수 있다. 본 출원의 카로티노이드 생산방법에 있어서, 상기 전환하는 단계는 상기 배양하는 단계 또는 상기 회수하는 단계 이후에 추가로 포함될 수 있다. 상기 전환하는 단계는 당해 기술분야에 공지된 적합한 방법을 이용하여 수행할 수 있다. 예컨데, 상기 전환은 화학적으로, 또는 효소를 이용하여 수행할 수 있으나, 이에 제한되지 않는다.

본 출원의 레티노이드의 생산방법은 본 출원의 야로위아 속 미생물이 생산한 레티놀을 레티놀 이외의 레티노이드로 전환하는 단계를 추가로 포함할 수 있다. 본 출원의 레티노이드 생산방법에 있어서, 상기 전환하는 단계는 상기 배양하는 단계 또는 상기 회수하는 단계 이후에 추가로 포함될 수 있다. 상기 전환하는 단계는 당해 기술분야에 공지된 적합한 방법을 이용하여 수행할 수 있다. 예컨데, 상기 전환은 레티놀 아실트렌스퍼라아제(retinol acyltransferase)를 이용하여 수행할 수 있으나, 이에 제한되지 않는다.

일 구현 예로, 상기 레티놀 이외의 레티노이드는 레티날, 레티노산, 및 레티닐 에스터로 구성되는 군에서 선택되는 어느 하나일 수 있으나, 레티노이드에 포함되는 한 이에 제한되지 않는다.

본 출원의 또 다른 하나의 양태는 본 출원의 야로위아 속 미생물 또는 이의 배양물을 포함하는 카로티노이드 또는 이를 전구체로 하는 물질의 생산용 조성물을 제공한다.

상기 미생물, 카로티노이드, 또는 이를 전구체로 하는 물질은 다른 양태에서 설명한 바와 같다.

본 출원의 조성물은 통상 사용되는 임의의 적합한 부형제를 추가로 포함할 수 있으며, 이러한 부형제는, 예를 들어 보존제, 습윤제, 분산제, 현탁화제, 완충제, 안정화제 또는 등장화제 등일 수 있으나, 이에 한정되는 것은 아니다.

본 출원의 또 다른 하나의 양태는 본 출원의 미생물 또는 이의 배양물의 카로티노이드 또는 이를 전구체로 하는 물질의 생산 용도를 제공한다.

본 출원은 Haematococcus pluvialis 유래 제라닐제라닐 피로포스페이트 신타아제 유전자를 야로위아 속 미생물에 도입함으로써 카로티노이드 및 이를 전구체로 하는 물질의 생산을 효과적으로 증가시킬 수 있다.

도 1은 여러 미생물 유래의 GGPP synthase 유전자 도입주 플라스크 평가 결과를 나타낸 도이다.
도 2는 Mb.BCO 도입주 플라스크 평가 결과 결과를 나타낸 도이다,

이하 본 출원을 실시예에 의해 보다 상세하게 설명한다. 그러나 하기 실시예는 본 출원을 예시하기 위한 바람직한 실시양태에 불과한 것이며 따라서, 본 출원의 권리범위를 이에 한정하는 것으로 의도되지는 않는다. 한편, 본 명세서에 기재되지 않은 기술적인 사항들은 본 출원의 기술 분야 또는 유사 기술 분야에서 숙련된 통상의 기술자이면 충분히 이해하고 용이하게 실시할 수 있다.

실시예 1. 카로티노이드 또는 이를 전구체로 하는 물질의 생산용 플랫폼 균주 제작

실시예 1-1. X. dendrorhous 유래 crtYB-crtI 삽입주 제작

카로티노이드 또는 이를 전구체로 하는 물질의 생산을 위한 플랫폼 균주 제작을 위해 고지방 효모인 야로위아 리폴리티카(Yarrowia lipolytica) CC08-0125(기탁번호 KCCM12972P) 균주의 게놈에 Xanthophyllomyces dendrorhous 유래 lycopene cyclase/phytoene synthase (crtYB)와 phytoene desaturase(crtI) 유전자를 삽입하였다.

crtYB의 경우 NCBI(National Center for Biotechnology Information Search database)에 등록되어 있는 염기서열(GenBank: AY177204.1)에 근거하여 서열번호 71의 폴리뉴클레오티드를 확보하였고, crtI의 경우 NCBI에 등록되어 있는 염기서열(GenBank: AY177424.1)에 근거하여 서열번호 72의 폴리뉴클레오티드를 확보하였다. crtYB와 crtI의 폴리뉴클레오티드 서열은 마크로젠社를 통해 TEFINtp-crtYB-CYC1t(서열번호 73), TEFINtp-crtI-CYC1t(서열번호 74)의 형태로 유전자를 합성하였으며, 선별 마커로는 Y. lipolytica의 URA3 유전자(서열번호 75)를 이용하여 MHY1(YALI0B21582g) 유전자 위치에 삽입되는 카세트를 디자인하였다. 합성된 crtYB, crtI 유전자 및 KCCM12972P 게놈 DNA를 주형으로 하고 서열번호 76 및 서열번호 77, 서열번호 78 및 서열번호 79, 서열번호 80 및 서열번호 81, 서열번호 82 및 서열번호 83, 서열번호 84 및 서열번호 85, 및 서열번호 86 및 서열번호 87의 프라이머를 이용하여 각각의 PCR을 수행하였다. PCR 조건은 변성 95°C, 1분; 어닐링 55°C, 1분; 및 중합반응 72°C, 3분을 35회 반복 수행하였다. 그 결과로 얻어진 5개의 DNA 단편은 overlap extension PCR을 통해 하나의 카세트로 제작하였다.

이렇게 제작된 카세트를 열충격법 (D.-C. Chen et al., Appl Microbiol Biotechnol, 1997) 으로 KCCM12972P 균주에 도입한 후, 우라실(uracil)이 포함되지 않은 고체배지(YLMM1)에서 형성된 콜로니를 획득하였다. 서열번호 88 및 서열번호 89의 프라이머를 이용하여 게놈 내에 카세트 삽입이 확인된 콜로니들을 5-FOA 고체배지에 spotting하여 30°C에서 3일간 배양하였고, 5-FOA 고체 배지에서 자란 콜로니를 획득함으로써 URA3 마커를 회수하였다.

서열번호	서열(5'- 3')	PCR 산물
76	GTGCGCTTCTCTCGTCTCGGTAACCCTGTC	Homology left arm
77	ATGCGCCGCCAACCCGGTCTCTGGGGTGTGGTGGATGGGGTGTG	Homology left arm
78	CACACCCCATCCACCACACCCCAGAGACCGGGTTGGCGGCGCAT	TEFINtp-crtYB-CYC1t
79	CGCCGCCAACCCGGTCTCTTGAAGACGAAAGGGCCTCCG	TEFINtp-crtYB-CYC1t
80	CGGAGGCCCTTTCGTCTTCAAGAGACCGGGTTGGCGGCG	TEFINtp-crtI-CYC1t
81	GACGAGTCAGACAGGAGGCATCAGACAGATACTCGTCGCG	TEFINtp-crtI-CYC1t
82	CGCGACGAGTATCTGTCTGATGCCTCCTGTCTGACTCGTC	URA3
83	ATGACGAGTCAGACAGGAGGCATGGTGGTATTGTGACTGGGGAT	URA3
84	ATCCCCAGTCACAATACCACCATGCCTCCTGTCTGACTCGTCAT	Repeat region
85	CGGCGTCCTTCTCGTAGTCCGCTTTTGGTGGTGAAGAGGAGACT	Repeat region
86	AGTCTCCTCTTCACCACCAAAAGCGGACTACGAGAAGGACGCCG	Homology right arm
87	CCACTCGTCACCAACAGTGCCGTGTGTTGC	Homology right arm
88	TCGTACGTCTATACCAACAGATGG	Forward
89	CGCATACACACACACTGCCGGGGG	Reverse

실시예 1-2. HMGR 강화주 제작

앞서 실시예 1-1에서 제작된 균주의 하이드록시메틸글루타릴 리덕테이즈(3-hydroxy-3-methylglutaryl-CoA reductase, HMGR)유전자의 native 프로모터(서열번호 90) 부위를 TEFINt 프로모터로 교체하기 위한 카세트를 디자인하였고, KCCM12972P 게놈 DNA를 주형으로 하고 서열번호 91 및 서열번호 92, 서열번호 93 및 서열번호 94, 서열번호 95 및 서열번호 96, 서열번호 97 및 서열번호 98, 및 서열번호 99 및 서열번호 100의 프라이머를 이용하여 각각의 PCR을 수행하였다. PCR 조건은 변성 95°C, 1분; 어닐링 55°C, 1분; 및 중합반응 72°C, 1분 30초를 35회 반복 수행하였다. 그 결과로 얻어진 5개의 DNA 단편은 overlap extension PCR을 통해 하나의 카세트로 제작하였다.

이렇게 제작된 카세트를 열충격법으로 실시예 1-1에서 제작한 균주에 도입한 후, 우라실이 포함되지 않은 고체배지(YLMM1)에서 형성된 콜로니를 획득하였다. 서열번호 101 및 서열번호 102의 프라이머를 이용하여 카세트 삽입이 확인된 콜로니들을 5-FOA 고체배지에 spotting하여 30°C에서 3일간 배양하였고, 5-FOA 고체 배지에서 자란 콜로니를 획득함으로써 URA3 마커를 회수하였다. 이에 따라 최종적으로 제작된 플랫폼 균주를 CC08-1023으로 명명하였다.

< Yarrowia lipolytica minimal media1 (YLMM1)>

포도당 20 g/L, 아미노산을 포함하지 않는 효모 질소 염기(Yeast nitrogen base without amino acids) 6.7 g/L, 우라실을 포함하지 않는 효모 합성 드롭 아웃 배지 보충물 (Yeast Synthetic Drop-out Medium Supplements without uracil) 2 g/L, 한천(agar) 15 g/L

<5-Fluoroorotic Acid (5-FOA)>

포도당 20 g/L, 아미노산을 포함하지 않는 효모 질소 염기(Yeast nitrogen base without amino acids) 6.7 g/L, 우라실을 포함하지 않는 효모 합성 드롭 아웃 배지 보충물 (Yeast Synthetic Drop-out Medium Supplements without uracil) 2 g/L, 우라실(Uracil) 50 μg/mL, 5-플루오로 오로틴산(5-FOA) 1 g/L, 한천(agar) 15 g/L

서열번호	서열(5'- 3')	PCR 산물
91	GACAATGCCTCGAGGAGGTTTAAAAGTAACT	Homology left arm
92	GCGCCGCCAACCCGGTCTCTCTGTGTTAGTCGGATGATAGG	Homology left arm
93	CCTATCATCCGACTAACACAGAGAGACCGGGTTGGCGGCGC	TEFINt promoter
94	GACGAGTCAGACAGGAGGCACTGCGGTTAGTACTGCAAAAAG	TEFINt promoter
95	CTTTTTGCAGTACTAACCGCAGTGCCTCCTGTCTGACTCGTC	URA3
96	ATGCGCCGCCAACCCGGTCTCTTGGTGGTATTGTGACTGGGGAT	URA3
97	ATCCCCAGTCACAATACCACCAAGAGACCGGGTTGGCGGCGCAT	Repeat region
98	CTTTCCAATAGCTGCTTGTAGCTGCGGTTAGTACTGCAAAA	Repeat region
99	TTTTGCAGTACTAACCGCAGCTACAAGCAGCTATTGGAAAG	Homology right arm
100	GCTTAATGTGATTGATCTCAAACTTGATAG	Homology right arm
101	GCTGTCTCTGCGAGAGCACGTCGA	Forward
102	GGTTCGCACAACTTCTCGGGTGGC	Reverse

실시예 2. 헤마토코쿠스 플루비알리스( Haematococcus pluvialis ) 유래의 제라닐제라닐 피로포스페이트 산타아제(Geranylgeranyl pyrophosphate synthase; GGPP synthase) 유전자 삽입주 제작

각기 다른 유래의 GGPP synthase 유전자(이하, GGPPS 유전자) 4종을 실시예 1에서 제작한 균주 CC08-1023의 게놈에 다음과 같이 각각 도입하였다.

실시예 2-1. Haematococcus pluvialis 유래 GGPPS 삽입주 제작

Yarrowia lipolytica 염색체 상에 Haematococcus pluvialils 유래 GGPPS1 유전자(이하, Hp.GGPPS1)를 삽입하기 위해 Hp.GGPPS1은 NCBI(National Center for Biotechnology Information Search database)에 등록되어 있는 염기서열(GenBank: APX64485.1)에 근거하여 http://atgme.org를 통해 Y. lipolytica에 적합하도록 코돈 최적화를 진행하였고(서열번호 1), 마크로젠社를 통해 TEFINtp-코돈 최적화된 Hp.GGPPS1-CYC1t의 형태로 유전자를 합성하였으며(서열번호 4), 선별 마커로는 Y. lipolytica 의 URA3 유전자(서열번호 5)를 이용하여 LIG4(YALI0D21384g) 유전자 위치에 삽입되는 카세트를 디자인 하였다. 합성된 Hp.GGPPS1 유전자 및 KCCM12972P genomic DNA를 주형으로 하고, 하기 표 3과 같이 서열번호 15 및 서열번호 16, 서열번호 17 및 서열번호 18, 서열번호 19 및 서열번호 20, 서열번호 21 및 서열번호 22, 서열번호 23 및 서열번호 24, 서열번호 25 및 서열번호 26, 및 서열번호 27 및 서열번호 28의 프라이머를 이용하여 각각 left homologous region, TEFINt promoter, Hp.GGPPS1 ORF, CYC1 terminator, URA3, repeat region, 및 right homologous region 단편의 PCR을 수행하였다. PCR 조건은 변성 95°C, 1분; 어닐링 55°C, 1분; 및 중합반응 72°C, 2분을 35회 반복 수행하였다. 그 결과로 얻어진 DNA 단편들은 overlap extension PCR을 통해 하나의 카세트로 제작하였다.

이렇게 제작된 카세트를 열충격법으로 CC08-1023 균주에 도입한 후, 우라실(uracil)이 포함되지 않은 고체배지(YLMM1)에서 형성된 콜로니를 획득하였다. 서열번호 29 및 서열번호 30의 프라이머를 이용하여 게놈 내에 카세트 삽입이 확인된 콜로니들을 5-FOA 고체배지에 도말하여 30°C에서 3일간 배양하였고, 5-FOA 고체 배지에서 형성된 콜로니를 획득함으로써 URA3 마커를 제거하였다.

서열번호	서열(5'- 3')
15	CATCATTTCAAAAGAGGGAACAGC
16	CGCCGCCAACCCGGTCTCTGTGTTTGGCGGTGTGAGTTGTC
17	GACAACTCACACCGCCAAACACAGAGACCGGGTTGGCGGCG
18	CGGTTGTGCATGGCTCGGATCTGCGGTTAGTACTGCAAAAAGTGC
19	GCACTTTTTGCAGTACTAACCGCAGATCCGAGCCATGCACAACCG
20	AACTAATTACATGActcgaGCTAGTTCTTTCGGTAGCCGA
21	TCGGCTACCGAAAGAACTAGCtcgagTCATGTAATTAGTT
22	gacgagtcagacaggaggcaGCAAATTAAAGCCTTCGAGC
23	GCTCGAAGGCTTTAATTTGCtgcctcctgtctgactcgtc
24	AACTAATTACATGActcgaGtggtggtattgtgactgggg
25	ccccagtcacaataccaccaCtcgagTCATGTAATTAGTT
26	CCATATGGAGTGTTATTTGAAGGGGCAAATTAAAGCCTTCGAGC
27	GCTCGAAGGCTTTAATTTGCCCCTTCAAATAACACTCCATATGG
28	CCGATACAGTGTCCAAGTACG
29	GAGTGTCTGAAGACAAGGCTTC
30	GACGACAATGCTGAGCTCCG

실시예 2-2. Xanthophyllomyces dendrorhous 유래 crtE 변이 유전자 삽입주 제작

Yarrowia lipolytica 염색체 상에 Xanthophyllomyces dendrorhous 유래 crtE 변이 유전자 crtEM1 (서열번호 6, Hong et al., Applied Microbiology and Biotechnology, 2019 Jan;103(1):211-223)를 삽입하기 위해 , 마크로젠社를 통해 TEFINtp-crtEM1-TDH3t의 형태로 유전자를 합성하였으며(서열번호 8), 선별 마커로는 Y. lipolytica의 URA3 유전자(서열번호 5)를 이용하여 LIG4(YALI0D21384g) 유전자 위치에 삽입되는 카세트를 디자인 하였다.

합성된 crtEM1 DNA와 KCCM12972P genomic DNA를 주형으로 하고 표 4와 같이 서열번호 31 및 서열번호 32, 서열번호 33 및 서열번호 34, 서열번호 35 및 서열번호 36, 서열번호 37 및 서열번호 38, 서열번호 39 및 서열번호 40, 서열번호 41 및 서열번호 42, 및 서열번호 43 및 서열번호 44의 프라이머를 이용하여 각각 left homologous region, TEFINt promoter, crtEM1 ORF, TDH3 terminator, URA3, repeat region, 및 right homologous region 단편의 PCR을 수행하였다.

PCR 조건은 변성 95°C, 1분; 어닐링 55°C, 1분; 및 중합반응 72°C, 2분을 35회 반복 수행하였다. 그 결과로 얻어진 DNA 단편들은 overlap extension PCR을 통해 하나의 카세트로 제작하였다.

이렇게 제작된 카세트를 열충격법으로 CC08-1023균주에 도입한 후, 우라실이 포함되지 않은 고체배지(YLMM1)에서 형성된 콜로니를 획득하였다. 서열번호 45 및 서열번호 46의 프라이머를 이용하여 게놈 내에 카세트 삽입이 확인된 콜로니들을 5-FOA 고체배지에 도말하여 30°C에서 3일간 배양하였고, 5-FOA 고체 배지에서 형성된 콜로니를 획득함으로써 URA3 마커를 제거하였다.

서열번호	서열(5'- 3')
31	CATCATTTCAAAAGAGGGAACAGC
32	CGCCGCCAACCCGGTCTCTGTGTTTGGCGGTGTGAGTTGTC
33	GACAACTCACACCGCCAAACACAGAGACCGGGTTGGCGGCG
34	CTGTGAGGATGTTCGCGTAATCCTGCGGTTAGTACTGCAAAAAGTGC
35	GCACTTTTTGCAGTACTAACCGCAGGATTACGCGAACATCCTCACAG
36	CTTCGCTCTTGATCTTCGGATAGTCACAGAGGGATATCGGCTAG
37	CTAGCCGATATCCCTCTGTGACTATCCGAAGATCAAGAGCGAAG
38	GACGAGTCAGACAGGAGGCAGTCTTGGAACGGTGAAAAAGCCTGC
39	GCAGGCTTTTTCACCGTTCCAAGACTGCCTCCTGTCTGACTCGTC
40	CGCTCTTGATCTTCGGATAGTGGTGGTATTGTGACTGGGGA
41	TCCCCAGTCACAATACCACCACTATCCGAAGATCAAGAGCG
42	CATATGGAGTGTTATTTGAAGGGGTCTTGGAACGGTGAAAAAGCCTGC
43	GCAGGCTTTTTCACCGTTCCAAGACCCCTTCAAATAACACTCCATATG
44	CCGATACAGTGTCCAAGTACG
45	GAGTGTCTGAAGACAAGGCTTC
46	GACGACAATGCTGAGCTCCG

실시예 2-3. Saccharomyces cerevisiae 유래 BTS1 삽입주 제작

Yarrowia lipolytica 염색체 상에 Saccharomyces cerevisiae 유래 BTS1 유전자(이하, Sc.BTS1)를 삽입하기 위해 BTS1은 KEGG(Kyoto Encyclopedia of Genes and Genomes)에 등록되어 있는 염기서열(YPL069C)에 근거하여 서열번호 9의 폴리뉴클레오티드를 확보하였다. 상기 BTS1의 폴리뉴클레오티드를 이용하여 TEFINtp-Sc.BTS1-TDH3t(서열번호 10)의 형태로 유전자를 합성하였다. 선별 마커로는 Y. lipolytica의 URA3 유전자(서열번호 5)를 이용하여 LIG4(YALI0D21384g) 유전자 위치에 삽입되는 카세트를 디자인 하였다.

합성된 Sc.BTS1 DNA 및 KCCM12972P genomic DNA를 주형으로 하고 표 5와 같이 서열번호 31 및 서열번호 32, 서열번호 33 및 서열번호 47, 서열번호 48 및 서열번호 49, 서열번호 50 및 서열번호 38, 서열번호 39 및 서열번호 40, 서열번호 41 및 서열번호 42, 서열번호 43 및 서열번호 44의 프라이머를 이용하여 각각 left homologous region, TEFINt promoter, Sc.BTS1 ORF, TDH3 terminator, URA3, repeat region, 및 right homologous region 단편의 PCR을 수행하였다. PCR 조건은 변성 95°C, 1분; 어닐링 55°C, 1분; 및 중합반응 72°C, 2분을 35회 반복 수행하였다. 그 결과로 얻어진 DNA 단편들은 overlap extension PCR을 통해 하나의 카세트로 제작하였다.

서열번호	서열(5'- 3')
47	CAGCTCATCTATCTTGGCCTCCTGCGGTTAGTACTGCAAAAAGTGC
48	GCACTTTTTGCAGTACTAACCGCAGGAGGCCAAGATAGATGAGCTG
49	CTTCGCTCTTGATCTTCGGATAGTCACAATTCGGATAAGTGGTCTATTATATATAAC
50	GTTATATATAATAGACCACTTATCCGAATTGTGACTATCCGAAGATCAAGAGCGAAG

실시예 2-4. Yarrowia lipolytica 유래 GGS1 삽입주 제작

Yarrowia lipolytica 염색체 상에 Yarrowia lipolytica 유래 GGS1 유전자(이하, Yl.GGS1)를 삽입하기 위해 GGS1은 KEGG(Kyoto Encyclopedia of Genes and Genomes)에 등록되어 있는 염기서열(YALI0D17050g)에 근거하여 서열번호 11의 폴리뉴클레오티드를 확보하였다. 상기 Yl.GGS1의 폴리뉴클레오티드를 이용하여 TEFINtp-Yl.GGS1-TDH3t(서열번호 12)의 형태로 유전자를 합성하였다. 선별 마커로는 Y. lipolytica의 URA3 유전자(서열번호 5)를 이용하여 LIG4(YALI0D21384g) 유전자 위치에 삽입되는 카세트를 디자인 하였다.

합성된 Yl.GGS1 유전자 및 KCCM12972P genomic DNA를 주형으로 하고 표 6과 같이 서열번호 31 및 서열번호 32, 서열번호 33 및 서열번호 51, 서열번호 52 및 서열번호 53, 서열번호 54 및 서열번호 38, 서열번호 39 및 서열번호 40, 서열번호 41 및 서열번호 42, 및 서열번호 43 및 서열번호 44의 프라이머를 이용하여 각각 left homologous region, TEFINt promoter, Yl.GGS1 ORF, TDH3 terminator, URA3, repeat region, 및 right homologous region 단편의 PCR을 수행하였다. PCR 조건은 변성 95°C, 1분; 어닐링 55°C, 1분; 및 중합반응 72°C, 2분을 35회 반복 수행하였다. 그 결과로 얻어진 DNA 단편들은 overlap extension PCR을 통해 하나의 카세트로 제작하였다.

서열번호	서열(5'- 3')
51	CTTGAAATCCGCGCTGTTATAATCCTGCGGTTAGTACTGCAAAAAGTGC
52	GCACTTTTTGCAGTACTAACCGCAGGATTATAACAGCGCGGATTTCAAG
53	CTTCGCTCTTGATCTTCGGATAGTCACTGCGCATCCTCAAAGTAC
54	GTACTTTGAGGATGCGCAGTGACTATCCGAAGATCAAGAGCGAAG

실시예 3. GGPP synthase 도입주 기반 베타카로틴 생산능 비교 평가

실시예 2-1 내지 2-4에서 확보한 균주와 실시예 1에서 확보한 모균주 CC08-1023를 포함하여 총 5종에 대해 플라스크 평가를 진행하였다. 상기 균주를 YPD(Yeast extract-Peptone-Dextrose) 배지 20ml을 포함하는 250ml 코너-바플 플라스크에 초기 OD 2가 되도록 접종하고 30℃에서 48시간 동안, 200rpm으로 진탕 배양하였다. 배양을 종료한 후, 배양액 1 ml을 원심 분리하여 상등액을 제거하였다. 상기 YPD 배지 조성은 다음과 같다.

< YPD liquid media >

4% 포도당, 1% yeast extract, 2% peptone의 비율로 0.1M 포스페이트 완충액(sodium phosphate buffer)(pH 7.0)에 녹인다.

그 다음으로, DMSO(Dimethyl sulfoxide, sigma 社, CAS number 67-68-5) 0.5ml을 첨가하고 55℃에서 10분 동안 진탕(agitation, 2,000rpm)하여 세포를 파쇄하였다. 추가로 아세톤(sigma社, CAS number 67-64-1) 0.5ml을 첨가하고 45℃에서 15분동안 진탕(agitation, 2,000rpm)하여 베타카로틴과 스쿠알렌 추출을 진행하였으며, HPLC 설비로 농도 분석을 하였다. 분석된 베타카로틴 및 스쿠알렌 농도를 측정한 결과를 도 1에 표시하였다.

그 결과, 도 1에서 나타난 바와 같이, CC08-1023(모균주), Hp.GGPPS1 도입주, crtEM1 도입주, Sc.BTS1 도입주, 및 Yl.GGS1 도입주에서의 베타카로틴 농도는 각각 5.49mg/L, 58.73mg/L, 40.58mg/L, 5.21mg/L, 및 49.22mg/L로 측정되었으며, 특히 Hp.GGPPS1를 도입하였을 때 베타카로틴이 모균주 대비 53.24mg/L 증가하여 베타카로틴 증가효과가 가장 우수함을 확인하였다.

추가적으로 스쿠알렌 농도는 각각 313.24mg/L, 200.31mg/L, 235.27mg/L, 253.28mg/L, 및 221.22mg/L로 측정되었으며, 유사하게 Hp.GGPPS1이 도입되었을 때 스쿠알렌 농도가 CC08-1023 균주 대비 112.93mg/L 감소하여 스쿠알렌 생산 저감 효과가 가장 우수함을 확인하였다.

이러한 결과를 바탕으로 야로위아 속 미생물에서는 Hp.GGPPS1이 GGPP synthase로써의 효과가 가장 우수하다는 것을 확인하였다. 놀랍게도, 근연관계를 갖는 사카로마이세스 세레비지에, 야로위아 리폴리티카, 및 크산토필마로마이세스 덴드로로스 유래의 제라닐제라닐 피로포스페이트 신타아제를 도입하였을 때에는 효과가 미미하였으나, 상대적으로 근연관계가 없는 헤마토코쿠스 플루비알리스 유래의 제라닐제라닐 피로포스페이트 신타아제를 도입하였을 때에는 효과가 현저하였다.

실시예 4. Beta-carotene 15,15'oxygenase(BCO) 유전자 도입주 제작

Yarrowia lipolytica 염색체 상에 해양세균 66A03(Uncultured marine bacterium 66A03) 유래 beta-carotene 15,15'oxygenase(이하, Mb.BCO) 유전자를 삽입하기 위해 Mb.BCO는 UniProtKB(UniProt Knowledgebase)에 등록되어 있는 아미노산 서열(Q4PNI0)에 근거하여 http://atgme.org를 통해 Yarrowia lipolytica에 적합하도록 코돈 최적화한 폴리뉴클레오티드 서열(서열번호 13)을 확보하였다. 상기 Mb.BCO 의 폴리뉴클레오티드를 이용하여 TEFINtp-코돈 최적화된 Mb.BCO-CYC1t(서열번호 14)의 형태로 유전자를 합성하였다. 선별 마커로는 Y. lipolytica의 URA3 유전자(서열번호 5)를 이용하여 KU70(YALI0C08701g) 유전자 위치에 삽입되는 카세트를 디자인 하였다. 합성된 Mb.BCO 및 KCCM12972P genomic DNA를 주형으로 하고 표 7과 같이 서열번호 55 및 서열번호 56, 서열번호 57 및 서열번호 58, 서열번호 59 및 서열번호 60, 서열번호 61 및 서열번호 62, 서열번호 63 및 서열번호 64, 서열번호 65 서열번호 66, 및 서열번호 67 및 서열번호 68의 프라이머를 이용하여 각각 left homologous region, TEFINt promoter, Mb.BCO ORF, CYC1 terminator, URA3, repeat region, 및 right homologous region PCR을 수행하였다. PCR 조건은 변성 95°C, 1분; 어닐링 55°C, 1분; 및 중합반응 72°C, 2분을 35회 반복 수행하였다. 그 결과로 얻어진 DNA 단편들은 overlap extension PCR을 통해 하나의 카세트로 제작하였다.

이렇게 제작된 카세트를 열충격법으로 실시예 2-1 내지 2-4에서 제작한 균주에 각각 도입한 후, 우라실이 포함되지 않은 고체배지(YLMM1)에서 형성된 콜로니를 획득하였다. 서열번호 69와 서열번호 70의 프라이머를 이용하여 게놈 내에 카세트 삽입이 확인된 콜로니들을 5-FOA 고체배지에 도말하여 30°C에서 3일간 배양하였고, 5-FOA 고체 배지에서 형성된 콜로니를 획득함으로써 URA3 마커를 제거하였다.

서열번호	서열(5'- 3')
55	GGCGTTTCAGGTGGTTGCGTGAGTG
56	GACACAAATGCGCCGCCAACCCGGTCTCTGCGGCGGTTCGTGGTTCGTGTTTC
57	GAAACACGAACCACGAACCGCCGCAGAGACCGGGTTGGCGGCGCATTTGTGTC
58	CAGTCGATCAGCATCAGGCCCTGCGGTTAGTACTGCAAAA
59	TTTTGCAGTACTAACCGCAGGGCCTGATGCTGATCGACTG
60	AACTAATTACATGActcgaGCTAGTTCTTGATCTTGATTC
61	GAATCAAGATCAAGAACTAGCtcgagTCATGTAATTAGTT
62	gacgagtcagacaggaggcaGCAAATTAAAGCCTTCGAGCGTCCC
63	GGGACGCTCGAAGGCTTTAATTTGCtgcctcctgtctgactcgtc
64	AACTAATTACATGActcgaGtggtggtattgtgactgggg
65	ccccagtcacaataccaccaCtcgagTCATGTAATTAGTT
66	GCAGCAGTCATACATGTTCTGAGGCAAATTAAAGCCTTCGAGCGTCCC
67	GGGACGCTCGAAGGCTTTAATTTGCCTCAGAACATGTATGACTGCTGC
68	CTACTTTGTGCAGATTGAGGCCAAG
69	GTCGTCTGTCTTCTCTTCAG
70	CCACCAAGATGGGCAAGAAG

실시예 5. Beta-carotene 15,15'oxygenase(BCO) 유전자 도입주 레티놀 생산능 비교평가

실시예 4에서 확보한 균주 및 실시예 1에서 확보한 모균주 CC08-1023을 포함하여 총 5종에 대해 플라스크 평가를 진행하였다. 상기 균주를 YPD(Yeast extract-Peptone-Dextrose) 배지 20ml 및 butylated hydroxytoluene 0.05%을 포함하는 250ml 코너-바플 플라스크에 초기 OD 2가 되도록 접종하고 30℃에서 48시간 동안, 200rpm으로 진탕 배양하였다. 배양을 종료한 후, 배양액 1 ml를 원심분리하여 상등액을 제거하였다. 그 다음으로 DMSO(Dimethyl sulfoxide, sigma社) 0.5ml을 넣고 55℃에서 10분 동안 진탕(agitation 2,000rpm)하여 세포를 파쇄하였다. 추가로 아세톤(sigma社) 0.5ml을 첨가하고 45℃에서 15분동안 진탕(agitation, 2,000rpm)하여 레티놀, 레티날, 베타카로틴, 및 스쿠알렌 추출을 진행하였고, HPLC 설비로 각각을 농도 분석하였다. 분석된 레티놀, 레티날, 베타카로틴, 및 스쿠알렌 농도를 측정한 결과를 도 2에 표시하였다.

그 결과, 도 2에서와 같이, CC08-1023 균주에 Mb.BCO를 도입한 균주에서는 레티놀이 측정되지 않았다. 이와 달리 CC08-1023을 기반으로 Hp.GGPPS1, crtEM1, Sc.BTS1, 및 Yl,GGS1를 각각 도입한 후에 Mb.BCO를 도입한 균주 4종에서 각각 8.44mg/L, 2.78mg/L, 0mg/L, 및 4.35mg/L의 레티놀 농도가 측정되었다.

베타카로틴 농도는 상기 균주 5종에서 각각 3.68mg/L, 0.35mg.L, 2.47mg/L, 3.58mg/L, 및 0.98mg/L로 베타카로틴이 레티놀로 전환되어 낮은 베타카로틴 농도를 나타냄을 확인하였다. 또한, 상기 균주 5종에서 스쿠알렌 농도는 각각 309.88mg/L, 202.18mg/L, 282.19mg/L, 306.34mg/L, 및 269.18mg/L로 측정하였다.

이러한 결과를 바탕으로 GGPP 생합성 강화가 레티놀 생산능 증대에 긍정적인 효과가 있음이 확인되었다.

또한, 상기 결과를 통해, Hp.GGPPS1는 베타카로틴 생산, 스쿠알렌 감소, 및 레티놀 생산에 우수한 효과가 있음을 검증하였다.

이상의 설명으로부터, 본 출원이 속하는 기술분야의 당업자는 본 출원이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 출원의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 출원의 범위에 포함되는 것으로 해석되어야 한다.

한국미생물보존센터(국외)

KCCM12972P

20210409

<110> CJ CheilJedang Corporation <120> Microorganism comprising Geranylgeranyl pyrophosphate synthase derived from Haematococcus pluvialis, for producing carotenoid or compound in which a precursor thereof is carotenoid, and method using the same <130> KPA220049-KR <160> 103 <170> KoPatentIn 3.0 <210> 1 <211> 1017 <212> DNA <213> Artificial Sequence <220> <223> Codon optimized Hp.GGPPS1 ORF <400> 1 atgatccgag ccatgcacaa ccgagccccc accccccgaa cccgagtgtc tcacccccga 60 tctcaccgag ccctggccca cgtgtctgcc gtggccaccg ccggccaggt ggccgaggtg 120 cactctgccc ccgccttcga cttcgagatg tacatgcgag accgagccga gatggtgaac 180 aaggccctgg acgccgccct gccctctcga taccccgagg tgctggtgga ctctatgcga 240 tactctgtgc tggccggcgg caagcgagtg cgacccgccc tgaccctggc cgcctgtgac 300 ctggtgggcg gcgacatggc caccgccctg cccaccgcct gtgccatgga gatgatccac 360 accatgtctc tgatccacga cgacctgccc gccatggaca acgacgactt ccgacgaggc 420 cgacccacca accacaaggt gtacggcgag gacatcgcca tcctggccgg cgacgccctg 480 ctgtctttcg ccttcgagca catcgcccga gacaccaagg gcgtgcccgc cgacgccgtg 540 ctgaaggtga tcatggagct gggccgagcc gtgggcgccc agggcctgtc tgccggccag 600 gccgtggaca tcaagtctga gggccaggag gtgggcctgg aggtgctgga gtacatccac 660 caccacaaga ccgccgccct gctggaggcc gccgtggtgt gtggcgccct ggtgggcggc 720 gccgacaccg ccaccgtgga gaagctgcga aagtacgccc tgaacatcgg cctggccttc 780 caggtgatcg acgacatcct ggacgtgacc cagaccaccg agaccctggg caagaccgcc 840 gccaaggacc tggccgtgaa caagaccacc taccccaagc tgctgggcct ggaggcctct 900 cgaaaggtgg ccgacgacct gatccgagag gccatcgccc agctggacga gttcgagccc 960 gcccgaaagg cccccatggt ggccctggcc cacctgatcg gctaccgaaa gaactag 1017 <210> 2 <211> 531 <212> DNA <213> Artificial Sequence <220> <223> TEFINtp promoter <400> 2 agagaccggg ttggcggcgc atttgtgtcc caaaaaacag ccccaattgc cccaattgac 60 cccaaattga cccagtagcg ggcccaaccc cggcgagagc ccccttctcc ccacatatca 120 aacctccccc ggttcccaca cttgccgtta agggcgtagg gtactgcagt ctggaatcta 180 cgcttgttca gactttgtac tagtttcttt gtctggccat ccgggtaacc catgccggac 240 gcaaaataga ctactgaaaa tttttttgct ttgtggttgg gactttagcc aagggtataa 300 aagaccaccg tccccgaatt acctttcctc ttcttttctc tctctccttg tcaactcaca 360 cccgaaatcg ttaagcattt ccttctgagt ataagaatca ttcaaaatgg tgagtttcag 420 aggcagcagc aattgccacg ggctttgagc acacggccgg gtgtggtccc attcccatcg 480 acacaagacg ccacgtcatc cgaccagcac tttttgcagt actaaccgca g 531 <210> 3 <211> 254 <212> DNA <213> Artificial Sequence <220> <223> CYC1 terminator <400> 3 ctcgagtcat gtaattagtt atgtcacgct tacattcacg ccctcccccc acatccgctc 60 taaccgaaaa ggaaggagtt agacaacctg aagtctaggt ccctatttat ttttttatag 120 ttatgttagt attaagaacg ttatttatat ttcaaatttt tctttttttt ctgtacagac 180 gcgtgtacgc atgtaacatt atactgaaaa ccttgcttga gaaggttttg ggacgctcga 240 aggctttaat ttgc 254 <210> 4 <211> 1799 <212> DNA <213> Artificial Sequence <220> <223> TEFINtp-codon optimized Hp.GGPPS1-CYC1t <400> 4 agagaccggg ttggcggcgc atttgtgtcc caaaaaacag ccccaattgc cccaattgac 60 cccaaattga cccagtagcg ggcccaaccc cggcgagagc ccccttctcc ccacatatca 120 aacctccccc ggttcccaca cttgccgtta agggcgtagg gtactgcagt ctggaatcta 180 cgcttgttca gactttgtac tagtttcttt gtctggccat ccgggtaacc catgccggac 240 gcaaaataga ctactgaaaa tttttttgct ttgtggttgg gactttagcc aagggtataa 300 aagaccaccg tccccgaatt acctttcctc ttcttttctc tctctccttg tcaactcaca 360 cccgaaatcg ttaagcattt ccttctgagt ataagaatca ttcaaaatgg tgagtttcag 420 aggcagcagc aattgccacg ggctttgagc acacggccgg gtgtggtccc attcccatcg 480 acacaagacg ccacgtcatc cgaccagcac tttttgcagt actaaccgca gatccgagcc 540 atgcacaacc gagcccccac cccccgaacc cgagtgtctc acccccgatc tcaccgagcc 600 ctggcccacg tgtctgccgt ggccaccgcc ggccaggtgg ccgaggtgca ctctgccccc 660 gccttcgact tcgagatgta catgcgagac cgagccgaga tggtgaacaa ggccctggac 720 gccgccctgc cctctcgata ccccgaggtg ctggtggact ctatgcgata ctctgtgctg 780 gccggcggca agcgagtgcg acccgccctg accctggccg cctgtgacct ggtgggcggc 840 gacatggcca ccgccctgcc caccgcctgt gccatggaga tgatccacac catgtctctg 900 atccacgacg acctgcccgc catggacaac gacgacttcc gacgaggccg acccaccaac 960 cacaaggtgt acggcgagga catcgccatc ctggccggcg acgccctgct gtctttcgcc 1020 ttcgagcaca tcgcccgaga caccaagggc gtgcccgccg acgccgtgct gaaggtgatc 1080 atggagctgg gccgagccgt gggcgcccag ggcctgtctg ccggccaggc cgtggacatc 1140 aagtctgagg gccaggaggt gggcctggag gtgctggagt acatccacca ccacaagacc 1200 gccgccctgc tggaggccgc cgtggtgtgt ggcgccctgg tgggcggcgc cgacaccgcc 1260 accgtggaga agctgcgaaa gtacgccctg aacatcggcc tggccttcca ggtgatcgac 1320 gacatcctgg acgtgaccca gaccaccgag accctgggca agaccgccgc caaggacctg 1380 gccgtgaaca agaccaccta ccccaagctg ctgggcctgg aggcctctcg aaaggtggcc 1440 gacgacctga tccgagaggc catcgcccag ctggacgagt tcgagcccgc ccgaaaggcc 1500 cccatggtgg ccctggccca cctgatcggc taccgaaaga actagctcga gtcatgtaat 1560 tagttatgtc acgcttacat tcacgccctc cccccacatc cgctctaacc gaaaaggaag 1620 gagttagaca acctgaagtc taggtcccta tttatttttt tatagttatg ttagtattaa 1680 gaacgttatt tatatttcaa atttttcttt tttttctgta cagacgcgtg tacgcatgta 1740 acattatact gaaaaccttg cttgagaagg ttttgggacg ctcgaaggct ttaatttgc 1799 <210> 5 <211> 1533 <212> DNA <213> Artificial Sequence <220> <223> URA3 <400> 5 tgcctcctgt ctgactcgtc attgccgcct ttggagtacg actccaacta tgagtgtgct 60 tggatcactt tgacgataca ttcttcgttg gaggctgtgg gtctgacagc tgcgttttcg 120 gcgcggttgg ccgacaacaa tatcagctgc aacgtcattg ctggctttca tcatgatcac 180 atttttgtcg gcaaaggcga cgcccagaga gccattgacg ttctttctaa tttggaccga 240 tagccgtata gtccagtcta tctataagtt caactaactc gtaactatta ccataacata 300 tacttcactg ccccagataa ggttccgata aaaagttctg cagactaaat ttatttcagt 360 ctcctcttca ccaccaaaat gccctcctac gaagctcgag ctaacgtcca caagtccgcc 420 tttgccgctc gagtgctcaa gctcgtggca gccaagaaaa ccaacctgtg tgcttctctg 480 gatgttacca ccaccaagga gctcattgag cttgccgata aggtcggacc ttatgtgtgc 540 atgatcaaga cccatatcga catcattgac gacttcacct acgccggcac tgtgctcccc 600 ctcaaggaac ttgctcttaa gcacggtttc ttcctgttcg aggacagaaa gttcgcagat 660 attggcaaca ctgtcaagca ccagtacaag aacggtgtct accgaatcgc cgagtggtcc 720 gatatcacca acgcccacgg tgtacccgga accggaatca ttgctggcct gcgagctggt 780 gccgaggaaa ctgtctctga acagaagaag gaggacgtct ctgactacga gaactcccag 840 tacaaggagt tcctggtccc ctctcccaac gagaagctgg ccagaggtct gctcatgctg 900 gccgagctgt cttgcaaggg ctctctggcc actggcgagt actccaagca gaccattgag 960 cttgcccgat ccgaccccga gtttgtggtt ggcttcattg cccagaaccg acctaagggc 1020 gactctgagg actggcttat tctgaccccc ggggtgggtc ttgacgacaa gggagacgct 1080 ctcggacagc agtaccgaac tgttgaggat gtcatgtcta ccggaacgga tatcataatt 1140 gtcggccgag gtctgtacgg ccagaaccga gatcctattg aggaggccaa gcgataccag 1200 aaggctggct gggaggctta ccagaagatt aactgttaga ggttagacta tggatatgtc 1260 atttaactgt gtatatagag agcgtgcaag tatggagcgc ttgttcagct tgtatgatgg 1320 tcagacgacc tgtctgatcg agtatgtatg atactgcaca acctgtgtat ccgcatgatc 1380 tgtccaatgg ggcatgttgt tgtgtttctc gatacggaga tgctgggtac aagtagctaa 1440 tacgattgaa ctacttatac ttatatgagg cttgaagaaa gctgacttgt gtatgactta 1500 ttctcaacta catccccagt cacaatacca cca 1533 <210> 6 <211> 1131 <212> DNA <213> Artificial Sequence <220> <223> Codon optimized crtEM1 ORF <400> 6 atggattacg cgaacatcct cacagcaatt ccactcgagt ttactcctca ggatgatatc 60 gtgctccttg aaccgtatca ctacctagga aagaaccctg gaaaagaaat tcgatcacaa 120 ctcatcgagg ctttcaacta ttggttggat gtcaagaagg aggatctcga ggtcatccag 180 aacgttgttg gcatgctaca taccgctagc ttattaatgg acgatgtgga ggattcatcg 240 gtcctcaggc gtgggtcgcc tgtagcccat ctaatttacg ggattccgca gacaataaac 300 actgcaaact acgtctactt tctggcttat caagagatct tcaagcttcg cccaacaccg 360 atacccatgc ctgtaattcc tccttcatct gcttcgcttc aatcaaccgt ctcctctgca 420 tcctcctcct cctcggcctc gtctgaaaac gggggcacgt catctcctaa ttcgcagatt 480 ccgttctcga aagatacgta tcttgataaa gtgatcacag acgagatgct ttccctccat 540 agagggcaag gcctggagct attctggaga gatagtctga cgtgtcctag cgaagaggaa 600 tatgtgaaaa tggttcttgg aaagacggga ggtttgttcc gtatagcggt cagattgatg 660 atggcaaagt cagaatgtga catagacttt gtccagcttg tcaacttgat ctcaatatac 720 ttccagatca gggatgacta tatgaacctt cagtcttctg agtatgccca tattaagaat 780 tttgcagagg acctcacaga aggaaaattc agttttccca ctatccactc gattcgtgcc 840 aacccctcat cgagactcgt catcaatacg ttgcagaaga aatcgacctc tcctgagatc 900 cttcaccact gtgtaaacta catgcgcaca gaaacccact cattcgaata tactcaggaa 960 gtcctcaaca ccttgtcagg tgcactcgag agagaactag gaaggcttca aggagagttc 1020 gcagaagcta actcaaagat tgatcttgga gacgtagagt cggaaggaag aacggggaag 1080 aacgtcaaat tggaagcgat cctgaaaaag ctagccgata tccctctgtg a 1131 <210> 7 <211> 500 <212> DNA <213> Artificial Sequence <220> <223> TDH3t <400> 7 ctatccgaag atcaagagcg aagcaagttg taagtccagg acatgtttcc cgcccacgcg 60 agtgatttat aacacctctc ttttttgaca cccgctcgcc ttgaaattca tgtcacataa 120 attatagtca acgacgtttg aataacttgt cttgtagttc gatgatgatc atatgattac 180 attaatagta attactgtat ttgatatata tactaattac aatagtacat attagaacat 240 acaatagtta gtgccgtgaa gtggcttaaa ataccgcgag tcgattacgt aatattatat 300 ataatgtcaa agtggggtcc cagagccgaa gaaggtgctt ttcttgaaga tcccagtgta 360 ttggacaagt atatctgtct ctatgattgt ttttccaggt gaaaatgttg aacaaagtgt 420 ctactggagt ttgtaagcgc tggtgcgact ggggccactt ttaaaacccg ccttagcagg 480 ctttttcacc gttccaagac 500 <210> 8 <211> 2159 <212> DNA <213> Artificial Sequence <220> <223> TEFINtp-codon optimized crtEM1-TDH3t <400> 8 agagaccggg ttggcggcgc atttgtgtcc caaaaaacag ccccaattgc cccaattgac 60 cccaaattga cccagtagcg ggcccaaccc cggcgagagc ccccttctcc ccacatatca 120 aacctccccc ggttcccaca cttgccgtta agggcgtagg gtactgcagt ctggaatcta 180 cgcttgttca gactttgtac tagtttcttt gtctggccat ccgggtaacc catgccggac 240 gcaaaataga ctactgaaaa tttttttgct ttgtggttgg gactttagcc aagggtataa 300 aagaccaccg tccccgaatt acctttcctc ttcttttctc tctctccttg tcaactcaca 360 cccgaaatcg ttaagcattt ccttctgagt ataagaatca ttcaaaatgg tgagtttcag 420 aggcagcagc aattgccacg ggctttgagc acacggccgg gtgtggtccc attcccatcg 480 acacaagacg ccacgtcatc cgaccagcac tttttgcagt actaaccgca ggattacgcg 540 aacatcctca cagcaattcc actcgagttt actcctcagg atgatatcgt gctccttgaa 600 ccgtatcact acctaggaaa gaaccctgga aaagaaattc gatcacaact catcgaggct 660 ttcaactatt ggttggatgt caagaaggag gatctcgagg tcatccagaa cgttgttggc 720 atgctacata ccgctagctt attaatggac gatgtggagg attcatcggt cctcaggcgt 780 gggtcgcctg tagcccatct aatttacggg attccgcaga caataaacac tgcaaactac 840 gtctactttc tggcttatca agagatcttc aagcttcgcc caacaccgat acccatgcct 900 gtaattcctc cttcatctgc ttcgcttcaa tcaaccgtct cctctgcatc ctcctcctcc 960 tcggcctcgt ctgaaaacgg gggcacgtca tctcctaatt cgcagattcc gttctcgaaa 1020 gatacgtatc ttgataaagt gatcacagac gagatgcttt ccctccatag agggcaaggc 1080 ctggagctat tctggagaga tagtctgacg tgtcctagcg aagaggaata tgtgaaaatg 1140 gttcttggaa agacgggagg tttgttccgt atagcggtca gattgatgat ggcaaagtca 1200 gaatgtgaca tagactttgt ccagcttgtc aacttgatct caatatactt ccagatcagg 1260 gatgactata tgaaccttca gtcttctgag tatgcccata ttaagaattt tgcagaggac 1320 ctcacagaag gaaaattcag ttttcccact atccactcga ttcgtgccaa cccctcatcg 1380 agactcgtca tcaatacgtt gcagaagaaa tcgacctctc ctgagatcct tcaccactgt 1440 gtaaactaca tgcgcacaga aacccactca ttcgaatata ctcaggaagt cctcaacacc 1500 ttgtcaggtg cactcgagag agaactagga aggcttcaag gagagttcgc agaagctaac 1560 tcaaagattg atcttggaga cgtagagtcg gaaggaagaa cggggaagaa cgtcaaattg 1620 gaagcgatcc tgaaaaagct agccgatatc cctctgtgac tatccgaaga tcaagagcga 1680 agcaagttgt aagtccagga catgtttccc gcccacgcga gtgatttata acacctctct 1740 tttttgacac ccgctcgcct tgaaattcat gtcacataaa ttatagtcaa cgacgtttga 1800 ataacttgtc ttgtagttcg atgatgatca tatgattaca ttaatagtaa ttactgtatt 1860 tgatatatat actaattaca atagtacata ttagaacata caatagttag tgccgtgaag 1920 tggcttaaaa taccgcgagt cgattacgta atattatata taatgtcaaa gtggggtccc 1980 agagccgaag aaggtgcttt tcttgaagat cccagtgtat tggacaagta tatctgtctc 2040 tatgattgtt tttccaggtg aaaatgttga acaaagtgtc tactggagtt tgtaagcgct 2100 ggtgcgactg gggccacttt taaaacccgc cttagcaggc tttttcaccg ttccaagac 2159 <210> 9 <211> 1008 <212> DNA <213> Artificial Sequence <220> <223> Sc.BTS1 ORF <400> 9 atggaggcca agatagatga gctgatcaat aatgatcctg tttggtccag ccaaaatgaa 60 agcttgattt caaaacctta taatcacatc cttttgaaac ctggcaagaa ctttagacta 120 aatttaatag ttcaaattaa cagagttatg aatttgccca aagaccagct ggccatagtt 180 tcgcaaattg ttgagctctt gcataattcc agccttttaa tcgacgatat agaagataat 240 gctcccttga gaaggggaca gaccacttct cacttaatct tcggtgtacc ctccactata 300 aacaccgcaa attatatgta tttcagagcc atgcaacttg tatcgcagct aaccacaaaa 360 gagcctttgt atcataattt gattacgatt ttcaacgaag aattgatcaa tctacatagg 420 ggacaaggct tggatatata ctggagagac tttctgcctg aaatcatacc tactcaggag 480 atgtatttga atatggttat gaataaaaca ggcggccttt tcagattaac gttgagactc 540 atggaagcgc tgtctccttc ctcacaccac ggccattcgt tggttccttt cataaatctt 600 ctgggtatta tttatcagat tagagatgat tacttgaatt tgaaagattt ccaaatgtcc 660 agcgaaaaag gctttgctga ggacattaca gaggggaagt tatcttttcc catcgtccac 720 gcccttaact tcactaaaac gaaaggtcaa actgagcaac acaatgaaat tctaagaatt 780 ctcctgttga ggacaagtga taaagatata aaactaaagc tgattcaaat actggaattc 840 gacaccaatt cattggccta caccaaaaat tttattaatc aattagtgaa tatgataaaa 900 aatgataatg aaaataagta tttacctgat ttggcttcgc attccgacac cgccaccaat 960 ttacatgacg aattgttata tataatagac cacttatccg aattgtga 1008 <210> 10 <211> 2036 <212> DNA <213> Artificial Sequence <220> <223> TEFINtp-Sc.BTS1-TDH3t <400> 10 agagaccggg ttggcggcgc atttgtgtcc caaaaaacag ccccaattgc cccaattgac 60 cccaaattga cccagtagcg ggcccaaccc cggcgagagc ccccttctcc ccacatatca 120 aacctccccc ggttcccaca cttgccgtta agggcgtagg gtactgcagt ctggaatcta 180 cgcttgttca gactttgtac tagtttcttt gtctggccat ccgggtaacc catgccggac 240 gcaaaataga ctactgaaaa tttttttgct ttgtggttgg gactttagcc aagggtataa 300 aagaccaccg tccccgaatt acctttcctc ttcttttctc tctctccttg tcaactcaca 360 cccgaaatcg ttaagcattt ccttctgagt ataagaatca ttcaaaatgg tgagtttcag 420 aggcagcagc aattgccacg ggctttgagc acacggccgg gtgtggtccc attcccatcg 480 acacaagacg ccacgtcatc cgaccagcac tttttgcagt actaaccgca ggaggccaag 540 atagatgagc tgatcaataa tgatcctgtt tggtccagcc aaaatgaaag cttgatttca 600 aaaccttata atcacatcct tttgaaacct ggcaagaact ttagactaaa tttaatagtt 660 caaattaaca gagttatgaa tttgcccaaa gaccagctgg ccatagtttc gcaaattgtt 720 gagctcttgc ataattccag ccttttaatc gacgatatag aagataatgc tcccttgaga 780 aggggacaga ccacttctca cttaatcttc ggtgtaccct ccactataaa caccgcaaat 840 tatatgtatt tcagagccat gcaacttgta tcgcagctaa ccacaaaaga gcctttgtat 900 cataatttga ttacgatttt caacgaagaa ttgatcaatc tacatagggg acaaggcttg 960 gatatatact ggagagactt tctgcctgaa atcataccta ctcaggagat gtatttgaat 1020 atggttatga ataaaacagg cggccttttc agattaacgt tgagactcat ggaagcgctg 1080 tctccttcct cacaccacgg ccattcgttg gttcctttca taaatcttct gggtattatt 1140 tatcagatta gagatgatta cttgaatttg aaagatttcc aaatgtccag cgaaaaaggc 1200 tttgctgagg acattacaga ggggaagtta tcttttccca tcgtccacgc ccttaacttc 1260 actaaaacga aaggtcaaac tgagcaacac aatgaaattc taagaattct cctgttgagg 1320 acaagtgata aagatataaa actaaagctg attcaaatac tggaattcga caccaattca 1380 ttggcctaca ccaaaaattt tattaatcaa ttagtgaata tgataaaaaa tgataatgaa 1440 aataagtatt tacctgattt ggcttcgcat tccgacaccg ccaccaattt acatgacgaa 1500 ttgttatata taatagacca cttatccgaa ttgtgactat ccgaagatca agagcgaagc 1560 aagttgtaag tccaggacat gtttcccgcc cacgcgagtg atttataaca cctctctttt 1620 ttgacacccg ctcgccttga aattcatgtc acataaatta tagtcaacga cgtttgaata 1680 acttgtcttg tagttcgatg atgatcatat gattacatta atagtaatta ctgtatttga 1740 tatatatact aattacaata gtacatatta gaacatacaa tagttagtgc cgtgaagtgg 1800 cttaaaatac cgcgagtcga ttacgtaata ttatatataa tgtcaaagtg gggtcccaga 1860 gccgaagaag gtgcttttct tgaagatccc agtgtattgg acaagtatat ctgtctctat 1920 gattgttttt ccaggtgaaa atgttgaaca aagtgtctac tggagtttgt aagcgctggt 1980 gcgactgggg ccacttttaa aacccgcctt agcaggcttt ttcaccgttc caagac 2036 <210> 11 <211> 984 <212> DNA <213> Artificial Sequence <220> <223> Yl.GGS1 ORF <400> 11 atggattata acagcgcgga tttcaaggag atatggggca aggccgccga caccgcgctg 60 ctgggaccgt acaactacct cgccaacaac cggggccaca acatcagaga acacttgatc 120 gcagcgttcg gagcggttat caaggtggac aagagcgatc tcgagaccat ttcgcacatc 180 accaagattt tgcataactc gtcgctgctt gttgatgacg tggaagacaa ctcgatgctc 240 cgacgaggcc tgccggcagc ccattgtctg tttggagtcc cccaaaccat caactccgcc 300 aactacatgt actttgtggc tctgcaggag gtgctcaagc tcaagtctta tgatgccgtc 360 tccattttca ccgaggaaat gatcaacttg catagaggtc agggtatgga tctctactgg 420 agagaaacac tcacttgccc ctcggaagac gagtatctgg agatggtggt gcacaagacc 480 ggtggactgt ttcggctggc tctgagactt atgctgtcgg tggcatcgaa acaggaggac 540 catgaaaaga tcaactttga tctcacacac cttaccgaca cactgggagt catttaccag 600 attctggatg attacctcaa cctgcagtcc acggaattga ccgagaacaa gggattctgc 660 gaagatatca gcgaaggaaa gttttcgttt ccgctgattc acagcatacg caccaacccg 720 gataaccacg agattctcaa cattctcaaa cagcgaacaa gcgacgcttc actcaaaaag 780 tacgccgtgg actacatgag aacagaaacc aagagtttcg actactgcct caagaggata 840 caggccatgt cactcaaggc aagttcgtac attgatgatc tagcagcagc tggccacgat 900 gtctccaagc tacgagccat tttgcattat tttgtgtcca cctctgactg tgaggagaga 960 aagtactttg aggatgcgca gtga 984 <210> 12 <211> 2012 <212> DNA <213> Artificial Sequence <220> <223> TEFINtp-Yl.GGS1-TDH3t <400> 12 agagaccggg ttggcggcgc atttgtgtcc caaaaaacag ccccaattgc cccaattgac 60 cccaaattga cccagtagcg ggcccaaccc cggcgagagc ccccttctcc ccacatatca 120 aacctccccc ggttcccaca cttgccgtta agggcgtagg gtactgcagt ctggaatcta 180 cgcttgttca gactttgtac tagtttcttt gtctggccat ccgggtaacc catgccggac 240 gcaaaataga ctactgaaaa tttttttgct ttgtggttgg gactttagcc aagggtataa 300 aagaccaccg tccccgaatt acctttcctc ttcttttctc tctctccttg tcaactcaca 360 cccgaaatcg ttaagcattt ccttctgagt ataagaatca ttcaaaatgg tgagtttcag 420 aggcagcagc aattgccacg ggctttgagc acacggccgg gtgtggtccc attcccatcg 480 acacaagacg ccacgtcatc cgaccagcac tttttgcagt actaaccgca ggattataac 540 agcgcggatt tcaaggagat atggggcaag gccgccgaca ccgcgctgct gggaccgtac 600 aactacctcg ccaacaaccg gggccacaac atcagagaac acttgatcgc agcgttcgga 660 gcggttatca aggtggacaa gagcgatctc gagaccattt cgcacatcac caagattttg 720 cataactcgt cgctgcttgt tgatgacgtg gaagacaact cgatgctccg acgaggcctg 780 ccggcagccc attgtctgtt tggagtcccc caaaccatca actccgccaa ctacatgtac 840 tttgtggctc tgcaggaggt gctcaagctc aagtcttatg atgccgtctc cattttcacc 900 gaggaaatga tcaacttgca tagaggtcag ggtatggatc tctactggag agaaacactc 960 acttgcccct cggaagacga gtatctggag atggtggtgc acaagaccgg tggactgttt 1020 cggctggctc tgagacttat gctgtcggtg gcatcgaaac aggaggacca tgaaaagatc 1080 aactttgatc tcacacacct taccgacaca ctgggagtca tttaccagat tctggatgat 1140 tacctcaacc tgcagtccac ggaattgacc gagaacaagg gattctgcga agatatcagc 1200 gaaggaaagt tttcgtttcc gctgattcac agcatacgca ccaacccgga taaccacgag 1260 attctcaaca ttctcaaaca gcgaacaagc gacgcttcac tcaaaaagta cgccgtggac 1320 tacatgagaa cagaaaccaa gagtttcgac tactgcctca agaggataca ggccatgtca 1380 ctcaaggcaa gttcgtacat tgatgatcta gcagcagctg gccacgatgt ctccaagcta 1440 cgagccattt tgcattattt tgtgtccacc tctgactgtg aggagagaaa gtactttgag 1500 gatgcgcagt gactatccga agatcaagag cgaagcaagt tgtaagtcca ggacatgttt 1560 cccgcccacg cgagtgattt ataacacctc tcttttttga cacccgctcg ccttgaaatt 1620 catgtcacat aaattatagt caacgacgtt tgaataactt gtcttgtagt tcgatgatga 1680 tcatatgatt acattaatag taattactgt atttgatata tatactaatt acaatagtac 1740 atattagaac atacaatagt tagtgccgtg aagtggctta aaataccgcg agtcgattac 1800 gtaatattat atataatgtc aaagtggggt cccagagccg aagaaggtgc ttttcttgaa 1860 gatcccagtg tattggacaa gtatatctgt ctctatgatt gtttttccag gtgaaaatgt 1920 tgaacaaagt gtctactgga gtttgtaagc gctggtgcga ctggggccac ttttaaaacc 1980 cgccttagca ggctttttca ccgttccaag ac 2012 <210> 13 <211> 828 <212> DNA <213> Artificial Sequence <220> <223> Codon optimized Mb.BCO ORF <400> 13 atgggcctga tgctgatcga ctggtgtgcc ctggccctgg tggtgttcat cggcctgccc 60 cacggcgccc tggacgccgc catctctttc tctatgatct cttctgccaa gcgaatcgcc 120 cgactggccg gcatcctgct gatctacctg ctgctggcca ccgccttctt cctgatctgg 180 taccagctgc ccgccttctc tctgctgatc ttcctgctga tctctatcat ccacttcggc 240 atggccgact tcaacgcctc tccctctaag ctgaagtggc cccacatcat cgcccacggc 300 ggcgtggtga ccgtgtggct gcccctgatc cagaagaacg aggtgaccaa gctgttctct 360 atcctgacca acggccccac ccccatcctg tgggacatcc tgctgatctt cttcctgtgt 420 tggtctatcg gcgtgtgtct gcacacctac gagaccctgc gatctaagca ctacaacatc 480 gccttcgagc tgatcggcct gatcttcctg gcctggtacg ccccccccct ggtgaccttc 540 gccacctact tctgtttcat ccactctcga cgacacttct ctttcgtgtg gaagcagctg 600 cagcacatgt cttctaagaa gatgatgatc ggctctgcca tcatcctgtc ttgtacctct 660 tggctgatcg gcggcggcat ctacttcttc ctgaactcta agatgatcgc ctctgaggcc 720 gccctgcaga ccgtgttcat cggcctggcc gccctgaccg tgccccacat gatcctgatc 780 gacttcatct tccgacccca ctcttctcga atcaagatca agaactag 828 <210> 14 <211> 1610 <212> DNA <213> Artificial Sequence <220> <223> TEFINtp-codon optimized Mb.BCO-CYC1t <400> 14 agagaccggg ttggcggcgc atttgtgtcc caaaaaacag ccccaattgc cccaattgac 60 cccaaattga cccagtagcg ggcccaaccc cggcgagagc ccccttctcc ccacatatca 120 aacctccccc ggttcccaca cttgccgtta agggcgtagg gtactgcagt ctggaatcta 180 cgcttgttca gactttgtac tagtttcttt gtctggccat ccgggtaacc catgccggac 240 gcaaaataga ctactgaaaa tttttttgct ttgtggttgg gactttagcc aagggtataa 300 aagaccaccg tccccgaatt acctttcctc ttcttttctc tctctccttg tcaactcaca 360 cccgaaatcg ttaagcattt ccttctgagt ataagaatca ttcaaaatgg tgagtttcag 420 aggcagcagc aattgccacg ggctttgagc acacggccgg gtgtggtccc attcccatcg 480 acacaagacg ccacgtcatc cgaccagcac tttttgcagt actaaccgca gggcctgatg 540 ctgatcgact ggtgtgccct ggccctggtg gtgttcatcg gcctgcccca cggcgccctg 600 gacgccgcca tctctttctc tatgatctct tctgccaagc gaatcgcccg actggccggc 660 atcctgctga tctacctgct gctggccacc gccttcttcc tgatctggta ccagctgccc 720 gccttctctc tgctgatctt cctgctgatc tctatcatcc acttcggcat ggccgacttc 780 aacgcctctc cctctaagct gaagtggccc cacatcatcg cccacggcgg cgtggtgacc 840 gtgtggctgc ccctgatcca gaagaacgag gtgaccaagc tgttctctat cctgaccaac 900 ggccccaccc ccatcctgtg ggacatcctg ctgatcttct tcctgtgttg gtctatcggc 960 gtgtgtctgc acacctacga gaccctgcga tctaagcact acaacatcgc cttcgagctg 1020 atcggcctga tcttcctggc ctggtacgcc ccccccctgg tgaccttcgc cacctacttc 1080 tgtttcatcc actctcgacg acacttctct ttcgtgtgga agcagctgca gcacatgtct 1140 tctaagaaga tgatgatcgg ctctgccatc atcctgtctt gtacctcttg gctgatcggc 1200 ggcggcatct acttcttcct gaactctaag atgatcgcct ctgaggccgc cctgcagacc 1260 gtgttcatcg gcctggccgc cctgaccgtg ccccacatga tcctgatcga cttcatcttc 1320 cgaccccact cttctcgaat caagatcaag aactagctcg agtcatgtaa ttagttatgt 1380 cacgcttaca ttcacgccct ccccccacat ccgctctaac cgaaaaggaa ggagttagac 1440 aacctgaagt ctaggtccct atttattttt ttatagttat gttagtatta agaacgttat 1500 ttatatttca aatttttctt ttttttctgt acagacgcgt gtacgcatgt aacattatac 1560 tgaaaacctt gcttgagaag gttttgggac gctcgaaggc tttaatttgc 1610 <210> 15 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Hp.GGPPS1 insertion <400> 15 catcatttca aaagagggaa cagc 24 <210> 16 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Hp.GGPPS1 insertion <400> 16 cgccgccaac ccggtctctg tgtttggcgg tgtgagttgt c 41 <210> 17 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Hp.GGPPS1 insertion <400> 17 gacaactcac accgccaaac acagagaccg ggttggcggc g 41 <210> 18 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Hp.GGPPS1 insertion <400> 18 cggttgtgca tggctcggat ctgcggttag tactgcaaaa agtgc 45 <210> 19 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Hp.GGPPS1 insertion <400> 19 gcactttttg cagtactaac cgcagatccg agccatgcac aaccg 45 <210> 20 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Hp.GGPPS1 insertion <400> 20 aactaattac atgactcgag ctagttcttt cggtagccga 40 <210> 21 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Hp.GGPPS1 insertion <400> 21 tcggctaccg aaagaactag ctcgagtcat gtaattagtt 40 <210> 22 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Hp.GGPPS1 insertion <400> 22 gacgagtcag acaggaggca gcaaattaaa gccttcgagc 40 <210> 23 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Hp.GGPPS1 insertion <400> 23 gctcgaaggc tttaatttgc tgcctcctgt ctgactcgtc 40 <210> 24 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Hp.GGPPS1 insertion <400> 24 aactaattac atgactcgag tggtggtatt gtgactgggg 40 <210> 25 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Hp.GGPPS1 insertion <400> 25 ccccagtcac aataccacca ctcgagtcat gtaattagtt 40 <210> 26 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Hp.GGPPS1 insertion <400> 26 ccatatggag tgttatttga aggggcaaat taaagccttc gagc 44 <210> 27 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Hp.GGPPS1 insertion <400> 27 gctcgaaggc tttaatttgc cccttcaaat aacactccat atgg 44 <210> 28 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Hp.GGPPS1 insertion <400> 28 ccgatacagt gtccaagtac g 21 <210> 29 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer to confirm insertion of cassette for Hp.GGPPS1 insertion <400> 29 gagtgtctga agacaaggct tc 22 <210> 30 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer to confirm insertion of cassette for Hp.GGPPS1 insertion <400> 30 gacgacaatg ctgagctccg 20 <210> 31 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1 insertion <400> 31 catcatttca aaagagggaa cagc 24 <210> 32 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1 insertion <400> 32 cgccgccaac ccggtctctg tgtttggcgg tgtgagttgt c 41 <210> 33 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1 insertion <400> 33 gacaactcac accgccaaac acagagaccg ggttggcggc g 41 <210> 34 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1 insertion <400> 34 ctgtgaggat gttcgcgtaa tcctgcggtt agtactgcaa aaagtgc 47 <210> 35 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1 insertion <400> 35 gcactttttg cagtactaac cgcaggatta cgcgaacatc ctcacag 47 <210> 36 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1 insertion <400> 36 cttcgctctt gatcttcgga tagtcacaga gggatatcgg ctag 44 <210> 37 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1 insertion <400> 37 ctagccgata tccctctgtg actatccgaa gatcaagagc gaag 44 <210> 38 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1 insertion <400> 38 gacgagtcag acaggaggca gtcttggaac ggtgaaaaag cctgc 45 <210> 39 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1 insertion <400> 39 gcaggctttt tcaccgttcc aagactgcct cctgtctgac tcgtc 45 <210> 40 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1 insertion <400> 40 cgctcttgat cttcggatag tggtggtatt gtgactgggg a 41 <210> 41 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1 insertion <400> 41 tccccagtca caataccacc actatccgaa gatcaagagc g 41 <210> 42 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1 insertion <400> 42 catatggagt gttatttgaa ggggtcttgg aacggtgaaa aagcctgc 48 <210> 43 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1 insertion <400> 43 gcaggctttt tcaccgttcc aagacccctt caaataacac tccatatg 48 <210> 44 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1 insertion <400> 44 ccgatacagt gtccaagtac g 21 <210> 45 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer to confirm insertion of cassette for crtEM1, Sc. BTS1, or Yl.GGS1 insertion <400> 45 gagtgtctga agacaaggct tc 22 <210> 46 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer to confirm insertion of cassette for crtEM1, Sc. BTS1, or Yl.GGS1 insertion <400> 46 gacgacaatg ctgagctccg 20 <210> 47 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Sc. BTS1 insertion <400> 47 cagctcatct atcttggcct cctgcggtta gtactgcaaa aagtgc 46 <210> 48 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Sc. BTS1 insertion <400> 48 gcactttttg cagtactaac cgcaggaggc caagatagat gagctg 46 <210> 49 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Sc. BTS1 insertion <400> 49 cttcgctctt gatcttcgga tagtcacaat tcggataagt ggtctattat atataac 57 <210> 50 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Sc. BTS1 insertion <400> 50 gttatatata atagaccact tatccgaatt gtgactatcc gaagatcaag agcgaag 57 <210> 51 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Yl.GGS1 insertion <400> 51 cttgaaatcc gcgctgttat aatcctgcgg ttagtactgc aaaaagtgc 49 <210> 52 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Yl.GGS1 insertion <400> 52 gcactttttg cagtactaac cgcaggatta taacagcgcg gatttcaag 49 <210> 53 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Yl.GGS1 insertion <400> 53 cttcgctctt gatcttcgga tagtcactgc gcatcctcaa agtac 45 <210> 54 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Yl.GGS1 insertion <400> 54 gtactttgag gatgcgcagt gactatccga agatcaagag cgaag 45 <210> 55 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Mb.BCO insertion <400> 55 ggcgtttcag gtggttgcgt gagtg 25 <210> 56 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Mb.BCO insertion <400> 56 gacacaaatg cgccgccaac ccggtctctg cggcggttcg tggttcgtgt ttc 53 <210> 57 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Mb.BCO insertion <400> 57 gaaacacgaa ccacgaaccg ccgcagagac cgggttggcg gcgcatttgt gtc 53 <210> 58 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Mb.BCO insertion <400> 58 cagtcgatca gcatcaggcc ctgcggttag tactgcaaaa 40 <210> 59 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Mb.BCO insertion <400> 59 ttttgcagta ctaaccgcag ggcctgatgc tgatcgactg 40 <210> 60 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Mb.BCO insertion <400> 60 aactaattac atgactcgag ctagttcttg atcttgattc 40 <210> 61 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Mb.BCO insertion <400> 61 gaatcaagat caagaactag ctcgagtcat gtaattagtt 40 <210> 62 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Mb.BCO insertion <400> 62 gacgagtcag acaggaggca gcaaattaaa gccttcgagc gtccc 45 <210> 63 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Mb.BCO insertion <400> 63 gggacgctcg aaggctttaa tttgctgcct cctgtctgac tcgtc 45 <210> 64 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Mb.BCO insertion <400> 64 aactaattac atgactcgag tggtggtatt gtgactgggg 40 <210> 65 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Mb.BCO insertion <400> 65 ccccagtcac aataccacca ctcgagtcat gtaattagtt 40 <210> 66 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Mb.BCO insertion <400> 66 gcagcagtca tacatgttct gaggcaaatt aaagccttcg agcgtccc 48 <210> 67 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Mb.BCO insertion <400> 67 gggacgctcg aaggctttaa tttgcctcag aacatgtatg actgctgc 48 <210> 68 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for Mb.BCO insertion <400> 68 ctactttgtg cagattgagg ccaag 25 <210> 69 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer to confirm insertion of cassette for Mb.BCO insertion <400> 69 gtcgtctgtc ttctcttcag 20 <210> 70 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer to confirm insertion of cassette for Mb.BCO insertion <400> 70 ccaccaagat gggcaagaag 20 <210> 71 <211> 2022 <212> DNA <213> Artificial Sequence <220> <223> crtYB derived from X. dendrorhous <400> 71 atgacggctc tcgcatatta ccagatccat ctgatctata ctctcccaat tcttggtctt 60 ctcggcctgc tcacttcccc gattttgaca aaatttgaca tctacaaaat atcgatcctc 120 gtatttattg cgtttagtgc aaccacacca tgggactcat ggatcatcag aaatggcgca 180 tggacatatc catcagcgga gagtggccaa ggcgtgtttg gaacgtttct agatgttcca 240 tatgaagagt acgctttctt tgtcattcaa accgtaatca ccggcttggt ctacgtcttg 300 gcaactaggc accttctccc atctctcgcg cttcccaaga ctagatcgtc cgccctttct 360 ctcgcgctca aggcgctcat ccctctgccc attatctacc tatttaccgc tcaccccagc 420 ccatcgcccg acccgctcgt gacagatcac tacttctaca tgcgggcact ctccttactc 480 atcaccccac ctaccatgct cttggcagca ttatcaggcg aatatgcttt cgattggaaa 540 agtggccgag caaagtcaac tattgcagca atcatgatcc cgacggtgta tctgatttgg 600 gtagattatg ttgctgtcgg tcaagactct tggtcgatca acgatgagaa gattgtaggg 660 tggaggcttg gaggtgtact acccattgag gaagctatgt tcttcttact gacgaatcta 720 atgattgttc tgggtctgtc tgcctgcgat catactcagg ccctatacct gctacacggt 780 cgaactattt atggcaacaa aaagatgcca tcttcatttc ccctcattac accgcctgtg 840 ctctccctgt tttttagcag ccgaccatac tcttctcagc caaaacgtga cttggaactg 900 gcagtcaagt tgttggagga aaagagccgg agcttttttg ttgcctcggc tggatttcct 960 agcgaagtta gggagaggct ggttggacta tacgcattct gccgggtgac tgatgatctt 1020 atcgactctc ctgaagtatc ttccaacccg catgccacaa ttgacatggt ctccgatttt 1080 cttaccctac tatttgggcc cccgctacac ccttcgcaac ctgacaagat cctttcttcg 1140 cctttacttc ctccttcgca cccttcccga cccacgggaa tgtatcccct cccgcctcct 1200 ccttcgctct cgcctgccga gctcgttcaa ttccttaccg aaagggttcc cgttcaatac 1260 catttcgcct tcaggttgct cgctaagttg caagggctga tccctcgata cccactcgac 1320 gaactcctta gaggatacac cactgatctt atctttccct tatcgacaga ggcagtccag 1380 gctcggaaga cgcctatcga gaccacagct gacttgctgg actatggtct atgtgtagca 1440 ggctcagtcg ccgagctatt ggtctatgtc tcttgggcaa gtgcaccaag tcaggtccct 1500 gccaccatag aagaaagaga agctgtgtta gtggcaagcc gagagatggg aactgccctt 1560 cagttggtga acattgctag ggacattaaa ggggacgcaa cagaagggag attttaccta 1620 ccactctcat tctttggtct tcgggatgaa tcaaagcttg cgatcccgac tgattggacg 1680 gaacctcggc ctcaagattt cgacaaactc ctcagtctat ctccttcgtc cacattacca 1740 tcttcaaacg cctcagaaag cttccggttc gaatggaaga cgtactcgct tccattagtc 1800 gcctacgcag aggatcttgc caaacattct tataagggaa ttgaccgact tcctaccgag 1860 gttcaagcgg gaatgcgagc ggcttgcgcg agctacctac tgatcggccg agagatcaaa 1920 gtcgtttgga aaggagacgt cggagagaga aggacagttg ccggatggag gagagtacgg 1980 aaagtcttga gtgtggtcat gagcggatgg gaagggcagt aa 2022 <210> 72 <211> 1749 <212> DNA <213> Artificial Sequence <220> <223> crtI derived from X. dendrorhous <400> 72 atgggaaaag aacaagatca ggataaaccc acagctatca tcgtgggatg tggtatcggt 60 ggaatcgcca ctgccgctcg tcttgctaaa gaaggtttcc aggtcacggt gttcgagaag 120 aacgactact ccggaggtcg atgctcttta atcgagcgag atggttatcg attcgatcag 180 gggcccagtt tgctgctctt gccagatctc ttcaagcaga cattcgaaga tttgggagag 240 aagatggaag attgggtcga tctcatcaag tgtgaaccca actatgtttg ccacttccac 300 gatgaagaga ctttcactct ttcaaccgac atggcgttgc tcaagcggga agtcgagcgt 360 tttgaaggca aagatggatt tgatcggttc ttgtcgttta tccaagaagc ccacagacat 420 tacgagcttg ctgtcgttca cgtcctgcag aagaacttcc ctggcttcgc agcattctta 480 cggctacagt tcattggcca aatcctggct cttcacccct tcgagtctat ctggacaaga 540 gtttgtcgat atttcaagac cgacagatta cgaagagtct tctcgtttgc agtgatgtac 600 atgggtcaaa gcccatacag tgcgcccgga acatattcct tgctccaata caccgaattg 660 accgagggca tctggtatcc gagaggaggc ttttggcagg ttcctaatac tcttcttcag 720 atcgtcaagc gcaacaatcc ctcagccaag ttcaatttca acgctccagt ttcccaggtt 780 cttctctctc ctgccaagga ccgagcgact ggtgttcgac ttgaatccgg cgaggaacat 840 cacgccgatg ttgtgattgt caatgctgac ctcgtttacg cctccgagca cttgattcct 900 gacgatgcca gaaacaagat tggccaactg ggtgaagtca agagaagttg gtgggctgac 960 ttagttggtg gaaagaagct caagggaagt tgcagtagtt tgagcttcta ctggagcatg 1020 gaccgaatcg tggacggtct gggcggacac aatatcttct tggccgagga cttcaaggga 1080 tcattcgaca caatcttcga ggagttgggt ctcccagccg atccttcctt ttacgtgaac 1140 gttccctcgc gaatcgatcc ttctgccgct cccgaaggca aagatgctat cgtcattctt 1200 gtgccgtgtg gccatatcga cgcttcgaac cctcaagatt acaacaagct tgttgctcgg 1260 gcaaggaagt ttgtgatcca cacgctttcc gccaagcttg gacttcccga ctttgaaaaa 1320 atgattgtgg cagagaaggt tcacgatgct ccctcttggg agaaagaatt caacctcaag 1380 gacggaagca tcttgggact ggctcacaac tttatgcaag ttcttggttt caggccgagc 1440 accagacatc ccaagtatga caagttgttc tttgtcgggg cttcgactca tcccggaact 1500 ggggttccca tcgtcttggc tggagccaag ttaactgcca accaagttct cgaatccttt 1560 gaccgatccc cagctccaga tcccaatatg tcactctccg taccatatgg aaaacctctc 1620 aaatcaaatg gaacgggtat cgattctcag gtccagctga agttcatgga tttggagaga 1680 tgggtatacc ttttggtgtt gttgattggg gccgtgatcg ctcgatccgt tggtgttctt 1740 gctttctga 1749 <210> 73 <211> 2804 <212> DNA <213> Artificial Sequence <220> <223> TEFINtp-crtYB-CYC1t <400> 73 agagaccggg ttggcggcgc atttgtgtcc caaaaaacag ccccaattgc cccaattgac 60 cccaaattga cccagtagcg ggcccaaccc cggcgagagc ccccttctcc ccacatatca 120 aacctccccc ggttcccaca cttgccgtta agggcgtagg gtactgcagt ctggaatcta 180 cgcttgttca gactttgtac tagtttcttt gtctggccat ccgggtaacc catgccggac 240 gcaaaataga ctactgaaaa tttttttgct ttgtggttgg gactttagcc aagggtataa 300 aagaccaccg tccccgaatt acctttcctc ttcttttctc tctctccttg tcaactcaca 360 cccgaaatcg ttaagcattt ccttctgagt ataagaatca ttcaaaatgg tgagtttcag 420 aggcagcagc aattgccacg ggctttgagc acacggccgg gtgtggtccc attcccatcg 480 acacaagacg ccacgtcatc cgaccagcac tttttgcagt actaaccgca gacggctctc 540 gcatattacc agatccatct gatctatact ctcccaattc ttggtcttct cggtctgctc 600 acttccccga ttttgacaaa atttgacatc tacaaaatat cgatcctcgt atttattgcg 660 tttagtgcaa ccacaccatg ggactcatgg atcatcagaa atggcgcatg gacatatcca 720 tcagcggaga gtggccaagg cgtgtttgga acgtttctag atgttccata tgaagagtac 780 gctttctttg tcattcaaac cgtaatcacc ggcttggtct acgtcttggc aactaggcac 840 cttctcccat ctctcgcgct tcccaagact agatcgtccg ccctttctct cgcgctcaag 900 gcgctcatcc ctctgcccat tatctaccta tttaccgctc accccagccc atcgcccgac 960 ccgctcgtga cagatcacta cttctacatg cgggcactct ccttactcat caccccacct 1020 accatgctct tggcagcatt atcaggcgaa tatgctttcg attggaaaag tggccgagca 1080 aagtcaacta ttgcagcaat catgatcccg acggtgtatc tgatttgggt agattatgtt 1140 gctgtcggtc aagactcttg gtcgatcaac gatgagaaga ttgtagggtg gaggcttgga 1200 ggtgtactac ccattgagga agctatgttc ttcttactga cgaatctaat gattgttctg 1260 ggtctgtctg cctgcgatca tactcaggcc ctatacctgc tacacggtcg aactatttat 1320 ggcaacaaaa agatgccatc ttcatttccc ctcattacac cgcctgtgct ctccctgttt 1380 tttagcagcc gaccatactc ttctcagcca aaacgtgact tggaactggc agtcaagttg 1440 ttggaggaaa agagccggag cttttttgtt gcctcggctg gatttcctag cgaagttagg 1500 gagaggctgg ttggactata cgcattctgc cgggtgactg atgatcttat cgactctcct 1560 gaagtatctt ccaacccgca tgccacaatt gacatggtct ccgattttct taccctacta 1620 tttgggcccc cgctacaccc ttcgcaacct gacaagatcc tttcttcgcc tttacttcct 1680 ccttcgcacc cttcccgacc cacgggaatg tatcccctcc cgcctcctcc ttcgctctcg 1740 cctgccgagc tcgttcaatt ccttaccgaa agggttcccg ttcaatacca tttcgccttc 1800 aggttgctcg ctaagttgca agggctgatc cctcgatacc cactcgacga actccttaga 1860 ggatacacca ctgatcttat ctttccttta tcgacagagg cagtccaggc tcggaagacg 1920 cctatcgaga ccacagctga cttgctggac tatggtctat gtgtagcagg ctcagtcgcc 1980 gagctattgg tctatgtctc ttgggcaagt gcaccaagtc aggtccctgc caccatagaa 2040 gaaagagaag ctgtgttagt ggcaagccga gagatgggaa ctgcccttca gttggtgaac 2100 attgctaggg acattaaagg ggacgcaaca gaagggagat tttacctacc actctcattc 2160 tttggtcttc gggatgaatc aaagcttgcg atcccgactg attggacgga acctcggcct 2220 caagatttcg acaaactcct cagtctatct ccttcgtcca cattaccatc ttcaaacgcc 2280 tcagaaagct tccggttcga atggaagacg tactcgcttc cattagtcgc ctacgcagag 2340 gatcttgcca aacattctta taagggaatt gaccgacttc ctaccgaggt tcaagcggga 2400 atgcgagcgg cttgcgcgag ctacctactg atcggccgag agatcaaagt cgtttggaaa 2460 ggagacgtcg gagagagaag gacagttgcc ggatggagga gagtacggaa agtcttgagt 2520 gtggtcatga gcggatggga agggcagtaa ctcgagtcat gtaattagtt atgtcacgct 2580 tacattcacg ccctcccccc acatccgctc taaccgaaaa ggaaggagtt agacaacctg 2640 aagtctaggt ccctatttat ttttttatag ttatgttagt attaagaacg ttatttatat 2700 ttcaaatttt tctttttttt ctgtacagac gcgtgtacgc atgtaacatt atactgaaaa 2760 ccttgcttga gaaggttttg ggacgctcga aggctttaat ttgc 2804 <210> 74 <211> 2531 <212> DNA <213> Artificial Sequence <220> <223> TEFINtp-crtI-CYC1t <400> 74 agagaccggg ttggcggcgc atttgtgtcc caaaaaacag ccccaattgc cccaattgac 60 cccaaattga cccagtagcg ggcccaaccc cggcgagagc ccccttctcc ccacatatca 120 aacctccccc ggttcccaca cttgccgtta agggcgtagg gtactgcagt ctggaatcta 180 cgcttgttca gactttgtac tagtttcttt gtctggccat ccgggtaacc catgccggac 240 gcaaaataga ctactgaaaa tttttttgct ttgtggttgg gactttagcc aagggtataa 300 aagaccaccg tccccgaatt acctttcctc ttcttttctc tctctccttg tcaactcaca 360 cccgaaatcg ttaagcattt ccttctgagt ataagaatca ttcaaaatgg tgagtttcag 420 aggcagcagc aattgccacg ggctttgagc acacggccgg gtgtggtccc attcccatcg 480 acacaagacg ccacgtcatc cgaccagcac tttttgcagt actaaccgca gggaaaagaa 540 caagatcagg ataaacccac agctatcatc gtgggatgtg gtatcggtgg aatcgccact 600 gccgctcgtc ttgctaaaga aggtttccag gtcacggtgt tcgagaagaa cgactactcc 660 ggaggtcgat gctctttaat cgagcgagat ggttatcgat tcgatcaggg gcccagtttg 720 ctgctcttgc cagatctctt caagcagaca ttcgaagatt tgggagagaa gatggaagat 780 tgggtcgatc tcatcaagtg tgaacccaac tatgtttgcc acttccacga tgaagagact 840 ttcactcttt caaccgacat ggcgttgctc aagcgggaag tcgagcgttt tgaaggcaaa 900 gatggatttg atcggttctt gtcgtttatc caagaagccc acagacatta cgagcttgct 960 gtcgttcacg tcctgcagaa gaacttccct ggcttcgcag cattcttacg gctacagttc 1020 attggccaaa tcctggctct tcaccccttc gagtctatct ggacaagagt ttgtcgatat 1080 ttcaagaccg acagattacg aagagtcttc tcgtttgcag tgatgtacat gggtcaaagc 1140 ccatacagtg cgcccggaac atattccttg ctccaataca ccgaattgac cgagggcatc 1200 tggtatccga gaggaggctt ttggcaggtt cctaatactc ttcttcagat cgtcaagcgc 1260 aacaatccct cagccaagtt caatttcaac gctccagttt cccaggttct tctctctcct 1320 gccaaggacc gagcgactgg tgttcgactt gaatccggcg aggaacatca cgccgatgtt 1380 gtgattgtca atgctgacct cgtttacgcc tccgagcact tgattcctga cgatgccaga 1440 aacaagattg gccaactggg tgaagtcaag agaagttggt gggctgactt agttggtgga 1500 aagaagctca agggaagttg cagtagtttg agcttctact ggagcatgga ccgaatcgtg 1560 gacggtctgg gcggacacaa tatcttcttg gccgaggact tcaagggatc attcgacaca 1620 atcttcgagg agttgggtct cccagccgat ccttcctttt acgtgaacgt tccctcgcga 1680 atcgatcctt ctgccgctcc cgaaggcaaa gatgctatcg tcattcttgt gccgtgtggc 1740 catatcgacg cttcgaaccc tcaagattac aacaagcttg ttgctcgggc aaggaagttt 1800 gtgatccaca cgctttccgc caagcttgga cttcccgact ttgaaaaaat gattgtggca 1860 gagaaggttc acgatgctcc ctcttgggag aaagaattca acctcaagga cggaagcatc 1920 ttgggactgg ctcacaactt tatgcaagtt cttggtttca ggccgagcac cagacatccc 1980 aagtatgaca agttgttctt tgtcggggct tcgactcatc ccggaactgg ggttcccatc 2040 gtcttggctg gagccaagtt aactgccaac caagttctcg aatcctttga ccgatcccca 2100 gctccagatc ccaatatgtc actctccgta ccatatggaa aacctctcaa atcaaatgga 2160 acgggtatcg attctcaggt ccagctgaag ttcatggatt tggagagatg ggtatacctt 2220 ttggtattgt tgattggggc cgtgatcgct cgatccgttg gtgttcttgc tttctgactc 2280 gagtcatgta attagttatg tcacgcttac attcacgccc tccccccaca tccgctctaa 2340 ccgaaaagga aggagttaga caacctgaag tctaggtccc tatttatttt tttatagtta 2400 tgttagtatt aagaacgtta tttatatttc aaatttttct tttttttctg tacagacgcg 2460 tgtacgcatg taacattata ctgaaaacct tgcttgagaa ggttttggga cgctcgaagg 2520 ctttaatttg c 2531 <210> 75 <211> 1533 <212> DNA <213> Artificial Sequence <220> <223> URA3 derived from Y. lipolytica <400> 75 tgcctcctgt ctgactcgtc attgccgcct ttggagtacg actccaacta tgagtgtgct 60 tggatcactt tgacgataca ttcttcgttg gaggctgtgg gtctgacagc tgcgttttcg 120 gcgcggttgg ccgacaacaa tatcagctgc aacgtcattg ctggctttca tcatgatcac 180 atttttgtcg gcaaaggcga cgcccagaga gccattgacg ttctttctaa tttggaccga 240 tagccgtata gtccagtcta tctataagtt caactaactc gtaactatta ccataacata 300 tacttcactg ccccagataa ggttccgata aaaagttctg cagactaaat ttatttcagt 360 ctcctcttca ccaccaaaat gccctcctac gaagctcgag ctaacgtcca caagtccgcc 420 tttgccgctc gagtgctcaa gctcgtggca gccaagaaaa ccaacctgtg tgcttctctg 480 gatgttacca ccaccaagga gctcattgag cttgccgata aggtcggacc ttatgtgtgc 540 atgatcaaga cccatatcga catcattgac gacttcacct acgccggcac tgtgctcccc 600 ctcaaggaac ttgctcttaa gcacggtttc ttcctgttcg aggacagaaa gttcgcagat 660 attggcaaca ctgtcaagca ccagtacaag aacggtgtct accgaatcgc cgagtggtcc 720 gatatcacca acgcccacgg tgtacccgga accggaatca ttgctggcct gcgagctggt 780 gccgaggaaa ctgtctctga acagaagaag gaggacgtct ctgactacga gaactcccag 840 tacaaggagt tcctggtccc ctctcccaac gagaagctgg ccagaggtct gctcatgctg 900 gccgagctgt cttgcaaggg ctctctggcc actggcgagt actccaagca gaccattgag 960 cttgcccgat ccgaccccga gtttgtggtt ggcttcattg cccagaaccg acctaagggc 1020 gactctgagg actggcttat tctgaccccc ggggtgggtc ttgacgacaa gggagacgct 1080 ctcggacagc agtaccgaac tgttgaggat gtcatgtcta ccggaacgga tatcataatt 1140 gtcggccgag gtctgtacgg ccagaaccga gatcctattg aggaggccaa gcgataccag 1200 aaggctggct gggaggctta ccagaagatt aactgttaga ggttagacta tggatatgtc 1260 atttaactgt gtatatagag agcgtgcaag tatggagcgc ttgttcagct tgtatgatgg 1320 tcagacgacc tgtctgatcg agtatgtatg atactgcaca acctgtgtat ccgcatgatc 1380 tgtccaatgg ggcatgttgt tgtgtttctc gatacggaga tgctgggtac aagtagctaa 1440 tacgattgaa ctacttatac ttatatgagg cttgaagaaa gctgacttgt gtatgactta 1500 ttctcaacta catccccagt cacaatacca cca 1533 <210> 76 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtYB-crtI insertion <400> 76 gtgcgcttct ctcgtctcgg taaccctgtc 30 <210> 77 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtYB-crtI insertion <400> 77 atgcgccgcc aacccggtct ctggggtgtg gtggatgggg tgtg 44 <210> 78 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtYB-crtI insertion <400> 78 cacaccccat ccaccacacc ccagagaccg ggttggcggc gcat 44 <210> 79 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtYB-crtI insertion <400> 79 cgccgccaac ccggtctctt gaagacgaaa gggcctccg 39 <210> 80 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtYB-crtI insertion <400> 80 cggaggccct ttcgtcttca agagaccggg ttggcggcg 39 <210> 81 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtYB-crtI insertion <400> 81 gacgagtcag acaggaggca tcagacagat actcgtcgcg 40 <210> 82 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtYB-crtI insertion <400> 82 cgcgacgagt atctgtctga tgcctcctgt ctgactcgtc 40 <210> 83 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtYB-crtI insertion <400> 83 atgacgagtc agacaggagg catggtggta ttgtgactgg ggat 44 <210> 84 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtYB-crtI insertion <400> 84 atccccagtc acaataccac catgcctcct gtctgactcg tcat 44 <210> 85 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtYB-crtI insertion <400> 85 cggcgtcctt ctcgtagtcc gcttttggtg gtgaagagga gact 44 <210> 86 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtYB-crtI insertion <400> 86 agtctcctct tcaccaccaa aagcggacta cgagaaggac gccg 44 <210> 87 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for crtYB-crtI insertion <400> 87 ccactcgtca ccaacagtgc cgtgtgttgc 30 <210> 88 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer to confirm insertion of cassette for crtYB-crtI insertion <400> 88 tcgtacgtct ataccaacag atgg 24 <210> 89 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer to confirm insertion of cassette for crtYB-crtI insertion <400> 89 cgcatacaca cacactgccg gggg 24 <210> 90 <211> 550 <212> DNA <213> Artificial Sequence <220> <223> HMGR native promoter region <400> 90 tccacacgtc gttctttttt ccttagcctt ttttgcagtg cgcgtgtccc aaaccccagc 60 tctacacacc agcacaaaca aagttaagct cagggttgtc gttgaggtcg cttactgtag 120 tcagtgctcg tatggttcgt tcaattttcg ccaaaaatcg ttttgccttt gtatcttggg 180 aataacatca actgtggttc ttcaacaggc ctaaggaacg aaacaagccg gaccaagatc 240 aggttcaagg tgagtactga gaaggaatag aaggcctaaa ggcgcaaacc gacaggtggc 300 aacagctcca caccgaccac gaaggccacg aaatcaaggg gtcctaaagt tagtctttgt 360 ggcctcgacg gtcagcgaaa acgcgagacc acaacgcgat cagaaccagg acctaaacaa 420 cacaggacgg ggtcacaata ggcttgaaca gcaagtacaa gctgtgatct ctctatattt 480 gattctcaaa ccacccctga ctacttcagc gcctctgtga cacagccccc ctatcatccg 540 actaacacag 550 <210> 91 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for HMGR enhancement <400> 91 gacaatgcct cgaggaggtt taaaagtaac t 31 <210> 92 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for HMGR enhancement <400> 92 gcgccgccaa cccggtctct ctgtgttagt cggatgatag g 41 <210> 93 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for HMGR enhancement <400> 93 cctatcatcc gactaacaca gagagaccgg gttggcggcg c 41 <210> 94 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for HMGR enhancement <400> 94 gacgagtcag acaggaggca ctgcggttag tactgcaaaa ag 42 <210> 95 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for HMGR enhancement <400> 95 ctttttgcag tactaaccgc agtgcctcct gtctgactcg tc 42 <210> 96 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for HMGR enhancement <400> 96 atgcgccgcc aacccggtct cttggtggta ttgtgactgg ggat 44 <210> 97 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for HMGR enhancement <400> 97 atccccagtc acaataccac caagagaccg ggttggcggc gcat 44 <210> 98 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for HMGR enhancement <400> 98 ctttccaata gctgcttgta gctgcggtta gtactgcaaa a 41 <210> 99 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for HMGR enhancement <400> 99 ttttgcagta ctaaccgcag ctacaagcag ctattggaaa g 41 <210> 100 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer to prepare cassette for HMGR enhancement <400> 100 gcttaatgtg attgatctca aacttgatag 30 <210> 101 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer to confirm insertion of cassette for HMGR enhancement <400> 101 gctgtctctg cgagagcacg tcga 24 <210> 102 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer to confirm insertion of cassette for HMGR enhancement <400> 102 ggttcgcaca acttctcggg tggc 24 <210> 103 <211> 338 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Hp.GGPP <400> 103 Met Ile Arg Ala Met His Asn Arg Ala Pro Thr Pro Arg Thr Arg Val 1 5 10 15 Ser His Pro Arg Ser His Arg Ala Leu Ala His Val Ser Ala Val Ala 20 25 30 Thr Ala Gly Gln Val Ala Glu Val His Ser Ala Pro Ala Phe Asp Phe 35 40 45 Glu Met Tyr Met Arg Asp Arg Ala Glu Met Val Asn Lys Ala Leu Asp 50 55 60 Ala Ala Leu Pro Ser Arg Tyr Pro Glu Val Leu Val Asp Ser Met Arg 65 70 75 80 Tyr Ser Val Leu Ala Gly Gly Lys Arg Val Arg Pro Ala Leu Thr Leu 85 90 95 Ala Ala Cys Asp Leu Val Gly Gly Asp Met Ala Thr Ala Leu Pro Thr 100 105 110 Ala Cys Ala Met Glu Met Ile His Thr Met Ser Leu Ile His Asp Asp 115 120 125 Leu Pro Ala Met Asp Asn Asp Asp Phe Arg Arg Gly Arg Pro Thr Asn 130 135 140 His Lys Val Tyr Gly Glu Asp Ile Ala Ile Leu Ala Gly Asp Ala Leu 145 150 155 160 Leu Ser Phe Ala Phe Glu His Ile Ala Arg Asp Thr Lys Gly Val Pro 165 170 175 Ala Asp Ala Val Leu Lys Val Ile Met Glu Leu Gly Arg Ala Val Gly 180 185 190 Ala Gln Gly Leu Ser Ala Gly Gln Ala Val Asp Ile Lys Ser Glu Gly 195 200 205 Gln Glu Val Gly Leu Glu Val Leu Glu Tyr Ile His His His Lys Thr 210 215 220 Ala Ala Leu Leu Glu Ala Ala Val Val Cys Gly Ala Leu Val Gly Gly 225 230 235 240 Ala Asp Thr Ala Thr Val Glu Lys Leu Arg Lys Tyr Ala Leu Asn Ile 245 250 255 Gly Leu Ala Phe Gln Val Ile Asp Asp Ile Leu Asp Val Thr Gln Thr 260 265 270 Thr Glu Thr Leu Gly Lys Thr Ala Ala Lys Asp Leu Ala Val Asn Lys 275 280 285 Thr Thr Tyr Pro Lys Leu Leu Gly Leu Glu Ala Ser Arg Lys Val Ala 290 295 300 Asp Asp Leu Ile Arg Glu Ala Ile Ala Gln Leu Asp Glu Phe Glu Pro 305 310 315 320 Ala Arg Lys Ala Pro Met Val Ala Leu Ala His Leu Ile Gly Tyr Arg 325 330 335 Lys Asn

Claims

헤마토코쿠스 플루비알리스(Haematococcus pluvialis) 유래의 제라닐제라닐 피로포스페이트 신타아제(Geranylgeranyl pyrophosphate synthase)를 발현하는, 카로티노이드 또는 이를 전구체로 하는 물질의 생산능을 갖는, 야로위아 속 미생물.
제1항에 있어서, 상기 제라닐제라닐 피로포스페이트 신타아제는 서열번호 103의 아미노산 서열로 이루어진 것인, 야로위아 속 미생물.
제1항에 있어서, 상기 제라닐제라닐 피로포스페이트 신타아제는 서열번호 1의 염기서열로 이루어진 폴리뉴클레오티드에 의해 코딩되는 것인, 야로위아 속 미생물.
제1항에 있어서, 상기 야로위아 속 미생물은 야로위아 리폴리티카인 것인, 야로위아 속 미생물.
제1항에 있어서, 상기 카로티노이드를 전구체로 하는 물질은 레티노이드인 것인, 야로위아 속 미생물.
제1항에 있어서, 상기 카로티노이드는 베타카로틴인 것인, 야로위아 속 미생물.
제5항에 있어서, 상기 레티노이드는 레티놀인 것인, 야로위아 속 미생물.
제1항에 있어서, 상기 야로위아 속 미생물은 부산물 생산능이 감소된 것인, 야로위아 속 미생물.
제8항에 있어서, 상기 부산물은 스쿠알렌인 것인, 야로위아 속 미생물.
제1항 내지 제9항 중 어느 한 항에 따른 야로위아 속 미생물을 배지에서 배양하는 단계; 및 상기 야로위아 속 미생물 또는 배지로부터 카로티노이드 또는 이를 전구체로 하는 물질을 회수하는 단계를 포함하는, 카로티노이드 또는 이를 전구체로 하는 물질 생산방법.
제10항에 있어서, 상기 야로위아 속 미생물이 생산한 베타카로틴을 베타카로틴 이외의 카로티노이드로 전환하는 단계; 또는
상기 야로위아 속 미생물이 생산한 레티놀을 레티놀 이외의 레티노이드로 전환하는 단계를 추가로 포함하는 것인, 카로티노이드 또는 이를 전구체로 하는 물질 생산방법.
제1항 내지 제9항 중 어느 한 항의 야로위아 속 미생물 또는 이의 배양물을 포함하는 카로티노이드 또는 이를 전구체로 하는 물질 생산용 조성물.