KR102379608B1 - 개선된 스테비올 배당체 화합물 또는 이의 전구체의 생산 - Google Patents

개선된 스테비올 배당체 화합물 또는 이의 전구체의 생산 Download PDF

Info

Publication number
KR102379608B1
KR102379608B1 KR1020190135842A KR20190135842A KR102379608B1 KR 102379608 B1 KR102379608 B1 KR 102379608B1 KR 1020190135842 A KR1020190135842 A KR 1020190135842A KR 20190135842 A KR20190135842 A KR 20190135842A KR 102379608 B1 KR102379608 B1 KR 102379608B1
Authority
KR
South Korea
Prior art keywords
gene
leu
steviol
kaurene
glu
Prior art date
Application number
KR1020190135842A
Other languages
English (en)
Other versions
KR20210051058A (ko
Inventor
고혁진
김정민
최은수
Original Assignee
주식회사 삼양사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 삼양사 filed Critical 주식회사 삼양사
Priority to KR1020190135842A priority Critical patent/KR102379608B1/ko
Publication of KR20210051058A publication Critical patent/KR20210051058A/ko
Application granted granted Critical
Publication of KR102379608B1 publication Critical patent/KR102379608B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/56Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/007Preparation of hydrocarbons or halogenated hydrocarbons containing one or more isoprene units, i.e. terpenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y106/00Oxidoreductases acting on NADH or NADPH (1.6)
    • C12Y106/02Oxidoreductases acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
    • C12Y106/02004NADPH-hemoprotein reductase (1.6.2.4), i.e. NADP-cytochrome P450-reductase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/14Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced flavin or flavoprotein as one donor, and incorporation of one atom of oxygen (1.14.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y205/00Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
    • C12Y205/01Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
    • C12Y205/01029Geranylgeranyl diphosphate synthase (2.5.1.29)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/03Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)
    • C12Y402/03019Ent-kaurene synthase (4.2.3.19)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y505/00Intramolecular lyases (5.5)
    • C12Y505/01Intramolecular lyases (5.5.1)
    • C12Y505/01013Ent-copalyl diphosphate synthase (5.5.1.13)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

본 발명은 스테비올, 스테비올 배당체 또는 이들의 전구체 생합성에 관한 것으로서, 더욱 자세하게는 스테비올 전구체를 생산하는 효소, 스테비올 생산 효소, 스테비올 배당체 생산 효소 또는 상기 효소를 발현하는 재조합 미생물과, 상기 효소 또는 미생물을 이용한 스테비올, 스테비올 배당체 또는 이들의 전구체의 생산용 조성물, 및 스테비올, 스테비올 배당체 또는 이들의 전구체를 생산하는 방법에 관한 것이다.

Description

개선된 스테비올 배당체 화합물 또는 이의 전구체의 생산{Improved production of steviol glycoside and its precursors}
본 발명은 스테비올, 스테비올 전구체 또는 스테비올 배당체의 전구체 생합성에 관한 것으로서, 더욱 자세하게는 스테비올 전구체를 생산하는 효소, 스테비올 생산 효소 또는 스테비올 배당체 생산 효소, 상기 효소를 발현하는 재조합 미생물에 관한 것이다. 또한, 본 발명은 상기 효소 또는 미생물을 이용한 스테비올, 스테비올 배당체 또는 이들의 전구체의 생산용 조성물, 및 스테비올, 스테비올 배당체 또는 이들의 전구체를 생산하는 방법에 관한 것이다.
감미료는 식품, 음료, 또는 과자 산업에서 가장 흔히 이용되는 성분들로 알려져 있다. 감미료는 생산 동안 최종 식품 산물에 통합될 수 있거나 또는 단독 용도로 적절하게 희석시켰을 때, 식탁 감미료 또는 베이킹에서 설탕을 대체하는 가정용 대체물로 이용할 수 있다. 감미료는 예를 들어 수크로오스, 고과당 옥수수 시럽, 당밀, 메이플 시럽, 및 꿀과 같은 천연 감미료들, 그리고 예를 들어 아스파르탐, 사카린 및 수크랄로오스(sucralose)와 같은 인공 감미료를 포함한다.
스테비아(Stevia) 추출물은 다년생 관목, 스테비아 레바우디아나(Stevia rebaudiana)로부터 추출할 수 있는 천연 감미료이다. 다양한 수준으로 정제된 스테비아 추출물은 식품 및 블렌드에서 고감도 조미료로, 또는 단독으로 식탁 감미료로 시판된다.
스테비아 식물의 추출물들은 레바우디오시드 및 단맛에 기여하는 기타 스테비올을 함유하지만, 각 글리코시드의 양은 상이한 생산 일괄량 (batches)에 따라 흔히 변화한다. 기존의 시판 제품들은 주로 레바우디오시드 A이며, 적은 양의 레바우디오시드 C, D, 및 F와 같은 기타 글리코시들이 있다. 스테비아 추출물은 또한 이취(off-flavors)의 원인이 되는 식물에서 유도된 화합물과 같은 오염물질을 함유할 수 있다. 이러한 이취는 선택된 식품 시스템 또는 용도에 따라 대체로 문제가 될 수 있다.
스테비아 추출물의 조성물은 식물이 성장하는 토양 및 기후에 따라 매우 다양할 수 있다. 원료 식물, 기후 조건, 및 추출 공정에 따라, 상업적 제조 과정에서 레바우디오시드 A의 양은 총 스테비올 글리코시드 함량의 20 내지 97%로 다양하다고 보고된다. 또 다른 스테비올 글리코시드들이 스테비아 추출물 내에 다양한 양으로 존재한다.
스테비아 식물로부터의 스테비올 글리코시드의 회수 및 정제가 노동 집약적이고 비효율적인 것으로 밝혀지면서, RebD 및 RebM과 같은 고수율의 요망되는 스테비올 글리코시드를 축적할 수 있는 재조합 생산 시스템이 여전히 요구되고 있다. 또한, 상업적 용도를 위한 재조합 숙주에서 스테비올 글리코시드의 개선된 생산에 대한 요구가 여전히 있다.
본 발명의 일 예는 스테비올 전구체를 생산하는 효소, 스테비올 생산 효소, 및 스테비올 배당체 생산 효소 또는 상기 효소를 발현하는 재조합 미생물과, 상기 효소 또는 미생물을 이용한 스테비올, 스테비올 배당체 또는 이들의 전구체의 생산용 조성물을 제공하는 것이다.
본 발명의 또 다른 일 예는 스테비올 전구체를 생산하는 효소, 스테비올 생산 효소, 및 스테비올 배당체 생산 효소 또는 상기 효소를 발현하는 재조합 미생물과, 상기 효소 또는 미생물을 이용한 스테비올, 스테비올 배당체 또는 이들의 전구체를 생산하는 방법에 관한 것이다.
이하, 본 발명을 더욱 자세히 설명하고자 한다.
본 발명의 일 예에 따라 효모를 이용하여 스테비올 전구체, 예컨대 카우렌을 생산하는 경우 하기 생합성 유전자 구조체를 포함할 수 있다:
(A) copalyl pyrophosphate (CPP) synthase를 이용하여 GGPP로부터 CPP의 생합성 및 kaurene synthase (KS)를 이용하여 CPP에서부터 카우렌(kaurene)의 생합성 구조체.
본 발명의 일 예에 따라 효모를 이용하여 스테비올을 생산하는 경우 하기 생합성 모듈을 포함할 수 있다:
(A) 카우렌의 생합성 구조체, 및
(B) Kaurene oxidase (KO)와 KO에 전자를 전달하여 전자전달계를 완성하는 시토크롬 P450 환원효소(cytochrome P450 reductase, CPR) 이용하여 카우렌으로부터 카우렌산(kaurenoic acid)의 생합성 및 Kaurenoic acid hydroxylase(KAH)와 CPR를 이용하여 카우렌산으로부터 스테비올의 생합성 구조체.
본 발명의 일 예에 따라 효모를 이용하여 스테비올 배당체를 생산하는 경우 하기 생합성 모듈을 포함할 수 있다:
(A) 카우렌의 생합성 구조체,
(B) 스테비올의 생합성 구조체, 및
(C) 스테비올에 글루코오스를 전달하는 효소를 이용하여 스테비올로부터 스테비올 배당체의 생합성 구조체.
상기 효모를 이용한 스테비올 전구체, 스테비올 또는 스테비올 배당체를 생합성 하는 유전자 구조체는 각각 (D) GGPP(geranyl geranyl pyrophosphate) synthase를 이용한 GGPP의 생합성 구조체를 추가로 포함할 수 있다. 상기 (D) GGPP의 생합성 구조체를 포함하는 경우, 스테비올 전구체, 스테비올 또는 스테비올 배당체를 생합성 하는 유전자 구조체와 개별 전사 프로모터에 의해서 조절될 수 있다.
상기 스테비올 전구체, 스테비올 또는 스테비올 배당체를 생합성 하는 유전자 구조체는 목적 단백질을 암호화하는 DNA 및 RNA를 포함한다. 상기 핵산분자는 숙주세포 내로 도입되어 발현될 수 있는 것이면, 어떠한 형태로 도입되는 것이든 상관없다. 예를 들면, 상기 핵산은 자체적으로 발현되는데 필요한 모든 요소를 포함하는 유전자 구조체인 발현 카세트 (expression cassette)의 형태로 숙주세포에 도입될 수 있다.
상기 발현 카세트는 통상 상기 핵산분자에 작동 가능하게 연결되어 있는 프로모터 (promoter), 전사 종결신호, 리보좀 결합부위 및 번역 종결신호를 포함할 수 있다. 상기 발현 카세트는 자체 복제가 가능한 발현 벡터 형태일 수 있다. 또한, 상기 핵산은 그 자체의 형태로 숙주세포에 도입되어 숙주세포에서 발현에 필요한 서열과 작동 가능하게 연결되어 있는 것일 수도 있으며, 이에 한정되지 않는다. 또한, 상기에서 용어 "작동 가능하게 연결"된 것이란 본 출원의 목적 단백질을 암호화하는 핵산의 전사를 개시 및 매개하도록 하는 프로모터 서열과 상기 유전자 서열이 기능적으로 연결되어 있는 것을 의미한다.
이하, 효모를 이용한 스테비올 전구체, 스테비올 또는 스테비올 배당체를 생합성 하는 유전자 구조체에 관해 이하에서 자세히 기술하고자 한다.
본 발명의 일 예는 (A)카우렌(kaurene)의 생합성 유전자 구조체로서, copalyl pyrophosphate (CPP) synthase (CDPS, CPS)를 이용하여 geranylgeranyl pyrophosphate (GGPP)로부터 CPP의 생합성 및 kaurene synthase (KS)를 이용하여 CPP에서부터 카우렌(kaurene)을 생성하는 CDPS/KS 이중 기능 효소 단백질(bifunctional enzyme protein)과, 상기 이중 기능 효소 단백질의 암호화 유전자의 5'-말단에 직접 또는 링커를 통해 연결되며, 상기 효소 단백질의 발현을 조절하는 조절 유전자를 포함한다. 상기 링커는 글리신(Glycine)이 1 내지 10개로 이루어지는 펩타이드 일 수 있으며, 예를 들면 3개 글리신, 4개 글리신, 5개 글리신, 6개 글리신, 또는 7개 글리신으로 구성된 펩타이드일 수 있으며, 상기 유전자에 삽입되는 경우 상기 펩타이드를 암호화하는 염기서열일 수 있으며, 예를 들면 (GGT)가 1회 내지 10회 연결된 폴리뉴클레오티드일 수 있으며, 예를 들면 (GGT)가 3회 연결, 4회 연결, 5회 연결, 또는 6회 연결된 폴리뉴클레오티드 서열일 수 있다. 상기 이중 기능 효소 단백질을 암호화하는 유전자와 조절 유전자는 융합 단백질로 발현되는 것이 바람직하며, 이 경우 번역단계에서 이중 기능 효소 단백질의 발현을 증가시킨다.
상기 효소의 기능적 발현을 향상시키기 위한 조절 유전자는, 대장균 유래의 말토오스 결합단백질(MBP), S. cerevisiae 유래의 CUP1, 또는 대장균 유래의 단백질 신장요소 (tsf)를 암호화하는 유전자일 수 있다. 상기 MBP 유전자의 일예는 서열번호 18의 아미노산 서열을 암호화하는 폴리뉴클레오티드 서열 또는 이와 서열 동일성이 90%이상, 95%이상, 97% 이상 또는 99%이상인 폴리뉴클레오티드 서열을 포함한다. 상기 CUP1 유전자의 일예는 서열번호 19의 아미노산 서열을 암호화하는 폴리뉴클레오티드 서열 또는 이와 서열 동일성이 90%이상, 95%이상, 97% 이상 또는 99%이상인 폴리뉴클레오티드 서열을 포함한다. 상기 tsf 유전자의 일예는 서열번호 20의 아미노산 서열을 암호화하는 폴리뉴클레오티드 서열 또는 이와 서열 동일성이 90%이상, 95%이상, 97% 이상 또는 99%이상인 폴리뉴클레오티드 서열을 포함한다.
상기 카우렌 생합성 유전자 구조체는 (D)GGPP 생합성 모듈을 추가로 포함할 수 있으며, 자세하게는 GGPP synthase를 이용하여 farnesyl pyrophosphate(FPP)로부터 GGPP를 합성하는 유전자 구조체를 추가로 포함할 수 있다. 상기 GGPP synthase의 일 예는 BTS1 (서열번호 15), XdCrtE(서열번호 16), 및 ERG20F96C (서열번호 17)로 이루어지는 군에서 선택된 단일 효소 또는 2개 효소단백질이 융합된 융합 단백질일 수 있으며, 2종 이상 효소의 융합 단백질로 생산하는 경우, 기능적 발현(soluble expression)을 증가하여 활성이 증가하는 장점이 있어 바람직하다.
예를 들면, GGPP synthase을 암호화하는 유전자의 예는, BTS1로서, UniProtKB accession number Q12051을 갖는 Saccharomyces cerevisiae의 BTS1이고 (서열번호 15의 아미노산 서열), Geranylgeranyl pyrophosphate synthase를 암호화는 유전자의 예는 XdCrtE로서 UniProtKB accession number Q1L6K3을 갖는 Xanthophyllomyces dendrorhous crtE이고 (서열번호 16의 아미노산 서열), GGPP synthase를 암호화하는 유전자의 예는 ERG20F96C(DNA sequence of the GGPP synthase ERG20F96C from Saccharomyces cerevisiae)로서, 서열번호 17의 아미노산 서열에 의해 암호화되며, 구체적으로 참고문헌 Metabolic engineering 27 (2015) 65-75, Efficient diterpene production in yeast by engineering Erg20p into a geranylgeranyl diphosphate synthase에 기재된 것이다.
본 발명에 따른 CDPS/KS 이중 기능 효소 단백질은 ent-코팔릴 디포스페이트 신타제 (CDPS)와 ent-카우렌 신타제 (KS)의 두 가지 기능을 모두 가지는 이중 기능 효소(bifunctional enzyme) 단백질이다. 본 발명에 따른 이중 기능 효소는 channelling을 형성하여 두 가지 반응을 연속적으로 빠르게 일어나게 하는 장점이 있어, 효소를 이용하여 생산한 산물의 수율 및 생산속도 등을 향상시키는 장점이 있다. 따라서, 본 발명에 따른 가지는 이중 기능 효소는 기질로부터 카우렌 생성까지 진행할 수 있다. 본 발명에 따른 CDPS/KS 이중 기능 효소 단백질을 이용하는 경우, 종래에 사용하는 CDPS 및 KS의 두 가지 효소를 사용하는 것에 비해 Kaurene 생성 및 스테비올 생성이 증가한다.
본 발명에 따른 CDPS/KS 이중 기능 효소 단백질은 Jungermannia subulata 에서 유래되며, 서열번호 1의 아미노산 서열과 적어도 40% 이상의 서열 동일성을 갖는 CDPS/KS 이중 기능 효소 단백질일 수 있다. 상기 효소 단백질의 아미노산 서열의 동일성은 적어도 40%이상, 50%이상, 60%이상, 70%이상, 80%이상, 90%이상, 95%이상 또는 99%이상일 수 있다. 상기 CDPS/KS 이중 기능 효소 단백질은 서열번호 2의 핵산 서열과 적어도 70%의 서열 동일성을 갖는 염기서열에 의해 암호화될 수 있으며, 상기 염기서열의 동일성은 적어도 70%이상, 80%이상, 90%이상, 95%이상 97% 또는 99%이상일 수 있다.
상기에서 용어 "상동성", "일치성" 또는 "동일성"은 주어진 아미노산 서열 또는 염기 서열과 일치하는 정도를 의미하며 백분율로 표시될 수 있다. 본 명세서에서, 주어진 아미노산 서열 또는 염기 서열과 동일하거나 유사한 활성을 가지는 그의 상동성 서열 또는 동일성 서열이 갖는 "% "으로 표시된다.
본 발명에 따른 일 예는 서열번호 1의 아미노산 서열과 적어도 40%의 서열 동일성을 갖는 CDPS/KS 이중 기능 효소 단백질을 암호화하는 핵산분자에 관한 것이며, 예를 들면 서열번호 2의 핵산 서열과 적어도 70%의 서열 동일성을 갖는 것이며, 상기 유전자의 핵산 서열의 동일성은 적어도 70%이상, 80%이상, 90%이상, 95%이상 또는 99%이상일 수 있다.
상기 핵산분자에 작동 가능하게 연결되어 있는 프로모터 (promoter), 전사 종결신호, 리보좀 결합부위 및 번역 종결신호를 포함할 수 있다. 상기 발현 카세트는 자체 복제가 가능한 발현 벡터 형태일 수 있다. 구체적으로, 상기 전사 프로모터는 효모에서 유래된 GAL 프로모터일 수 있으며, 예를 들면 Saccharomyces cerevisiae 유래 GAL 프로모터 (예, ScGAL1), Saccharomyces mikatae 유래 GAL 프로모터 (예, SmGAL2), Saccharomyces eubayanus 유래 GAL 프로모터(예, SeGAL2), S. kudriavzevii 유래 GAL 프로모터(예, SkGAL1)를 사용할 수 있다.
본 발명의 일 예는 스테비올의 생합성 유전자 구조체로서,
(A)CDPS/KS 이중 기능 효소 단백질(bifunctional enzyme protein)과 상기 이중 기능 효소 단백질의 암호화 유전자의 5'-말단에 직접 또는 링커를 통해 연결되며, 상기 효소 단백질의 발현을 조절하는 조절 유전자를 포함하는 카우렌의 생합성 유전자 구조체, 및
(B) Kaurene oxidase (KO)와 KO에 전자를 전달하여 전자전달계를 완성하는 시토크롬 P450 환원효소(cytochrome P450 reductase, CPR) 이용하여 카우렌으로부터 카우렌산(kaurenoic acid)의 생합성 및 Kaurenoic acid hydroxylase(KAH)와 CPR를 이용하여 카우렌산으로부터 스테비올의 생합성 구조체를 포함한다.
상기 (A) 카우렌의 생합성 유전자 구조체에 대해서는 전술한 바와 같다.
상기 (B)스테비올의 생합성 유전자 구조체에 포함된 효를 암호화하 유전자는, KO, KAH, 및 CPR의 기능성 동족체(homolog)를 포함한다. 예를 들어, KO, KAH, 및 CPR의 기질 특이성을 변경시키는 방법은 당업자에게 공지되어 있으며, 부위-지정된/논리적 돌연변이유발 접근법, 무작위 유도되는 진화 접근법 및 무작위 돌연변이유발/포화 기법이 효소의 활성 부위 부근에서 수행되는 조합법을 포함하나, 이로 한정되는 것은 아니다.
구체적으로, S. rebaudiana 유래의 KO (SrKO) 및 KAH (SrKAH)와 Arabidopsis thaliana 유래와 S.cereviiae의 CPR (AtCPR, yCPR)을 사용할 수 있다. 구체적 사용 가능한 유전자로서, SrKO(stevia rebaudiana KO1, genbank accession number, Q6UQ67), SrKAH (stevia rebaudiana KA13H genebank accession number, Q0NZP1), AtCPR(arabidopsis thaliana CPR2, genbank accession number, Q9SUM3), 및 yCPR (Saccharomyces cerevisiae CPR1, genbank accession number, P16603)으로 이루어지는 군에서 선택된 1종이상일 수 있다.
상기 조절 영역의 선택은 비제한적으로 특정 배양 단계 동안의 효율, 선택성, 유도성, 요망되는 발현 수준, 및 우선적인 발현을 포함하는 여러 인자에 의해 좌우된다. 코딩 서열에 대한 조절 영역을 적절하게 선택하고 정위함에 의해 코딩 서열의 발현을 조절하는 것은 당업자에게는 관례적인 것이다. 하나를 초과하는 조절 영역, 예컨대 인트론, 인핸서, 업스트림 활성화 영역, 전사 종결인자, 및 유도성 요소가 존재할 수 있음이 이해될 것이다.
본 발명의 일 예는 스테비올 배당체, 예를 들면 스테비올-13 글루코시드의 생합성 유전자 구조체로서,
(A)CDPS/KS 이중 기능 효소 단백질(bifunctional enzyme protein)과 상기 이중 기능 효소 단백질의 암호화 유전자의 5'-말단에 직접 또는 링커를 통해 연결되며, 상기 효소 단백질의 발현을 조절하는 조절 유전자를 포함하는 카우렌의 생합성 유전자 구조체,
(B) Kaurene oxidase (KO)와 KO에 전자를 전달하여 전자전달계를 완성하는 시토크롬 P450 환원효소(cytochrome P450 reductase, CPR) 이용하여 카우렌으로부터 카우렌산(kaurenoic acid)의 생합성 및 Kaurenoic acid hydroxylase(KAH)와 CPR를 이용하여 카우렌산으로부터 스테비올의 생합성 구조체; 및
(C) 스테비올에 글루코오스를 전달하는 효소를 이용하여 스테비올로부터 스테비올 배당체의 생합성 구조체를 포함한다.
상기 효모를 이용한 스테비올 배당체를 생합성 하는 유전자 구조체는 각각 (D) GGPP(geranyl geranyl pyrophosphate) synthase를 이용한 GGPP의 생합성 구조체를 추가로 포함할 수 있다. 상기 (D) GGPP의 생합성 구조체를 포함하는 경우, 스테비올 전구체, 스테비올 또는 스테비올 배당체를 생합성 하는 유전자 구조체와 개별 전사 프로모터에 의해서 조절될 수 있다.
상기 스테비올에 글루코오스를 전달하는 특별히 제한되지 않고 사용될 수 있으며, 예를 들면 스테비올의 13번 탄소에 글루코오스를 전달하는 UDP-glycosyltransferase 85C2 (UGT85C2)와 스테비올의 19번 탄소에 글루코오스를 전달하는 UDP-glycosyltransferase 74G1 (UGT74G1)를 포함한다. 구체적으로, UGT85C2 효소는 서열번호 21의 아미노산 서열을 포함하며, 상기 효소를 암호화하는 뉴클레오티드 서열은 서열번호 21의 아미노산 서열에 의해 암호화하는 서열 또는 서열번호 22의 뉴클레오티드 서열일 수 있다. UGT74G1 효소는 서열번호 23의 아미노산 서열을 포함하며, 상기 효소를 암호화하는 뉴클레오티드 서열은 서열번호 21의 아미노산 서열에 의해 암호화하는 서열일 수 있다.
본 발명의 추가 일 예는, 상기 효모를 이용한 스테비올 전구체, 스테비올 또는 스테비올 배당체를 생합성 하는 유전자 구조체는 벡터에 도입되거나 숙주세포에 형질전환되어 이들 숙주세포를 이용하여 스테비올 전구체, 스테비올 또는 스테비올 배당체를 합성할 수 있다.
본 발명의 추가 일 예는, 상기 효모를 이용한 스테비올 전구체, 스테비올 또는 스테비올 배당체를 생합성 하는 유전자 구조체를 포함하는 재조합 벡터에 관한 것이다.
상기 재조합 벡터에서, 상기 폴리뉴클레오티드는 작동 가능한 조절 서열에 연결되어 포함될 수 있으며, 상기 조절서열은 전사 프로모터 등을 포함한다. 본 발명에 따른 카우렌 생합성 구조체를 포함하는 재조합 벡터의 일 예는 도 1에 예시적으로 도시되어 있다.
또한, 상기 효모를 이용한 스테비올 전구체, 스테비올 또는 스테비올 배당체를 생합성 하는 유전자 구조체를 포함하는 형질전환 세포에 관한 것이다. 상기 스테비올 전구체, 스테비올 또는 스테비올 배당체를 생합성 하는 유전자 구조체는 각각 별개 벡터 또는 하나의 벡터에 도입하여 숙주 세포로 형질전환될 수 있다.
본 출원에서 용어 "형질전환"은 표적 단백질을 암호화하는 핵산 포함하는 벡터를 숙주세포 내에 도입하여 숙주세포 내에서 상기 핵산이 암호화하는 단백질이 발현할 수 있도록 하는 것을 의미한다. 형질전환된 핵산은 숙주세포 내에서 발현될 수 있기만 한다면, 숙주세포의 염색체 내에 삽입되어 위치하거나 염색체 외에 위치하거나 상관없이 이들 모두를 포함할 수 있다.
본 출원의 벡터를 형질전환 시키는 방법은 핵산을 세포 내로 도입하는 어떤 방법도 포함되며, 숙주세포에 따라 당 분야에서 공지된 바와 같이 적합한 표준 기술을 선택하여 수행할 수 있다. 예를 들어, 전기천공법(electroporation), 인산칼슘(CaPO4) 침전, 염화칼슘(CaCl2) 침전, 미세주입법(microinjection), 폴리에틸렌 글리콜(PEG)법, DEAE-덱스트란법, 양이온 리포좀법, 및 초산 리튬-DMSO법 등이 있으나, 이에 제한되지 않는다.
상기 숙주 세포로는 DNA의 도입효율이 높고, 도입된 DNA의 발현 효율이 높은 숙주를 사용하는 것이 좋다. 본원에 기재된 재조합 숙주는 식물 세포, 포유동물 세포, 곤충 세포, 진균류 세포 또는 박테리아 세포를 포함한다. 상기 박테리아 세포는 에스체리치아 박테리아 세포, 예를 들어, 에스체리치아 콜라이 세포; 락토바실러스 박테리아 세포, 락토코커스 박테리아 세포, 코르네박테리움 박테리아 세포, 아세토박터 박테리아 세포, 아시네토박터 박테리아 세포, 또는 슈도모나스 박테리아 세포를 포함한다.
상기 진균류 세포는 효모 세포를 포함한다. 한 양태에서, 효모 세포는 사카로마아세스 세레비시애(Saccharomyces cerevisiae), 쉬조사카로마이세스 폼베(Schizosaccharomyces pombe), 야로위아 리폴리티카(Yarrowia lipolytica), 칸디다 글라브라타(Candida glabrata), 아쉬비아 고시피이(Ashbya gossypii), 사이베를린드네라 자디니이(Cyberlindnera jadinii), 피치아 파스토리스(Pichia pastoris), 클루이베로마이세스 락티스(Kluyveromyces lactis), 한세눌라 폴리모르파(Hansenula polymorpha), 칸디다 보이디니이(Candida boidinii), 아르술라 아데니니보란스(Arxula adeninivorans), 잔토필로마이세스 덴드로르호우스(Xanthophyllomyces dendrorhous), 또는 칸디다 알비칸스(Candida albicans) 종으로부터의 세포이다.상 기 효모 세포는 사카로마이세테(Saccharomycete)이다. 한 양태에서, 효모 세포는 사카로마이세스 세레비시애 종으로부터의 세포이다.
본 발명의 일 예에서, 본 발명에 기재된 방법 또는 재조합 숙주에 의해 생성된 스테비올 전구체, 스테비올, 또는 스테비올 배당체는 상기 조건 하에서 배양될 때 검출 가능한 농도로 축적된다. 본 발명에 기재된 방법 또는 재조합 숙주에 의해 생성된 스테비올, 스테비올 배당체 또는 이들의 전구체는 스테비아 추출물보다 적은 오염물질을 포함한다. 상기 오염물질은 이취(off-flavors)의 원인이 되는 식물-유래 화합물을 포함한다.
본 발명에 따른 재조합 숙주 세포의 배양은, 예를 들면 상기 재조합 숙주 세포가 효모인 경우, 재조합 효모를 YPD 배지에서 전배양을 한 다음, OD600에서 흡광도가 특정 값이 되게, 예를 들면 0.1 내지 0.2가 되게 YNB 액체배지에 접종하여 30 ℃ 온도에서 240 rpm으로 5일 배양하여, 스테비올 또는 스테비올 전구체를 생산할 수 있다.
본 발명에 기재된 재조합 미생물에 의해 생성된 조성물은 식품에 혼입될 수 있다 실질적으로 순수한 스테비올 또는 스테비올은 다른 감미료, 예를 들어, 사카린, 덱스트로스, 수크로스, 푸룩토스, 에리트리톨, 아스파르탐, 수크랄로스, 모나틴, 또는 아세술팜 포타슘과 함께 식품에 혼입될 수 있다. 기타 감미료에 대한 스테비올 또는 스테비올의 중량비는 최종 식품에서 만족할 만한 맛에 도달하기 위해 필요에 따라 변화될 수 있다.
본 발명에 따른 스테비올 및 이의 배당체를 제조하는 합성 경로를 간략히 반응식 1에 표시한다. 구체적으로, 상기 스테비올 합성 경로에 관여하는 효소를 살펴보면, Mevalonate에서 FPP(farnesyl pyrophosphate)를 거쳐 GGPP (geranylgeranyl pyrophosphate)를 얻고, CDPS) copalyl diphosphate synthase를 이용하여 GGPP에서 CPP (copalyl pyrophosphate)를 얻고, (KS) kaurene synthase를 이용하여 CPP에서 카우렌을 얻고, (KO) kaurene oxidase를 이용하여 카우렌에서 카우레노익산을 얻고, (KAH) kaurenoic acid hydroylase을 이용하여 카우레노익산에서 스테비올을 얻는다. 상기 스테비올에서 스테비올에 글루코오스를 전달하는 효소를 처리하여 스테비올 배당체를 제조한다.
[반응식 1]
Figure 112019110798606-pat00001
본 명세서에서, 스테비올 글리코시드 또는 스테비올 배당체는 스테비올-13-O-글루코시드 (13-SMG), 스테비올-1,2-바이오사이드, 스테비올-1,3-바이오사이드, 스테비올-19-O-글루코시드 (19-SMG), 스테비오사이드, 1,3-스테비오사이드, 루부소사이드, 레바우디오사이드 A (RebA), 레바우디오사이드 B (RebB), 레바우디오사이드 C (RebC), 레바우디오사이드 D (RebD), 레바우디오사이드 E (RebE), 레바우디오사이드 F (RebF), 레바우디오사이드 M (RebM), 레바우디오사이드 Q (RebQ), 레바우디오사이드 I (RebI), 둘코사이드 A, 디-글리코실화된 스테비올, 트리-글리코실화된 스테비올, 테트라-글리코실화된 스테비올, 펜타-글리코실화된 스테비올, 헥사-글리코실화된 스테비올, 헵타-글리코실화된 스테비올, 또는 이들의 이성질체를 포함한다.
본 명세서에서 사용된 바와 같이, 용어 "스테비올 전구체","스테비올 글리코시드 전구체" 및 "스테비올 전구체 화합물"은 스테비올 생합성 경로의 중간체 화합물을 지칭하기 위해 사용된다. 스테비올 전구체는 비제한적으로, 게라닐게라닐 디포스페이트 (GGPP), ent-코팔릴-디포스페이트, 코팔릴-파이로포스페이트, ent-카우렌, ent-카우레놀, ent-카우레날, ent-카우레노산, 및 스테비올을 포함한다. 바람직하게는, 상기 스테비올 전구체는 FPP(farnesyl pyrophosphate), GGPP(geranylgeranyl pyrophosphate), CPP(copalyl pyrophosphate), 카우렌 및 카우레노익산(kaurnoic acid)으로 이루어지는 군에서 선택된 1종 이상일 수 있으나 이에 한정되지 않는다.
본 발명에 따른 스테비올, 스테비올 전구체 또는 스테비올 배당체 생산용 조성물 또는 생산방법은, 스테비아 식물로부터의 제조하는 기술에 비해, 고수율의 스테비올을 축적할 수 있는 재조합 생산 시스템이다.
도 1은 본 발명의 일 예에 따른 카우렌을 생합성하는 재조합 균주 제조를 위한 벡터의 개열 지도(cleavage map)이다.
본 발명을 하기 실시예를 들어 더욱 자세히 설명할 것이나, 본 발명의 범위가 하기 예시적인 실시예 범위로 한정되는 의도는 아니다.
실시예 1: CDPS/KS 이중기능 효소 생산
1-1: GGPP에서부터 카우렌을 생산하는 이중 기능 효소의 탐색
스테비올을 생합성 과정의 중간체인 카우렌은, GGPP에서 CPP을 거쳐서 생성된다. CPP에서 카우렌을 생산하는 과정에 작용하는 효소가 copalyl pyrophosphate synthase (CDPS) 및 Ent-kaurene synthase (KS)로서 이것을 동시에 할 수 있는 두 기능(bifunctional) 효소를 탐색하였다. 두 가지 기능 효소의 탐색은 NCBI(www.ncbi.nlm.nih.gov)의 공개된 정보를 바탕으로 기존에 기능이 확인되지 않은 효소들을 우선 선별하였다.
최종적으로 Jungermannia subulata 유래의 두 기능 효소인 CDPS/KS 효소(JsCDPS/KS)가 선별되었고, 해당 유전자에서의 신호서열을 제거하기 위해 plant network (www.cbs.dtu.dk/services/TargetP) 프로그램을 사용하여 N 말단의 신호서열(signal peptide)를 확인하고 제거하였다. 상기 신호서열 (N-말단의 105개 아미노산)이 제거된 효소의 아미노산 서열을 서열번호 1에 나타냈다.
Saccharomyces cerevisiae 코돈 최적화하여 서열번호 1의 아미노산을 암호화하는 폴리뉴클레오타이드(서열번호 2)를 Genescript(USA)에서 합성하였다. 합성된 유전자 서열은 CAI Calculator 2 서버를 이용하여 코돈 최적화된 유전자 서열을 재확인하였다.
1-2. 카우렌을 생합성하는 재조합 균주의 제조
실시예 1-1에서 선별된 JsCDPS/KS의 효소 활성 확인을 위해 S. cereviaise 에서의 카우렌 생합성을 확인하였다.
구체적으로, 도 1에서의 스테비올 생합성 대사경로 내 카우렌 생합성을 위해, CDPS/KS 이외의 유전자들이 GAL 프로모터 조절 하에 발현되도록 설계되었다. 설계된 유전자는 GGPP 합성 단계 관련 BTS1, XdCrtE, ERG20F96C 3종의 효소들을 조합하여 GGPP 생합성 모듈로서 GAL1 프로모터 조절 하에 발현되도록 설계하였다. 구체적으로, Geranylgeranyl pyrophosphate synthase을 암호화하는 BTS1은 UniProtKB accession number Q12051을 갖는 Saccharomyces cerevisiae의 BTS1이고, Geranylgeranyl pyrophosphate synthase를 암호화는 XdCrtE는 UniProtKB accession number Q1L6K3을 갖는 Xanthophyllomyces dendrorhous crtE이고, GGPP synthase를 암호화하는 ERG20F96C(DNA sequence of the GGPP synthase ERG20F96C from Saccharomyces cerevisiae)는 참고문헌 Metabolic engineering 27 (2015) 65-75, Efficient diterpene production in yeast by engineering Erg20p into a geranylgeranyl diphosphate synthase에 기재된 것이다. 구체적으로, BTS1, XdCrtE, ERG20F96C 3종의 효소 단백질의 아미노산 서열은 서열번호 15, 16 및 17에 각각 나타냈다.
또한 카우렌 생성 단계 관련 Stevia rebaudiana 유래 KS (SrKS) 효소와 CPS (SrCDPS) 효소 2종과 CPS/KS 두 효소의 역할을 한번에 진행하는 Jungermannia subulata 유래의 이중 기능 효소 JsCDPS/KS 를 카우렌 생합성 모듈로서 GAL2 프로모터 조절 하에 발현되도록 설계하였다. 상기 제조된 벡터의 개열지도를 도 1에 나타냈다. 두 모듈의 유전자들을 조합하여 GGPP에서부터 카우렌까지 생합성 단계의 총 6개 조합을 설계하고 대장균-효모 셔틀 벡터인 pRS424로 클로닝되어 표 1의 pSYK 재조합 플라스미드 6종을 제작하였다.
재조합
플라스미드
GGPP 생합성 모듈 카우렌 생합성 모듈
프로모터 유전자 프로모터 유전자 프로모터 유전자
pSYK1R ScGAL1 BTS1-ERG20 SmGAL2 SrCDPS ScGAL2 SrKS
pSYK2R ScGAL1 XdCrtE-ERG20 SmGAL2 SrCDPS ScGAL2 SrKS
pSYK3R ScGAL1 ERG20F96C SmGAL2 SrCDPS ScGAL2 SrKS
pSYK4 ScGAL1 BTS1-ERG20 - - ScGAL2 JsCDPS/KS
pSYK5 ScGAL1 XdCrtE-ERG20 - - ScGAL2 JsCDPS/KS
pSYK6 ScGAL1 ERG20F96C - - ScGAL2 JsCDPS/KS
c: Saccharomyces cerevisiae, Sm: Saccharomyces mikatae
Sr: Stevia rebaudiana Js: Jungermannia subulata
제조된 6종의 재조합 플라스미드 S. cerevisiae의 유전체로 삽입을 위해 SwaI(NEB)을 처리한 후 LiAc(Lithium acetate) 방법을 이용하여 S. cerevisiae CEN PK2-1c 균주에 형질전환하였다. 제조된 6종의 유전자 카세트들은 S. cerevisiae 유전체의 GAL7-GAL10-GAL1위치에 상동재조합 형태로 삽입되었으며, LEU 선별마커를 통해 6종의 유전자 카세트들이 삽입된 재조합 균주들을 선별하였다.
1-3: 재조합 균주의 배양
실시예 1-2에서 제조한, 카우렌을 생합성하는 재조합 효모의 배양은 표 2의 배지를 사용하여 배양하였다. 재조합 효모 균주의 배양은 고체배지에 배양한 뒤 표 2에 나타낸 배지 5 mL에 접종하여 30 ℃ 온도에서 200 rpm으로 9시간 전배양하였다. 전배양액의 세포들은 최종적으로 25 mL의 표 2 배지에 접종한 뒤 멸균된 2 mL 도데칸(dodecane)을 첨가하여 30 ℃ 온도, 200 rpm에서 72시간 동안 진탕배양하였다. 이에 따라, Dodecane two phase(도데칸 층분리) 배양물과 배양 세포균체를 얻었다.
배지성분 사용조건 (g/L)
YNB(yeast nitrogene base) 6.7
MES 100 mM
Glucose 20
암모니아수 pH 6.0 조정
1-4: LC-MS를 이용한 중간체 물질의 정량분석
1-4-1: 중간체 확인을 위한 재조합 효모 배양
대사 산물로서 중간체 물질인 파네졸산(FPP), 게라닐게라닐산(GGPP) 등을 확인하기 위해서, 실시예 2에서 얻어진 6종의 카우렌 생합성 효모 균주를 36시간 배양하였다. 대수 증식기에서 배양 세포를 이용하여 중간체 생산을 확인하였다.
구체적으로, 중간체의 확인을 위해 배양한 균체액을 냉각시킨 식염수 용액 45mL에 상기 효모 배양액 5 mL을 섞고, 원심분리(5000 g, 10 min, 0) 하여 상등액을 빠르게 버리고 다시 냉각된 식염수 용액으로 세척하였다. 원심분리로 상등액을 제거하고 균체를 얼음에 보관한 후 추출공정에 사용하였다.
1-4-2: 재조합 효모 세포로부터 대사산물의 추출
대사산물의 추출을 위해, 95 ℃ 온도의 수조에서 가열한 70%((v/v) 에탄올 수용액을 1.5 mL 첨가하여 상기 균체를 잘 풀어준 다음, 3분 동안 95 ℃ 온도에서 120 rpm으로 shaking하여 대사산물을 추출한 후, 얼음에 넣어 빠르게 식힌 다음 5분 동안 보관 후 원심분리(15,000 g, 5분)하여 상등액을 얻었으며, 상기 상등액을 이용하여 LC-MS 분석을 실시하였다.
대사산물의 분석은 LC-MS 방법을 이용하는데 gemini-NX C18 150 mm X2mm, 3 um 110 A particale (Phenomenex) column을 이용하고, 이동상은 7.5 mM tributylamine(pH 4.95) 용액과 아세토나이트릴을 각각 이용하여 Gradient로 분석하였다. 상기 LC-MS 분석 조건을 하기 표 3에 나타냈다.
Time (min) Eluent B(%)
0 0
10 15
35 30
45 70
47 100
49 100
55 100
56 0
60 0
상기 GGPP 추출물의 LC-MS 분석을 통하여 재조합 효모 균체의 추출물에서 FPP와 GGPP의 존재를 확인하였다.
1-5: 효모 배양에 따른 카우렌 생산 및 추출
재조합 균주의 배양 과정에서, 도데칸을 첨가하면서 재조합 효모를 배양하는 경우, 도데칸 층에 카우렌이 축적되므로, 도데칸 층에 존재하는 카우렌과 세포를 파쇄하고 헥산으로 추출한 세포 추출물에 포함된 카우렌의 함량을 확인하고자 하였다.
구체적으로, 실시예 1-3과 동일한 방법으로 재조합 균주를 12시간 동안 배양하고 상기 배양액의 상층에 존재하는 도데칸 층 200 uL를 물이 포함되지 않도록 샘플을 확보하여, 도데칸 층의 카우렌의 생산량을 확인 실험에 사용하였다. 또한, 세포 배양액과 배양 세포로부터 카우렌을 확인하였다. 구체적으로, 배양 세포로부터의 카우렌 추출과정은 실시예 1-3에서 얻어진 3 mL의 Dodecane two phase(도데칸 층분리) 배양하여 얻어진 효모 배양물(전체 배양세포 포함)을 원심분리(13000 g, 5분)하여 균체를 회수하였다.
상기 세포 배양물의 원심분리에서 얻어진 배양 상등액 1mL을 400ul hexane 과 섞어서 2mL screw-capped tube에 옮긴 후 추출 과정을 거처 세포 배양액 내에 존재하는 카우렌 양을 확인하는 실험에 사용하였다.
상기 원심 분리에서 회수한 균체는 물 1ml로 2회 씻은 후 0.5 mm입경을 갖는 glass bead 을 200 mg 양으로 넣고, 포화 염화나트륨 용액을 200 ul 첨가하였다. 그런 후에, Hexane을 400 ul 첨가하여 screw-capped tube 에 옮긴 후, 분당 6,500회 bead-beating하여 카우렌을 추출하여 카우렌의 생산량을 확인 실험에 사용하였다.
1-6: GC-MS 분석을 통한 카우렌 정량
실시예 1-5에서 추출한 카우렌의 양은 GC-MS를 통하여 분석하였다. 구체적으로, GC-MS 분석은 실시예 1-5에서 얻어진, 세포 배양액의 도데칸 층에 포함된 시료, 상기 세포 배양물의 원심분리에서 얻어진 배양 상등액의 헥산 추출물 시료, 및 배양 세포의 추출물 시료를 분석하였다. 4 ul injection을 260 ℃ 온도에서 실시하였고, 분석용 컬럼은 30 m 0.24 um 0.25 um + 10 m EZ guard (Agilent CP9013)을 사용하고 유동상은 1 mL/min 의 속도로 헬륨가스를 사용하였고, GC-MS Gradient 조건은 다음 표 4과 같이 실행하였다.
온도 시간 비고
40 2 -
40 - 210 15.4 +11 / min
210 2 -
210 - 250 6.1 +6.5 / min
250 15 -
1-7: 재조합 효모 세포로부터 부산물 생성 확인
카우렌 생산과정은 FPP(farnesyl pyrophosphate), GGPP(geranylgeranyl pyrophosphate), CPP(copalyl pyrophosphate) 의 중간체를 거치면서 이루어진다. 카우렌 생합성 과정에서 카우렌 생성은 실시예 1-5의 분석으로 확인하였다. 카우렌 생산 과정의 각 중간체가 가수분해되면 파네졸(FPP 가수분해산물) 및 게라닐게라니올(GGPP 가수분해 산물) 등의 부산물이 생성된다. 대사공학적으로 유도된 효모의 경우, 파네졸, 게라닐게라니올, 카우렌 등의 분포에 따라 대사과정의 방향성을 확인할 수 있다.
구체적으로, 실시예 1-3에서 배양한 세포 배양물 중에 파네졸, 게라닐게라니올, 및 카우렌 생성을 확인하였다. 구체적으로, 실시예 1-5 및 1-6과 실질적으로 동일한 방법으로 세포 배양액의 도데칸 층에 포함된 시료, 상기 세포 배양물의 원심분리에서 얻어진 배양 상등액의 헥산 추출물 시료, 및 배양 세포의 추출물 시료를 GC-MS 방법으로 분석하였다.
상기 GC-MS 분석 결과로부터, 파네졸, 게라닐게라니올, 카우렌 등을 확인하였다. 구체적으로, 균체의 헥산 추출물에는 파네졸, 카우렌 및 스쿠알렌이 존재하고, 도데칸 층에는 파네졸, 카우린, 및 게라닐게라니올이 존재함을 확인하였다. 이 과정 중에 스쿠알렌(squalene)의 경우 균체의 헥산 추출물에만 존재하였다. 제작된 카우렌 생성 균주의 GC-MS 분석을 통하여 카우렌과 부산물의 생성을 탐색한 GC-MS 분석 결과를 하기 표 5에 기재하였다.
strain Average Titer(mg/L)
Product Average Standard deviation
S1 farnesol 26.870 4.306
geranylgeraniol 2.167 0.577
kaurene 0.059 0.008
S2 farnesol 19.797 5.030
geranylgeraniol 3.967 0.670
kaurene 0.119 0.054
S3 farnesol 19.407 1.897
geranylgeraniol 6.523 6.088
kaurene 0.170 0.126
S4 farnesol 17.007 13.655
geranylgeraniol 0.760 0.518
kaurene 0.160 0.024
S5 farnesol 29.790 9.685
geranylgeraniol 4.470 0.695
kaurene 1.267 0.540
S6 farnesol 28.183 4.476
geranylgeraniol 10.030 1.015
kaurene 0.794 0.102
상기 표 5에 나타낸 바와 같이, 재조합 효모 배양액의 도데칸 층을 GC-MS로 분석한 결과. 파네졸 생성량이 25~30 mg/L임을 확인하였으며, 게라닐게라니올의 생성량은 편차가 심하였다. 이는 세포 내에 존재하는 FPP 농도의 차이에 의해 나타나고 GGPP의 경우 geranylgeraniol과 연관되어 차이를 보이고 GGPP 생합성 모듈로서 ERG20F96C의 경우 XdCrtE-ERG20, BTS1-ERG20 보다 생성량이 많았다.
카우렌 농도의 경우, Stevia rebaudiana 유래의 CDPS와 KS의 조합에서 생성량이 낮았고, 이중기능(bifunctional) 효소를 사용한 조합의 경우 높게 나타났다. CDPS, KS의 유전자 모듈에서 작용하여 카우렌 생산된 평균치는 Stevia rebaudiana 유래의 SrCDPS, SrKS의 경우 0.116이고, 이끼류(Jungermannia subulata) 유래인 JsCDPS/KS의 경우 0.740 mg/L의 생산량 평균치를 보였다. 이를 보면 이끼류 유래의 JsCDPS/KS의 경우 광범위하게 카우렌으로 전환할 수 있는 능력을 가진 것을 확인하였다.
실시예 2: 카우렌 생산용 유전자 구조체(gene construct) 제조
2-1: 유전자 카세트의 제조
실시예 1-2와 실질적으로 동일한 방법으로서, 실시예 1-1에서 얻은 Jungermannia subulata 유래의 CPS/KS (JsCPS/KS) 이중 기능 효소와 실시예 1-2에서 사용한 ERG20F96C (서열번호 17의 아미노산 서열)을 GGPPS 효소로 이용하여 카우렌 생산용 유전자 구조체 S21을 제조하였으며, 다만, JsCPS/KS의 프로모터는 Saccharomyces eubayanus 유래의 GAL2 프로모터(SeGAL2)를 사용하고, ERG20F96C의 프로모터는 S. kudriavzevii 유래의 GAL1 프로모터(SkGAL1)를 사용하였다.
또한, 상기 효소의 기능적 발현을 향상시키기 위해, MBP 유전자 (서열번호 18), CUP1 유전자(서열번호 19), 또는 tsf 유전자(서열번호 20) 를 깁슨 어셈블리 방법을 사용하여 JsCPS/KS와 연결하여, 동일한 GAL2 프로모터 하에 조절되도록 유전자 구조체 S22, S23 및 S24를 제조하였다. 유전자 구조체 S25는 MBP-JsCPS/KS에 ERG20F96C 를 연결하여 동일한 GAL2 프로모터하에 조절되도록 제조하여 융합 단백질로 발현되도록 하였다.
유전자 구조체 구조체(A) 구조체(B)
프로모터 조절서열 효소 프로모터 효소
S21 SeGAL2 - JsCDPS/KS - SkGAL1 ERG20F96C
S22 SeGAL2 MBP JsCDPS/KS - SkGAL1 ERG20F96C
S23 SeGAL2 CUP1 JsCDPS/KS - SkGAL1 ERG20F96C
S24 SeGAL2 tsf JsCDPS/KS - SkGAL1 ERG20F96C
S25 SeGAL2 MBP JsCDPS/KS ERG20F96C _ -
2-2: 재조합 균주를 이용한 카우렌 생산
각각의 설계된 6종의 카우렌 모듈들은 pRS415 E. coli/yeast 셔틀벡터로 클로닝 되어 각각 pSYK21, pSYK22, pSYK23, pSYK24 및 pSYK25 재조합 플라스미드가 제작되었다.
제작된 6종의 재조합 플라스미드는 LiAc/ssDNA 방법에 의해 S. cerevisiae CEN.PK2-1c 균주로 형질전환 되어 6종의 재조합 효모 균주(S21~S26)를 구축하였다.
상기 재조합 효모 균주들로부터 플라스크 배양을 통해 카우렌 생산을 시도하였다. 카우렌을 생산하는 재조합 균주들의 배양은 고체배지에 배양한 후에 상기 표 2에 나타낸 배지 5 mL에 접종하여 30 ℃ 온도에서 200 rpm으로 9시간 전배양하였다. 전배양액의 세포들은 최종적으로 25 mL의 표 2 배지에 접종한 뒤 멸균된 2 mL 도데칸(dodecane)을 첨가하여 30 ℃ 온도, 200 rpm에서 72시간 동안 진탕배양하였다. 이에 따라, Dodecane two phase(도데칸 층분리) 배양물과 배양 세포 균체를 얻었다.
구체적으로, 배양 세포로부터의 카우렌 추출과정은 Dodecane two phase(도데칸 층분리) 배양하여 얻어진 효모 배양물(전체 배양세포 포함)을 원심분리(13000 g, 5분)하여 균체를 회수하였다. 상기 세포 배양물의 원심분리에서 얻어진 배양 상등액 1mL을 400ul 헥산과 섞어서 2mL screw-capped tube에 옮긴 후 추출 과정을 거처 세포 배양액내에 존재하는 카우렌 양을 확인하는 실험에 사용하였다. 상기 원심 분리에서 회수한 균체는 물 1ml로 2회 씻은 후 0.5 mm입경을 갖는 유리 비드를 200 mg 양으로 넣고, 포화 염화나트륨 용액을 200 ul 첨가하였다. 그런 후에, 헥산을 400 ul 첨가하여 screw-capped tube 에 옮긴 후, 분당 6500회 bead-beating하여 카우렌을 추출하여 카우렌의 생산량을 확인 실험에 사용하였다.
2-3: 생산된 카우렌의 정량분석
상기 실시예 2-2에서 얻어진 Dodecane two phase(도데칸 층분리) 배양물과 배양 세포 균체를, 실시예 1-5의 방법과 실질적으로 동일한 방법으로 GC-MS 분석을 이용하여 카우렌을 정량하였다. 5종의 재조합 균주로부터 생산된 카우렌의 함량은 표 7에 정리되었다.
재조합 균주 카우렌 생산량 (mg/L)
S21 1.187 (±0.128)
S22 2.334 (±0.586)
S23 1.845 (±0.101)
S24 1.810 (±0.701)
S25 3.120 (±0.844)
효소의 기능적 발현을 향상시키기 위해, MBP, CUP1, 또는 tsf 유전자를 JsCPS/KS와 연결한 S22, S23, S24 균주 중에서, MBP가 융합된 카우렌 생합성 모듈을 가진 재조합 균주 S22가 가장 높고, 그 다음으로 CUP1이 융합된 카우렌 생합성 모듈을 가진 재조합 균주 S23 및 tsf가 융합된 카우렌 생합성 모듈을 가진 재조합 균주 S24 순으로 카우렌 생산량이 감소하였다. 또한, MBP가 융합된 카우렌 생합성 모듈을 가진 재조합 균주 S22와 균주 S25는, ERG20F96C가 추가로 연결된 균주 S25가 더 높은 카우렌 생산량을 나타내어 ERG20F96C가 별도 전사 프로모터 하에서 발현되는 것에 비해 JsCPS/KS와 하나의 융합 단백질로 발현하는 것이 더욱 바람직함을 확인하였다.
실시예 3. 스테비올 생산균주를 이용한 스테비올 생산
3-1: 스테비올 생산균주의 제조
실시예 1에서 얻어진 카우렌 생산균주인 S6와 S9 균주를 선별하여, 스테비올 생산을 위해서, 카우렌 산화효소(kaurene oxidase, KO)와 카우렌산 수산화효소(Ent-kaurenoic acid 13-hydroxylase, KAH) 및 시토크롬 P450 환원효소(cytochrome P450 reductase, CPR)를 포함한 총 3가지 효소 유전자를 도입하여 스테비올 생산용 재조합 효소를 제조하였으며, 이를 S6-steviol로 명명하였다. 문헌 상으로 확인된 S. rebaudiana 유래의 KO (SrKO) 및 KAH (SrKAH)와 Arabidopsis thaliana 유래와 S.cereviiae의 CPR (AtCPR, yCPR)을 사용하였다.
구체적으로, KO, KAH, 및 CPR 유전자의 재조합 효모내로 도입은 상동 재조합방식으로 도입하였는데, 효모의 DPP(diphosphate phosphatase)1 위치에 유전자를 도입하도록 상동유전자 부분을 결합한 형태로 SrKAH와 AtCPR의 유전자 발현 카세트와 SrKO와 yCPR 유전자를 각각 하나의 모듈로 제조하고, 유전자 내에 hygromycin 내성인자인 Hph(hygromycin B phosphotransferase)를 도입하여 발현 카세트를 포함하여 DPPF1, DPPF2, DPPF3, DPPF4를 제작하였다. 각각의 유전자 덩어리는 pBluescipt SK에 서브클로닝 하였고, 유전자서열분석을 통하여 유전자가 정상적으로 발현할 수 있는 형태을 확인하였다. 확인된 유전자 카세트를 PCR을 통해서 증폭하고, 증폭된 각각의 유전자 발현 카세트들은, LiAc 형질전환방법을 이용하여, 실시예 2의 재조합 효모에 형질전환하였다. 구체적으로 DPPF1, DPPF2, DPPF3, 및 DPPF4는 하기 표 8에 기재된 프라이머 쌍을 이용하여 유전자 증폭 반응을 95 ℃에서 30초, 55 ℃에서 30초, 72 ℃에서 4분의 반응을 30회 반복하여 확보하였다. 상기 제조된 DPPF1, DPPF2, DPPF3, DPPF4의 핵산서열은 각각 서열번호 3 내지 6에 나타냈다.
명명 핵산서열 (5'->3') 서열번호
DPPF1-F CGCCGAGGGTATTTTACTTCC 7
DPPF1-R GCACTCGAAACTTCAGGTTC 8
DPPF2의 정방향 프라이머 GGTGTTATCGTTGCTGGTGG 9
DPPF2의 역방향 프라이머 GATAGTACTAGAGACACATATTC 10
DPPF3의 정방향 프라이머 GGCACTGGTCACTCTTTTGG 11
DPPF3의 역방향 프라이머 CTGTCCTTGCCTGGTGGG 12
DPPF4의 정방향 프라이머 CTCTCGCCGCTCGCCATC 13
DPPF4의 역방향 프라이머 CAACCGGCTCTTTGTCAACAG 14
효모에 도입된 유전자는 효모 내에서 In vivo assembly 과정으로 조립 되고, 최종적으로 DPP1 유전자 자리에 상동재조합 과정에 의해 효모 유전체 내로 삽입되었다. KAH/CPR 조합 카세트가 도입된 형질전환 균주는 Hygromycin (200 mg/L)에 내성을 바탕으로 선별하여, KO, KAH, 및 CPR 유전자가 도입된 효모균주를 확보하였다.
3-2: 재조합 효모균주의 배양 및 스테비올 생산
KO, KAH 및 CPR 유전자가 도입된 형질전환 균주(S6-steviol)을 3 mL YPD 배지에서 전배양 후, 초기 OD600가 0.1~0.2가 되도록 조정하여 50 mL YPD (50 g/L glucose) 플라스크에서 온도 30°C 및 250 rpm에서 본배양을 수행하였다. 본 배양의 샘플링은 72시간 배양 후 OD600를 측정 후 5 mL씩 취하여 분주하였다. 상기 배양된 스테비올 생산 균주의 OD600를 측정하여 균주별로 생장 정도를 확인하였다.
상기 스테비올 생산 균주의 배양액 5 mL로부터 세포추출물을 추출하여 스테비올이 생산되었는지 확인하였다. 구체적으로, 스테비올의 추출방법은 CSH (Cold Spring Harbor)에서 제작한 LC-MS 분석을 위한 효모로부터의 추출물 분리 방법으로서, 세포 배양물에서 원심분리를 하여 세포를 회수하고, MeOH:ACN:H2O (2:2:1) 용매를 사용하여 세포를 희석하고, -70°C에서 30분간 정치한 뒤 상온에서 30분 동안 교반하여 스테비올 추출을 진행하였다.
추출된 샘플은 여과 후에 Gradient HPLC를 통해 분석하였다. 스테비올 표준물질과 비교하여, 상기 추출물로부터 스테비올이 동일한 머무름값(retention time, RT)을 가지는 물질을 확인할 수 있었고, 배양시간의 증가에 따라 스테비올 의 양이 증가하는 것을 확인하였다. 최종적으로 S6-steviol 균주에서 생산되는 스테비올의 생산량은 0.67 ± 0.22(mg/L)이었다.
실시예 4: 스테비올 및 13-SMG의 생산
본 실시예에서는, 실시예 3에서 얻어진 스테비올 생산 균주에 스테비올 13번 탄소 위치에 글루코오스를 전달하는 효소를 암호화하는 유전자를 도입하여 스테비올 배당체인 13-SMG를 생산하였다.
구체적으로, CDPS/KS 이중 기능 효소에 더하여, 카우렌 옥시다제(KO), 카우렌산 하이드로실라제(KAH), KO와 KAH 전자를 전달하여 전자전달계를 완성하는 시토크롬 P450 환원효소(CPR) 및 스테비올 13번 탄소 위치에 글루코오스를 전달하는 UGT85C2 효소를 암호화하는 유전자 (서열번호 22)들이 포함된 4개의 재조합 플라스미드를 설계하였다 (pSYK32, pSYK34, pSYK35, pSYK36). 스테비올-13-글리코시드 생합성을 위한 2종의 재조합 플라스미드의 유전자 구성은 표 9에서 나타낸다.
각각의 유전자 발현 카세트들은 GRE3 유전자 위치에 CRISPR/Cas9 기술을 이용하여 유전체에 삽입되어, 또한, 상기 pSYK36 및 pSYK32을 도입한 S35 균주(지속발현)를 제조하고, 상기 pSYK35 및 pSYK34 플라즈미드를 도입한 S36 균주(유도발현)를 제조하였으며, 각 균주들의 유전자 정보는 표 10에 나타낸다.
재조합 플라스미드 유전자 발현유형 유전자 구성
pSYK32 지속발현 SrKO, SrKAH, UGT85C2, SrCPR8, Cyb5
pSYK34 유도발현 SrKO, SrKAH, UGT85C2, SrCPR8, Cyb5
pSYK35 유도발현 ERG20F96C, JsCPS/KS
pSYK36 지속발현 ERG20F96C, JsCPS/KS
재조합 균주 유전자 구성
S35(pSYK36 & pSYK32) GRE3::P PGK1 >ERG20 F96C >T EBS1 -P TDH3 >JsCPS/KS>T NAT5 -P KlURA3 >KlURA3>T KlURA3 -P TEF2 >SrKO>T NAT1 -P ENO2 >SrKAH>T RPL41B -P GPD1 >UGT85C2>T RPL15A -P TEF1 >SrCPR8>T YHI9 -P TPI1 >CyB5>T IDP1
S36(pSYK35 & pSYK34) GRE3::P GAL1 >ERG20 F96C >T EBS1 -P GAL2 >JsCPS/KS>T NAT5 -P KlURA3 >KlURA3>T KlURA3 -P SkGAL1 >SrKO>T NAT1 -P SeGAL2 >SrKAH>T RPL41B -P SbGAL2 >UGT85C2>T RPL15A -P SkGAL2 >SrCPR8>T YHI9 -P SmGAL2 >CyB5>T IDP1
상기 표 10에 나타낸 바와 같이, S35 균주의 경우 추가적인 유도물질 없이 생장함에 따라 도입된 유전자들이 발현되는 형태의 프로모터 조절 하에 존재하고, S36 균주의 경우에는 갈락토오스를 유도물질로 첨가한 후부터 도입된 유전자들이 발현되는 갈락토오스 대사관련 프로모터의 조절 하에 존재한다.
상기 플라즈미드가 도입된 형질전환 S35 균주 및 S36 균주를, 3 mL YPD 배지에서 전 배양 후, 초기 OD600가 0.2가 되도록 조정하여 50 mL YPD (50 g/L glucose) 플라스크에서 온도 30℃ 및 250 rpm에서 본 배양을 수행하였다. 본 배양의 샘플링은 72시간 배양 후 OD600를 측정 후 5 mL씩 취하여 분주하였다. 상기 배양된 스테비올 생산 균주의 OD600를 측정하였으며 하기와 같은 균주 생장 속도를 확인하였다.
S35 균주 비생장 속도(Specific growth rate) = 0.172 ± 0.004 h-1
S36 균주 비생장 속도(Specific growth rate) = 0.307 ± 0.006 h-1
상기 재조합 균주의 배양물을 원심분리(4,000 rpm, 5분)를 수행하여 세포를 회수하여 스테비올 및 13-SMG 생산을 확인하였다. 생산된 스테비올 및 13-SMG는 LC-MS/MS를 이용하여 분석하였다. 5 uL injection을 40 ℃에서 수행하였고, 분석용 컬럼은 50 mm x 2 mm, 2.5 um 의 COSMOSIL C18을 사용하고 유동상은 0.4 mL/min의 속도로 표 11의 조건으로 분석을 수행하였다.
Method (A: 10 mM ammonium acetate, B: acetonitrile (AcN))
Time (min) % Solvent B (AcN)
0 7
0.2 7
0.3 20
5 48
5.01 99
7 100
7.01 7
8 7
S35와 S36 균주는 스테비올과 13-SMG가 각각 0.017 mg/L, 0.1 mg/L와 0.002 mg/L, 17.3 mg/L 생산되었다.
균주 스테비올 (mg/L) 13-SMG (mg/L)
S35 0.017 (± 0.001) 0.1 (± 0.1)
S36 0.002 (± 0.001) 17.3 (± 2.7)
실시예 3에서 스테비올 생산에 사용된 CDPS/KS, KO, KAH 및 CPR을 도입하여 스테비올을 생산하였으며, 본 실시예에서는 스테비올 13번 탄소 위치에 글루코오스를 전달하는 UGT85C2를 추가로 도입하여 스테비올의 당화를 유도하여 13-SMG를 생성하였다. 생산 형태는 프로모터를 지속발현형태(S35)와 유도발현(S36)을 확인한 결과 유도 발현에 의하여 생성되는 13-SMG 의 양이 증가함을 확인하였다. 스테비올과 스테비올 배당체의 경우 숙주인 효모에서 생성되었을 때 균주에 영향을 줄 수 있어서 유도발현에 의해 생성되는 산물이 증가한다고 보여진다.
<110> SAMYANG CORPORATION <120> Improved production of steviol glycoside and its precursors <130> DPP20193992KR <160> 23 <170> KoPatentIn 3.0 <210> 1 <211> 782 <212> PRT <213> Artificial Sequence <220> <223> JS CDPS/KS enzyme of Jungermannia subulata <400> 1 Met Ser Phe Glu Lys Ser Ala Pro Gly Ser Val Val Glu Pro Asn Gly 1 5 10 15 Arg Ser Lys Pro Asp Ile Tyr Lys Asp Lys Gly Lys Glu Ala Glu Glu 20 25 30 Ile Lys Gln Trp Ile Glu Glu Ile Arg Ala Met Met Gly Ser Met Thr 35 40 45 Asp Gly Glu Ile Thr Asn Ser Pro Tyr Asp Thr Ala Trp Val Ala Leu 50 55 60 Val Pro Ala Leu Asp Gly Ser Asp Gly Pro Gln Phe Pro Lys Ser Leu 65 70 75 80 Gln Trp Ile Ile Glu Asn Gln Phe Ser Asp Gly Ser Trp Gly Asp Arg 85 90 95 Gly Tyr Phe Ser Tyr Tyr Asp Arg Val Cys Asn Thr Leu Ala Cys Ile 100 105 110 Ile Ala Leu Lys Thr Trp Lys Thr Gly Ser Ala Ala Val Glu Lys Gly 115 120 125 Val Glu Phe Ile Gln Lys Asn Leu Gln Ala Met Glu Thr Glu Glu Asp 130 135 140 Ala His Met Met Ile Gly Phe Glu Ile Val Phe Pro Ala Leu Ile Ser 145 150 155 160 Tyr Ala Lys Ser Leu Asp Leu Asp Leu Pro Phe Asp Ala Pro Ile Ile 165 170 175 Ala Lys Ile Ser Ala Glu Arg Glu Lys Lys Leu Ala Lys Ile Pro Met 180 185 190 Asp Ile Leu His Lys Val Pro Thr Thr Leu Leu His Ser Leu Glu Gly 195 200 205 Phe His Glu Glu Leu Asp Trp Glu Lys Leu Leu Lys Leu Gln Ser Glu 210 215 220 Asp Gly Ser Phe Leu Cys Ser Pro Ala Ser Thr Ala Ala Cys Leu Leu 225 230 235 240 His Thr Lys Asp Glu Lys Ala Leu Ser Tyr Leu Thr Ser Leu Leu Asp 245 250 255 Arg Phe Asn Asn Ala Val Pro Asn Val Tyr Pro Val Asp Leu Phe Glu 260 265 270 His Met Trp Thr Val Asp Arg Leu Gln Arg Leu Gly Ile Asp Arg Tyr 275 280 285 Phe Glu Lys Glu Ile Lys Asp Ser Leu Asp Tyr Val Tyr Lys Tyr Tyr 290 295 300 Lys Ser Val Gly Ile Gly Trp Ala Arg Gly Ser Val Val Gln Asp Leu 305 310 315 320 Asp Asp Thr Ala Met Gly Phe Arg Leu Leu Arg Gln Asn Gly Tyr Asp 325 330 335 Val Asn Glu Asp Val Phe Arg Gln Phe Lys Gly Lys Glu Ser Glu Phe 340 345 350 Phe Cys Phe Ala Gly Gln Ser Gly Gln Ala Val Thr Gly Leu Phe Asn 355 360 365 Phe Tyr Arg Ala Thr Gln Thr Arg Phe Pro Gly Glu Ser Leu Leu Ala 370 375 380 Thr Gly Glu His Phe Ala Arg Gly Phe Leu Val Glu Arg His Glu Lys 385 390 395 400 Asn Glu Cys Phe Asp Lys Trp Ile Ile Thr Lys Asp Leu Pro Gly Glu 405 410 415 Val Glu Tyr Ala Leu Ala Thr Pro Trp Tyr Cys Ser Leu Pro Arg Leu 420 425 430 Glu Thr Glu Ser Tyr Leu Ser His Tyr Gly Thr Asp Asp Ile Trp Ile 435 440 445 Gly Lys Ser Leu Tyr Arg Met Pro Phe Val Asn Asn Glu Thr Phe Leu 450 455 460 Ala Leu Ala Lys Ala Asp Phe Asn Leu Cys Gln Ala Lys His Gln Glu 465 470 475 480 Asp Leu Gln Asn Ile Thr Arg Trp Ser Glu Asp Cys Gly Phe Gly Lys 485 490 495 Leu Ser Phe Ala Arg Gln Lys Ala Ile Glu Gly Val Phe Ser Ala Ala 500 505 510 Cys Ile Leu Pro Gly Pro Glu Leu Ser Pro Ala Arg Leu Val Trp Ala 515 520 525 Gln Asn Cys Val Leu Thr Thr Val Val Asp Asp Tyr Phe Asp Val Gly 530 535 540 Gly Thr Leu Pro Asp Met Arg Arg Phe Leu Glu Ala Phe Lys Glu Trp 545 550 555 560 Asn Pro Ser Leu Met Asp Gly Thr Ala Glu Glu Ala Gln Ile Val Phe 565 570 575 Asn Gly Leu Tyr Asn Thr Leu Asn Ala Met Thr Gln Glu Gly Thr Leu 580 585 590 Ala Gln Gly Arg Asp Ile Gly Gln His Leu Gln Lys Ile Trp Leu Arg 595 600 605 Trp Leu Glu Ser Cys Leu Thr Glu Ala Glu Trp Thr Ala Ser Ser Phe 610 615 620 Ser Pro Ser Phe Asp Glu Tyr Met Lys Asn Ala Leu Pro Ser Ile Ala 625 630 635 640 Leu Glu Pro Ile Val Leu Cys Thr Leu Phe Phe Leu Gly Glu Pro Leu 645 650 655 Ser Asp Glu Phe Val Gly Asp Ser Gln Lys Leu Arg Leu Met Glu Leu 660 665 670 Thr Asn Arg Val Gly Arg Leu Leu Asn Asp Ser Gln Gly Trp Lys Arg 675 680 685 Glu Asp Ser Gln Asn Lys Pro Asn Ser Val Ser Ile Leu Leu Arg Glu 690 695 700 Asn Pro Gly Trp Thr Glu Glu Glu Ala Ile Ala Asn Val Arg Ser Thr 705 710 715 720 Val Glu Glu Ser Met Leu Glu Leu Val Arg Ala Val His Gln Arg Ser 725 730 735 Pro Ile Pro Asn Ser Ile Arg Gln Leu His Phe Asn Met Ala Arg Ile 740 745 750 Met His Leu Phe Tyr Gln Lys Thr Asp Gly Phe Thr Asp Arg Ser Ala 755 760 765 Met Ala Lys Lys Leu Lys Lys Val Leu Phe Gln Pro Val Val 770 775 780 <210> 2 <211> 2349 <212> DNA <213> Artificial Sequence <220> <223> JS CDPS/KS enzyme of Jungermannia subulata <400> 2 atgtcttttg aaaaatcagc tccaggttct gttgttgaac caaatggtag atcaaagcca 60 gatatatata aggataaggg taaagaagct gaagaaatca agcaatggat cgaagaaatc 120 agagcaatga tgggttcaat gactgatggt gaaattacaa attctccata cgatactgca 180 tgggttgctt tggttccagc tttagatggt tcagatggtc cacaatttcc aaaatcttta 240 caatggatca tcgaaaacca attttctgat ggttcatggg gtgacagagg ttacttctca 300 tactacgata gagtttgtaa cactttagca tgtatcatcg ctttgaagac ttggaagaca 360 ggttctgctg ctgttgaaaa gggtgttgag tttattcaaa agaatttgca agctatggaa 420 acagaagaag atgcacacat gatgatcggt ttcgaaatcg ttttcccagc tttgatttca 480 tacgcaaaat ctttggattt ggatttgcca ttcgatgcac caatcatcgc taaaatttca 540 gcagaaagag aaaagaaatt ggctaagatc ccaatggata ttttgcataa agttccaact 600 acattgttgc attctttaga aggtttccat gaagaattgg attgggaaaa attgttgaaa 660 ttacaatcag aagatggttc atttttgtgt tctccagctt caactgctgc atgtttgtta 720 catacaaagg atgaaaaagc attatcatat ttgacttctt tgttggatag attcaataac 780 gctgttccaa atgtttaccc agttgatttg tttgaacata tgtggacagt tgatagattg 840 caaagattgg gtatcgatag atacttcgaa aaggaaatca aagattcttt agattatgtt 900 tacaaatatt acaaatcagt tggtattggt tgggctagag gttctgttgt tcaagatttg 960 gatgatactg caatgggttt cagattgttg agacaaaacg gttacgatgt taacgaagat 1020 gtttttagac aattcaaagg taaagaatca gaatttttct gttttgctgg tcaatctggt 1080 caagcagtta ctggtttgtt taatttctac agagctactc aaacaagatt tcctggtgaa 1140 tctttgttag ctacaggtga acattttgca agaggtttct tggttgaaag acatgaaaag 1200 aatgaatgtt tcgataagtg gatcatcact aaagatttgc caggtgaagt tgaatatgct 1260 ttggcaacac cttggtactg ttcattgcca agattggaaa ctgaatctta tttgtcacat 1320 tacggtacag atgatatttg gatcggtaaa tctttgtaca gaatgccatt cgttaacaac 1380 gaaacatttt tggctttggc aaaggctgat ttcaatttgt gtcaagctaa gcatcaagaa 1440 gatttgcaaa acatcacaag atggtcagaa gattgtggtt tcggtaaatt atcttttgct 1500 agacaaaagg ctattgaagg tgttttctct gctgcttgta ttttgccagg tccagaatta 1560 tctccagcta gattggtttg ggcacaaaat tgtgttttga ctacagttgt tgatgattac 1620 tttgatgttg gtggtacatt accagatatg agaagatttt tggaagcctt taaagaatgg 1680 aatccatctt tgatggatgg tactgctgaa gaagctcaaa tcgtttttaa tggtttgtac 1740 aacacattga acgctatgac tcaagaaggt acattagcac aaggtagaga tattggtcaa 1800 catttgcaaa agatttggtt aagatggttg gaatcatgtt tgactgaagc tgaatggaca 1860 gcatcttcat tttctccatc atttgatgaa tacatgaaga acgctttacc atctattgca 1920 ttggaaccta ttgttttgtg tactttgttt ttcttgggtg aaccattatc agatgaattt 1980 gttggtgact ctcaaaaatt gagattgatg gaattgacaa acagagttgg tagattgttg 2040 aacgattcac aaggttggaa gagagaagat tctcaaaata agccaaattc tgtttcaatt 2100 ttgttgagag aaaacccagg ttggactgaa gaagaagcta ttgctaatgt tagatcaaca 2160 gttgaagaat ctatgttaga attggttaga gcagttcatc aaagatcacc aatcccaaat 2220 tctatcagac aattacattt caacatggct agaatcatgc atttgtttta ccaaaagact 2280 gatggtttta cagatagatc agctatggct aagaaattga agaaagtttt atttcaacca 2340 gttgtttaa 2349 <210> 3 <211> 5530 <212> DNA <213> Artificial Sequence <220> <223> DPPF1 polynucleotide sequence <400> 3 cgccgagggt attttacttc cgaatctcaa agaaaaaaat atgcttactg ttaatcctaa 60 aagaggtgac aatattcagc taaaactttc agagacttgc agttctcttc aaggcggtca 120 actttaacaa agaggtagca gattgttttc tttatttgtt cgctatttac aagtgaagaa 180 gcagctcttc ataaagggac aacacggctt atagcatttt ttacgaaaag tttgaccgtt 240 tagaacaaat atttaaaaac tagtactcga tttctggcgc agcaaaaata tagcattatg 300 tccgataaac acagttgtga tctgtcttgt gatcgcatac tctgcagata atcagttgaa 360 atagcagctt ttaagtgaga atcttattct tagtctacat cgttacattg tatcagtcac 420 aggtacggag agaaattata cttttcgatt tcattcaatg tagtttcttt tttacattaa 480 atatagtttt ccagtagtgc actattatta aggcgcttct gtttttagtc aacacttttt 540 cagatagtac ctttcaggtg gttagagtgc gatcccttta aaaaaaagta ttcgtcaacg 600 atgacagggt aaagaataaa tgcagcacgc ctggcgtata ctgctataat tgtacatcat 660 gttatcggcg ttgattctca attgtttggt gattagcttt tatatataga tagaaaccca 720 acgttggata acctcacgac taactttttt gtattttaga aataatttgt cgatcggttg 780 tatatttttg tcatatatta tctagaaacg ttagggaata aactgttatc tagggtccac 840 taacatacgc gcagttcgga aatcagcaaa catcacttaa aggacacctg ctataaactg 900 aattgtgtcc aatttttcga gtagttagca gttcaataaa gggcacgtta tcaattgtta 960 aaggcaaaga atcagaatta aatcatagca aacgaccaaa atgtcttgta aggcagtttc 1020 aaaggaatac tctgatttgt tacaaaagga tgaagcatct tttactaagt gggatgatga 1080 taaggttaag gatcatttgg atacaaataa gaatttgtat ccaaatgatg aaattaaaga 1140 atttgttgaa tcagttaaag caatgttcgg ttctatgaac gatggtgaaa ttaatgtttc 1200 tgcttacgat actgcatggg ttgctttggt tcaagatgtt gatggttcag gttctccaca 1260 atttccatct tcattggaat ggatcgcaaa caaccaatta tcagatggtt cttggggtga 1320 ccatttgtta ttttcagctc atgatagaat tattaacact ttggcatgtg ttattgcttt 1380 aacatcatgg aatgttcatc catctaagtg tgaaaagggt ttgaatttct tgagagaaaa 1440 tatttgtaaa ttggaagatg aaaatgcaga acacatgcct attggtttcg aagttacatt 1500 tccatctttg attgatattg ctaagaaatt gaacatcgaa gttccagaag atactccagc 1560 attgaaggaa atatatgcta gaagagatat taaattgaca aaaattccaa tggaagtttt 1620 gcataaagtt ccaactacat tgttgcattc tttggaaggt atgccagatt tggaatggga 1680 aaaattgttg aaattgcaat gcaaggatgg ttcattttta ttttctccat cttcaactgc 1740 attcgctttg atgcaaacaa aggatgaaaa gtgtttgcaa tatttgacta acatcgttac 1800 aaagtttaat ggtggtgttc caaatgttta cccagttgat ttgttcgaac atatttgggt 1860 tgttgataga ttgcaaagat taggtatcgc aagatacttc aagtctgaaa ttaaagattg 1920 tgttgaatac atcaataagt actggactaa aaatggtatt tgttgggcta gaaacactca 1980 tgttcaagat attgatgata cagcaatggg ttttagagtt ttgagagcac atggttatga 2040 tgttacacca gatgttttta gacaattcga aaaggatggt aaatttgttt gttttgcagg 2100 tcaatcaact caagctgtta caggcatgtt caatgtttac agagcatctc aaatgttgtt 2160 tccaggtgaa agaattttag aagatgctaa gaaattttct tacaactact taaaggaaaa 2220 gcaatctact aatgaattgt tagataaatg gattattgct aaagatttgc caggtgaagt 2280 tggttatgca ttagatattc cttggtacgc ttctttgcca agattagaaa caagatacta 2340 cttggaacaa tatggtggtg aagatgatgt ttggatcggt aaaactttat acagaatggg 2400 ttacgtttca aacaacacat acttggaaat ggcaaaattg gattacaaca actacgttgc 2460 tgttttgcaa ttagaatggt acactatcca acaatggtac gttgatattg gtatcgaaaa 2520 gttcgaatct gataacatca aatcagtttt ggtttcttat tacttagctg ctgcttctat 2580 tttcgaacca gaaagatcaa aggaaagaat tgcatgggct aaaactacaa ttttagttga 2640 taagatcact tcaatttttg attcttcaca atcttcaaag gaagatatta cagcttttat 2700 tgataagttt agaaataagt cttcttctaa gaaacattct attaatggtg aaccttggca 2760 tgaagttatg gttgctttga agaaaacttt gcatggtttt gcattggatg ctttaatgac 2820 acattcacaa gatattcatc cacaattaca tcaagcatgg gaaatgtggt tgactaaatt 2880 acaagatggt gttgatgtta cagcagaatt aatggttcaa atgattaata tgactgctgg 2940 tagatgggtt tctaaggaat tgttgacaca tccacaatac caaagattgt caactgttac 3000 aaattctgtt tgtcatgata ttactaaatt gcataacttc aaggaaaatt caactacagt 3060 tgattctaag gttcaagaat tggttcaatt agttttctct gatacaccag atgatttgga 3120 tcaagatatg aagcaaacat ttttgacagt tatgaaaact ttttactaca aagcatggtg 3180 tgatccaaat actattaacg atcatatctc aaaagttttc gaaatcgtta tataacaata 3240 agcgatttaa tctctaatta ttagttaaag ttttataagc atttttatgt aacgaaaaat 3300 aaattggttc atattattac tgcactgtca cttaccatgg aaagaccaga caagaagttg 3360 ccgacagtct gttgaattgg cctggttagg cttaagtctg ggtccgcttc tttacaaatt 3420 tggagaattt ctcttaaacg atatgtatat tcttttcgtt ggaaaagatg tcttccaaaa 3480 aaaaaaccga tgaattagtg gaaccaagga aaaaaaaaga ggtatccttg attaaggaac 3540 actgtttaaa cagtgtggtt tccaaaaccc tgaaactgca ttagtgtaat agaagactag 3600 acacctcgat acaaataact gggcatgcat gtcgacaccc ttaatataac ttcgtataat 3660 gtatgctata cgaagttatt aggtctagag atctgtttag cttgcctcgt ccccgccggg 3720 tcacccggcc agcgacatgg aggcccagaa taccctcctt gacagtcttg acgtgcgcag 3780 ctcaggggca tgatgtgact gtcgcccgta catttagccc atacatcccc atgtataatc 3840 atttgcatcc atacattttg atggccgcac ggcgcgaagc aaaaattacg gctcctcgct 3900 gcagacctgc gagcagggaa acgctcccct cacagacgcg ttgaattgtc cccacgccgc 3960 gcccctgtag agaaatataa aaggttagga tttgccactg aggttcttct ttcatatact 4020 tccttttaaa atcttgctag gatacagttc tcacatcaca tccgaacata aacaaccatg 4080 cctgaactca ccgcgacgtc tgtcgagaag tttctgatcg aaaagttcga cagcgtctcc 4140 gacctgatgc agctctcgga gggcgaagaa tctcgtgctt tcagcttcga tgtaggaggg 4200 cgtggatatg tcctgcgggt aaatagctgc gccgatggtt tctacaaaga tcgttatgtt 4260 tatcggcact ttgcatcggc cgcgctcccg attccggaag tgcttgacat tggggaattc 4320 agcgagagcc tgacctattg catctcccgc cgtgcacagg gtgtcacgtt gcaagacctg 4380 cctgaaaccg aactgcccgc tgttctgcag ccggtcgcgg aggccatgga tgcgatcgct 4440 gcggccgatc ttagccagac gagcgggttc ggcccattcg gaccgcaagg aatcggtcaa 4500 tacactacat ggcgtgattt catatgcgcg attgctgatc cccatgtgta tcactggcaa 4560 actgtgatgg acgacaccgt cagtgcgtcc gtcgcgcagg ctctcgatga gctgatgctt 4620 tgggccgagg actgccccga agtccggcac ctcgtgcacg cggatttcgg ctccaacaat 4680 gtcctgacgg acaatggccg cataacagcg gtcattgact ggagcgaggc gatgttcggg 4740 gattcccaat acgaggtcgc caacatcttc ttctggaggc cgtggttggc ttgtatggag 4800 cagcagacgc gctacttcga gcggaggcat ccggagcttg caggatcgcc gcggctccgg 4860 gcgtatatgc tccgcattgg tcttgaccaa ctctatcaga gcttggttga cggcaatttc 4920 gatgatgcag cttgggcgca gggtcgatgc gacgcaatcg tccgatccgg agccgggact 4980 gtcgggcgta cacaaatcgc ccgcagaagc gcggccgtct ggaccgatgg ctgtgtagaa 5040 gtactcgccg atagtggaaa ccgacgcccc agcactcgtc cgagggcaaa ggaatagtca 5100 gtactgacaa taaaaagatt cttgttttca agaacttgtc atttgtatag tttttttata 5160 ttgtagttgt tctattttaa tcaaatgtta gcgtgattta tatttttttt cgcctcgaca 5220 tcatctgccc agatgcgaag ttaagtgcgc agaaagtaat atcatgcgtc aatcgtatgt 5280 gaatgctggt cgctatactg ctgtcgattc gatactaacg ccgccatcca gtgtcgaaaa 5340 cgagctctcg agaaccctta atataacttc gtataatgta tgctatacga agttattagg 5400 tgatatcaga tccactagtg gcctatgcgg gtgttatcgt tgctggtggt gcccatgggg 5460 ctgacgaggg gaattacgat gtttgctagt tccaccccct tcgggggttt gaacctgaag 5520 tttcgagtgc 5530 <210> 4 <211> 5185 <212> DNA <213> Artificial Sequence <220> <223> DPPF2 polynucleotide sequence <400> 4 ggtgttatcg ttgctggtgg tgcccatggg gctgacgagg ggaattacga tgtttgctag 60 ttccaccccc ttcgggggtt tgaacctgaa gtttcgagtg cgacatggag gcccagaata 120 ccctccttga cagtcttgac gtgcgcagct caggggcatg atgtgactgt cgcccgtaca 180 tttagcccat acatccccat gtataatcat ttgcatccat acattttgat ggccgcacgg 240 cgcgaagcaa aaattacggc tcctcgctgc agacctgcga gcagggaaac gctcccctca 300 cagacgcgtt gaattgtccc cacgccgcgc ccctgtagag aaatataaaa ggttaggatt 360 tgccactgag gttcttcttt catatacttc cttttaaaat cttgctagga tacagttctc 420 acatcacatc cgaacataaa caaccatgat ccagtttctg acccccgtgc tactatttat 480 cgtcttatac gtgttttgga aggtttacaa gactcagaaa actaaaatca acctgccccc 540 aggtagtttc gggtggccgt ttttaggcga aacgcttgcg ttccttcgtg cgaactggga 600 tggggttccg gaaaggtttg ttcaggaacg tgtcgaaaag tatgggagtc ccctggtctt 660 caagacctca cttttgggag acagaatggc agtgctgtgc ggtcatgctg gtaacaaatt 720 tctttttggg aacgagaata agctagttgc tgtctggtgg ccccttcctg taagaaaatt 780 gtttgggcgt tctctgataa cgatcagagg cgacgaagcc aagtggatgc gtaaaatgct 840 actttcatat ttagggccgg aggcttttgc gacacactat gcggcgacca tggacgctgt 900 cacccgtagg catatacaag tccattggca aggcaaagaa gaagtaaacg tgtttcaaac 960 tgtgaaggtc tatgcattcg agcttgcttg tcgtctgttt cttagccttg aggagccgaa 1020 ccatattgcg aaattggcga gcctgtttaa catctttatg aaaggaatta tagaattgcc 1080 cataaacttt ccgggaacga gattttacag ctctaaaaag gccgcggcgg cgataagaac 1140 agagcttaaa aaaataatca aagctaggcg tgttgagcta gaagagggca acgcgagtac 1200 aagccaagat ctacttagtc atctgttaac atcatctgat gagaacggta ggtatttaac 1260 cgaaaacgat atcgcgaaca acatacttgt cctgctgttc gccggccatg atacctcagc 1320 ggtcagtatc acgctactgt taaagtctct gggggagcat ccaaatgtgt atgacaaggt 1380 tttgaaggaa cagatagaaa tatccaatgc caaggaggcg tgggaacttc tgaaatggga 1440 ggatatccaa aagatgaaat attcctggaa cgtggtaagc gaagtaatga ggttgacacc 1500 tcctgtaacc ggcgcttatc gtgaagcgtt agttgatatt gagtacgcag gatacaccat 1560 accgaagggg tggaagttgc actggagtgg ctcacacacg catagggagg aagcgaattt 1620 tgaagatccc atgaggtttg atccgtccag attcgaggga gcgggacctc gtccattcac 1680 ttttgtccca tttgggggtg gccctaggat gtgtctaggt aaggaatttg caaggttgga 1740 agtactggcg tttcttcaca acatcgtaac taattttaaa tgggaccttt taatacctaa 1800 tgagaaaata gagtacgatc ccatgcctac tccagtcaag ggactaccta tacgtataca 1860 tccccaccag gtctaagtct gaagaatgaa tgatttgatg atttcttttt ccctccattt 1920 ttcttactga atatatcaat gatatagact tgtatagttt attatttcaa attaagtagc 1980 tatatatagt caagataacg tttgtttgac acgattacat tattcgtcga catctttttt 2040 cagcctgtcg tggtagcaat ttgaggagta ttattaattg aataggttca ttttgcgctc 2100 gcataaacag ttttcgtcag ggacagtatg ttggaatgag tggtaattaa tggtgacatg 2160 acatgttata gcaataacct tgatgtttac atcgtagttt aatgtacacc ccgcgaattc 2220 gttcaagtag gagtgcacca attgcaaagg gaaaagctga atgggcagtt cgaatagcgc 2280 gaacaaaaat cacgatctgg gtgggtgtgg gtgtattgga ttataggaag ccacgcgctc 2340 aacctggaat tacaggaagc tggtaatttt ttgggtttgc aatcatcacc atctgcacgt 2400 tgttataatg tcccgtgtct atatatatcc attgacggta ttctattttt ttgctattga 2460 aatgagcgtt ttttgttact acaattggtt ttacagacgg aattttccct atttgtttcg 2520 tcccattttt ccttttctca ttgttctcat atcttaaaaa ggtcctttct tcataatcaa 2580 tgctttcttt tacttaatat tttacttgca ttcagtgaat tttaatacat attcctctag 2640 tcttgcaaaa tcgatttaga atcaagatac cagcctaaaa atgaatgagc agtagctcct 2700 caagctccac gtctatgata gacttgatgg ccgcgataat taagggggaa ccagtgattg 2760 ttagtgaccc ggctaatgcg agtgcatacg aatcagtagc ggctgaactg tcatctatgt 2820 tgatcgagaa cagacaattc gctatgatag tgacgacgag catagccgtt cttatcggtt 2880 gtatcgtaat gttggtttgg aggcgtagtg ggagcgggaa tagcaaacgt gttgagcccc 2940 taaagcctct ggtgataaaa ccgagggagg aagaaataga tgatggtaga aagaaggtta 3000 ctattttttt cggaactcag acggggacag cggagggttt tgccaaggcc cttggagagg 3060 aggcaaaagc acgttacgaa aagacccgtt tcaagatagt agacttagac gactatgcgg 3120 cagacgatga tgagtatgaa gagaagctga agaaggaaga cgtcgcgttt ttcttcctgg 3180 cgacttatgg tgatggggaa cccacagata acgcggcaag gttttataaa tggttcaccg 3240 aaggcaatga cagaggagag tggttaaaga atcttaagta cggtgttttt gggcttggga 3300 acaggcaata tgagcacttt aacaaggttg ccaaagttgt cgatgatatc ctagttgaac 3360 aaggcgcaca gagattggtt caggtcggtc ttggagatga cgaccagtgt atcgaggatg 3420 atttcactgc gtggagagag gccttgtggc ctgagcttga cacaatctta agggaagagg 3480 gggatacagc cgtagctacg ccttataccg ccgcggtgtt ggagtacagg gtctccatcc 3540 acgactccga ggacgccaag ttcaatgaca taaacatggc gaatggcaat ggatatactg 3600 tctttgatgc acaacatcca tacaaggcca atgtggcggt taaaagagag ctgcacacgc 3660 ctgaaagcga tagaagctgt atccacttag agtttgacat agccggctca ggtttaacat 3720 acgaaactgg ggaccacgtg ggcgtgttgt gcgataacct aagtgaaact gtggatgaag 3780 ctttgcgttt attggatatg tcccccgaca cgtacttctc attacatgcg gaaaaggagg 3840 acggcactcc tatatcatcc tcacttcccc ctcccttccc gccttgcaat cttcgtaccg 3900 ccctaactag atatgcttgc ttattatcct ctccaaaaaa gtccgcactg gtcgcgcttg 3960 ccgcccacgc ttcagatccg accgaggccg agagattgaa acatttagcc agcccagcag 4020 gcaaagatga atattctaaa tgggtcgtgg agagtcagag aagcctgctt gaagtgatgg 4080 ctgaatttcc cagtgcgaaa ccgcctttgg gggtgttttt tgctggagta gcacccagac 4140 ttcaaccacg tttttattcc atctcatcta gtcccaaaat tgcagaaacg aggatacatg 4200 ttacctgtgc attggtatac gaaaagatgc ctacaggacg tattcacaag ggagtctgct 4260 ccacttggat gaaaaatgcg gttccatacg aaaaatctga aaattgttcc agcgcgccca 4320 tatttgtgcg tcagtcaaat tttaagcttc cctccgacag taaggtgccg atcatcatga 4380 tcggaccagg tactggatta gcgcccttca gaggttttct gcaagaaaga ctggccttgg 4440 ttgaatctgg agttgagttg ggaccttctg ttcttttttt tgggtgtcgt aacaggagga 4500 tggatttcat ctacgaagaa gaacttcagc gttttgtcga gtcaggtgca cttgctgaat 4560 taagcgtagc attctccaga gaagggccaa caaaggaata tgtgcaacac aaaatgatgg 4620 acaaagccag cgatatttgg aatatgatca gtcaaggcgc ttatttgtac gtctgtggtg 4680 atgctaaagg catggctcgt gatgtgcata ggtctctgca taccattgca caggagcagg 4740 gtagtatgga ttcaactaag gcggaagggt ttgtcaagaa cttacagacg tctggcagat 4800 atttaaggga cgtttggtaa ttgtcgatat catgtaatta gttatgtcac gcttacattc 4860 acgccctcct cccacatccg ctctaaccga aaaggaagga gttagacaac ctgaagtcta 4920 ggtccctatt tatttttttt aatagttatg ttagtattaa gaacgttatt tatatttcaa 4980 atttttcttt tttttctgta caaacgcgtg tacgcatgta acattatact gaaaaccttg 5040 cttgagaagg ttttgggacg ctcgaaggct ttaatttgca agggcactgg tcactctttt 5100 ggcattctct agcattcgtg catgcagatc atcttaggtc tgtctgccct agtcgctctt 5160 tagaatatgt gtctctagta ctatc 5185 <210> 5 <211> 3428 <212> DNA <213> Artificial Sequence <220> <223> DPPF3 polynucleotide sequence <400> 5 ggcactggtc actcttttgg cattctctag cattcgtgca tgcagatcat cttaggtctg 60 tctgccctag tcgctcttta gaatatgtgt ctctagtact atcataaaaa acacgctttt 120 tcagttcgag tttatcatta tcaatactgc catttcaaag aatacgtaaa taattaatag 180 tagtgatttt cctaacttta tttagtcaaa aaattagcct tttaattctg ctgtaacccg 240 tacatgccca aaataggggg cgggttacac agaatatata acatcgtagg tgtctgggtg 300 aacagtttat tcctggcatc cactaaatat aatggagccc gctttttaag ctggcatcca 360 gaaaaaaaaa gaatcccagc accaaaatat tgttttcttc accaaccatc agttcatagg 420 tccattctct tagcgcaact acagagaaca ggggcacaaa caggcaaaaa acgggcacaa 480 cctcaatgga gtgatgcaac ctgcctggag taaatgatga cacaaggcaa ttgacccacg 540 catgtatcta tctcattttc ttacaccttc tattaccttc tgctctctct gatttggaaa 600 aagctgaaaa aaaaggttga aaccagttcc ctgaaattat tcccctactt gactaataag 660 tatataaaga cggtaggtat tgattgtaat tctgtaaatc tatttcttaa acttcttaaa 720 ttctactttt atagttagtc ttttttttag ttttaaaaca ccaagaactt agtttcgaat 780 aaacacacat aaacaaacaa aatgacttct catggtggtc aaactaatcc aacaaatttg 840 attattgata ctacaaagga aagaatacaa aaattgttta aaaatgttga aatttctgtt 900 tcttcttatg atacagcatg ggttgctatg gttccatctc caaattcacc aaagtctcca 960 tgtttcccag aatgtttaaa ttggttgatt aataaccaat taaatgatgg ttcttggggt 1020 ttggttaacc atactcataa ccataaccat ccattgttga aggattcatt atcttcaaca 1080 ttggcatgta tcgttgcttt gaaaagatgg aatgttggtg aagatcaaat taataagggt 1140 ttgtctttta ttgaatctaa tttggcatca gctactgata aatcacaacc atctcctatt 1200 ggtttcgata ttatcttccc aggtttgtta gaatatgcta aaaatttgga tattaatttg 1260 ttgtctaaac aaacagattt ttcattgatg ttacataaaa gagaattaga acaaaagaga 1320 tgtcattcta acgaaattga tggttatttg gcttacatct cagaaggttt aggcaatttg 1380 tacgattgga acatggttaa gaaataccaa atgaagaacg gttctgtttt taattctcca 1440 tcagcaactg ctgctgcttt tattaatcat caaaatccag gttgtttaaa ttacttaaat 1500 tctttgttag ataaatttgg taatgctgtt ccaactgttt acccattgga tttgtacatc 1560 agattatcta tggttgatac tattgaaaga ttgggtattt cacatcattt tagagttgaa 1620 attaaaaatg ttttagatga aacttataga tgttgggttg aaagagatga acaaattttt 1680 atggatgttg ttacttgtgc attggctttt agattgttga gaatacatgg ttacaaagtt 1740 tctccagatc aattagcaga aatcactaac gaattggctt ttaaagatga atacgcagct 1800 ttagaaacat accatgcatc acaaatttta taccaagaag atttgtcttc aggtaaacaa 1860 attttgaagt ctgctgattt cttgaagggt attttgtcaa ctgattctaa tagattatca 1920 aaattgatcc ataaggaagt tgaaaatgct ttaaaatttc caattaatac tggtttggaa 1980 agaattaata caagaagaaa catccaatta tataatgttg ataatacaag aattttgaaa 2040 actacatacc attcttcaaa tatttctaac acttactact tgagattagc tgttgaagat 2100 ttctacactt gtcaatctat atatagagaa gaattaaaag gtttggaaag atgggttgtt 2160 caaaataagt tggatcaatt aaagttcgca agacaaaaga ctgcttattg ttacttttct 2220 gttgcagcta cattatcttc accagaattg tctgatgcaa gaatttcatg ggctaaaaat 2280 ggtattttaa ctacagttgt tgatgatttc tttgatattg gtggtactat tgatgaatta 2340 acaaatttga tccaatgtgt tgaaaagtgg aatgttgatg ttgataagga ttgttgttct 2400 gaacacgtta gaattttgtt tttagcattg aaggatgcta tttgttggat tggtgacgaa 2460 gcctttaaat ggcaagctag agatgttact tctcatgtta tccaaacatg gttggaattg 2520 atgaactcta tgttgagaga agcaatttgg actagagatg cttatgttcc aacattaaac 2580 gaatacatgg aaaacgcata cgtttctttt gctttgggtc ctattgttaa accagctatc 2640 tattttgttg gtccaaaatt gtcagaagaa atcgttgaat cttcagaata ccataatttg 2700 tttaaattga tgtctactca aggtagattg ttgaacgata ttcattcttt taaaagagag 2760 tttaaagagg gtaaattgaa tgcagttgct ttacatttgt ctaatggtga atctggtaaa 2820 gttgaagaag aagttgttga agaaatgatg atgatgatta aaaataagag aaaggaatta 2880 atgaaattga tcttcgaaga aaacggttct attgttccaa gagcatgtaa agatgctttt 2940 tggaatatgt gtcatgtttt gaatttcttt tatgctaacg atgatggttt tactggtaac 3000 acaattttgg atacagttaa agatattatc tataatccat tagttttggt taatgaaaat 3060 gaagaacaaa gataaatcat gtaattagtt atgtcacgct tacattcacg ccctcctccc 3120 acatccgctc taaccgaaaa ggaaggagtt agacaacctg aagtctaggt ccctatttat 3180 tttttttaat agttatgtta gtattaagaa cgttatttat atttcaaatt tttctttttt 3240 ttctgtacaa acgcgtgtac gcatgtaaca ttatactgaa aaccttgctt gagaaggttt 3300 tgggacgctc gaaggcttta atttgcctct cgccgctcgc catcgtctcc tccggacttg 3360 aacttgtccg ccattggtgc atgctgtcta aaaacccacc accatgtagg cccaccaggc 3420 aaggacag 3428 <210> 6 <211> 6561 <212> DNA <213> Artificial Sequence <220> <223> DPPF4 polynucleotide sequence <400> 6 ctctcgccgc tcgccatcgt ctcctccgga cttgaacttg tccgccattg gtgcatgctg 60 tctaaaaacc caccaccatg taggcccacc aggcaaggac agatccaact ggcaccgctg 120 gcttgaacaa caataccagc cttccaactt ctgtaaataa cggcggtacg ccagtgccac 180 cagtaccgtt acctttcggt atacctcctt tccccatgtt tccaatgccc ttcatgcctc 240 caacggctac tatcacaaat cctcatcaag ctgacgcaag ccctaagaaa tgaataacaa 300 tactgacagt actaaataat tgcctacttg gcttcacata cgttgcatac gtcgatatag 360 ataataatga taatgacagc aggattatcg taatacgtaa tagttgaaaa tctcaaaaat 420 gtgtgggtca ttacgtaaat aatgatagga atgggattct tctatttttc ctttttccat 480 tctagcagcc gtcgggaaaa cgtggcatcc tctctttcgg gctcaattgg agtcacgctg 540 ccgtgagcat cctctctttc catatctaac aactgagcac gtaaccaatg gaaaagcatg 600 agcttagcgt tgctccaaaa aagtattgga tggttaatac catttgtctg ttctcttctg 660 actttgactc ctcaaaaaaa aaaaatctac aatcaacaga tcgcttcaat tacgccctca 720 caaaaacttt tttccttctt cttcgcccac gttaaatttt atccctcatg ttgtctaacg 780 gatttctgca cttgatttat tataaaaaga caaagacata atacttctct atcaatttca 840 gttattgttc ttccttgcgt tattcttctg ttcttctttt tcttttgtca tatataacca 900 taaccaagta atacatattc aaaatggatg cagtaactgg attgctgacc gttccagcta 960 cggctataac tattgggggc actgcggttg cattggctgt tgctttgatt ttttggtatt 1020 tgaagtctta cacgagtgcc agaagatccc aaagcaacca tttgccacgg gtgcctgaag 1080 tgccaggggt tccactcttg ggtaatctgt tgcaattgaa agaaaaaaaa ccatatatga 1140 cttttaccag atgggcggct acttatggac ctatttactc tattaagacc ggtgctacga 1200 gtatggttgt cgtttcctca aatgagattg ctaaggaagc tttggttact cgttttcaat 1260 ctatatcgac taggaacttg agcaaggcct tgaaagtttt gactgctgac aaaactatgg 1320 ttgccatgtc tgattacgac gattatcata agactgttaa aagacatatt ttgactgctg 1380 ttttaggtcc caatgcccaa aaaaagcaca gaatccaccg cgatattatg atggataata 1440 tttcgactca attgcatgaa ttcgttaaaa ataacccaga gcaggaagaa gttgatttga 1500 gaaaaatatt tcagtcagaa ttgtttggtt tggctatgag acaagctttg ggcaaggatg 1560 ttgagtcttt atatgtggaa gatttgaaaa tcactatgaa ccgtgacgag atctttcaag 1620 ttttagttgt tgacccgatg atgggcgcga ttgatgttga ttggagagac ttcttccctt 1680 atcttaaatg ggtcccgaat aaaaagttcg agaacactat tcaacaaatg tacattagaa 1740 gagaagccgt tatgaaatcc ttgatcaagg agcacaagaa gagaatagct tctggagaaa 1800 aattgaattc ttatattgat tacttgttgt ctgaagcaca aactttgacc gaccagcaat 1860 tgttgatgtc tctctgggag ccaattattg aatcttctga tacaactatg gttacgactg 1920 aatgggccat gtacgaactg gctaaaaatc ctaagttgca ggatagattg tatagagata 1980 tcaaatctgt ttgtggttcc gagaaaataa ctgaagagca tttgtctcaa ttgccatata 2040 tcactgcaat tttccatgaa actcttagaa ggcacagtcc agtccctatt atcccattga 2100 gacatgttca cgaagacact gtccttggtg gctaccatgt tcccgctggc actgaattgg 2160 cggttaatat ttatggttgc aatatggata agaacgtttg ggaaaatcca gaagaatgga 2220 accctgaaag atttatgaaa gagaacgaaa ctattgactt tcaaaagact atggcattcg 2280 gtggtggaaa aagagtttgt gctggtagct tgcaggcctt gttgactgca tctattggga 2340 ttggaagaat ggtccaggaa tttgaatgga aattgaaaga tatgactcaa gaagaggtta 2400 atacaatcgg tttgactact caaatgctga gacctttacg agcaataata aaaccaagaa 2460 tttaagatta atataattat ataaaaatat tatcttcttt tctttatatc tagtgttatg 2520 taaaataaat tgatgactac ggaaagcttt tttatattgt ttctttttca ttctgagcca 2580 cttaaatttc gtgaatgttc ttgtaaggga cggtagattt acaagtgata caacaaaaag 2640 caaggcgctt tttctaataa aaagaagaaa agcatttaac aattgaacac ctctatatca 2700 acgaagaata ttactttgtc tctaaatcct tgtaaaatgt gtacgatctc tatatgggtt 2760 actcataagt gtaccgaaga ctgcattgaa agtttatgtt ttttcactgg aggcgtcatt 2820 ttcgcgttga gaagatgttc ttatccaaat ttcaactgtt atatagaaga gcgcgaaagt 2880 ttttccggca agctaaatgg aaaaaggaaa gattattgaa agagaaagaa agaaaaaaaa 2940 aaaatgtaca cccagacatc gggcttccac aatttcggct ctattgtttt ccatctctcg 3000 caacggcggg attcctctat ggcgtgtgat gtctgtatct gttacttaat ccagaaactg 3060 gcacttgacc caactctgcc acgtgggtcg ttttgccatc gacagattgg gagattttca 3120 tagtagaatt cagcatgata gctacgtaaa tgtgttccgc accgtcacaa agtgttttct 3180 actgttcttt cttctttcgt tcattcagtt gagttgagtg agtgctttgt tcaatggatc 3240 ttagctaaaa tgcatatttt ttctcttggt aaatgaatgc ttgtgatgtc ttccaagtga 3300 tttcctttcc ttcccatatg atgctaggta cctttagtgt cttcctaaaa aaaaaaaaag 3360 gctcgccatc aaaacgatat tcgttggctt ttttttctga attataaata ctctttggta 3420 acttttcatt tccaagaacc tcttttttcc agttatatca tggtcccctt tcaaagttat 3480 tctctactct ttttcatatt cattcttttt catcctttgg ttttttattc ttaacttgtt 3540 tattattctc tcttgtttct atttacaaga caccaatcaa aacaaataaa acatcatcac 3600 aatgccgttt ggaatagaca acaccgactt cactgtcctg gcggggctag tgcttgccgt 3660 gctactgtac gtaaagagaa actccatcaa ggaactgctg atgtccgatg acggagatat 3720 cacagctgtc agctcgggca acagagacat tgctcaggtg gtgaccgaaa acaacaagaa 3780 ctacttggtg ttgtatgcgt cgcagactgg gactgccgag gattacgcca aaaagttttc 3840 caaggagctg gtggccaagt tcaacctaaa cgtgatgtgc gcagatgttg agaactacga 3900 ctttgagtcg ctaaacgatg tgcccgtcat agtctcgatt tttatctcta catatggtga 3960 aggagacttc cccgacgggg cggtcaactt tgaagacttt atttgtaatg cggaagcggg 4020 tgcactatcg aacctgaggt ataatatgtt tggtctggga aattctactt atgaattctt 4080 taatggtgcc gccaagaagg ccgagaagca tctctccgcc gcgggcgcta tcagactagg 4140 caagctcggt gaagctgatg atggtgcagg aactacagac gaagattaca tggcctggaa 4200 ggactccatc ctggaggttt tgaaagacga actgcatttg gacgaacagg aagccaagtt 4260 cacctctcaa ttccagtaca ctgtgttgaa cgaaatcact gactccatgt cgcttggtga 4320 accctctgct cactatttgc cctcgcatca gttgaaccgc aacgcagacg gcatccaatt 4380 gggtcccttc gatttgtctc aaccgtatat tgcacccatc gtgaaatctc gcgaactgtt 4440 ctcttccaat gaccgtaatt gcatccactc tgaatttgac ttgtccggct ctaacatcaa 4500 gtactccact ggtgaccatc ttgctgtttg gccttccaac ccattggaaa aggtcgaaca 4560 gttcttatcc atattcaacc tggaccctga aaccattttt gacttgaagc ccctggatcc 4620 caccgtcaaa gtgcccttcc caacgccaac tactattggc gctgctatta aacactattt 4680 ggaaattaca ggacctgtct ccagacaatt gttttcatct ttgattcagt tcgcccccaa 4740 cgctgacgtc aaggaaaaat tgactctgct ttcgaaagac aaggaccaat tcgccgtcga 4800 gataacctcc aaatatttca acatcgcaga tgctctgaaa tatttgtctg atggcgccaa 4860 atgggacacc gtacccatgc aattcttggt cgaatcagtt ccccaaatga ctcctcgtta 4920 ctactctatc tcttcctctt ctctgtctga aaagcaaacc gtccatgtca cctccattgt 4980 ggaaaacttt cctaacccag aattgcctga tgctcctcca gttgttggtg ttacgactaa 5040 cttgttaaga aacattcaat tggctcaaaa caatgttaac attgccgaaa ctaacctacc 5100 tgttcactac gatttaaatg gcccacgtaa acttttcgcc aattacaaat tgcccgtcca 5160 cgttcgtcgt tctaacttca gattgccttc caacccttcc accccagtta tcatgatcgg 5220 tccaggtacc ggtgttgccc cattccgtgg gtttatcaga gagcgtgtcg cgttcctcga 5280 atcacaaaag aagggcggta acaacgtttc gctaggtaag catatactgt tttatggatc 5340 ccgtaacact gatgatttct tgtaccagga cgaatggcca gaatacgcca aaaaattgga 5400 tggttcgttc gaaatggtcg tggcccattc caggttgcca aacaccaaaa aagtttatgt 5460 tcaagataaa ttaaaggatt acgaagacca agtatttgaa atgattaaca acggtgcatt 5520 tatctacgtc tgtggtgatg caaagggtat ggccaagggt gtgtcaaccg cattggttgg 5580 catcttatcc cgtggtaaat ccattaccac tgatgaagca acagagctaa tcaagatgct 5640 caagacttca ggtagatacc aagaagatgt ctggtaatca gcccactgat caagccttcg 5700 gcgcggttgt tcaaccacac gatctgtatc aaagaaaaat aagttagata accaaaaaaa 5760 aaaaaaattt catactcact ataagaaatc atacgcagtt caacttttgc ttttacatac 5820 aattttatct atatattcgt gcttctgcga tgtccttatt tatccgatga aggtatgtaa 5880 gaataaaaaa gaatatatac tccacatgac atacgaaata tacgtattta ttgttctgta 5940 tggaataaca gcgattacat aaagatgaca tgttacttct ttattcaaat taatcttgac 6000 gtgcaagggc ctgcttgtta tttcatcgga caatcccaac atcactttac acgaaagcct 6060 tagaagttta ttatttgttt taagttggac tatagtgatg taggtagttt cttaggaagc 6120 agttgagtag ctgatttttg agataagaac ctggtgtaat caatctataa acagcctaga 6180 atctttttaa gcaaatttac ttttacattt atctctatct tctttcttac aagaagttat 6240 tttcattaca aaaggacatt aaatacacta aattttcaat ctttacattg ttggaaagcc 6300 tcgttgtctt ttaagatttt ataagcattg attttttttt tcaataattt tccgttcccc 6360 ttaacacata ctatgtataa atgtcattga gtcatctcac tttagatcaa tattatgaaa 6420 tacagtgcaa cgaacttgaa gcgatacgtt ccatttatat ggatgacttt actgacttaa 6480 ctaaaagaaa gtctagctgg gataagcagc cacagattat attcgaaatt acgcttcgat 6540 ctgttgacaa agagccggtt g 6561 <210> 7 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Forward PCR primer for DPPF1 polynucleotide sequence <400> 7 cgccgagggt attttacttc c 21 <210> 8 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Reverse PCR primer for DPPF1 polynucleotide sequence <400> 8 gcactcgaaa cttcaggttc 20 <210> 9 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Forward PCR primer for DPPF2 polynucleotide sequence <400> 9 ggtgttatcg ttgctggtgg 20 <210> 10 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Reverse PCR primer for DPPF2 polynucleotide sequence <400> 10 gatagtacta gagacacata ttc 23 <210> 11 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Forward PCR primer for DPPF3 polynucleotide sequence <400> 11 ggcactggtc actcttttgg 20 <210> 12 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Reverse PCR primer for DPPF3 polynucleotide sequence <400> 12 ctgtccttgc ctggtggg 18 <210> 13 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Forward PCR primer for DPPF4 polynucleotide sequence <400> 13 ctctcgccgc tcgccatc 18 <210> 14 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Reverse PCR primer for DPPF4 polynucleotide sequence <400> 14 caaccggctc tttgtcaaca g 21 <210> 15 <211> 335 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of eranylgeranyl pyrophosphate synthase (BTS1) of Saccharomyces cerevisiae <400> 15 Met Glu Ala Lys Ile Asp Glu Leu Ile Asn Asn Asp Pro Val Trp Ser 1 5 10 15 Ser Gln Asn Glu Ser Leu Ile Ser Lys Pro Tyr Asn His Ile Leu Leu 20 25 30 Lys Pro Gly Lys Asn Phe Arg Leu Asn Leu Ile Val Gln Ile Asn Arg 35 40 45 Val Met Asn Leu Pro Lys Asp Gln Leu Ala Ile Val Ser Gln Ile Val 50 55 60 Glu Leu Leu His Asn Ser Ser Leu Leu Ile Asp Asp Ile Glu Asp Asn 65 70 75 80 Ala Pro Leu Arg Arg Gly Gln Thr Thr Ser His Leu Ile Phe Gly Val 85 90 95 Pro Ser Thr Ile Asn Thr Ala Asn Tyr Met Tyr Phe Arg Ala Met Gln 100 105 110 Leu Val Ser Gln Leu Thr Thr Lys Glu Pro Leu Tyr His Asn Leu Ile 115 120 125 Thr Ile Phe Asn Glu Glu Leu Ile Asn Leu His Arg Gly Gln Gly Leu 130 135 140 Asp Ile Tyr Trp Arg Asp Phe Leu Pro Glu Ile Ile Pro Thr Gln Glu 145 150 155 160 Met Tyr Leu Asn Met Val Met Asn Lys Thr Gly Gly Leu Phe Arg Leu 165 170 175 Thr Leu Arg Leu Met Glu Ala Leu Ser Pro Ser Ser His His Gly His 180 185 190 Ser Leu Val Pro Phe Ile Asn Leu Leu Gly Ile Ile Tyr Gln Ile Arg 195 200 205 Asp Asp Tyr Leu Asn Leu Lys Asp Phe Gln Met Ser Ser Glu Lys Gly 210 215 220 Phe Ala Glu Asp Ile Thr Glu Gly Lys Leu Ser Phe Pro Ile Val His 225 230 235 240 Ala Leu Asn Phe Thr Lys Thr Lys Gly Gln Thr Glu Gln His Asn Glu 245 250 255 Ile Leu Arg Ile Leu Leu Leu Arg Thr Ser Asp Lys Asp Ile Lys Leu 260 265 270 Lys Leu Ile Gln Ile Leu Glu Phe Asp Thr Asn Ser Leu Ala Tyr Thr 275 280 285 Lys Asn Phe Ile Asn Gln Leu Val Asn Met Ile Lys Asn Asp Asn Glu 290 295 300 Asn Lys Tyr Leu Pro Asp Leu Ala Ser His Ser Asp Thr Ala Thr Asn 305 310 315 320 Leu His Asp Glu Leu Leu Tyr Ile Ile Asp His Leu Ser Glu Leu 325 330 335 <210> 16 <211> 376 <212> PRT <213> Artificial Sequence <220> <223> GGDP synthase (crtE) of Xanthophyllomyces dendrorhous <400> 16 Met Asp Tyr Ala Asn Ile Leu Thr Ala Ile Pro Leu Glu Phe Thr Pro 1 5 10 15 Gln Asp Asp Ile Val Leu Leu Glu Pro Tyr His Tyr Leu Gly Lys Asn 20 25 30 Pro Gly Lys Glu Ile Arg Ser Gln Leu Ile Glu Ala Phe Asn Tyr Trp 35 40 45 Leu Asp Val Lys Lys Glu Asp Leu Glu Val Ile Gln Asn Val Val Gly 50 55 60 Met Leu His Thr Ala Ser Leu Leu Met Asp Asp Val Glu Asp Ser Ser 65 70 75 80 Val Leu Arg Arg Gly Ser Pro Val Ala His Leu Ile Tyr Gly Ile Pro 85 90 95 Gln Thr Ile Asn Thr Ala Asn Tyr Val Tyr Phe Leu Ala Tyr Gln Glu 100 105 110 Ile Phe Lys Leu Arg Pro Thr Pro Ile Pro Met Pro Val Ile Pro Pro 115 120 125 Ser Ser Ala Ser Leu Gln Ser Ser Val Ser Ser Ala Ser Ser Ser Ser 130 135 140 Ser Ala Ser Ser Glu Asn Gly Gly Thr Ser Thr Pro Asn Ser Gln Ile 145 150 155 160 Pro Phe Ser Lys Asp Thr Tyr Leu Asp Lys Val Ile Thr Asp Glu Met 165 170 175 Leu Ser Leu His Arg Gly Gln Gly Leu Glu Leu Phe Trp Arg Asp Ser 180 185 190 Leu Thr Cys Pro Ser Glu Glu Glu Tyr Val Lys Met Val Leu Gly Lys 195 200 205 Thr Gly Gly Leu Phe Arg Ile Ala Val Arg Leu Met Met Ala Lys Ser 210 215 220 Glu Cys Asp Ile Asp Phe Val Gln Leu Val Asn Leu Ile Ser Ile Tyr 225 230 235 240 Phe Gln Ile Arg Asp Asp Tyr Met Asn Leu Gln Ser Ser Glu Tyr Ala 245 250 255 His Asn Lys Asn Phe Ala Glu Asp Leu Thr Glu Gly Lys Phe Ser Phe 260 265 270 Pro Thr Ile His Ser Ile His Ala Asn Pro Ser Ser Arg Leu Val Ile 275 280 285 Asn Thr Leu Gln Lys Lys Ser Thr Ser Pro Glu Ile Leu His His Cys 290 295 300 Val Asn Tyr Met Arg Thr Glu Thr His Ser Phe Glu Tyr Thr Gln Glu 305 310 315 320 Val Leu Asn Thr Leu Ser Gly Ala Leu Glu Arg Glu Leu Gly Arg Leu 325 330 335 Gln Gly Glu Phe Ala Glu Ala Asn Ser Lys Ile Asp Leu Gly Asp Val 340 345 350 Glu Ser Glu Gly Arg Thr Gly Lys Asn Val Lys Leu Glu Ala Ile Leu 355 360 365 Lys Lys Leu Ala Asp Ile Pro Leu 370 375 <210> 17 <211> 352 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of GGPP synthase ERG20F96C from Saccharomyces cerevisiae <400> 17 Met Ala Ser Glu Lys Glu Ile Arg Arg Glu Arg Phe Leu Asn Val Phe 1 5 10 15 Pro Lys Leu Val Glu Glu Leu Asn Ala Ser Leu Leu Ala Tyr Gly Met 20 25 30 Pro Lys Glu Ala Cys Asp Trp Tyr Ala His Ser Leu Asn Tyr Asn Thr 35 40 45 Pro Gly Gly Lys Leu Asn Arg Gly Leu Ser Val Val Asp Thr Tyr Ala 50 55 60 Ile Leu Ser Asn Lys Thr Val Glu Gln Leu Gly Gln Glu Glu Tyr Glu 65 70 75 80 Lys Val Ala Ile Leu Gly Trp Cys Ile Glu Leu Leu Gln Ala Tyr Cys 85 90 95 Leu Val Ala Asp Asp Met Met Asp Lys Ser Ile Thr Arg Arg Gly Gln 100 105 110 Pro Cys Trp Tyr Lys Val Pro Glu Val Gly Glu Ile Ala Ile Asn Asp 115 120 125 Ala Phe Met Leu Glu Ala Ala Ile Tyr Lys Leu Leu Lys Ser His Phe 130 135 140 Arg Asn Glu Lys Tyr Tyr Ile Asp Ile Thr Glu Leu Phe His Glu Val 145 150 155 160 Thr Phe Gln Thr Glu Leu Gly Gln Leu Met Asp Leu Ile Thr Ala Pro 165 170 175 Glu Asp Lys Val Asp Leu Ser Lys Phe Ser Leu Lys Lys His Ser Phe 180 185 190 Ile Val Thr Phe Lys Thr Ala Tyr Tyr Ser Phe Tyr Leu Pro Val Ala 195 200 205 Leu Ala Met Tyr Val Ala Gly Ile Thr Asp Glu Lys Asp Leu Lys Gln 210 215 220 Ala Arg Asp Val Leu Ile Pro Leu Gly Glu Tyr Phe Gln Ile Gln Asp 225 230 235 240 Asp Tyr Leu Asp Cys Phe Gly Thr Pro Glu Gln Ile Gly Lys Ile Gly 245 250 255 Thr Asp Ile Gln Asp Asn Lys Cys Ser Trp Val Ile Asn Lys Ala Leu 260 265 270 Glu Leu Ala Ser Ala Glu Gln Arg Lys Thr Leu Asp Glu Asn Tyr Gly 275 280 285 Lys Lys Asp Ser Val Ala Glu Ala Lys Cys Lys Lys Ile Phe Asn Asp 290 295 300 Leu Lys Ile Glu Gln Leu Tyr His Glu Tyr Glu Glu Ser Ile Ala Lys 305 310 315 320 Asp Leu Lys Ala Lys Ile Ser Gln Val Asp Glu Ser Arg Gly Phe Lys 325 330 335 Ala Asp Val Leu Thr Ala Phe Leu Asn Lys Val Tyr Lys Arg Ser Lys 340 345 350 <210> 18 <211> 371 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of MBP <400> 18 Met Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile Asn Gly Asp Lys 1 5 10 15 Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe Glu Lys Asp Thr 20 25 30 Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu Glu Glu Lys Phe 35 40 45 Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile Ile Phe Trp Ala 50 55 60 His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu Leu Ala Glu Ile 65 70 75 80 Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro Phe Thr Trp Asp 85 90 95 Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro Ile Ala Val Glu 100 105 110 Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro Asn Pro Pro Lys 115 120 125 Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu Lys Ala Lys Gly 130 135 140 Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr Phe Thr Trp Pro 145 150 155 160 Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr Glu Asn Gly Lys 165 170 175 Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly Ala Lys Ala Gly 180 185 190 Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His Met Asn Ala Asp 195 200 205 Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys Gly Glu Thr Ala 210 215 220 Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile Asp Thr Ser Lys 225 230 235 240 Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys Gly Gln Pro Ser 245 250 255 Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn Ala Ala Ser Pro 260 265 270 Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr Leu Leu Thr Asp 275 280 285 Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu Gly Ala Val Ala 290 295 300 Leu Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro Arg Ile Ala Ala 305 310 315 320 Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro Asn Ile Pro Gln 325 330 335 Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val Ile Asn Ala Ala 340 345 350 Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp Ala Gln Thr Arg 355 360 365 Ile Thr Lys 370 <210> 19 <211> 61 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of CUP1 <400> 19 Met Phe Ser Glu Leu Ile Asn Phe Gln Asn Glu Gly His Glu Cys Gln 1 5 10 15 Cys Gln Cys Gly Ser Cys Lys Asn Asn Glu Gln Cys Gln Lys Ser Cys 20 25 30 Ser Cys Pro Thr Gly Cys Asn Ser Asp Asp Lys Cys Pro Cys Gly Asn 35 40 45 Lys Ser Glu Glu Thr Lys Lys Ser Cys Cys Ser Gly Lys 50 55 60 <210> 20 <211> 283 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of tsf <400> 20 Met Ala Glu Ile Thr Ala Ser Leu Val Lys Glu Leu Arg Glu Arg Thr 1 5 10 15 Gly Ala Gly Met Met Asp Cys Lys Lys Ala Leu Thr Glu Ala Asn Gly 20 25 30 Asp Ile Glu Leu Ala Ile Glu Asn Met Arg Lys Ser Gly Ala Ile Lys 35 40 45 Ala Ala Lys Lys Ala Gly Asn Val Ala Ala Asp Gly Val Ile Lys Thr 50 55 60 Lys Ile Asp Gly Asn Tyr Gly Ile Ile Leu Glu Val Asn Cys Gln Thr 65 70 75 80 Asp Phe Val Ala Lys Asp Ala Gly Phe Gln Ala Phe Ala Asp Lys Val 85 90 95 Leu Asp Ala Ala Val Ala Gly Lys Ile Thr Asp Val Glu Val Leu Lys 100 105 110 Ala Gln Phe Glu Glu Glu Arg Val Ala Leu Val Ala Lys Ile Gly Glu 115 120 125 Asn Ile Asn Ile Arg Arg Val Ala Ala Leu Glu Gly Asp Val Leu Gly 130 135 140 Ser Tyr Gln His Gly Ala Arg Ile Gly Val Leu Val Ala Ala Lys Gly 145 150 155 160 Ala Asp Glu Glu Leu Val Lys His Ile Ala Met His Val Ala Ala Ser 165 170 175 Lys Pro Glu Phe Ile Lys Pro Glu Asp Val Ser Ala Glu Val Val Glu 180 185 190 Lys Glu Tyr Gln Val Gln Leu Asp Ile Ala Met Gln Ser Gly Lys Pro 195 200 205 Lys Glu Ile Ala Glu Lys Met Val Glu Gly Arg Met Lys Lys Phe Thr 210 215 220 Gly Glu Val Ser Leu Thr Gly Gln Pro Phe Val Met Glu Pro Ser Lys 225 230 235 240 Thr Val Gly Gln Leu Leu Lys Glu His Asn Ala Glu Val Thr Gly Phe 245 250 255 Ile Arg Phe Glu Val Gly Glu Gly Ile Glu Lys Val Glu Thr Asp Phe 260 265 270 Ala Ala Glu Val Ala Ala Met Ser Lys Gln Ser 275 280 <210> 21 <211> 481 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of UGT85C2 <400> 21 Met Asp Ala Met Ala Thr Thr Glu Lys Lys Pro His Val Ile Phe Ile 1 5 10 15 Pro Phe Pro Ala Gln Ser His Ile Lys Ala Met Leu Lys Leu Ala Gln 20 25 30 Leu Leu His His Lys Gly Leu Gln Ile Thr Phe Val Asn Thr Asp Phe 35 40 45 Ile His Asn Gln Phe Leu Glu Ser Ser Gly Pro His Cys Leu Asp Gly 50 55 60 Ala Pro Gly Phe Arg Phe Glu Thr Ile Pro Asp Gly Val Ser His Ser 65 70 75 80 Pro Glu Ala Ser Ile Pro Ile Arg Glu Ser Leu Leu Arg Ser Ile Glu 85 90 95 Thr Asn Phe Leu Asp Arg Phe Ile Asp Leu Val Thr Lys Leu Pro Asp 100 105 110 Pro Pro Thr Cys Ile Ile Ser Asp Gly Phe Leu Ser Val Phe Thr Ile 115 120 125 Asp Ala Ala Lys Lys Leu Gly Ile Pro Val Met Met Tyr Trp Thr Leu 130 135 140 Ala Ala Cys Gly Phe Met Gly Phe Tyr His Ile His Ser Leu Ile Glu 145 150 155 160 Lys Gly Phe Ala Pro Leu Lys Asp Ala Ser Tyr Leu Thr Asn Gly Tyr 165 170 175 Leu Asp Thr Val Ile Asp Trp Val Pro Gly Met Glu Gly Ile Arg Leu 180 185 190 Lys Asp Phe Pro Leu Asp Trp Ser Thr Asp Leu Asn Asp Lys Val Leu 195 200 205 Met Phe Thr Thr Glu Ala Pro Gln Arg Ser His Lys Val Ser His His 210 215 220 Ile Phe His Thr Phe Asp Glu Leu Glu Pro Ser Ile Ile Lys Thr Leu 225 230 235 240 Ser Leu Arg Tyr Asn His Ile Tyr Thr Ile Gly Pro Leu Gln Leu Leu 245 250 255 Leu Asp Gln Ile Pro Glu Glu Lys Lys Gln Thr Gly Ile Thr Ser Leu 260 265 270 His Gly Tyr Ser Leu Val Lys Glu Glu Pro Glu Cys Phe Gln Trp Leu 275 280 285 Gln Ser Lys Glu Pro Asn Ser Val Val Tyr Val Asn Phe Gly Ser Thr 290 295 300 Thr Val Met Ser Leu Glu Asp Met Thr Glu Phe Gly Trp Gly Leu Ala 305 310 315 320 Asn Ser Asn His Tyr Phe Leu Trp Ile Ile Arg Ser Asn Leu Val Ile 325 330 335 Gly Glu Asn Ala Val Leu Pro Pro Glu Leu Glu Glu His Ile Lys Lys 340 345 350 Arg Gly Phe Ile Ala Ser Trp Cys Ser Gln Glu Lys Val Leu Lys His 355 360 365 Pro Ser Val Gly Gly Phe Leu Thr His Cys Gly Trp Gly Ser Thr Ile 370 375 380 Glu Ser Leu Ser Ala Gly Val Pro Met Ile Cys Trp Pro Tyr Ser Trp 385 390 395 400 Asp Gln Leu Thr Asn Cys Arg Tyr Ile Cys Lys Glu Trp Glu Val Gly 405 410 415 Leu Glu Met Gly Thr Lys Val Lys Arg Asp Glu Val Lys Arg Leu Val 420 425 430 Gln Glu Leu Met Gly Glu Gly Gly His Lys Met Arg Asn Lys Ala Lys 435 440 445 Asp Trp Lys Glu Lys Ala Arg Ile Ala Ile Ala Pro Asn Gly Ser Ser 450 455 460 Ser Leu Asn Ile Asp Lys Met Val Lys Glu Ile Thr Val Leu Ala Arg 465 470 475 480 Asn <210> 22 <211> 1446 <212> DNA <213> Artificial Sequence <220> <223> Nucleotide sequence of UGT85C2 <400> 22 atggacgcta tggccactac cgagaaaaaa cctcatgtta tattcattcc gtttccagca 60 caatctcata tcaaagctat gttgaaactg gcgcaattgt tgcatcataa aggtcttcag 120 attaccttcg ttaacacaga ctttattcac aatcaatttt tggaatcttc tggtccacat 180 tgtttggatg gggcaccagg ttttaggttc gagacaattc cagacggtgt gtctcactct 240 cccgaagctt ctattccaat aagggaaagc ttgttgagat ctatcgaaac taactttttg 300 gatcgtttta tcgacttggt gacgaaatta ccagacccgc caacttgtat tatttctgat 360 ggctttttgt ccgtctttac tattgatgca gctaaaaagt tgggtattcc agtaatgatg 420 tattggactt tggctgcttg tggttttatg ggattctatc atattcattc tctgattgag 480 aagggttttg caccattgaa agatgcctct tacttgacta acggttacct tgataccgtc 540 attgattggg tcccaggtat ggaaggtatc agattgaagg attttccttt agattggtct 600 actgacttga acgataaggt cttgatgttt acaacggaag ctcctcaacg ttctcacaaa 660 gtatctcatc acattttcca tactttcgac gaattggaac ctagtataat aaaaactttg 720 tctctgagat ataatcatat ctataccatt ggaccattgc agttgttgtt ggatcagatt 780 ccagaggaaa aaaaacaaac tggaattact tctttgcacg gttactcctt ggttaaagaa 840 gaaccagaat gctttcagtg gttgcaatct aaggaaccga atagtgttgt ttatgttaac 900 tttggttcta ctacggttat gtctttggag gatatgacag agttcggatg gggtctcgca 960 aactctaatc actacttctt gtggatcata agaagtaatt tggttatagg tgaaaatgct 1020 gtgttgcccc ccgagctcga agaacatatt aaaaagagag gattcattgc ctcttggtgt 1080 tctcaagaga aagtgttgaa acatccatct gttggtggtt ttttgactca ctgtggttgg 1140 ggctctacta ttgaatcttt gtctgccggc gttcccatga tttgttggcc atattcttgg 1200 gatcaattga ccaattgccg ctacatctgc aaggaatggg aagtaggcct ggaaatgggt 1260 actaaggtaa aaagagacga ggttaaaaga ttggtacaag aattgatggg tgaagggggt 1320 cataagatgc gaaataaggc taaagattgg aaggaaaaag caagaatagc aatagcgcca 1380 aacggttcct cttctctaaa tatagataag atggtcaaag aaataaccgt gttggctagg 1440 aattaa 1446 <210> 23 <211> 460 <212> PRT <213> Artificial Sequence <220> <223> Nucleotide sequence of UGT74G1 <400> 23 Met Ala Glu Gln Gln Lys Ile Lys Lys Ser Pro His Val Leu Leu Ile 1 5 10 15 Pro Phe Pro Leu Gln Gly His Ile Asn Pro Phe Ile Gln Phe Gly Lys 20 25 30 Arg Leu Ile Ser Lys Gly Val Lys Thr Thr Leu Val Thr Thr Ile His 35 40 45 Thr Leu Asn Ser Thr Leu Asn His Ser Asn Thr Thr Thr Thr Ser Ile 50 55 60 Glu Ile Gln Ala Ile Ser Asp Gly Cys Asp Glu Gly Gly Phe Met Ser 65 70 75 80 Ala Gly Glu Ser Tyr Leu Glu Thr Phe Lys Gln Val Gly Ser Lys Ser 85 90 95 Leu Ala Asp Leu Ile Lys Lys Leu Gln Ser Glu Gly Thr Thr Ile Asp 100 105 110 Ala Ile Ile Tyr Asp Ser Met Thr Glu Trp Val Leu Asp Val Ala Ile 115 120 125 Glu Phe Gly Ile Asp Gly Gly Ser Phe Phe Thr Gln Ala Cys Val Val 130 135 140 Asn Ser Leu Tyr Tyr His Val His Lys Gly Leu Ile Ser Leu Pro Leu 145 150 155 160 Gly Glu Thr Val Ser Val Pro Gly Phe Pro Val Leu Gln Arg Trp Glu 165 170 175 Thr Pro Leu Ile Leu Gln Asn His Glu Gln Ile Gln Ser Pro Trp Ser 180 185 190 Gln Met Leu Phe Gly Gln Phe Ala Asn Ile Asp Gln Ala Arg Trp Val 195 200 205 Phe Thr Asn Ser Phe Tyr Lys Leu Glu Glu Glu Val Ile Glu Trp Thr 210 215 220 Arg Lys Ile Trp Asn Leu Lys Val Ile Gly Pro Thr Leu Pro Ser Met 225 230 235 240 Tyr Leu Asp Lys Arg Leu Asp Asp Asp Lys Asp Asn Gly Phe Asn Leu 245 250 255 Tyr Lys Ala Asn His His Glu Cys Met Asn Trp Leu Asp Asp Lys Pro 260 265 270 Lys Glu Ser Val Val Tyr Val Ala Phe Gly Ser Leu Val Lys His Gly 275 280 285 Pro Glu Gln Val Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val 290 295 300 Asn Phe Leu Trp Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu 305 310 315 320 Asn Leu Ser Glu Val Ile Lys Thr Gly Lys Gly Leu Ile Val Ala Trp 325 330 335 Cys Lys Gln Leu Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val 340 345 350 Thr His Cys Gly Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val 355 360 365 Pro Val Val Ala Met Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys 370 375 380 Leu Leu Asp Glu Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu 385 390 395 400 Asn Gly Ile Val Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile 405 410 415 Met Glu Glu Glu Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp 420 425 430 Lys Asp Leu Ala Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn 435 440 445 Asp Ile Val Glu Phe Val Ser Glu Leu Ile Lys Ala 450 455 460

Claims (20)

  1. Jungermannia subulata 에서 유래되며, 서열번호 1의 아미노산 서열로 이루어지는 코파릴 디포스페이트 신타제 (copalyl diphosphate synthase, CDPS) / 카우렌 신타제 (kaurene synthase, KS) (CDPS/KS) 이중 기능 효소 단백질을 암호화하는 폴리뉴클레오타이드, 및
    상기 CDPS/KS 이중 기능 효소 단백질을 암호화하는 폴리뉴클레오타이드에 직접 또는 링커를 통해 연결되며 상기 효소 단백질의 발현을 증가시키는, 말토오스-결합 단백질 (maltose-binding protein, MBP), CUP1 및 tsf 유전자로 이루어진 군에서 선택되는 1종 이상의 유전자를 함유하는 조절 유전자를 포함하고,
    제라닐제라닐 피로포스페이트 (geranylgeranyl pyrophosphate, GGPP) 신타제 (GGPP synthase)를 이용하여 파네실 피로포스페이트 (farnesyl pyrophosphate, FPP)로부터 GGPP를 합성하는 유전자 구조체를 추가로 포함하고,
    상기 GGPP synthase는 서열번호 16의 아미노산 서열을 포함하는 XdCrtE 및 서열번호 17의 아미노산 서열을 포함하는 ERG20F96C로 이루어지는 군에서 선택된 1종 또는 2종 이상의 융합 단백질인, 카우렌 생산용 유전자 구조체.
  2. 제1항에 있어서, 코파릴 디포스페이트 신타제 (copalyl diphosphate synthase, CDPS) / 카우렌 신타제 (kaurene synthase, KS) (CDPS/KS) 이중 기능 효소 단백질은 서열번호 2의 염기서열로 이루어지는 폴리뉴클레오타이드에 의해 암호화되는 것인 카우렌 생산용 유전자 구조체.
  3. 제1항에 있어서, 상기 조절 유전자는 서열번호 18의 염기서열을 포함하는 말토오스-결합 단백질 (maltose-binding protein, MBP) 유전자, 서열번호 19의 염기서열을 포함하는 CUP1 유전자 또는 서열번호 20의 염기서열을 포함하는 tsf 유전자인, 카우렌 생산용 유전자 구조체.
  4. 제1항에 있어서, 효모 유래 GAL 프로모터를 추가로 포함하는, 카우렌 생산용 유전자 구조체.
  5. 제1항에 따른 카우렌 생산용 유전자 구조체, 및
    카우렌으로부터 카우렌산 (kaurenoic acid)을 합성하는 카우렌 산화효소 (Kaurene oxidase, KO)의 암호화 유전자, 카우렌으로부터 스테비올을 합성하는 카우렌산 히드록시라제 (Kaurenoic acid hydroxylase, KAH) 및 시토크롬 P450 환원효소 (CPR)의 암호화 유전자를 포함하는, 스테비올의 생합성 유전자 구조체.
  6. 제5항에 있어서, 상기 카우렌 생산용 유전자 구조체의 코파릴 디포스페이트 신타제 (copalyl diphosphate synthase, CDPS) / 카우렌 신타제 (kaurene synthase, KS) (CDPS/KS) 이중 기능 효소 단백질은 서열번호 2의 염기서열로 이루어지는 폴리뉴클레오타이드에 의해 암호화되는, 스테비올의 생합성 유전자 구조체.
  7. 제5항에 있어서, 상기 카우렌 생산용 유전자 구조체의 조절 유전자는 서열번호 18의 염기서열을 포함하는 말토오스-결합 단백질 (maltose-binding protein, MBP) 유전자, 서열번호 19의 염기서열을 포함하는 CUP1 유전자 또는 서열번호 20의 염기서열을 포함하는 tsf 유전자인, 스테비올의 생합성 유전자 구조체.
  8. 제5항에 있어서, 상기 카우렌 생산용 유전자 구조체에 효모 유래 GAL 프로모터를 추가로 포함하는, 스테비올의 생합성 유전자 구조체.
  9. 제5항에 있어서, 상기 카우렌 산화효소 (Kaurene oxidase, KO) 유전자는 S. rebaudiana 유래의 KO 유전자 (SrKO), 상기 카우렌산 히드록시라제 (Kaurenoic acid hydroxylase, KAH)는 S. rebaudiana 유래의 KAH 유전자(SrKAH), 또는
    상기 시토크롬 P450 환원효소 (CPR) 유전자는 Arabidopsis thaliana 유래 CPR 유전자 또는 S.cereviiae 유래 CPR 유전자 (yCPR)인 스테비올의 생합성 유전자 구조체.
  10. 제1항에 따른 카우렌 생산용 유전자 구조체,
    카우렌으로부터 카우렌산(kaurenoic acid)를 합성하는 카우렌 산화효소 (Kaurene oxidase, KO) 암호화 유전자, 카우렌산으로부터 스테비올을 합성하는 카우렌산 히드록시라제 (Kaurenoic acid hydroxylase, KAH) 및 시토크롬 P450 환원효소(CPR) 암호화 유전자를 포함하는 스테비올의 생합성 유전자 구조체, 및
    스테비올에 글루코오스를 전달하는 효소의 암호화 유전자를 포함하는, 스테비올-배당체 생합성 유전자 구조체.
  11. 제10항에 있어서, 상기 카우렌 생산용 유전자 구조체의 코파릴 디포스페이트 신타제 (copalyl diphosphate synthase, CDPS) / 카우렌 신타제 (kaurene synthase, KS) (CDPS/KS) 이중 기능 효소 단백질은 서열번호 2의 염기서열로 이루어지는 폴리뉴클레오타이드에 의해 암호화되는, 스테비올-배당체 생합성 유전자 구조체.
  12. 제10항에 있어서, 상기 카우렌 생산용 유전자 구조체의 조절 유전자는 서열번호 18의 염기서열을 포함하는 말토오스-결합 단백질 (maltose-binding protein, MBP) 유전자, 서열번호 19의 염기서열을 포함하는 CUP1 유전자 또는 서열번호 20의 염기서열을 포함하는 tsf 유전자인, 스테비올-배당체 생합성 유전자 구조체.
  13. 제10항에 있어서, 상기 카우렌 생산용 유전자 구조체에 효모 유래 GAL 프로모터를 추가로 포함하는, 스테비올-배당체 생합성 유전자 구조체.
  14. 제10항에 있어서, 상기 KO 유전자는 S. rebaudiana 유래의 카우렌 산화효소 (Kaurene oxidase, KO) 유전자 (SrKO), 상기 카우렌산 히드록시라제 (Kaurenoic acid hydroxylase, KAH) 유전자 (SrKAH), 또는
    상기 CPR 유전자는 Arabidopsis thaliana 유래 시토크롬 P450 환원효소 (CPR) 유전자 또는 S.cereviiae 유래 CPR 유전자 (yCPR)인 스테비올-배당체 생합성 유전자 구조체.
  15. 제10항에 있어서, 상기 스테비올에 글루코오스를 전달하는 효소의 암호화 유전자는 UGT85C2 효소의 암호화 유전자인, 스테비올-배당체 생합성 유전자 구조체.
  16. 제1항 내지 제15항 중 어느 한 항에 따른 유전자 구조체를 포함하는, 재조합 숙주세포.
  17. 제16항에 있어서, 상기 재조합 숙주가 식물 세포, 포유동물 세포, 곤충 세포, 진균류 세포 또는 박테리아 세포를 포함하는 재조합 숙주 세포.
  18. 제17항에 있어서, 상기 진균류 세포가 효모 세포인 재조합 숙주 세포.
  19. 제16항에 따른 재조합 숙주세포의 균체, 상기 재조합 숙주 세포의 배양물, 또는 상기 재조합 숙주 세포의 배양물에서 얻어지는 추출물을 포함하는, 스테비올 배당체 또는 이의 전구체 생산용 조성물.
  20. 제19항에 있어서, 상기 스테비올 전구체는 파네실 피로포스페이트 (farnesyl pyrophosphate, FPP), 제라닐제라닐 피로포스페이트 (geranylgeranyl pyrophosphate, GGPP), 코파릴 피로포스페이트 (copalyl pyrophosphate, CPP), 카우렌 및 카우레노익산 (kaurnoic acid)으로 이루어지는 군에서 선택된 1종 이상인 조성물.
KR1020190135842A 2019-10-29 2019-10-29 개선된 스테비올 배당체 화합물 또는 이의 전구체의 생산 KR102379608B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190135842A KR102379608B1 (ko) 2019-10-29 2019-10-29 개선된 스테비올 배당체 화합물 또는 이의 전구체의 생산

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190135842A KR102379608B1 (ko) 2019-10-29 2019-10-29 개선된 스테비올 배당체 화합물 또는 이의 전구체의 생산

Publications (2)

Publication Number Publication Date
KR20210051058A KR20210051058A (ko) 2021-05-10
KR102379608B1 true KR102379608B1 (ko) 2022-03-29

Family

ID=75918148

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190135842A KR102379608B1 (ko) 2019-10-29 2019-10-29 개선된 스테비올 배당체 화합물 또는 이의 전구체의 생산

Country Status (1)

Country Link
KR (1) KR102379608B1 (ko)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3128532A1 (en) * 2011-08-08 2013-02-14 Evolva Sa Recombinant production of steviol glycosides

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Costa 등, Frontiers in MICROBIOLOGY, 5권, 문서 63, 페이지 1-20 (2014)*
Kawaide 등, FEBS Journal, 278권, 페이지 123-133 (2011)*

Also Published As

Publication number Publication date
KR20210051058A (ko) 2021-05-10

Similar Documents

Publication Publication Date Title
US20210198711A1 (en) Production of steviol glycosides in recombinant hosts
CN107567492B (zh) Udp-糖基转移酶
EP3021689B1 (en) Diterpene production
JP2016506743A5 (ko)
KR20120134116A (ko) 피키아 파스토리스에서 생산된 치료 당단백질 상의 n-글리코실화 부위 점유를 증가시키는 방법
KR20150125902A (ko) 인삼 유래의 당전이효소를 이용한 신규한 진세노사이드 당전이 방법
CN107922913B (zh) 甜菊醇糖苷转运
WO2018211032A1 (en) Production of steviol glycosides in recombinant hosts
MXPA03004853A (es) Metodos y composiciones para produccion sumamente eficiente de proteinas heterologas en levadura.
CN107922465B (zh) 甜菊醇糖苷转运
CN114207108A (zh) 产生糖基化大麻素的基因修饰的宿主细胞
US11976312B2 (en) Enzymatic method for preparing Rebaudioside C
KR20160108375A (ko) 개량형 β-프룩토프라노시다아제
KR102379608B1 (ko) 개선된 스테비올 배당체 화합물 또는 이의 전구체의 생산
CN113797326B (zh) 一种预防冠状病毒引起疾病的疫苗
KR20140114278A (ko) 변형된 o-글리코실화를 갖는 단백질의 생산을 위한 효모 균주
KR102618015B1 (ko) 스테비올 또는 이의 전구체의 생산
WO2015139599A1 (zh) 新的贝壳烯酸-13α-羟化酶、其编码基因及其应用
JP4258662B2 (ja) O−フコース結合型タンパク質合成系遺伝子が導入された酵母形質転換体
KR102022242B1 (ko) 겨울 우산 버섯 유래 테르펜 합성효소 유전자 및 상기 유전자가 삽입된 돌연변이 효모의 형질전환체
KR20220091425A (ko) 당전이 효소 및 이를 이용한 스테비올 배당체의 제조방법
KR102171224B1 (ko) 이눌린 과당전이효소 활성이 도입된 효모 및 이를 이용한 디프럭토스 언하이드리드 iii 및 프럭토올리고당의 생산방법
KR101764840B1 (ko) 내열성 균주 유래의 효소를 이용한 알로스의 제조방법
KR20230098494A (ko) 개선된 레바우디오사이드의 생산방법
CN116445438A (zh) 一种环糊精葡萄糖基转移酶突变体、碱基序列、构建方法及甜菊糖苷转化方法

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant