KR20200035981A

KR20200035981A - 레바우디오사이드의 고효율 생산을 위한 피숨 사티붐 카우렌 산화효소

Info

Publication number: KR20200035981A
Application number: KR1020207005218A
Authority: KR
Inventors: 게일 위치만; 아디티 칸코제; 티나 마하트데즈쿨-메도우스
Original assignee: 아미리스 인코퍼레이티드
Priority date: 2017-08-11
Filing date: 2018-08-10
Publication date: 2020-04-06
Also published as: AU2018314249A2; US20200165651A1; MX2020001537A; CN111263815A; AU2018314249A1; MA49836A; SG11202001058TA; WO2019033064A1; RU2020109765A3; JP7487099B2; RU2020109765A; CA3071029A1; EP3665287A1; JP2020533954A; BR112020002708A2

Abstract

숙주 세포에서 스테비올 글리코시드의 개선된 생산에 대한 조성물 및 방법이 본원에서 제시된다. 몇몇 양태에서, 상기 숙주 세포는 피숨 사티붐 ( Pisum sativum ) 카우렌 산화효소 또는 이의 변이 카우렌 산화효소를 인코딩하는 이종 뉴클레오티드 서열을 포함하도록 유전적으로 변형된다. 몇몇 양태에서, 상기 숙주 세포는, 상기 숙주 세포에서 스테비올 글리코시드를 생산할 수 있는 경로의 추가의 효소들을 인코딩하는 하나 이상의 이종 뉴클레오티드 서열을 더 포함한다. 본원에 기재된 조성물 및 방법은, 레바우디오사이드 D(rebaudioside D) 및 레바우디오사이드 M(rebaudioside M)을 포함하나, 이에 한정되는 것은 아닌 스테비올 글리코시드의 이종 생산을 위한 효율적인 경로를 제시한다.

Description

레바우디오사이드의 고효율 생산을 위한 피숨 사티붐 카우렌 산화효소

관련출원의 상호참조

본 출원은 2017년 8월 11일자 미국 가출원 제62/544,718호 및 2017년 8월 11일자 국제출원 PCT/US2017/046637호를 우선권으로 주장하고, 이들의 내용은 이들의 전체 기재내용이 본원에 참고로 포함된다.

기술분야

본 개시내용은 특정 카우렌 산화효소 (kaurene oxidase, KO), 이를 포함하는 조성물, 이를 포함하는 숙주 세포, 및 레바우디오사이드 D 및 레바우디오사이드 M을 포함하는 레바우디오사이드의 생산에 이들을 이용하는 방법에 관한 것이다.

천연 원료로부터 유래된 제로-칼로리 감미료는 높은 당 소비량의 부작용(예, 당뇨 및 비만)을 제한하는 데 바람직하다. 레바우디오사이드 M (Rebaudioside M, RebM)은 스테비아 식물(stevia plant) [S. 레바우디아나 베르토니(S. rebaudiana Bertoni)]에 의해 생산되는 많은 단맛이 나는 화합물들 중 하나이다. 모든 레바우디오사이드 중에서, RebM은 가장 높은 효능(potency)을 가지며 (수크로스보다 ~200-300x 더 달다), 가장 산뜻한 맛이 난다. 그러나, RebM은 스테비아 식물에 의해 소량으로만 생산되고, 전체 스테비올 글리코시드 함량의 적은 부분이다 (<1.0%). Ohta 외, 2010, J. Appl . Glycosci., 57, 199-209 (2010). 이와 같이, 대량 생산과 높은 순도를 허용하는 생명공학 기술 경로를 이용하여 RebM을 생산하는 것이 바람직하다.

생명공학 기술을 이용하여 제품을 경제적으로 생산하기 위해, 공급원료(feedstock)로부터 생성물로의 생물 전환(bioconversion)에서 각 단계는 높은 전환 효율(conversion efficiency) (이상적으로, >90%)을 가져야 할 필요가 있다. 효모를 RebM을 생성하도록 하는 우리의 조작(engineering)에서, 엔트-카우렌을 카우레노산으로 만드는 RebM에 대한 경로(도 1a 및 도 1b)의 생합성 단계(biosynthetic step) 초기에서 분명한 한계점이 확인되었다.

KO 효소는 모든 식물에서 발견되고, 보통, 식물 호르몬인 지베렐린(gibberellin)의 생성에 작용한다. 식물 세포에서 지베렐린의 레벨은 산업용 생산을 위한 효모에서 생산되는 RebM의 레벨보다 크기 정도들(orders of magnitude)이 낮으므로, 대부분의 KO 효소는 상업적 제조를 위한 RebM의 생산에 필요한 높은 플럭스(high flux)를 지닐 것으로 예상되지 않는다. 통상적으로, 스테비아 레바우디아나 (Stevia rebaudiana )로부터 수득된 KO 효소(Sr.KO)는 RebM을 생산하도록 조작된 효모에서 엔트 -카우렌을 카우레노산으로 전환하는 데 이용되어왔다. 통상적인 믿음은 이 식물이 높은 레벨의 스테비올 글리코시드를 생산하므로, 대부분의 다른 KO 효소보다 Sr.KO 효소가 더 높은 전환율(conversion rate)를 갖거나, 또는 더 높은 플럭스를 다루도록 진화되었어야 했다는 것이었다.

RebM로의 높은 탄소 플럭스(carbon flux)를 갖는 효모 균주에서, Sr.KO는 카우레노산으로의 낮은 전환 효율 비율(conversion efficiency rate) (25.6%)을 갖는 것으로 발견되었고, 매우 높은 레벨의 상류 중간 대사체(upstream intermediate metabolite) (엔트 -카우렌, 카우레놀 및 카우레날)가 형성 되었다 (도 1c).

RebM을 효율적이고, 높은 순도로 생산하기 위해, 카우레노산을 고효율로 생산할 수 있는 개선된 효소가 필요하다. 본원에서 제시된 조성물 및 방법은 이러한 필요성을 다루고, 또한 관련된 이점을 제시한다.

카우레노산으로의 카우렌의 개선된 전환에 대한 조성물 및 방법이 본원에서 제시된다. 이들 조성물 및 방법은 현저히 높은 효율로, 카우렌을 카우레노산으로 전환할 수 있는 특정 카우렌 산화효소(kaurene oxidase, KO)의 놀라운 발견에 부분적으로 기초한다. RebM에 대한 시장 수요가 연간 50억 톤이라고 가정하면, 새로운 KO를 이용한 균주 성능(strain performance)의 보통의 개선 (예, 10%) 조차, 향후 생산 비용에서 잠재적으로 천만 달러 넘게 절약할 수 있다.

또한, 본원에 기재된 특정 KO는 잔여 카우레놀 또는 카우레날이 거의 없거나 또는 없이, 카우레노산을 생산할 수 있다. 이와 같이, 특정 양태에서, 본원에 기재된 조성물 및 방법은 하류 공정(downstream processing)의 비용을 감소시켜, RebM과 같은 스테비올 글리코시드를 고수율로 갖는 조성물을 획득할 수 있다.

한 측면에서, 유전적으로 변형된 숙주 세포 및 산업상 유용한 화합물의 생산을 위한 이들의 이용방법이 본원에서 제시된다. 한 측면에서, 피숨 사티붐 카우렌 산화효소를 인코딩하는 이종 핵산을 포함하는 유전적으로 변형된 숙주 세포가 본원에서 제시된다. 몇몇 양태에서, 상기 유전적으로 변형된 숙주 세포는 스테비올 및/또는 스테비올 글리코시드를 생산할 수 있는 하나 이상의 효소적 경로(enzymatic pathway)를 더 포함한다.

특정 양태에서, 피숨 사티붐 카우렌 산화효소의 서열 (예, 서열번호 1)에 대해서 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는 아미노산 서열을 포함하는 카우렌 산화효소를 인코딩하는 이종 핵산을 포함하는 유전적으로 변형된 숙주 세포가 본원에서 제시된다. 특정 양태에서, 상기 유전적으로 변형된 숙주 세포는 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 또는 98%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 상기 유전적으로 변형된 숙주 세포는 효모 세포이다. 특정 양태에서, 상기 유전적으로 변형된 숙주 세포는 사카로마이세스 세레비시아 ( Saccharomyces cerevisiae) 세포이다.

다른 측면에서, 이종 스테비올 글리코시드를 생산하는 방법이 본원에서 제시되고, 상기 방법은 하기 단계를 포함한다: 탄소 공급원을 지닌 배지에서, 본원에 기재된 스테비올 글리코시드의 생성에 적합한 조건하에, 상기 스테비올 글리코시드 화합물을 생산할 수 있는, 본원에서 제시된 유전적으로 변형된 숙주 세포의 집단을 배양하는 단계; 및 상기 배지로부터 상기 스테비올 글리코시드를 회수하는 단계(recovering). 몇몇 양태에서, 이종 스테비올 글리코시드는 RebD 및 RebM으로 이루어진 군으로부터 선택된다.

다른 측면에서, RebD를 생산하는 방법이 본원에서 제시되고, 상기 방법은 하기 단계를 포함한다: 탄소 공급원을 지닌 배지에서, 본원에 기재된 RebD의 생성에 적합한 조건하에, 상기 RebD를 생산할 수 있는 본원에 제시된 유전적으로 변형된 숙주 세포의 집단을 배양하는 단계; 및 상기 배지로부터 상기 RebD를 회수하는 단계.

다른 측면에서, RebM을 생산하는 방법이 본원에 제시되고, 상기 방법은 하기 단계를 포함한다: 탄소 공급원을 지닌 배지에서, 본원에 기재된 RebM의 생성에 적합한 조건하에, 상기 RebM을 생산할 수 있는 본원에 제시된 유전적으로 변형된 숙주 세포의 집단을 배양하는 단계; 및 상기 배지로부터 상기 RebM을 회수하는 단계.

다른 측면에서, 카우레노산을 생산하는 방법이 본원에 제시되고, 상기 방법은 하기 단계를 포함한다: 카우레노산 형성에 적합한 조건하에서, 카우렌을 카우레노산으로 전환할 수 있는, 본원에 기재된 카우렌 산화효소를 카우렌과 접촉시키는 단계.

몇몇 양태에서, 상기 숙주 세포는 효모 세포이다. 몇몇 양태에서, 효모는 사 카로마이세스 세레비시아(Saccharomyces cerevisiae)이다. 몇몇 양태에서, 상기 숙주 세포는 RebD 또는 RebM을 고효율로 생산한다. 몇몇 양태에서, 상기 숙주 세포는 피숨 사티붐 카우렌 산화효소를 포함하지 않는 효모 세포에 비해서, 증가된 양의 RebD 또는 RebM을 생산한다.

도 1a는 파르네실 피로포스페이트(farnesyl pyrophosphate)가 스테비올로 전환되는 것의 개략도를 제시한다.
도 1b는 제라닐제라닐 피로포스페이트 (geranylgeranyl pyrophosphate, GGPP)가 RebM으로 전환되는 것의 개략도를 제시한다.
도 1c는 엔트 -카우렌(ent-kaurene)이 카우레놀(kaurenol)으로, 카우레날(kaurenal)으로, 카우레노산(kaurenoic acid)으로 전환되는 것의 개략도를 제시한다.
도 1d는 메발로네이트(mevalonate) 경로의 개략적 다이어그램을 제시한다.
도 2는 스테비올이 RebM으로 되는 예시적 경로를 제시한다.
도 3a는 효모에서 카우레노산 생산을 스크리닝하기 위한 개별적인 KO 효소들을 삽입하는데 이용된 "랜딩 패드(landing pad)" 설계의 개략도를 제시한다.
도 3b는 효모에서 카우레노산 생산 전환(production conversion)을 스크리닝하기 위한 KO 유전자 제작물의 개략도를 제시한다.
도 4는 상이한 카우렌 산화효소로, 생체 내 생산된 카우레노산의 상대적인 증가를 도시하는 차트를 제시한다.
도 5는 RebM으로의 높은 플럭스를 갖는 효모 균주에서 생체 내 생산된 카우레노산의 총량에 대해서 정규화된 엔트 -카우렌, 카우레놀 및 카우레날의 상대적인 레벨을 도시하는 막대 차트(bar chart)를 제시한다.
도 6은 Sr.KO 또는 Ps.KO 중 하나를 함유하는 높은 플럭스 균주(high flux strain)에서 RebM 역가의 상대적인 레벨을 도시하는 차트를 제시한다.

1. 용어

본원에서 이용된, 용어 "이종- (heterologous)"은 자연에서 보통 발견되지 않는 것을 의미한다. 용어 "이종 뉴클레오티드 서열(heterologous nucleotide sequence)"은 자연에 주어진 세포에서 보통 발견되지 않는 뉴클레오티드 서열을 의미한다. 이와 같이, 이종 뉴클레오티드 서열은 (a) 이의 숙주 세포에 이질적(foreign)일 수 있고 (즉, 세포에 "외인성"임); (b) 숙주 세포에서 자연적으로 발견될 수 있으나 (즉, "내인성"), 세포에 비정상적인 양으로 존재하고 (즉, 숙주 세포에서 자연적으로 발견되는 양보다 크거나 또는 작은 양); 또는 (c) 숙주 세포에서 자연적으로 발견될 수 있으나, 이의 자연적인 유전자 좌위 밖에 위치할 수 있다. 용어 "이종 효소(heterologous enzyme)"는 자연에 주어진 세포에서 보통 발견되지 않는 효소를 의미한다. 상기 용어는 (a) 주어진 세포에 외인성인 효소 (즉, 숙주 세포에 정상적으로 존재하지 않거나, 또는 숙주 세포에 주어진 맥락에서 자연적으로 존재하지 않는 뉴클레오티드 서열에 의해 인코딩됨); 및 (b) 숙주 세포에서 자연적으로 발견되나(예, 효소가 세포에 내인성인 뉴클레오티드 서열에 의해 인코딩됨), 숙주 세포에서 비정상적인 양 (예, 자연적으로 발견되는 양보다 크거나 또는 작음)으로 생산된 효소;를 포함한다.

반면에, 분자 및 특히, 효소 및 핵산에 대해서 본원에서 이용된 용어 "천연- (native)" 또는 "내인성- (endogenous)"은 천연 미생물(native microorganism)에서의 분자의 발현 레벨보다 더 낮거나, 동일하거나, 또는 더 높을 수 있는 발현 레벨과 무관하게 유기체에서 발현되는 분자들 - 자연에서, 상기 분자들은 상기 유기체에서 유래되거나 또는 발견됨 - 을 나타낸다. 천연 효소 또는 폴리뉴클레오티드의 발현은 재조합 미생물에서 변형될 수 있다는 것이 이해될 것이다.

본원에서 이용된, 용어 "모세포(parent cell)"는 변형된 숙주 세포 내로 조작된, 하나 이상의 특정한 유전적 변형, 예를 들어, 다음으로 이루어진 군으로부터 선택된 하나 이상의 변형을 포함하지 않는다는 것 외에, 본원에 개시된 유전적으로 변형된 숙주 세포와 동일한 유전적 백그라운드(genetic background)를 갖는 세포를 의미한다: 스테비올 경로의 효소의 이종 발현; 스테비올 글리코시드 경로의 효소의 이종 발현; 제라닐제라닐 디포스페이트 합성효소의 이종 발현; 코팔릴 디포스페이트 합성효소의 이종 발현; 카우렌 합성효소의 이종 발현; 카우렌 산화효소 (예, 피숨 사티붐 카우렌 산화효소)의 이종 발현; 스테비올 합성효소 (카우레노산 수산화효소); 사이토크롬 P450 환원효소의 이종 발현; UGT74G1의 이종 발현; UGT76G1의 이종 발현; UGT85C2의 이종 발현; 91D의 이종 발현; 및 이종 UGT40087 또는 이의 변이체의 이종 발현.

본원에서 이용된, 용어 "자연적으로 존재하는- (naturally occurring)"은 자연에서 발견되는 것을 의미한다. 예를 들어, 자연에서 공급원으로부터 분리될 수 있는 유기체에 존재하고, 실험실에서 인간에 의해 의도적으로 변형되지 않은 카우렌 산화효소는 자연적으로 존재하는 카우렌 산화효소이다. 역으로, 본원에서 이용된 용어 "자연적으로 존재하지 않는- (non-naturally occurring)"은 자연에서 발견되지 않지만, 인간의 개입(human intervention)에 의해 생성되는 것을 의미한다.

용어 "배지"는 배양 배지 및/또는 발효 배지를 의미한다.

용어 "발효 조성물"은 유전적으로 변형된 숙주 세포 및 유전적으로 변형된 숙주 세포에 의해 생산된 생성물 또는 대사체를 포함하는 조성물을 의미한다. 발효 조성물의 예시는 유전적으로 변형된 숙주 세포로부터 생산된 세포, 수성상(aqueous phase) 및 화합물을 포함하는 용기 (예, 플라스크, 플레이트, 또는 발효기)의 전체 내용물일 수 있는 전세포 배양액(whole cell broth)이다.

본원에서 이용된, 용어 "생산량(production)"은 일반적으로, 본원에서 제시된 유전적으로 변형된 숙주 세포에 의해 생산된 스테비올 또는 스테비올 글리코시드의 양을 의미한다. 몇몇 양태에서, 생산량은 숙주 세포에 의한 스테비올 또는 스테비올 글리코시드의 수율로 표현된다. 다른 양태에서, 생산량은 스테비올 또는 스테비올 글리코시드의 생산에 있어, 숙주 세포의 생산성(productivity)으로 표현된다.

본원에서 이용된, 용어 "생산성(productivity)"은 시간에 따른 (시간 당) 숙주 세포가 배양된 발효액의 양 (부피 기준) 당 생산된 스테비올 또는 스테비올 글리코시드의 양 (중량 기준)으로 표현된, 숙주 세포에 의한 스테비올 또는 스테비올 글리코시드의 생산량을 의미한다.

본원에서 이용된, 용어 "수율(yield)"은 중량 기준의, 숙주 세포에 의해 소비된 탄소 공급원(carbon source)의 양 당 생산된 스테비올 또는 스테비올 글리코시드의 양으로 표현된, 숙주 세포에 의한 스테비올 또는 스테비올 글리코시드의 생산량을 의미한다.

본원에서 이용된, 용어 화합물 (예, RebM2, 스테비올 글리코시드, 또는 기타 화합물)의 "검출 불가능한 레벨(undetectable level)"은 화합물을 측정하는 표준 기법에 의해 측정 및/또는 분석되기에 너무 낮은 화합물의 레벨을 의미한다. 예를 들어, 상기 용어는 실시예 6에 기재된 분석적 방법에 의해 검출 가능하지 않은 화합물의 레벨을 포함한다.

용어 "카우렌(kaurene)"은 화합물 카우렌을 의미하며, 카우렌의 임의의 입체 이성질체를 포함한다. 특정 양태에서, 상기 용어는 당해분야에서 엔트 -카우렌(ent-kaurene)으로 공지된 거울상 이성질체를 의미한다. 특정 양태에서, 상기 용어는 하기 화학식 1의 구조에 따른 화합물을 의미한다:

화학식 1

용어 "카우레놀(kaurenol)"은 화합물 카우레놀을 의미하며, 카우레놀의 임의의 입체 이성질체를 포함한다. 특정 양태에서, 상기 용어는 당해분야에서 엔트 -카우레놀(ent-kaurenol)로 공지된 거울상 이성질체를 의미한다. 특정 양태에서, 상기 용어는 하기 화학식 2의 구조에 따른 화합물을 의미한다:

화학식 2

용어 "카우레날(kaurenal)"은 화합물 카우레날을 의미하며, 카우레날의 임의의 입체 이성질체를 포함한다. 특정 양태에서, 상기 용어는 당해분야에서 엔트 -카우레날(ent-kaurenal)로 공지된 거울상 이성질체를 의미한다. 특정 양태에서, 상기 용어는 하기 화학식 3의 구조에 따른 화합물을 의미한다:

화학식 3

용어 "카우레노산(kaurenoic acid)"은 화합물 카우레노산을 의미하며, 카우레노산의 임의의 입체 이성질체를 포함한다. 특정 양태에서, 상기 용어는 당해분야에서 엔트 -카우레노산(ent-kaurenoic acid)으로 공지된 거울상 이성질체를 의미한다. 특정 양태에서, 상기 용어는 하기 화학식 4의 구조에 따른 화합물을 의미한다:

화학식 4

본원에서 이용된, 용어 "스테비올 글리코시드(들)"은 자연적으로 존재하는 스테비올 글리코시드, 예를 들어, 스테비올모노사이드(steviolmonoside), 스테비올바이오사이드(steviolbioside), 루부소사이드(rubusoside), 둘코사이드 B(dulcoside B), 둘코사이드 A, 레바우디오사이드 B(rebaudioside B), 레바우디오사이드 G, 스테비오사이드(stevioside), 레바우디오사이드 C, 레바우디오사이드 F, 레바우디오사이드 A, 레바우디오사이드 I, 레바우디오사이드 E, 레바우디오사이드 H, 레바우디오사이드 L, 레바우디오사이드 K, 레바우디오사이드 J, 레바우디오사이드 M, 레바우디오사이드 D, 레바우디오사이드 N, 레바우디오사이드 O; 합성 스테비올 글리코시드, 예를 들어, 효소적으로 글리코실화된 스테비올 글리코시드; 및 이들의 혼합물;을 포함하나, 이에 한정되는 것은 아닌 스테비올의 글리코시드를 의미한다.

본원에서 이용된, 용어 "변이(체)"는 구체적으로 인용된 "참조" 폴리펩티드와 아미노산 삽입, 결실, 돌연변이 및/또는 치환에 의해 상이한 폴리펩티드를 의미하나 (예, 야생형 서열), 참조 폴리펩티드와 실질적으로 유사한 활성을 유지한다. 몇몇 양태에서, 상기 변이체는 돌연변이 유발(mutagenesis)과 같은 재조합 DNA 기법에 의해 생성된다. 몇몇 양태에서, 변이 폴리펩티드는 이의 참조 폴리펩티드와 하나의 염기성 잔기가 다른 염기성 잔기로 치환되는 것 (즉, Arg이 Lys으로 치환); 하나의 소수성 잔기가 다른 소수성 잔기로 치환되는 것 (즉, Leu이 Ile으로 치환); 또는 하나의 방향족 잔기가 다른 방향족 잔기로 치환되는 것 (즉, Phe이 Ile으로 치환) 등에 의해 상이하다. 몇몇 양태에서, 변이체는 참조 서열의 실질적인 구조적 유사성(structural analogy)을 야기하는 보존적 치환(conservative substitution)이 획득된 유사체(analog)를 포함한다. 이러한 보존적 치환의 예시는, 글루탐산이 아스파르트산으로 치환되는 것 및 이의 역으로 치환되는 것; 글루타민이 아스파라긴으로 치환되는 것 및 이의 역으로 치환되는 것; 세린이 트레오닌으로 치환되는 것 및 이의 역으로 치환되는 것; 리신이 아르기닌으로 치환되는 것 및 이의 역으로 치환되는 것; 또는 이소류신, 발린 또는 류신 중 임의의 것이 서로 치환되는 것;을 포함하나, 이에 한정되는 것은 아니다.

본원에서 이용된, 용어 "서열 일치도(sequence identity)" 또는 "백분율 일치도(percent identity)"는 두 개 이상의 핵산 또는 단백질 서열의 맥락에서 동일하거나, 또는 동일한 아미노산 잔기 또는 뉴클레오티드의 소정의 백분율을 갖는 두 개 이상의 서열 또는 부분서열(subsquecne)을 의미한다. 예를 들어, 비교창(comparison window)을 통해서 최대 유사성(maximum correspondence)을 위해 비교 및 정렬되거나, 또는 매뉴얼 정렬(manual alignment) 및 비쥬얼 인스펙션(visual inspection)에 의해서 또는 서열 비교 알고리즘을 이용하여 측정된 영역으로 지정되는 경우에, 서열은 참조 서열에 대한 소정의 영역에 대해서 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 그 이상의 일치도의 백분율 일치도를 가질 수 있다. 예를 들어, 일치도의 백분율은 "서열 내 동일한 뉴클레오티드 (또는 아미노산 잔기)의 수 ÷ (전체 뉴클레오티드 (또는 아미노산 잔기)의 길이 - 임의의 갭의 길이)"의 비율을 계산함으로써 결정된다.

편의를 위해, 두 서열 사이 일치도의 정도는 당해분야에 공지된 컴퓨터 프로그램 및 수학적 알고리즘을 이용하여 확인될 수 있다. 백분율 서열 일치도를 계산하는 이러한 알고리즘은 일반적으로, 비교 영역에 대해서, 서열 갭과 미스매치(mismatch)를 고려한다. Clustal W (Thompson 외, (1994) Nucleic Acids Res., 22: 4673-4680), ALIGN (Myers 외, (1988) CABIOS, 4: 11-17), FASTA (Pearson 외, (1988) PNAS, 85:2444-2448; Pearson (1990), Methods Enzymol., 183: 63-98) 및 gapped BLAST (Altschul 외, (1997) Nucleic Acids Res., 25: 3389-3402)와 같은 서열을 비교 및 정렬하는 프로그램들은 상기 목적에 유용하다. BLAST 또는 BLAST 2.0 (Altschul 외, J. Mol . Biol . 215:403-10, 1990)은 서열분석 프로그램인 BLASTP, BLASTN, BLASTX, TBLASTN, 및 TBLASTX와 관련해 사용하기 위해, 국립 생명공학 정보 센터(National Center for Biological Information, NCBI)를 포함하는 몇몇 소스(source)로부터, 인터넷상에서 입수 가능하다. 추가 정보는 NCBI 웹사이트에서 찾을 수 있다.

특정 양태에서, 서열 정렬 및 백분율 일치도 계산은 BLAST 프로그램 - 이의 표준, 기본 파라미터(default parameter)를 이용하는 - 을 이용하여 결정될 수 있다. 뉴클레오티드 서열 정렬 및 서열 일치도 계산의 경우, BLASTN 프로그램이 이의 기본 파라미터 [갭 개시 패널티(Gap opening penalty)=5, 갭 연장 패널티(Gap extension penalty)=2, 핵산 매치(Nucleic match)=2, 핵산 미스매치(Nucleic mismatch)=-3, 기댓값(Expectation value) = 10.0, 워드 크기(Word size) = 11, 퀘리 범위 내 최대 매치(Max matches in a query range) = 0]로 이용된다. 폴리펩티드 서열 정렬 및 서열 일치도 계산의 경우, BLASTP 프로그램이 이의 기본 파라미터 [정렬 행렬(Alignment matrix) = BLOSUM62; 갭 비용(Gap costs): 존재(Existence)=11, 연장(Extension)=1; 조성 조정(Compositional adjustments)=조건적 조성 점수(Conditional compositional score), 행렬 조정(matrix adjustment); 기댓값 = 10.0; 워드 사이즈=6; 퀘리 범위 내 최대 매치 = 0]로 이용된다. 대안적으로는, 다음의 프로그램과 파라미터가 이용된다: Align Plus software of Clone Manager Suite, 버전 5 (Sci-Ed 소프트웨어); DNA 비교: 글로벌 비교(Global comparison), 표준 선형 점수계산 행렬(Standard Linear Scoring matrix), 미스매치 패널티=2, 개시 갭 패널티(Open gap penalty)=4, 연장 갭 패널티(Extend gap penalty)=1; 아미노산 비교: 글로벌 비교(Global comparison), BLOSUM 62 점수계산 행렬. 본원에 기재된 양태에서, 서열 일치도는 BLASTN 또는 BLASTP 프로그램 - 이들의 기본 파라미터를 이용하는 - 을 이용하여 계산된다. 본원에 기재된 양태에서, 둘 이상의 서열의 서열 정렬은 제안된 기본 파라미터 [정렬해제 인풋 서열(Dealign input sequences): 없음; Mbed-유사 클러스터링 가이드-트리(Mbed-like clustering guide-tree): 있음; Mbed-유사 클러스터링 반복(Mbed-like clustering iteration): 있음; 컴바인드 반복의 수(number of combined iterations): 기본값(0); 최대 가이드 트리 반복(Max guide tree iterations): 기본값; 최대 HMM 반복(Max HMM iterations): 기본값; 순서(Order): 인풋)]를 이용하는 Clustal W를 이용하여 수행된다.

2. 숙주 세포

카우렌으로부터 카우레노산 (kaurenoic acid, KA)을 고효율로 생산할 수 있는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 숙주 세포는 시작 물질로서 카우렌으로부터 카우레노산을 생산할 수 있다. 특정 양태에서, 숙주 세포는 배양 배지 중 탄소 공급원으로부터 카우레노산을 생산할 수 있다. 특정 양태에서, 숙주 세포는 배양 배지 중 탄소 공급원으로부터 카우레노산을 생산할 수 있고, 상기 카우레노산으로부터 RebA 또는 RebD를 더 생산할 수 있다. 특정 양태에서, 숙주 세포는 상기 RebD로부터 레바우디오사이드 M (rebaudioside M, RebM)을 더 생산할 수 있다.

특정 양태에서, 숙주 세포는 피숨 사티붐 카우렌 산화효소의 효소 활성을 포함한다. 피숨 사티붐 카우렌 산화효소는 고효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소는 30%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소는 35%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소는 40%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소는 95%는 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 피숨 사 티붐 카우렌 산화효소는 50%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소는 55%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소는 약 58%의 효율로 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 피 숨 사티붐 카우렌 산화효소는 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다.

특정 양태에서, 숙주 세포는 30%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 숙주 세포는 35%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 숙주 세포는 40%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 숙주 세포는 45%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 숙주 세포는 50%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 숙주 세포는 55%를 초과하는 효율로 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 숙주 세포는 약 58%의 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 숙주 세포는 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다.

전환의 효율은 통상의 기술자에게 분명한 임의의 기법에 의해 측정될 수 있다. 특정 양태에서, 전환의 효율은 카우레노산의 형성에 적합한 조건하에서, 카우렌을 효소 또는 숙주 세포와 접촉시킴으로써 측정될 수 있다. 효율은 생성되는 조성물 중 카우렌과 카우레노산의 총량에 비해, 생산된 카우레노산의 몰량(molar amount)을 비교함으로써 측정될 수 있다. 또한, 효율은 생성되는 조성물 중 카우레노산 및 카우레노산의 하류 생성물(downstream product)의 총량을 카우렌, 카우레놀, 카우레날, 카우레노산, 및 카우레노산의 하류 생성물의 총량에 비교함으로써 측정될 수 있다. 예를 들어, 도 5에 제시된 Ps.KO를 포함하는 균주의 전환 효율은 생성되는 조성물 중 카우레노산과 도 2에 제시된 모든 하류 화합물(downstream compound)의 총량을 카우렌, 카우레놀, 카우레날, 카우레노산 및 도 2에 제시된 모든 하류 화합물 (즉, 스테비올, 1개의 글루코스 + 스테비올, 2개의 글루코스 + 스테비올, 3개의 글루코스 +스테비올, 4개의 글루코스 + 스테비올, 5개의 글루코스 +스테비올, 및 6개의 글루코스 + 스테비올)의 총량에 비교함으로써 측정되었다.

특정 양태에서, 서열번호 1의 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 실질적으로 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 60% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 65% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 70% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 75% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 85% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 90% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 95% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 96% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 97% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 98% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 99% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 60%, 적어도 99%, 또는 적어도 60% 내지 99% 사이의 임의의 백분율이 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다.

특정 양태에서, 본원에 기재된 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시되고, 카우렌을 카우렌으로 전환할 수 있다. 특정 양태에서, 본원에서 기재된 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시되고, 카우렌, 카우레놀, 및 카우레날 각각의 19번 위치를 산화시킬 수 있다. 특정 양태에서, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 또는 97%를 초과하는 효율로, 카우렌을 카우레노산으로 전환시킬 수 있는, 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시되고, 상기 카우렌 산화효소는 서열번호 1의 아미노산 서열에 대해서 적어도 95%의 서열 일치도를 갖는 아미노산 서열을 포함한다.

특정 양태에서, 서열번호 1의 아미노산 서열을 포함하는 피숨 사티붐 카우렌 산화효소를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 실질적으로 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 60% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 65% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 70% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 75% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 85% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 90% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 95% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 96% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 97% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 98% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 99% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 적어도 60%, 적어도 99%, 또는 60% 내지 99% 사이의 임의의 백분율인 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다.

특정 양태에서, 서열번호 1의 서열을 갖는 피숨 사티붐 카우렌 산화효소를 인코딩하는 서열번호 14의 뉴클레오티드 서열을 포함하는 이종 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 14의 뉴클레오티드 서열과 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 동일한 뉴클레오티드 서열을 포함하는 이종 핵산을 포함하는 숙주 세포가 본원에서 제시된다.

특정 양태에서, 숙주 세포는 상기 기재된 피숨 사티붐 카우렌 산화효소 폴리펩티드의 변이체를 포함한다. 특정 양태에서, 변이체는 피숨 사티붐 카우렌 산화효소 폴리펩티드에 비해서, 최대 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 아미노산 치환을 포함할 수 있다. 특정 양태에서, 변이체는 피숨 사티붐 카우렌 산화효소 폴리펩티드에 비해서, 최대 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 보존적 아미노산 치환을 포함할 수 있다. 특정 양태에서, 본원에 기재된 핵산들 중 임의의 핵산은 숙주 세포에 대해서, 예를 들어, 코돈 최적화(codon optimization)에 의해 최적화될 수 있다.

본원에 기재된 양태들에서, 임의의 적합한 방법은 두 개의 폴리펩티드의 대응하는 아미노산 자리(amino acid position) 또는 대응하는 루프 위치(loop location)를 결정하는 데 이용될 수 있다. 특정 양태에서, 카우렌 산화효소의 서열 및 참조 서열인 서열번호 1은 Clustal(W) - 이의 기본 파라미터를 이용하는 - 을 이용하여 정렬될 수 있다. 다른 양태에서, 카우렌 산화효소의 서열과 참조 서열인 서열번호 1은 ExPASy 웹 서버를 통해서, 또는 프로그램인 DeepView (Swiss Pdb-Viewer)로부터 접속 가능한, 단백질 구조 상동성-모델링 서버(protein structure homology-modelling server)인 SWISS-MODEL과 같은 구조적 정렬(structural alignment)을 이용하여 정렬될 수 있다.

특정 양태에서, 카우렌은 도 1c에 제시된 것이다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소 또는 변이 피숨 사티붐 카우렌 산화효소는 C-19에서 카우렌의 산화를 촉매하여, 카우레놀을 형성할 수 있다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소 또는 변이 피숨 사티붐 카우렌 산화효소는 C-19에서 카우레놀의 산화를 촉매하여, 카우레날을 형성할 수 있다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소는 C-19에서 카우레날의 산화를 촉매하여, 카우레노산을 형성할 수 있다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소 또는 변이 피숨 사티붐 카우렌 산화효소는 C-19에서 카우렌의 산화를 촉매하여, 카우레놀을 형성할 수 있고; C-19에서 카우레놀의 산화를 촉매하여, 카우레날을 형성할 수 있으며; C-19에서 카우레날의 산화를 촉매하여, 카우레노산을 형성할 수 있다.

특정 양태에서, RebD는 도 2에 제시된 것이다. 특정 양태에서, 숙주 세포는 카우레노산을 스테비올로 전환할 수 있는 하나 이상의 효소를 더 포함한다. 특정 양태에서, 숙주 세포는 스테비올을 하나 이상의 스테비올 글리코시드로 전환할 수 있는 하나 이상의 효소를 더 포함한다. 특정 양태에서, 숙주 세포는 RebA를 RebD로 전환할 수 있는 하나 이상의 효소를 더 포함한다. 특정 양태에서, 숙주 세포는 RebD를 RebM으로 전환할 수 있는 하나 이상의 효소를 더 포함한다.

숙주 세포의 피숨 사티붐 카우렌 산화효소 또는 임의의 변이 피숨 사티붐 카우렌 산화효소는 카우렌을 기질로 수용하고(accepting), 카우렌의 공급원은 통상의 기술자에게 적합한 것으로 간주되는 임의의 공급원일 수 있다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소 또는 임의의 변이 피숨 사티붐 카우렌 산화효소는 카우렌과 접촉될 수 있다. 특정 양태에서, 숙주 세포는 카우렌과 접촉될 수 있다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소 또는 피숨 사티붐 카우렌 산화효소의 임의의 변이체는 카우렌, 카우레놀, 및 카우레날 중 하나 이상을 포함하는 조성물과 접촉될 수 있다. 특정 양태에서, 조성물은 카우렌을 포함한다. 특정 양태에서, 조성물은 카우레놀을 포함한다. 특정 양태에서, 조성물은 카우레날을 포함한다. 특정 양태에서, 조성물은 스테비아 레바우디아나 잎(leaf)으로부터 분리된 천연 생성물로부터 유래된다. 특정 양태에서, 조성물은 미생물학적으로(microbially) 유래된다. 특정 양태에서, 숙주 세포는 하나 이상의 탄소 공급원을 포함하는 조성물과 접촉될 수 있다.

특정 양태에서, 목적하는 반응을 촉매하는 데 적합한 임의의 변이 피숨 사티 붐 카우렌 산화효소는 당해분야에 공지된 임의의 적합한 방법에 대해서 스크리닝 될 수 있다. 예를 들어, 변이 피숨 사티붐 카우렌 산화효소를 인코딩하는 이종 핵산을 발현시키고, 기질의 목적하는 위치 (예, 카우렌, 카우레놀, 및/또는 카우레날의 C-19 위치)에서 산화를 촉매할 수 있는 기능성 변이 피숨 사티붐 카우렌 산화효소를 생산하는 세포를 스크리닝함으로써, 적합한 변이 피숨 사티붐 카우렌 산화효소가 생체 내에서 분석될 수 있다. 예시적인 스크리닝 방법이 아래의 실시예에서 기재된다. 다른 예시에서, 적합한 변이 피숨 사티붐 카우렌 산화효소는 변이 피숨 사티붐 카우렌 산화효소를 카우렌, 카우레놀, 및/또는 카우레날과 같은 기질과 접촉시킴으로써 시험관 내에서 스크리닝될 수 있다. 이 예시에서, 카우레노산, 스테비올, 또는 RebD와 같은 스테비올 글리코시드의 존재를 검정하는 것은 변이 피숨 사티붐 카우렌 산화효소가 적합한 효소인지 여부를 결정하는 테스트로 이용될 수 있다. 반응은 LC-MS 또는 당해분야 내 기타 공지된 방법에 의해 분석될 수 있다. 예를 들어, 국제 특허공보 WO 제2013/022989호를 참고한다.

특정 양태에서, 변이 피숨 사티붐 카우렌 산화효소가 생체 내에서 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 또는 97%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있는 경우에, 이는 카우렌을 카우레노산으로 전환시키는 데 적합한 것으로 고려된다.

특정 양태에서, 변이 피숨 사티붐 카우렌 산화효소가 생체 내에서 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 또는 97%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있는 경우에, 이는 카우렌을 카우레놀로 전환시키는 데 적합한 것으로 고려된다.

특정 양태에서, 변이 피숨 사티붐 카우렌 산화효소가 생체 내에서 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 또는 97%를 초과하는 효율로, 카우레놀을 카우레날로 전환할 수 있는 경우에, 이는 카우레놀을 카우레날로 전환시키는 데 적합한 것으로 고려된다.

특정 양태에서, 변이 피숨 사티붐 카우렌 산화효소가 생체 내에서 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 또는 97%를 초과하는 효율로, 카우레날을 카우레노산으로 전환할 수 있는 경우에, 이는 카우레날을 카우레노산을 전환하는 데 적합한 것으로 고려된다.

특정 양태에서, 전환 효율이 생체 내에서 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 또는 97%를 초과하는 경우에, 변이 피숨 사티붐 카우렌 산화효소는 카우렌을 카우레노산으로 전환하는 데 적합한 것으로 고려되고, 상기 전환 효율은 생성되는 조성물 중 카우렌, 카우레놀, 카우레날, 카우레노산, 및 도 2에 제시된 모든 하류 화합물의 총량으로 나뉜, 카우레노산 및 도 2에 제시된 모든 하류 화합물의 총량 (× 100 퍼센트)에 의해 계산된다.

유리한 양태에서, 숙주 세포는 카우렌을 생성할 수 있는 하나 이상의 효소적 경로를 포함할 수 있고, 상기 경로는 개별적으로 또는 함께 이용될 수 있다. 특정 양태에서, 숙주 세포는 제라닐제라닐 디포스페이트를 카우렌으로 전환할 수 있는 하나 이상의 효소를 포함한다. 유용한 효소 및 효소를 인코딩하는 핵산은 통상의 기술자에게 공지되어 있다. 특정 양태에서, 숙주 세포는 제라닐제라닐 디포스페이트를 카우렌으로 전환할 수 있는 하나 이상의 효소를 포함한다. 추가의 유리한 양태에서, 숙주 세포는 카우레노산을 스테비올 및/또는 스테비올 글리코시드로 전환할 수 있는 하나 이상의 효소적 경로를 포함할 수 있고, 상기 경로는 개별적으로 또는 함께 이용될 수 있다. 유용한 효소 및 효소를 인코딩하는 핵산은 통상의 기술자에게 공지되어 있다. 특히 유용한 효소 및 핵산은 아래의 섹션에서 기재되고, 예를 들어, US 제2014/0329281 A1호, US 제2014/0357588 A1호, US 제2015/0159188호, WO 제2016/038095 A2호, 및 US 제2016/0198748 A1호에 추가로 기재되어 있다.

추가의 양태에서, 숙주 세포는 탄소 공급원으로부터 제라닐제라닐 디포스페이트를 생성할 수 있는 하나 이상의 효소를 더 포함한다. 이들은 DXP 경로의 효소 및 MEV경로의 효소를 포함한다. 유용한 효소 및 효소를 인코딩하는 핵산은 통상의 기술자에게 공지되어 있다. 각 경로의 예시적인 효소는 아래에서 기재되고, 예를 들어, US 제2016/0177341 A1호에 추가로 기재되어 있다. 또한, MEV 경로는 도 1d에서 제시된다.

특정 양태에서, 추가의 효소는 천연이다. 유리한 양태에서, 추가의 효소는 이종이다. 특정 양태에서, 두 효소는 하나의 폴리펩티드로 결합될 수 있다.

3. 자연적으로 존재하지 않는 카우렌 산화효소 폴리펩티드 및 핵산

다른 측면에서, 참조 서열 (예, 서열번호 1)에 비해서, 아미노산 잔기의 변형(들)을 포함하고, 카우렌을 카우레노산으로, 카우렌을 카우레놀로, 카우레놀을 카우레날로, 및/또는 카우레날을 카우레노산으로 전환하는 카우렌 산화효소로서 활성을 여전히 유지하는, 자연적으로 존재하지 않는 변이 카우렌 산화효소가 본원에서 제시된다. 특정 양태에서, 자연적으로 존재하지 않는 변이 카우렌 산화효소는 참조 서열 (예, 서열번호 1)에 비해서, 특정 아미노산 자리(position) 또는 위치(location)에 최대 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 아미노산 치환, 결실, 첨가, 및/또는 삽입을 포함할 수 있다. 특정 양태에서, 자연적으로 존재하지 않는 변이 카우렌 산화효소는 본원에 기재된 변이 카우렌 산화효소 중 임의의 효소를 포함한다.

다른 측면에서, 참조 서열 (예, 서열번호 15)에 비해서, 핵산 잔기의 변형(들)을 포함하고, 단백질로 번역되는 경우에, 단백질이 카우렌을 카우레노산으로, 카우렌을 카우레놀로, 카우레놀을 카우레날로, 및/또는 카우레날을 카우레노산으로 변형하는 카우렌 산화효소로서 활성을 여전히 유지하는, 자연적으로 존재하지 않는 변이 카우렌 산화효소가 본원에서 제시된다. 특정 양태에서, 자연적으로 존재하지 않는 변이 카우렌 산화효소는 본원에 기재된 변이 카우렌 산화효소 중 임의의 효소를 인코딩할 수 있다.

4. 세포주

본원에 제시된 조성물 및 방법에 유용한 숙주 세포는 고세균(archae), 원핵세포, 또는 진핵세포를 포함한다.

적합한 원핵 숙주는 다양한 그람-양성, 그람-음성, 또는 그람-가변성(gram-variable) 박테리아 중 임의의 박테리아를 포함할 수 있으나, 이에 한정되는 것은 아니다. 예시는 다음의 속들(genera)에 속하는 세포를 포함하나, 이에 한정되는 것은 아니다: 아그로박테리움( Agrobacterium ), 알리사이클로바실러 스(Alicyclobacillus), 아나베나 ( Anabaena ), 아나시스티스 ( Anacystis ), 아르트로박터(Arthrobacter), 아조박터 ( Azobacter ), 바실러스 (Bacillus), 브레비박테리 움(Brevibacterium), 크로마티움 ( Chromatium ), 클로스트리듐(Clostridium), 코리네 박테리움(Corynebacterium), 엔테로박터( Enterobacter ), 에르위니아 ( Erwinia ), 에 세리키아(Escherichia), 락토바실러스 (Lactobacillus), 락토코커스(Lactococcus) , 메소리조비움(Mesorhizobium), 메틸로박테리움 ( Methylobacterium ), 마이크로박테리 움(Microbacterium), 포르미디움 ( Phormidium ), 슈도모나스( Pseudomonas ), 로도박 터(Rhodobacter), 로도슈도모나스 ( Rhodopseudomonas ), 로도스피릴 륨(Rhodospirillum), 로도코커스 ( Rhodococcus ), 살모넬라(Salmonella), 세네데스 문(Scenedesmun), 세라티아( Serratia ), 시겔라 ( Shigella ), 스타필로코커 스(Staphlococcus), 스트렙토마이세스 ( Strepromyces ), 사이네코커스 ( Synnecoccus ), 및 자이모모나스(Zymomonas). 원핵 균주의 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: 바실러스 서브틸리스 (Bacillus subtilis ), 바실러스 아밀로리퀴파시엔스 (Bacillus amyloliquefacines ), 브레비박테리움 암모 니아게네스(Brevibacterium ammoniagenes ), 브레비박테리움 임마리오필 룸(Brevibacterium immariophilum ), 클로스트리듐 베이게링키 (Clostridium beigerinckii), 엔테로박터 사카자키 ( Enterobacter sakazakii ), 에세리키아 콜라 이(Escherichia coli ), 락토코커스 락티스 ( Lactococcus lactis ), 메소리조비움 로 티(Mesorhizobium loti ), 슈도모나스 에루지노사 ( Pseudomonas aeruginosa ), 슈도모나스 메발로니 ( Pseudomonas mevalonii ), 슈도모나스 푸디카 ( Pseudomonas pudica ), 로도박터 캡슐라투스 ( Rhodobacter capsulatus ), 로도박터 스페로이데 스(Rhodobacter sphaeroides ), 로도스피릴륨 루브룸 ( Rhodospirillum rubrum ), 살모넬라 엔테리카 (Salmonella enterica ), 살모넬라 티피 (Salmonella typhi ), 살모넬라 티피뮤리움(Salmonella typhimurium ), 시겔라 디센테리아 ( Shigella dysenteriae ), 시겔라 플렉스네리 ( Shigella flexneri ), 시겔라 소네이 ( Shigella sonnei ), 및 스타필로코커스 아우레우스 (Staphylococcus aureus). 특정 양태에서, 숙주 세포는 에세리키아 콜라이 세포이다.

적합한 고세균 숙주는 다음의 속들에 속하는 세포를 포함하나, 이에 한정되는 것은 아니다: 에로피룸 ( Aeropyrum ), 아르케오글로부스 ( Archaeglobus ), 할로박테 리움(Halobacterium), 메타노코커스 ( Methanococcus ), 메타노박테리움 (Methanobacterium), 파이로코커스 ( Pyrococcus ), 술포로부스( Sulfolobus ), 및 써 모플라즈마(Thermoplasma). 고세균 균주의 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: 아르케오글로부스 풀지두스 ( Archaeoglobus fulgidus ), 할로박테리 움 sp .( Halobacterium sp .), 메타노코커스 잔나스키 ( Methanococcus jannaschii ), 메타노박테리움 써모오토트로피쿰 ( Methanobacterium thermoautotrophicum ), 써모플라즈마 아시도필룸 ( Thermoplasma acidophilum ), 써모플라즈마 볼카니 움(Thermoplasma volcanium ), 파이로코커스 호리코시이 ( Pyrococcus horikoshii ), 파이로코커스 어비시 ( Pyrococcus abyssi ), 및　 에로피룸 페르닉스 ( Aeropyrum pernix).

적합한 진핵 숙주는 진균 세포, 조류 세포, 곤충 세포, 및 식물 세포를 포함하나, 이에 한정되는 것은 아니다. 몇몇 양태에서, 본 발명의 방법에 유용한 효모는 미생물 기탁처 (예, IFO, ATCC 등)에 기탁되었고, 그 중에서도 다음의 속들에 속하는 효모를 포함한다: 아시쿨로코니듐 ( Aciculoconidium ), 암브로시오지 마(Ambrosiozyma), 아르트로아스쿠스 ( Arthroascus ), 아르씨오지마 ( Arxiozyma ), 아 쉬비아(Ashbya), 바브제비아 ( Babjevia ), 벤싱토니아 ( Bensingtonia ), 보트리오아스 쿠스(Botryoascus), 보트리오지마(Botryozyma),브레타노마이세스 ( Brettanomyces ), 불레라(Bullera), 불레로마이세스 ( Bulleromyces ), 칸디다( Candida ), 시테로마이세 스(Citeromyces), 클라비스포라 ( Clavispora ), 크립토코커스 ( Cryptococcus ), 시스토필로바시디움 (Cystofilobasidium), 데바리오마이세스 ( Debaryomyces ), 덱카라 (Dekkara), 디포다스콥시스 ( Dipodascopsis ), 디포다스커스 ( Dipodascus ), 에니엘라 (Eeniella), 엔도마이콥셀라 ( Endomycopsella ), 에레마스커스 ( Eremascus ), 에레모테시움 ( Eremothecium ), 에리 트로바시디움(Erythrobasidium), 펠로마이세스 ( Fellomyces ), 필로바시디 움(Filobasidium), 갈락토마이세스 ( Galactomyces ), 지오트리쿰 ( Geotrichum ), 귈리 에르몬델라(Guilliermondella), 한세니아스포라 ( Hanseniaspora ), 한세눌라 ( Hansenula ), 하세가와에(Hasegawaea), 홀터만니아 ( Holtermannia ), 호르모아스커스 ( Hormoascus ), 하이포피키아(Hyphopichia), 이사첸키아 ( Issatchenkia ), 클로엑케라 ( Kloeckera ), 클로엑케라스포라(Kloeckeraspora), 클루이베로마이세스 ( Kluyveromyces ), 콘도 아 (Kondoa), 쿠라이시아 ( Kuraishia ), 쿠르츠마노마이세스 ( Kurtzmanomyces ), 류코스포리디움 ( Leucosporidium ), 리포마이세스 ( Lipomyces ), 로데로마이세스(Lodderomyces), 말라세지아 ( Malassezia ), 멧츠쉬니코위 아(Metschnikowia), 므라키아 ( Mrakia ), 마이소지마 ( Myxozyma ), 나드소니 아(Nadsonia), 나카자와에 ( Nakazawaea ), 네마토스포 라(Nematospora), 오가타에 ( Ogataea ), 오스포리디움 ( Oosporidium ), 파키솔렌 (Pachysolen), 파키티코스포라 ( Phachytichospora ), 파피아 ( Phaffia ), 피키아 ( Pichia ), 로도스포리 듐(Rhodosporidium), 로도토룰라 ( Rhodotorula ), 사카로마이세스 ( Saccharomyces ), 사카로마이코데스(Saccharomycodes), 사카로마이콥시스 ( Saccharomycopsis ), 사이토엘라(Saitoella), 사카구치아 ( Sakaguchia ), 사투르노스포라 ( Saturnospora ), 스키조 블라스토스포리온(Schizoblastosporion), 스키조사카로마이세 스(Schizosaccharomyces), 슈완니오마이세스 ( Schwanniomyces ), 스포리디오볼루 스(Sporidiobolus), 스포로볼로마이세스 ( Sporobolomyces ), 스포로파키데르미 아(Sporopachydermia), 스테파노아스커스 ( Stephanoascus ), 스테리그마토마이세 스(Sterigmatomyces), 스테리그마토스포리듐 ( Sterigmatosporidium ), 심바이오타프 리나(Symbiotaphrina), 심포디오마이세스 ( Sympodiomyces ), 심포디오마이콥시 스(Sympodiomycopsis), 토룰라스포라 ( Torulaspora ), 트리코스포리엘 라(Trichosporiella), 트리코스포론 ( Trichosporon ), 트리고놉시스 ( Trigonopsis ), 츠키야에(Tsuchiyaea), 우데니오마이세스 ( Udeniomyces ), 왈토마이세 스(Waltomyces), 위커하미아 ( Wickerhamia ), 위커하미엘라 ( Wickerhamiella ), 윌리옵 시스(Williopsis), 아마다지마 ( Yamadazyma ), 야로위아 ( Yarrowia ), 자이고아스커스 (Zygoascus), 자이고사카로마이세스 ( Zygosaccharomyces ), 자이고윌리옵시 스(Zygowilliopsis), 및 자이고지마(Zygozyma).

몇몇 양태에서, 숙주 미생물은 사카로마이세스 세레비시아 , 피키아 파스토리 스(Pichia pastoris ), 스키조사카로마이세스 폼베 ( Schizosaccharomyces pombe ), 덱 케라 브룩셀렌시스 ( Dekkera bruxellensis ), 클루이베로마이세스 락티 스(Kluyveromyces lactis ) [이전에, 사카로마이세스 락티스(Saccharomyces lactis)라고 칭함], 클루베로마이세스 마르시아누스 ( Kluveromyces marxianus ), 아르술라 아데니니보란스(Arxula adeninivorans ), 또는 한세눌라 폴리모르파 ( Hansenula polymorpha ) [현재, 피키아 앵구스타 (Pichia angusta )로 알려짐]이다. 몇몇 양태에서, 숙주 미생물은 칸디다 리폴리티카(Candida lipolytica ), 칸디다 귈리에르몬디이 ( Candida guilliermondii), 칸디다 크루세이 ( Candida krusei ), 칸디다 슈도트로피칼리 스(Candida pseudotropicalis ), 또는 칸디다 유틸리스(Candida utilis)와 같은 칸디다 속의 균주이다.

특정 양태에서, 숙주 미생물은 사카로마이세스 세레비시아이다. 몇몇 양태에서, 숙주는 빵 효모(Baker's yeast), CBS 7959, CBS 7960, CBS 7961, CBS 7962, CBS 7963, CBS 7964, IZ-1904, TA, BG-1, CR-1, SA-1, M-26, Y-904, PE-2, PE-5, VR-1, BR-1, BR-2, ME-2, VR-2, MA-3, MA-4, CAT-1, CB-1, NR-1, BT-1, 및 AL-1로 이루어진 군으로부터 선택된 사카로마이세스 세레비시아의 균주이다. 몇몇 양태에서, 숙주 미생물은 PE-2, CAT-1, VR-1, BG-1, CR-1, 및 SA-1로 이루어진 군으로부터 선택된 사카로마이세스 세레비시아의 균주이다. 특정 양태에서, 사카로마이 세스 세레비시아의 균주는 PE-2이다. 다른 특정 양태에서, 사카로마이세스 세레비 시아의 균주는 CAT-1이다. 다른 특정 양태에서, 사카로마이세스 세레비시아의 균주는 BG-1이다.

몇몇 양태에서, 숙주 미생물은 산업용 발효에 적합한 미생물이다. 특정 양태에서, 미생물은 산업용 발효 환경의 인식된 스트레스 조건인 높은 용매 농도, 고온, 확장된 기질 활용(substrate utilization), 영양 제한(nutrient limitation), 당과 염으로 인한 삼투 스트레스(osmotic stress), 산성, 설파이트(sulfite) 및 박테리아 오염(bacterial contamination), 또는 이들의 조합하에서 존속되도록 길들어졌다(conditioned).

5. 스테비올 및 스테비올 글리코시드 생합성 경로

몇몇 양태에서, 스테비올 생합성 경로 및/또는 스테비올 글리코시드 생합성 경로는, 이 경로의 하나 이상의 효소를 인코딩하는 폴리뉴클레오티드 및/또는 폴리펩티드를 발현하도록 세포를 조작함으로써, 본원에서 제시된 유전적으로 변형된 숙주 세포에서 활성화된다. 도 1b는 예시적인 스테비올 생합성 경로를 도시한다. 도 2는 제라닐제라닐 피로포스페이트로부터 시작하여, 다양한 스테비올 글리코시드를 생성하는 예시적 스테비올 글리코시드 생합성 경로를 도시한다.

따라서, 몇몇 양태에서, 본원에서 제시된 유전적으로 변형된 숙주 세포는 제라닐제라닐 디포스페이트 합성효소 (geranylgeranyl diphosphate synthase, GGPPS) 활성을 갖는 폴리펩티드를 인코딩하는 이종 폴리뉴클레오티드를 포함한다. 몇몇 양태에서, 본원에서 제시된 유전적으로 변형된 숙주 세포는 코팔릴 디포스페이트 합성효소 또는 엔트 -코팔릴 피로포스페이트 합성효소 (copalyl diphosphate synthase, CDPS; 또한, 엔트-코팔릴 피로포스페이트 합성효소 또는 CPS라고 함) 활성을 갖는, 폴리펩티드를 인코딩하는 이종 폴리뉴클레오티드를 포함한다. 몇몇 양태에서, 본원에서 제시된 유전적으로 변형된 숙주 세포는 카우렌 합성효소 (kaurene synthase, KS; 또한, 엔트-카우렌 합성효소라고 함) 활성을 갖는, 폴리펩티드를 인코딩하는 이종 폴리뉴클레오티드를 포함한다. 특정 양태에서, 본원에서 제시된 유전적으로 변형된 숙주 세포는 본원에 기재된 카우렌 산화효소(kaurene oxidase, KO; 또한, 엔트 -카우렌 19-산화효소라고 함) 활성을 갖는, 폴리펩티드를 인코딩하는 이종 폴리뉴클레오티드를 포함한다. 몇몇 양태에서, 본원에 제시된 유전적으로 변형된 숙주 세포는 스테비올 합성효소 (또한, 엔트-카우레노산 13-수산화효소 또는 KAH라고 함) 활성을 갖는, 폴리펩티드를 인코딩하는 이종 폴리뉴클레오티드를 포함한다. 몇몇 양태에서, 본원에 제시된 유전적으로 변형된 숙주 세포는 사이토크롬 P450 환원효소 (cytochrome P450 reductase, CPR) 활성을 갖는, 폴리펩티드를 인코딩하는 이종 폴리뉴클레오티드를 포함한다.

몇몇 양태에서, 본원에 제시된 유전적으로 변형된 숙주 세포는 UGT74G1 활성을 갖는, 폴리펩티드를 인코딩하는 이종 폴리뉴클레오티드를 포함한다. 몇몇 양태에서, 본원에 제시된 유전적으로 변형된 숙주 세포는 UGT76G1 활성을 갖는, 폴리펩티드를 인코딩하는 이종 폴리뉴클레오티드를 포함한다. 몇몇 양태에서, 본원에 제시된 유전적으로 변형된 숙주 세포는 UGT85C2 활성을 갖는, 폴리펩티드를 인코딩하는 이종 폴리뉴클레오티드를 포함한다. 몇몇 양태에서, 본원에 제시된 유전적으로 변형된 숙주 세포는 UGT91D 활성을 갖는, 폴리펩티드를 인코딩하는 이종 폴리뉴클레오티드를 포함한다. 몇몇 양태에서, 본원에 제시된 유전적으로 변형된 숙주 세포는 UDP 글리코실 전이효소 활성을 갖는, 폴리펩티드를 인코딩하는 이종 폴리뉴클레오티드를 포함한다.

특정 양태에서, 숙주 세포는 변이체를 포함한다. 특정 양태에서, 변이체는 관련 폴리펩티드에 비해서, 최대 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 아미노산 치환을 포함할 수 있다. 특정 양태에서, 변이체는 참조 폴리펩티드에 비해서, 최대 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 보존적 아미노산 치환을 포함할 수 있다. 특정 양태에서, 본원에 기재된 핵산 중 임의의 핵산은 숙주 세포에 대해서 최적화, 예를 들어, 코돈 최적화될 수 있다.

스테비올 생합성 경로 및/또는 스테비올 글리코시드 생합성 경로의 예시적 핵산 및 효소가 아래에 기재된다.

5.1. 제라닐제라닐 디포스페이트 합성효소 ( Geranylgeranyl diphosphate synthase, GGPPS )

제라닐제라닐 디포스페이트 합성효소 (EC 2.5.1.29)는 파르네실 피로포스페이트를 제라닐제라닐 디포스페이트로 전환하는 것을 촉매한다. 효소의 설명적인 예시는 다음을 포함한다: 스테비아 레바우디아나의 효소 (수탁번호 ABD92926), 지베렐라 푸지쿠로이 ( Gibberella fujikuroi )의 효소 (수탁번호 CAA75568), 무스 무스 쿨루스(Mus musculus )의 효소 (수탁번호 AAH69913), 탈라시오시라 슈도나나 (Thalassiosira pseudonana )의 효소 (수탁번호 XP_002288339), 스트렙토마이세스 클라불리저러스(Streptomyces clavuligerus )의 효소 (수탁번호 ZP_05004570), 술풀 로부스 아시도칼다리우스 ( Sulfulobus acidocaldarius )의 효소 (수탁번호 BAA43200), 시네코코커스 sp .( Synechococcus sp .)의 효소 (수탁번호 ABC98596), 아라비돕시스 탈리아나(Arabidopsis thaliana)의 효소 (수탁번호 NP_195399), 브라케 스리아 트리스포라(Blakeslea trispora)의 효소 (수탁번호 AFC92798.1) 및 US 제2014/0329281 A1호의 효소. 이들 효소를 인코딩하는 핵산은 본원에 제시된 세포 및 방법에 유용하다. 특정 양태에서, 이들 GGPPS 핵산들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 GGPPS 효소들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법이 본원에서 제시된다.

5.2 코팔릴 디포스페이트 합성효소 ( Copalyl diphosphate synthase , CDPS)

코팔릴 디포스페이트 합성효소 (EC 5.5.1.13)는 파르네실 피로포스페이트를 제라닐제라닐 디포스페이트로 전환하는 것을 촉매한다. 효소의 설명적 예시는 스테비아 레바우디아나의 효소 (수탁번호 AAB87091), 스트렙토마이세스 클라불리저러 스의 효소 (수탁번호 EDY51667), 브래디리조비움 자포니쿰 ( Bradyrhizobium japonicum)의 효소 (수탁번호 AAC28895.1), 제아 마이스(Zea mays)의 효소 (수탁번호 AY562490), 아라비돕시스 탈리아나의 효소 (수탁번호 NM_116512), 오리자 사티 바(Oryza sativa)의 효소 (수탁번호 Q5MQ85.1) 및 US 제2014/0329281 A1호의 효소를 포함한다. 이들 효소를 인코딩하는 핵산은 본원에서 제시된 세포 및 방법에 유용하다. 특정 양태에서, 이들 CDPS 핵산들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 CDPS 효소들 중 적어도 하나에 대해서, 적어도 80%, 95%, 90%, 또는 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법이 본원에서 제시된다.

5.3 카우렌 합성효소 ( Kaurene Synthase , KS)

카우렌 합성효소 (EC 4.2.3.19)는 코팔릴 디포스페이트를 카우렌 및 디포스페이트로 전환하는 것을 촉매한다. 효소의 설명적 예시는 다음을 포함한다: 브래디리조비움 자포니쿰의 효소 (수탁번호 AAC28895.1), 파에오스파에리아 sp.(Phaeosphaeria sp .)의 효소 (수탁번호 O13284), 아라비돕시스 탈리아나의 효소 (수탁번호 Q9SAK2), 피세아 글라우카(Picea glauca)의 효소 (수탁번호 ADB55711.1) 및 US 제2014/0329281 A1호의 효소. 이들 효소를 인코딩하는 핵산은 본원에 제시된 세포 및 방법에 유용하다. 특정 양태에서, 이들 KS 핵산들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 KS 효소들 중 적어도 하나에 대해서, 적어도 80%, 85%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법이 본원에서 제시된다.

5.4 이중 기능성( bifunctional ) 코팔릴 디포스페이트 합성효소 ( CDPS ) 및 카우렌 합성효소 (KS)

CDPS-KS 이중 기능성 효소 (EC 5.5.1.13 및 EC 4.2.3.19)가 또한 이용될 수 있다. 효소의 설명적 예시는 다음을 포함한다: 포몹시스 아미그달리(Phomopsis amygdali)의 효소 (수탁번호 BAG30962), 피스코미트렐라 파텐스(Physcomitrella patens)의 효소 (수탁번호 BAF61135), 지베렐라 푸지쿠로이의 효소 (수탁번호 Q9UVY5.1) 및 US 제2014/0329281 A1호의 효소, US 제2014/0357588 A1호의 효소, US 제2015/0159188호의 효소, 및 WO 제2016/038095 A2호의 효소. 이들 효소를 인코딩하는 핵산은 본원에 제시된 세포 및 방법에 유용하다. 특정 양태에서, 이들 CDPS-KS 핵산들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 CDPS-KS 효소들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법이 본원에서 제시된다.

5.5 엔트 - 카우렌 산화효소 (KO)

엔트-카우렌 산화효소 (EC 1.14.13.78; 또한, 카우렌 산화효소라고 함)가 본원에서 기재된다. 이들 효소를 인코딩하는 핵산은 본원에 제시된 세포 및 방법에 유용하다. 특정 양태에서, 이들 카우렌 산화효소 핵산들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 카우렌 산화효소들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법이 본원에서 제시된다.

5.6. 스테비올 합성효소 ( KAH )

스테비올 합성효소, 또는 카우레노산 수산화효소 (KAH), (EC 1.14.13)는 카우레노산이 스테비올로 전환되는 것을 촉매한다. 효소의 설명적 예시는 다음을 포함한다: 스테비아 레바우디아나의 효소 (수탁번호 ACD93722), 스테비아 레바우디아 나의 효소 (서열번호 10), 아라비돕시스 탈리아나의 효소 (수탁번호 NP_197872), 비티스 비니페라(Vitis vinifera)의 효소 (수탁번호 XP_002282091), 메디카고 트룬 쿨라타(Medicago trunculata )의 효소(수탁번호 ABC59076), 및 US 제2014/0329281 A1호의 효소, US 제2014/0357588 A1호의 효소, US 제2015/0159188호의 효소, 및 WO 제2016/038095 A2호의 효소. 이들 효소를 인코딩하는 핵산은 본원에 제시된 세포 및 방법에 유용하다. 특정 양태에서, 이들 KAH 핵산들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 KAH 효소들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법이 본원에서 제시된다.

5.7 사이토크롬 P450 환원효소 (CPR)

사이토크롬 P450 환원효소 (EC 1.6.2.4)는 상기 기재된 KO 및/또는 KAH의 활성을 보조하거나 또는 용이하게 할 수 있다. 효소의 설명적 예시는 다음을 포함한다: 스테비아 레바우디아나의 효소 (수탁번호 ABB88839), 아라비돕시스 탈리아나의 효소 (수탁번호 NP_194183), 지베렐라 푸지쿠로이의 효소 (수탁번호 CAE09055), 아 르테미시아 아누아(Artemisia annua)의 효소 (수탁번호 ABC47946.1) 및 US 제2014/0329281 A1호의 효소, US 제2014/0357588 A1호의 효소, US 제2015/0159188호의 효소, 및 WO 제2016/038095 A2호의 효소. 이들 효소를 인코딩하는 핵산은 본원에서 제시된 세포 및 방법에 유용하다. 특정 양태에서, 이들 CPR 핵산들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 CPR 효소들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법이 본원에서 제시된다.

5.8. UDP 글리코실 전이효소 74G1 ( UGT74G1 )

UGT74G1은 우리딘 5'-디포스포 글리코실: 스테비올 19-COOH 전이효소 및 우리딘 5'-디포스포 글루코실: 스테비올-13-O-글루코시드 19-COOH 전이효소로서 작용할 수 있다. 도 2에서 제시된 대로, UGT74G1은 스테비올을 19-글리코시드로 전환할 수 있다. 또한, UGT74G1은 스테비올모노사이드를 루부소사이드로 전환할 수 있다. 또한, UGT74G1은 스테비올바이오사이드를 스테비오사이드로 전환할 수 있다. 효소의 설명적 예시는 스테비아 레바우디아나의 효소 (예, Richman 외, 2005, Plant J. 41: 56-67 및 US 제2014/0329281호 및 WO 제2016/038095 A2호 및 수탁번호 AAR06920.1의 효소)를 포함한다. 이들 효소를 인코딩하는 핵산은 본원에 제시된 세포 및 방법에 유용하다. 특정 양태에서, 이들 UGT74G1 핵산들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 UGT74G1 효소들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법이 본원에서 제시된다.

5.9. UDP 글리코실 전이효소 76G1 ( UGT76G1 )

UGT76G1은 글루코스 모이어티(glucose moiety)를 수용 분자(acceptor molecule)인 스테비올 1,2 글리코시드의 C-13-O-글루코스의 C-3'으로 전이시킬 수 있다. 따라서, UGT76G1은 우리딘 5'-디포스포 글루코실: 스테비올 13-O-1,2 글루코시드 C-3' 글루코실 전이효소 및 우리딘 5'-디포스포 글루코실: 스테비올-19-O-글루코스, 13-O-1,2 바이오사이드 C-3' 글루코실 전이효소로 작용할 수 있다. 도 2에서 제시된 대로, UGT76G1은 스테비올바이오사이드를 RebB로 전환할 수 있다. 또한, UGT76G1은 스테비오사이드를 RebA로 전환할 수 있다. 또한, UGT76G1은 RebD를 RebM으로 전환할 수 있다. 효소의 설명적 예시는 스테비아 레바우디아나의 효소 (예, Richman 외, 2005, Plant J. 41: 56-67 및 US 제2014/0329281 A1호 및 WO 제2016/038095 A2호 및 수탁번호 AAR06912.1의 효소)를 포함한다. 이들 효소를 인코딩하는 핵산은 본원에 제시된 세포 및 방법에 유용하다. 특정 양태에서, 이들 UGT76G1 핵산들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 UGT76G1 효소들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법이 본원에서 제시된다.

5.10. UDP 글리코실 전이효소 85C2 ( UGT85C2 )

UGT85C2는 우리딘 5'-디포스포글루코실:스테비올 13-OH 전이효소, 및 우리딘 5'-디포스포글루코실:스테비올-19-O-글루코시드 13-OH 전이효소로 작용할 수 있다. 따라서, 도 2에 제시된 대로, UGT85C2는 스테비올을 스테비올모노사이드로 전환할 수 있고, 또한, 19-글리코시드를 루부소사이드로 전환할 수 있다. 효소의 설명적 예시는 스테비아 레바우디아나 효소 (예, Richman 외, 2005, Plant J. 41: 56-67 및 US 제2014/0329281 A1호 및 WO 제2016/038095 A2호 및 수탁번호 AAR06916.1의 효소)를 포함한다. 이들 효소를 인코딩하는 핵산은 본원에서 제시된 세포 및 방법에 유용하다. 특정 양태에서, 이들 UGT85C2 핵산들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 UGT85C2 효소들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법에 본원에서 제시된다.

5.11. UDP - 글리코실 전이효소 91D ( UGT91D )

UGT91D는 우리딘 5'-디포스포글루코실:스테비올-13-O-글루코시드 전이효소로 작용하고, 글루코스 모이어티를 수용 분자인 스테비올-13-O-글루코시드 (스테비올모노사이드)의 13-O-글루코스의 C-2'로 전이하여, 스테비오바이오사이드(steviobioside)를 생산할 수 있다. 또한, UGT91D는 도 2에 제시된 대로, 우리딘 5'-디포스포글루코실:루부소사이드 전이효소로 작용하고, 글루코스 모이어티를 수용 분자인 루부소사이드의 13-O-글루코스의 C-2'에 전이하여, 스테비오사이드를 생산할 수 있다. 또한, UGT91D는 UGT91D2, UGT91D2e, 또는 UGT91D-like3이라고 한다. UGT91D 효소의 설명적 예시는 스테비아 레바우디아나의 효소(예, 수탁번호 ACE87855.1을 갖는 UGT 서열, US 제2014/0329281 A1호, WO 제2016/038095 A2호, 및 서열번호 7의 효소)를 포함한다. 이들 효소를 인코딩하는 핵산은 본원에 제시된 세포 및 방법에 유용하다. 특정 양태에서, 이들 UGT91D 핵산들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 UGT91D 효소들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법이 본원에서 제시된다.

5.12. RebA를 RebD로 전환할 수 있는 우리딘 디포스페이트 의존성 글리코 실 전이효소 (UGT _AD )

우리딘 디포스페이트-의존성 글리코실 전이효소 (UGT_AD)는 도 2에 제시된 대로, RebA의 19-O-글루코스의 C-2' 위치에 글루코스 모이어티를 전이하여, RebD를 생산할 수 있다. 또한, UGT_AD는 스테비오사이드의 19-O-글루코스의 C-2' 위치에 글루코스 모이어티를 전이하여, RebE를 생산할 수 있다. UGT의 유용한 예시는 오리자 사티바로부터 수득된 Os_UGT_91C1 (또한, Houghton-Larsen 외, WO 제2013/022989 A2호에서 EUGT11; XP_015629141.1이라고 함) 및 솔라눔 리코페르시 쿰(Solanum lycopersicum )으로부터 수득된 Sl_UGT_101249881 (또한, Markosyan 외, WO 제2014/193888 A1호에서 UGTSL2; XP_004250485.1이라고 함)을 포함한다. 추가의 유용한 UGT는 UGT40087 (XP_004982059.1), sr.UGT_9252778 (서열번호 16), Bd_UGT10840 (XP_003560669.1), Hv_UGT_V1 (BAJ94055.1), Bd_UGT10850 (XP_010230871.1), 및 Ob_UGT91B1_like (XP_006650455.1)를 포함한다. 임의의 UGT 또는 UGT 변이체는 본원에 기재된 조성물 및 방법에 이용될 수 있다. 이들 효소를 인코딩하는 핵산은 본원에서 제시된 세포 및 방법에 유용하다. 특정 양태에서, UGT들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 UGT들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 본원에 기재된 UGT 변이체를 인코딩하는 핵산이 본원에서 제시된다.

특정 양태에서, 유전적으로 변형된 숙주 세포는 UGT40087의 서열(예, 서열번호 17 또는 서열번호 18)에 대해서 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 아미노산 서열을 포함하는 UDP-글리코실 전이효소를 인코딩하는 이종 핵산을 포함한다. 특정 양태에서, 유전적으로 변형된 숙주 세포는 90%, 95%, 96%, 또는 97%를 초과하는 효율로, RebA를 RebD로 전환할 수 있다. 특정 양태에서, 유전적으로 변형된 숙주 세포는 당 수용 도메인(sugar acceptor domain)을 포함하는 UDP-글리코실 전이효소를 포함하고, 상기 당 수용 도메인의 아미노산 서열은 서열번호 17 또는 서열번호 18의 당 수용 도메인의 아미노산 서열에 대해서, 적어도 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 일치도를 가진다. 특정 양태에서, 유전적으로 변형된 숙주 세포는 loop1 아미노산 서열, 변이 loop1 아미노산 서열, loop2 아미노산 서열, 변이 loop2 아미노산 서열, loop3_1 아미노산 서열, 변이 loop3_1 아미노산 서열, loop3_2 아미노산 서열, 변이 loop3_2 아미노산 서열, loop4_1 아미노산 서열, 변이 loop4_1 아미노산 서열, loop4_2 아미노산 서열, 또는 이들의 임의의 조합을 포함하는 UDP-글리코실 전이효소를 포함한다. 특정 양태에서, 유전적으로 변형된 숙주 세포는 서열번호 17 또는 서열번호 18의 당 수용 도메인에 대해서, 적어도 61%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 아미노산 서열을 포함하는 UDP-글리코실 전이효소를 포함하고, 서열번호 17 또는 서열번호 18의 loop4_1 아미노산 서열을 더 포함한다.

본원에서 이용된, 용어 "변이 loop1" 아미노산 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개의 아미노산 삽입, 결실, 돌연변이 및/또는 치환에 의해 서열번호 17 또는 18의 참조 loop1 아미노산 서열과 상이하지만 (또는 서열번호 28의 서열을 갖는 UGT40087의 변형된 loop1 서열), 각각 서열번호 17 또는 18의 loop1 아미노산 서열 위치에 대응하는 위치에 삽입된 변이 loop1 아미노산 서열을 포함하는 UDP-글리코실 전이효소가 RebA를 RebD로 전환하는 것 및/또는 스테비오사이드를 RebE로 전환하는 것의 촉매를 허용하는 아미노산 서열을 의미한다.

본원에서 이용된, 용어 "변이 loop2" 아미노산 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개의 아미노산 삽입, 결실, 돌연변이, 및/또는 치환에 의해 서열번호 17 또는 18의 참조 loop2 아미노산 서열과 상이하지만, 각각 서열번호 17 또는 18의 loop2 아미노산 서열 위치에 대응하는 위치에 삽입된 변이 loop2 아미노산 서열을 포함하는 UDP-글리코실 전이효소가 RebA를 RebD로 전환하는 것 및/또는 스테비오사이드를 RebE로 전환하는 것의 촉매를 허용한다.

본원에서 이용된, "변이 loop3_1" 아미노산 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개의 아미노산 삽입, 결실, 돌연변이, 및/또는 치환에 의해 서열번호 17 또는 18의 참조 loop3_1 아미노산 서열과 상이하지만, 서열번호 17 또는 18의 loop3_1 아미노산 서열 위치에 대응하는 위치에 삽입된 변이 loop3_1 아미노산 서열을 포함하는 UDP-글리코실 전이효소가 RebA를 RebD로 전환하는 것 및/또는 스테비오사이드를 RebE로 전환하는 것의 촉매를 허용하는 아미노산 서열을 의미한다. 본원에서 이용된, 용어 "변이 loop3_2" 아미노산 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개의 아미노산 삽입, 결실, 돌연변이, 및/또는 치환에 의해 서열번호 17 또는 18의 참조 loop3_2 아미노산 서열과 상이하지만, 각각 서열번호 17 또는 18의 loop3_2 아미노산 서열 위치에 대응하는 위치에 삽입된 변이 loop3_2 아미노산 서열을 포함하는 UDP-글리코실 전이효소가 RebA를 RebD로 전환하는 것 및/또는 스테비오사이드를 RebE로 전환하는 것의 촉매를 허용하는 아미노산 서열을 의미한다. 특정 양태에서, 변이 loop3_2 아미노산 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 또는 최대 30개의 아미노산 삽입, 결실, 돌연변이, 및/또는 치환에 의해, 참조 loop3_2 아미노산 서열과 상이하다.

본원에서 이용된, 용어 "변이 loop4_1" 아미노산 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 또는 최대 30개의 아미노산 삽입, 결실, 돌연변이, 및/또는 치환에 의해, 서열번호 17 또는 18의 참조 loop4_1 아미노산 서열과 상이하지만, 서열번호 17 또는 18의 loop4_1 아미노산 위치에 대응하는 위치에 삽입된 변이 loop4_1 서열을 포함하는 UDP-글리코실 전이효소가 RebA가 RebD로 전환되는 것 및/또는 스테비오사이드를 RebE로 전환하는 것의 촉매를 허용하는 아미노산 서열을 의미한다.

특정 양태에서, 숙주 세포는 UGT40087의 기능성 도메인을 포함하고, 상기 UGT40087은 서열번호 17 또는 서열번호 18의 아미노산 서열을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 아미노산 서열을 포함하는 UGT40087의 N-말단 당 수용 도메인(N-terminal sugar acceptor domain)을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 아미노산 서열을 포함하는 UGT40087의 C-말단 당 공여 도메인(C-terminal sugar donor domain)을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, UGT40087의 당 수용 도메인은 서열번호 18의 아미노산 자리 1 내지 214 (서열번호 17의 아미노산 자리 1 내지 215에 대응함) 부근을 포함한다. 특정 양태에서, UGT40087의 당 공여 도메인은 서열번호 18의 아미노산 자리 215 내지 435 (서열번호 17의 아미노산 자리 216 내지 436에 대응함) 부근을 포함한다. 특정 양태에서, UGT40087의 당 수용 도메인은 서열번호 17의 아미노산 자리 1 내지 215 부근을 포함한다. 특정 양태에서, 당 공여 도메인은 서열번호 17의 아미노산 자리 216 내지 436 부근을 포함한다. 특정 양태에서, UGT40087의 당 수용 도메인 및 당 공여 도메인은 서열번호 18에 관하여, 각각 1 내지 214 또는 215 내지 435보다 더 좁은 아미노산 잔기의 범위를 포함한다. 특정 양태에서, UGT40087의 당 수용 도메인 및 당 공여 도메인은 서열번호 17에 관하여, 각각 1 내지 215 또는 216 내지 436보다 더 좁은 아미노산 잔기의 범위를 포함한다.

특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 실질적으로 동일한 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 60% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 65% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 70% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 75% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 80% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 85% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 90% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 95% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 96% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 97% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 98% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 99% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 60%, 적어도 99%, 또는 60% 내지 90% 사이의 임의의 백분율이 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포가 본원에서 제시된다.

특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열을 포함하는 UGT40087을 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열과 실질적으로 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 60% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 65% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 70% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 75% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 80% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 85% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 90% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 95% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 96% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 97% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 98% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 99% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다.

특정 양태에서, UGT40087 및 다른 UDP-글리코실 전이효소의 3차원 모델링된 구조가 비교 및 분석되는 경우에, 이들은 N-말단 당 수용 도메인에서 유의한 구조적 차이점을 지닌 4개의 루프 (즉, loop1, loop2, loop3, 및 loop4)를 드러냈다. 2개의 UGT 사이에서 대응하는 루프 서열의 교환으로부터 획득된 실험 결과는 UGT40087의 loop1, loop2, loop3_1, loop3_2, 및 loop4_1이, RebA를 RebD로 전환시킬 수 있는 다른 UDP-글리코실 전이효소로부터 비롯된 이들의 각각 대응하는 루프 서열로 치환될 수 있다는 것을 나타냈다. 이들 양태에서, 두 버전의 loop3 (즉, loop3_1 및 loop3_2) 및 loop_4 (즉, loop4_1 및 loop4_2)가 2개의 가능한 루프 길이를 고려하여 설계되었다.

따라서, 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 아미노산 서열을 포함하는 UDP-글리코실 전이효소를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 아미노산 서열을 포함하는 UDP-글리코실 전이효소를 인코딩하는 이종 핵산을 포함한다. 특정 양태에서, UDP-글리코실 전이효소는 UGT40087 (즉, 서열번호 17 또는 18)의 loop1 아미노산 서열을, 각각 서열번호 17 또는 18의 loop1 위치에 대응하는 UDP-글리코실 전이효소의 위치에서 더 포함한다. 특정 양태에서, 서열번호 17 또는 18의 loop1 아미노산 서열은 서열번호 30의 아미노산 서열을 가진다. 특정 양태에서, loop1 아미노산 서열은 서열번호 28의 서열을 가진다. 특정 양태에서, UDP-글리코실 전이효소는 변이 loop1 아미노산 서열을, 각각 서열번호 17 또는 18의 loop1 위치에 대응하는 UDP-글리코실 전이효소의 위치에서 더 포함한다. 변이 loop1 아미노산 서열은 서열번호 17 또는 18의 참조 loop1 아미노산 서열 또는 서열번호 28을 갖는 loop1 아미노산 서열과 상이하지만, 변이 loop1 아미노산을 포함하는 UDP-글리코실 전이효소가, RebA를 RebD로 전환하고/하거나 스테비오사이드를 RebE로 전환하는 이의 활성을 유지하도록 허용하는 아미노산 서열을 의미한다.

특정 양태에서, UDP-글리코실 전이효소는 UGT40087 (즉, 서열번호 17 또는 18)의 loop2 아미노산 서열을, 각각 서열번호 17 또는 18의 loop2 위치에 대응하는 UDP-글리코실 전이효소의 위치에서 더 포함한다. 특정 양태에서, 서열번호 17 또는 18의 loop2 아미노산 서열은 서열번호 24의 아미노산 서열을 가진다. 특정 양태에서, UDP-글리코실 전이효소는 변이 loop2 아미노산 서열을, 각각 서열번호 17 또는 18의 loop2 위치에 대응하는 UDP-글리코실 전이효소의 위치에서 더 포함한다. 변이 loop2 아미노산 서열은 서열번호 17 또는 18의 참조 loop2 아미노산 서열과 상아하지만, 변이 loop2 아미노산을 포함하는 UDP-글리코실 전이효소가 RebA를 RebD로 전환하고/하거나 스테비오사이드를 RebE로 전환하는 이의 활성을 유지하도록 허용하는 아미노산 서열을 의미한다.

특정 양태에서, UDP-글리코실 전이효소는 UGT40087 (즉, 서열번호 17 또는 18)의 loop3_1 아미노산 서열을, 각각 서열번호 17 또는 18의 loop3_1 위치에 대응하는 UDP-글리코실 전이효소의 위치에서 더 포함한다. 특정 양태에서, 서열번호 17 또는 18의 loop3_1 아미노산 서열은 서열번호 25의 아미노산 서열을 가진다. 특정 양태에서, UDP-글리코실 전이효소는 변이 loop3_1 아미노산 서열을, 각각 서열번호 17 또는 18의 loop3_1 위치에 대응하는 UDP-글리코실 전이효소의 위치에서 더 포함한다. 변이 loop3_1 아미노산 서열은 서열번호 17 또는 18의 참조 loop3_1 아미노산 서열과 상이하지만, 변이 loop3_1 아미노산을 포함하는 UDP-글리코실 전이효소가 RebA를 RebD로 전환하고/하거나 스테비오사이드를 RebE로 전환하는 이의 활성을 유지하도록 허용하는 아미노산 서열을 의미한다.

특정 양태에서, UDP-글리코실 전이효소는 UGT40087 (즉, 서열번호 17 또는 18)의 loop3_2 아미노산 서열을, 각각 서열번호 17 또는 18의 loop3_2 위치에 대응하는 UDP-글리코실 전이효소의 위치에서 더 포함한다. 특정 양태에서, 서열번호 17 또는 18의 loop3_2 아미노산 서열은 서열번호 26의 아미노산 서열을 가진다. 특정 양태에서, UDP-글리코실 전이효소는 변이 loop3_2 아미노산 서열을, 각각 서열번호 17 또는 18의 loop3_2 위치에 대응하는 UDP-글리코실 전이효소의 위치에서 더 포함한다. 변이 loop3_2 아미노산 서열은 서열번호 17 또는 18의 참조 loop3_2 아미노산 서열과 상이하지만, 변이 loop3_2 아미노산을 포함하는 UDP-글리코실 전이효소가 RebA를 RebD로 전환하고/하거나 스테비오사이드를 RebE로 전환하는 이의 활성을 유지하도록 허용하는 아미노산 서열을 의미한다.

특정 양태에서, UDP-글리코실 전이효소는 UGT40087 (즉, 서열번호 17 또는 18)의 loop4_1 아미노산 서열을, 각각 서열번호 17 또는 18의 loop4_1 위치에 대응하는 UDP-글리코실 전이효소의 위치에서 더 포함한다. 특정 양태에서, 서열번호 17 또는 18의 loop4_1 아미노산 서열은 서열번호 27의 아미노산 서열을 가진다. 특정 양태에서, UDP-글리코실 전이효소는 변이 loop4_1 아미노산 서열을, 각각 서열번호 17 또는 18의 loop4_1 위치에 대응하는 UDP-글리코실 전이효소의 위치에서 더 포함한다. 변이 loop4_1 아미노산 서열은 서열번호 17 또는 18의 참조 loop4_1 아미노산 서열과 상이하지만, 변이 loop4_1 아미노산을 포함하는 UDP-글리코실 전이효소가 RebA를 RebD로 전환하고/하거나 스테비오사이드를 RebE로 전환하는 이의 활성을 유지하도록 허용하는 아미노산 서열을 의미한다.

특정 양태에서, UDP-글리코실 전이효소는 UGT40087 (즉, 서열번호 17 또는 18)의 loop4_2 아미노산 서열을, 각각 서열번호 17 또는 18의 loop4_2 위치에 대응하는 UDP-글리코실 전이효소의 위치에서 더 포함한다. 서열번호 17 또는 18의 loop4_2 아미노산 서열은 서열번호 28의 아미노산 서열을 가진다.

특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 아미노산 서열을 포함하는 UDP-글리코실 전이효소, 또는 이의 UDP-글리코실 전이효소를 인코딩하는 이종 핵산을 포함하고, 다음 중 임의의 조합을 더 포함한다:

(a) 서열번호 17 또는 18의 loop1 아미노산 서열, 서열번호 30의 아미노산 서열, 또는 변이 loop1 아미노산 서열을, 각각 서열번호 17 또는 18의 loop1 위치에 대응하는 UDP-글리코실 전이효소의 위치에서;

(b) 서열번호 17 또는 18의 loop2 아미노산 서열, 또는 변이 loop2 아미노산 서열을, 각각 서열번호 17 또는 18의 loop2 위치에 대응하는 UDP-글리코실 전이효소의 위치에서;

(c) 서열번호 17 또는 18의 loop3_1 아미노산 서열, 또는 변이 loop3_1 아미노산 서열을, 각각 서열번호 17 또는 18의 loop 3_1 위치에 대응하는 UDP-글리코실 전이효소의 위치에서;

(d) 서열번호 17 또는 18의 loop3_2 아미노산 서열, 또는 변이 loop3_2 아미노산 서열을, 각각 서열번호 17 또는 18의 loop3_2 위치에 대응하는 UDP-글리코실 전이효소의 위치에서;

(e) 서열번호 17 또는 18의 loop4_1 아미노산 서열, 또는 변이 loop4_1 아미노산 서열을, 각각 서열번호 17 또는 18의 loop4_1 위치에 대응하는 UDP-글리코실 전이효소의 위치에서; 및

(f) 서열번호 17 또는 18의 loop4_2 아미노산 서열을, 각각 서열번호 17 또는 18의 loop4_2 위치에 대응하는 UDP-글리코실 전이효소의 위치에서.

특정 양태에서, RebA를 RebD로 전환할 수 있는 UDP-글리코실 전이효소의 3차원 모델링된 구조가 비교 및 분석될 때, UGT40087의 loop4_1이 다른 UDP-글리코실 전이효소의 대응하는 loop4_1 위치로 포함되는 (이의 천연 loop4_1 아미노산 서열을 대체하는) 경우에, 상기 loop4_1이 RebA를 RebD로 전환하는 이의 능력의 관점에서, 변이 UDP-글리코실 전이효소의 우수한 활성을 초래한다는 것이 발견되었다. 실시예 12를 참고한다. 이들 결과는 임의의 적합한 UDP-글리코실 전이효소의 loop4_1 아미노산 서열이 서열번호 17 또는 18의 loop4_1 아미노산 서열과 치환되어, RebA를 RebD로 전환할 수 있다는 것을 나타낸다.

그러므로, 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열과 적어도 61%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 일치하는 아미노산 서열을 포함하는 UDP-글리코실 전이효소를 포함하고, UGT40087 (즉, 서열번호 17 또는 18)의 loop4_1 아미노산 서열 (즉, 서열번호 27)을 더 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열과 적어도 61%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 일치하는 아미노산 서열을 포함하는 UDP-글리코실 전이효소를 인코딩하는 이종 핵산을 포함하고, 서열번호 17 또는 18의 loop4_1 아미노산 서열 (즉, 서열번호 27)을 더 포함한다. 특정 양태에서, 서열번호 17 또는 18에 대해서 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%인 아미노산 서열을 포함하는 임의의 적합한 UDP-글리코실 전이효소는 서열번호 17 또는 18로부터의 loop4_1 아미노산 서열을 이의 대응하는 loop4_1 위치에 통합하는 데 (이의 천연 loop4_1 아미노산 서열을 대체하는) 이용될 수 있다. 예를 들어, Ob_UGT91B_like, Hv_UGT_V1, Sl_UGT_101249881, Sr.UGT_g252778, Os_UGT_91C1, Bd_UGT10840, Bd_UGT10850, 또는 Si91Dlike는 서열번호 17 또는 18로부터의 loop4_1 아미노산 서열을 이의 대응하는 loop4_1 위치에 통합하는 데 기본으로 이용될 수 있다. 특정 양태에서, UDP-글리코실 전이효소는 서열번호 33의 아미노산 서열을 포함한다.

특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열과 실질적으로 동일한 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 60% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 65% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 70% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 75% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 80% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 85% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 90% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 95% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 96% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 97% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 98% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 99% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다.

특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열을 포함하는 UGT40087을 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열과 실질적으로 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 60% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 65% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 70% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 75% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 80% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 85% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 90% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 95% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 96% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 97% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 98% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 99% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다.

따라서, 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 일치하는 아미노산 서열을 포함하는 UDP-글리코실 전이효소를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 일치하는 아미노산 서열을 포함하는 UDP-글리코실 전이효소를 인코딩하는 이종 핵산을 포함한다. 특정 양태에서, UDP-글리코실 전이효소는 다른 UDP-글리코실 전이효소로부터 비롯된 C-말단 당 공여 도메인을 더 포함한다. 적합한 C-말단 당 공여 도메인을 갖는 다른 UDP-글리코실 전이효소의 예시는 Ob_UGT91B_like, Hv_UGT_V1, SI_UGT_101249881, Sr.UGT_g252778, Os_UGT_91C1, Bd_UGT10840, Bd_UGT10850, 또는 Si91Dlike를 포함한다.

특정 양태에서, N-말단 당 수용 도메인 내에 있는 특정 아미노산 잔기가 비-기능성인, 추정상의(putative) UDP-글리코실 전이효소를 활성 UDP-글리코실 전이효소로 만드는 촉매 활성을 회복시킬 수 있다는 것이 발견되었다. 그러므로, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 아미노산 서열을 포함하는 UDP-글리코실 전이효소를 포함하고, 아래의 아미노산 잔기들 중 하나 이상을 추가로 포함하는데;

(a) 서열번호 18의 아미노산 자리 11에 대응하는 UDP-글리코실 전이효소의 아미노산 자리에서, 발린;

(b) 서열번호 18의 아미노산 자리 12에 대응하는 UDP-글리코실 전이효소의 아미노산 자리에서, 이소류신;

(c) 서열번호 18의 아미노산 자리 55에 대응하는 UDP-글리코실 전이효소의 아미노산 자리에서, 프롤린;

(d) 서열번호 18의 아미노산 자리 90에 대응하는 UDP-글리코실 전이효소의 아미노산 자리에서, 글루탐산;

(e) 서열번호 18의 아미노산 자리 203에 대응하는 UDP-글리코실 전이효소의 아미노산 자리에서, 세린;

(f) 서열번호 18의 아미노산 자리 223에 대응하는 UDP-글리코실 전이효소의 아미노산 자리에서, 글루탐산; 또는

(g) 서열번호 18의 아미노산 자리 413에 대응하는 UDP-글리코실 전이효소의 아미노산 자리에서, 발린,

서열번호 18의 아미노산 자리에 대응하는 UDP-글리코실 전이효소의 아미노산 자리는 서열 정렬에 의해 결정된다.

특정 양태에서, 숙주 세포는 서열번호 32의 아미노산 서열을 포함하는 UDP-글리코실 전이효소를 포함한다.

특정 양태에서, 숙주 세포는 상기 기재된 UGT40087 폴리펩티드의 변이체를 포함한다. 특정 양태에서, 변이체는 UGT40087 폴리펩티드에 비해서, 최대 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 아미노산 치환을 포함할 수 있다. 특정 양태에서, 변이체는 UGT40087 폴리펩티드에 비해서, 최대 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 보존적 아미노산 치환을 포함할 수 있다. 특정 양태에서, 본원에 기재된 핵산들 중 임의의 핵산은 숙주 세포에 대해서 최적화될 수 있으며, 예를 들어, 코돈 최적화될 수 있다. 유용한 핵산은 서열번호 35 및 36을 포함한다.

6. MEV 경로 FPP 및/또는 GGPP 생산

몇몇 양태에서, 본원에서 제시된 유전적으로 변형된 숙주 세포는 FPP 및/또는 GGPP의 형성에 유용한 MEV 경로의 하나 이상의 이종 효소를 포함한다. 도 1d를 참고한다. 몇몇 양태에서, MEV 경로의 하나 이상의 효소는 아세틸-CoA를 말로닐-CoA(malonyl-CoA)와 축합하여(condensing), 아세토아세틸-CoA를 형성하는 효소를 포함한다. 몇몇 양태에서, MEV 경로의 하나 이상의 효소는 두 분자의 아세틸-CoA를 축합하여, 아세토아세틸-CoA를 형성하는 효소를 포함한다. 몇몇 양태에서, MEV 경로의 하나 이상의 효소는 아세토아세틸-CoA와 아세틸-CoA를 축합하여, HMG-CoA를 형성하는 효소를 포함한다. 몇몇 양태에서, MEV 경로의 하나 이상의 효소는 HMG-CoA를 메발로네이트로 전환하는 효소를 포함한다. 몇몇 양태에서, MEV 경로의 하나 이상의 효소는 메발로네이트를 메발로네이트 5-포스페이트로 인산화시키는(phosphorylating) 효소를 포함한다. 몇몇 양태에서, MEV 경로의 하나 이상의 효소는 메발로네이트 5-포스페이트를 메발로네이트 5-피로포스페이트로 전환하는 효소를 포함한다. 몇몇 양태에서, MEV 경로의 하나 이상의 효소는 메발로네이트 5-피로포스페이트를 이소펜테닐 피로포스페이트로 전환하는 효소를 포함한다.

몇몇 양태에서, MEV 경로의 하나 이상의 효소는 아세틸-CoA 티올라제(acetyl-CoA thiolase), 아세토아세틸-CoA 합성효소, HMG-CoA 합성효소, HMG-CoA 환원효소, 메발로네이트 인산화효소, 포스포메발로네이트 인산화효소 및 메발로네이트 피로포스페이트 탈탄산효소(mevalonate pyrophosphate decarboxylase)로 이루어진 군으로부터 선택된다. 몇몇 양태에서, 아세토아세틸-CoA의 형성을 촉매할 수 있는 MEV 경로의 효소에 대해서, 유전적으로 변형된 숙주 세포는 두 분자의 아세틸-CoA를 축합시켜, 아세토아세틸-CoA를 형성하는 효소, 예를 들어, 아세틸-CoA 티올라제; 또는 아세틸-CoA를 말로닐-CoA와 축합시켜, 아세토아세틸-CoA를 형성하는 효소, 예를 들어, 아세토아세틸-CoA 합성효소; 중 하나를 포함한다. 몇몇 양태에서, 유전적으로 변형된 숙주 세포는 두 분자의 아세틸-CoA를 축합시켜, 아세토아세틸-CoA를 형성하는 효소, 예를 들어, 아세틸-CoA 티올라제; 및 아세틸-CoA를 말로닐-CoA와 축합시켜, 아세토아세틸-CoA를 형성하는 효소, 예를 들어, 아세토아세틸-CoA 합성효소; 모두를 포함한다.

몇몇 양태에서, 숙주 세포는 MEV 경로의 1개보다 많은 효소를 인코딩하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 숙주 세포는 MEV 경로의 2개의 효소를 인코딩하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 숙주 세포는 HMG-CoA를 메발로네이트로 전환할 수 있는 효소 및 메발로네이트를 메발로네이트 5-포스페이트로 전환할 수 있는 효소를 인코딩하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 숙주 세포는 MEV 경로의 3개의 효소를 인코딩하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 숙주 세포는 MEV 경로의 4개의 효소를 인코딩하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 숙주 세포는 MEV 경로의 5개의 효소를 인코딩하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 숙주 세포는 MEV 경로의 6개의 효소를 인코딩하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 숙주 세포는 MEV 경로의 7개의 효소를 인코딩하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 숙주 세포는 MEV 경로의 모든 효소를 인코딩하는 복수의 이종 뉴클레오티드 서열을 포함한다.

몇몇 양태에서, 유전적으로 변형된 숙주 세포는 이소펜테닐 피로포스페이트 (isopentenyl pyrophosphate, IPP)를 디메틸알릴 피로포스페이트 (dimethylallyl pyrophosphate, DMAPP)로 전환할 수 있는 효소를 인코딩하는 이종 핵산을 더 포함한다. 몇몇 양태에서, 유전적으로 변형된 숙주 세포는 IPP 및/또는 DMAPP 분자를 축합하여, 폴리프레닐 화합물(polyprenyl compound)을 형성할 수 있는 효소를 인코딩하는 이종 핵산을 더 포함한다. 몇몇 양태에서, 유전적으로 변형된 숙주 세포는 IPP 또는 폴리프레닐을 변형하여, FPP와 같은 이소프레노이드 화합물(isoprenoid compound)을 형성할 수 있는 효소를 인코딩하는 이종 핵산을 더 포함한다.

6.1. 아세토아세틸 - CoA로의 아세틸- CoA의 전환

몇몇 양태에서, 유전적으로 변형된 숙주 세포는 두 분자의 아세틸-조효소 A를 축합하여, 아세토아세틸-CoA를 형성하는 효소, 예를 들어, 아세틸-CoA 티올라제를 인코딩하는 이종 뉴클레오티드 서열을 포함한다. 이러한 효소를 인코딩하는 뉴클레오티드 서열의 설명적 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: (NC_000913 REGION: 2324131.2325315; 에세리키아 콜라이), (D49362; 파라코커스데 니트리피칸스(Paracoccus denitrificans)),및 (L20428; 사카로마이세스 세레비시아).

아세틸-CoA 티올라제는 두 분자의 아세틸-CoA의 가역적 축합반응을 촉매하여, 아세토아세틸-CoA를 수득하지만, 이 반응은 열역학적으로 불리하고(thermodynamically unfavorable), 아세토아세틸-CoA 티올 첨가분해(acetoacetyl-CoA thiolysis)가 아세토아세틸-CoA 합성보다 선호된다. 아세토아세틸-CoA 합성효소 (Acetoacetyl-CoA synthase, AACS) (대안적으로는, 아세틸-CoA:말로닐-CoA 아실전이효소(malonyl-CoA acyltransferase); EC 2.3.1.194라고 함)는 아세틸-CoA를 말로닐-CoA와 축합시켜, 아세토아세틸-CoA를 형성한다. 아세틸-CoA 티올라제와 대조적으로, AACS에 의해 촉매된 아세토아세틸-CoA 합성은, 말로닐-CoA의 관련 탈탄산 반응으로 인하여, 본질적으로 에너지 관점에서 유리한 반응(energy-favored reaction)이다. 또한, AACS는 아세토아세틸-CoA에 대한 티올 첨가분해 활성(thiolysis activity)을 보이지 않으므로, 반응은 비가역적이다.

아세틸-CoA 티올라제 및 이종 ADA 및/또는 포스포트랜스아세틸라제 (phosphotransacetylase, PTA)를 포함하는 숙주 세포에서, 아세토아세틸-CoA 티올 첨가분해를 선호하는 아세틸-CoA 티올라제에 의해 촉매된 가역적 반응은 큰 아세틸-CoA 풀(pool)을 야기할 수 있다. ADA의 가역적인 활성을 고려하면, 상기 아세틸-CoA 풀은 결국, ADA가 아세틸-CoA를 아세트알데히드로 전환시키는 가역적인 반응으로 향하도록 유도할 수 있으므로, 아세틸-CoA 생산을 향하는 ADA에 의해 제공되는 이점을 약화시킨다. 마찬가지로, PTA의 활성은 가역적이므로, 큰 아세틸-CoA 풀은 PTA가 아세틸-CoA를 아세틸 포스페이트로 전환시키는 가역적인 반응을 향하도록 유도할 수 있다. 그러므로, 몇몇 양태에서, ADA 및 PTA의 정반응을 유도하도록 아세틸-CoA에 대한 강력한 우위(pull)를 제공하기 위해, 본원에서 제시된 유전적으로 변형된 숙주 세포의 MEV 경로는 아세토아세틸-CoA 합성효소를 활용하여, 아세틸-CoA와 말로닐-CoA로부터 아세토아세틸-CoA를 형성한다.

몇몇 양태에서, AACS는 스트렙토마이세스 sp. 균주 CL190로부터 수득된다 (Okamura 외, Proc Natl Acad Sci USA 107(25):11265-70 (2010). 스트렙토마이세스 sp. 균주 CL190의 대표적인 AACS 뉴클레오티드 서열은 수탁번호 AB540131.1을 포함한다. 스트렙토마이세스 sp. 균주 CL190의 대표적인 AACS 단백질 서열은 수탁번호 D7URV0, BAJ10048를 포함한다. 본원에 제시된 조성물 및 방법에 유용한 다른 아세토아세틸-CoA 합성효소는 다음을 포함하나, 이에 한정되는 것은 아니다: 스트렙토마이세스 sp. (AB183750; KO-3988 BAD86806); S. 아눌라투스(S. anulatus ) 균주 9663 (FN178498; CAX48662); 스트렙토마이세스 sp. KO-3988 (AB212624; BAE78983); 악티노플라네스 sp.(Actinoplanes sp .) A40644 (AB113568; BAD07381); 스트렙토마이세스 sp. C (NZ_ACEW010000640; ZP_05511702); 노카디옵시스 다손빌레이 (Nocardiopsis dassonvillei ) DSM 43111 (NZ_ABUI01000023; ZP_04335288); 마이 코박테리움 울세란스 (Mycobacterium ulcerans ) Agy99 (NC_008611; YP_907152); 마이코박테리움 마리눔 (Mycobacterium marinum ) M (NC_010612; YP_001851502); 스트 렙토마이세스 sp. Mg1 (NZ_DS570501; ZP_05002626); 스트렙토마이세스 sp. AA4 (NZ_ACEV01000037; ZP_05478992); S. 로세오스포루스(S. roseosporus ) NRRL 15998 (NZ_ABYB01000295; ZP_04696763); 스트렙토마이세스 sp. ACTE (NZ_ADFD01000030; ZP_06275834); S. 비리도크로모게네스(S. viridochromogenes ) DSM 40736 (NZ_ACEZ01000031; ZP_05529691); 프랑키아 sp.(Frankia sp .) CcI3 (NC_007777; YP_480101); 노카디아 브라실리엔시스 ( Nocardia brasiliensis ) (NC_018681; YP_006812440.1); 및 오스트윅키아 첼로네(Austwickia chelonae) (NZ_BAGZ01000005; ZP_10950493.1). 추가의 적합한 아세토아세틸-CoA 합성효소는 미국 특허출원 공보 제2010/0285549호 및 제2011/0281315호에 기재된 효소들을 포함하며, 이들 공보는 이의 전체 기재내용이 본원에 참고로 포함된다.

본원에서 제시된 조성물 및 방법에 또한 유용한 아세토아세틸-CoA 합성효소는 본원에 기재된 아세토아세틸-CoA 합성효소들 중 임의의 효소의 "유도체"라고 하는 분자를 포함한다. 이러한 "유도체"는 다음의 특징을 가진다: (1) 본원에 기재된 아세토아세틸-CoA 합성효소들 중 임의의 효소와 실질적 상동성(substantial homology)을 공유함; 및 (2) 아세틸-CoA와 말로닐-CoA의 비가역적인 축합반응을 촉매하여, 아세토아세틸-CoA를 형성할 수 있음. 아세토아세틸-CoA 합성효소의 유도체는, 유도체의 아미노산 서열이 아세토아세틸-CoA 합성효소의 아미노산 서열과 적어도 80%, 더욱 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 동일한 경우에, 아세토아세틸-CoA 합성효소와 "실질적 상동성"을 공유한다고 일컬어진다.

6.2. HMG - CoA로의 아세토아세틸 - CoA의 전환

몇몇 양태에서, 숙주 세포는 아세토아세틸-CoA와 다른 분자의 아세틸-CoA를 축합시켜, 3-히드록시-3-메틸글루타릴-CoA(3-hydroxy-3-methylglutaryl-CoA, HMG-CoA)를 형성할 수 있는 효소, 예를 들어, HMG-CoA 합성효소를 인코딩하는 이종 뉴클레오티드 서열을 포함한다. 이러한 효소를 인코딩하는 뉴클레오티드 서열의 설명적 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: (NC_001145. complement 19061.20536; 사카로마이세스 세레비시아), (X96617; 사카로마이세스 세레비시아), (X83882; 아라비돕시스 탈리아나), (AB037907; 키타사토스포라 그리세올라(Kitasatospora griseola )), (BT007302; 호모 사피엔스), 및 (NC_002758, Locus tag SAV2546, GeneID 1122571; 스타필로코커스 아우레우스).

6.3. 메발로네이트로의 HMG - CoA의 전환

몇몇 양태에서, 숙주 세포는 HMG-CoA를 메발로네이트로 전환할 수 있는 효소, 예를 들어, HMG-CoA 환원효소를 인코딩하는 이종 뉴클레오티드 서열을 포함한다. 몇몇 양태에서, HMG-CoA 환원효소는 NADH-이용 히드록시메틸글루타릴-CoA 환원효소-CoA 환원효소(NADH-using hydroxymethylglutaryl-CoA reductase-CoA reductase)이다. HMG-CoA 환원효소는 (EC 1.1.1.34; EC 1.1.1.88) (S)-HMG-CoA가 (R)-메발로네이트로되는 환원적 탈아실화 반응(reductive deacylation)을 촉매하고, 두 클래스인 클래스 I 및 클래스 II HMGr로 분류될 수 있다. 클래스 I은 진핵생물, 대부분 고세균으로부터 비롯된 효소를 포함하고, 클래스 II는 특정 원핵생물 및 고세균의 HMG-CoA 환원효소를 포함한다. 서열의 분화(divergence)에 더하여, 두 클래스의 효소는 또한 이들의 보조인자 특이도(cofactor specificity)에 대해서 상이하다. NADPH를 배타적으로 활용하는 클래스 I 효소와 달리, 클래스 II HMG-CoA 환원효소는 NADPH와 NADH를 식별하는 능력이 다양하다. 예를 들어, Hedl 외, Journal of Bacteriology 186 (7): 1927-1932 (2004)를 참고한다. 클래스 II HMG-CoA 환원효소의 선택을 위한 보조인자 특이도는 아래에서 제시된다.

[표: 클래스 II HMG - CoA 환원효소의 선택을 위한 보조인자 특이도]

본원에 제시된 조성물 및 방법에 대해서 유용한 HMG-CoA 환원효소는 보조인자로서 NADH를 활용할 수 있는 HMG-CoA 환원효소, 예를 들어, P. 메발로니 , A. 폴 지두스 또는 S. 아우레우스로부터 수득된 HMG-CoA 환원효소를 포함한다. 특정 양태에서, HMG-CoA 환원효소는 보조인자로서 NADH만 활용할 수 있고, 예를 들어, P. 메발로니, S. 포메로이 (S. pomeroyi ) 또는 D. 아시도보란스(D. acidovorans)로부터 수득된 HMG-CoA 환원효소이다.

몇몇 양태에서, NADH-이용 HMG-CoA 환원효소는 슈도모나스 메발로니로부터 수득된다. HMG-CoA 환원효소 (EC 1.1.1.88)를 인코딩하는 슈도모나스 메발로니로니의 야생형 mvaA 유전자의 서열은 이전에 기재되었다. Beach 및 Rodwell, J. Bacteriol. 171:2994-3001 (1989)를 참고한다. 슈도모나스 메발로니로니의 대표적인 mvaA 뉴클레오티드 서열은 수탁번호 M24015를 포함한다. 슈도모나스 메발로니로니의 대표적인 HMG-CoA 환원효소 단백질 서열은 수탁번호 AAA25837, P13702, MVAA_PSEMV를 포함한다.

몇몇 양태에서, NADH-이용 HMG-CoA 환원효소(NADH-using HMG-CoA reductase)는 실리시박터 포메로이 ( Silicibacter pomeroyi )로부터 수득된다. 실리시박터 포메로이의 대표적인 HMG-CoA 환원효소 뉴클레오티드 서열은 수탁번호 NC_006569.1을 포함한다. 실리시박터 포메로이의 대표적인 HMG-CoA 환원효소 단백질 서열은 수탁번호 YP_164994를 포함한다.

몇몇 양태에서, NADH-이용 HMG-CoA 환원효소는 델프티아 아시도보란 스(Delftia acidovorans )로부터 수득된다. 델프티아 아시도보란스의 대표적인 HMG-CoA 환원효소 뉴클레오티드 서열은 NC_010002 REGION: complement (319980..321269)를 포함한다. 델프티아 아시도보란스의 대표적인 HMG-CoA 환원효소 단백질 서열은 수탁번호 YP_001561318을 포함한다.

몇몇 양태에서, NADH-이용 HMG-CoA 환원효소는 솔라눔 투베로숨(Solanum tuberosum)으로부터 수득된다 (Crane 외, J. Plant Physiol . 159:1301-1307 (2002)).

또한, 본원에 제시된 조성물 및 방법에 유용한 NADH-이용 HMG-CoA 환원효소는 예를 들어, P. 메발로니 , S. 포메로이 및 D. 아시도보란스로부터 수득된 본원에 기재된 NADH-이용 HMG-CoA 환원효소들 중 임의의 효소의 "유도체"라고 하는 분자들을 포함한다. 이러한 "유도체"는 다음의 특징을 갖는다: (1) 본원에 기재된 NADH-이용 HMG-CoA 환원효소들 중 임의의 효소와 실질적 상동성을 공유함; 및 (2) NADH를 보조인자로 우선적으로 이용하며, (S)-HMG-CoA를 (R)-메발로네이트로 만드는 환원적 탈아실화 반응을 촉매할 수 있음. NADH-이용 HMG-CoA 환원효소의 유도체는, 유도체의 아미노산 서열이 NADH-이용 HMG-CoA 환원효소의 아미노산 서열과 적어도 80%, 더욱 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 동일한 경우에, NADH-이용 HMG-CoA 환원효소와 "실질적 상동성"을 공유한다고 일컬어진다.

본원에서 이용된, 구절 "NADH-이용 (NADH-using)"은 NADH-이용 HMG-CoA 환원효소가, 예를 들어, NADPH보다 NADH에 대한 더 높은 특이 활성을 입증함으로써, 보조인자로서 NADPH보다 NADH에 선택적이라는 것을 의미한다. 몇몇 양태에서, 보조인자로서 NADH에 대한 선택성(selectivity)은 k _cat ⁽ ^NADH ⁾/ k _cat ⁽ ^NADPH ⁾ 비율로 표현된다. 몇몇 양태에서, NADH-이용 HMG-CoA 환원효소는 적어도 5, 10, 15, 20, 25 또는 25를 초과하는 k _cat ⁽ ^NADH ⁾/ k _cat ⁽ ^NADPH ⁾ 비율을 가진다. 몇몇 양태에서, NADH-이용 HMG-CoA 환원효소는 NADH를 배타적으로 이용한다. 예를 들어, NADH를 배타적으로 이용하는 NADH-이용 HMG-CoA 환원효소는 시험관 내에서 단독 보조인자(sole cofactor)로 공급된 NADH와 약간의 활성을 보이고, NADPH가 단독 보조인자로 공급되는 경우에, 검출가능한 활성을 보이지 않는다. 당해분야에 공지된 보조인자 특이도를 측정하는 임의의 방법이 활용되어, 보조인자로서 NADH에 대한 선호를 갖는 HMG-CoA 환원효소를 확인할 수 있고, 이들 효소는 Kim 외, Protein Science 9:1226-1234 (2000); 및 Wilding 외, J. Bacteriol . 182(18):5147-52 (2000)에 의해 기재된 효소들을 포함하며, 이들 문헌의 내용은 이의 기재내용이 본원에 참고로 포함된다.

몇몇 양태에서, NADH-이용 HMG-CoA 환원효소는 NADPH 보다 NADH에 대해서 선택적이도록, 예를 들어, 보조인자-결합 포켓(cofactor-biding pocket)의 부위-지정 돌연변이 유발(site-directed mutagenesis)을 통해서 조작된다. NADH-선택성을 조작하는 방법은 Watanabe 외, Microbiology 153:3044-3054 (2007)에 기재되어 있고, HMG-CoA 환원효소의 보조인자 특이도를 측정하는 방법은 Kim 외, Protein Sci . 9:1226-1234 (2000)에 기재되어 있으며, 이들 문헌의 내용은 이의 전체 기재내용이 본원에 참고로 포함된다.

몇몇 양태에서, NADH-이용 HMG-CoA 환원효소는 메발로네이트 분해 경로(degradative pathway)를 선천적으로 포함하는 숙주 종, 예를 들어, 이의 단독 탄소 공급원으로서 메발로네이트를 촉매하는 숙주 종으로부터 유래된다. 이들 양태 내에서, 이의 천연 숙주 세포 내에 내재화된(internalized) (R)-메발로네이트를 (S)-HMG-CoA로 만드는 산화적 아실화 반응(oxidative acylation)을 정상적으로 촉매하는 NADH-이용 HMG-CoA 환원효소가 활용되어, 역반응, 즉, 메발로네이트 생합성 경로를 포함하는 유전적으로 변형된 숙주 세포에서 (S)-HMG-CoA를 (R)-메발로네이트로 만드는 환원적 탈아실화를 촉매한다. 메발로네이트를 단독 탄소 공급원으로 하는, 메발로네이트에서 성장할 수 있는 원핵생물은 다음의 문헌에 의해 기재되고: Anderson 외, J. Bacteriol , 171(12):6468-6472 (1989); Beach 외, J. Bacteriol . 171:2994-3001 (1989); Bensch 외, J. Biol . Chem . 245:3755-3762; Fimongnari 외, Biochemistry 4:2086-2090 (1965); Siddiqi 외, Biochem . Biophys . Res. Commun . 8:110-113 (1962); Siddiqi 외, J. Bacteriol . 93:207-214 (1967); 및 Takatsuji 외, Biochem . Biophys . Res. Commun .110:187-193 (1983), 이들 문헌의 내용은 이의 전체 기재내용이 본원에 참고로 포함된다.

본원에 제시된 조성물 및 방법의 몇몇 양태에서, 숙주 세포는 NADH-이용 HMGr과 NADPH-이용 HMG-CoA 환원효소 모두를 포함한다. NADPH-이용 HMG-CoA 환원효소를 인코딩하는 뉴클레오티드 서열의 설명적 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: (NM_206548; 드로소필라 멜라노가스터 ( Drosophila melanogaster )), (NC_002758, Locus tag SAV2545, GeneID 1122570; 스타필로코커스 아우레우스), (AB015627; 스트렙토마이세스 sp . KO 3988), (절단된(truncated) HMG-CoA 환원효소를 인코딩하는 서열을 제공하는 AX128213; 사카로 마이세스 세레비시아), 및 (NC_001145: complement (115734.118898; 사카로마이세스 세레비시아).

6.4. 메발로네이트 -5- 포스페이트로의 메발로네이트의 전환

몇몇 양태에서, 숙주 세포는 메발로네이트를 메발로네이트 5-포스페이트로 전환할 수 있는 효소, 예를 들어, 메발로네이트 인산화효소를 인코딩하는 이종 뉴클레오티드 서열을 포함한다. 이러한 효소를 인코딩하는 뉴클레오티드 서열의 설명적 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: (L77688; 아라비돕시 스 탈리아나), 및 (X55875; 사카로마이세스 세레비시아).

6.5. 메발로네이트 -5- 피로포스페이트로의 메발로네이트 -5- 포스페이트의 전환

몇몇 양태에서, 숙주 세포는 메발로네이트 5-포스페이트를 메발로네이트 5-피로포스페이트로 전환할 수 있는 효소, 예를 들어, 포스포메발로네이트 인산화효소를 인코딩하는 이종 뉴클레오티드 서열을 포함한다. 이러한 효소를 인코딩하는 뉴클레오티드 서열의 설명적 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: (AF429385; 헤베아 브라실리엔시스 ( Hevea brasiliensis )), (NM_006556; 호모 사피엔스), 및 (NC_001145. complement 712315.713670; 사카로마이세스 세레비시아).

6.6. IPP로의 메발로네이트 -5- 피로포스페이트의 전환

몇몇 양태에서, 숙주 세포는 메발로네이트 5-피로포스페이트를 이소펜테닐 디포스페이트 (IPP)로 전환할 수 있는 효소, 예를 들어, 메발로네이트 피로포스페이트 탈탄산효소를 인코딩하는 이종 뉴클레오티드 서열을 포함한다. 이러한 효소를 인코딩하는 뉴클레오티드 서열의 설명적 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: (X97557; 사카로마이세스 세레비시아), (AF290095; 엔테로코커스 패시움(Enterococcus faecium)), 및 (U49260; 호모 사피엔스).

6.7. DMAPP로의 IPP의 전환

몇몇 양태에서, 숙주 세포는 MEV 경로를 통해 생성된 IPP를 디메틸알릴 피로포스페이트(dimethylallyl pyrophosphate, DMAPP)로 전환할 수 있는 효소, 예를 들어, IPP 이성질화 효소(IPP isomerase)를 인코딩하는 이종 뉴클레오티드 서열을 더 포함한다. 이러한 효소를 인코딩하는 뉴클레오티드 서열의 설명적 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: (NC_000913, 3031087.3031635; 에세리키아 콜라이), 및 (AF082326; 헤마토코쿠스 플루비알리스(Haematococcus pluvialis)).

6.8. 폴리프레닐 합성효소

몇몇 양태에서, 숙주 세포는 IPP 및/또는 DMAPP 분자를 축합하여, 5개를 초과하는 탄소를 함유하는 폴리프레닐 화합물을 형성할 수 있는 폴리프레닐 합성효소를 인코딩하는 이종 뉴클레오티드 서열을 더 포함한다.

몇몇 양태에서, 숙주 세포는 한 분자의 IPP와 한 분자의 DMAPP를 축합하여, 한 분자의 제라닐 피로포스페이트(geranyl pyrophosphate, "GPP")를 형성할 수 있는 효소, 예를 들어, GPP 합성효소를 인코딩하는 이종 뉴클레오티드 서열을 포함한다. 이러한 효소를 인코딩하는 뉴클레오티드 서열의 설명적 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: (AF513111; 아비에스 그란디스 ( Abies grandis )), (AF513112; 아비에스 그 란디스), (AF513113; 아비에스 그란디스), (AY534686; 안티르히눔 마주 스(Antirrhinum majus )), (AY534687; 안티르히눔 마주스), (Y17376; 아라비돕시스 탈리아나), (AE016877, Locus AP11092; 바실러스 세레우스(Bacillus cereus ); ATCC 14579), (AJ243739; 시트루스 시넨시스 (Citrus sinensis )), (AY534745; 클라키아 브루에리(Clarkia breweri )), (AY953508; 입스 피니( Ips pini)), (DQ286930; 리코페르시콘 에스쿨렌툼 ( Lycopersicon esculentum )), (AF182828; 멘타 x 피페리타 ( Mentha x piperita )), (AF182827; 멘타 x 피페리타), (MPI249453; 멘타 x 피페리타), (PZE431697, Locus CAD24425; 파라코커스 제아잔티니파시엔스 (Paracoccus zeaxanthinifaciens )), (AY866498; 피크로리자 쿠로 아(Picrorhiza kurrooa )), (AY351862; 비티스 비니페라 ( Vitis vinifera )), 및 (AF203881, Locus AAF12843; 자이모모나스 모빌리스( Zymomonas mobilis )).

몇몇 양태에서, 숙주 세포는 두 분자의 IPP와 한 분자의 DMAPP를 축합, 또는 한 분자의 IPP를 한 분자의 GPP에 추가하여, 한 분자의 파르네실 피로포스페이트("FPP")를 형성할 수 있는 효소, 예를 들어, FPP 합성효소를 인코딩하는 이종 뉴클레오티드 서열을 포함한다. 이러한 효소를 인코딩하는 뉴클레오티드 서열의 설명적 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: (ATU80605; 아라비돕시 스 탈리아나), (ATHFPS2R; 아라비돕시스 탈리아나), (AAU36376; 아르테미시아 아누 아(Artemisia annua )), (AF461050; 보스 토러스 ( Bos taurus)), (D00694; 에세리키아 콜라이 K-12), (AE009951, Locus AAL95523; 푸소박테리움 뉴클레아툼 subsp . 뉴 클레아툼(Fusobacterium nucleatum subsp . nucleatum ) ATCC 25586), (GFFPPSGEN; 지베렐라 푸지쿠로이), (CP000009, Locus AAW60034; 글루코노박터 옥시단 스(Gluconobacter oxydans 621H)), (AF019892; 헬리안투스 안누우스 ( Helianthus annuus)), (HUMFAPS; 호모 사피엔스), (KLPFPSQCR; 클루이베로마이세스 락티 스(Kluyveromyces lactis )), (LAU15777; 루피누스 알부스 ( Lupinus albus )), (LAU20771; 루피누스 알부스), (AF309508; 무스 무스쿨루스), (NCFPPSGEN; 뉴로스포라 크라사 ( Neurospora crassa)), (PAFPS1; 파르테니움 아르겐타툼 ( Parthenium argentatum )), (PAFPS2; 파르테니움 아르겐타툼), (RATFAPS; 라투스 노르베기쿠스 ( Rattus norvegicus )), (YSCFPP; 사카로마이세스 세레비시아), (D89104; 스키조사카로마이세스 폼베), (CP000003, Locus AAT87386; 스트렙토코커스 피오게네스 (Streptococcus pyogenes)), (CP000017, Locus AAZ51849; 스트렙토코커스 피오게네스), (NC_008022, Locus YP_598856; 스트렙토코커스 피오게네스 MGAS10270), (NC_008023, Locus YP_600845; 스트렙토코커스 피오게네스 MGAS2096), (NC_008024, Locus YP_602832; 스트렙토코커스 피오게네스 MGAS10750), (MZEFPS; 제아 마이스 ), (AE000657, Locus AAC06913; 아퀴펙스 아에올리쿠스 ( Aquifex aeolicus ) VF5), (NM_202836; 아라비돕시스 탈리아나), (D84432, Locus BAA12575; 바실러스 서브틸 리스), (U12678, Locus AAC28894; 브래디리조비움 자포니쿰 USDA 110), (BACFDPS; 지오바실러스 스테아로써모필러스 ( Geobacillus stearothermophilus )), (NC_002940, Locus NP_873754; 헤모필루스 듀크레이 ( Haemophilus ducreyi ) 35000HP), (L42023, Locus AAC23087; 헤모필루스 인플루엔자( Haemophilus influenzae ) Rd KW20), (J05262; 호모 사피엔스), (YP_395294; 락토바실러스 사케이 subsp . 사케이 (Lactobacillus sakei subsp . sakei ) 23K), (NC_005823, Locus YP_000273; 렙토스피라 인터로간스 세로바 코펜하게니 str . 피오크루즈(Leptospira interrogans serovar Copenhageni str . Fiocruz ) L1-130), (AB003187; 마이크로코커스 루테우 스(Micrococcus luteus )), (NC_002946, Locus YP_208768; 나이세리아 고노레 아(Neisseria gonorrhoeae ) FA 1090), (U00090, Locus AAB91752; 리조비움 sp. NGR234), (J05091; 사카로마이세스 세레비시아 ( Saccharomyces cerevisae )), (CP000031, Locus AAV93568; 실리시박터 포메로이 DSS-3), (AE008481, Locus AAK99890; 스트렙토코커스 뉴모니에 (Streptococcus pneumoniae ) R6), 및 (NC_004556, Locus NP 779706; 자일렐라 파스티디오사 테메큘라 1(Xylella fastidiosa Temecula 1)).

몇몇 양태에서, 숙주 세포는 IPP와 DMAPP, 또는 IPP와 FPP를 결합시켜, 제라닐제라닐 피로포스페이트 ("GGPP")를 형성할 수 있는 효소를 인코딩하는 이종 뉴클레오티드 서열을 더 포함한다. 이러한 효소를 인코딩하는 뉴클레오티드 서열의 설명적 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: (ATHGERPYRS; 아라비돕 시스 탈리아나), (BT005328; 아라비돕시스 탈리아나 ), (NM_119845; 아라비돕시스 탈리아나), (NZ_AAJM01000380, Locus ZP_00743052; 바실러스 투린지엔시스 세로바 이스라엘렌시스(Bacillus thuringiensis serovar israelensis ), ATCC 35646 sq1563), (CRGGPPS; 카타란투스 로세우스(Catharanthus roseus)), (NZ_AABF02000074, Locus ZP_00144509; 푸소박테리움 뉴클레아툼 subsp . 빈센티 ( Fusobacterium nucleatum subsp. vincentii ), ATCC 49256), (GFGGPPSGN; 지베렐라 푸지쿠로이), (AY371321; 징코 빌로바 (Ginkgo biloba )), (AB055496; 헤베아 브라실리엔시스), (AB017971; 호모 사피엔스), (MCI276129; 무코르 시르시넬로이 데스 f. 루시타니쿠스 ( Mucor circinelloides f. lusitanicus )), (AB016044; 무스 무스쿨루스), (AABX01000298, Locus NCU01427; 뉴로스포라 크라사), (NCU20940; 뉴로스포라 크라사), (NZ_AAKL01000008, Locus ZP_00943566; 랄스토니아 솔라나세 아룸(Ralstonia solanacearum ) UW551), (AB118238; 라투스 노르베기쿠스), (SCU31632; 사카로마이세스 세레비시아), (AB016095; 시네코코커스 일롱게이 츠(Synechococcus elongates)), (SAGGPS; 시나피스 알바 ( Sinapis alba )), (SSOGDS; 술폴로부스 아시도칼다리우스 ( Sulfolobus acidocaldarius )), (NC_007759, Locus YP_461832; 신트로푸스 아시디트로피쿠스 ( Syntrophus aciditrophicus ) SB), (NC_006840, Locus YP_204095; 비브리오 피셰리 ( Vibrio fischeri) ES114), (NM_112315; 아라비돕시스 탈리아나), (ERWCRTE; 판토에아 아 글로메란스(Pantoea agglomerans )), (D90087, Locus BAA14124; 판토에아 아나나티 스(Pantoea ananatis )), (X52291, Locus CAA36538; 로도박터 캡슐라투스), (AF195122, Locus AAF24294; 로도박터 스페로이데스), 및 (NC_004350, Locus NP_721015; 스트렙토코커스 뮤탄스 (Streptococcus mutans) UA159).

메발로네이트 경로의 효소의 예시가 상기에 기재되어 있으나, 특정 양태에서, DXP 경로의 효소가 대안적인 또는 추가의 경로로서 이용되어, 본원에 기재된 숙주 세포, 조성물 및 방법에서 DMAPP 및 IPP를 생산할 수 있다. DXP 경로의 효소를 인코딩하는 효소 및 핵산은 당해분야에서 주지되어 있고, 특성화되어있다. WO 제2012/135591 A2호.

7. 스테비올 글리코시드의 생산방법

다른 측면에서, 스테비올 글리코시드를 생산하는 방법이 본원에서 제시되며, 상기 방법은 다음의 단계를 포함한다: (a) 탄소 공급원을 지닌 배지에서, 스테비올 글리코시드 화합물의 생성에 적합한 조건하에, 스테비올 글리코시드를 생산할 수 있는 본원에 기재된 유전적으로 변형된 숙주 세포들 중 임의의 세포의 집단을 배양하는 단계; 및 (b) 상기 배지로부터 상기 스테비올 글리코시드 화합물을 회수하는 단계.

몇몇 양태에서, 유전적으로 변형된 숙주 세포는 하나 이상의 변형을 포함하지 않는 모세포, 또는 유전적으로 변형된 숙주 세포의 하나 이상의 변형의 하위 집합만 포함하는 모세포에 비해서 증가된 양의 스테비올 글리코시드 화합물을 생산하나, 이 외에는 유전적으로 동일하다. 몇몇 양태에서, 증가된 양은 적어도 1%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100% 또는 100%를 초과하며, 이는 예를 들어, 세포 배양물의 리터 당 그램(grams per liter of cell culture), 건조 세포 중량의 그램 당 밀리그램(milligrams per gram of dry cell weight), 세포 배양물 기준의 단위 부피 당(per unit volume of cell culture basis), 단위 건조 세포 중량 기준 당(per unit dry cell weight basis), 단위 시간 기준 당 세포 배양물의 단위 부피 당(per unit volume of cell culture per unit time basis), 또는 단위 시간 기준 당 단위 건조 세포 중량 당(per unit dry cell weight per unit time basis) 수율, 생산량, 생산성으로 측정된다.

몇몇 양태에서, 숙주 세포는 발효 배지의 리터 당 약 10g보다 큰, 상승된 레벨의 스테비올 글리코시드를 생산한다. 몇몇 이러한 양태에서, 스테비올 글리코시드는 세포 배양물의 리터 당 약 10 내지 약 50 그램의 양, 약 15 그램을 초과하는 양, 약 20 그램을 초과하는 양, 약 25 그램을 초과하는 양, 또는 약 30 그램을 초과하는 양으로 생산된다.

몇몇 양태에서, 숙주 세포는 건조 세포 중량의 그램 당 약 50밀리그램을 초과하는 상승된 레벨의 스테비올 글리코시드를 생산한다. 몇몇 이러한 양태에서, 스테비올 글리코시드는 건조 세포 중량의 그램 당 약 50 내지 약 1500 밀리그램의 양, 약 100 밀리그램을 초과하는 양, 약 150 밀리그램을 초과하는 양, 약 200 밀리그램을 초과하는 양, 약 250 밀리그램을 초과하는 양, 약 500 밀리그램을 초과하는 양, 약 750 밀리그램을 초과하는 양, 또는 약 1000 밀리그램을 초과하는 양으로 생산된다.

몇몇 양태에서, 숙주 세포는 세포 배양물 기준의 단위 부피 당, 모세포에 의해 생산된 스테비올 글리코시드의 레벨보다, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배, 또는 그 이상 높은, 상승된 레벨의 스테비올 글리코시드를 생산한다.

몇몇 양태에서, 숙주 세포는 단위 건조 세포 중량 기준 당, 모세포에 의해 생산된 스테비올 글리코시드의 레벨보다, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배, 또는 그 이상 높은, 상승된 레벨의 스테비올 글리코시드를 생산한다.

몇몇 양태에서, 숙주 세포는 단위 시간 기준 당 세포 배양물의 단위 부피 당, 모세포에 의해 생산된 스테비올 글리코시드의 레벨보다, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배, 또는 그 이상 높은, 상승된 레벨의 스테비올 글리코시드를 생산한다.

몇몇 양태에서, 숙주 세포는 단위 시간 기준 당 단위 건조 세포 중량 당, 모세포에 의해 생산된 스테비올 글리코시드의 레벨보다, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배, 또는 그 이상 높은, 상승된 레벨의 스테비올 글리코시드를 생산한다.

대부분의 양태에서, 숙주 세포에 의한 상승된 레벨의 스테비올 글리코시드의 생산은 유도 화합물(inducing compound)에 의해 유도 가능하다. 이러한 숙주 세포는 유도 화합물 없이 용이하게 조작될 수 있다. 유도 화합물은 추가되어, 숙주 세포에 의한 상승된 레벨의 스테비올 글리코시드의 생산을 유도한다. 다른 양태에서, 숙주 세포에 의한 스테비올 글리코시드의 상승된 레벨의 생산은, 예를 들어, 성장 온도, 배지 구성 등과 같은 배양 조건을 변화시킴으로써 유도 가능하다.

8. 배양 배지 및 조건

미생물 배양물을 유지 및 성장시키는 재료 및 방법은 미생물학 또는 발효 과학 분야의 통상의 기술자에게 주지되어 있다 (예를 들어, Bailey 외, Biochemical Engineering Fundamentals, second edition, McGraw Hill, New York, 1986을 참고). 숙주 세포, 발효 및 공정의 특정한 요건에 따라서, 적합한 배양 배지, pH, 온도 및 호기성, 미세 호기성(microaerobic), 또는 혐기성 조건에 대한 요건을 고려해야 한다.

본원에 제시된 스테비올 글리코시드를 생산하는 방법은 세포 배양 플레이트, 플라스크 또는 발효기를 포함하나, 이에 한정되는 것은 아닌 적절한 용기 내에서, 적절한 배양 배지 [예, 판토테네이트(pantothenate) 보충이 있거나 또는 없는]에서 수행될 수 있다. 또한, 상기 방법은 미생물 생성물의 산업용 생산을 지원하는 당해분야에 공지된 발효의 임의의 규모로 수행될 수 있다. 임의의 적합한 발효기가 이용될 수 있으며, 교반탱크 발효기(stirred tank fermentator), 에어리프트 발효기(airlift fermentor), 기포 발효기(bubble fermentor), 또는 이들의 임의의 조합을 포함한다. 사카로마이세스 세레비시아를 숙주 세포로 활용하는 특정 양태에서, 균주는 Kosaric 외, in Ullmann's Encyclopedia of Industrial Chemistry, 제6판, 12권, 398-473 페이지, 독일, 바인하임 소재, Wiley-VCH Verlag GmbH & Co. KDaA에 의해 상세히 기재된 대로, 발효기에서 성장될 수 있다.

몇몇 양태에서, 배양 배지는 스테비올 글리코시드를 생산할 수 있는 유전적으로 변형된 미생물이 존속할 수 있는, 즉, 성장 및 생존도를 유지할 수 있는 임의의 배양 배지이다. 몇몇 양태에서, 배양 배지는 동화 가능한(assimilable) 탄소 공급원, 질소 공급원 및 포스페이트 공급원(phosphate source)을 포함하는 수성 배지이다. 또한, 이러한 배지는 적합한 염, 미네랄, 금속 및 다른 영양소를 포함할 수 있다. 몇몇 양태에서, 탄소 공급원 및 각각의 필수 세포 영양소는 발효 배지에 증분적으로(incrementally) 또는 지속적으로 추가되고, 각 필수 영양소(required nutrient)는, 예를 들어, 탄소 공급원을 바이오매스(biomass)로 전환하는 세포의 대사 또는 호흡 기능에 기초한 예정된 세포 성장 곡선에 따른, 성장하는 세포에 의한 효율적인 동화에 필요한 최소 레벨에 기본적으로 유지된다.

미생물의 배양에 적합한 조건 및 적합한 배지는 당해분야에 주지되어 있다. 몇몇 양태에서, 적합한 배지는, 예를 들어, 유도자(inducer) [예, 유전자 산물을 인코딩하는 하나 이상의 뉴클레오티드 서열이 유도성 프로모터(inducible promoter)의 제어하에 있는 경우]; 억제자(repressor) [예, 유전자 산물을 인코딩하는 하나 이상의 뉴클레오티드 서열이 억제성 프로모터(repressible promoter)의 제어하에 있는 경우]; 또는 선별 제제(selection agent) [예, 유전적 변형을 포함하는 미생물을 선별하기 위한 항생제];와 같은 하나 이상의 추가의 제제로 보충된다.

몇몇 양태에서, 탄소 공급원은 단당류 (단순당), 이당류, 다당류, 비-발효성 탄소 공급원(non-fermentable carbon source), 또는 이들의 하나 이상의 혼합물이다. 적합한 단당류의 비-제한적인 예시는 글루코스, 갈락토스, 만노스, 프럭토스, 자일로스, 리보스, 및 이들의 혼합물을 포함한다. 적합한 이당류의 비-제한적 예시는 수크로스, 락토스, 말토스, 트레할로스(trehalose), 셀로비오스(cellobiose), 및 이들의 혼합물을 포함한다. 적합한 다당류의 비-제한적 예시는 전분, 글리코겐, 셀룰로오스, 키틴, 및 이들의 혼합물을 포함한다. 적합한 비-발효성 탄소 공급원(non-fermentable carbon source)의 비-제한적 예시는 아세테이트 및 글리세롤을 포함한다.

배양 배지 중 글루코스와 같은 탄소 공급원의 농도는 세포 성장을 촉진시켜야 하지만, 이용되는 미생물의 성장을 억제할 만큼 높아서는 안된다. 통상적으로, 배양은 목적하는 레벨의 성장 및 바이오매스를 달성하기 위한 레벨이지만, 검출 불가능한 레벨 (약 0.1g/l 미만인 검출 한계를 가짐)로 추가되는 글루코스와 같은 탄소 공급원과 함께 수행된다. 다른 양태에서, 배양 배지 중 글루코스와 같은 탄소 공급원의 농도는 약 1 g/L를 초과하고, 바람직하게는 약 2 g/L를 초과하며, 더욱 바람직하게는 약 5 g/L를 초과한다. 또한, 배양 배지 중 글루코스와 같은 탄소 공급원의 농도는 통상적으로, 약 100 g/L 미만이고, 바람직하게는 약 50 g/L 미만이며, 더욱 바람직하게는 약 20 g/L 미만이다. 배양 성분 농도에 대한 언급은 초기 및/또는 진행중인(ongoing) 성분 농도 모두를 의미할 수 있다는 것을 주의해야 한다. 몇몇 경우에서, 배양하는 동안에 배양 배지가 탄소 공급원을 고갈하도록 하는 것이 바람직할 수 있다.

적합한 배양 배지에서 이용될 수 있는 동화성 질소 공급원은 단순 질소 공급원(simple nitrogen source), 유기 질소 공급원(organic nitrogen sources) 및 복합 질소 공급원(complex nitrogen source)을 포함하나, 이에 한정되는 것은 아니다. 이러한 질소 공급원은 무수 암모니아(anhydrous ammonia), 암모늄 염 및 동물, 식물 및/또는 미생물 기원의 물질을 포함한다. 적합한 질소 공급원은 단백질 가수분해물(protein hydrolysate), 미생물 바이오매스 가수분해물(microbial biomass hydrolysate), 펩톤(peptone), 효모 추출물, 암모늄 설페이트, 요소, 및 아미노산을 포함하나, 이에 한정되는 것은 아니다. 통상적으로, 배양 배지 중 질소 공급원의 농도는 약 0.1 g/L를 초과하고, 바람직하게는 약 0.25 g/L를 초과하며, 더욱 바람직하게는 약 1.0 g/L를 초과한다. 그러나, 특정 농도를 넘어서서, 질소 공급원을 배양 배지에 추가하는 것은 미생물의 성장에 이롭지 않다. 결과적으로, 배양 배지 중 질소 공급원의 농도는 약 20 g/L 미만이고, 바람직하게는 약 10 g/L 미만이며, 더욱 바람직하게는 약 5 g/L 미만이다. 또한, 몇몇 경우에서, 배양하는 동안에 배양 배지가 질소 공급원을 고갈하도록 하는 것이 바람직할 수 있다.

효과적인 배양 배지는 무기염, 비타민, 미량 금속(trace metal), 또는 성장 촉진제(growth promoter)와 같은 다른 화합물을 함유할 수 있다. 또한, 이러한 다른 화합물은 효과적인 배지 중 탄소 공급원, 질소 공급원 또는 미네랄 공급원(mineral source)에 존재할 수 있거나, 또는 배지에 구체적으로 추가될 수 있다.

또한, 배양 배지는 적합한 포스페이트 공급원을 함유할 수 있다. 이러한 포스페이트 공급원은 무기 및 유기 포스페이트 공급원 모두를 포함한다. 바람직한 포스페이트 공급원은 일염기(monobasic) 또는 이염기(dibasic) 소듐 및 포타슘 포스페이트, 암모늄 포스페이트 및 이들의 혼합물과 같은 포스페이트 염을 포함하나, 이에 한정되는 것은 아니다. 통상적으로, 배양 배지 중 포스페이트의 농도는 약 1.0 g/L를 초과하고, 바람직하게는 약 2.0 g/L를 초과하며, 더욱 바람직하게는 약 5.0 g/L를 초과한다. 그러나, 특정 농도를 넘어서서, 배양 배지에 포스페이트를 추가하는 것은 미생물의 성장에 이롭지 않다. 따라서, 배양 배지 중 포스페이트의 농도는 통상적으로 약 20 g/L 미만이고, 바람직하게는 약 15 g/L 미만이며, 더욱 바람직하게는 약 10 g/L 미만이다.

또한, 적합한 배양 배지는 마그네슘원(source of magnesium), 바람직하게는 마그네슘 설페이트 헵타하이드레이트(magnesium sulfate heptahydrate)와 같은 생리학적으로 허용가능한 염의 형태인 마그네슘원을 포함하나, 유사한 양의 마그네슘에 기여하는 농도의 다른 마그네슘원이 이용될 수 있다. 통상적으로, 배양 배지 중 마그네슘의 농도는 약 0.5 g/L를 초과하고, 바람직하게는 약 1.0 g/L를 초과하며, 더욱 바람직하게는 약 2.0 g/L를 초과한다. 그러나, 특정 농도를 넘어서서, 배양 배지에 마그네슘을 첨가하는 것은 미생물의 성장에 이롭지 않다. 따라서, 배양 배지 중 마그네슘의 농도는 통상적으로 약 10 g/L 미만이고, 바람직하게는 약 5 g/L 미만이며, 더욱 바람직하게는 약 3 g/L 미만이다. 또한, 몇몇 경우에서, 배양하는 동안에 배양 배지가 마그네슘원을 고갈하도록 하는 것이 바람직할 수 있다.

몇몇 양태에서, 배양 배지는 또한 생물학적으로 허용가능한 킬레이트제, 예를 들어, 트리소듐 시트레이트(trisodium citrate)의 다이하이드레이트(dihydrate)를 포함할 수 있다. 이러한 경우에, 배양 배지 중 킬레이트제의 농도는 약 0.2 g/L를 초과하고, 바람직하게는 약 0.5 g/L를 초과하며, 더욱 바람직하게는 약 1 g/L를 초과한다. 그러나, 특정 농도를 넘어서서, 킬레이트제를 배양 배지에 추가하는 것은 미생물의 성장에 이롭지 않다. 따라서, 배양 배지 중 킬레이트제의 농도는 통상적으로 약 10 g/L 미만이고, 바람직하게는 약 5 g/L 미만이며, 더욱 바람직하게는 약 2 g/L 미만이다.

또한, 배양 배지는 초기에 생물학적으로 허용가능한 산 또는 염기를 포함하여, 배양 배지의 목적하는 pH를 유지할 수 있다. 생물학적으로 허용가능한 산은 염산, 황산, 질산, 인산 및 이들의 혼합물을 포함하나, 이에 한정되는 것은 아니다. 생물학적으로 허용가능한 염기는 암모늄 하이드록사이드(ammonium hydroxide), 소듐 하이드록사이드, 포타슘 하이드록사이드 및 이들의 혼합물을 포함하나, 이에 한정되는 것은 아니다. 몇몇 양태에서, 이용된 염기는 암모늄 하이드록사이드이다.

또한, 배양 배지는 생물학적으로 허용가능한 칼슘원을 포함하고, 칼슘 클로라이드를 포함하나, 이에 한정되는 것은 아니다. 통상적으로, 배양 배지 중 칼슘 클로라이드, 다이하이드레이트(dihydrate)와 같은 칼슘원의 농도는 약 5 mg/L 내지 약 2000 mg/L의 범위에 속하고, 바람직하게는 약 20 mg/L 내지 약 1000 mg/L의 범위에 속하며, 더욱 바람직하게는 약 50 mg/L 내지 약 500 mg/L의 범위에 속한다.

또한, 배양 배지는 소듐 클로라이드를 포함할 수 있다. 통상적으로, 배양 배지 중 소듐 클로라이드의 농도는 약 0.1　g/L 내지 약 5 g/L의 범위에 속하고, 바람직하게는 약 1 g/L 내지 약 4 g/L의 범위에 속하며, 더욱 바람직하게는 약 2 g/L 내지 약 4 g/L의 범위에 속한다.

몇몇 양태에서, 배양 배지는 또한 미량 금속(trace metal)을 포함할 수 있다. 이러한 미량 금속은, 편의를 위해 배양 배지의 나머지와 별도로 제조될 수 있는 저장 용액(stock solution)으로서, 배양 배지에 추가될 수 있다. 통상적으로, 배양 배지에 추가된 이러한 미량 금속 용액의 양은 약 1 mL/L를 초과하고, 바람직하게는 약 5 mL/L를 초과하며, 더욱 바람직하게는 약 10 mL/L를 초과한다. 그러나, 특정 농도를 넘어서서, 미량 금속을 배양 배지에 추가하는 것은 미생물의 성장에 이롭지 않다. 따라서, 배양 배지에 추가된 이러한 미량 금속 용액의 양은 통상적으로 약 100 mL/L 미만이고, 바람직하게는 약 50 mL/L 미만이며, 더욱 바람직하게는 약 30 mL/L 미만이다. 저장 용액에 미량 금속을 추가하는 것에 더하여, 개별적인 성분이, 미량 금속 용액의 상기 기재된 범위에 의해 영향을 받는 성분의 양에 독립적으로 대응하는 범위 내에서 별도로, 각각 추가될 수 있다는 것에 주의해야 한다.

배양 배지는 판토테네이트, 비오틴, 칼슘, 판토테네이트, 이노시톨, 피리독신-HCl(pyridoxine-HCl), 및 티아민-HCl(thiamine-HCl)과 같은 기타 비타민을 포함할 수 있다. 이러한 비타민은 편의를 위해, 배양 배지의 나머지와 별도로 제조될 수 있는 저장 용액으로서 배양 배지에 추가될 수 있다. 그러나, 특정 농도를 넘어서서, 비타민을 배양 배지에 추가하는 것은 미생물의 성장에 이롭지 않다.

본원에 기재된 발효 방법은, 배치(batch), 페드-배치(fed-batch), 세포 재순환(cell recycle), 연속식(continuous) 및 반-연속식(semi-continuous)을 포함하나, 이에 한정되는 것은 아닌 통상적인 배양 방식에서 수행될 수 있다. 몇몇 양태에서, 발효는 페드-배치 방식으로 수행된다. 이러한 경우에, 배양의 생산 단계(production stage) 동안에 판토테네이트를 포함하는 배지의 성분들 중 일부는 배양 동안에 고갈된다. 몇몇 양태에서, 첨가물이 필요하기 전의 기간 동안에, 성장 및/또는 스테비올 글리코시드 생산이 지원되도록, 배양은 예를 들어, 생산 단계의 처음에서, 상대적으로 높은 농도의 이러한 성분으로 보충될 수 있다. 이들 성분의 레벨이 배양에 의해 고갈됨에 따라, 이들의 바람직한 범위는 이들을 추가함으로써 배양 동안에 유지된다. 배양 배지 중 성분의 레벨은 예를 들어, 배양 배지를 주기적으로 샘플링하여, 농도에 대해서 검정함으로써 모니터링될 수 있다. 대안적으로는, 표준 배양 절차가 전개되면, 특정한 시간의 공지된 레벨에 대응하는 시간을 맞춘 간격(timed interval)에서, 배양 동안에 추가를 수행할 수 있다. 통상의 기술자에 의해 인식되는 바와 같이, 배지의 세포 밀도가 증가함에 따라, 영양소의 소비 속도는 배양하는 동안에 증가한다. 더욱이, 배양 배지로 외부 미생물의 도입을 피하기 위해, 당해분야에 공지되어 있는 무균 추가 방법(aseptic addition method)을 이용하여 추가가 수행된다. 또한, 소량의 소포제(anti-foaming agent)가 배양하는 동안 추가될 수 있다.

배양 배지의 온도는 유전적으로 변형된 세포의 성장 및/또는 스테비올 글리코시드의 생산에 적합한 임의의 온도일 수 있다. 예를 들어, 접종물과 함께 배양 배지를 접종하기 전에, 배양 배지는 약 20°C 내지 약 45°C 범위 내 온도, 바람직하게는 약 25°C 내지 약 40°C 범위 내 온도, 및 더욱 바람직하게는 약 28°C 내지 약 32°C 범위 내 온도로 초래되고 유지될 수 있다.

배양 배지의 pH는 산 또는 염기를 배양 배지에 추가함으로써 제어될 수 있다. 이러한 경우에서, 암모니아가 pH의 제어에 이용되면, 이는 또한 편리하게 배양 배지에서 질소 공급원으로 작용한다. 바람직하게는, pH는 약 3.0 내지 약 8.0으로 유지되고, 더욱 바람직하게는 약 3.5 내지 약 7.0으로 유지되며, 가장 바람직하게는 약 4.0 내지 약 6.5로 유지된다.

몇몇 양태에서, 배양 배지의 글루코스 농도와 같은 탄소 공급원 농도가 배양하는 동안에 모니터링된다. 배양 배지의 글루코스 농도는 예를 들어, 상청액, 예를 들어, 배양 배지의 무세포 성분(cell-free component) 중 글루코스 농도를 모니터링하는 데 이용될 수 있는 글루코스 산화효소 검사(glucose oxidase test) 또는 고압 액체 크로마토그래피의 이용과 같은 공지된 기법을 이용하여 모니터링될 수 있다. 이전에 명시된 대로, 탄소 공급원 농도는 세포 성장 억제가 발생하는 레벨 미만으로 유지되어야 한다. 이러한 농도가 유기체마다 다를 수 있으나, 글루코스가 탄소 공급원인 경우에, 약 60 g/L를 초과하는 글루코스 농도에서 세포 성장 억제가 발생하고, 실험에 의해 용이하게 측정될 수 있다. 따라서, 클루코스가 탄소 공급원으로 이용되는 경우에, 글루코스는 바람직하게는, 발효기에 투입되고(feeding), 검출 한계 미만으로 유지된다. 대안적으로는, 배양 배지 중 글루코스 농도는 약 1 g/L 내지 약 100 g/L의 범위 내에서 유지되고, 더욱 바람직하게는 약 2 g/L 내지 약 50 g/L의 범위 내에서 유지되며, 더 더욱 바람직하게는 약 5 g/L 내지 약 20 g/L의 범위 내에서 유지된다. 탄소 공급원 농도는, 예를 들어, 실질적으로 순수한 글루코스 용액의 추가에 의해 목적하는 레벨 내에서 유지될 수 있으나, 본래의 배양 배지의 분획의 추가에 의해 배양 배지의 탄소 공급원 농도를 유지하는 것이 허용가능하고, 바람직할 수 있다. 배지 중 기타 영양소 (예를 들어, 질소 공급원 및 포스페이트 공급원)의 농도가 동시에 유지될 수 있기 때문에, 본래의 배양 배지의 분획의 이용은 바람직할 수 있다. 마찬가지로, 미량 금속 농도가, 미량 금속 용액의 분획의 추가에 의해 배양 배지에서 유지될 수 있다.

기타 적합한 발효 배지 및 방법은 예를 들어, WO 제2016/196321호에 기재되어 있다.

9. 발효 조성물

다른 측면에서, 본원에 기재된 유전적으로 변형된 숙주 세포 및 유전적으로 변형된 숙주 세포로부터 생산된 스테비올 글리코시드를 포함하는 발효 조성물이 본원에서 제시된다. 발효 조성물은 배지를 더 포함할 수 있다. 특정 양태에서, 발효 조성물은 유전적으로 변형된 숙주 세포를 포함하고, RebA, RebD, 및 RebM을 더 포함한다. 특정 양태에서, 본원에 제시된 발효 조성물은 RebM을 유전적으로 변형된 숙주 세포로부터 생산된 스테비올 글리코시드의 주성분으로서 포함한다. 특정 양태에서, 발효 조성물은 RebA, RebD, 및 RebM을 적어도 1:7:50의 비율로 포함한다. 특정 양태에서, 발효 조성물은 RebA, RebD, 및 RebM을 적어도 1:7:50 내지 1:100:1000의 비율로 포함한다. 특정 양태에서, 발효 조성물은 적어도 1:7:50 내지 1:200:2000의 비율을 포함한다. 특정 양태에서, RebA, RebD, 및 RebM의 비율은 배지 및 유전적으로 변형된 숙주 세포와 관련된 스테비올 글리코시드의 전체 함량에 기초한다. 특정 양태에서, RebA, RebD, 및 RebM의 비율은 배지 중 스테비올 글리코시드의 전체 함량에 기초한다. 특정 양태에서, RebA, RebD, 및 RebM의 비율은 유전적으로 변형된 숙주 세포와 관련된 스테비올 글리코시드의 전체 함량에 기초한다.

특정 양태에서, 본원에서 제시된 발효 조성물은 RebM2를 검출 불가능한 레벨로 함유한다. 특정 양태에서, 본원에서 제시된 발효 조성물은 자연적으로 존재하지 않는 스테비올 글리코시드를 검출 불가능한 레벨로 함유한다. 특정 양태에서, 본원에 제시된 발효 조성물에 대해서 GC-크로마토그래피를 수행하는 경우에, RebA 피크와 RebB 사이에서 검출 가능한 레벨의 "스테비올 + 2 글루코스" 피크를 생성하지 않는다.

10. 스테비올 글리코시드의 회수

스테비올 글리코시드가 숙주 세포에 의해 생산되면, 스테비올 글리코시드는 당해분야에 공지된 임의의 적합한 분리 및 정제를 이용하여, 후속적인 이용을 위해 회수 및 분리될 수 있다. 몇몇 양태에서, 스테비올 글리코시드를 포함하는 유기상은 원심분리에 의해 발효물로부터 분리된다. 다른 양태에서, 스테비올 글리코시드를 포함하는 유기상은 발효물로부터 자발적으로 분리된다. 다른 양태에서, 스테비올 글리코시드를 포함하는 유기상은 항유화제(demulsifier) 및/또는 핵제(nucleating agent)를 발효 반응에 첨가함으로써 발효물로부터 분리된다. 항유화제의 설명적 예시는 응집제(flocculant) 및 응고제(coagulant)를 포함한다. 핵제의 설명적 예시는 도데칸(dodecane), 이소프로필 미리스트레이트(isopropyl myristrate), 및 메틸 올레에이트(methyl oleate)와 같은 유기 용매와 스테비올 글리코시드 자체의 액적들을 포함한다.

이들 세포에서 생산된 스테비올 글리코시드는 배양 상청액에 존재할 수 있고/할 수 있거나, 숙주 세포와 관련될 수 있다. 스테비올 글리코시드가 숙주 세포와 관련된 양태에서, 스테비올 글리코시드의 회수는 세포를 투과(permeabilizing) 또는 용해시키는 방법을 포함할 수 있다. 대안적으로 또는 동시에, 배양 배지 중 스테비올 글리코시드는 크로마토그래피, 추출, 용매 추출, 막 분리(membrane separation), 전기투석 (electrodialysis), 역삼투(reverse osmosis), 증류, 화학적 유도체화(derivatization) 및 결정화를 포함하나, 이에 한정되는 것은 아닌 회수 공정을 이용하여 회수될 수 있다.

몇몇 양태에서, 스테비올 글리코시드는 유기상에 존재할 수 있는 다른 생성물로부터 분리된다. 몇몇 양태에서, 분리는 흡수(adsorption), 증류, 기체-액체 추출(gas-liquid extraction) [스트리핑(stripping)], 액체-액체 추출 (liquid-liquid extraction) (용매 추출), 진공 추출, 증발, 한외여과, 및 표준 크로마토그래피 기법을 이용하여 달성된다. 다른 적합한 발효 배지 및 방법이 예를 들어, US 제2016/0185813호에 기재되어 있다.

11. 유전적으로 변형된 세포를 생성하는 방법

상기 기재된 변형들 중 하나 이상, 예를 들어, 피숨 사티붐 카우렌 산화효소, 및/또는 예를 들어, 스테비올 글리코시드 화합물에 대한 생합성 경로 효소를 인코딩하는 하나 이상의 핵 이종 핵산을 포함하도록 유전적으로 조작된 숙주 세포를 생산하는 방법이 본원에서 또한 제시된다. 숙주 세포에서 발현을 허용하는 조절 인자(regulatory element)의 제어하에 있는, 효소를 인코딩하는 뉴클레오티드 서열을 포함하는 핵산을 숙주 세포로 도입시킴으로써, 숙주 세포에서 이종 효소의 발현이 달성될 수 있다. 몇몇 양태에서, 핵산은 염색체 외 플라스미드(extrachromosomal plasmid)이다. 다른 양태에서, 핵산은 뉴클레오티드 서열을 숙주 세포의 염색체로 통합시킬 수 있는 염색체 통합 벡터(chromosomal integration vector)이다.

이들 단백질을 인코딩하는 핵산은 제한 없이, 통상의 기술자에게 공지된 임의의 방법에 의해 숙주 세포로 통합될 수 있다 (예를 들어, Hinnen 외. (1978) Proc . Natl. Acad . Sci . USA 75:1292-3; Cregg 외. (1985) Mol . Cell. Biol . 5:3376-3385; Goeddel 외. eds, 1990, Methods in Enzymology, vol. 185, Academic Press, Inc., CA; Krieger, 1990, Gene Transfer and Expression -- A Laboratory Manual, Stockton Press, NY; Sambrook 외, 1989, Molecular Cloning -- A Laboratory Manual, Cold Spring Harbor Laboratory, NY; 및 Ausubel 외, eds., Current Edition, Current Protocols in Molecular Biology, Greene Publishing Associates and Wiley Interscience, NY를 참고한다). 예시적인 기법은 스페로플라스팅(spheroplasting), 전기천공(electroporation), PEG 1000 매개 형질전환, 및 리튬 아세테이트 또는 리튬 클로라이드 매개 형질전환을 포함하나, 이들에 한정되는 것은 아니다.

숙주 세포에서 효소의 카피 수는 효소를 인코딩하는 유전자의 전사를 변형시킴으로써 변경될 수 있다. 이는, 예를 들어, 효소를 인코딩하는 뉴클레오티드 서열의 카피 수를 변형시킴으로써 (예를 들어, 뉴클레오티드 서열을 포함하는 더 높은 카피 수 또는 더 낮은 카피 수의 발현 벡터를 이용함으로써, 또는 뉴클레오티드 서열의 추가의 카피를 숙주 세포의 게놈으로 도입시킴으로써, 또는 숙주 세포의 게놈에서 뉴클레오티드 서열을 결실 또는 파괴시킴으로써); 오페론의 폴리시스트론 mRNA(polycistronic mRNA) 상에서 서열을 코딩하는 순서를 변화시키거나 또는 오페론을 개별적인 유전자 - 각각은 이의 자체 제어 인자(control element)를 지님 - 로 분해시킴으로써; 또는 뉴클레오티드 서열이 작동가능하게 연결된, 프로모터 또는 오퍼레이터의 세기를 증가시킴으로써; 달성될 수 있다. 대안적으로 또는 이에 더하여, 숙주 세포에서 효소의 카피 수는, 효소를 인코딩하는 mRNA의 번역의 레벨을 변형시킴으로써 변경될 수 있다. 이는, 예를 들어, mRNA의 안정성을 변형시킴으로써; 리보솜 결합 부위의 서열을 변형시킴으로써; 리보솜 결합 부위와 효소 코딩 서열의 개시 코돈 사이의 거리 또는 서열을 변형시킴으로써; 효소 코딩 영역의 개시 코돈의 5' 측의 "상류"에 위치하거나 또는 이에 인접한 전체 시스트론 간 영역 (intercistronic region)을 변형시킴으로써; 헤어핀 및 전문화된 서열(specialized sequence)을 이용하여 mRNA 전사물의 3'-말단을 안정화시킴으로써; 효소의 코돈 사용을 변형시킴으로써; 효소의 생합성에서 이용되는 드문 코돈 tRNA(rare codon tRNA)의 발현을 변경함으로써; 및/또는 효소의 안정성을, 예를 들어, 이의 코딩 서열의 돌연변이를 통해 증가시킴으로써; 달성될 수 있다.

숙주 세포에서 효소의 활성은 다음을 포함하나, 이들에 한정되는 것은 아닌 다수의 방법으로 변경될 수 있다: 숙주 세포에서 증가 또는 감소된 용해도를 보이는 효소의 변형된 형태의 발현; 도메인 - 이를 통해 효소의 활성이 억제됨 - 이 결여된 효소의 변형된 형태의 발현; 기질에 대한 더 높거나 더 낮은 Kcat, 또는 더 낮거나 더 높은 Km을 갖는 효소의 변형된 형태의 발현; 또는 경로 내 다른 분자에 의한 피드-백 조절(feed-back regulation) 또는 피드-포워드 조절(feed-forward regulation)에 의해 영향을 더 받거나 또는 덜 받는 효소의 변경된 형태의 발현.

몇몇 양태에서, 숙주 세포를 유전적으로 변형하는 데 이용된 핵산은 형질전환된 숙주 세포의 선별 및 외부 DNA를 유지하기 위해 숙주 세포에 선택압(selective pressure)을 가하는 데 유용한 하나 이상의 선별가능한 마커(selectable marker)를 포함한다.

몇몇 양태에서, 선별가능한 마커는 항생제 저항성 마커이다. 항생제 저항성 마커의 설명적 예시는 BLA , NAT1 , PAT, AUR1 -C, PDR4 , SMR1 , CAT, 마우스 dhfr, HPH, DSDA , KAN ^R , 및 SH BLE 유전자 산물을 포함하나, 이에 한정되는 것은 아니다. E. 콜라이로부터 수득된 BLA 유전자 산물은 베타-락탐 항생제[예, 좁은 범위(narrow-spectrum) 세팔로스포린(cephalosporin), 세파마이신(cephamycin), 및 카바페넴(carbapenem) (에르타페넴(ertapenem)), 세파만돌(cefamandole), 및 세포페라존(cefoperazone)] 및 테모실린(temocillin)을 제외한 모든 항-그람-음성 박테리아 페니실린에 대한 저항성을 부여하고; S. 노우르세이(S. noursei)로부터 수득된 NAT1 유전자 산물은 노우르세오트리신(nourseothricin)에 대한 저항성을 부여하며; S. 비리도크로모게 네스 Tu94로부터 수득된 PAT 유전자 산물은 비알로포스(bialophos)에 대한 저항성을 부여하고; 사카로마이세스 세레비시아로부터 수득된 AUR1 -C 유전자 산물은 아우에로바시딘 A (Auerobasidin A, AbA)에 대한 저항성을 부여하며; PDR4 유전자 산물은 세룰레닌(cerulenin)에 대한 저항성을 부여하고; SMR1 유전자 산물은 설포메투론 메틸(sulfometuron methyl)에 대한 저항성을 부여하며; Tn9 트랜스포존(transposon)으로부터 수득된 CAT 유전자 산물은 클로람페니콜(chloramphenicol)에 대한 저항성을 부여하고; 마우스 dhfr 유전자 산물은 메토트렉세이트에 대한 저항성을 부여하며; 클레브시엘라 뉴모니에(Klebsiella pneumonia)의 HPH 유전자 산물은 하이그로마이신 B(Hygromycin B)에 대한 저항성을 부여하고; E. 콜라이의 DSDA 유전자 산물은 세포가 D-세린을 단독 질소 공급원으로 함유한 플레이트 상에서 성장하도록하며; Tn903 트랜스포존의 KAN ^R 유전는 G418에 대한 저항성을 부여하고; 스트 렙토알로테이쿠스 힌두스타누스 ( Streptoalloteichus hindustanus )로부터 수득된 SH BLE 유전자 산물은 제오신(블레오마이신)[Zeocin (bleomycin)]에 대한 저항성을 부여한다. 몇몇 양태에서, 항생제 저항성 마커는 본원에 개시된 유전적으로 변형된 숙주 세포가 분리된 후에 결실된다.

몇몇 양태에서, 선별가능한 마커는 유전적으로 변형된 미생물에서 영양요구성(auxotrophy) [예, 영양소 영양요구성(nutritional auxotrophy)]을 회복시킨다(rescuing). 이러한 양태에서, 모 미생물은(parent microorganism)은 아미노산 또는 뉴클레오티드 생합성 경로에서 작용하고, 비-기능성인 경우에 모세포가 하나 이상의 영양소로 보충되지 않은 배지에서 성장할 수 없는 상태로 만드는 하나 이상의 유전자 산물에서의 기능상의 파괴(functional disruption)를 포함한다. 이러한 유전자 산물은 효모에서의 HIS3 , LEU2 , LYS1 , LYS2 , MET15, TRP1 , ADE2 , 및 URA3 유전자 산물을 포함하나, 이에 한정되는 것은 아니다. 이어서, 파괴된 유전자 산물의 기능성 카피(functional copy)를 인코딩하는 발현 벡터 또는 염색체 통합 제작물(chromosomal integration construct)로 모세포를 형질전환시킴으로써, 영양요구성 표현형(auxotrophic phenotype)이 회복될 수 있고, 생성된 유전적으로 변형된 숙주 세포는 모세포의 영양요구성 표현형의 상실에 기초하여 선별될 수 있다. 선별가능한 마커로서 URA3 , TRP1, 및 LYS2 유전자의 활용은, 양성 및 음성 선별 모두가 가능하기 때문에, 현저한 이점을 가진다. 양성 선별은 URA3 , TRP1, 및 LYS2 돌연변이의 영양요구성 보완(auxotrophic complementation)에 의해 수행되는 반면에, 음성 선별은 특정한 억제자, 즉, 각각 5-플루오로-오르트산 (fluoro-orotic acid, FOA), 5-플루오로안트라닐산(5-fluoroanthranilic acid), 및 아미노아디프산(aminoadipic acid, aAA) - 자가영양 균주(prototrophic strain)의 성장을 예방하나, 각각 URA3 , TRP1, 및 LYS2 돌연변이의 성장을 허용함 - 에 기초한다. 다른 양태에서, 선별가능한 마커는 공지된 선별 방법에 의해 확인될 수 있는 다른 비-치명적인(non-lethal) 결핍 또는 표현형을 회복시킨다.

본 개시내용의 방법, 조성물 및 유기체에 유용한 특정한 유전자 및 단백질이 본원에 기재되었지만, 이러한 유전자에 대한 절대적인 동일함(absolute identity)이 필수적이지 않다는 것이 인식될 것이다. 예를 들어, 폴리펩티드 또는 효소를 인코딩하는 서열을 포함하는 특정한 유전자 또는 폴리뉴클레오티드의 변화가 수행될 수 있고, 활성에 대해서 스크리닝될 수 있다. 통상적으로, 이러한 변화는 보존적 돌연변이 및 침묵 돌연변이를 포함한다. 이러한 변형된 또는 돌연변이된 폴리뉴클레오티드 및 폴리펩티드는 당해분야에 공지된 방법을 이용하여, 기능성 효소의 발현에 대해서 스크리닝될 수 있다.

유전 암호(genetic code)의 내재하는 축퇴(inherent degeneracy)로 인해, 동일하거나 또는 기능적으로 등가인 폴리펩티드를 실질적으로 인코딩하는 다른 폴리뉴클레오티드가 이러한 효소를 인코딩하는 폴리뉴클레오티드의 클로닝 및 발현에 또한 이용될 수 있다.

코딩 서열을 변형하여, 특정한 숙주에서 이의 발현을 강화시키는 것이 이로울 수 있는데, 이는 통상의 기술자에게 이해될 것이다. 유전 암호는 64개의 가능한 코돈으로 중복되지만(redundant), 대부분의 유기체는 통상적으로 이들 코돈의 하위 집합을 이용한다. 종(species)에서 가장 흔히 사용되는 코돈을 최적 코돈(optimal codon)이라고 하며, 매우 흔히 사용되지 않는 코돈은 드문 (rare) 또는 저-사용 코돈(low-usage codon)으로 분류된다. 때때로, "코돈 최적화" 또는 "종 코돈 편향에 대한 제어(controlling for species codon bias)"라고 하는 과정에서, 코돈이 치환되어 숙주의 바람직한 코돈 사용을 반영할 수 있다. 다른 숙주 세포에 대한 코돈 최적화는 코돈 사용표를 이용하여 용이하게 결정될 수 있거나, 또는 Integrated DNA Technologies의 CodonOp (www.idtdna.com/CodonOptfrom)와 같은 시판중인 소프트웨어를 이용하여 수행될 수 있다.

특정한 원핵 또는 진핵 숙주에 의해 선호되는 코돈을 함유하는 최적화된 코딩 서열 (Murray 외, 1989, Nucl Acids Res. 17: 477-508)이 제조되어, 예를 들어, 번역의 속도를 증가시키거나, 또는 비-최적화된 서열로부터 생산된 전사물에 비해서 더 긴 반감기와 같은, 목적하는 특성을 갖는 재조합 RNA 전사물을 생산할 수 있다. 또한, 번역 종결 코돈이 변형되어, 숙주 선호도를 반영할 수 있다. 예를 들어, S. 세레비시아 및 포유동물에 대한 통상적인 종결 코돈은 각각 UAA 및 UGA이다. 단자엽 식물(monocotyledonous plant)에 대한 통상적인 종결 코돈은 UGA인 반면에, 곤충 및 E. 콜라이는 통상적으로 UAA를 종결 코돈으로 이용한다 (Dalphin 외, 1996, Nucl Acids Res. 24: 216-8).

통상의 기술자는, 유전 암호의 축퇴 성질(degenerate nature)로 인해, 다양한 DNA 분자 - 이들의 뉴클레오티드 서열이 상이한 - 가 본 개시내용의 제공된 효소를 인코딩하는 데 이용될 수 있다는 것을 인식할 것이다. 상기 기재된 생합성 효소를 인코딩하는 천연 DNA 서열이 단지 본 개시내용의 양태를 설명하기 위해 본원에서 언급되고, 본 개시내용은 본 개시내용의 방법에서 활용되는 효소의 폴리펩티드 및 단백질의 아미노산 서열을 인코딩하는 임의의 서열의 DNA 분자를 포함한다. 유사한 방식으로, 폴리펩티드는 목적하는 활성의 상실 또는 유의한 상실 없이, 이의 아미노산 서열에 하나 이상의 아미노산 치환, 결실, 및 삽입을 통상적으로 용인할 수 있다. 본 개시내용은 변형된 또는 변이된 폴리펩티드가 참조 폴리펩티드의 효소 동화 활성(anabolic activity) 또는 이화 활성(catabolic activity)을 갖는 한, 본원에 기재된 특정한 단백질과 상이한 아미노산 서열을 갖는 이러한 폴리펩티드를 포함한다. 또한, 본원에 나타낸 DNA 서열에 의해 인코딩된 아미노산 서열은 단지, 본 개시내용의 양태를 설명한다.

또한, 본원에 제시된 조성물 및 방법에 유용한 효소의 상동체가 본 개시내용에 의해 포함된다. 몇몇 양태에서, 2개의 단백질 (또는 단백질의 영역)은 아미노산 서열이 적어도 약 30%, 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 일치도를 갖는 경우에, 실질적으로 상동성이다. 2개의 아미노산 서열, 또는 핵산 서열의 백분율 일치도를 측정하기 위해, 서열들은 최적의 비교 목적을 위해 정렬된다 (예를 들어, 최적의 정렬을 위해, 갭이 제1 및 제2 아미노산 또는 핵산 서열 중 하나 또는 모두에 도입될 수 있고, 비-상동 서열이 비교 목적을 위해 무시될 수 있다). 하나의 양태에서, 비교 목적을 위해 정렬된 참조 서열의 길이는 참조 서열 길이의 적어도 30%, 통상적으로는 적어도 40%, 더욱 통상적으로는 적어도 50%, 더 더욱 통상적으로는 적어도 60%, 및 더 더욱 통상적으로는 적어도 70%, 80%, 90%, 100% 이다. 대응하는 아미노산 자리 또는 뉴클레오티드 자리에서 아미노산 잔기 또는 뉴클레오티드가 비교된다. 제1 서열에 존재하는 자리에, 제2 서열에 존재하는 대응하는 자리와 동일한 아미노산 잔기 또는 뉴클레오티드가 위치하는 경우에, 분자는 상기 자리에서 일치한다 (본원에서 이용된, 아미노산 또는 핵산 "일치도"는 아미노산 또는 핵산 "상동성"과 등가임). 두 서열 사이의 백분율 일치도는 서열에 의해 공유되는 동일한 자리의 수의 함수이고, 두 서열의 최적의 정렬을 위해 도입될 필요가 있는 갭의 수와 각 갭의 길이를 고려한다.

"상동성-"이 단백질 또는 펩티드에 대해서 이용되는 경우에, 일치하지 않는 잔기 자리는 보존적 아미노산 치환에 의해 대개 상이하지 않다는 것이 인지된다. "보존적 아미노산 치환"은 아미노산 잔기가 유사한 화학적 특성 (예, 전하 또는 소수성)을 지닌 측쇄 (R 기)를 갖는 다른 아미노산 잔기에 의해 치환된 것이다. 대체로, 보존적 아미노산 치환은 단백질의 기능적 특성을 실질적으로 변화시키지 않을 것이다. 2개 이상의 아미노산 서열이 보존적 치환에 의해 서로 상이한 경우에, 백분율 서열 일치도 또는 상동성의 정도(degree of homology)는 상향 조정되어, 치환의 보존적 성질에 대해서 보정할 수 있다. 이러한 조정을 수행하는 수단은 통상의 기술자에게 주지되어 있다 (예를 들어, Pearson W. R., 1994, Methods in Mol Biol 25: 365-89를 참고).

다음의 6개의 그룹은 각각, 서로에 대한 보존적 치환인 아미노산을 함유한다: 1) 세린(Serine, S), 트레오닌(Threonine, T); 2) 아스파라긴산(Aspartic Acid, D), 글루탐산(Glutamic Acid, E); 3) 아스파라긴(Asparagine, N), 글루타민(Glutamine, Q); 4) 아르기닌(Arginine, R), 리신(Lysine, K); 5) 이소류신(Isoleucine, I), 류신(Leucine, L), 알라닌(Alanine, A), 발린(Valine, V), 및 6) 페닐알라닌(Phenylalanine, F), 티로신(Tyrosine, Y), 트립토판(Tryptophan, W).

백분율 서열 일치도로 또한 지칭되는, 폴리펩티드에 대한 서열 상동성은 통상적으로 서열 분석 소프트웨어를 이용하여 측정된다. 상이한 유기체로부터 비롯된 많은 수의 서열을 함유하는 데이터베이스에 분자 서열을 비교하는데 이용되는 통상적인 알고리즘은 컴퓨터 프로그램인 BLAST이다. 많은 수의 상이한 유기체로부터 비롯된 서열을 함유하는 데이터베이스를 검색하는 경우에, 아미노산 서열을 비교하는 것이 통상적이다.

또한, 상기 기재된 효소들을 인코딩하는 유전자들 중 임의의 유전자 (또는 본원에서 언급된 임의의 다른 유전자들 (또는 이들의 발현을 제어 또는 조절하는 조절 인자들 중 임의의 인자))는 통상의 기술자에게 공지된, 유도 진화(directed evolution) 또는 합리적 돌연변이 유발(rational mutagenesis)과 같은 유전자/단백질 조작 기법에 의해 최적화될 수 있다. 이러한 작용은 통상의 기술자가 효모에서의 발현 및 활성에 대해 효소를 최적화하는 것을 허용한다.

또한, 이들 효소를 인코딩하는 유전자가 다른 진균 또는 박테리아 종으로부터 확인될 수 있고, 이 경로의 조절을 위해 발현될 수 있다. 다양한 유기체는 이들 유전자를 위한 공급원으로 작용할 수 있으며, 다음을 포함하나, 이에 한정되는 것은 아니다: S. 세레비시아 및 S. 우바룸(S. uvarum)을 포함하는 사카로마이세 스 spp.; K. 써모톨러란스 (K. thermotolerans ), K. 락티스, 및 K. 마르시아누스를 포함하는 클루이베로마이세스 spp.; 피키아 spp.; H. 폴리모르파를 포함하는 한세눌라 spp.; 칸디다 spp.; 트리코스포론 spp.; Y. spp. 스티피티스(Y. spp. stipitis )를 포함하는 야마다지마 spp . ( Yamadazyma spp .); 토룰라스포라 프레토리 엔시스(Torulaspora pretoriensis ); 이사첸키아 오리엔탈리스(Issatchenkia orientalis); S. 폼베를 포함하는 스키조사카로마이세스 spp.; 크립토코커스 spp .; 아스페르길루스 spp .( Aspergillus spp .); 뉴로스포라 spp.; 또는 우스틸라고 spp.(Ustilago spp.). 혐기성 진균으로부터 수득된 유전자들의 공급원들은 피로마이세스 spp .( Piromyces spp .), 오르피노마이세스 spp .( Orpinomyces spp .), 또는 네 오칼리 마스틱스 spp .( Neocallimastix spp .)를 포함하나, 이에 한정되는 것은 아니다. 유용한 원핵생물 효소의 공급원들은 다음을 포함하나, 이들에 한정되는 것은 아니다: 에세리키아 콜라이, 자이모모나스 모빌리스, 스타필로코커스 아우레우스, 바실 러스 spp., 클로스트리듐 spp., 코리네박테리움 spp .( Corynebacterium spp .), 슈도모나스 spp., 락토코커스 spp., 엔테로박터 spp., 및 살모넬라 spp..

통상의 기술자에게 공지된 기법은 추가의 상동 유전자 및 상동 효소를 확인하는 데 적합할 수 있다. 일반적으로, 유사 유전자(analogous gene) 및/또는 유사 효소(analogous enzyme)는 기능 분석에 의해 확인될 수 있고, 기능적 유사성을 가질 것이다. 통상의 기술자에게 공지된 기법은 유사 유전자 및 유사 효소를 확인하는 데 적합할 수 있다. 예를 들어, 상동 또는 유사 UDP 글리코실 전이효소, PTA, 또는 임의의 생합성 경로 유전자, 단백질, 또는 효소를 확인하기 위해, 기법은 관심 있는 유전자/효소의 공개된 서열에 기초한 프라이머를 이용한 PCR; 또는 관심 있는 유전자들 중 보존된 영역을 증폭하도록 설계된 축퇴 프라이머(degenerate primer)를 이용한 축퇴 PCR(degenerate PCR);에 의한 유전자의 클로닝을 포함하나, 이에 한정되는 것은 아니다. 또한, 통상의 기술자는 기법을 이용하여, 기능적 상동성 또는 유사성을 갖는 상동 또는 유사 유전자, 단백질, 또는 효소를 확인할 수 있다. 기법은 다음을 포함한다: 세포 또는 세포 배양물을 효소의 촉매 활성에 대한 시험관 내 효소 검정을 통해서, 상기 활성에 대해서 검사(예를 들어, 본원 또는 Kiritani, K., Branched-Chain Amino Acids Methods Enzymology, 1970에 기재됨)한 후에, 상기 활성을 갖는 효소를 정제를 통해 분리하는 것, 에드만 분해(Edman degradation)와 같은 기법을 통해 효소의 단백질 서열을 결정하는 것, 유망한 핵산 서열에 대한 PCR 프라이머의 설계, PCR을 통한 상기 DNA 서열의 증폭, 및 상기 핵산 서열의 클로닝. 상동 또는 유사한 유전자 및/또는 상동 또는 유사한 효소, 유사 유전자 및/또는 유사 효소 또는 단백질을 확인하기 위해, 기법은 또한 후보 유전자 또는 효소에 관련된 데이터를 BRENDA, KEGG, 또는 MetaCYC와 같은 데이터베이스와 비교하는 것을 포함한다. 본원의 교시에 따라, 후보 유전자 또는 효소가 상기 언급된 데이터베이스 내에서 확인될 수 있다.

[ 실시예 ]

[ 실시예 1: 파르네실 피로포스페이트 ( FPP ) 및 이소프레노이드 파르네 센(isoprenoid farnesene )에 대해서 높은 플럭스(high flux)를 할 수 있는 기본 효모 균주(base yeast strain)의 생성]

GAL1 또는 GAL10 프로모터의 제어하에서, 메발로네이트 경로 (도 1d)의 유전자를 발현시킴으로써, 파르네센 생산 균주를 야생형 사카로마이세스 세레비시아 균주 (CEN.PK2)로부터 제작했다. 상기 균주는 다음의 염색체 통합된 S. 세레비시아로부터 수득된 메발로네이트 경로 유전자를 포함했다: 아세틸-CoA 티올라제, HMG-CoA 합성효소, HMG-CoA 환원효소, 메발로네이트 인산화효소, 포스포메발로네이트 인산화효소, 메발로네이트 피로포스페이트 탈탄산효소, 및 IPP:DMAPP 이성질화 효소. 공개적으로 입수가능하거나 또는 다른 적합한 알고리즘을 이용하여, 본원에 기재된 모든 유전자를 코돈 최적화시켰다. 이에 더하여, 균주는 아르테미시닌 아누아(Artemisinin annua)로부터 수득되었고, 또한 GAL1 또는 GAL10 프로모터 중 하나의 제어하에 있는, 파르네센 합성효소의 6 카피를 함유했다. 또한, 균주는 GAL80 유전자의 결실과 GAL4oc 프로모터 하에 있는 GAL4의 추가의 카피를 함유했고, 사카 로마이세스 세레비시아의 GAL4 유전자의 코딩 서열은 이의 천연 프로모터의 "작동 구성요소(operative constitutive)" 버전의 조절 제어(regulatory control)하에 있다 (PGAL4oc; 예를 들어, Griggs & Johnston (1991) PNAS 88(19):8597-8601을 참고).　 끝으로, 천연 프로모터를 효모 유전자 MET3의 프로모터로 대체함으로써, 스쿠알렌 합성효소(squalene synthase)를 인코딩하는 ERG9 유전자를 하향조절한다 (Westfall 외, PNAS 2012).

[ 실시예 2: 레바우디오사이드 A ( RebA )에 높은 플럭스를 할 수 있는 기본 효소 균주의 생성]

도 1b는 FPP로부터 스테비올로 만드는 예시적 생합성 경로를 나타낸다. 도 2는 스테비올로부터 글리코시드 RebM으로 만드는 예시적 생합성 경로를 나타낸다. 상기 기재된 파르네센 기본 균주(base strain)를 C-20 이소프레노이드 카우렌에 대한 높은 플럭스를 갖도록 전환하기 위해, 6 카피의 제라닐제라닐 피로포스페이트 합성효소(GGPP)를 게놈으로 통합시킨 후에, 각각 4 카피의 코팔릴디포스페이트 합성효소 및 카우렌 합성효소를 게놈으로 통합시켰다. 표 1은 FPP를 RebA로 전환하는 데 이용된 모든 유전자와 프로모터를 열거한다. 이 시점에서, 6 카피의 파르네센 합성효소를 균주로부터 제거했다. 새로운 균주가 엔트 -카우렌을 만드는 것으로 확인되면, 엔트 -카우렌을 RebA로 전환시키는 나머지 유전자를 게놈으로 삽입했다. 2 카피를 갖는 Sr.KAH 효소를 제외하고, 각 유전자를 단일 카피로 통합시켰다 (표 1). 표 1에 기재된 모든 유전자를 함유하는 균주는 RebA를 주로 생산했다. 효소 UGT91D_like3은 RebA를 레바우디오사이드 D (RebD)로 전환하는 약간 낮은 활성을 가진다. 단일 카피의 91D_like3이 RebA의 약 (3%)를 균주에서 RebD로, 상기 기재된 효모 균주의 (도 3 및 표 2) 생체 내에서 전환시킬 수 있다는 것을 측정했다. 이어서, UGT76G1은 RebD를 최종 생성물인 레바우디오사이드 M (RebM)으로 전환할 수 있다.

[ 실시예 3: 고효율로, 카우렌을 카우레노산 으로 전환시키는 카우렌 산화효소 (KO)의 스크리닝]

RebM에 대한 높은 플럭스를 갖는 균주를 생성하기 위해, 실시예 2에 기재된 균주를 GAL1 프로모터 하에 있는, 단일 카피의 유전자 UGT40087로 형질전환시켰다 (실시예 8과 표들 및 본원에 부록(appendix)으로 첨부된 PCT 출원 AM-7400 PCT의 도면에 기재됨). 이 균주는 RebM을 주로 생산한다. 생체 내에서 카우렌을 카우레노산으로 전환하기 위한, 상이한 KO 대립 유전자를 스크리닝하기 위해, 이 RebM 균주에서 스테비아 레바우디아나 KO 유전자를 제거했고, GAL1 프로모터와 터미네이터(terminator) - 프로모터와 터미네이터 사이에 F-CphI 제한 서열(restriction sequence)을 갖는 - 만 함유하는 랜딩 패드로 대체했다 (도 3). 이제, 이 스크리닝 균주는 임의의 KO 효소가 결여되었고, 엔트-카우렌만 생성한다.

문헌으로부터 획득된 13개의 KO 효소 (표 1)를 S. 세레비시아에서 최적의 발현을 위해 코돈 최적화했고, 도 3a에 기재된 랜딩 패드에서 F-CphI 서열을 플랭킹하는(flanking) 효모 터미네이터 및 PGAL1에 대해서 상동인 60 bp의 서열로 합성했다. 각각의 합성된 KO 유전자를, 단일 카피로, 상기 기재된 효모 균주에서, 엔트 -카우렌을 카우레노산으로 생체 내에서 전환하는 능력에 대해서 개별적으로 테스트했다. 효모를 KO 공여 DNA 및 랜딩 패드 내에 DNA를 절단하기 위한 엔도뉴클레아제 F-CphI을 함유하는 플라스미드로 형질전환시켰다. 각 형질전환에서 특정한 KO 유전자에 인터널(internal)인 역방향 프라이머와 GAL1 프로모터의 말단에 있는 유니버셜 정방향 프라이머(universal forward primer)를 이용한 콜로니 PCR에 의해 정확한 통합을 확인했다. 도 3b는 정확한 F-CphI 절단 및 KO DNA를 이용한 상동 재조합(homologous recombination) 후, 최종 유전자 제작물을 나타낸다.

[표 1: 카우레노산으로의 카우렌의 더 높은 전환에 대해서, 효모에서 테스트된 카우렌 산화효소]

도 4는 KO 스크리닝의 결과를 나타낸다. 이 균주 백그라운드(strain background)에서, 스테비아 레바우디아나 (Sr.KO)로부터 수득된 KO 효소에 비해서, 식물 피숨 사티붐 (완두)으로부터 수득된 하나의 KO 효소 (Ps.KO)는 엔트 -카우렌을 카우레노산으로 전환하는 증가된 능력 (약 3.5x 개선됨)을 갖는 것으로 밝혀졌다. 효모 세포에서의 발현에 이용된 피숨 사티붐 KO 효소의 코돈 최적화된 핵산 서열은 서열번호 15로 제시된다.

[ 실시예 4: 카우레노산으로의 엔트 - 카우렌의 개선된 전환을 갖는 높은 플럭스 RebM 균주의 생성]

Ps.KO의 활성을 RebM에 대한 매우 높은 플럭스를 지닌 균주에서 Sr.KO에 대해서 테스트했다. KO 효소는 보통, 대부분의 식물에서 작용하여, 식물 호르몬인 지베렐린(gibberellin)을 생산한다. 식물 세포에서 지베렐린의 레벨은 산업용 생산을 위해 효소에서 생산된 RebM의 레벨보다 크기 정도들(orders of magnitude)이 낮으므로, KO 효소는 상업용 제조를 위한 RebM의 생산에 필요한 높은 플럭스를 지닐 것으로 예상되지 않는다. 표 3은 초기에 KO 효소를 스크리닝하는 데 이용된 균주 (즉, KO "기본 균주")보다 더 높은 RebM 플럭스를 지닌 균주에 함유된 모든 유전자 및 프로모터를 열거한다. 표 3의 모든 유전자들을 효모 게놈으로 삽입했다. KO 유전자는 엔트 -카우렌을 3차례 후속적으로 산화시켜, 카우레노산을 생산한다. 반응의 순서 및 중간체는 다음과 같다: 첫 번째 산화는 엔트 -카우렌을 카우레놀로 만들고 (K-OL), 두 번째 산화는 카우레놀을 카우레날로 만들며 (K-AL), 세 번째 산화는 카우레날을 카우레노산 (-acid)으로 만든다 (도 1c). 엔트 -카우렌으로부터 RebM으로 최대 플럭스를 달성하기 위해, KO 효소는 엔트 -카우렌을 K-acid로 완전히 산화시켜야 한다. 불완전한 전환은 탄소를 소모할 것이고, RebM 역가를 전반적으로 감소시킬 것이며, 독성 중간체 화합물을 잠재적으로 생산할 것이다. 도 5의 데이터는 RebM에 대한 높은 탄소 플럭스를 지닌 균주에서, Sr.KO 대립 유전자가 상류 중간체인 엔트 -카우렌, 카우레놀 (K-OL), 카우레날 (K-AL)의 유의한 양을 축적한다고 나타낸 반면에, Ps.KO 효소는 이들 중간체의 유의하게 감소된 축적을 나타낸다.

도 6은 Sr.KO에 비해서 Ps.KO으로 생산된 카우레노산의 더 높은 양으로 인해, Ps.KO가 세포에서 만들어진 RebM의 양을 증가시킨다는 것을 나타낸다. 높은 플럭스 RebM 균주에서, Sr.KO를 지닌 동일한 균주에 비해서 Ps.KO를 지닌 균주에서 RebM 역가가 16% 증가한다. 이러한 더 높은 RebM 역가는 Ps.KO 균주에서 생산되는 더 많은 카우레노산으로 인한 것이다.

[ 실시예 5: 효모 배양 조건]

예상되는 카우렌 산화효소 유전자를 함유하는 것으로 확인된 효모 콜로니를 찍어서(picking), 20 g/L의 수크로스 및 37.5　g/L의 암모늄 설페이트와 함께 버드 시드 배지(Bird Seed Media, BSM; 본래, van Hoek 외, Biotechnology and Bioengineering 68(5), 2000, pp. 517-523에 의해 기재됨)를 함유하는 96-웰 마이크로타이터 플레이트(96-well microtiter plate)로 넣었다. 세포를 30℃에서, 고용량 마이크로타이터 플레이트 배양기(high capacity microtiter plate incubator)에서, 1000 RPM으로 80%의 습도에서 3일 동안 진탕시키며, 배양물이 탄소 소진(carbon exhaustion)에 도달할 때까지 배양시켰다. 성장-포화 배양물(growth-saturated culture)로부터 14.4 μL를 취해, 360 μL의 새로운 배지 중으로 희석시킴으로써, 포화 배양물을 40　g/L의 수크로스 및 150　g/L의 암모늄 설페이트와 함께 BSM를 함유하는 새로운 플레이트 내로 계대 배양시켰다(subculturing). 생산 배지 중 세포를 30℃에서, 고용량 마이크로타이터 플레이트 진탕기(high capacity microtiter plate shaker)에서, 1000 RPM으로, 80%의 습도에서 추출 및 분석하기 전 추가로 3일 동안 배양시켰다. 완료되면, 전세포 배양액을 100% 에탄올 360 μL로 희석시키고, 호일 씰(foil seal)로 실링하여, 1250　rpm에서, 30분 동안 진탕시켜, 레바우디오사이드를 추출한다. 50:50의 에탄올:물 490 μL를 새로운 1.1-mL 검정 플레이트에 추가하고, 10uL의 배양물/에탄올 혼합물을 상기 검정 플레이트에 추가한다. 상기 혼합물을 원심분리시켜 임의의 고체를 펠렛으로 만들었고(peletting), 400　μL의 용액을 새로운 1.1-mL 플레이트로 옮겨, LC-MS에 의해 검정했다.

[ 실시예 6: 분석 방법]

스테비올 및 스테비올 글리코시드의 질량 분석기 검출:

샘플을 LC-MS 질량 분석기(AB QTrap 4000)에 의해 다음의 기울기와 함께, Sigma Ascentis Express Peptide ES-C18 (5　cm, 2.1　mm, 2.7　㎛; part #53301-U)를 이용하여 분석한다:

질량 분석기를 음이온 다중 반응 모니터링 모드(negative ion multiple reaction monitoring mode)에서 작동시켰다. 인증 표준(authentic standard)으로부터 결정된 머무름 시간(retention time) 및 MRM 전이(MRM transition)에 의해 각각의 레바우디오사이드 이성질체를 확인했다:

카우렌 정량:

배양액 중 엔트 -카우렌의 역가를 제한된 열 질량 오븐(limited thermal mass oven)과 불꽃 이온화 검출기(flame ionization detector)가 장착된 기체 크로마토그래피를 이용하여 측정한다. 동일한 비율의 배양액 및 메탄올을 이용하여 배양액 샘플을 추출하고, 실링된 용기에서 30분 동안 진탕시켜, 세포로부터 엔트-카우렌을 회수한다. 이어서, 배양액:메탄올 용액의 240 uL의 분획(aliquot)을 1 mL의 에틸 아세테이트와 희석시키고, 실링하여, 추가의 30분 동안 진탕시켜, 엔트-카우렌을 유기상 중으로 추출한다. 상기 유기상을 적절히 희석하여, 검정의 선형 범위(linear range) 내에 속하도록 하고, 샘플 바이알로 분취했다(aliquoting). 샘플을 적절한 분할비(split ratio)로 주입하여, 선형 범위 내에 속하도록 했다. 정압모드(constant pressure mode)에서, 운반 기체(carrier gas)로서 수소와 함께, 애질런트(Agilent) DB-1MS LTM II 컬럼 상에서 다음의 온도 기울기(temperature gradient)를 이용하여 샘플 분리를 수행했다: (1) 0분 동안 초기온도 150^oC, (2) 25^oC/분의 온도를 230 ^oC의 온도로 증가시킴, (3) 1800 ^oC/분의 온도를 320 ^oC의 온도로 증가시키고, 1분 동안 유지. 인증된 엔트 -카우렌 표준을 이용한 외부 교정(external calibration)을 이용하여 엔트-카우렌의 양을 측정한다.

카우레노산 , 카우레놀 , 및 카우레날 정량 :

배양액 중 카우레노산, 카우레놀, 및 카우레날의 역가를 가변파장 검출기(variable wavelength detector)가 장착된 고압 액체 크로마토그래프(high pressure liquid chromatograph)를 이용하여 측정한다. 배양액 샘플(100　μL)을 300　μL의 에탄올 중에 희석시켜, 실링된 용기에서 30분 동안 진탕시켰다. 200　μL의 물을 배양액:에탄올 혼합물에 추가하여, 혼합시켰고, 원심분리시켰다. 생성되는 용액의 분획을 (세포 펠렛을 피하며) 샘플 바이알로 옮겼고, HPLC를 이용하여 분석했다. 애질런트 Eclipse Plus C18 USP L1 (4.6　mm x 50　mm x 1.8　μm) 상에서 다음의 용매를:

이동상 A: 0.1%의 수 중 포름산 (v/v)

이동상 B: 0.1%의 아세토니트릴 중 포름산 (v/v)

다음의 용매 기울기와 함께 이용하여, 샘플 분리를 수행한다:

피분석물(analyte)을 200　nm에서의 UV 흡수를 이용하여 검출하고, 스테비올 표준에 대한 상대 반응 계수(relative response factor)와 함께 외부 교정으로 정량한다.

도 6에 제시된 데이터에 이용된 레바우디오사이드 M 정량법:

배양액 중 레바우디오사이드 M의 역가를 삼중 사중극자 질량 분석기(triple quadrupole mass spectrometer)가 장착된 고압 액체 크로마토그래프를 이용하여 측정한다. 배양액 샘플을 에펜도르프 튜브(Eppendorf tube) 내로 분취하여, 50:50의 에탄올:물 중에 200배 내지 800배로 희석시켜, 20분 동안 혼합시켰고, 원심분리시켜 세포와 잔해물을 펠렛으로 만들었으며, 상청액의 분획을 분석용 샘플 바이알로 옮겼다. 피분석물이 MRM 전이의 신호 강도에 기초하여 정량되는 유동 주입 모드(flow injetion mode)에서 샘플을 검사한다. 이동상 40%의 물 + 0.1%의 포름산 및 60%의 아세토니트릴 + 0.1%의 포름산과 1.1　mL/분의 유속. 레바우디오사이드 M 농도를 내부 표준 (레바우디오사이드 N)의 반응에 대해서 정규화된 이의 반응에 의해 측정한다.

[표 2: FPP를 RebA로 전환하는 데 이용된 효소의 유전자, 프로모터, 및 아미노산 서열]

[표 3: RebM을 생산하는 균주에서 효소의 유전자, 프로모터, 카피 수, 및 아미노산 서열]

본 명세서에서 인용된 모든 간행물, 특허, 및 특허 출원은 참고로 본원에 포함되며, 각각의 개별적인 간행물 또는 특허 출원은 참고로 포함되었음이 구체적이고 개별적으로 명시되었다고 간주된다. 명료한 이해를 위해, 상기 기재된 발명이 도시 및 예시로서 일부 상세히 기재되었으나, 본 발명의 교시를 고려하면, 첨부된 청구범위의 사상 및 범위로부터 벗어나지 않고, 본 발명에 특정한 변화 및 변형이 행해질 수 있다는 것은 통상의 기술자에게 용이하게 명백할 것이다.

[서열목록]

>Seq_ID_1

MDTLTLSLGFLSLFLFLFLLKRSTHKHSKLSHVPVVPGLPVIGNLLQLKEKKPHKTFTKMAQKYGPIFSIKAGSSKIIVLNTAHLAKEAMVTRYSSISKRKLSTALTILTSDKCMVAMSDYNDFHKMVKKHILASVLGANAQKRLRFHREVMMENMSSKFNEHVKTLSDSAVDFRKIFVSELFGLALKQALGSDIESIYVEGLTATLSREDLYNTLVVDFMEGAIEVDWRDFFPYLKWIPNKSFEKKIRRVDRQRKIIMKALINEQKKRLTSGKELDCYYDYLVSEAKEVTEEQMIMLLWEPIIETSDTTLVTTEWAMYELAKDKNRQDRLYEELLNVCGHEKVTDEELSKLPYLGAVFHETLRKHSPVPIVPLRYVDEDTELGGYHIPAGSEIAINIYGCNMDSNLWENPDQWIPERFLDEKYAQADLYKTMAFGGGKRVCAGSLQAMLIACTAIGRLVQEFEWELGHGEEENVDTMGLTTHRLHPLQVKLKPRNRIY

>Seq_ID_2

MDAVTGLLTVPATAITIGGTAVALAVALIFWYLKSYTSARRSQSNHLPRVPEVPGVPLLGNLLQLKEKKPYMTFTRWAATYGPIYSIKTGATSMVVVSSNEIAKEALVTRFQSISTRNLSKALKVLTADKTMVAMSDYDDYHKTVKRHILTAVLGPNAQKKHRIHRDIMMDNISTQLHEFVKNNPEQEEVDLRKIFQSELFGLAMRQALGKDVESLYVEDLKITMNRDEIFQVLVVDPMMGAIDVDWRDFFPYLKWVPNKKFENTIQQMYIRREAVMKSLIKENKKRIASGEKLNSYIDYLLSEAQTLTDQQLLMSLWEPIIESSDTTMVTTEWAMYELAKNPKLQDRLYRDIKSVCGSEKITEEHLSQLPYITAIFHETLRRHSPVPIIPLRHVHEDTVLGGYHVPAGTELAVNIYGCNMDKNVWENPEEWNPERFMKENETIDFQKTMAFGGGKRVCAGSLQALLTASIGIGRMVQEFEWKLKDMTQEEVNTIGLTTQMLRPLRAIIKPRI

>Seq_ID_3

MAFFSMISILLGFVISSFIFIFFFKKLLSFSRKNMSEVSTLPSVPVVPGFPVIGNLLQLKEKKPHKTFTRWSEIYGPIYSIKMGSSSLIVLNSTETAKEAMVTRFSSISTRKLSNALTVLTCDKSMVATSDYDDFHKLVKRCLLNGLLGANAQKRKRHYRDALIENVSSKLHAHARDHPQEPVNFRAIFEHELFGVALKQAFGKDVESIYVKELGVTLSKDEIFKVLVHDMMEGAIDVDWRDFFPYLKWIPNKSFEARIQQKHKRRLAVMNALIQDRLKQNGSESDDDCYLNFLMSEAKTLTKEQIAILVWETIIETADTTLVTTEWAIYELAKHPSVQDRLCKEIQNVCGGEKFKEEQLSQVPYLNGVFHETLRKYSPAPLVPIRYAHEDTQIGGYHVPAGSEIAINIYGCNMDKKRWERPEDWWPERFLDDGKYETSDLHKTMAFGAGKRVCAGALQASLMAGIAIGRLVQEFEWKLRDGEEENVDTYGLTSQKLYPLMAIINPRRS

>Seq_ID_4

MAVATDPLGCMQKLVQMLQAPPYVAAAVQSSALLLTFFIGDWRKRRRSPLPLLPAIPGIPVLGNLLQLKEKKPHKTFAQWSETYGPIYSIKAGASTVIVLNSSDLAKEAMVTRYSSISSRKLSKALTILTADKCMVAMSDYNDFHKLVKRYILANVLGANAQKRLRQRRDTMIDNISRELFACVKDSSSESVNFRKIFESELFGLALKETFGRDMESLYVDGLGTTLLREDLFRTLVIDPMEGAIEVDWRDFFPYLRWIPNKGVEDRIRKMDFRRRVTMKSLMEEKKKQIAAGEDLNCYSEFLLSEAKSLTEEQISMLLWEIIIETSDTTLVVTEWAMYELAQNPKRQERLYQHIQSVCGSAKITEENLSQLPYLTAVFHETLRKYSPVSIVPLRYAHEDTQLGGYFIPAGSEVAVNIYACNMDKKQWESPEEWKPERFLDESYDPMDLYKTMAFGGGKRVCAGAPKAMLIACTTLGRLVQGFTWKLREGEEDKVDTLGLTARKLQPLHIVAKPRIN

>Seq_ID_5

MAVVTDPLASMQLLANTIPAPPYAAAAVLGGVSLVLSVFFVADCRKKRRNFLPPVPAVPGVPVLGNLLQLKEKKPHKTFARWAETYGAVYSIRTGASTVIVLNTTEVAKEAMVTRYGSISSRKLSKALTILTADKCMVAMSDYNEFHKMVKRYILANVLGANAQKKHRQRRDAMIENISRELFAHVKEFPLDTVNFRKIFEAELFRLALKETLGKDIESIYVDGLGTTLPREDLFRILVIDPMEGAIEVDWRDFFPYLRWIPNKRVENKIRNMDFRRRMTMKKLMEEPKKRIAAGEETYCYADFLLSEAKTLTEDQISMLLWETIIETSDTTLVVTEWAMYELSKDPRRQDYLYQQIQSVCGSATLTEENLSQLPYLTAIFHETLRKHSPVPVVPLRYAHEDTQLGGYFVPAGSEIAVNIYACNMDKDHWESPEEWKPERFLDDKYDPMDLHKTMAFGGGKRVCAGALKAMLIACTTIGRMVQEFEWKLREGEEEKVDTLGLTARKLQPLHVVIKPRNN

>Seq_ID_6

MSKSNSMNSTSHETLFQQLVLGLDRMPLMDVHWLIYVAFGAWLCSYVIHVLSSSSTVKVPVVGYRSVFEPTWLLRLRFVWEGGSIIGQGYNKFKDSIFQVRKLGTDIVIIPPNYIDEVRKLSQDKTRSVEPFINDFAGQYTRGMVFLQSDLQNRVIQQRLTPKLVSLTKVMKEELDYALTKEMPDMKNDEWVEVDISSIMVRLISRISARVFLGPEHCRNQEWLTTTAEYSESLFITGFILRVVPHILRPFIAPLLPSYRTLLRNVSSGRRVIGDIIRSQQGDGNEDILSWMRDAATGEEKQIDNIAQRMLILSLASIHTTAMTMTHAMYDLCACPEYIEPLRDEVKSVVGASGWDKTALNRFHKLDSFLKESQRFNPVFLLTFNRIYHQSMTLSDGTNIPSGTRIAVPSHAMLQDSAHVPGPTPPTEFDGFRYSKIRSDSNYAQKYLFSMTDSSNMAFGYGKYACPGRFYASNEMKLTLAILLLQFEFKLPDGKGRPRNITIDSDMIPDPRARLCVRKRSLRDE

>Seq_ID_7

MNKFNSMNNTINETLLRQLVSGLDEIPLMDIHWLIYVAFGAWLCSYVIHLLSSPSTVNVPFVGYRSVFEPTWFLRLRFVWEGGSIISQGYSKFKDSIFQVRKLGTDIVIIPPNYIDEVRKLSQDKTRSVEPFINDFAGDYTRGMVFLQSDLQNRVIQQRLTPKLVSLTKVMKEELDYALTKGMPDMKDDEWVEADIASIMVRLISRISARVFLGPEHCRNQEWLTTTAEYSESLFMTGFILRVVPHILRPFVAPLLPSYRTLLRSVSSGRKVIGDIIRSQQGSENEDILSWMVEAATGEEKQVDNIAQRMLILSLASIHTTAMTMTHAMYDLCARPEYTKPLREEVKGVVGASGWDKTALNRLHKLDSFLKESQRFNPVFLLTFNRIYHQPMTLSDGTNLPSGTRIAVPSHAMLQDSAHVPGPAPPTDFDGFRYSKIRSDSNYAQKYLFSMTDSSNMAFGYGKYACPGRFYASNEMKLTLAILLLQFEFKLPDGKGRPRNITIDSDMVPDPRARLCVRKRSLREE

>Seq_ID_8

MDLQTMAPMGSAAIAIGGPAVAVAGGISLLFLKSFLSQQPGNPNHLPSVPAVPGVPLLGNLLELKEKKPYKTFTKWAETYGPIYSIKTGATSMVVVNSNQLAKEAMVTRFDSISTRKLSKALQILTADKTMVAMSDYDDYHKTVKRNLLTSILGPAAQKRHRAHRDAMGDNLSRQLHALALNSPQEAINFRQIFQSELFTLAFKQTFGRDIESIFVGDLGTTMTREEMFQILVVDPMMGAIDVDWRDFFPYLKWIPNAKLEEKIEQMYIRRKAVMKAVIQEHRKRIDSGENLDSYIDFLLAEAQPLTEKQLLMSLWEPIIETSDTTMVTTEWAMYELSKHPNKQQRLYNEIRNICGSEKITEEKLCKMPYLSAVFHETLRVHSPVSIIPLRYVHENTELGGYHVPAGTELAVNIYGCNMEREIWENPEEWSPERFLAENEPVNLQKTMAFGAGKRVCAGAMQAMLLACVGIGRMVQEFEWRLKDDVEEDVNTLGLTTQRLNPMLAVIKPRN

>Seq_ID_9

MDGVIDMQTIPLRTAIAIGGTAVALVVALYFWFLRSYASPSHHSNHLPPVPEVPGVPVLGNLLQLKEKKPYMTFTKWAEMYGPIYSIRTGATSMVVVSSNEIAKEVVVTRFPSISTRKLSYALKVLTEDKSMVAMSDYHDYHKTVKRHILTAVLGPNAQKKFRAHRDTMMENVSNELHAFFEKNPNQEVNLRKIFQSQLFGLAMKQALGKDVESIYVKDLETTMKREEIFEVLVVDPMMGAIEVDWRDFFPYLKWVPNKSFENIIHRMYTRREAVMKALIQEHKKRIASGENLNSYIDYLLSEAQTLTDKQLLMSLWEPIIESSDTTMVTTEWAMYELAKNPNMQDRLYEEIQSVCGSEKITEENLSQLPYLYAVFQETLRKHCPVPIMPLRYVHENTVLGGYHVPAGTEVAINIYGCNMDKKVWENPEEWNPERFLSEKESMDLYKTMAFGGGKRVCAGSLQAMVISCIGIGRLVQDFEWKLKDDAEEDVNTLGLTTQKLHPLLALINPRKS

>Seq_ID_10

MEAFVPGGAGAAAAAVGGFVAAAALAERAGVIAPRKRPNAPPAVPGLPIIGNLHQLKEKKPHQTFAKWAEIYGPIYTIRTGASSVVVLNSTEVAKEAMVAKFSSISTRKLSKALTVLTRDKSMVATSDYCDFHKMVKRYVMSSMLGTSAQKQFRDIRDMMIHNMLSTFHKLVKDDPHAPLIFRDVFKDELFRLSMIQSLGEDVSSVYVDEFGRDISKEEIYNATVTDMMMCAIEVDWRDFFPYLSWVPNKSFETRVFTTETRRTAVMRALIKQQKERIVRGEAKTCYLDFLLAENTLTDEQLMMLVWEALIEAADTTLVTTEWAMYELAKNPDKQERLYQEIREVCGDETVTEEHLPRLPYLNAVFHETLRRHSPVPLIPPRFVHEDTKLAGYDVPAGTEMVINLYGCNMNRKEWESPEEWVPERFAGGRLEVADMYKTMAFGAGRRACAGSLQATHIACAAVARFVQEFGWRLREGDEEKVDTVQLTAYKLHPLHVHLTRRGRM

>Seq_ID_11

MLETKVIAHHVSHSPCAAIPGGLPVLGNLLQLTEKKPHRTFTAWSKEHGPIFTIKVGSVPQAVVNNSEIAKEVLVTKFASISKRQMPMALRVLTRDKTMVAMSDYGEEHRMLKKLVMTNLLGPTTQNKNRSLRDDALIGMIEGVLAELKASPTSPKVVNVRDYVQRSLFPFALQQVFGYIPDQVEVLELGTCVSTWDMFDALVVAPLSAVINVDWRDFFPALRWIPNRSVEDLVRTVDFKRNSIMKALIRAQRMRLANLKEPPRCYADIALTEATHLTEKQLEMSLWEPIIESADTTLVTSEWAMYEIAKNPDCQDRLYREIVSVAGTERMVTEDDLPNMPYLGAIIKETLRKYTPVPLIPSRFVEEDITLGGYDIPKGYQILVNLFAIANDPAVWSNPEKWDPERMLANKKVDMGFRDFSLMPFGAGKRMCAGITQAMFIIPMNVAALVQHCEWRLSPQEISNINNKIEDVVYLTTHKLSPLSCEATPRISHRLP

>Seq_ID_12

MMDDTTSPYSTYHSVRSIRNQSAWALAPIAVFICYVVLRHNRKSVPAASAGSHSILEPLWLARLRFIRDSRFIIGQGYSKFKDTIFKVTKVGADIIVVAPKYVEEIRRLSRDTGRSVEPFIHDFAGELLGGLNFLESDLQTRVVQQKLTPNLKTIVPVMEDEMHYALVSELDSCLDGSEHWTRVDMIHMLSRIVSRISARIFLGPKYCRNDLWLKTTAEYTENLFLTGTLLRFVPRMLQKWIAPLLPSFRQLQENRQAARKIISEILTDHQPEKHDETSDNGDPYPDILTLMFQAARGKEKDIEDIAQHTLLLSLSSIHTTALTMTQALYDLCAYPQYLDPVKHEIADTLQSEGSWSKAMLDKLHMMDSLLRESQRLSPVFLLTFNRILHTPLTLSNGIHLPKGTRIAAPSDAILNDPSLVPGPQPADTFDPFRYINHSTGDAKKTKTNFQTTSLQNMAFGYGKYACPGRFYVANEIKLVLGHLLMHYEFKFPPGMGRPVNSTVDTDMYPDLGARLLVRKRKMEE

>Seq_ID_13

MESLVAALPAGGAAAAAAFGGLVAAAALAGKVGLVGSKKHLNAPPAVSGLPLIGNLHQLKEKKPHQTFTKWAEIYGPIYTIRTGSSTVVVLNSAQVAKEAMIAKFSSISTRKLSKALSALTRDKTMVATSDYGDFHKMIKRYIMTFMLGTSGQKQFRDTRNMMVDNMLNTFHTLLMDDPNSPLNFREVFKNELFRLSLVQALGEDVSSIYVEEYGKVISKEEIYKATVVDMMMCAIEVDWRDFFPYLSWIPNRTFETRVLTTEARRTTVMQALIKQQKERIARGETRISYLDFLLAENTLTDEQLLMLVWEAVIEAADTTLVTTEWAMYEIAKHPEKQEYLYQEIQKVCGNKTVTEDHLPELPYLNAVFHETMRRHSPVPLVPPRLVHENTNLAGYEVPAGTEIIINLYGCNMNKNDWAEPEEWKPERFLDGRFEAVDMHKTMAFGAGRRACAGSMQAMNISCTAIGRFVQEFAWRLEEGDEDKVDTIQLTTNRLYPLHVYLAPRGRK

>SEQ ID NO:14 AY245442.1 ent-kaurene oxidase mRNA [Pisum sativum]

GTGGTGAAGCAACTAGCAGTGGCAGCCATGGATACTCTCACACTTTCTTTGGGTTTTTTA

TCTCTCTTTTTGTTCCTCTTCTTACTAAAGAGATCTACTCACAAACATTCCAAGCTTTCC

CATGTACCAGTGGTTCCAGGTTTGCCAGTGATTGGGAATCTGCTGCAATTGAAAGAGAAG

AAACCTCACAAGACATTCACAAAGATGGCTCAGAAATATGGACCCATTTTTTCCATCAAA

GCTGGTTCTTCCAAAATCATTGTTCTCAACACTGCTCATCTTGCTAAAGAGGCAATGGTG

ACTAGATATTCATCAATTTCAAAAAGGAAGCTATCAACTGCACTGACGATTCTAACTTCG

GATAAATGCATGGTTGCTATGAGCGACTACAATGATTTTCACAAAATGGTTAAAAAACAT

ATTCTTGCAAGTGTTCTTGGAGCCAATGCACAGAAGCGACTCCGTTTTCACAGAGAGGTT

ATGATGGAAAATATGTCTAGTAAGTTTAATGAACATGTGAAGACCCTCTCAGATTCTGCT

GTTGATTTTAGGAAAATATTTGTGTCTGAACTTTTCGGATTAGCACTAAAGCAAGCTCTG

GGAAGTGATATTGAATCCATTTATGTGGAGGGTTTGACGGCTACATTATCAAGAGAGGAC

TTATATAACACTCTAGTGGTTGATTTTATGGAGGGTGCAATTGAGGTGGATTGGAGAGAT

TTCTTCCCGTACCTGAAATGGATTCCAAATAAGAGCTTCGAGAAGAAAATCCGTAGAGTC

GATCGCCAAAGAAAAATTATCATGAAGGCACTAATTAATGAGCAAAAGAAGCGGTTGACA

TCAGGAAAAGAATTAGATTGTTATTATGATTACCTAGTATCAGAAGCTAAAGAAGTGACT

GAAGAACAAATGATCATGCTGCTCTGGGAGCCAATTATTGAGACATCCGATACTACCTTA

GTCACGACAGAATGGGCTATGTATGAACTTGCCAAAGACA

>Seq_ID_15

ATGGATACCTTAACTTTGTCTTTAGGTTTCTTATCTTTGTTCTTATTTTTATTCTTGTTAAAGAGATCTACTCACAAGCACTCCAAGTTATCCCACGTTCCAGTTGTTCCAGGTTTGCCTGTCATTGGTAACTTATTGCAATTGAAAGAAAAGAAGCCACACAAGACTTTCACCAAGATGGCTCAAAAGTACGGTCCAATTTTCTCCATCAAAGCCGGTTCTTCTAAAATCATTGTTTTAAACACTGCCCACTTGGCTAAAGAAGCTATGGTTACTAGATATTCTTCCATCTCCAAGAGAAAGTTGTCTACTGCTTTGACCATCTTGACTTCTGATAAGTGCATGGTTGCTATGTCCGATTATAACGACTTCCACAAGATGGTTAAGAAGCACATCTTGGCTTCTGTTTTGGGTGCCAACGCCCAAAAGAGATTGCGTTTCCACAGAGAAGTCATGATGGAAAACATGTCTTCCAAATTCAATGAACATGTCAAGACTTTGTCTGATTCTGCTGTTGACTTCAGAAAGATTTTCGTTTCTGAATTATTTGGTTTGGCTTTGAAGCAAGCTTTGGGTTCCGATATCGAATCTATCTACGTTGAAGGTTTGACTGCTACTTTATCTAGAGAAGATTTGTATAACACCTTGGTCGTCGACTTCATGGAAGGTGCTATCGAAGTTGATTGGAGAGACTTTTTCCCTTATTTGAAGTGGATTCCAAACAAATCCTTCGAAAAGAAGATCAGAAGAGTTGATAGACAAAGAAAAATTATCATGAAAGCTTTGATCAACGAACAAAAGAAAAGATTGACCTCTGGTAAGGAATTGGACTGTTACTACGATTACTTAGTTTCTGAAGCTAAGGAAGTCACCGAAGAACAAATGATCATGTTGTTGTGGGAACCAATTATTGAGACTTCTGATACTACTTTAGTTACCACCGAATGGGCTATGTATGAGTTGGCTAAGGACAAGAACCGTCAAGACAGATTGTACGAAGAATTGTTGAACGTTTGTGGTCACGAAAAGGTTACTGATGAAGAATTGTCCAAGTTGCCATACTTAGGTGCTGTCTTTCACGAAACCTTGCGTAAACACTCTCCAGTTCCAATCGTCCCATTGAGATACGTTGATGAAGATACCGAATTGGGTGGTTATCATATTCCTGCCGGTTCCGAAATCGCTATCAACATTTACGGTTGTAATATGGATTCCAACTTGTGGGAGAACCCAGATCAATGGATCCCTGAAAGATTTTTAGATGAAAAATACGCCCAAGCTGATTTGTATAAGACTATGGCTTTCGGTGGTGGTAAAAGAGTCTGTGCTGGTTCCTTACAAGCTATGTTGATTGCCTGTACTGCTATTGGTAGATTGGTTCAAGAATTTGAATGGGAATTGGGTCACGGTGAAGAAGAAAACGTTGACACCATGGGTTTAACTACCCATAGATTACACCCATTGCAAGTCAAATTAAAGCCAAGAAACAGAATTTACTAA

>SEQ ID NO:16 (sr.UGT_g252778)

MATNDDDRKQLHVAMFPWLAFGHILPFLELSKLIAQNGHKVSFLSTTRNIQRLPSHLTPLINLVKLTLPRVQELPEDAEATTDIKHDDQDHLLNASDGLQPEVTRFLEEESPDWIIFDYSYYWLPPVAAELGISRAFFMTFPTWTMALTRLPSDQLTAEDLMTLSKISFKKHEIVNLMYGTSTQGDLYRLTMACNGSDCILIRCCYEFEPQWLTLLEKLLPVPVVPVGLLPPEIHGDEKDDDTWVSVKEWLDGQHKGHVVYVALGSEAMVSKDELGELALGLELSGLPFFWALRKPPGSTESDSVELPDGFMERTRNRGVVWTSWAPQLRILSHESVCGFLTHCGVSSIVEGLMFGHPLIMLPIFGDQIMNAQVLADKQVGIEIPRNEEDGWFTKESVAKSLRSVVVDDEGEIYKANARELSKIFSDTDLGKKYISHFIDFLMMEIVKT*

SEQ ID NO:17 (UGT40087 version 1)

MDASDSSPLHIVIFPWLAFGHMLASLELAERLAARGHRVSFVSTPRNISRLRPVPPALAPLIDFVALPLP

RVDGLPDGAEATSDIPPGKTELHLKALDGLAAPFAAFLDAACADGSTNKVDWLFLDNFQYWAAAAAADHK

IPCALNLTFAASTSAEYGVPRVEPPVDGSTASILQRFVLTLEKCQFVIQRACFELEPEPLPLLSDIFGKP

VIPYGLVPPCPPAEGHKREHGNAALSWLDKQQPESVLFIALGSEPPVTVEQLHEIALGLELAGTTFLWAL

KKPNGLLLEADGDILPPGFEERTRDRGLVAMGWVPQPIILAHSSVGAFLTHGGWASTIEGVMSGHPMLFL

TFLDEQRINAQLIERKKAGLRVPRREKDGSYDRQGIAGAIRAVMCEEESKSVFAANAKKMQEIVSDRNCQ

EKYIDELIQRLGSFEK

SEQ ID NO: 18 (UGT40087 version 2)

MDASSSPLHIVIFPWLAFGHMLASLELAERLAARGHRVSFVSTPRNISRLRPVPPALAPLIDFVALPLP

RVDGLPDGAEATSDIPPGKTELHLKALDGLAAPFAAFLDAACADGSTNKVDWLFLDNFQYWAAAAAADHK

IPCALNLTFAASTSAEYGVPRVEPPVDGSTASILQRFVLTLEKCQFVIQRACFELEPEPLPLLSDIFGKP

VIPYGLVPPCPPAEGHKREHGNAALSWLDKQQPESVLFIALGSEPPVTVEQLHEIALGLELAGTTFLWAL

KKPNGLLLEADGDILPPGFEERTRDRGLVAMGWVPQPIILAHSSVGAFLTHGGWASTIEGVMSGHPMLFL

TFLDEQRINAQLIERKKAGLRVPRREKDGSYDRQGIAGAIRAVMCEEESKSVFAANAKKMQEIVSDRNCQ

EKYIDELIQRLGSFEK

SEQ ID NO: 19 (loop2 from Os_UGT_91C1)

EGLPDGAESTNDVPHDRPDMV

SEQ ID NO: 20 (loop3_1 from Os_UGT_91C1)

SEFLGTACAD

SEQ ID NO: 21 (loop3_2 from Os_UGT_91C1)

SEFLGTACADWVIVDVFHH

SEQ ID NO: 22 (loop4_1 from Os_UGT_91C1)

ADRRLERAETESPAAAGQGRPAAAPTFEVARMKLIRTKGSSGM

SEQ ID NO: 23 (loop4_2 from Os_UGT_91C1)

MMLLGSAHMIASIADRRLERAETESPAAAGQGRPAAAPTFEVARMKLIRTKGSSGM

SEQ ID NO: 24 (loop2 from UGT40087)

DGLPDGAEATSDIPPGKT

SEQ ID NO: 25 (loop3_1 from UGT40087)

AAFLDAACADGSTNKVD

SEQ ID NO: 26 (loop3_2 from UGT40087)

AAFLDAACADGSTNKVDWLFLDNFQY

SEQ ID NO: 27 (loop4_1 from UGT40087)

GVPRVEPPVDGSTA

SEQ ID NO: 28 (loop4_2 from UGT40087)

LNLTFAASTSAEYGVPRVEPPVDGSTA

SEQ ID NO: 29 (modified loop1 from Os_UGT_91C1 present in UGT40087_loop1)

TPRNISRLPPVPPALAP

SEQ ID NO: 30 (modified loop1 from UGT40087 present in Os_UGT_91C1_loop1)

TPRNISRLRPVRPALAP

SEQ ID NO: 31 (loop1 from Os_UGT_91C1 having SEQ ID NO:8)

TPRNISRLPPVRPALAP

SEQ ID NO: 32 (loop1 from UGT40087 having SEQ ID NO:11)

TPRNISRLRPVPPALAP

SEQ ID NO: 33 (UGT40087/Si91Dlike chimera)

MDASSSPLHIVIFPWLAFGHMLASLELAERLAARGHRVSFVSTPRNISRLRPVPPALAPLIDFVALPLPRVDGLPDGAEATSDIPPGKTELHLKALDGLAAPFAAFLDAACADGSTNKVDWLFLDNFQYWAAAAAADHKIPCALNLTFAASTSAEYGVPRVEPPVDGSTASILQRFVLTLEKCQFVIQRACFELEPEPLPLLSDIFGKPVIPYGLVPPCPPAQGHIEHDNAALSWLDKQQPESVLFIALGSEPPVTVEQLHEIALGLELAGTTFLWALKKPNGLLLEADGDILPPGFEERTRDRGLVAMGWVPQLSILAHSSVGAFLTHGGWSSTIEGAMSGHPMVFLTFLDEQRINAQLIERKKAGLRVPRCEKDGSYDRQGIAGAIRAVMCEEESKSVFAANAKKMQEIINDRKCQERYIDELIQRLRSFEK

SEQ ID NO: 34 (Os_UGT_91C1_loop4_1)

MDSGYSSSYAAAAGMHVVICPWLAFGHLLPCLDLAQRLASRGHRVSFVSTPRNISRLPPVRPALAPLVAFVALPLPRVEGLPDGAESTNDVPHDRPDMVELHRRAFDGLAAPFSEFLGTACADWVIVDVFHHWAAAAALEHKVPCAMMLLGSAHMIASIGVPRVEPPVDGSTASLAERFSLTLSRSSLVVGRSCVEFEPETVPLLSTLRGKPITFLGLMPPLHEGRREDGEDATVRWLDAQPAKSVVYVALGSEVPLGVEKVHELALGLELAGTRFLWALRKPTGVSDADLLPAGFEERTRGRGVVATRWVPQMSILAHAAVGAFLTHCGWNSTIEGLMFGHPLIMLPIFGDQGPNARLIEAKNAGLQVARNDGDGSFDREGVAAAIRAVAVEEESSKVFQAKAKKLQEIVADMACHERYIDGFIQQLRSYKD

SEQ ID NO:35 (unoptimized nucleic acid sequence of UGT40087 having SEQ ID NO:17)

tcgtgacgca acagagcaac tctcgccggc accggtcgcc ccttccgcag gcaggcagca

ggctcgcgcg catggacgcc tccgactcct ccccgctgca catcgtcatc ttcccgtggc

tcgcgttcgg ccacatgctc gccagcctgg agctcgccga gcgcctggcc gcgcgaggcc

accgcgtgtc cttcgtctcc accccgcgca acatcagccg cctccgcccg gtcccgcccg

cgctggcgcc gctcatcgac ttcgtggcgc tgccgctgcc gcgcgtcgac ggcctccccg

acggcgcgga ggccaccagc gacatcccgc ccggcaagac cgagctccac ctcaaggccc

tagacggcct cgccgcgccc ttcgcagctt tcctcgacgc cgcctgcgcc gacgggagca

ccaacaaggt ggactggctc ttcctcgaca acttccaata ctgggccgcc gccgccgctg

ccgaccataa gataccctgc gcgctgaacc tgacattcgc agcgtcgacg tcagcggagt

acggtgtgcc acgcgttgag ccgccggtgg atggctcaac agcctcaata ctccagcgat

ttgtgctaac cttggagaaa tgccagtttg tcatccaacg cgcctgcttc gagctggagc

cggagcccct gcctctcctg tcagacatct tcggcaagcc ggtgatcccg tacggcctag

tcccgccgtg tccccccgca gaaggtcaca aaagagagca cggcaacgca gctctgtcat

ggctcgacaa gcagcagccc gagtctgtcc tgttcattgc tctgggaagc gagcctccgg

tgaccgtcga acagctgcac gagatcgcgc ttgggctgga gctcgccggg acgacattcc

tctgggctct gaagaagcct aacggcctcc tcctcgaggc ggacggcgac atcctgcccc

caggtttcga ggagcggacg cgtgaccgtg ggctcgtggc catgggctgg gttcctcagc

ccatcatact ggctcacagc tccgtgggcg cgttcctgac gcacggcgga tgggcctcca

ccattgaagg ggttatgtcc gggcatccca tgctcttcct gacgttctta gatgaacaga

ggataaacgc gcaactgatc gagaggaaga aggccgggtt gcgagtgcca aggcgtgaga

aggacggctc gtacgatcgc caaggcatcg ccggagcgat ccgggctgtc atgtgcgagg

aagaaagtaa gagcgtcttc gcggctaatg ccaagaagat gcaggagatt gtgagcgaca

ggaattgcca ggagaagtac atcgacgagc ttatccagcg tctgggatcc ttcgagaagt

gaaataaggt gaaatatcct acaataaccg cctgttgatg gcttgatgca acgatgtagg

tggccattcg cgcctctgat ctccatgttc cggcaataaa tccaccatat gttatggctc

tgacttactg aatttcctaa tatgtatgcc caaacacatg cataggttgc tagttgcccc

tcgcgccggc attagcgata atgtcaccgc agtcgccagc acaggtgtag caatttgaca

t

SEQ ID NO: 36 (UGT40087-1 codon optimized nucleic acid sequence)

ATGGATGCTTCCAGTAGTCCTTTACACATCGTTATCTTTCCATGGTTAGCTTTCGGTCATATGTTGGCTTCCTTGGAATTGGCTGAGAGATTGGCTGCTCGTGGTCACAGAGTCTCCTTCGTTTCCACCCCTAGAAACATCTCTAGATTACGTCCAGTTCCACCAGCTTTAGCTCCATTGATTGATTTTGTCGCTTTGCCATTGCCTAGAGTCGATGGTTTACCAGATGGTGCCGAAGCTACCTCTGACATTCCACCAGGTAAGACCGAATTACACTTGAAGGCTTTGGACGGTTTGGCTGCTCCATTCGCCGCTTTTTTGGACGCTGCCTGTGCTGATGGTTCCACCAACAAGGTTGATTGGTTGTTTTTGGACAACTTCCAATACTGGGCTGCCGCTGCCGCTGCTGATCACAAAATTCCTTGCGCCTTAAACTTGACTTTTGCCGCTTCCACCTCCGCTGAATACGGTGTTCCACGTGTTGAACCACCAGTTGACGGTTCCACTGCCTCCATCTTACAAAGATTTGTCTTAACCTTAGAAAAATGTCAATTCGTTATCCAAAGAGCTTGTTTCGAATTGGAACCTGAACCATTGCCATTGTTGTCCGACATTTTCGGTAAGCCAGTCATCCCATACGGTTTAGTTCCTCCATGTCCACCAGCTGAAGGTCACAAAAGAGAACACGGTAACGCTGCTTTGTCCTGGTTGGATAAGCAACAACCAGAATCTGTTTTGTTCATCGCTTTGGGTTCTGAACCACCTGTTACCGTCGAACAATTGCACGAAATCGCTTTGGGTTTAGAATTGGCCGGTACCACCTTCTTGTGGGCCTTGAAAAAGCCAAACGGTTTGTTGTTAGAAGCCGATGGTGATATTTTGCCACCAGGTTTCGAAGAAAGAACTAGAGATAGAGGTTTAGTCGCTATGGGTTGGGTTCCACAACCAATTATCTTGGCCCATTCCTCTGTTGGTGCCTTTTTGACTCACGGTGGTTGGGCCTCCACTATTGAAGGTGTCATGTCCGGTCACCCTATGTTGTTCTTAACCTTCTTGGACGAACAACGTATCAACGCCCAATTGATCGAAAGAAAAAAGGCTGGTTTAAGAGTCCCAAGAAGAGAAAAGGATGGTTCCTACGACAGACAAGGTATTGCTGGTGCTATTAGAGCCGTCATGTGTGAAGAAGAATCTAAGTCTGTCTTCGCTGCTAACGCTAAGAAAATGCAAGAGATCGTTTCTGACAGAAACTGTCAAGAAAAGTACATCGACGAATTGATTCAAAGATTGGGTTCTTTCGAAAAGTAA

SEQUENCE LISTING <110> AMYRIS, INC. <120> PISUM SATIVUM KAURENE OXIDASE FOR HIGH EFFICIENCY PRODUCTION OF REBAUDIOSIDES <130> 107345.00694 <140> PCT/US2018/046359 <141> 2018-08-10 <150> US 62/544,718 <151> 2017-08-11 <150> PCT/US2017/046637 <151> 2017-08-11 <160> 36 <170> PatentIn version 3.5 <210> 1 <211> 499 <212> PRT <213> Pisum Sativum <220> <221> misc_feature <222> (1)..(499) <223> Kaurene oxidase enzyme <400> 1 Met Asp Thr Leu Thr Leu Ser Leu Gly Phe Leu Ser Leu Phe Leu Phe 1 5 10 15 Leu Phe Leu Leu Lys Arg Ser Thr His Lys His Ser Lys Leu Ser His 20 25 30 Val Pro Val Val Pro Gly Leu Pro Val Ile Gly Asn Leu Leu Gln Leu 35 40 45 Lys Glu Lys Lys Pro His Lys Thr Phe Thr Lys Met Ala Gln Lys Tyr 50 55 60 Gly Pro Ile Phe Ser Ile Lys Ala Gly Ser Ser Lys Ile Ile Val Leu 65 70 75 80 Asn Thr Ala His Leu Ala Lys Glu Ala Met Val Thr Arg Tyr Ser Ser 85 90 95 Ile Ser Lys Arg Lys Leu Ser Thr Ala Leu Thr Ile Leu Thr Ser Asp 100 105 110 Lys Cys Met Val Ala Met Ser Asp Tyr Asn Asp Phe His Lys Met Val 115 120 125 Lys Lys His Ile Leu Ala Ser Val Leu Gly Ala Asn Ala Gln Lys Arg 130 135 140 Leu Arg Phe His Arg Glu Val Met Met Glu Asn Met Ser Ser Lys Phe 145 150 155 160 Asn Glu His Val Lys Thr Leu Ser Asp Ser Ala Val Asp Phe Arg Lys 165 170 175 Ile Phe Val Ser Glu Leu Phe Gly Leu Ala Leu Lys Gln Ala Leu Gly 180 185 190 Ser Asp Ile Glu Ser Ile Tyr Val Glu Gly Leu Thr Ala Thr Leu Ser 195 200 205 Arg Glu Asp Leu Tyr Asn Thr Leu Val Val Asp Phe Met Glu Gly Ala 210 215 220 Ile Glu Val Asp Trp Arg Asp Phe Phe Pro Tyr Leu Lys Trp Ile Pro 225 230 235 240 Asn Lys Ser Phe Glu Lys Lys Ile Arg Arg Val Asp Arg Gln Arg Lys 245 250 255 Ile Ile Met Lys Ala Leu Ile Asn Glu Gln Lys Lys Arg Leu Thr Ser 260 265 270 Gly Lys Glu Leu Asp Cys Tyr Tyr Asp Tyr Leu Val Ser Glu Ala Lys 275 280 285 Glu Val Thr Glu Glu Gln Met Ile Met Leu Leu Trp Glu Pro Ile Ile 290 295 300 Glu Thr Ser Asp Thr Thr Leu Val Thr Thr Glu Trp Ala Met Tyr Glu 305 310 315 320 Leu Ala Lys Asp Lys Asn Arg Gln Asp Arg Leu Tyr Glu Glu Leu Leu 325 330 335 Asn Val Cys Gly His Glu Lys Val Thr Asp Glu Glu Leu Ser Lys Leu 340 345 350 Pro Tyr Leu Gly Ala Val Phe His Glu Thr Leu Arg Lys His Ser Pro 355 360 365 Val Pro Ile Val Pro Leu Arg Tyr Val Asp Glu Asp Thr Glu Leu Gly 370 375 380 Gly Tyr His Ile Pro Ala Gly Ser Glu Ile Ala Ile Asn Ile Tyr Gly 385 390 395 400 Cys Asn Met Asp Ser Asn Leu Trp Glu Asn Pro Asp Gln Trp Ile Pro 405 410 415 Glu Arg Phe Leu Asp Glu Lys Tyr Ala Gln Ala Asp Leu Tyr Lys Thr 420 425 430 Met Ala Phe Gly Gly Gly Lys Arg Val Cys Ala Gly Ser Leu Gln Ala 435 440 445 Met Leu Ile Ala Cys Thr Ala Ile Gly Arg Leu Val Gln Glu Phe Glu 450 455 460 Trp Glu Leu Gly His Gly Glu Glu Glu Asn Val Asp Thr Met Gly Leu 465 470 475 480 Thr Thr His Arg Leu His Pro Leu Gln Val Lys Leu Lys Pro Arg Asn 485 490 495 Arg Ile Tyr <210> 2 <211> 513 <212> PRT <213> Stevia rebaudiana <220> <221> misc_feature <222> (1)..(513) <223> Kaurene oxidase enzyme <400> 2 Met Asp Ala Val Thr Gly Leu Leu Thr Val Pro Ala Thr Ala Ile Thr 1 5 10 15 Ile Gly Gly Thr Ala Val Ala Leu Ala Val Ala Leu Ile Phe Trp Tyr 20 25 30 Leu Lys Ser Tyr Thr Ser Ala Arg Arg Ser Gln Ser Asn His Leu Pro 35 40 45 Arg Val Pro Glu Val Pro Gly Val Pro Leu Leu Gly Asn Leu Leu Gln 50 55 60 Leu Lys Glu Lys Lys Pro Tyr Met Thr Phe Thr Arg Trp Ala Ala Thr 65 70 75 80 Tyr Gly Pro Ile Tyr Ser Ile Lys Thr Gly Ala Thr Ser Met Val Val 85 90 95 Val Ser Ser Asn Glu Ile Ala Lys Glu Ala Leu Val Thr Arg Phe Gln 100 105 110 Ser Ile Ser Thr Arg Asn Leu Ser Lys Ala Leu Lys Val Leu Thr Ala 115 120 125 Asp Lys Thr Met Val Ala Met Ser Asp Tyr Asp Asp Tyr His Lys Thr 130 135 140 Val Lys Arg His Ile Leu Thr Ala Val Leu Gly Pro Asn Ala Gln Lys 145 150 155 160 Lys His Arg Ile His Arg Asp Ile Met Met Asp Asn Ile Ser Thr Gln 165 170 175 Leu His Glu Phe Val Lys Asn Asn Pro Glu Gln Glu Glu Val Asp Leu 180 185 190 Arg Lys Ile Phe Gln Ser Glu Leu Phe Gly Leu Ala Met Arg Gln Ala 195 200 205 Leu Gly Lys Asp Val Glu Ser Leu Tyr Val Glu Asp Leu Lys Ile Thr 210 215 220 Met Asn Arg Asp Glu Ile Phe Gln Val Leu Val Val Asp Pro Met Met 225 230 235 240 Gly Ala Ile Asp Val Asp Trp Arg Asp Phe Phe Pro Tyr Leu Lys Trp 245 250 255 Val Pro Asn Lys Lys Phe Glu Asn Thr Ile Gln Gln Met Tyr Ile Arg 260 265 270 Arg Glu Ala Val Met Lys Ser Leu Ile Lys Glu Asn Lys Lys Arg Ile 275 280 285 Ala Ser Gly Glu Lys Leu Asn Ser Tyr Ile Asp Tyr Leu Leu Ser Glu 290 295 300 Ala Gln Thr Leu Thr Asp Gln Gln Leu Leu Met Ser Leu Trp Glu Pro 305 310 315 320 Ile Ile Glu Ser Ser Asp Thr Thr Met Val Thr Thr Glu Trp Ala Met 325 330 335 Tyr Glu Leu Ala Lys Asn Pro Lys Leu Gln Asp Arg Leu Tyr Arg Asp 340 345 350 Ile Lys Ser Val Cys Gly Ser Glu Lys Ile Thr Glu Glu His Leu Ser 355 360 365 Gln Leu Pro Tyr Ile Thr Ala Ile Phe His Glu Thr Leu Arg Arg His 370 375 380 Ser Pro Val Pro Ile Ile Pro Leu Arg His Val His Glu Asp Thr Val 385 390 395 400 Leu Gly Gly Tyr His Val Pro Ala Gly Thr Glu Leu Ala Val Asn Ile 405 410 415 Tyr Gly Cys Asn Met Asp Lys Asn Val Trp Glu Asn Pro Glu Glu Trp 420 425 430 Asn Pro Glu Arg Phe Met Lys Glu Asn Glu Thr Ile Asp Phe Gln Lys 435 440 445 Thr Met Ala Phe Gly Gly Gly Lys Arg Val Cys Ala Gly Ser Leu Gln 450 455 460 Ala Leu Leu Thr Ala Ser Ile Gly Ile Gly Arg Met Val Gln Glu Phe 465 470 475 480 Glu Trp Lys Leu Lys Asp Met Thr Gln Glu Glu Val Asn Thr Ile Gly 485 490 495 Leu Thr Thr Gln Met Leu Arg Pro Leu Arg Ala Ile Ile Lys Pro Arg 500 505 510 Ile <210> 3 <211> 509 <212> PRT <213> Arabidopsis thaliana <220> <221> misc_feature <222> (1)..(509) <223> Kaurene oxidase enzyme <400> 3 Met Ala Phe Phe Ser Met Ile Ser Ile Leu Leu Gly Phe Val Ile Ser 1 5 10 15 Ser Phe Ile Phe Ile Phe Phe Phe Lys Lys Leu Leu Ser Phe Ser Arg 20 25 30 Lys Asn Met Ser Glu Val Ser Thr Leu Pro Ser Val Pro Val Val Pro 35 40 45 Gly Phe Pro Val Ile Gly Asn Leu Leu Gln Leu Lys Glu Lys Lys Pro 50 55 60 His Lys Thr Phe Thr Arg Trp Ser Glu Ile Tyr Gly Pro Ile Tyr Ser 65 70 75 80 Ile Lys Met Gly Ser Ser Ser Leu Ile Val Leu Asn Ser Thr Glu Thr 85 90 95 Ala Lys Glu Ala Met Val Thr Arg Phe Ser Ser Ile Ser Thr Arg Lys 100 105 110 Leu Ser Asn Ala Leu Thr Val Leu Thr Cys Asp Lys Ser Met Val Ala 115 120 125 Thr Ser Asp Tyr Asp Asp Phe His Lys Leu Val Lys Arg Cys Leu Leu 130 135 140 Asn Gly Leu Leu Gly Ala Asn Ala Gln Lys Arg Lys Arg His Tyr Arg 145 150 155 160 Asp Ala Leu Ile Glu Asn Val Ser Ser Lys Leu His Ala His Ala Arg 165 170 175 Asp His Pro Gln Glu Pro Val Asn Phe Arg Ala Ile Phe Glu His Glu 180 185 190 Leu Phe Gly Val Ala Leu Lys Gln Ala Phe Gly Lys Asp Val Glu Ser 195 200 205 Ile Tyr Val Lys Glu Leu Gly Val Thr Leu Ser Lys Asp Glu Ile Phe 210 215 220 Lys Val Leu Val His Asp Met Met Glu Gly Ala Ile Asp Val Asp Trp 225 230 235 240 Arg Asp Phe Phe Pro Tyr Leu Lys Trp Ile Pro Asn Lys Ser Phe Glu 245 250 255 Ala Arg Ile Gln Gln Lys His Lys Arg Arg Leu Ala Val Met Asn Ala 260 265 270 Leu Ile Gln Asp Arg Leu Lys Gln Asn Gly Ser Glu Ser Asp Asp Asp 275 280 285 Cys Tyr Leu Asn Phe Leu Met Ser Glu Ala Lys Thr Leu Thr Lys Glu 290 295 300 Gln Ile Ala Ile Leu Val Trp Glu Thr Ile Ile Glu Thr Ala Asp Thr 305 310 315 320 Thr Leu Val Thr Thr Glu Trp Ala Ile Tyr Glu Leu Ala Lys His Pro 325 330 335 Ser Val Gln Asp Arg Leu Cys Lys Glu Ile Gln Asn Val Cys Gly Gly 340 345 350 Glu Lys Phe Lys Glu Glu Gln Leu Ser Gln Val Pro Tyr Leu Asn Gly 355 360 365 Val Phe His Glu Thr Leu Arg Lys Tyr Ser Pro Ala Pro Leu Val Pro 370 375 380 Ile Arg Tyr Ala His Glu Asp Thr Gln Ile Gly Gly Tyr His Val Pro 385 390 395 400 Ala Gly Ser Glu Ile Ala Ile Asn Ile Tyr Gly Cys Asn Met Asp Lys 405 410 415 Lys Arg Trp Glu Arg Pro Glu Asp Trp Trp Pro Glu Arg Phe Leu Asp 420 425 430 Asp Gly Lys Tyr Glu Thr Ser Asp Leu His Lys Thr Met Ala Phe Gly 435 440 445 Ala Gly Lys Arg Val Cys Ala Gly Ala Leu Gln Ala Ser Leu Met Ala 450 455 460 Gly Ile Ala Ile Gly Arg Leu Val Gln Glu Phe Glu Trp Lys Leu Arg 465 470 475 480 Asp Gly Glu Glu Glu Asn Val Asp Thr Tyr Gly Leu Thr Ser Gln Lys 485 490 495 Leu Tyr Pro Leu Met Ala Ile Ile Asn Pro Arg Arg Ser 500 505 <210> 4 <211> 517 <212> PRT <213> Cucurbita maxima <220> <221> misc_feature <222> (1)..(517) <223> Kaurene oxidase enzyme <400> 4 Met Ala Val Ala Thr Asp Pro Leu Gly Cys Met Gln Lys Leu Val Gln 1 5 10 15 Met Leu Gln Ala Pro Pro Tyr Val Ala Ala Ala Val Gln Ser Ser Ala 20 25 30 Leu Leu Leu Thr Phe Phe Ile Gly Asp Trp Arg Lys Arg Arg Arg Ser 35 40 45 Pro Leu Pro Leu Leu Pro Ala Ile Pro Gly Ile Pro Val Leu Gly Asn 50 55 60 Leu Leu Gln Leu Lys Glu Lys Lys Pro His Lys Thr Phe Ala Gln Trp 65 70 75 80 Ser Glu Thr Tyr Gly Pro Ile Tyr Ser Ile Lys Ala Gly Ala Ser Thr 85 90 95 Val Ile Val Leu Asn Ser Ser Asp Leu Ala Lys Glu Ala Met Val Thr 100 105 110 Arg Tyr Ser Ser Ile Ser Ser Arg Lys Leu Ser Lys Ala Leu Thr Ile 115 120 125 Leu Thr Ala Asp Lys Cys Met Val Ala Met Ser Asp Tyr Asn Asp Phe 130 135 140 His Lys Leu Val Lys Arg Tyr Ile Leu Ala Asn Val Leu Gly Ala Asn 145 150 155 160 Ala Gln Lys Arg Leu Arg Gln Arg Arg Asp Thr Met Ile Asp Asn Ile 165 170 175 Ser Arg Glu Leu Phe Ala Cys Val Lys Asp Ser Ser Ser Glu Ser Val 180 185 190 Asn Phe Arg Lys Ile Phe Glu Ser Glu Leu Phe Gly Leu Ala Leu Lys 195 200 205 Glu Thr Phe Gly Arg Asp Met Glu Ser Leu Tyr Val Asp Gly Leu Gly 210 215 220 Thr Thr Leu Leu Arg Glu Asp Leu Phe Arg Thr Leu Val Ile Asp Pro 225 230 235 240 Met Glu Gly Ala Ile Glu Val Asp Trp Arg Asp Phe Phe Pro Tyr Leu 245 250 255 Arg Trp Ile Pro Asn Lys Gly Val Glu Asp Arg Ile Arg Lys Met Asp 260 265 270 Phe Arg Arg Arg Val Thr Met Lys Ser Leu Met Glu Glu Lys Lys Lys 275 280 285 Gln Ile Ala Ala Gly Glu Asp Leu Asn Cys Tyr Ser Glu Phe Leu Leu 290 295 300 Ser Glu Ala Lys Ser Leu Thr Glu Glu Gln Ile Ser Met Leu Leu Trp 305 310 315 320 Glu Ile Ile Ile Glu Thr Ser Asp Thr Thr Leu Val Val Thr Glu Trp 325 330 335 Ala Met Tyr Glu Leu Ala Gln Asn Pro Lys Arg Gln Glu Arg Leu Tyr 340 345 350 Gln His Ile Gln Ser Val Cys Gly Ser Ala Lys Ile Thr Glu Glu Asn 355 360 365 Leu Ser Gln Leu Pro Tyr Leu Thr Ala Val Phe His Glu Thr Leu Arg 370 375 380 Lys Tyr Ser Pro Val Ser Ile Val Pro Leu Arg Tyr Ala His Glu Asp 385 390 395 400 Thr Gln Leu Gly Gly Tyr Phe Ile Pro Ala Gly Ser Glu Val Ala Val 405 410 415 Asn Ile Tyr Ala Cys Asn Met Asp Lys Lys Gln Trp Glu Ser Pro Glu 420 425 430 Glu Trp Lys Pro Glu Arg Phe Leu Asp Glu Ser Tyr Asp Pro Met Asp 435 440 445 Leu Tyr Lys Thr Met Ala Phe Gly Gly Gly Lys Arg Val Cys Ala Gly 450 455 460 Ala Pro Lys Ala Met Leu Ile Ala Cys Thr Thr Leu Gly Arg Leu Val 465 470 475 480 Gln Gly Phe Thr Trp Lys Leu Arg Glu Gly Glu Glu Asp Lys Val Asp 485 490 495 Thr Leu Gly Leu Thr Ala Arg Lys Leu Gln Pro Leu His Ile Val Ala 500 505 510 Lys Pro Arg Ile Asn 515 <210> 5 <211> 519 <212> PRT <213> Cucumis sativus <220> <221> misc_feature <222> (1)..(519) <223> Kaurene oxidase enzyme <400> 5 Met Ala Val Val Thr Asp Pro Leu Ala Ser Met Gln Leu Leu Ala Asn 1 5 10 15 Thr Ile Pro Ala Pro Pro Tyr Ala Ala Ala Ala Val Leu Gly Gly Val 20 25 30 Ser Leu Val Leu Ser Val Phe Phe Val Ala Asp Cys Arg Lys Lys Arg 35 40 45 Arg Asn Phe Leu Pro Pro Val Pro Ala Val Pro Gly Val Pro Val Leu 50 55 60 Gly Asn Leu Leu Gln Leu Lys Glu Lys Lys Pro His Lys Thr Phe Ala 65 70 75 80 Arg Trp Ala Glu Thr Tyr Gly Ala Val Tyr Ser Ile Arg Thr Gly Ala 85 90 95 Ser Thr Val Ile Val Leu Asn Thr Thr Glu Val Ala Lys Glu Ala Met 100 105 110 Val Thr Arg Tyr Gly Ser Ile Ser Ser Arg Lys Leu Ser Lys Ala Leu 115 120 125 Thr Ile Leu Thr Ala Asp Lys Cys Met Val Ala Met Ser Asp Tyr Asn 130 135 140 Glu Phe His Lys Met Val Lys Arg Tyr Ile Leu Ala Asn Val Leu Gly 145 150 155 160 Ala Asn Ala Gln Lys Lys His Arg Gln Arg Arg Asp Ala Met Ile Glu 165 170 175 Asn Ile Ser Arg Glu Leu Phe Ala His Val Lys Glu Phe Pro Leu Asp 180 185 190 Thr Val Asn Phe Arg Lys Ile Phe Glu Ala Glu Leu Phe Arg Leu Ala 195 200 205 Leu Lys Glu Thr Leu Gly Lys Asp Ile Glu Ser Ile Tyr Val Asp Gly 210 215 220 Leu Gly Thr Thr Leu Pro Arg Glu Asp Leu Phe Arg Ile Leu Val Ile 225 230 235 240 Asp Pro Met Glu Gly Ala Ile Glu Val Asp Trp Arg Asp Phe Phe Pro 245 250 255 Tyr Leu Arg Trp Ile Pro Asn Lys Arg Val Glu Asn Lys Ile Arg Asn 260 265 270 Met Asp Phe Arg Arg Arg Met Thr Met Lys Lys Leu Met Glu Glu Pro 275 280 285 Lys Lys Arg Ile Ala Ala Gly Glu Glu Thr Tyr Cys Tyr Ala Asp Phe 290 295 300 Leu Leu Ser Glu Ala Lys Thr Leu Thr Glu Asp Gln Ile Ser Met Leu 305 310 315 320 Leu Trp Glu Thr Ile Ile Glu Thr Ser Asp Thr Thr Leu Val Val Thr 325 330 335 Glu Trp Ala Met Tyr Glu Leu Ser Lys Asp Pro Arg Arg Gln Asp Tyr 340 345 350 Leu Tyr Gln Gln Ile Gln Ser Val Cys Gly Ser Ala Thr Leu Thr Glu 355 360 365 Glu Asn Leu Ser Gln Leu Pro Tyr Leu Thr Ala Ile Phe His Glu Thr 370 375 380 Leu Arg Lys His Ser Pro Val Pro Val Val Pro Leu Arg Tyr Ala His 385 390 395 400 Glu Asp Thr Gln Leu Gly Gly Tyr Phe Val Pro Ala Gly Ser Glu Ile 405 410 415 Ala Val Asn Ile Tyr Ala Cys Asn Met Asp Lys Asp His Trp Glu Ser 420 425 430 Pro Glu Glu Trp Lys Pro Glu Arg Phe Leu Asp Asp Lys Tyr Asp Pro 435 440 445 Met Asp Leu His Lys Thr Met Ala Phe Gly Gly Gly Lys Arg Val Cys 450 455 460 Ala Gly Ala Leu Lys Ala Met Leu Ile Ala Cys Thr Thr Ile Gly Arg 465 470 475 480 Met Val Gln Glu Phe Glu Trp Lys Leu Arg Glu Gly Glu Glu Glu Lys 485 490 495 Val Asp Thr Leu Gly Leu Thr Ala Arg Lys Leu Gln Pro Leu His Val 500 505 510 Val Ile Lys Pro Arg Asn Asn 515 <210> 6 <211> 525 <212> PRT <213> Gibberella fujikuroi <220> <221> misc_feature <222> (1)..(525) <223> Kaurene oxidase enzyme <400> 6 Met Ser Lys Ser Asn Ser Met Asn Ser Thr Ser His Glu Thr Leu Phe 1 5 10 15 Gln Gln Leu Val Leu Gly Leu Asp Arg Met Pro Leu Met Asp Val His 20 25 30 Trp Leu Ile Tyr Val Ala Phe Gly Ala Trp Leu Cys Ser Tyr Val Ile 35 40 45 His Val Leu Ser Ser Ser Ser Thr Val Lys Val Pro Val Val Gly Tyr 50 55 60 Arg Ser Val Phe Glu Pro Thr Trp Leu Leu Arg Leu Arg Phe Val Trp 65 70 75 80 Glu Gly Gly Ser Ile Ile Gly Gln Gly Tyr Asn Lys Phe Lys Asp Ser 85 90 95 Ile Phe Gln Val Arg Lys Leu Gly Thr Asp Ile Val Ile Ile Pro Pro 100 105 110 Asn Tyr Ile Asp Glu Val Arg Lys Leu Ser Gln Asp Lys Thr Arg Ser 115 120 125 Val Glu Pro Phe Ile Asn Asp Phe Ala Gly Gln Tyr Thr Arg Gly Met 130 135 140 Val Phe Leu Gln Ser Asp Leu Gln Asn Arg Val Ile Gln Gln Arg Leu 145 150 155 160 Thr Pro Lys Leu Val Ser Leu Thr Lys Val Met Lys Glu Glu Leu Asp 165 170 175 Tyr Ala Leu Thr Lys Glu Met Pro Asp Met Lys Asn Asp Glu Trp Val 180 185 190 Glu Val Asp Ile Ser Ser Ile Met Val Arg Leu Ile Ser Arg Ile Ser 195 200 205 Ala Arg Val Phe Leu Gly Pro Glu His Cys Arg Asn Gln Glu Trp Leu 210 215 220 Thr Thr Thr Ala Glu Tyr Ser Glu Ser Leu Phe Ile Thr Gly Phe Ile 225 230 235 240 Leu Arg Val Val Pro His Ile Leu Arg Pro Phe Ile Ala Pro Leu Leu 245 250 255 Pro Ser Tyr Arg Thr Leu Leu Arg Asn Val Ser Ser Gly Arg Arg Val 260 265 270 Ile Gly Asp Ile Ile Arg Ser Gln Gln Gly Asp Gly Asn Glu Asp Ile 275 280 285 Leu Ser Trp Met Arg Asp Ala Ala Thr Gly Glu Glu Lys Gln Ile Asp 290 295 300 Asn Ile Ala Gln Arg Met Leu Ile Leu Ser Leu Ala Ser Ile His Thr 305 310 315 320 Thr Ala Met Thr Met Thr His Ala Met Tyr Asp Leu Cys Ala Cys Pro 325 330 335 Glu Tyr Ile Glu Pro Leu Arg Asp Glu Val Lys Ser Val Val Gly Ala 340 345 350 Ser Gly Trp Asp Lys Thr Ala Leu Asn Arg Phe His Lys Leu Asp Ser 355 360 365 Phe Leu Lys Glu Ser Gln Arg Phe Asn Pro Val Phe Leu Leu Thr Phe 370 375 380 Asn Arg Ile Tyr His Gln Ser Met Thr Leu Ser Asp Gly Thr Asn Ile 385 390 395 400 Pro Ser Gly Thr Arg Ile Ala Val Pro Ser His Ala Met Leu Gln Asp 405 410 415 Ser Ala His Val Pro Gly Pro Thr Pro Pro Thr Glu Phe Asp Gly Phe 420 425 430 Arg Tyr Ser Lys Ile Arg Ser Asp Ser Asn Tyr Ala Gln Lys Tyr Leu 435 440 445 Phe Ser Met Thr Asp Ser Ser Asn Met Ala Phe Gly Tyr Gly Lys Tyr 450 455 460 Ala Cys Pro Gly Arg Phe Tyr Ala Ser Asn Glu Met Lys Leu Thr Leu 465 470 475 480 Ala Ile Leu Leu Leu Gln Phe Glu Phe Lys Leu Pro Asp Gly Lys Gly 485 490 495 Arg Pro Arg Asn Ile Thr Ile Asp Ser Asp Met Ile Pro Asp Pro Arg 500 505 510 Ala Arg Leu Cys Val Arg Lys Arg Ser Leu Arg Asp Glu 515 520 525 <210> 7 <211> 525 <212> PRT <213> Gibberella moniliformis <220> <221> misc_feature <222> (1)..(525) <223> Kaurene oxidase enzyme <400> 7 Met Asn Lys Phe Asn Ser Met Asn Asn Thr Ile Asn Glu Thr Leu Leu 1 5 10 15 Arg Gln Leu Val Ser Gly Leu Asp Glu Ile Pro Leu Met Asp Ile His 20 25 30 Trp Leu Ile Tyr Val Ala Phe Gly Ala Trp Leu Cys Ser Tyr Val Ile 35 40 45 His Leu Leu Ser Ser Pro Ser Thr Val Asn Val Pro Phe Val Gly Tyr 50 55 60 Arg Ser Val Phe Glu Pro Thr Trp Phe Leu Arg Leu Arg Phe Val Trp 65 70 75 80 Glu Gly Gly Ser Ile Ile Ser Gln Gly Tyr Ser Lys Phe Lys Asp Ser 85 90 95 Ile Phe Gln Val Arg Lys Leu Gly Thr Asp Ile Val Ile Ile Pro Pro 100 105 110 Asn Tyr Ile Asp Glu Val Arg Lys Leu Ser Gln Asp Lys Thr Arg Ser 115 120 125 Val Glu Pro Phe Ile Asn Asp Phe Ala Gly Asp Tyr Thr Arg Gly Met 130 135 140 Val Phe Leu Gln Ser Asp Leu Gln Asn Arg Val Ile Gln Gln Arg Leu 145 150 155 160 Thr Pro Lys Leu Val Ser Leu Thr Lys Val Met Lys Glu Glu Leu Asp 165 170 175 Tyr Ala Leu Thr Lys Gly Met Pro Asp Met Lys Asp Asp Glu Trp Val 180 185 190 Glu Ala Asp Ile Ala Ser Ile Met Val Arg Leu Ile Ser Arg Ile Ser 195 200 205 Ala Arg Val Phe Leu Gly Pro Glu His Cys Arg Asn Gln Glu Trp Leu 210 215 220 Thr Thr Thr Ala Glu Tyr Ser Glu Ser Leu Phe Met Thr Gly Phe Ile 225 230 235 240 Leu Arg Val Val Pro His Ile Leu Arg Pro Phe Val Ala Pro Leu Leu 245 250 255 Pro Ser Tyr Arg Thr Leu Leu Arg Ser Val Ser Ser Gly Arg Lys Val 260 265 270 Ile Gly Asp Ile Ile Arg Ser Gln Gln Gly Ser Glu Asn Glu Asp Ile 275 280 285 Leu Ser Trp Met Val Glu Ala Ala Thr Gly Glu Glu Lys Gln Val Asp 290 295 300 Asn Ile Ala Gln Arg Met Leu Ile Leu Ser Leu Ala Ser Ile His Thr 305 310 315 320 Thr Ala Met Thr Met Thr His Ala Met Tyr Asp Leu Cys Ala Arg Pro 325 330 335 Glu Tyr Thr Lys Pro Leu Arg Glu Glu Val Lys Gly Val Val Gly Ala 340 345 350 Ser Gly Trp Asp Lys Thr Ala Leu Asn Arg Leu His Lys Leu Asp Ser 355 360 365 Phe Leu Lys Glu Ser Gln Arg Phe Asn Pro Val Phe Leu Leu Thr Phe 370 375 380 Asn Arg Ile Tyr His Gln Pro Met Thr Leu Ser Asp Gly Thr Asn Leu 385 390 395 400 Pro Ser Gly Thr Arg Ile Ala Val Pro Ser His Ala Met Leu Gln Asp 405 410 415 Ser Ala His Val Pro Gly Pro Ala Pro Pro Thr Asp Phe Asp Gly Phe 420 425 430 Arg Tyr Ser Lys Ile Arg Ser Asp Ser Asn Tyr Ala Gln Lys Tyr Leu 435 440 445 Phe Ser Met Thr Asp Ser Ser Asn Met Ala Phe Gly Tyr Gly Lys Tyr 450 455 460 Ala Cys Pro Gly Arg Phe Tyr Ala Ser Asn Glu Met Lys Leu Thr Leu 465 470 475 480 Ala Ile Leu Leu Leu Gln Phe Glu Phe Lys Leu Pro Asp Gly Lys Gly 485 490 495 Arg Pro Arg Asn Ile Thr Ile Asp Ser Asp Met Val Pro Asp Pro Arg 500 505 510 Ala Arg Leu Cys Val Arg Lys Arg Ser Leu Arg Glu Glu 515 520 525 <210> 8 <211> 511 <212> PRT <213> Lactuca sativa <220> <221> misc_feature <222> (1)..(511) <223> Kaurene oxidase enzyme <400> 8 Met Asp Leu Gln Thr Met Ala Pro Met Gly Ser Ala Ala Ile Ala Ile 1 5 10 15 Gly Gly Pro Ala Val Ala Val Ala Gly Gly Ile Ser Leu Leu Phe Leu 20 25 30 Lys Ser Phe Leu Ser Gln Gln Pro Gly Asn Pro Asn His Leu Pro Ser 35 40 45 Val Pro Ala Val Pro Gly Val Pro Leu Leu Gly Asn Leu Leu Glu Leu 50 55 60 Lys Glu Lys Lys Pro Tyr Lys Thr Phe Thr Lys Trp Ala Glu Thr Tyr 65 70 75 80 Gly Pro Ile Tyr Ser Ile Lys Thr Gly Ala Thr Ser Met Val Val Val 85 90 95 Asn Ser Asn Gln Leu Ala Lys Glu Ala Met Val Thr Arg Phe Asp Ser 100 105 110 Ile Ser Thr Arg Lys Leu Ser Lys Ala Leu Gln Ile Leu Thr Ala Asp 115 120 125 Lys Thr Met Val Ala Met Ser Asp Tyr Asp Asp Tyr His Lys Thr Val 130 135 140 Lys Arg Asn Leu Leu Thr Ser Ile Leu Gly Pro Ala Ala Gln Lys Arg 145 150 155 160 His Arg Ala His Arg Asp Ala Met Gly Asp Asn Leu Ser Arg Gln Leu 165 170 175 His Ala Leu Ala Leu Asn Ser Pro Gln Glu Ala Ile Asn Phe Arg Gln 180 185 190 Ile Phe Gln Ser Glu Leu Phe Thr Leu Ala Phe Lys Gln Thr Phe Gly 195 200 205 Arg Asp Ile Glu Ser Ile Phe Val Gly Asp Leu Gly Thr Thr Met Thr 210 215 220 Arg Glu Glu Met Phe Gln Ile Leu Val Val Asp Pro Met Met Gly Ala 225 230 235 240 Ile Asp Val Asp Trp Arg Asp Phe Phe Pro Tyr Leu Lys Trp Ile Pro 245 250 255 Asn Ala Lys Leu Glu Glu Lys Ile Glu Gln Met Tyr Ile Arg Arg Lys 260 265 270 Ala Val Met Lys Ala Val Ile Gln Glu His Arg Lys Arg Ile Asp Ser 275 280 285 Gly Glu Asn Leu Asp Ser Tyr Ile Asp Phe Leu Leu Ala Glu Ala Gln 290 295 300 Pro Leu Thr Glu Lys Gln Leu Leu Met Ser Leu Trp Glu Pro Ile Ile 305 310 315 320 Glu Thr Ser Asp Thr Thr Met Val Thr Thr Glu Trp Ala Met Tyr Glu 325 330 335 Leu Ser Lys His Pro Asn Lys Gln Gln Arg Leu Tyr Asn Glu Ile Arg 340 345 350 Asn Ile Cys Gly Ser Glu Lys Ile Thr Glu Glu Lys Leu Cys Lys Met 355 360 365 Pro Tyr Leu Ser Ala Val Phe His Glu Thr Leu Arg Val His Ser Pro 370 375 380 Val Ser Ile Ile Pro Leu Arg Tyr Val His Glu Asn Thr Glu Leu Gly 385 390 395 400 Gly Tyr His Val Pro Ala Gly Thr Glu Leu Ala Val Asn Ile Tyr Gly 405 410 415 Cys Asn Met Glu Arg Glu Ile Trp Glu Asn Pro Glu Glu Trp Ser Pro 420 425 430 Glu Arg Phe Leu Ala Glu Asn Glu Pro Val Asn Leu Gln Lys Thr Met 435 440 445 Ala Phe Gly Ala Gly Lys Arg Val Cys Ala Gly Ala Met Gln Ala Met 450 455 460 Leu Leu Ala Cys Val Gly Ile Gly Arg Met Val Gln Glu Phe Glu Trp 465 470 475 480 Arg Leu Lys Asp Asp Val Glu Glu Asp Val Asn Thr Leu Gly Leu Thr 485 490 495 Thr Gln Arg Leu Asn Pro Met Leu Ala Val Ile Lys Pro Arg Asn 500 505 510 <210> 9 <211> 513 <212> PRT <213> Lactuca sativa <220> <221> misc_feature <222> (1)..(513) <223> Kaurene oxidase enzyme <400> 9 Met Asp Gly Val Ile Asp Met Gln Thr Ile Pro Leu Arg Thr Ala Ile 1 5 10 15 Ala Ile Gly Gly Thr Ala Val Ala Leu Val Val Ala Leu Tyr Phe Trp 20 25 30 Phe Leu Arg Ser Tyr Ala Ser Pro Ser His His Ser Asn His Leu Pro 35 40 45 Pro Val Pro Glu Val Pro Gly Val Pro Val Leu Gly Asn Leu Leu Gln 50 55 60 Leu Lys Glu Lys Lys Pro Tyr Met Thr Phe Thr Lys Trp Ala Glu Met 65 70 75 80 Tyr Gly Pro Ile Tyr Ser Ile Arg Thr Gly Ala Thr Ser Met Val Val 85 90 95 Val Ser Ser Asn Glu Ile Ala Lys Glu Val Val Val Thr Arg Phe Pro 100 105 110 Ser Ile Ser Thr Arg Lys Leu Ser Tyr Ala Leu Lys Val Leu Thr Glu 115 120 125 Asp Lys Ser Met Val Ala Met Ser Asp Tyr His Asp Tyr His Lys Thr 130 135 140 Val Lys Arg His Ile Leu Thr Ala Val Leu Gly Pro Asn Ala Gln Lys 145 150 155 160 Lys Phe Arg Ala His Arg Asp Thr Met Met Glu Asn Val Ser Asn Glu 165 170 175 Leu His Ala Phe Phe Glu Lys Asn Pro Asn Gln Glu Val Asn Leu Arg 180 185 190 Lys Ile Phe Gln Ser Gln Leu Phe Gly Leu Ala Met Lys Gln Ala Leu 195 200 205 Gly Lys Asp Val Glu Ser Ile Tyr Val Lys Asp Leu Glu Thr Thr Met 210 215 220 Lys Arg Glu Glu Ile Phe Glu Val Leu Val Val Asp Pro Met Met Gly 225 230 235 240 Ala Ile Glu Val Asp Trp Arg Asp Phe Phe Pro Tyr Leu Lys Trp Val 245 250 255 Pro Asn Lys Ser Phe Glu Asn Ile Ile His Arg Met Tyr Thr Arg Arg 260 265 270 Glu Ala Val Met Lys Ala Leu Ile Gln Glu His Lys Lys Arg Ile Ala 275 280 285 Ser Gly Glu Asn Leu Asn Ser Tyr Ile Asp Tyr Leu Leu Ser Glu Ala 290 295 300 Gln Thr Leu Thr Asp Lys Gln Leu Leu Met Ser Leu Trp Glu Pro Ile 305 310 315 320 Ile Glu Ser Ser Asp Thr Thr Met Val Thr Thr Glu Trp Ala Met Tyr 325 330 335 Glu Leu Ala Lys Asn Pro Asn Met Gln Asp Arg Leu Tyr Glu Glu Ile 340 345 350 Gln Ser Val Cys Gly Ser Glu Lys Ile Thr Glu Glu Asn Leu Ser Gln 355 360 365 Leu Pro Tyr Leu Tyr Ala Val Phe Gln Glu Thr Leu Arg Lys His Cys 370 375 380 Pro Val Pro Ile Met Pro Leu Arg Tyr Val His Glu Asn Thr Val Leu 385 390 395 400 Gly Gly Tyr His Val Pro Ala Gly Thr Glu Val Ala Ile Asn Ile Tyr 405 410 415 Gly Cys Asn Met Asp Lys Lys Val Trp Glu Asn Pro Glu Glu Trp Asn 420 425 430 Pro Glu Arg Phe Leu Ser Glu Lys Glu Ser Met Asp Leu Tyr Lys Thr 435 440 445 Met Ala Phe Gly Gly Gly Lys Arg Val Cys Ala Gly Ser Leu Gln Ala 450 455 460 Met Val Ile Ser Cys Ile Gly Ile Gly Arg Leu Val Gln Asp Phe Glu 465 470 475 480 Trp Lys Leu Lys Asp Asp Ala Glu Glu Asp Val Asn Thr Leu Gly Leu 485 490 495 Thr Thr Gln Lys Leu His Pro Leu Leu Ala Leu Ile Asn Pro Arg Lys 500 505 510 Ser <210> 10 <211> 505 <212> PRT <213> Oryza sativa subsp. japonica <220> <221> misc_feature <222> (1)..(505) <223> Kaurene oxidase enzyme <400> 10 Met Glu Ala Phe Val Pro Gly Gly Ala Gly Ala Ala Ala Ala Ala Val 1 5 10 15 Gly Gly Phe Val Ala Ala Ala Ala Leu Ala Glu Arg Ala Gly Val Ile 20 25 30 Ala Pro Arg Lys Arg Pro Asn Ala Pro Pro Ala Val Pro Gly Leu Pro 35 40 45 Ile Ile Gly Asn Leu His Gln Leu Lys Glu Lys Lys Pro His Gln Thr 50 55 60 Phe Ala Lys Trp Ala Glu Ile Tyr Gly Pro Ile Tyr Thr Ile Arg Thr 65 70 75 80 Gly Ala Ser Ser Val Val Val Leu Asn Ser Thr Glu Val Ala Lys Glu 85 90 95 Ala Met Val Ala Lys Phe Ser Ser Ile Ser Thr Arg Lys Leu Ser Lys 100 105 110 Ala Leu Thr Val Leu Thr Arg Asp Lys Ser Met Val Ala Thr Ser Asp 115 120 125 Tyr Cys Asp Phe His Lys Met Val Lys Arg Tyr Val Met Ser Ser Met 130 135 140 Leu Gly Thr Ser Ala Gln Lys Gln Phe Arg Asp Ile Arg Asp Met Met 145 150 155 160 Ile His Asn Met Leu Ser Thr Phe His Lys Leu Val Lys Asp Asp Pro 165 170 175 His Ala Pro Leu Ile Phe Arg Asp Val Phe Lys Asp Glu Leu Phe Arg 180 185 190 Leu Ser Met Ile Gln Ser Leu Gly Glu Asp Val Ser Ser Val Tyr Val 195 200 205 Asp Glu Phe Gly Arg Asp Ile Ser Lys Glu Glu Ile Tyr Asn Ala Thr 210 215 220 Val Thr Asp Met Met Met Cys Ala Ile Glu Val Asp Trp Arg Asp Phe 225 230 235 240 Phe Pro Tyr Leu Ser Trp Val Pro Asn Lys Ser Phe Glu Thr Arg Val 245 250 255 Phe Thr Thr Glu Thr Arg Arg Thr Ala Val Met Arg Ala Leu Ile Lys 260 265 270 Gln Gln Lys Glu Arg Ile Val Arg Gly Glu Ala Lys Thr Cys Tyr Leu 275 280 285 Asp Phe Leu Leu Ala Glu Asn Thr Leu Thr Asp Glu Gln Leu Met Met 290 295 300 Leu Val Trp Glu Ala Leu Ile Glu Ala Ala Asp Thr Thr Leu Val Thr 305 310 315 320 Thr Glu Trp Ala Met Tyr Glu Leu Ala Lys Asn Pro Asp Lys Gln Glu 325 330 335 Arg Leu Tyr Gln Glu Ile Arg Glu Val Cys Gly Asp Glu Thr Val Thr 340 345 350 Glu Glu His Leu Pro Arg Leu Pro Tyr Leu Asn Ala Val Phe His Glu 355 360 365 Thr Leu Arg Arg His Ser Pro Val Pro Leu Ile Pro Pro Arg Phe Val 370 375 380 His Glu Asp Thr Lys Leu Ala Gly Tyr Asp Val Pro Ala Gly Thr Glu 385 390 395 400 Met Val Ile Asn Leu Tyr Gly Cys Asn Met Asn Arg Lys Glu Trp Glu 405 410 415 Ser Pro Glu Glu Trp Val Pro Glu Arg Phe Ala Gly Gly Arg Leu Glu 420 425 430 Val Ala Asp Met Tyr Lys Thr Met Ala Phe Gly Ala Gly Arg Arg Ala 435 440 445 Cys Ala Gly Ser Leu Gln Ala Thr His Ile Ala Cys Ala Ala Val Ala 450 455 460 Arg Phe Val Gln Glu Phe Gly Trp Arg Leu Arg Glu Gly Asp Glu Glu 465 470 475 480 Lys Val Asp Thr Val Gln Leu Thr Ala Tyr Lys Leu His Pro Leu His 485 490 495 Val His Leu Thr Arg Arg Gly Arg Met 500 505 <210> 11 <211> 496 <212> PRT <213> Physcomitrella patens subsp. patens <220> <221> misc_feature <222> (1)..(496) <223> Kaurene oxidase enzyme <400> 11 Met Leu Glu Thr Lys Val Ile Ala His His Val Ser His Ser Pro Cys 1 5 10 15 Ala Ala Ile Pro Gly Gly Leu Pro Val Leu Gly Asn Leu Leu Gln Leu 20 25 30 Thr Glu Lys Lys Pro His Arg Thr Phe Thr Ala Trp Ser Lys Glu His 35 40 45 Gly Pro Ile Phe Thr Ile Lys Val Gly Ser Val Pro Gln Ala Val Val 50 55 60 Asn Asn Ser Glu Ile Ala Lys Glu Val Leu Val Thr Lys Phe Ala Ser 65 70 75 80 Ile Ser Lys Arg Gln Met Pro Met Ala Leu Arg Val Leu Thr Arg Asp 85 90 95 Lys Thr Met Val Ala Met Ser Asp Tyr Gly Glu Glu His Arg Met Leu 100 105 110 Lys Lys Leu Val Met Thr Asn Leu Leu Gly Pro Thr Thr Gln Asn Lys 115 120 125 Asn Arg Ser Leu Arg Asp Asp Ala Leu Ile Gly Met Ile Glu Gly Val 130 135 140 Leu Ala Glu Leu Lys Ala Ser Pro Thr Ser Pro Lys Val Val Asn Val 145 150 155 160 Arg Asp Tyr Val Gln Arg Ser Leu Phe Pro Phe Ala Leu Gln Gln Val 165 170 175 Phe Gly Tyr Ile Pro Asp Gln Val Glu Val Leu Glu Leu Gly Thr Cys 180 185 190 Val Ser Thr Trp Asp Met Phe Asp Ala Leu Val Val Ala Pro Leu Ser 195 200 205 Ala Val Ile Asn Val Asp Trp Arg Asp Phe Phe Pro Ala Leu Arg Trp 210 215 220 Ile Pro Asn Arg Ser Val Glu Asp Leu Val Arg Thr Val Asp Phe Lys 225 230 235 240 Arg Asn Ser Ile Met Lys Ala Leu Ile Arg Ala Gln Arg Met Arg Leu 245 250 255 Ala Asn Leu Lys Glu Pro Pro Arg Cys Tyr Ala Asp Ile Ala Leu Thr 260 265 270 Glu Ala Thr His Leu Thr Glu Lys Gln Leu Glu Met Ser Leu Trp Glu 275 280 285 Pro Ile Ile Glu Ser Ala Asp Thr Thr Leu Val Thr Ser Glu Trp Ala 290 295 300 Met Tyr Glu Ile Ala Lys Asn Pro Asp Cys Gln Asp Arg Leu Tyr Arg 305 310 315 320 Glu Ile Val Ser Val Ala Gly Thr Glu Arg Met Val Thr Glu Asp Asp 325 330 335 Leu Pro Asn Met Pro Tyr Leu Gly Ala Ile Ile Lys Glu Thr Leu Arg 340 345 350 Lys Tyr Thr Pro Val Pro Leu Ile Pro Ser Arg Phe Val Glu Glu Asp 355 360 365 Ile Thr Leu Gly Gly Tyr Asp Ile Pro Lys Gly Tyr Gln Ile Leu Val 370 375 380 Asn Leu Phe Ala Ile Ala Asn Asp Pro Ala Val Trp Ser Asn Pro Glu 385 390 395 400 Lys Trp Asp Pro Glu Arg Met Leu Ala Asn Lys Lys Val Asp Met Gly 405 410 415 Phe Arg Asp Phe Ser Leu Met Pro Phe Gly Ala Gly Lys Arg Met Cys 420 425 430 Ala Gly Ile Thr Gln Ala Met Phe Ile Ile Pro Met Asn Val Ala Ala 435 440 445 Leu Val Gln His Cys Glu Trp Arg Leu Ser Pro Gln Glu Ile Ser Asn 450 455 460 Ile Asn Asn Lys Ile Glu Asp Val Val Tyr Leu Thr Thr His Lys Leu 465 470 475 480 Ser Pro Leu Ser Cys Glu Ala Thr Pro Arg Ile Ser His Arg Leu Pro 485 490 495 <210> 12 <211> 525 <212> PRT <213> Sphaceloma manihoticola <220> <221> misc_feature <222> (1)..(525) <223> Kaurene oxidase enzyme <400> 12 Met Met Asp Asp Thr Thr Ser Pro Tyr Ser Thr Tyr His Ser Val Arg 1 5 10 15 Ser Ile Arg Asn Gln Ser Ala Trp Ala Leu Ala Pro Ile Ala Val Phe 20 25 30 Ile Cys Tyr Val Val Leu Arg His Asn Arg Lys Ser Val Pro Ala Ala 35 40 45 Ser Ala Gly Ser His Ser Ile Leu Glu Pro Leu Trp Leu Ala Arg Leu 50 55 60 Arg Phe Ile Arg Asp Ser Arg Phe Ile Ile Gly Gln Gly Tyr Ser Lys 65 70 75 80 Phe Lys Asp Thr Ile Phe Lys Val Thr Lys Val Gly Ala Asp Ile Ile 85 90 95 Val Val Ala Pro Lys Tyr Val Glu Glu Ile Arg Arg Leu Ser Arg Asp 100 105 110 Thr Gly Arg Ser Val Glu Pro Phe Ile His Asp Phe Ala Gly Glu Leu 115 120 125 Leu Gly Gly Leu Asn Phe Leu Glu Ser Asp Leu Gln Thr Arg Val Val 130 135 140 Gln Gln Lys Leu Thr Pro Asn Leu Lys Thr Ile Val Pro Val Met Glu 145 150 155 160 Asp Glu Met His Tyr Ala Leu Val Ser Glu Leu Asp Ser Cys Leu Asp 165 170 175 Gly Ser Glu His Trp Thr Arg Val Asp Met Ile His Met Leu Ser Arg 180 185 190 Ile Val Ser Arg Ile Ser Ala Arg Ile Phe Leu Gly Pro Lys Tyr Cys 195 200 205 Arg Asn Asp Leu Trp Leu Lys Thr Thr Ala Glu Tyr Thr Glu Asn Leu 210 215 220 Phe Leu Thr Gly Thr Leu Leu Arg Phe Val Pro Arg Met Leu Gln Lys 225 230 235 240 Trp Ile Ala Pro Leu Leu Pro Ser Phe Arg Gln Leu Gln Glu Asn Arg 245 250 255 Gln Ala Ala Arg Lys Ile Ile Ser Glu Ile Leu Thr Asp His Gln Pro 260 265 270 Glu Lys His Asp Glu Thr Ser Asp Asn Gly Asp Pro Tyr Pro Asp Ile 275 280 285 Leu Thr Leu Met Phe Gln Ala Ala Arg Gly Lys Glu Lys Asp Ile Glu 290 295 300 Asp Ile Ala Gln His Thr Leu Leu Leu Ser Leu Ser Ser Ile His Thr 305 310 315 320 Thr Ala Leu Thr Met Thr Gln Ala Leu Tyr Asp Leu Cys Ala Tyr Pro 325 330 335 Gln Tyr Leu Asp Pro Val Lys His Glu Ile Ala Asp Thr Leu Gln Ser 340 345 350 Glu Gly Ser Trp Ser Lys Ala Met Leu Asp Lys Leu His Met Met Asp 355 360 365 Ser Leu Leu Arg Glu Ser Gln Arg Leu Ser Pro Val Phe Leu Leu Thr 370 375 380 Phe Asn Arg Ile Leu His Thr Pro Leu Thr Leu Ser Asn Gly Ile His 385 390 395 400 Leu Pro Lys Gly Thr Arg Ile Ala Ala Pro Ser Asp Ala Ile Leu Asn 405 410 415 Asp Pro Ser Leu Val Pro Gly Pro Gln Pro Ala Asp Thr Phe Asp Pro 420 425 430 Phe Arg Tyr Ile Asn His Ser Thr Gly Asp Ala Lys Lys Thr Lys Thr 435 440 445 Asn Phe Gln Thr Thr Ser Leu Gln Asn Met Ala Phe Gly Tyr Gly Lys 450 455 460 Tyr Ala Cys Pro Gly Arg Phe Tyr Val Ala Asn Glu Ile Lys Leu Val 465 470 475 480 Leu Gly His Leu Leu Met His Tyr Glu Phe Lys Phe Pro Pro Gly Met 485 490 495 Gly Arg Pro Val Asn Ser Thr Val Asp Thr Asp Met Tyr Pro Asp Leu 500 505 510 Gly Ala Arg Leu Leu Val Arg Lys Arg Lys Met Glu Glu 515 520 525 <210> 13 <211> 508 <212> PRT <213> Zea mays <220> <221> misc_feature <222> (1)..(508) <223> Kaurene oxidase enzyme <400> 13 Met Glu Ser Leu Val Ala Ala Leu Pro Ala Gly Gly Ala Ala Ala Ala 1 5 10 15 Ala Ala Phe Gly Gly Leu Val Ala Ala Ala Ala Leu Ala Gly Lys Val 20 25 30 Gly Leu Val Gly Ser Lys Lys His Leu Asn Ala Pro Pro Ala Val Ser 35 40 45 Gly Leu Pro Leu Ile Gly Asn Leu His Gln Leu Lys Glu Lys Lys Pro 50 55 60 His Gln Thr Phe Thr Lys Trp Ala Glu Ile Tyr Gly Pro Ile Tyr Thr 65 70 75 80 Ile Arg Thr Gly Ser Ser Thr Val Val Val Leu Asn Ser Ala Gln Val 85 90 95 Ala Lys Glu Ala Met Ile Ala Lys Phe Ser Ser Ile Ser Thr Arg Lys 100 105 110 Leu Ser Lys Ala Leu Ser Ala Leu Thr Arg Asp Lys Thr Met Val Ala 115 120 125 Thr Ser Asp Tyr Gly Asp Phe His Lys Met Ile Lys Arg Tyr Ile Met 130 135 140 Thr Phe Met Leu Gly Thr Ser Gly Gln Lys Gln Phe Arg Asp Thr Arg 145 150 155 160 Asn Met Met Val Asp Asn Met Leu Asn Thr Phe His Thr Leu Leu Met 165 170 175 Asp Asp Pro Asn Ser Pro Leu Asn Phe Arg Glu Val Phe Lys Asn Glu 180 185 190 Leu Phe Arg Leu Ser Leu Val Gln Ala Leu Gly Glu Asp Val Ser Ser 195 200 205 Ile Tyr Val Glu Glu Tyr Gly Lys Val Ile Ser Lys Glu Glu Ile Tyr 210 215 220 Lys Ala Thr Val Val Asp Met Met Met Cys Ala Ile Glu Val Asp Trp 225 230 235 240 Arg Asp Phe Phe Pro Tyr Leu Ser Trp Ile Pro Asn Arg Thr Phe Glu 245 250 255 Thr Arg Val Leu Thr Thr Glu Ala Arg Arg Thr Thr Val Met Gln Ala 260 265 270 Leu Ile Lys Gln Gln Lys Glu Arg Ile Ala Arg Gly Glu Thr Arg Ile 275 280 285 Ser Tyr Leu Asp Phe Leu Leu Ala Glu Asn Thr Leu Thr Asp Glu Gln 290 295 300 Leu Leu Met Leu Val Trp Glu Ala Val Ile Glu Ala Ala Asp Thr Thr 305 310 315 320 Leu Val Thr Thr Glu Trp Ala Met Tyr Glu Ile Ala Lys His Pro Glu 325 330 335 Lys Gln Glu Tyr Leu Tyr Gln Glu Ile Gln Lys Val Cys Gly Asn Lys 340 345 350 Thr Val Thr Glu Asp His Leu Pro Glu Leu Pro Tyr Leu Asn Ala Val 355 360 365 Phe His Glu Thr Met Arg Arg His Ser Pro Val Pro Leu Val Pro Pro 370 375 380 Arg Leu Val His Glu Asn Thr Asn Leu Ala Gly Tyr Glu Val Pro Ala 385 390 395 400 Gly Thr Glu Ile Ile Ile Asn Leu Tyr Gly Cys Asn Met Asn Lys Asn 405 410 415 Asp Trp Ala Glu Pro Glu Glu Trp Lys Pro Glu Arg Phe Leu Asp Gly 420 425 430 Arg Phe Glu Ala Val Asp Met His Lys Thr Met Ala Phe Gly Ala Gly 435 440 445 Arg Arg Ala Cys Ala Gly Ser Met Gln Ala Met Asn Ile Ser Cys Thr 450 455 460 Ala Ile Gly Arg Phe Val Gln Glu Phe Ala Trp Arg Leu Glu Glu Gly 465 470 475 480 Asp Glu Asp Lys Val Asp Thr Ile Gln Leu Thr Thr Asn Arg Leu Tyr 485 490 495 Pro Leu His Val Tyr Leu Ala Pro Arg Gly Arg Lys 500 505 <210> 14 <211> 1000 <212> DNA <213> Pisum sativum <220> <221> misc_feature <222> (1)..(1000) <223> AY245442.1 ent-kaurene oxidase mRNA <400> 14 gtggtgaagc aactagcagt ggcagccatg gatactctca cactttcttt gggtttttta 60 tctctctttt tgttcctctt cttactaaag agatctactc acaaacattc caagctttcc 120 catgtaccag tggttccagg tttgccagtg attgggaatc tgctgcaatt gaaagagaag 180 aaacctcaca agacattcac aaagatggct cagaaatatg gacccatttt ttccatcaaa 240 gctggttctt ccaaaatcat tgttctcaac actgctcatc ttgctaaaga ggcaatggtg 300 actagatatt catcaatttc aaaaaggaag ctatcaactg cactgacgat tctaacttcg 360 gataaatgca tggttgctat gagcgactac aatgattttc acaaaatggt taaaaaacat 420 attcttgcaa gtgttcttgg agccaatgca cagaagcgac tccgttttca cagagaggtt 480 atgatggaaa atatgtctag taagtttaat gaacatgtga agaccctctc agattctgct 540 gttgatttta ggaaaatatt tgtgtctgaa cttttcggat tagcactaaa gcaagctctg 600 ggaagtgata ttgaatccat ttatgtggag ggtttgacgg ctacattatc aagagaggac 660 ttatataaca ctctagtggt tgattttatg gagggtgcaa ttgaggtgga ttggagagat 720 ttcttcccgt acctgaaatg gattccaaat aagagcttcg agaagaaaat ccgtagagtc 780 gatcgccaaa gaaaaattat catgaaggca ctaattaatg agcaaaagaa gcggttgaca 840 tcaggaaaag aattagattg ttattatgat tacctagtat cagaagctaa agaagtgact 900 gaagaacaaa tgatcatgct gctctgggag ccaattattg agacatccga tactacctta 960 gtcacgacag aatgggctat gtatgaactt gccaaagaca 1000 <210> 15 <211> 1500 <212> DNA <213> Pisum sativum <220> <221> misc_feature <222> (1)..(1500) <223> nucleic acid sequence of Pisum sativum KO enzyme <400> 15 atggatacct taactttgtc tttaggtttc ttatctttgt tcttattttt attcttgtta 60 aagagatcta ctcacaagca ctccaagtta tcccacgttc cagttgttcc aggtttgcct 120 gtcattggta acttattgca attgaaagaa aagaagccac acaagacttt caccaagatg 180 gctcaaaagt acggtccaat tttctccatc aaagccggtt cttctaaaat cattgtttta 240 aacactgccc acttggctaa agaagctatg gttactagat attcttccat ctccaagaga 300 aagttgtcta ctgctttgac catcttgact tctgataagt gcatggttgc tatgtccgat 360 tataacgact tccacaagat ggttaagaag cacatcttgg cttctgtttt gggtgccaac 420 gcccaaaaga gattgcgttt ccacagagaa gtcatgatgg aaaacatgtc ttccaaattc 480 aatgaacatg tcaagacttt gtctgattct gctgttgact tcagaaagat tttcgtttct 540 gaattatttg gtttggcttt gaagcaagct ttgggttccg atatcgaatc tatctacgtt 600 gaaggtttga ctgctacttt atctagagaa gatttgtata acaccttggt cgtcgacttc 660 atggaaggtg ctatcgaagt tgattggaga gactttttcc cttatttgaa gtggattcca 720 aacaaatcct tcgaaaagaa gatcagaaga gttgatagac aaagaaaaat tatcatgaaa 780 gctttgatca acgaacaaaa gaaaagattg acctctggta aggaattgga ctgttactac 840 gattacttag tttctgaagc taaggaagtc accgaagaac aaatgatcat gttgttgtgg 900 gaaccaatta ttgagacttc tgatactact ttagttacca ccgaatgggc tatgtatgag 960 ttggctaagg acaagaaccg tcaagacaga ttgtacgaag aattgttgaa cgtttgtggt 1020 cacgaaaagg ttactgatga agaattgtcc aagttgccat acttaggtgc tgtctttcac 1080 gaaaccttgc gtaaacactc tccagttcca atcgtcccat tgagatacgt tgatgaagat 1140 accgaattgg gtggttatca tattcctgcc ggttccgaaa tcgctatcaa catttacggt 1200 tgtaatatgg attccaactt gtgggagaac ccagatcaat ggatccctga aagattttta 1260 gatgaaaaat acgcccaagc tgatttgtat aagactatgg ctttcggtgg tggtaaaaga 1320 gtctgtgctg gttccttaca agctatgttg attgcctgta ctgctattgg tagattggtt 1380 caagaatttg aatgggaatt gggtcacggt gaagaagaaa acgttgacac catgggttta 1440 actacccata gattacaccc attgcaagtc aaattaaagc caagaaacag aatttactaa 1500 <210> 16 <211> 449 <212> PRT <213> Stevia rebaudiana <220> <221> misc_feature <222> (1)..(449) <223> sr.UGT_g252778 <400> 16 Met Ala Thr Asn Asp Asp Asp Arg Lys Gln Leu His Val Ala Met Phe 1 5 10 15 Pro Trp Leu Ala Phe Gly His Ile Leu Pro Phe Leu Glu Leu Ser Lys 20 25 30 Leu Ile Ala Gln Asn Gly His Lys Val Ser Phe Leu Ser Thr Thr Arg 35 40 45 Asn Ile Gln Arg Leu Pro Ser His Leu Thr Pro Leu Ile Asn Leu Val 50 55 60 Lys Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp Ala Glu Ala 65 70 75 80 Thr Thr Asp Ile Lys His Asp Asp Gln Asp His Leu Leu Asn Ala Ser 85 90 95 Asp Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Glu Glu Ser Pro 100 105 110 Asp Trp Ile Ile Phe Asp Tyr Ser Tyr Tyr Trp Leu Pro Pro Val Ala 115 120 125 Ala Glu Leu Gly Ile Ser Arg Ala Phe Phe Met Thr Phe Pro Thr Trp 130 135 140 Thr Met Ala Leu Thr Arg Leu Pro Ser Asp Gln Leu Thr Ala Glu Asp 145 150 155 160 Leu Met Thr Leu Ser Lys Ile Ser Phe Lys Lys His Glu Ile Val Asn 165 170 175 Leu Met Tyr Gly Thr Ser Thr Gln Gly Asp Leu Tyr Arg Leu Thr Met 180 185 190 Ala Cys Asn Gly Ser Asp Cys Ile Leu Ile Arg Cys Cys Tyr Glu Phe 195 200 205 Glu Pro Gln Trp Leu Thr Leu Leu Glu Lys Leu Leu Pro Val Pro Val 210 215 220 Val Pro Val Gly Leu Leu Pro Pro Glu Ile His Gly Asp Glu Lys Asp 225 230 235 240 Asp Asp Thr Trp Val Ser Val Lys Glu Trp Leu Asp Gly Gln His Lys 245 250 255 Gly His Val Val Tyr Val Ala Leu Gly Ser Glu Ala Met Val Ser Lys 260 265 270 Asp Glu Leu Gly Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly Leu Pro 275 280 285 Phe Phe Trp Ala Leu Arg Lys Pro Pro Gly Ser Thr Glu Ser Asp Ser 290 295 300 Val Glu Leu Pro Asp Gly Phe Met Glu Arg Thr Arg Asn Arg Gly Val 305 310 315 320 Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His Glu Ser 325 330 335 Val Cys Gly Phe Leu Thr His Cys Gly Val Ser Ser Ile Val Glu Gly 340 345 350 Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly Asp Gln 355 360 365 Ile Met Asn Ala Gln Val Leu Ala Asp Lys Gln Val Gly Ile Glu Ile 370 375 380 Pro Arg Asn Glu Glu Asp Gly Trp Phe Thr Lys Glu Ser Val Ala Lys 385 390 395 400 Ser Leu Arg Ser Val Val Val Asp Asp Glu Gly Glu Ile Tyr Lys Ala 405 410 415 Asn Ala Arg Glu Leu Ser Lys Ile Phe Ser Asp Thr Asp Leu Gly Lys 420 425 430 Lys Tyr Ile Ser His Phe Ile Asp Phe Leu Met Met Glu Ile Val Lys 435 440 445 Thr <210> 17 <211> 436 <212> PRT <213> Setaria italica <220> <221> misc_feature <222> (1)..(436) <223> UGT40087 version 1 <400> 17 Met Asp Ala Ser Asp Ser Ser Pro Leu His Ile Val Ile Phe Pro Trp 1 5 10 15 Leu Ala Phe Gly His Met Leu Ala Ser Leu Glu Leu Ala Glu Arg Leu 20 25 30 Ala Ala Arg Gly His Arg Val Ser Phe Val Ser Thr Pro Arg Asn Ile 35 40 45 Ser Arg Leu Arg Pro Val Pro Pro Ala Leu Ala Pro Leu Ile Asp Phe 50 55 60 Val Ala Leu Pro Leu Pro Arg Val Asp Gly Leu Pro Asp Gly Ala Glu 65 70 75 80 Ala Thr Ser Asp Ile Pro Pro Gly Lys Thr Glu Leu His Leu Lys Ala 85 90 95 Leu Asp Gly Leu Ala Ala Pro Phe Ala Ala Phe Leu Asp Ala Ala Cys 100 105 110 Ala Asp Gly Ser Thr Asn Lys Val Asp Trp Leu Phe Leu Asp Asn Phe 115 120 125 Gln Tyr Trp Ala Ala Ala Ala Ala Ala Asp His Lys Ile Pro Cys Ala 130 135 140 Leu Asn Leu Thr Phe Ala Ala Ser Thr Ser Ala Glu Tyr Gly Val Pro 145 150 155 160 Arg Val Glu Pro Pro Val Asp Gly Ser Thr Ala Ser Ile Leu Gln Arg 165 170 175 Phe Val Leu Thr Leu Glu Lys Cys Gln Phe Val Ile Gln Arg Ala Cys 180 185 190 Phe Glu Leu Glu Pro Glu Pro Leu Pro Leu Leu Ser Asp Ile Phe Gly 195 200 205 Lys Pro Val Ile Pro Tyr Gly Leu Val Pro Pro Cys Pro Pro Ala Glu 210 215 220 Gly His Lys Arg Glu His Gly Asn Ala Ala Leu Ser Trp Leu Asp Lys 225 230 235 240 Gln Gln Pro Glu Ser Val Leu Phe Ile Ala Leu Gly Ser Glu Pro Pro 245 250 255 Val Thr Val Glu Gln Leu His Glu Ile Ala Leu Gly Leu Glu Leu Ala 260 265 270 Gly Thr Thr Phe Leu Trp Ala Leu Lys Lys Pro Asn Gly Leu Leu Leu 275 280 285 Glu Ala Asp Gly Asp Ile Leu Pro Pro Gly Phe Glu Glu Arg Thr Arg 290 295 300 Asp Arg Gly Leu Val Ala Met Gly Trp Val Pro Gln Pro Ile Ile Leu 305 310 315 320 Ala His Ser Ser Val Gly Ala Phe Leu Thr His Gly Gly Trp Ala Ser 325 330 335 Thr Ile Glu Gly Val Met Ser Gly His Pro Met Leu Phe Leu Thr Phe 340 345 350 Leu Asp Glu Gln Arg Ile Asn Ala Gln Leu Ile Glu Arg Lys Lys Ala 355 360 365 Gly Leu Arg Val Pro Arg Arg Glu Lys Asp Gly Ser Tyr Asp Arg Gln 370 375 380 Gly Ile Ala Gly Ala Ile Arg Ala Val Met Cys Glu Glu Glu Ser Lys 385 390 395 400 Ser Val Phe Ala Ala Asn Ala Lys Lys Met Gln Glu Ile Val Ser Asp 405 410 415 Arg Asn Cys Gln Glu Lys Tyr Ile Asp Glu Leu Ile Gln Arg Leu Gly 420 425 430 Ser Phe Glu Lys 435 <210> 18 <211> 435 <212> PRT <213> Setaria italica <220> <221> misc_feature <222> (1)..(435) <223> UGT40087 version 2 <400> 18 Met Asp Ala Ser Ser Ser Pro Leu His Ile Val Ile Phe Pro Trp Leu 1 5 10 15 Ala Phe Gly His Met Leu Ala Ser Leu Glu Leu Ala Glu Arg Leu Ala 20 25 30 Ala Arg Gly His Arg Val Ser Phe Val Ser Thr Pro Arg Asn Ile Ser 35 40 45 Arg Leu Arg Pro Val Pro Pro Ala Leu Ala Pro Leu Ile Asp Phe Val 50 55 60 Ala Leu Pro Leu Pro Arg Val Asp Gly Leu Pro Asp Gly Ala Glu Ala 65 70 75 80 Thr Ser Asp Ile Pro Pro Gly Lys Thr Glu Leu His Leu Lys Ala Leu 85 90 95 Asp Gly Leu Ala Ala Pro Phe Ala Ala Phe Leu Asp Ala Ala Cys Ala 100 105 110 Asp Gly Ser Thr Asn Lys Val Asp Trp Leu Phe Leu Asp Asn Phe Gln 115 120 125 Tyr Trp Ala Ala Ala Ala Ala Ala Asp His Lys Ile Pro Cys Ala Leu 130 135 140 Asn Leu Thr Phe Ala Ala Ser Thr Ser Ala Glu Tyr Gly Val Pro Arg 145 150 155 160 Val Glu Pro Pro Val Asp Gly Ser Thr Ala Ser Ile Leu Gln Arg Phe 165 170 175 Val Leu Thr Leu Glu Lys Cys Gln Phe Val Ile Gln Arg Ala Cys Phe 180 185 190 Glu Leu Glu Pro Glu Pro Leu Pro Leu Leu Ser Asp Ile Phe Gly Lys 195 200 205 Pro Val Ile Pro Tyr Gly Leu Val Pro Pro Cys Pro Pro Ala Glu Gly 210 215 220 His Lys Arg Glu His Gly Asn Ala Ala Leu Ser Trp Leu Asp Lys Gln 225 230 235 240 Gln Pro Glu Ser Val Leu Phe Ile Ala Leu Gly Ser Glu Pro Pro Val 245 250 255 Thr Val Glu Gln Leu His Glu Ile Ala Leu Gly Leu Glu Leu Ala Gly 260 265 270 Thr Thr Phe Leu Trp Ala Leu Lys Lys Pro Asn Gly Leu Leu Leu Glu 275 280 285 Ala Asp Gly Asp Ile Leu Pro Pro Gly Phe Glu Glu Arg Thr Arg Asp 290 295 300 Arg Gly Leu Val Ala Met Gly Trp Val Pro Gln Pro Ile Ile Leu Ala 305 310 315 320 His Ser Ser Val Gly Ala Phe Leu Thr His Gly Gly Trp Ala Ser Thr 325 330 335 Ile Glu Gly Val Met Ser Gly His Pro Met Leu Phe Leu Thr Phe Leu 340 345 350 Asp Glu Gln Arg Ile Asn Ala Gln Leu Ile Glu Arg Lys Lys Ala Gly 355 360 365 Leu Arg Val Pro Arg Arg Glu Lys Asp Gly Ser Tyr Asp Arg Gln Gly 370 375 380 Ile Ala Gly Ala Ile Arg Ala Val Met Cys Glu Glu Glu Ser Lys Ser 385 390 395 400 Val Phe Ala Ala Asn Ala Lys Lys Met Gln Glu Ile Val Ser Asp Arg 405 410 415 Asn Cys Gln Glu Lys Tyr Ile Asp Glu Leu Ile Gln Arg Leu Gly Ser 420 425 430 Phe Glu Lys 435 <210> 19 <211> 21 <212> PRT <213> Oryza sativa <220> <221> misc_feature <222> (1)..(21) <223> loop2 from Os_UGT_91C1 <400> 19 Glu Gly Leu Pro Asp Gly Ala Glu Ser Thr Asn Asp Val Pro His Asp 1 5 10 15 Arg Pro Asp Met Val 20 <210> 20 <211> 10 <212> PRT <213> Oryza sativa <220> <221> misc_feature <222> (1)..(10) <223> loop3_1 from Os_UGT_91C1 <400> 20 Ser Glu Phe Leu Gly Thr Ala Cys Ala Asp 1 5 10 <210> 21 <211> 19 <212> PRT <213> Oryza sativa <220> <221> misc_feature <222> (1)..(19) <223> loop3_2 from Os_UGT_91C1 <400> 21 Ser Glu Phe Leu Gly Thr Ala Cys Ala Asp Trp Val Ile Val Asp Val 1 5 10 15 Phe His His <210> 22 <211> 43 <212> PRT <213> Oryza sativa <220> <221> misc_feature <222> (1)..(43) <223> loop4_1 from Os_UGT_91C1 <400> 22 Ala Asp Arg Arg Leu Glu Arg Ala Glu Thr Glu Ser Pro Ala Ala Ala 1 5 10 15 Gly Gln Gly Arg Pro Ala Ala Ala Pro Thr Phe Glu Val Ala Arg Met 20 25 30 Lys Leu Ile Arg Thr Lys Gly Ser Ser Gly Met 35 40 <210> 23 <211> 56 <212> PRT <213> Oryza sativa <220> <221> misc_feature <222> (1)..(56) <223> loop4_2 from Os_UGT_91C1 <400> 23 Met Met Leu Leu Gly Ser Ala His Met Ile Ala Ser Ile Ala Asp Arg 1 5 10 15 Arg Leu Glu Arg Ala Glu Thr Glu Ser Pro Ala Ala Ala Gly Gln Gly 20 25 30 Arg Pro Ala Ala Ala Pro Thr Phe Glu Val Ala Arg Met Lys Leu Ile 35 40 45 Arg Thr Lys Gly Ser Ser Gly Met 50 55 <210> 24 <211> 18 <212> PRT <213> Oryza sativa <220> <221> misc_feature <222> (1)..(18) <223> loop2 from UGT40087 <400> 24 Asp Gly Leu Pro Asp Gly Ala Glu Ala Thr Ser Asp Ile Pro Pro Gly 1 5 10 15 Lys Thr <210> 25 <211> 17 <212> PRT <213> Setaria italica <220> <221> misc_feature <222> (1)..(17) <223> loop3_1 from UGT40087 <400> 25 Ala Ala Phe Leu Asp Ala Ala Cys Ala Asp Gly Ser Thr Asn Lys Val 1 5 10 15 Asp <210> 26 <211> 26 <212> PRT <213> Setaria italica <220> <221> misc_feature <222> (1)..(26) <223> loop3_2 from UGT40087 <400> 26 Ala Ala Phe Leu Asp Ala Ala Cys Ala Asp Gly Ser Thr Asn Lys Val 1 5 10 15 Asp Trp Leu Phe Leu Asp Asn Phe Gln Tyr 20 25 <210> 27 <211> 14 <212> PRT <213> Setaria italica <220> <221> misc_feature <222> (1)..(14) <223> loop4_1 from UGT40087 <400> 27 Gly Val Pro Arg Val Glu Pro Pro Val Asp Gly Ser Thr Ala 1 5 10 <210> 28 <211> 27 <212> PRT <213> Setaria italica <220> <221> misc_feature <222> (1)..(27) <223> loop4_2 from UGT40087 <400> 28 Leu Asn Leu Thr Phe Ala Ala Ser Thr Ser Ala Glu Tyr Gly Val Pro 1 5 10 15 Arg Val Glu Pro Pro Val Asp Gly Ser Thr Ala 20 25 <210> 29 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: modified loop1 from Os_UGT_91C1 present in UGT40087_loop1 <400> 29 Thr Pro Arg Asn Ile Ser Arg Leu Pro Pro Val Pro Pro Ala Leu Ala 1 5 10 15 Pro <210> 30 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: modified loop1 from UGT40087 present in Os_UGT_91C1_loop1 <400> 30 Thr Pro Arg Asn Ile Ser Arg Leu Arg Pro Val Arg Pro Ala Leu Ala 1 5 10 15 Pro <210> 31 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: loop1 from Os_UGT_91C1 having SEQ ID NO:8 <400> 31 Thr Pro Arg Asn Ile Ser Arg Leu Pro Pro Val Arg Pro Ala Leu Ala 1 5 10 15 Pro <210> 32 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: loop1 from UGT40087 having SEQ ID NO:11 <400> 32 Thr Pro Arg Asn Ile Ser Arg Leu Arg Pro Val Pro Pro Ala Leu Ala 1 5 10 15 Pro <210> 33 <211> 434 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: UGT40087/Si91Dlike chimera <400> 33 Met Asp Ala Ser Ser Ser Pro Leu His Ile Val Ile Phe Pro Trp Leu 1 5 10 15 Ala Phe Gly His Met Leu Ala Ser Leu Glu Leu Ala Glu Arg Leu Ala 20 25 30 Ala Arg Gly His Arg Val Ser Phe Val Ser Thr Pro Arg Asn Ile Ser 35 40 45 Arg Leu Arg Pro Val Pro Pro Ala Leu Ala Pro Leu Ile Asp Phe Val 50 55 60 Ala Leu Pro Leu Pro Arg Val Asp Gly Leu Pro Asp Gly Ala Glu Ala 65 70 75 80 Thr Ser Asp Ile Pro Pro Gly Lys Thr Glu Leu His Leu Lys Ala Leu 85 90 95 Asp Gly Leu Ala Ala Pro Phe Ala Ala Phe Leu Asp Ala Ala Cys Ala 100 105 110 Asp Gly Ser Thr Asn Lys Val Asp Trp Leu Phe Leu Asp Asn Phe Gln 115 120 125 Tyr Trp Ala Ala Ala Ala Ala Ala Asp His Lys Ile Pro Cys Ala Leu 130 135 140 Asn Leu Thr Phe Ala Ala Ser Thr Ser Ala Glu Tyr Gly Val Pro Arg 145 150 155 160 Val Glu Pro Pro Val Asp Gly Ser Thr Ala Ser Ile Leu Gln Arg Phe 165 170 175 Val Leu Thr Leu Glu Lys Cys Gln Phe Val Ile Gln Arg Ala Cys Phe 180 185 190 Glu Leu Glu Pro Glu Pro Leu Pro Leu Leu Ser Asp Ile Phe Gly Lys 195 200 205 Pro Val Ile Pro Tyr Gly Leu Val Pro Pro Cys Pro Pro Ala Gln Gly 210 215 220 His Ile Glu His Asp Asn Ala Ala Leu Ser Trp Leu Asp Lys Gln Gln 225 230 235 240 Pro Glu Ser Val Leu Phe Ile Ala Leu Gly Ser Glu Pro Pro Val Thr 245 250 255 Val Glu Gln Leu His Glu Ile Ala Leu Gly Leu Glu Leu Ala Gly Thr 260 265 270 Thr Phe Leu Trp Ala Leu Lys Lys Pro Asn Gly Leu Leu Leu Glu Ala 275 280 285 Asp Gly Asp Ile Leu Pro Pro Gly Phe Glu Glu Arg Thr Arg Asp Arg 290 295 300 Gly Leu Val Ala Met Gly Trp Val Pro Gln Leu Ser Ile Leu Ala His 305 310 315 320 Ser Ser Val Gly Ala Phe Leu Thr His Gly Gly Trp Ser Ser Thr Ile 325 330 335 Glu Gly Ala Met Ser Gly His Pro Met Val Phe Leu Thr Phe Leu Asp 340 345 350 Glu Gln Arg Ile Asn Ala Gln Leu Ile Glu Arg Lys Lys Ala Gly Leu 355 360 365 Arg Val Pro Arg Cys Glu Lys Asp Gly Ser Tyr Asp Arg Gln Gly Ile 370 375 380 Ala Gly Ala Ile Arg Ala Val Met Cys Glu Glu Glu Ser Lys Ser Val 385 390 395 400 Phe Ala Ala Asn Ala Lys Lys Met Gln Glu Ile Ile Asn Asp Arg Lys 405 410 415 Cys Gln Glu Arg Tyr Ile Asp Glu Leu Ile Gln Arg Leu Arg Ser Phe 420 425 430 Glu Lys <210> 34 <211> 433 <212> PRT <213> Oryza sativa <220> <221> misc_feature <222> (1)..(433) <223> Os_UGT_91C1_loop4_1 <400> 34 Met Asp Ser Gly Tyr Ser Ser Ser Tyr Ala Ala Ala Ala Gly Met His 1 5 10 15 Val Val Ile Cys Pro Trp Leu Ala Phe Gly His Leu Leu Pro Cys Leu 20 25 30 Asp Leu Ala Gln Arg Leu Ala Ser Arg Gly His Arg Val Ser Phe Val 35 40 45 Ser Thr Pro Arg Asn Ile Ser Arg Leu Pro Pro Val Arg Pro Ala Leu 50 55 60 Ala Pro Leu Val Ala Phe Val Ala Leu Pro Leu Pro Arg Val Glu Gly 65 70 75 80 Leu Pro Asp Gly Ala Glu Ser Thr Asn Asp Val Pro His Asp Arg Pro 85 90 95 Asp Met Val Glu Leu His Arg Arg Ala Phe Asp Gly Leu Ala Ala Pro 100 105 110 Phe Ser Glu Phe Leu Gly Thr Ala Cys Ala Asp Trp Val Ile Val Asp 115 120 125 Val Phe His His Trp Ala Ala Ala Ala Ala Leu Glu His Lys Val Pro 130 135 140 Cys Ala Met Met Leu Leu Gly Ser Ala His Met Ile Ala Ser Ile Gly 145 150 155 160 Val Pro Arg Val Glu Pro Pro Val Asp Gly Ser Thr Ala Ser Leu Ala 165 170 175 Glu Arg Phe Ser Leu Thr Leu Ser Arg Ser Ser Leu Val Val Gly Arg 180 185 190 Ser Cys Val Glu Phe Glu Pro Glu Thr Val Pro Leu Leu Ser Thr Leu 195 200 205 Arg Gly Lys Pro Ile Thr Phe Leu Gly Leu Met Pro Pro Leu His Glu 210 215 220 Gly Arg Arg Glu Asp Gly Glu Asp Ala Thr Val Arg Trp Leu Asp Ala 225 230 235 240 Gln Pro Ala Lys Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Pro 245 250 255 Leu Gly Val Glu Lys Val His Glu Leu Ala Leu Gly Leu Glu Leu Ala 260 265 270 Gly Thr Arg Phe Leu Trp Ala Leu Arg Lys Pro Thr Gly Val Ser Asp 275 280 285 Ala Asp Leu Leu Pro Ala Gly Phe Glu Glu Arg Thr Arg Gly Arg Gly 290 295 300 Val Val Ala Thr Arg Trp Val Pro Gln Met Ser Ile Leu Ala His Ala 305 310 315 320 Ala Val Gly Ala Phe Leu Thr His Cys Gly Trp Asn Ser Thr Ile Glu 325 330 335 Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly Asp 340 345 350 Gln Gly Pro Asn Ala Arg Leu Ile Glu Ala Lys Asn Ala Gly Leu Gln 355 360 365 Val Ala Arg Asn Asp Gly Asp Gly Ser Phe Asp Arg Glu Gly Val Ala 370 375 380 Ala Ala Ile Arg Ala Val Ala Val Glu Glu Glu Ser Ser Lys Val Phe 385 390 395 400 Gln Ala Lys Ala Lys Lys Leu Gln Glu Ile Val Ala Asp Met Ala Cys 405 410 415 His Glu Arg Tyr Ile Asp Gly Phe Ile Gln Gln Leu Arg Ser Tyr Lys 420 425 430 Asp <210> 35 <211> 1621 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: unoptimized nucleic acid sequence of UGT40087 having SEQ ID NO:17 <400> 35 tcgtgacgca acagagcaac tctcgccggc accggtcgcc ccttccgcag gcaggcagca 60 ggctcgcgcg catggacgcc tccgactcct ccccgctgca catcgtcatc ttcccgtggc 120 tcgcgttcgg ccacatgctc gccagcctgg agctcgccga gcgcctggcc gcgcgaggcc 180 accgcgtgtc cttcgtctcc accccgcgca acatcagccg cctccgcccg gtcccgcccg 240 cgctggcgcc gctcatcgac ttcgtggcgc tgccgctgcc gcgcgtcgac ggcctccccg 300 acggcgcgga ggccaccagc gacatcccgc ccggcaagac cgagctccac ctcaaggccc 360 tagacggcct cgccgcgccc ttcgcagctt tcctcgacgc cgcctgcgcc gacgggagca 420 ccaacaaggt ggactggctc ttcctcgaca acttccaata ctgggccgcc gccgccgctg 480 ccgaccataa gataccctgc gcgctgaacc tgacattcgc agcgtcgacg tcagcggagt 540 acggtgtgcc acgcgttgag ccgccggtgg atggctcaac agcctcaata ctccagcgat 600 ttgtgctaac cttggagaaa tgccagtttg tcatccaacg cgcctgcttc gagctggagc 660 cggagcccct gcctctcctg tcagacatct tcggcaagcc ggtgatcccg tacggcctag 720 tcccgccgtg tccccccgca gaaggtcaca aaagagagca cggcaacgca gctctgtcat 780 ggctcgacaa gcagcagccc gagtctgtcc tgttcattgc tctgggaagc gagcctccgg 840 tgaccgtcga acagctgcac gagatcgcgc ttgggctgga gctcgccggg acgacattcc 900 tctgggctct gaagaagcct aacggcctcc tcctcgaggc ggacggcgac atcctgcccc 960 caggtttcga ggagcggacg cgtgaccgtg ggctcgtggc catgggctgg gttcctcagc 1020 ccatcatact ggctcacagc tccgtgggcg cgttcctgac gcacggcgga tgggcctcca 1080 ccattgaagg ggttatgtcc gggcatccca tgctcttcct gacgttctta gatgaacaga 1140 ggataaacgc gcaactgatc gagaggaaga aggccgggtt gcgagtgcca aggcgtgaga 1200 aggacggctc gtacgatcgc caaggcatcg ccggagcgat ccgggctgtc atgtgcgagg 1260 aagaaagtaa gagcgtcttc gcggctaatg ccaagaagat gcaggagatt gtgagcgaca 1320 ggaattgcca ggagaagtac atcgacgagc ttatccagcg tctgggatcc ttcgagaagt 1380 gaaataaggt gaaatatcct acaataaccg cctgttgatg gcttgatgca acgatgtagg 1440 tggccattcg cgcctctgat ctccatgttc cggcaataaa tccaccatat gttatggctc 1500 tgacttactg aatttcctaa tatgtatgcc caaacacatg cataggttgc tagttgcccc 1560 tcgcgccggc attagcgata atgtcaccgc agtcgccagc acaggtgtag caatttgaca 1620 t 1621 <210> 36 <211> 1308 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: UGT40087-1 codon optimized nucleic acid sequence <400> 36 atggatgctt ccagtagtcc tttacacatc gttatctttc catggttagc tttcggtcat 60 atgttggctt ccttggaatt ggctgagaga ttggctgctc gtggtcacag agtctccttc 120 gtttccaccc ctagaaacat ctctagatta cgtccagttc caccagcttt agctccattg 180 attgattttg tcgctttgcc attgcctaga gtcgatggtt taccagatgg tgccgaagct 240 acctctgaca ttccaccagg taagaccgaa ttacacttga aggctttgga cggtttggct 300 gctccattcg ccgctttttt ggacgctgcc tgtgctgatg gttccaccaa caaggttgat 360 tggttgtttt tggacaactt ccaatactgg gctgccgctg ccgctgctga tcacaaaatt 420 ccttgcgcct taaacttgac ttttgccgct tccacctccg ctgaatacgg tgttccacgt 480 gttgaaccac cagttgacgg ttccactgcc tccatcttac aaagatttgt cttaacctta 540 gaaaaatgtc aattcgttat ccaaagagct tgtttcgaat tggaacctga accattgcca 600 ttgttgtccg acattttcgg taagccagtc atcccatacg gtttagttcc tccatgtcca 660 ccagctgaag gtcacaaaag agaacacggt aacgctgctt tgtcctggtt ggataagcaa 720 caaccagaat ctgttttgtt catcgctttg ggttctgaac cacctgttac cgtcgaacaa 780 ttgcacgaaa tcgctttggg tttagaattg gccggtacca ccttcttgtg ggccttgaaa 840 aagccaaacg gtttgttgtt agaagccgat ggtgatattt tgccaccagg tttcgaagaa 900 agaactagag atagaggttt agtcgctatg ggttgggttc cacaaccaat tatcttggcc 960 cattcctctg ttggtgcctt tttgactcac ggtggttggg cctccactat tgaaggtgtc 1020 atgtccggtc accctatgtt gttcttaacc ttcttggacg aacaacgtat caacgcccaa 1080 ttgatcgaaa gaaaaaaggc tggtttaaga gtcccaagaa gagaaaagga tggttcctac 1140 gacagacaag gtattgctgg tgctattaga gccgtcatgt gtgaagaaga atctaagtct 1200 gtcttcgctg ctaacgctaa gaaaatgcaa gagatcgttt ctgacagaaa ctgtcaagaa 1260 aagtacatcg acgaattgat tcaaagattg ggttctttcg aaaagtaa 1308

Claims

하나 이상의 스테비올 글리코시드(steviol glycoside)를 생산할 수 있는 유전적으로 변형된 사카로마이세스 세레비시아 ( Saccharomyces cerevisiae ) 숙주 세포로서, 상기 숙주 세포는, 서열번호 1에 대해서 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도(sequence identity)를 갖는 아미노산 서열을 포함하는 카우렌 산화효소(kaurene oxidase)를 인코딩하는 이종 핵산(heterologous nucleic acid)을 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항에 있어서,
30%, 35%, 40%, 45%, 50%, 또는 55%를 초과하는 효율로, 카우렌(kaurene)을 카우레노산(kaurenoic acid)으로 전환할 수 있는 것인, 유전적으로 변형된 사카로 마이세스 세레비시아 숙주 세포.
제1항 또는 제2항에 있어서,
상기 카우렌 산화효소는 서열번호 1의 서열을 갖는 아미노산 서열을 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제3항 중 어느 한 항에 있어서,
상기 카우렌 산화효소는 카우렌, 카우레놀(kaurenol), 및/또는 카우레날(kaurenal)의 C19 위치를 산화시킬 수 있는 것인, 유전적으로 변형된 사카로마이 세스 세레비시아 숙주 세포.
제1항 내지 제4항 중 어느 한 항에 있어서,
상기 카우렌 산화효소는 이종(heterologous) 핵산에 의해 인코딩되고, 상기 이종 핵산은 서열번호 15에 대해서 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는 뉴클레오티드 서열을 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제5항 중 어느 한 항에 있어서,
상기 카우렌 산화효소는 서열번호 15의 서열을 갖는 이종 핵산에 의해 인코딩되는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제6항 중 어느 한 항에 있어서,
30%, 35%, 40%, 45%, 50%, 또는 55%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있고, 상기 카우렌 산화효소는 서열번호 1에 대해서 적어도 95% 서열 일치도를 갖는 아미노산 서열을 포함하는 것인, 유전적으로 변형된 사카로마 이세스 세레비시아 숙주 세포.
제1항 내지 제7항 중 어느 한 항에 있어서,
상기 카우렌 산화효소는 서열번호 1의 기능성 도메인(functional domain)에 대해서 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 지닌 기능성 도메인을 갖는 폴리펩티드인 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제26항에 있어서,
55%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제9항 중 어느 한 항에 있어서,
카우레노산을 생산할 수 있는 것인, 유전적으로 변형된 사카로마이세스 세레 비시아 숙주 세포.
제1항 내지 제10항 중 어느 한 항에 있어서,
스테비올을 생산할 수 있는 것인, 유전적으로 변형된 사카로마이세스 세레비 시아 숙주 세포.
제1항 내지 제11항 중 어느 한 항에 있어서,
RebD를 생산할 수 있는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제12항 중 어느 한 항에 있어서,
RebM을 생산할 수 있는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제13항 중 어느 한 항에 있어서,
RebM과 RebM2를 적어도 10:1, 100:1, 또는 1000:1의 비율로 생산할 수 있는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제14항 중 어느 한 항에 있어서,
상기 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포는 검출 불가능한 레벨의 RebM2를 생산하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제15항 중 어느 한 항에 있어서,
상기 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포는, 스테비올을 생성하는 경로의 하나 이상의 효소를 인코딩하는 하나 이상의 이종 핵산을 더 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제16항 중 어느 한 항에 있어서,
상기 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포는, 스테비올 글리코시드를 생성하는 경로의 하나 이상의 효소를 인코딩하는 하나 이상의 이종 핵산을 더 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제17항 중 어느 한 항에 있어서,
상기 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포는, RebA를 생성하는 경로의 하나 이상의 효소를 인코딩하는 하나 이상의 이종 핵산을 더 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제18항 중 어느 한 항에 있어서,
상기 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포는, RebM을 생성하는 경로의 하나 이상의 효소를 인코딩하는 하나 이상의 이종 핵산을 더 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제19항 중 어느 한 항에 있어서,
상기 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포는, RebE를 생성하는 경로의 하나 이상의 효소를 인코딩하는 하나 이상의 이종 핵산을 더 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제20항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소는 제라닐제라닐 디포스페이트 합성효소(geranylgeranyl diphosphate synthase)를 포함하는 것인, 유전적으로 변형된 사 카로마이세스 세레비시아 숙주 세포.
제1항 내지 제21항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소는 코팔릴 디포스페이트 합성효소(copalyl diphosphate synthase)를 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제22항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소는 엔트-카우렌 합성효소(ent-kaurene synthase)를 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제23항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소는 카우레노산 수산화효소(kaurenoic acid hydroxylase)를 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제24항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소는 사이토크롬 P450 환원효소(cytochrome P450 reductase)를 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제25항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소는 하나 이상의 우리딘 5'-디포스페이트-의존성 글리코실 전이효소(uridine 5'-diphosphate-dependent glycosyltransferase)를 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제26항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소는 Os_UGT_91C1, Sl_UGT_101249881, UGT40087, sr.UGT_9252778, Bd_UGT10840, Hv_UGT_V1, Bd_UGT10850, 또는 Ob_UGT91B1_like를 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제27항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소는 UGT74G1, UGT76G1, UGT85C2, UGT91D, 또는 UGT40087 또는 이의 변이체를 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제28항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소는 제라닐제라닐 디포스페이트 합성효소, 코팔릴 디포스페이트 합성효소, 엔트-카우렌 합성효소, 카우렌 산화효소, 카우레노산 수산화효소, 사이토크롬 P450 환원효소, UGT_AD, UGT74G1, UGT76G1, UGT85C2, 및 UGT91D를 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제29항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소는 제라닐제라닐 디포스페이트 합성효소, 코팔릴 디포스페이트 합성효소, 엔트-카우렌 합성효소, 카우렌 산화효소, 카우레노산 수산화효소, 사이토크롬 P450 환원효소, UGT40087 또는 이의 변이체, UGT74G1, UGT76G1, UGT85C2, 및 UGT91D를 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제30항 중 어느 한 항에 있어서,
상기 UGT40087은 서열번호 17, 18, 또는 33에 따른 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제31항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소는 이중 기능성 (bifunctional) 코팔릴 디포스페이트 합성효소 및 카우렌 합성효소를 포함하는 것인, 유전적으로 변형된 사카로 마이세스 세레비시아 숙주 세포.
제1항 내지 제32항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소를 인코딩하는 하나 이상의 이종 핵산은 단일 전사 조절인자(transcriptional regulator)의 제어하에 있는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제33항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소를 인코딩하는 하나 이상의 이종 핵산은 복수의 이종 전사 조절인자의 제어하에 있는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제34항 중 어느 한 항에 있어서,
상기 세포는 박테리아 세포, 진균 세포, 조류 세포(algal cell), 곤충 세포, 및 식물 세포로 이루어진 군으로부터 선택되는 것인, 유전적으로 변형된 사카로마 이세스 세레비시아 숙주 세포.
제1항 내지 제35항 중 어느 한 항에 있어서,
상기 세포는 효모 세포인 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
제1항 내지 제36항 중 어느 한 항에 있어서,
효모는 사카로마이세스 세레비시아인 것인, 유전적으로 변형된 사카로마이세 스 세레비시아 숙주 세포.
하기 단계를 포함하는, 카우레노산을 생산하는 방법:
(a) 탄소 공급원을 지닌 배지에서, RebD의 생성에 적합한 조건하에, 제1항 내지 제37항 중 어느 한 항에 기재된 유전적으로 변형된 사카로마이세스 세레비시 아 숙주 세포의 집단을 배양하는 단계; 및
(b) 상기 배지로부터 상기 카우레노산 화합물을 회수하는 단계(recovering).
하기 단계를 포함하는, RebD를 생산하는 방법:
(a) 탄소 공급원을 지닌 배지에서, RebD의 생성에 적합한 조건하에, 제1항 내지 제37항 중 어느 한 항에 기재된 유전적으로 변형된 숙주 세포의 집단을 배양하는 단계; 및
(b) 상기 배지로부터 상기 RebD 화합물을 회수하는 단계;
하기 단계를 포함하는, RebM을 생산하는 방법:
(a) 탄소 공급원을 지닌 배지에서, RebM의 생성에 적합한 조건하에, 제1항 내지 제37항 중 어느 한 항에 기재된 유전적으로 변형된 숙주 세포의 집단을 배양하는 단계; 및
(b) 상기 배지로부터 상기 RebM 화합물을 회수하는 단계.
하기 단계를 포함하는, 카우레노산을 생산하는 방법:
(a) 카우레노산의 형성에 적합한 조건하에서, 카우렌을 카우레노산으로 전환할 수 있는 제1항 내지 제40항 중 어느 한 항에 기재된 카우렌 산화효소를 카우렌과 접촉시키는 단계; 및
(b) 배지로부터 상기 카우레노산 화합물을 회수하는 단계.
(a) 하기를 포함하는, 유전적으로 변형된 숙주 세포:
i. 카우렌을 카우레노산으로 전환할 수 있는, 제1항 내지 제41항 중 어느 한 항에 기재된 카우렌 산화효소를 인코딩하는 이종 핵산; 및
(b) 상기 유전적으로 변형된 숙주 세포로부터 생산된 스테비올 글리코시드;를 포함하는 발효 조성물.
제42항에 있어서,
상기 스테비올 글리코시드는 RebA, RebD 및 ReM을 적어도 1:7:50의 RebA:RebD:RebM의 비율로 포함하는 것인, 발효 조성물.
서열번호 1에 대해서 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 자연적으로 존재하지 않는 카우렌 산화효소.
생체 내에서 30%, 35%, 40%, 45%, 50%, 또는 55%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있는, 자연적으로 존재하지 않는 카우렌 산화효소.
제44항 또는 제45항에 기재된 자연적으로 존재하지 않는 카우렌 산화효소를 인코딩하는, 자연적으로 존재하지 않는 핵산.
하기 단계를 포함하는, 스테비올 글리코시드를 생산하는 방법:
(a) 탄소 공급원을 지닌 배지에서, 스테비올 글리코시드의 생성에 적합한 조건하에, 제1항 내지 제37항 중 어느 한 항에 기재된 유전적으로 변형된 숙주 세포의 집단을 배양하는 단계.