KR20190038612A

KR20190038612A - 레바우디오시드의 고효율 생산을 위한 udp 의존성 글리코실트랜스퍼라제

Info

Publication number: KR20190038612A
Application number: KR1020197006546A
Authority: KR
Inventors: 리산 자오; 웬종 리; 게일 비흐만; 아디티 칸호예; 데 곤잘로 샹탈 그라시아; 티나 마하트데즈쿨-메도우스; 사이나 잭슨; 마이클 리벨; 다렌 플랏
Original assignee: 아미리스 인코퍼레이티드
Priority date: 2016-08-12
Filing date: 2017-08-11
Publication date: 2019-04-08
Also published as: US20210355458A1; JP2022137061A; WO2018031955A2; PT3497222T; US11091743B2; BR112018074999A2; CN109804073A; US20190185826A1; EP3497222B1; SG11201900930UA; JP2019524134A; ES2906310T3; US20240174987A1; AU2017308143B2; RU2019104496A; AU2017308143A1; MX2019001631A; KR102331018B1; RU2019104496A3; CN109804073B

Abstract

본 명세서에서 숙주 세포에서 스테비올 글리코시드의 개선된 생산을 위한 조성물 및 방법을 제공한다. 일부 실시태양에서, 상기 숙주 세포를 세타리아 이탈리카 UDP-글리코실트랜스퍼라제 40087 또는 그의 변형 UDP-글리코실트랜스퍼라제를 암호화하는 이종 뉴클레오티드 서열을 포함하도록 유전자 변형시킨다. 일부 실시태양에서, 상기 숙주 세포를 UDP-글리코실트랜스퍼라제 sr.UGT_9252778, Bd_UGT10850, 및/또는 Ob_UGT91B1_유사를 암호화하는 이종 뉴클레오티드 서열을 포함하도록 유전자 변형시킨다. 일부 실시태양에서, 상기 숙주 세포는 상기 숙주 세포에서 스테비올 글리코시드를 생산할 수 있는 경로의 추가의 효소들을 암호화하는 하나 이상의 이종 뉴클레오티드 서열을 추가로 포함한다. 본 명세서에 기재된 조성물 및 방법은 비제한적으로 레바우디오시드 D 및 레바우디오시드 M을 포함한 스테비올 글리코시드의 이종 생산에 효율적인 경로를 제공한다.

Description

레바우디오시드의 고효율 생산을 위한 UDP 의존성 글리코실트랜스퍼라제

1. 관련 출원에 대한 상호참조

본 출원은 2016년 8월 12일자로 출원된 미국 가 출원 제 62/374,408 호의 이득을 주장하며, 상기 출원은 내용 전체가 본 명세서에 참고로 인용된다.

2. 발명의 분야

본 명세는 몇몇 유리딘 디포스페이트-의존성 글리코실트랜스퍼라제(UGT), 이를 포함하는 조성물, 이를 포함하는 숙주 세포, 및 레바우디오시드 D 및 레바우디오시드 M을 포함한 레바우디오시드의 생산을 위한 그의 사용 방법에 관한 것이다.

3. 배경

천연 공급원으로부터 유래된 제로-칼로리 감미료는 높은-당 소비의 부작용(예를 들어 당뇨병 및 비만증)을 제한하는 것을 목적으로 한다. 레바우디오시드 M(RebM)은 스테비아 식물(스테비아 레바우디아나 베르토니(Stevia rebaudiana Bertoni))에 의해 생산되는 많은 단맛 화합물들 중 하나이다. 모든 레바우디오시드 중에서, RebM이 가장 높은 효능을 가지며(슈크로스보다 약 200-300배 더 달다) 깔끔한 맛을 갖는다. 그러나, RebM은 상기 스테비아 식물에 의해 단지 소량으로만 생산되며, 전체 스테비올 글리코시드 함량의 단지 작은 부분(<1.0%)일 뿐이다. Ohta et al., 2010, J. Appl. Glycosci., 57, 199-209 (2010). 이와 같이 대량의 고순도 생산을 허용하는 생물공학적 경로를 사용하여 RebM을 생산하는 것이 바람직할 수 있다.

생물공학을 이용하여 생성물을 경제적으로 생산하기 위해서, 공급원료로부터 생성물로의 생물전환의 각 단계는 높은 전환효율(이상적으로는 >90%)을 갖는 것이 유리하다. RebM을 생산하기 위한 효모의 공학에서, 끝에서 두 번째 생합성 단계, 즉 레바우디오시드 A(RebA)에서 레바우디오시드 D(RebD)로의 전환에서 한계가 확인되었다. 도 1A를 참조하시오. 고유 효소(Ono, EP 2 826 861 A1, UGT91D_유사3, 또는 근접 상동체)는 RebA의 약 3%를 RebD로 전환시키는 것으로 관찰되었다. RebA를 RebD로 전환시킬 수 있는 2개의 다른 UGT 효소들이 동정되었다. 하나는 오리자 사티바(Oryza sativa)로부터의 Os_UGT_91C1(또한 휴튼 라르센(Houghton-Larsen) 등의 WO 2013/022989 A2에서 EUGT11이라 지칭된다)이고, 다른 하나는 솔라눔 라이코페르시쿰(Solanum lycopersicum)으로부터의 Sl_UGT_101249881(또한 마코시안(Markosyan) 등의 WO2014/193888 A1에서 UGTSL2라 지칭된다)이다. 그러나, Os_UGT_91C1 및 Sl_UGT_101249881은 모두 처음에는 본 발명자들에 의해 각각 약 53% 및 70%의 목적하는 것보다 더 낮은 전환 효율을 갖는 것으로 관찰되었다. 이들 3개의 효소 UGT91D_유사(like)3, Os_UGT_91C1, 및 SL_UGT_101249881은 모두 글루코스 부분을, 베타(1->2) 결합의 형성을 통해 19-O-글루코스 잔기의 C-2' 위치로 전달하는 유리딘 디포스페이트-의존성 글리코실트랜스퍼라제(UGT)이다(도 1A).

RebM을 효율적이고 고순도로 생산하기 위해서, RebA를 RebD로 고효율로 전환시킬 수 있는 개선된 효소가 필요하다. 본 명세서에 제공된 조성물 및 방법은 이러한 필요성을 다루고 있으며 또한 관련된 장점들을 제공한다.

4. 발명의 요약

본 명세서에서 RebA의 RebD로의 개선된 전환 및 RebD 및/또는 RebM의 개선된 생산을 위한 조성물 및 방법을 제공한다. 상기 조성물 및 방법은 부분적으로 몇몇 유리딘 디포스페이트-의존성 글리코실트랜스퍼라제(UGT)가 현저하게 높은 효율로 RebA를 RebD로 전환시킬 수 있다는 놀라운 발견을 기본으로 한다. 심지어 신규의 UGT에 의한 균주 수행능의 보통의 개선(예를 들어 10 퍼센트)조차, RebM에 대한 시장 수요가 매년 50억톤인 것으로 추정할 때, 잠재적으로는 차후의 생산 비용을 천만달러 이상 절감시킬 수 있다.

본 명세서에 기재된 몇몇 UGT들은 또한 RebM을 RebM2 부산물(즉 RebM의 이성질체)과 같은 비천연 글리코시드 없이 또는 거의 없이 RebM을 생산할 수 있다. 현재 공지된 스테비아 글리코시드의 목록에 대해서 문헌[Ceunen S. et al. Steviol Glycosides: Chemical Diversity, Metabolism, and Function. J. Nat. Prod., 76, 1201-1228 (2013)]을 참조하시오. 이와 같이, 몇몇 실시태양에서, 본 명세서에 기재된 조성물 및 방법은 고순도 RebM을 갖는 조성물을 수득하기 위한 하류부분 처리 비용을 감소시킬 수 있다.

또한 본 명세서는 이전에 공지된 UGT와 상이한 기질 특이성을 갖는 스테비올 글리코시드를 생산할 수 있는 대체 효소에 대한 조성물 및 방법을 제공한다. 상기 신규의 대체 효소는 잠재적으로는 다른 공지된 효소에 의해 생산된 것들과 비교하여 상이한 혼합물 또는 비율의 스테비올 글리코시드를 생산할 수 있다. 상이한 혼합물 또는 비율의 스테비올 글리코시드를 갖는 조성물들은 잠재적으로는 대안의 단맛 프로파일을 부여할 수 있으며, 이는 다양한 소모품 또는 식품의 제형화에 유용할 수 있다.

따라서, 본 명세서는 유전자 변형된 숙주 세포 및 산업적으로 유용한 화합물의 생산을 위한 그의 사용 방법을 제공한다. 하나의 태양에서, 본 명세서는 UDP-글리코실트랜스퍼라제(UGT400087, 또한 Si_UGT_400087이라 칭한다)를 암호화하는 이종 핵산을 포함하는 유전자 변형된 숙주 세포를 제공한다. 일부 실시태양에서, 상기 유전자 변형된 숙주 세포는 스테비올 및/또는 스테비올 글리코시드를 생산할 수 있는 하나 이상의 효소 경로를 추가로 포함한다.

몇몇 실시태양에서, 본 명세서는 UGT40087의 서열(예를 들어 서열번호 1 또는 서열번호 11)에 적어도 80%, 85%, 90% 또는 95% 서열 동일성(sequence identity)을 갖는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하는 유전자 변형된 숙주 세포를 제공한다. 몇몇 실시태양에서, 상기 유전자 변형된 숙주 세포는 RebA를 RebD로 90%, 95%, 96% 또는 97%를 초과하는 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 상기 유전자 변형된 숙주 세포는 당 수용체 도메인을 포함하는 UDP-글리코실트랜스퍼라제를 포함하며, 여기에서 상기 당 수용체 도메인의 아미노산 서열은 서열번호 1 또는 서열번호 11의 당 수용체 도메인의 아미노산 서열에 적어도 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는다. 몇몇 실시태양에서, 상기 유전자 변형된 숙주 세포는 고리1 아미노산 서열, 변형 고리1 아미노산 서열, 고리2 아미노산 서열, 변형 고리2 아미노산 서열, 고리3_1 아미노산 서열, 변형 고리3_1 아미노산 서열, 고리3_2 아미노산 서열, 변형 고리3_2 아미노산 서열, 고리4_1 아미노산 서열, 변형 고리4_1 아미노산 서열, 고리4_2 아미노산 서열 또는 이들의 임의의 조합을 포함하는 UDP-글리코실트랜스퍼라제를 포함한다. 몇몇 실시태양에서, 상기 유전자 변형된 숙주 세포는 서열번호 1 또는 서열번호 11의 당 수용체 도메인에 적어도 61%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하고, 서열번호 1 또는 서열번호 11의 고리4_1 아미노산 서열을 추가로 포함한다.

몇몇 실시태양에서, 본 명세서는 서열번호 2, 5 또는 6의 서열에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하는 유전자 변형된 숙주 세포를 제공한다. 몇몇 실시태양에서, 상기 유전자 변형된 숙주 세포는 RebA를 RebD로 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96% 또는 97%를 초과하는 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 상기 유전자 변형된 숙주 세포는 당 수용체 도메인을 포함하는 UDP-글리코실트랜스퍼라제를 포함하며, 여기에서 상기 당 수용체 도메인의 아미노산 서열은 서열번호 2, 5 또는 6의 당 수용체 도메인의 아미노산 서열에 적어도 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는다. 몇몇 실시태양에서, 상기 유전자 변형된 숙주 세포는 고리1 아미노산 서열, 변형 고리1 아미노산 서열, 고리2 아미노산 서열, 변형 고리2 아미노산 서열, 고리3_1 아미노산 서열, 변형 고리3_1 아미노산 서열, 고리3_2 아미노산 서열, 변형 고리3_2 아미노산 서열, 고리4_1 아미노산 서열, 변형 고리4_1 아미노산 서열, 고리4_2 아미노산 서열 또는 이들의 임의의 조합을 포함하는 UDP-글리코실트랜스퍼라제를 포함한다. 몇몇 실시태양에서, 상기 유전자 변형된 숙주 세포는 서열번호 2, 5 또는 6의 당 수용체 도메인에 적어도 61%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하고, 서열번호 2, 5 또는 6의 고리4_1 아미노산 서열을 추가로 포함한다.

또 다른 태양에서, 본 명세서는 이종 스테비올 글리코시드를 생산하는 방법을 제공하며, 상기 방법은 본 명세서에 기재된 바와 같이 스테비올 글리코시드를 생산할 수 있는, 본 명세서에 제공된 유전자 변형된 숙주 세포의 집단을, 상기 스테비올 글리코시드 화합물 생성에 적합한 조건하에서 탄소원(carbon source)을 갖는 배지에서 배양하고; 상기 배지로부터 상기 스테비올 글리코시드를 회수함을 포함한다. 일부 실시태양에서, 상기 이종 스테비올 글리코시드는 RebD 및 RebM으로 이루어지는 그룹 중에서 선택된다.

또 다른 태양에서, 본 명세서는 숙주 세포에서 스테비올 글리코시드 화합물의 생산을 증가시키는 방법을 제공하며, 상기 방법은 상기 숙주 세포에서 UGT40087을 암호화하는 이종 핵산을 발현시키고; 상기 숙주 세포를 상기 스테비올 글리코시드를 생산하기에 적합한 조건하에서 배양함을 포함한다. 일부 실시태양에서, 상기 숙주 세포는 UGT91D_유사3 효소, Os_UGT_91 효소, 또는 Sl_UGT_101249881 효소를 포함하지 않는다.

또 다른 태양에서, 본 명세서는 RebD의 생산 방법을 제공하며, 상기 방법은 본 명세서에 기재된 바와 같이 RebD를 생산할 수 있는, 본 명세서에 제공된 유전자 변형된 숙주 세포의 집단을, 상기 RebD 생성에 적합한 조건하에서 탄소원을 갖는 배지에서 배양하고; 상기 배지로부터 상기 RebD를 회수함을 포함한다.

또 다른 태양에서, 본 명세서는 RebM의 생산 방법을 제공하며, 상기 방법은 본 명세서에 기재된 바와 같이 RebM을 생산할 수 있는, 본 명세서에 제공된 유전자 변형된 숙주 세포의 집단을, 상기 RebM 생성에 적합한 조건하에서 탄소원을 갖는 배지에서 배양하고; 상기 배지로부터 상기 RebM을 회수함을 포함한다.

또 다른 태양에서, 본 명세서는 RebD의 생산 방법을 제공하며, 상기 방법은 RebA를 글루코스, 및 RebD의 형성에 적합한 조건하에서 RebA를 RebD로 전환시킬 수 있는, 본 명세서에 기재된 UDP-글리코실트랜스퍼라제와 접촉시킴을 포함한다.

또 다른 태양에서, 본 명세서는 RebM의 생산 방법을 제공하며, 상기 방법은 RebM을 글루코스, 및 RebD의 형성에 적합한 조건하에서 RebA를 RebD로 전환시킬 수 있는, 본 명세서에 기재된 UDP-글리코실트랜스퍼라제, 및 RebD를 RebM으로 전환시킬 수 있는, 본 명세서에 기재된 UDP-글리코실트랜스퍼라제와 접촉시킴을 포함한다.

일부 실시태양에서, 상기 숙주 세포는 효모 세포이다. 일부 실시태양에서, 상기 효모는 사카로마이세스 세레비지아에(Saccharomyces cerevisiae)이다. 일부 실시태양에서, 상기 숙주 세포는 RebD 또는 RebM을 고효율로 생산한다. 일부 실시태양에서, 상기 숙주 세포는 상기 UGT40087 효소를 포함하지 않는 효모 세포에 비해 증가된 양의 RebD 또는 RebM을 생산한다. 일부 실시태양에서, 상기 숙주 세포는 상기 UGT40087 효소를 포함하지 않는 효모 세포에 비해 증가된 양의, RebM2에 비해 RebM을 생산한다.

또 다른 태양에서, 본 명세서에 제공된 다른 UDG-글리코실트랜스퍼라제를, UGT40087 외에 또는 상기에 대한 대안으로 사용할 수 있다. 여기에는 예를 들어 sr.UGT_9252778, Bd_UGT10840, Hv_UGT_V1, Bd_UGT10850, 및 Ob_UGT91B1_유사가 포함된다.

도 1A는 RebA에서 RebD에서 RebM으로의 전환에 대한 도식적인 표현을 제공한다.
도 1B는 RebM2의 구조를 제공한다.
도 1C는 메발로네이트 경로의 개략도를 제공한다.
도 2A는 파르네실 피로포스페이트(FPP)의 스테비올로의 예시적인 경로를 제공한다.
도 2B는 스테비올의 RebM으로의 예시적인 경로를 제공한다.
도 2C는 RebM의 효소적 생산에 대한 예시적인 경로를 제공한다.
도 3은 Reb(D+M)의 마이크로몰/Reb(A+D+M)의 마이크로몰에 의해 측정된 바와 같은, 생체내 RebA의 RebD로의 전환비를 제공한다. 모 대조용 균주는 91D_유사3(스테비아 레바우디아나(Stevia rebaudiana)로부터)으로 표지되며; 상기 균주는 빈 랜딩 패드 외에, 단지 UGT: 85C2, 74G1, 91D_유사3 및 76G1만을 함유한다. 91D_유사3은 매우 낮은 RebA에서 RebD로의 전환을 가짐이 주목된다(∼3% 표 5 참조). 각 UGT 효소의 단일 사본을 상기 모 대조용 균주내에 삽입시키고 개선된 RebA에서 RebD로의 전환에 대해 선별하였다. 6개의 UGT 효소가, 앞서 공지된 효소 Os_UGT_91C1 및 Sl_UGT_101249881과 적어도 동등하거나 또는 더 양호한 RebA에서 RebD로의 전환을 갖는 것으로 보인다. 3개의 UGT 효소(Si_UGT_40087, Ob_UGT91B1_유사, 및 Hv_UGT_V1)가 RebA에서 RebD로의 전환에 있어서 앞서 식별된 2개의 UGT 효소 모두보다 양호하다. 오차 막대는 표준 오차이다.
도 4는 효모에서 RebA에서 RebD로의 전환을 선별하기 위해서 개별적인 UGT 효소를 삽입시키는데 사용된 "랜딩 패드" 디자인의 개략도를 제공한다.
도 5a-h는 표 5 및 도 3에 기재된 데이터를 생성시키는데 사용된 각 UGT 유전자에 대한 생체내 생산된 RebA, RebD, RebM, RebM2의 크로마토그램을 예시한다. 상기 크로마토그램 피크들은 RebA, RebD, RebM, 및 RebM2와 관련된 피크들을 나타내도록 선택된다. 각각의 도면은 체류 시간 대 진성 표준, 대조용 모 균주 Y31062, 및 추가적인 UGT 효소를 갖는 Y31062에 대한 강도%를 도시한다. Y31062는 모 대조용 균주이며 빈 랜딩 패드와 함께 UGT74G1, UGT85C2, UGT91D_유사3, 및 UGT76G1을 함유한다. 도 5a: Si_UGT_40087에 대한 데이터; 상기 도면은 또한 RebE 진성 표준에 대한 크로마토그램을 포함한다. 도 5b: Ob_UGT91B1_유사에 대한 데이터. 도 5c: Hv_UGT_V1에 대한 데이터. 도 5d: Sl_UGT_101249881에 대한 데이터. 도 5e: UGT_g252778에 대한 데이터. 도 5f: Os_UGT_91C1에 대한 데이터. 도 5g: Bd_UGT10850에 대한 데이터. 도 5h: Bd_UGT10840에 대한 데이터. 도 5i는 피크가 RebE임을 입증하는, 진성 표준에 대한 오직 Si_UGT_40087의 RebE 피크에 대한 크로마토그램의 확대도를 도시한다.
도 6은 UGT40087 구조의 상동 모델을 예시한다. 그의 N- 및 C-말단 도메인을 밝고 진한 회색으로 나타내며, 고리 교환(swapping) 실험에 사용된 4개의 고리가 또한 상기 구조상에 표지된다.
도 7은 UGT 도메인 교환 구성의 개략적인 개요를 예시한다.
도 8은 4개의 UDP-글리코실트랜스퍼라제(UGT40087(서열번호 1); Os_UGT_91C1(서열번호 8); 91D유사3(서열번호 7); Si91D유사(서열번호 12))의 서열 정렬을 예시한다.
도 9a는 모 대조용 세포(UGT74G1, UT85C2, UGT76G1, 및 UGT91D_유사3 포함)에 대한 생체내 생산된 스테비올 글리코시드의 크로마토그램을 예시한다. 도 9b는 UGT40087을 갖는 모 대조용 균주에 대한 생체내 생산된 스테비올 글리코시드의 크로마토그램을 예시한다. 도 9c는 Ob_UGT91B1-유사를 갖는 모 대조용 균주에 대한 생체내 생산된 스테비올 글리코시드의 크로마토그램을 예시한다.

6. 실시태양들의 상세한 기재

6.1 용어

본 명세서에 사용되는 바와 같이, "이종"이란 용어는 자연에서 통상적으로 발견되지 않는 것을 지칭한다. "이종 뉴클레오티드 서열"이란 용어는 자연에서 주어진 세포에서 통상적으로 발견되지 않는 뉴클레오티드 서열을 지칭한다. 이와 같이, 이종 뉴클레오티드 서열은 (a) 그의 숙주 세포에 대해 이질성(즉 상기 세포에 대해 "외인성")이거나; (b) 숙주 세포에서 자연적으로 발견되지만(즉 "내인성") 상기 세포 중에 자연적이지 않은 양(즉 상기 숙주 세포에서 자연적으로 발견되는 것보다 많거나 적은 양)으로 존재하거나; 또는 (c) 상기 숙주 세포에서 자연적으로 발견되지만 그의 자연적인 유전자좌의 밖에 위치할 수 있다. "이종 효소"란 용어는 자연에서 주어진 세포에서 통상적으로 발견되지 않는 효소를 지칭한다. 상기 용어는 (a) 주어진 세포에 대해 외인성이고(즉 숙주 세포 중에 자연적으로 존재하지 않거나 또는 상기 숙주 세포 중의 주어진 상황에 자연적으로 존재하지 않는 뉴클레오티드 서열에 의해 암호화되고); (b) 숙주 세포에서 자연적으로 발견되지만(예를 들어 상기 효소는 상기 세포에 내인성인 뉴클레오티드 서열에 의해 암호화된다) 상기 숙주 세포 중에 자연적이지 않은 양(즉 자연적으로 발견되는 것보다 많거나 적은 양)으로 생산되는 효소를 포함한다.

다른 한편으로, 분자, 및 특히 효소 및 핵산과 관련하여 본 명세서에 사용되는 바와 같은 "고유" 또는 "내인성"이란 용어는, 고유 미생물에서 상기 분자의 발현수준보다 낮거나, 상기 수준과 같거나 또는 상기 수준보다 더 높을 수 있는 발현 수준과 별개로, 이들이 기원하는 유기체에서 발현되거나 자연에서 발견되는 분자를 가리킨다. 고유 효소 또는 폴리뉴클레오티드의 발현은 재조합 미생물에서 변경될 수 있는 것으로 생각된다.

본 명세서에 사용되는 바와 같이, "모 세포"란 용어는, 변형된 숙주 세포내로 조작된 하나 이상의 특정한 유전자 변형, 예를 들어 하기로 이루어지는 그룹 중에서 선택된 하나 이상의 변형을 포함하지 않음을 제외하고, 본 명세서에 개시된 유전자 변형된 숙주 세포와 동일한 유전적 배경을 갖는 세포를 지칭한다: 스테비올 경로의 효소의 이종 발현, 스테비올 글리코시드 경로의 효소의 이종 발현, 제라닐제라닐 디포스페이트 신타제의 이종 발현, 코팔릴 디포스페이트 신타제의 이종 발현, 카우렌 신타제의 이종 발현, 카우렌 옥시다제의 이종 발현, 스테비올 신타제(카우렌산 하이드록실라제)의 이종 발현, 시토크롬 P450 리덕타제의 이종 발현, UGT74G1의 이종 발현, UGT76G1의 이종 발현, UGT85C2의 이종 발현, UGT91D의 이종 발현, 및 UGT40087의 이종 발현.

본 명세서에 사용되는 바와 같이, "천연"이란 용어는 자연에서 발견되는 것을 지칭한다. 예를 들어 자연의 공급원으로부터 단리될 수 있고 실험실에서 인간에 의해 의도적으로 변형되지 않은 유기체 중에 존재하는 UDP-글리코실트랜스퍼라제가 천연 UDP-글리코실트랜스퍼라제이다. 환언하면, 본 명세서에 사용되는 바와 같이, "비-천연"이란 용어는 자연에서 발견되지 않고 인간 개입에 의해 생성되는 것을 지칭한다.

"배지"란 용어는 배양 배지 및/또는 발효 배지를 지칭한다.

"발효 조성물"이란 용어는 유전자 변형된 숙주 세포 및 상기 유전자 변형된 숙주 세포에 의해 생산된 생성물 또는 대사산물을 포함하는 조성물을 지칭한다. 발효 조성물의 일례는 완전세포 브로쓰(broth)이며, 상기는 세포, 수성상, 및 상기 유전자 변형된 숙주 세포로부터 생산된 화합물을 포함하여, 용기(예를 들어 플라스크, 플레이트 또는 발효기)의 전체 내용물일 수 있다.

본 명세서에 사용되는 바와 같이, "생산"이란 용어는 일반적으로 본 명세서에 제공된 유전자 변형된 숙주 세포에 의해 생산된 스테비올 또는 스테비올 글리코시드의 양을 지칭한다. 일부 실시태양에서, 생산을 상기 숙주 세포에 의한 스테비올 또는 스테비올 글리코시드의 수율로서 나타낸다. 다른 실시태양에서, 생산을 상기 스테비올 또는 스테비올 글리코시드의 생산에 있어서 상기 숙주 세포의 생산성으로서 나타낸다.

본 명세서에 사용되는 바와 같이, "생산성"이란 용어는 시간에 걸쳐(시간당) 숙주 세포가 배양되는 발효 브로쓰의 양(부피 기준) 당 생산된 스테비올 또는 스테비올 글리코시드의 양(중량 기준)으로서 나타내는, 상기 숙주 세포에 의한 스테비올 또는 스테비올 글리코시드의 생산을 지칭한다.

본 명세서에 사용되는 바와 같이, "수율"이란 용어는 숙주 세포에 의해 소비되는 탄소원의 양(중량 기준) 당 생산된 스테비올 또는 스테비올 글리코시드의 양으로서 나타내는, 상기 숙주 세포에 의한 스테비올 또는 스테비올 글리코시드의 생산을 지칭한다.

본 명세서에 사용되는 바와 같이, 화합물(예를 들어 RebM2, 스테비올 글리코시드 또는 다른 화합물들)의 "검출할 수 없는 수준"이란 용어는 상기 화합물을 측정하기 위한 표준 기법에 의해 측정하고/하거나 분석하기에 너무 낮은 화합물의 수준을 의미한다. 예를 들어, 상기 용어는 실시예 7에 기재된 분석 방법에 의해 검출할 수 없는 화합물의 수준을 포함한다.

본 명세서에 사용되는 바와 같이, "스테비올 글리코시드(들)"란 용어는 스테비올의 하나 이상의 당 부분, 예를 들어 글리코시드의 첨가에 의해 효소적으로 변경된 스테비올, 예를 들어 비제한적으로 천연 스테비올 글리코시드, 예를 들어 스테비올모노시드, 스테비올비오시드, 루부소시드, 둘코시드 B, 둘코시드 A, 레바우디오시드 B, 레바우디오시드 G, 스테비오시드, 레바우디오시드 C, 레바우디오시드 F, 레바우디오시드 A, 레바우디오시드 I, 레바우디오시드 E, 레바우디오시드 H, 레바우디오시드 L, 레바우디오시드 K, 레바우디오시드 J, 레바우디오시드 M, 레바우디오시드 D, 레바우디오시드 N, 레바우디오시드 O, 합성 스테비올 글리코시드, 예를 들어 효소적으로 글루코실화된 스테비올 글리코시드 및 이들의 조합을 지칭한다.

본 명세서에 사용되는 바와 같이, "유리딘 디포스페이트(UDP)-글리코실트랜스퍼라제" 또는 "UDP-의존성 글리코실트랜스퍼라제"란 용어는 모노사카라이드 부분을 글리코실 공여체로부터 글리코실 수용체로 전달하는 활성을 갖는 효소, 특히 글리코실 공여체로서 UDP-당을 사용하는 효소를 지칭한다. "UDP-글리코실트랜스퍼라제"란 용어는 "UGT"와 호환 가능하게 사용될 수 있다.

본 명세서에 사용되는 바와 같이, "기능성 도메인"이란 용어는 UDP-글리코실트랜스퍼라제의 "당 수용체 도메인" 또는 "당 공여체 도메인"을 의미한다. 식물 UDP-글리코실트랜스퍼라제(UGT)는 글리코실트랜스퍼라제 상과의 1과에 속한다. 상기는 GT-B 구조적 폴드를 채용한다. 상기 UGT에 의해 공유된 구조적 특징은 도메인-간 링커에 의해 분리된, 유사한 로스만-유사 폴드를 갖는 2개의 도메인, C-말단 및 N-말단 도메인으로 이루어진다. 상기 C-말단 도메인은 UDP-글루코스("당 공여체")에 결합하고 따라서 당 공여체 도메인이라고도 지칭되는 반면, 상기 N-말단 도메인은 비-당 기질("수용체")에 결합하고 따라서 수용체 도메인이라고도 지칭된다.

본 명세서에 사용되는 바와 같이, "변체"란 용어는 아미노산 삽입, 결실, 돌연변이, 및/또는 치환에 의해, 특정하게 인용된 "참조" 폴리펩티드(예를 들어 야생형 서열)와 상이하지만 상기 참조 폴리펩티드와 실질적으로 유사한 활성을 유지하는 폴리펩티드를 지칭한다. 예를 들어, 변형 UGT40087은, 상기 변형 UGT40087이 RebA를 RebD로 및/또는 스테비오시드를 RebE로 전환시키는 반응을 또한 촉매화할 수 있다는 점에서 서열번호 11을 갖는 참조 UGT40087과 실질적으로 유사한 활성을 유지한다. 일부 실시태양에서, 상기 변체는 재조합 DNA 기법, 예를 들어 돌연변이유발에 의해 생성된다. 일부 실시태양에서, 변형 폴리펩티드는 또 다른 것에 대한 하나의 염기성 잔기의 치환(즉 Lys에 대한 Arg), 또 다른 것에 대한 하나의 소수성 잔기의 치환(즉 Ile에 대한 Leu), 또는 또 다른 것에 대한 하나의 방향족 잔기의 치환(즉 Tyr에 대한 Phe) 등에 의해 그의 참조 폴리펩티드와 상이하다. 일부 실시태양에서, 변체는 참조 서열의 실질적인 구조적 유사성을 생성시키는 보존적 치환이 획득되는 유사체를 포함한다. 상기와 같은 보존적 치환의 예는 비제한적으로 아스파트산에 대한 글루탐산 및 이와 역; 아스파라진에 대한 글루타민 및 이와 역; 쓰레오닌에 대한 세린 및 이와 역; 아르기닌에 대한 리신 및 이와 역; 또는 서로에 대한 이소류신, 발린 또는 류신 중 어느 하나를 포함한다.

본 명세서에 사용되는 바와 같이, "변형 고리1"이란 용어는 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 아미노산 삽입, 결실, 돌연변이 및/또는 치환에 의해 서열번호 1 또는 서열번호 11의 참조 고리1 아미노산 서열(또는 서열번호 28의 서열을 갖는 UGT40087의 변형된 고리1 서열)과 상이하지만, 각각 서열번호 1 또는 서열번호 11의 고리1 아미노산 서열 위치에 상응하는 위치에 삽입된, 변형 고리1 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제가 RebA의 RebD로의 및/또는 스테비오시드의 RebE로의 전환을 촉진하게 하는 아미노산 서열을 지칭한다.

본 명세서에 사용되는 바와 같이, "변형 고리2"란 용어는 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 아미노산 삽입, 결실, 돌연변이 및/또는 치환에 의해 서열번호 1 또는 서열번호 11의 참조 고리 2 아미노산 서열과 상이하지만, 각각 서열번호 1 또는 서열번호 11의 고리2 아미노산 서열 위치에 상응하는 위치에 삽입된, 변형 고리2 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제가 RebA의 RebD로의 및/또는 스테비오시드의 RebE로의 전환을 촉진하게 하는 아미노산 서열을 지칭한다.

본 명세서에 사용되는 바와 같이, "변형 고리3_1"이란 용어는 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 아미노산 삽입, 결실, 돌연변이 및/또는 치환에 의해 서열번호 1 또는 서열번호 11의 참조 고리3_1 아미노산 서열과 상이하지만, 각각 서열번호 1 또는 서열번호 11의 고리3_1 아미노산 서열 위치에 상응하는 위치에 삽입된, 변형 고리3_1 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제가 RebA의 RebD로의 및/또는 스테비오시드의 RebE로의 전환을 촉진하게 하는 아미노산 서열을 지칭한다. 본 명세서에 사용되는 바와 같이, "변형 고리3_2"란 용어는 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 아미노산 삽입, 결실, 돌연변이 및/또는 치환에 의해 서열번호 1 또는 서열번호 11의 참조 고리3_2 아미노산 서열과 상이하지만, 각각 서열번호 1 또는 서열번호 11의 고리3_2 아미노산 서열 위치에 상응하는 위치에 삽입된, 변형 고리3_2 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제가 RebA의 RebD로의 및/또는 스테비오시드의 RebE로의 전환을 촉진하게 하는 아미노산 서열을 지칭한다. 몇몇 실시태양에서, 변형 고리3_2 아미노산 서열은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 30개 이하의 아미노산 삽입, 결실, 돌연변이 및/또는 치환에 의해 참조 고리3_2 아미노산 서열과 상이하다.

본 명세서에 사용되는 바와 같이, "변형 고리4_1"이란 용어는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 30개 이하의 아미노산 삽입, 결실, 돌연변이 및/또는 치환에 의해 서열번호 1 또는 서열번호 11의 참조 고리4_1 아미노산 서열과 상이하지만, 서열번호 11의 고리4_1 아미노산 서열 위치에 상응하는 위치에 삽입된, 변형 고리4_1 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제가 RebA의 RebD로의 및/또는 스테비오시드의 RebE로의 전환을 촉진하게 하는 아미노산 서열을 지칭한다. 본 명세서에 사용되는 바와 같이, 상기의 상황에서 또는 2개 이상의 핵산 또는 단백질 서열에서 "서열 동일성" 또는 "동일성 퍼센트"란 용어는 동일하거나, 또는 동일한 아미노산 잔기 또는 뉴클레오티드의 명시된 백분율을 갖는 2개 이상의 서열 또는 하위서열을 지칭한다. 예를 들어, 상기 서열은 비교창, 또는 서열 비교 알고리즘을 사용하여 측정된 바와 같은 지정된 영역에 걸쳐 또는 수동 정렬 및 시각적 검사에 의해 최대의 관련성을 위해 비교 및 정렬시 참조 서열에 대해 명시된 영역에 걸쳐 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91% 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 이상의 동일성의 동일성 퍼센트를 가질 수 있다. 예를 들어, 동일성 퍼센트를, 전체 뉴클레오티드(또는 아미노산 잔기)의 길이 마이너스 임의의 끊김 길이로 나눈 서열 중 일치하는 뉴클레오티드(또는 아미노산 잔기)의 수의 비를 계산함으로써 측정한다.

편의상, 2개 서열간의 동일성 정도를 당해 분야에 공지된 컴퓨터 프로그램 및 수학적 알고리즘을 사용하여 확인할 수 있다. 서열 동일성 퍼센트를 계산하는 상기와 같은 알고리즘은 일반적으로 서열 끊김 및 비교 영역에 걸친 오합치를 설명한다. 클러스탈(Clustal) W(Thompson et al., (1994) Nucleic Acids Res., 22: 4673-4680), 클러스탈 오메가(Clustal Omega)(Sievers et al., (2011) Molecular Systems Biology., 7:539), ALIGN(Myers et al., (1988) CABIOS, 4: 11-17), FASTA(Pearson et al., (1988) PNAS, 85:2444-2448; Pearson (1990), Methods Enzymol., 183: 63-98) 및 끊긴 BLAST(Altschul et al., (1997) Nucleic Acids Res., 25: 3389-3402)와 같은, 서열을 비교 및 정렬하는 프로그램들이 상기 목적에 유용하다. BLAST 또는 BLAST 2.0(Altschul et al., J. Mol. Biol. 215:403-10, 1990)을 다수의 출처, 예를 들어 국립 생물정보 센터(NCBI)로부터 및 인터넷상에서, 서열 분석 프로그램 BLASTP, BLASTN, BLASTX, TBLASTN, 및 TBLASTX와 관련하여 사용하기 위해 입수할 수 있다. 추가적인 정보를 NCBI 웹 사이트에서 찾을 수 있다.

몇몇 실시태양에서, 서열 정렬 및 동일성 퍼센트 계산을 그의 표준, 디폴트 매개변수를 사용하여 BLAST 프로그램으로 측정할 수 있다. 뉴클레오티드 서열 정렬 및 서열 동일성 계산을 위해서, 상기 BLASTN 프로그램을 그의 디폴트 매개변수(끊김 벌점 = 5, 끊김 확장 벌점 = 2, 뉴클레익 합치 = 2, 뉴클레익 오합치 = 3, 예상치 = 10.0, 워드 크기 = 11, 조회 범위 중 최대 합치 = 0)와 함께 사용한다. 몇몇 실시태양에서, 뉴클레오티드 서열 정렬 및 서열 동일성 계산을 위해서, 상기 BLASTN 프로그램을 이들 매개변수(끊김 벌점 = 5, 끊김 확장 벌점 = 2, 뉴클레익 합치 = 1, 뉴클레익 오합치 = 3, 예상치 = 10.0, 워드 크기 = 11)와 함께 사용한다. 폴리펩티드 서열 정렬 및 서열 동일성 계산을 위해서, BLASTP 프로그램을 그의 디폴트 매개변수(정렬 행렬 = BLOSUM62; 끊김 비용: 존재 = 11, 확장 = 1; 조성 조정 = 조건적 조성 조정, 행렬 조정; 예상치 = 10.0; 워드 크기 = 6; 조회 범위 중 최대 합치 = 0)와 함께 사용한다. 한편으로 하기의 프로그램 및 매개변수들이 사용된다: 얼라인 플러스 소프트웨어 오브 클론 매니저 스위트(Align Plus software of Clone Manager Suite), 버전 5(Sci-Ed 소프트웨어); DNA 비교: 전체적인 비교, 표준 선형 채점 행렬, 오합치 벌점 = 2, 끊김 벌점 = 4, 확장 끊김 벌점 = 1. 본 명세서에 기재된 실시태양들에서, 상기 서열 동일성을 디폴트 매개변수들과 함께 BLASTN 또는 BLASTP 프로그램을 사용하여 계산한다. 본 명세서에 기재된 실시태양들에서, 2개 이상 서열의 서열 정렬을 추천된 디폴트 매개변수들을 사용하여 클러스탈 오메가로 수행한다(탈정렬 입력 서열: 없음; Mbed-유사 클러스터링 가이드 트리: 있음; Mbed-유사 클러스터링 반복: 있음; 병행된 반복의 수: 디폴트(0); 최대 가이드 트리 반복: 디폴트; 최대 HMM 반복: 디폴트; 순서: 정렬됨).

6.2 숙주 세포

본 명세서에서 레바우디오시드 A(RebA)로부터 레바우디오시드 D(RebD)를 고효율로 생산할 수 있는 숙주 세포를 제공한다. 몇몇 실시태양에서, 상기 숙주 세포는 출발 물질로서 RebA로부터 RebD를 생산할 수 있다. 바람직한 실시태양에서, 상기 숙주 세포는 배양 배지에서 탄소원으로부터 RebA를 생산할 수 있고 상기 RebA로부터 RebD를 추가로 생산할 수 있다. 특정한 실시태양에서, 상기 숙주 세포는 상기 RebD로부터 레바우디오시드 M(RebM)을 추가로 생산할 수 있다.

특정한 실시태양에서, 상기 숙주 세포는 유리딘 디포스페이트 글리코실트랜스퍼라제 87(UGT40087)의 효소 활성을 포함한다. UGT40087 효소는 RebA를 RebD로 고효율로 전환시킬 수 있다. 몇몇 실시태양에서 UGT40087 효소는 RebA를 RebD로 80% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서 UGT40087 효소는 RebA를 RebD로 85% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서 UGT40087 효소는 RebA를 RebD로 90% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서 UGT40087 효소는 RebA를 RebD로 95% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서 UGT40087 효소는 RebA를 RebD로 96% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서 UGT40087 효소는 RebA를 RebD로 약 97% 효율로 전환시킬 수 있다. 몇몇 실시태양에서 UGT40087 효소는 스테비오시드를 RebE로 전환시킬 수 있다.

몇몇 실시태양에서, 상기 숙주 세포는 RebA를 RebD로 80% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 상기 숙주 세포는 RebA를 RebD로 85% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서 상기 숙주 세포는 RebA를 RebD로 90% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서 상기 숙주 세포는 RebA를 RebD로 95% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서 상기 숙주 세포는 RebA를 RebD로 96% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서 상기 숙주 세포는 RebA를 RebD로 약 97% 효율로 전환시킬 수 있다. 몇몇 실시태양에서 상기 숙주 세포는 스테비오시드를 RebE로 전환시킬 수 있다.

전환 효율을 당해 분야의 숙련가들에게 자명한 임의의 기법에 의해 측정할 수 있다. 몇몇 실시태양에서, 전환 효율을 RebA를 RebD 형성에 적합한 조건하에서 효소 또는 숙주 세포와 접촉시킴으로써 측정할 수 있다. 효율을, 비교되는 생성된 RebD의 몰량을 생성 조성물 중의 RebA 및 RebD의 총량과 비교함으로써 측정할 수 있다. 효율을 또한 RebD 및 RebD의 하류 생성물의 총량을 생성 조성물 중의 RebA, RebD, 및 RebD의 하류 생성물의 총량에 비교함으로써 측정할 수 있다. 예를 들어, 효율을 또한 비교되는 RebD, RebM, 및 RebM2의 총량을 생성 조성물 중의 RebA, RebD, RebM 및 RebM2의 총량에 비교함으로써 측정할 수 있다.

몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열을 포함하는 UGT40087을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 실질적으로 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 60% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 65% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 70% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 75% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 80% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 85% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 90% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 95% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 96% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 97% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 98% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 99% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 60%, 적어도 99%, 또는 적어도 60% 내지 99% 중 임의의 백분율로 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다.

몇몇 실시태양에서, 본 명세서에서 본 명세서에 기재된 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하고 RebA를 RebD로 전환시킬 수 있는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 본 명세서에 기재된 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하고 스테비올 글리코시드의 19-O 글루코스의 C2' 위치에 대해 베타 1,2 글리코실화시킬 수 있는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 RebA를 RebD로 90%, 95%, 96%, 또는 97% 초과 효율로 전환시킬 수 있는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공하며, 여기에서 상기 UDP-글리코실트랜스퍼라제는 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함한다.

몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열을 포함하는 UGT40087을 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 실질적으로 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 60% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 65% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 70% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 75% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 80% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 85% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 90% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 95% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 96% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 97% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 98% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 99% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 60%, 적어도 99%, 또는 60% 내지 99% 중 임의의 백분율로 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다.

몇몇 실시태양에서, 본 명세서에서 서열번호 11의 서열을 갖는 UGT40087을 암호화하는 서열번호 13의 뉴클레오티드 서열을 포함하는 이종 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 13의 뉴클레오티드 서열에 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 일치하는 뉴클레오티드 서열을 포함하는 이종 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 11의 뉴클레오티드 서열에 적어도 90%, 적어도 99%, 또는 60% 내지 99% 중 임의의 백분율로 일치하는 뉴클레오티드 서열을 포함하는 이종 핵산을 포함하는 숙주 세포를 제공한다.

몇몇 실시태양에서, 본 명세서에서 UGT40087의 기능성 도메인을 포함하는 숙주 세포를 제공하며, 여기에서 상기 UGT40087은 서열번호 1 또는 서열번호 11의 아미노산 서열을 포함한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열을 포함하는 UGT40087의 N-말단 당 수용체 도메인을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열을 포함하는 UGT40087의 C-말단 당 공여체 도메인을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, UGT40087의 당 수용체 도메인은 서열번호 11의 대략 아미노산 위치 1 내지 214(서열번호 1의 아미노산 위치 1 내지 215에 상응한다)를 포함한다. 몇몇 실시태양에서, UGT40087의 당 공여체 도메인은 서열번호 11의 대략 아미노산 위치 215 내지 435(서열번호 1의 아미노산 위치 216 내지 436에 상응한다)를 포함한다. 몇몇 실시태양에서, UGT40087의 당 수용체 도메인은 서열번호 1의 대략 아미노산 위치 1 내지 215를 포함한다. 몇몇 실시태양에서, UGT40087의 당 공여체 도메인은 서열번호 1의 대략 아미노산 위치 216 내지 436을 포함한다. 몇몇 실시태양에서, UGT40087의 상기 당 수용체 도메인 및 당 공여체 도메인은 서열번호 11과 관련하여, 각각 1 내지 214 또는 215 내지 435보다 더 좁은 범위의 아미노산 잔기를 포함한다. 몇몇 실시태양에서, UGT40087의 상기 당 수용체 도메인 및 당 공여체 도메인은 서열번호 1과 관련하여, 각각 1 내지 215 또는 216 내지 436보다 더 좁은 범위의 아미노산 잔기를 포함한다.

몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 실질적으로 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 60% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 65% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 70% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 75% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 80% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 85% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 90% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 95% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 96% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 97% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 98% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 99% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 60%, 적어도 99%, 또는 60% 내지 99% 중 임의의 백분율로 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다.

몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열을 포함하는 UGT40087을 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 실질적으로 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 60% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 65% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 70% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 75% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 80% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 85% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 90% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 95% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 96% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 97% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 98% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 99% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다.

몇몇 실시태양에서, UGT40087 및 또 다른 UDP-글리코실트랜스퍼라제의 3차원 모델 구조를 비교 분석시, N 말단 당 수용체 도메인에서 현저한 입체형태적 차이를 갖는 4개의 고리(즉 고리1, 고리2, 고리3 및 고리4)가 밝혀졌다. 도 6 및 실시예 12를 참조하시오. 2개의 UGT간의 상응하는 고리 서열의 교환으로부터의 실험 결과는 UGT40087의 고리1, 고리2, 고리3_1, 고리3_2 및 고리4_1이 RebA를 RebD로 전환시킬 수 있는 다른 UDP-글리코실트랜스퍼라제로부터의 그들 각각의 상응하는 고리 서열로 치환될 수 있음을 가리켰다. 이들 실시태양에서, 2개의 가능한 고리 길이를 설명하기 위해 2가지 버전의 고리3(즉 고리3_1 및 고리3_2) 및 고리4(즉 고리4_1 및 고리4_2)가 설계되었다.

따라서, 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 각각 서열번호 1 또는 서열번호 11의 고리1 위치(loop1 location)에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 UGT40087(즉 서열번호 1 또는 서열번호 11)의 고리1 아미노산 서열을 추가로 포함한다. 몇몇 실시태양에서, 상기 서열번호 1 또는 서열번호 11의 고리1 아미노산 서열은 서열번호 30의 아미노산 서열을 갖는다. 몇몇 실시태양에서, 상기 고리1 아미노산 서열은 서열번호 28의 서열을 갖는다. 몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 각각 서열번호 1 또는 서열번호 11의 고리1 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 변형 고리1 아미노산 서열을 추가로 포함한다. 상기 변형 고리1 아미노산 서열은, 서열번호 1 또는 서열번호 11의 참조 고리1 아미노산 서열 또는 서열번호 28을 갖는 고리1 아미노산 서열과 상이하지만 상기 변형 고리1 아미노산을 포함하는 UDP-글리코실트랜스퍼라제가 RebA를 RebD로 전환시키고/시키거나 스테비오시드를 RebE로 전환시키는 그의 활성을 유지하게 하는 아미노산 서열을 지칭한다.

몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 각각 서열번호 1 또는 서열번호 11의 고리2 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 UGT40087(즉 서열번호 1 또는 서열번호 11)의 고리2 아미노산 서열을 추가로 포함한다. 몇몇 실시태양에서, 상기 서열번호 1 또는 서열번호 1의 고리2 아미노산 서열은 서열번호 19의 아미노산 서열을 갖는다. 몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 각각 서열번호 1 또는 서열번호 11의 고리2 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 변형 고리2 아미노산 서열을 추가로 포함한다. 상기 변형 고리2 아미노산 서열은, 서열번호 1 또는 서열번호 11의 참조 고리2 아미노산 서열과 상이하지만 상기 변형 고리2 아미노산을 포함하는 UDP-글리코실트랜스퍼라제가 RebA를 RebD로 전환시키고/시키거나 스테비오시드를 RebE로 전환시키는 그의 활성을 유지하게 하는 아미노산 서열을 지칭한다.

몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 각각 서열번호 1 또는 서열번호 11의 고리3_1 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 UGT40087(즉 서열번호 1 또는 서열번호 11)의 고리3_1 아미노산 서열을 추가로 포함한다. 몇몇 실시태양에서, 상기 서열번호 1 또는 서열번호 11의 고리3_1 아미노산 서열은 서열번호 20의 아미노산 서열을 갖는다. 몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 각각 서열번호 1 또는 서열번호 11의 고리3_1 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 변형 고리3_1 아미노산 서열을 추가로 포함한다. 상기 변형 고리3_1 아미노산 서열은, 서열번호 1 또는 서열번호 11의 참조 고리3_1 아미노산 서열과 상이하지만 상기 변형 고리3_1 아미노산을 포함하는 UDP-글리코실트랜스퍼라제가 RebA를 RebD로 전환시키고/시키거나 스테비오시드를 RebE로 전환시키는 그의 활성을 유지하게 하는 아미노산 서열을 지칭한다.

몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 각각 서열번호 1 또는 서열번호 11의 고리3_2 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 UGT40087(즉 서열번호 1 또는 서열번호 11)의 고리3_2 아미노산 서열을 추가로 포함한다. 몇몇 실시태양에서, 상기 서열번호 1 또는 서열번호 11의 고리3_2 아미노산 서열은 서열번호 21의 아미노산 서열을 갖는다. 몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 각각 서열번호 1 또는 서열번호 11의 고리3_2 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 변형 고리3_2 아미노산 서열을 추가로 포함한다. 상기 변형 고리3_2 아미노산 서열은, 서열번호 1 또는 서열번호 11의 참조 고리3_2 아미노산 서열과 상이하지만 상기 변형 고리3_2 아미노산을 포함하는 UDP-글리코실트랜스퍼라제가 RebA를 RebD로 전환시키고/시키거나 스테비오시드를 RebE로 전환시키는 그의 활성을 유지하게 하는 아미노산 서열을 지칭한다.

몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 각각 서열번호 1 또는 서열번호 11의 고리4_1 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 UGT40087(즉 서열번호 1 또는 서열번호 11)의 고리4_1 아미노산 서열을 추가로 포함한다. 몇몇 실시태양에서, 상기 서열번호 1 또는 서열번호 11의 고리4_1 아미노산 서열은 서열번호 22의 아미노산 서열을 갖는다. 몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 각각 서열번호 1 또는 서열번호 11의 고리4_1 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 변형 고리4_1 아미노산 서열을 추가로 포함한다. 상기 변형 고리4_1 아미노산 서열은, 서열번호 1 또는 서열번호 11의 참조 고리4_1 아미노산 서열과 상이하지만 상기 변형 고리4_1 아미노산을 포함하는 UDP-글리코실트랜스퍼라제가 RebA를 RebD로 전환시키고/시키거나 스테비오시드를 RebE로 전환시키는 그의 활성을 유지하게 하는 아미노산 서열을 지칭한다.

몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 각각 서열번호 1 또는 서열번호 11의 고리4_2 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 UGT40087(즉 서열번호 1 또는 서열번호 11)의 고리4_2 아미노산 서열을 추가로 포함한다. 상기 서열번호 1 또는 서열번호 11의 고리4_2 아미노산 서열은 서열번호 23의 아미노산 서열을 갖는다.

몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제, 또는 그의 UDP-글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하고, 하기 중 임의의 조합을 추가로 포함하는 숙주 세포를 제공한다:

(a) 각각 서열번호 1 또는 서열번호 11의 고리1 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에, 서열번호 1 또는 서열번호 11의 고리1 아미노산 서열, 서열번호 28의 아미노산 서열, 또는 변형 고리1 아미노산 서열;

(b) 각각 서열번호 1 또는 서열번호 11의 고리2 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에, 서열번호 1 또는 서열번호 11의 고리2 아미노산 서열, 또는 변형 고리2 아미노산 서열;

(c) 각각 서열번호 1 또는 서열번호 11의 고리3_1 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에, 서열번호 1 또는 서열번호 11의 고리3_1 아미노산 서열, 또는 변형 고리3_1 아미노산 서열;

(d) 각각 서열번호 1 또는 서열번호 11의 고리3_2 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에, 서열번호 1 또는 서열번호 11의 고리3_2 아미노산 서열, 또는 변형 고리3_2 아미노산 서열;

(e) 각각 서열번호 1 또는 서열번호 11의 고리4_1 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에, 서열번호 1 또는 서열번호 11의 고리4_1 아미노산 서열, 또는 변형 고리4_1 아미노산 서열; 및

(f) 각각 서열번호 1 또는 서열번호 11의 고리4_2 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에, 서열번호 1 또는 서열번호 11의 고리4_2 아미노산 서열.

몇몇 실시태양에서, RebA를 RebD로 전환시킬 수 있는 UDP-글리코실트랜스퍼라제의 3차원 모델 구조를 비교 분석시, UGT40087의 고리4_1은 또 다른 UDP-글리코실트랜스퍼라제의 상응하는 고리4_1 위치에 통합될 때(및 그의 고유 고리4_1 아미노산 서열의 교체시) RebA를 RebD로 전환시키는 그의 능력의 면에서 변형 DUP-글리코실트랜스퍼라제의 우수한 활성을 유도함을 발견하였다. 실시예 12를 참조하시오. 상기 결과는 임의의 적합한 UDP-글리코실트랜스퍼라제의 고리4_1 아미노산 서열을 서열번호 1 또는 서열번호 11의 고리4_1 아미노산 서열로 치환시켜 RebA를 RebD로 전환시킬 수 있음을 가리킨다.

따라서, 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 61%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하고, UGT40087(즉 서열번호 1 또는 서열번호 11)의 고리4_1 아미노산 서열(즉 서열번호 22)을 추가로 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 61%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하고, 서열번호 1 또는 서열번호 11의 고리4_1 아미노산 서열(즉 서열번호 22)을 추가로 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 서열번호 1 또는 서열번호 11에 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%인 아미노산 서열을 포함하는 임의의 적합한 UDP-글리코실트랜스퍼라제를 사용하여, 그의 상응하는 고리4_1 위치에 서열번호 1 또는 서열번호 11의 고리4_1 아미노산 서열을 통합시킬 수 있다(그의 고유 고리4_1 아미노산 서열을 교체함). 예를 들어 Ob_UGT91B_유사, Hv_UGT_V1, Sl_UGT_101249881, Sr.UGT_g252778, Os_UGT_91C1, Bd_UGT10840, Bd_UGT10850, 또는 Si91D유사를 염기로서 사용하여 그의 상응하는 고리4_1 위치에 서열번호 1 또는 서열번호 11의 고리4_1 아미노산 서열을 통합시킬 수 있다. 몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 서열번호 25의 아미노산 서열을 포함한다.

몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 실질적으로 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 60% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 65% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 70% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 75% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 80% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 85% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 90% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 95% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 96% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 97% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 98% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 99% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다.

몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열을 포함하는 UGT40087을 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 실질적으로 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 60% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 65% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 70% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 75% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 80% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 85% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 90% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 95% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 96% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 97% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 98% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 99% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다.

몇몇 실시태양에서, 상기 N-말단 당 수용체 도메인 및 상기 C-말단 당 공여체 도메인은 재조합하여 기질 특이성 또는 촉매 활성을 변경시켰다. 실시예 11에 상세히 기재된 바와 같이, RebA를 RebD로 전환시킬 수 있는 또 다른 UDP-글리코실트랜스퍼라제로부터의 당 공여체 도메인을 서열번호 1 또는 서열번호 11의 당 수용체 도메인과 재조합시켰을 때, 상기 키메릭 UDP-글리코실트랜스퍼라제는 RebA를 RebD로 전환시키는 그의 능력을 유지하는 것으로 밝혀졌다.

따라서, 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하는 숙주 세포를 제공한다. 실시예 11에 나타낸 바와 같이, 상기 C-말단 당 공여체 도메인은 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%의 서열 동일성을 포함하는 다른 UDP-글리코실트랜스퍼라제와 상대적으로 교환 가능하다. 몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 다른 UDP-글리코실트랜스퍼라제로부터의 C-말단 당 공여체 도메인을 추가로 포함한다. 적합한 C-말단 당 공여체 도메인을 갖는 다른 UDP-글리코실트랜스퍼라제의 예는 Ob_UGT91B_유사, Hv_UGT_V1, SI_UGT_101249881, Sr.UGT_g252778, Os_UGT_91C1, Bd_UGT10840, Bd_UGT10850, 또는 Si91D유사를 포함한다.

몇몇 실시태양에서, 상기 N-말단 당 수용체 도메인 중의 몇몇 아미노산 잔기는 비-기능성의 추정적인 UDP-글리코실트랜스퍼라제의 촉매 활성을 활성의 UDP-글리코실트랜스퍼라제로 복원시킬 수 있음이 발견되었다. 따라서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 아미노산 서열을 포함하고, 하기의 아미노산 잔기 중 하나 이상을 추가로 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공하며:

(a) 서열번호 11의 아미노산 위치 11에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 발린;

(b) 서열번호 11의 아미노산 위치 12에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 이소류신;

(c) 서열번호 11의 아미노산 위치 55에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 프롤린;

(d) 서열번호 11의 아미노산 위치 90에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 글루탐산;

(e) 서열번호 11의 아미노산 위치 203에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 세린;

(f) 서열번호 11의 아미노산 위치 223에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 글루탐산; 또는

(g) 서열번호 11의 아미노산 위치 413에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 발린,

여기에서 상기 서열번호 11의 아미노산 위치에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치들은 서열 정렬에 의해 측정된다.

몇몇 실시태양에서, 본 명세서에서 서열번호 24의 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다.

몇몇 실시태양에서, 상기 숙주 세포는 상술한 UGT40087 폴리펩티드의 변체를 포함한다. 몇몇 실시태양에서, 상기 변체는 상기 UGT40087 폴리펩티드에 대해 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 아미노산 치환을 포함할 수 있다. 몇몇 실시태양에서, 상기 변체는 상기 UGT40087 폴리펩티드에 대해 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1 개 이하의 보존적 아미노산 치환을 포함할 수 있다. 몇몇 실시태양에서, 본 명세서에 기재된 핵산 중 어느 하나를 숙주 세포에 대해 최적화할 수 있다, 예를 들어 코돈 최적화할 수 있다.

본 명세서에 기재된 실시태양에서, 임의의 적합한 방법을 사용하여 2개의 폴리펩티드의 상응하는 아미노산 위치 또는 상응하는 고리 위치를 측정할 수 있다. 몇몇 실시태양에서, UDP-글리코실트랜스퍼라제 및 참조 서열 서열번호 11의 서열들을 디폴트 매개변수를 사용하여 클러스탈 오메가로 정렬시킬 수 있다. 다른 실시태양에서, UDP-글리코실트랜스퍼라제 및 참조 서열 서열번호 11의 서열들을 SWISS-MODEL(상기는 단백질 구조 상동성-모델링 서버이며, ExPASy 웹 서버를 통해 또는 프로그램 DeepView(Swiss Pdb-Viewer)로부터 입수할 수 있다)과 같은 구조 정렬을 사용하여 정렬시킬 수 있다.

서열번호 11을 UDP-글리코실트랜스퍼라제에 대한 상응하는 아미노산 위치 또는 고리 위치의 측정을 위한 참조 서열이라 칭하지만, 몇몇 실시태양에서 서열번호 1을 또한 서열 정렬을 위한 참조 서열로서 사용할 수 있다.

몇몇 실시태양에서, RebA는 도 1A에 나타낸 바와 같다. 몇몇 실시태양에서, UGT40087 또는 변형 UGT40087은 도 1A에 나타낸 바와 같이 RebA의 19-O-글루코스의 C-2' 위치에 대해 β 결합을 형성하여 RebD를 생성시키는 당 잔기의 반응을 촉매화할 수 있다. 몇몇 실시태양에서, 상기 UGT40087 또는 변형 UGT40087은 RebA의 19-O-글루코스의 C-2' 위치에 대한, β 형성에서, 헥소스 잔기의 반응을 촉매화할 수 있다. 몇몇 실시태양에서, 상기 UGT40087은 RebA의 19-O-글루코스의 C-2' 위치에 대한, β 형성에서, 글루코스 잔기의 반응을 촉매화할 수 있다.

몇몇 실시태양에서, RebE는 도 2B에 나타낸 바와 같다. 몇몇 실시태양에서, UGT40087 또는 변형 UGT40087은 도 2B에 나타낸 바와 같이 스테비오시드의 19-O-글루코스의 C-2' 위치에 대해 β 결합을 형성하여 RebE를 생성시키는 당 잔기의 반응을 촉매화할 수 있다. 몇몇 실시태양에서, 상기 UGT40087 또는 변형 UGT40087은 스테비오시드의 19-O-글루코스의 C-2' 위치에 대한, β 형성에서, 헥소스 잔기의 반응을 촉매화할 수 있다. 몇몇 실시태양에서, 상기 UGT40087 또는 변형 UGT40087은 스테비오시드의 19-O-글루코스의 C-2' 위치에 대한, β 형성에서, 글루코스 잔기의 반응을 촉매화할 수 있다.

몇몇 실시태양에서, UGT40087 또는 변형 UGT40087은 스테비올모노시드(즉 13-O-스테비올 글리코시드)에의 제2 당 부분의 첨가 반응을 검출 가능한 수준으로 촉매화하지 않는다. 몇몇 실시태양에서, 상기 UGT40087 또는 변형 UGT40087은 루부소시드(즉 19-O-스테비올 글리코시드)에의 제2 당 부분의 첨가 반응을 검출 가능한 수준으로 촉매화하지 않는다.

몇몇 실시태양에서, RebD는 도 1A에 나타낸 바와 같다. 몇몇 실시태양에서, 상기 숙주 세포는 RebA를 RebD로 전환시킬 수 있는 하나 이상의 효소를 추가로 포함한다. 몇몇 실시태양에서, 상기 숙주 세포는 RebA의 RebD로의 전환을 위해 UGT40087 및/또는 변형 UGT40087을 포함한다.

몇몇 실시태양에서, UGT76G1은 도 1A에 나타낸 바와 같이 RebD를 RebM으로 전환시키는 당 잔기의 반응을 촉매화할 수 있다. 몇몇 실시태양에서, 상기 숙주 세포는 RebD를 RebM으로 전환시킬 수 있는 하나 이상의 효소를 추가로 포함한다. 몇몇 실시태양에서, 상기 숙주 세포는 RebD를 RebM으로 전환시킬 수 있는 UGT76G1을 추가로 포함한다.

몇몇 실시태양에서, RebM2는 도 1B에 나타낸 바와 같다. RebM2는 도 1B에 나타낸 바와 같이 단일의 잘못된 글루코스 결합을 갖는 RebM의 이성질체이다. RebM2는 19번 탄소 위치(COOH)에 RebM에 대한 목적하는 Glcβ(1-2)[Glcβ(1-3)]Glcβ1 대신에 Glcβ(1-2)[Glcβ(1-6)]Glcβ1을 갖는다.

숙련가들은 몇몇 용도에서 RebM2가 바람직하지 못한 부산물일 수도 있음을 알 것이다. 유리하게, 몇몇 실시태양에서, 본 명세서에서 제공된 상기 UGT40087(또는 변형 UGT40087) 및 숙주 세포는 RebM2를 거의 또는 전혀 생산할 수 없다. 상기 RebM2의 양을 RebM 대 RebM2의 비로서 나타낼 수 있다. 몇몇 실시태양에서 RebM 대 RebM2의 비는 적어도 2:1이다. 몇몇 실시태양에서 RebM 대 RebM2의 비는 적어도 3:1이다. 몇몇 실시태양에서 RebM 대 RebM2의 비는 적어도 4:1이다. 몇몇 실시태양에서 RebM 대 RebM2의 비는 적어도 5:1이다. 몇몇 실시태양에서 RebM 대 RebM2의 비는 적어도 10:1이다. 몇몇 실시태양에서 RebM 대 RebM2의 비는 적어도 100:1이다. 몇몇 실시태양에서 RebM 대 RebM2의 비는 적어도 1000:1이다. 몇몇 실시태양에서 RebM 대 RebM2의 비는 적어도 10000:1이다. 몇몇 실시태양에서, 본 명세서에서 제공된 상기 UGT40087(또는 변형 UGT40087) 및 숙주 세포는 RebM2를 검출할 수 없는 수준으로 생산한다.

상기 숙주 세포의 UGT40087 또는 임의의 변형 UGT40087은 기질로서 RebA를 수용하지만, RebA의 공급원은 숙련가들에게 적합한 것으로 여겨지는 임의의 공급원일 수 있다. 몇몇 실시태양에서, 상기 UGT40087 또는 임의의 변형 UGT40087을 RebA와 접촉시킬 수 있다. 몇몇 실시태양에서, 상기 숙주 세포를 RebA와 접촉시킬 수 있다. 몇몇 실시태양에서, 상기 UGT40087 또는 UGT40087의 임의의 변체를 하나 이상의 스테비올 글리코시드를 포함하는 조성물과 접촉시킬 수 있다. 몇몇 실시태양에서, 상기 조성물은 RebA를 포함한다. 몇몇 실시태양에서, 상기 조성물은 스테비오시드를 포함한다. 몇몇 실시태양에서, 상기 조성물은 스테비아 레바우디아나 잎으로부터 단리된 천연 생성물로부터 유래된다. 몇몇 실시태양에서, 상기 조성물은 미생물에 의해 유래된다. 몇몇 실시태양에서, 상기 숙주 세포를 하나 이상의 스테비올 글리코시드를 포함하는 조성물과 접촉시킬 수 있다.

몇몇 실시태양에서, 목적하는 반응을 촉매화하기에 적합한 임의의 변형 UGT40087을 당해 분야에 공지된 임의의 적합한 방법에 의해 선별할 수 있다. 예를 들어, 적합한 변형 UGT40087을, 변형 UGT40087을 암호화하는 이종 핵산을 발현시키고 기질의 목적하는 위치(예를 들어 스테비올 글리코시드 또는 다른 기질의 19-O-글루코스의 C2' 위치)에서 당을 첨가할 수 있는 기능성 변형 UGT40087을 생산하는 세포를 선별함으로써 분석할 수 있다. 예시적인 선별 방법들을 하기 실시예 3 내지 7에 기재한다. 또 다른 예에서, 적합한 변형 UGT40087을, 변형 UGT40087을 RebA와 같은 기질과 접촉시킴으로써 시험관내에서 선별할 수 있다. 상기 예에서, RebD의 존재에 대한 분석을, 변형 UGT40087이 적합한 효소인지의 여부를 결정하기 위한 시험으로서 사용할 수 있다. 상기 반응을 LC-MS 또는 당해 분야에 공지된 다른 방법들에 의해 분석할 수 있다. 예를 들어 WO 2013/022989를 참조하시오.

몇몇 실시태양에서, 변형 UGT40087이 생체내에서 RebA를 RebD로 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 또는 97% 초과 효율로 전환시킬 수 있는 경우 상기는 RebA를 RebD로(또는 글리코실화에 의해 임의의 적합한 기질로부터 그의 생성물로) 전환시키기에 적합한 것으로 간주된다.

일부 실시태양에서, 본 출원에서 발견되는 다른 적합한 UDP-글리코실트랜스퍼라제를 UGT40087 외에 또는 상기에 대한 대안으로 사용할 수 있다. 여기에는 예를 들어 UDP-글리코실트랜스퍼라제 sr.UGT_9252778, Bd_UGT10840, Hv_UGT_V1, Bd_UGT10850, 및 Ob_UGT91B1_유사가 포함된다. 몇몇 실시태양에서 UDP-글리코실트랜스퍼라제 sr.UGT_9252778은 서열번호 2를 포함한다. 몇몇 실시태양에서 UDP-글리코실트랜스퍼라제 Bd_UGT10840은 서열번호 3을 포함한다. 몇몇 실시태양에서 UDP-글리코실트랜스퍼라제 Hv_UGT_V1은 서열번호 4를 포함한다. 몇몇 실시태양에서 UDP-글리코실트랜스퍼라제 Bd_UGT10850은 서열번호 5를 포함한다. 몇몇 실시태양에서 UDP-글리코실트랜스퍼라제 Ob_UGT91B1_유사는 서열번호 6을 포함한다. 본 명세서에 기재된 UGT40087에 적합한 조성물 및 방법에 관한 임의의 논의를 또한 이들 다른 UDP-글리코실트랜스퍼라제에도 적용할 수 있다.

예를 들어, 일부 실시태양에서, 상기 숙주 세포는 유리딘 디포스페이트 글리코실트랜스퍼라제 sr.UGT_9252778, Bd_UGT10840, Hv_UGT_V1, Bd_UGT10850, 및/또는 Ob_UGT91B1_유사의 효소 활성을 포함한다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 40% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 45% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 50% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 55% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 60% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 65% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 70% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 75% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 80% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 85% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 90% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 95% 초과 효율로 전환시킬 수 있다.

몇몇 실시태양에서, 본 명세서에서 각각 서열번호 2, 3, 4, 5 또는 6의 아미노산 서열을 포함하는 sr.UGT_9252778, Bd_UGT10840, Hv_UGT_V1, Bd_UGT10850, 및/또는 Ob_UGT91B1_유사 중 임의의 하나 이상을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 2, 3, 4, 5 또는 6의 아미노산 서열에 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다.

유리한 실시태양에서, 상기 숙주 세포는 RebA를 생성시킬 수 있는 하나 이상의 효소 경로를 포함할 수 있으며, 상기 경로는 개별적으로 또는 함께 고려된다. 몇몇 실시태양에서, 상기 숙주 세포는 제라닐제라닐 디포스페이트를 RebA로 전환시킬 수 있는 하나 이상의 효소를 포함한다. 유용한 효소 및 상기 효소를 암호화하는 핵산은 당해 분야의 숙련가들에게 공지되어 있다. 특히 유용한 효소 및 핵산들이 하기의 섹션들에 기재되어 있으며 예를 들어 US 2014/0329281 A1, US 2014/0357588 A1, US 2015/0159188, WO 2016/038095 A2, 및 US 2016/0198748 A1에 추가로 기재되어 있다.

추가의 실시태양에서, 상기 숙주 세포는 탄소원으로부터 제라닐제라닐 디포스페이트를 생성시킬 수 있는 하나 이상의 효소를 추가로 포함한다. 여기에는 DXP 경로의 효소들 및 MEV 경로의 효소들이 포함된다. 유용한 효소 및 상기 효소를 암호화하는 핵산은 당해 분야의 숙련가들에게 공지되어 있다. 각 경로의 예시적인 효소들은 하기에 기재되어 있으며 예를 들어 US 2016/0177341 A1에 추가로 기재되어 있다. MEV 경로를 또한 도 1C에 나타낸다.

몇몇 실시태양에서, 상기 추가적인 효소들은 고유하다. 유리한 실시태양에서, 상기 추가적인 효소들은 이종성이다. 몇몇 실시태양에서, 2개의 효소가 하나의 폴리펩티드로 조합될 수 있다.

6.3 비-천연 UDP-글리코실트랜스퍼라제 폴리펩티드 및 핵산

또 다른 태양에서, 본 명세서는 참조 서열(예를 들어 서열번호 1)에 비해 아미노산 잔기의 변형(들)을 포함하고 UDP-글리코실트랜스퍼라제로서 RebA를 RebD로 및/또는 스테비오시드로부터 RebE로 전환시키는 활성을 여전히 유지하는 비-천연, 변형 UDP-글리코실트랜스퍼라제를 제공한다. 몇몇 실시태양에서, 비-천연, 변형 UDP-글리코실트랜스퍼라제는 참조 서열(예를 들어 서열번호 1 또는 서열번호 11)에 비해 몇몇 아미노산 위치 또는 장소에서 30, 25, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 아미노산 치환, 결실, 부가, 및/또는 삽입을 포함할 수 있다. 몇몇 실시태양에서, 비-천연, 변형 UDP-글리코실트랜스퍼라제는 본 명세서에 기재된 변형 UDP-글리코실트랜스퍼라제 중 어느 하나, 특히 섹션 6.2에 기재된 것들을 포함한다.

또 다른 태양에서, 본 명세서는 참조 서열(예를 들어 서열번호 26)에 비해 핵산 잔기의 변형(들)을 포함하고, 단백질로 번역시, 상기 단백질이 UDP-글리코실트랜스퍼라제로서 RebA를 RebD로 및/또는 스테비오시드를 RebE로 전환시키는 활성을 유지하는 비-천연, 변형 UDP-글리코실트랜스퍼라제를 제공한다. 몇몇 실시태양에서, 비-천연, 변형 UDP-글리코실트랜스퍼라제는 본 명세서에 기재된 변형 UDP-글리코실트랜스퍼라제 중 어느 하나, 특히 섹션 6.2에 기재된 것들을 암호화할 수 있다.

6.4 세포 균주

본 명세서에 제공된 조성물 및 방법에 유용한 숙주 세포는 고세균, 원핵 또는 진핵 세포를 포함한다.

적합한 원핵생물 숙주는 비제한적으로 다양한 그람-양성, 그람-음성, 또는 그람-가변성 세균 중 어느 하나를 포함한다. 예로서 비제한적으로 하기 속에 속하는 세포들을 포함한다: 아그로박테리움(Agrobacterium), 알리시클로바실러스(Alicyclobacillus), 아나바에나(Anabaena), 아나시스티스(Anacystis), 아르쓰로박터(Arthrobacter), 아조박터(Azobacter), 바실러스(Bacillus), 브레비박테리움(Brevibacterium), 크로마티움(Chromatium), 클로스트리디움(Clostridium), 코리네박테리움(Corynebacterium), 엔테로박터(Enterobacter), 에르위니아(Erwinia), 에스케리키아(Escherichia), 락토바실러스(Lactobacillus), 락토코커스(Lactococcus), 메소리조비움(Mesorhizobium), 메틸로박테리움(Methylobacterium), 미크로박테리움(Microbacterium), 포르미디움(Phormidium), 슈도모나스(Pseudomonas), 로도박터(Rhodobacter), 로도슈도모나스(Rhodopseudomonas), 로도스피릴룸(Rhodospirillum), 로도코커스(Rhodococcus), 살모넬라(Salmonella), 세네데스문(Scenedesmun), 세라티아(Serratia), 시겔라(Shigella), 스타필로코커스(Staphlococcus), 스트렙토마이세스(Strepromyces), 시네코커스(Synnecoccus) 및 지모모나스(Zymomonas). 원핵생물 균주의 예는 비제한적으로 바실러스 서브틸리스(Bacillus subtilis), 바실러스 아밀로리쿠에파시엔스(Bacillus amyloliquefacines), 브레비박테리움 암모니아게네스(Brevibacterium ammoniagenes), 브레비박테리움 임마리오필룸(Brevibacterium immariophilum), 클로스트리디움 베이제린키이(Clostridium beigerinckii), 엔테로박터 사카자키이(Enterobacter sakazakii), 에스케리키아 콜라이(Escherichia coli), 락토코커스 락티스(Lactococcus lactis), 메소리조비움 로티(Mesorhizobium loti), 슈도모나스 아에루기노사(Pseudomonas aeruginosa), 슈도모나스 메발로니이(Pseudomonas mevalonii), 슈도모나스 푸디카(Pseudomonas pudica), 로도박터 캅슐라투스(Rhodobacter capsulatus), 로도박터 스파에로이데스(Rhodobacter sphaeroides), 로도스피릴룸 루브룸(Rhodospirillum rubrum), 살모넬라 엔테리카(Salmonella enterica), 살모넬라 티피(Salmonella typhi), 살모넬라 티피무리움(Salmonella typhimurium), 시겔라 디센테리아에(Shigella dysenteriae), 시겔라 플렉스네리(Shigella flexneri), 시겔라 손네이(Shigella sonnei) 및 스타필로코커스 아우레우스(Staphylococcus aureus)를 포함한다. 특정한 실시태양에서, 상기 숙주 세포는 에스케리키아 콜라이 세포이다.

적합한 고세균 숙주는 비제한적으로 하기 속에 속하는 세포들을 포함한다: 아에로피룸(Aeropyrum), 알카에글로부스(Archaeglobus), 할로박테리움(Halobacterium), 메타노코커스(Methanococcus), 메타노박테리움(Methanobacterium), 피로코커스(Pyrococcus), 설포로부스(Sulfolobus) 및 써모플라스마(Thermoplasma). 고세균 균주의 예는 비제한적으로 하기를 포함한다: 알카에오글로부스 풀기두스(Archaeoglobus fulgidus), 할로박테리움 스페시즈(Halobacterium sp.), 메타노코커스 자나스키이(Methanococcus jannaschii), 메타노박테리움 써모아우토트로피쿰(Methanobacterium thermoautotrophicum), 써모플라스마 아시도필룸(Thermoplasma acidophilum), 써모플라스마 볼카니움(Thermoplasma volcanium), 피로코커스 호리코시이(Pyrococcus horikoshii), 피로코커스 아비씨(Pyrococcus abyssi) 및 아에로피룸 페르닉스(Aeropyrum pernix).

적합한 진핵생물 숙주는 비제한적으로 진균 세포, 조류 세포(algal cell), 곤충 세포, 및 식물 세포를 포함한다. 일부 실시태양에서, 본 방법에 유용한 효모는 미생물 기탁기관(예를 들어 IFO, ATCC 등)에 기탁되었으며 특히 하기 속에 속한 효모를 포함한다: 아시쿨로코니디움(Aciculoconidium), 암브로시오지마(Ambrosiozyma), 아르쓰로아스쿠스(Arthroascus), 아르시오지마(Arxiozyma), 아쉬비야(Ashbya), 바브제비아(Babjevia), 벤싱토니아(Bensingtonia), 보트리오아스쿠스(Botryoascus), 보트리오지마(Botryozyma), 브레타노마이세스(Brettanomyces), 불레라(Bullera), 불레로마이세스(Bulleromyces), 칸디다(Candida), 시테로마이세스(Citeromyces), 클라비스포라(Clavispora), 크립토코커스(Cryptococcus), 시스토필로바시디움(Cystofilobasidium), 데바리오마이세스(Debaryomyces), 덱카라(Dekkara), 디포다스코프시스(Dipodascopsis), 디포다스쿠스(Dipodascus), 에에니엘라(Eeniella), 엔도마이코프셀라(Endomycopsella), 에레마스쿠스(Eremascus), 에레모쎄시움(Eremothecium), 에리쓰로바시디움(Erythrobasidium), 펠로마이세스(Fellomyces), 필로바시디움(Filobasidium), 갈락토마이세스(Galactomyces), 제오트리쿰(Geotrichum), 귈리에르몬델라(Guilliermondella), 한세니아스포라(Hanseniaspora), 한세눌라(Hansenula), 하세가와에아(Hasegawaea), 홀테르마니아(Holtermannia), 호르모아스쿠스(Hormoascus), 히포피키아(Hyphopichia), 이싸트켄키아(Issatchenkia), 클로에케라(Kloeckera), 클로에케라스포라(Kloeckeraspora), 글루이베로마이세스(Kluyveromyces), 콘도아(Kondoa), 쿠라이시아(Kuraishia), 쿠르츠마노마이세스(Kurtzmanomyces), 류코스포리디움(Leucosporidium), 리포마이세스(Lipomyces), 로데로마이세스(Lodderomyces), 말라세지아(Malassezia), 메츠크니코위아(Metschnikowia), 므라키아(Mrakia), 믹소지마(Myxozyma), 나드소니아(Nadsonia), 나카자와에아(Nakazawaea), 네마토스포라(Nematospora), 오가타에아(Ogataea), 오오스포리디움(Oosporidium), 파키소렌(Pachysolen), 파키티코스포라(Phachytichospora), 파피아(Phaffia), 피키아(Pichia), 로도스포리디움(Rhodosporidium), 로도토루라(Rhodotorula), 사카로마이세스(Saccharomyces), 사카로마이코데스(Saccharomycodes), 사카로마이코프시스(Saccharomycopsis), 사이토엘라(Saitoella), 사카구치아(Sakaguchia), 사투르노스포라(Saturnospora), 스키조블라스토스포리온(Schizoblastosporion), 스키조사카로마이세스(Schizosaccharomyces), 슈와니오마이세스(Schwanniomyces), 스포리디오볼루스(Sporidiobolus), 스포로볼로마이세스(Sporobolomyces), 스포로파키데르미아(Sporopachydermia), 스테파노아스쿠스(Stephanoascus), 스테리그마토마이세스(Sterigmatomyces), 스테리그마토스포리디움(Sterigmatosporidium), 심비오타프리나(Symbiotaphrina), 심포디오마이세스(Sympodiomyces), 심포디오마이코프시스(Sympodiomycopsis), 토룰라스포라(Torulaspora), 트리코스포리엘라(Trichosporiella), 트리코스포론(Trichosporon), 트리고노프시스(Trigonopsis), 추키야에아(Tsuchiyaea), 우데니오마이세스(Udeniomyces), 왈토마이세스(Waltomyces), 위케라미아(Wickerhamia), 위케라미엘라(Wickerhamiella), 윌리오프시스(Williopsis), 야마다지마(Yamadazyma), 야로위아(Yarrowia), 지고아스쿠스(Zygoascus), 지고사카로마이세스(Zygosaccharomyces), 지고윌리오프시스(Zygowilliopsis) 및 지고지마(Zygozyma).

일부 실시태양에서, 상기 숙주 미생물은 사카로마이세스 세레비지아에(Saccharomyces cerevisiae), 피키아 파스토리스(Pichia pastoris), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 데케라 브룩셀렌시스(Dekkera bruxellensis), 클루이베로마이세스 락티스(Kluyveromyces lactis(이전에는 사카로마이세스 락티스라 지칭되었다), 클루이베로마이세스 마르시아누스(Kluveromyces marxianus), 아룩슐라 아데니니보란스(Arxula adeninivorans) 또는 한세눌라 폴리모르파(Hansenula polymorpha)(현재 피키아 안구스타(Pichia angusta)로서 공지됨)이다. 일부 실시태양에서, 상기 숙주 미생물은 칸디다 속의 균주, 예를 들어 칸디다 리포리티카(Candida lipolytica), 칸디다 귈리에르몬디이(Candida guilliermondii), 칸디다 크루제이(Candida krusei), 칸디다 슈도트로피칼리스(Candida pseudotropicalis) 또는 칸디다 유틸리스(Candida utilis)이다.

특정한 실시태양에서, 상기 숙주 미생물은 사카로마이세스 세레비지아에이다. 일부 실시태양에서, 상기 숙주는 베이커 효모, CBS 7959, CBS 7960, CBS 7961, CBS 7962, CBS 7963, CBS 7964, IZ-1904, TA, BG-1, CR-1, SA-1, M-26, Y-904, PE-2, PE-5, VR-1, BR-1, BR-2, ME-2, VR-2, MA-3, MA-4, CAT-1, CB-1, NR-1, BT-1, 및 AL-1로 이루어지는 그룹 중에서 선택된 사카로마이세스 세레비지아에의 균주이다. 일부 실시태양에서, 상기 숙주 미생물은 PE-2, CAT-1, VR-1, BG-1, CR-1, 및 SA-1로 이루어지는 그룹 중에서 선택된 사카로마이세스 세레비지아에의 균주이다. 특정한 실시태양에서, 상기 사카로마이세스 세레비지아에의 균주는 PE-2이다. 특정한 실시태양에서, 상기 사카로마이세스 세레비지아에의 균주는 CAT-1이다. 특정한 실시태양에서, 상기 사카로마이세스 세레비지아에의 균주는 BG-1이다.

일부 실시태양에서, 상기 숙주 미생물은 발효 공업에 적합한 미생물이다. 특정한 실시태양에서, 상기 미생물은 발효 공업 환경에 인식되는 스트레스 조건인 높은 용매 농도, 고온, 확장된 기질 이용, 영양소 제한, 당 및 염으로 인한 삼투압, 산도, 설파이트 및 세균 오염, 또는 이들의 조합하에서 유효하도록 조절된다.

6.5 스테비올 및 스테비올 글리코시드 생합성 경로

일부 실시태양에서, 스테비올 생합성 경로 및/또는 스테비올 글리코시드 생합성 경로는, 세포를 상기 경로의 하나 이상의 효소를 암호화하는 폴리뉴클레오티드 및/또는 폴리펩티드를 발현하도록 조작함으로써 본 명세서에 제공된 유전자 변형된 숙주 세포에서 활성화된다. 도 2A는 예시적인 스테비올 생합성 경로를 예시한다. 도 2B는 스테비올로부터 출발하여 다양한 스테비올 글리코시드로의 예시적인 스테비올 글리코시드 생합성 경로를 예시한다.

따라서, 일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 제라닐제라닐 디포스페이트 신타제(GGPPS) 활성을 갖는 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드를 포함한다. 일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 코팔릴 디포스페이트 신타제 또는 ent-코팔릴 피로포스페이트 신타제(CDPS; 또한 ent-코팔릴 피로포스페이트 신타제 또는 CPS라 지칭된다) 활성을 갖는 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드를 포함한다. 일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 카우렌 신타제(KS; 또한 ent-카우렌 신타제라 지칭된다) 활성을 갖는 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드를 포함한다. 일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 카우렌 옥시다제(KO; 또한 ent-카우렌 19-옥시다제라 지칭된다) 활성을 갖는 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드를 포함한다. 일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 스테비올 신타제(또한 ent-카우렌산 13-하이드록실라제 또는 KAH라 지칭된다) 활성을 갖는 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드를 포함한다. 일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 시토크롬 P450 리덕타제(CPR) 활성을 갖는 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드를 포함한다.

일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 UGT74G1 활성을 갖는 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드를 포함한다. 일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 UGT76G1 활성을 갖는 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드를 포함한다. 일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 UGT85C2 활성을 갖는 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드를 포함한다. 일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 UGT91D 활성을 갖는 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드를 포함한다. 일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 UGT40087 활성을 갖는 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드를 포함한다.

몇몇 실시태양에서, 상기 숙주 세포는 변체를 포함한다. 몇몇 실시태양에서, 상기 변체는 관련된 폴리펩티드에 비해 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 아미노산 치환을 포함할 수 있다. 몇몇 실시태양에서, 상기 변체는 참조 폴리펩티드에 비해 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 보존적 아미노산 치환을 포함할 수 있다. 몇몇 실시태양에서, 본 명세서에 기재된 핵산 중 어느 하나를 숙주 세포에 대해 최적화할 수 있다, 예를 들어 코돈 최적화할 수 있다.

스테비올 생합성 경로 및/또는 스테비올 글리코시드 생합성 경로의 예시적인 핵산 및 효소들을 하기에 기재한다.

6.5.1. 제라닐제라닐 디포스페이트 신타제(GGPPS)

제라닐제라닐 디포스페이트 신타제(EC 2.5.1.29)는 파르네실 피로포스페이트의 제라닐제라닐 디포스페이트(또한 제라닐제라닐 피로포스페이트로서 공지됨)로의 전환을 촉매화한다. 효소의 예시적인 예는 스테비아 레바우디아나(Stevia rebaudiana)(수납 번호 ABD92926), 지베렐라 푸지쿠로이(Gibberella fujikuroi)(수납 번호 CAA75568), 무스 무스쿨루스(Mus musculus)(수납 번호 AAH69913), 탈라씨오시라 슈도나나(Thalassiosira pseudonana)(수납 번호 XP_002288339), 스트렙토마이세스 클라불리제루스(Streptomyces clavuligerus)(수납 번호 ZP_05004570), 설풀로부스 아시도칼다리우스(Sulfulobus acidocaldarius)(수납 번호 BAA43200), 시네코코커스 스페시즈(Synechococcus sp.)(수납 번호 ABC98596), 아라비도프시스 탈리아나(Arabidopsis thaliana)(수납 번호 NP_195399), 블라케슬레아 트리스포라(Blakeslea trispora)(수납 번호 AFC92798.1) 및 US 2014/0329281 A1의 효소들을 포함한다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 GGPPS 핵산 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 GGPPS 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다.

6.5.2 코팔릴 디포스페이트 신타제(CDPS)

코팔릴 디포스페이트 신타제(EC 5.5.1.13)는 제라닐제라닐 디포스페이트의 코팔릴 디포스페이트로의 전환을 촉매화한다. 효소의 예시적인 예는 스테비아 레바우디아나(수납 번호 AAB87091), 스트렙토마이세스 클라불리제루스(Streptomyces clavuligerus)(수납 번호 EDY51667), 브라디리조비움 자포니쿰(Bradyrhizobium japonicum)(수납 번호 AAC28895.1), 제아 마이스(Zea mays)(수납 번호 AY562490), 아라비도프시스 탈리아나(수납 번호 NM_116512), 오리자 사티바(Oryza sativa)(수납 번호 Q5MQ85.1) 및 US 2014/0329281 A1의 효소들을 포함한다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 CDPS 핵산 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 CDPS 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다.

6.5.3 카우렌 신타제(KS)

카우렌 신타제(EC 4.2.3.19)는 코팔릴 디포스페이트의 카우렌 및 디포스페이트로의 전환을 촉매화한다. 효소의 예시적인 예는 브라디리조비움 자포니쿰(수납 번호 AAC28895.1), 파에오스파에리아 스페시즈(Phaeosphaeria sp.)(수납 번호 O13284), 아라비도프시스 탈리아나(수납 번호 Q9SAK2), 피세아 글라우카(Picea glauca)(수납 번호 ADB55711.1) 및 US 2014/0329281 A1의 효소들을 포함한다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 KS 핵산 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 KS 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다.

6.5.4 이작용기(bifunctional) 코팔릴 디포스페이트 신타제(CDPS) 및 카우렌 신타제(KS)

CDPS-KS 이작용기 효소(EC 5.5.1.13 및 EC 4.2.3.19)를 또한 사용할 수 있다. 효소의 예시적인 예는 포모프시스 아미그달리(Phomopsis amygdali)(수납 번호 BAG30962), 피스코미트렐라 파텐스(Physcomitrella patens)(수납 번호 BAF61135), 지베렐라 푸지쿠로이(수납 번호 Q9UVY5.1), 및 US 2014/0329281 A1, US 2014/0357588 A1, US 2015/0159188, 및 WO 2016/038095 A2의 효소들을 포함한다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 CDPS-KS 핵산 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 CDPS-KS 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다.

6.5.5 Ent-카우렌 옥시다제(KO)

Ent-카우렌 옥시다제(EC 1.14.13.78; 또한 본 명세서에서 카우렌 옥시다제라 지칭된다)는 카우렌의 카우렌산으로의 전환을 촉매화한다. 효소의 예시적인 예는 오리자 사티바(수납 번호 Q5Z5R4), 지베랄레 푸지쿠로이(수납 번호 O94142), 아라비도프시스 탈리아나(수납 번호 Q93ZB2), 스테비아 레바우디아나(수납 번호 AAQ63464.1), 피숨 사티붐(Pisum sativum)(Uniprot no. Q6XAF4) 및 US 2014/0329281 A1, US 2014/0357588 A1, US 2015/0159188, 및 WO 2016/038095 A2의 효소들을 포함한다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 KO 핵산 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 KO 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다.

6.5.6 스테비올 신타제(KAH)

스테비올 신타제, 또는 카우렌산 하이드록실라제(KAH)(EC 1.14.13)는 카우렌산의 스테비올로의 전환을 촉매화한다. 효소의 예시적인 효소는 스테비아 레바우디아나(수납 번호 ACD93722), 스테비아 레바우디아나(서열번호 10) 아라비도프시스 탈리아나(수납 번호 NP_197872), 비티스 비니페라(Vitis vinifera)(수납 번호 XP_002282091), 메디카고 트룬쿨라타(Medicago trunculata)(수납 번호 ABC59076), 및 US 2014/0329281 A1, US 2014/0357588 A1, US 2015/0159188, 및 WO 2016/038095 A2의 효소들을 포함한다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 KAH 핵산 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 KAH 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다.

6.5.7 시토크롬 P450 리덕타제(CPR)

시토크롬 P450 리덕타제(EC 1.6.2.4)는 상기 KO 및/또는 KAH의 활성을 지원하거나 촉진시킬 수 있다. 효소의 예시적인 예는 스테비아 레바우디아나(수납 번호 ABB88839) 아라비도프시스 탈리아나(수납 번호 NP_194183), 지베렐라 푸지쿠로이(수납 번호 CAE09055), 아르테미시아 안누아(Artemisia annua)(수납 번호 ABC47946.1) 및 US 2014/0329281 A1, US 2014/0357588 A1, US 2015/0159188, 및 WO 2016/038095 A2의 효소들을 포함한다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 CPR 핵산 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 CPR 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다.

6.5.8 UDP 글리코실트랜스퍼라제 74G1(UGT74G1)

UGT74G1은 유리딘 5'-디포스포 글루코실:스테비올 19-COOH 트랜스퍼라제로서 및 유리딘 5'-디포스포 글루코실:스테비올-13-O-글루코시드 19-COOH 트랜스퍼라제로서 기능할 수 있다. 도 2B에 나타낸 바와 같이, UGT74G1은 스테비올을 19-글리코시드로 전환시킬 수 있다. UGT74G1은 또한 스테비올모노시드를 루부소시드로 전환시킬 수 있다. UGT74G1은 또한 스테비올비오시드를 스테비오시드로 전환시킬 수도 있다. 효소의 예시적인 예는 스테비아 레바우디아나의 효소(예를 들어 문헌[Richman et al., 2005, Plant J. 41: 56-67] 및 US 2014/0329281 및 WO 2016/038095 A2 및 수납 번호 AAR06920.1의 효소들)를 포함한다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 UGT74G1 핵산 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 UGT74G1 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다.

6.5.9 UDP 글리코실트랜스퍼라제 76G1(UGT76G1)

UGT76G1은 글루코스 부분을 수용체 분자, 스테비올 1,2 글리코시드의 C-13-O-글루코스의 C-3'로 전달할 수 있다. 따라서, UGT76G1은 유리딘 5'-디포스포 글루코실:스테비올 13-O-1,2 글루코시드 C-3' 글루코실 트랜스퍼라제로서 및 유리딘 5'-디포스포 글루코실:스테비올-19-O-글루코스, 13-O-1,2 비오시드 C-3' 글루코실 트랜스퍼라제로서 기능할 수 있다. 도 2A에 나타낸 바와 같이, UGT76G1은 스테비올비오시드를 RebB로 전환시킬 수 있다. UGT76G1은 또한 스테비오시드를 RebA로 전환시킬 수 있다. UGT76G1은 또한 RebD를 RebM으로 전환시킬 수도 있다. 효소의 예시적인 예는 스테비아 레바우디아나의 효소(예를 들어 문헌[Richman et al., 2005, Plant J. 41: 56-67] 및 US 2014/0329281 A1 및 WO 2016/038095 A2 및 수납 번호 AAR06912.1의 효소들)를 포함한다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 UGT76G1 핵산 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 UGT76G1 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다.

6.5.10. UDP 글리코실트랜스퍼라제 85C2(UGT85C2)

UGT85C2는 유리딘 5'-디포스포 글루코실:스테비올 13-OH 트랜스퍼라제로서 및 유리딘 5'-디포스포 글루코실:스테비올-19-O-글루코스 13-OH 트랜스퍼라제로서 기능할 수 있다. 따라서, 도 2B에 나타낸 바와 같이, UGT85C2는 스테비올을 스테비올모노시드로 전환시킬 수 있고 또한 19-글리코시드를 루부소시드로 전환시킬 수 있다. 효소의 예시적인 예는 스테비아 레바우디아나의 효소(예를 들어 문헌[Richman et al., 2005, Plant J. 41: 56-67] 및 US 2014/0329281 A1 및 WO 2016/038095 A2 및 수납 번호 AAR06916.1의 효소들)를 포함한다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 UGT85C2 핵산 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 UGT85C2 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다.

6.5.11 UDP-글리코실트랜스퍼라제 91D(UGT91D)

UGT91D는 글루코스 부분을 수용체 분자, 스테비올-13-O-글루코스(스테비올모노시드)의 13-O-글루코스의 C-2'로 전달하여 스테비오비오시드를 생성시키는 유리딘 5'-디포스포글루코실:스테비올-13-글루코시드 트랜스퍼라제로서 기능한다. UGT91D는 또한 도 2B에 나타낸 바와 같이 글루코스 부분을 수용체 분자, 루부소시드의 13-O-글루코스의 C-2'로 전달하여 스테비오시드를 제공하는 유리딘 5'-디포스포 글루코실:루부소시드 트랜스퍼라제로서 기능할 수 있다. UGT91D는 또한 도 2B에 나타낸 바와 같이 글루코스 부분을 RebA의 19-O-글루코스의 C-2' 위치로 전달하여 RebD를 생성시킬 수 있다. UGT91D는 또한 UGT91D2, UGT91D2e, 또는 UGT91D-유사3이라 지칭된다. UGT91D 효소의 예시적인 예는 스테비아 레바우디아나의 효소(예를 들어 수납 번호 ACE87855.1, US 2014/0329281 A1, WO 2016/038095 A2, 및 서열번호 7을 갖는 UGT 서열의 효소들)를 포함한다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 UGT91D 핵산 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 UGT91D 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다.

6.5.12 UDP-글리코실트랜스퍼라제 40087(UGT40087)

UGT40087은 도 2B에 나타낸 바와 같이 글루코스 부분을 RebA의 19-O-글루코스의 C-2' 위치로 전달하여 RebD를 생성시킬 수 있다. UGT40087은 또한 글루코스 부분을 스테비오시드의 19-O-글루코스의 C-2' 위치로 전달하여 RebE를 생성시킬 수 있다. UGT40087의 예시적인 예들은 상기 섹션 5.2에 기재되어 있다. 본 명세서에 기재된 임의의 UGT40087 변체를 본 명세서에 기재된 조성물 및 방법에 사용할 수 있다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 UGT40087 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 UGT40087 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 본 명세서에 기재된 UGT40087 변체를 암호화하는 핵산을 제공한다.

6.6 MEV 경로 FPP 및/또는 GGPP 생산

일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 FPP 및/또는 GGPP의 형성에 유용한, MEV 경로의 하나 이상의 이종 효소를 포함한다. 일부 실시태양에서, 상기 MEV 경로의 하나 이상의 효소는 아세틸-CoA를 말로닐-CoA와 축합시켜 아세토아세틸-CoA를 형성시키는 효소를 포함한다. 일부 실시태양에서, 상기 MEV 경로의 하나 이상의 효소는 아세틸-CoA의 2개 분자를 축합시켜 아세토아세틸-CoA를 형성시키는 효소를 포함한다. 일부 실시태양에서, 상기 MEV 경로의 하나 이상의 효소는 아세토아세틸-CoA를 아세틸-CoA와 축합시켜 HMG-CoA를 형성시키는 효소를 포함한다. 일부 실시태양에서, 상기 MEV 경로의 하나 이상의 효소는 HMG-CoA를 메발로네이트로 전환시키는 효소를 포함한다. 일부 실시태양에서, 상기 MEV 경로의 하나 이상의 효소는 메발로네이트를 메발로네이트 5-포스페이트로 인산화시키는 효소를 포함한다. 일부 실시태양에서, 상기 MEV 경로의 하나 이상의 효소는 메발로네이트 5-포스페이트를 메발로네이트 5-피로포스페이트로 전환시키는 효소를 포함한다. 일부 실시태양에서, 상기 MEV 경로의 하나 이상의 효소는 메발로네이트 5-피로포스페이트를 이소펜테닐 피로포스페이트로 전환시키는 효소를 포함한다.

일부 실시태양에서, 상기 MEV 경로의 하나 이상의 효소는 아세틸-CoA 티올라제, 아세토아세틸-CoA 신시타제, HMG-CoA 신타제, HMG-CoA 리덕타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 및 메발로네이트 피로포스페이트 데카복실라제로 이루어지는 그룹 중에서 선택된다. 일부 실시태양에서, 아세토아세틸-CoA의 형성을 촉매화할 수 있는 MEV 경로의 효소에 관하여, 상기 유전자 변형된 숙주 세포는 아세틸-CoA의 2개 분자를 축합시켜 아세토아세틸-CoA를 형성시키는 효소, 예를 들어 아세틸-CoA 티올라제; 또는 아세틸-CoA를 말로닐-CoA와 축합시켜 아세토아세틸-CoA를 형성시키는 효소, 예를 들어 아세토아세틸-CoA 신타제를 포함한다. 일부 실시태양에서, 상기 유전자 변형된 숙주 세포는 아세틸-CoA의 2개 분자를 축합시켜 아세토아세틸-CoA를 형성시키는 효소, 예를 들어 아세틸-CoA 티올라제; 또는 아세틸-CoA를 말로닐-CoA와 축합시켜 아세토아세틸-CoA를 형성시키는 효소, 예를 들어 아세토아세틸-CoA 신타제를 모두 포함한다.

일부 실시태양에서, 상기 숙주 세포는 상기 MEV 경로의 하나 초과의 효소를 암호화하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 일부 실시태양에서, 상기 숙주 세포는 상기 MEV 경로의 2개 효소를 암호화하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 일부 실시태양에서, 상기 숙주 세포는 HMG-CoA를 메발로네이트로 전환시킬 수 있는 효소 및 메발로네이트를 메발로네이트 5-포스페이트로 전환시킬 수 있는 효소를 암호화하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 일부 실시태양에서, 상기 숙주 세포는 상기 MEV 경로의 3개 효소를 암호화하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 일부 실시태양에서, 상기 숙주 세포는 상기 MEV 경로의 4개 효소를 암호화하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 일부 실시태양에서, 상기 숙주 세포는 상기 MEV 경로의 5개 효소를 암호화하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 일부 실시태양에서, 상기 숙주 세포는 상기 MEV 경로의 6개 효소를 암호화하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 일부 실시태양에서, 상기 숙주 세포는 상기 MEV 경로의 7개 효소를 암호화하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 일부 실시태양에서, 상기 숙주 세포는 상기 MEV 경로의 효소들을 모두 암호화하는 다수의 이종 핵산을 포함한다.

일부 실시태양에서, 상기 유전자 변형된 숙주 세포는 이소펜테닐 피로포스페이트(IPP)를 디메틸알릴 피로포스페이트(DMAPP)로 전환시킬 수 있는 효소를 암호화하는 이종 핵산을 추가로 포함한다. 일부 실시태양에서, 상기 유전자 변형된 숙주 세포는 IPP 및/또는 DMAPP 분자를 축합시켜 폴리프레닐 화합물을 형성시킬 수 있는 효소를 암호화하는 이종 핵산을 추가로 포함한다. 일부 실시태양에서, 상기 유전자 변형된 숙주 세포는 IPP 또는 폴리프레닐을 변형시켜 이소프레노이드 화합물, 예를 들어 파르네신을 형성시킬 수 있는 효소를 암호화하는 이종 핵산을 추가로 포함한다.

6.6.1 아세틸-CoA의 아세토아세틸-CoA로의 전환

일부 실시태양에서, 상기 유전자 변형된 숙주 세포는 아세틸-조효소 A의 2개 분자를 축합시켜 아세토아세틸-CoA를 형성시킬 수 있는 효소, 예를 들어 아세틸-CoA 티올라제를 암호화하는 이종 뉴클레오티드 서열을 포함한다. 상기와 같은 효소를 암호화하는 뉴클레오티드 서열의 예시적인 예는 비제한적으로 (NC_000913 REGION: 2324131.2325315; 에스케리키아 콜라이), (D49362; 파라코커스 데니트리피칸스(Paracoccus denitrificans)), 및 (L20428; 사카로마이세스 세레비지아에)를 포함한다.

아세틸-CoA 티올라제는 아세토아세틸-CoA를 생성시키는 아세틸-CoA의 2개 분자의 가역적인 축합을 촉매화하지만, 상기 반응은 열역학적으로 불리하며; 아세토아세틸-CoA 티올분해가 아세토아세틸-CoA 합성보다 유리하다. 아세토아세틸-CoA 신타제(AACS)(교대로 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제; EC 2.3.1.194라고도 지칭됨)는 아세틸-CoA를 말로닐-CoA와 축합시켜 아세토아세틸-CoA를 형성시킨다. 아세틸-CoA 티올라제와 대조적으로, AACS-촉매화된 아세토아세틸-CoA 합성은 말로닐-CoA의 관련된 데카복실화로 인해 필수적으로 에너지-유리한 반응이다. 또한, AACS는 아세토아세틸-CoA에 대해 티올분해 활성을 나타내지 않으며, 따라서 상기 반응은 비가역적이다.

아세틸-CoA 티올라제 및 이종 ADA 및/또는 포스포트랜스아세틸라제(PTA)를 포함하는 숙주 세포에서, 아세토아세틸-CoA 티올분해를 촉진하는 아세틸-CoA 티올라제에 의해 촉매화된 가역적인 반응은 큰 아세틸-CoA 풀(pool)을 생성시킬 수 있다. ADA의 가역적인 활성에 비추어, 상기 아세틸-CoA 풀은 차례로 ADA를, 아세틸-CoA를 아세트알데히드로 전환시키는 역반응을 향해 구동시키고, 이에 의해 아세틸-CoA 생산을 향해 ADA에 의해 제공된 이득을 감소시킬 수 있다. 유사하게, PTA의 활성은 가역적이며, 따라서 큰 아세틸-CoA 풀은 PTA를, 아세틸-CoA를 아세틸 포스페이트로 전환시키는 역반응을 향해 구동시킬 수 있다. 따라서, 일부 실시태양에서, ADA 및 PTA의 순방향 반응을 구동시키는 아세틸-CoA에 강한 끌림을 제공하기 위해서, 본 명세서에 제공된 유전자 변형된 숙주 세포의 MEV 경로는 아세토아세틸-CoA 신타제를 사용하여 아세틸-CoA 및 말로닐-CoA로부터 아세토아세틸-CoA를 형성시킨다.

일부 실시태양에서, 상기 AACS는 스트렙토마이세스 스페시즈 균주 CL190으로부터 유래한다(Okamura et al., Proc Natl Acad Sci USA 107(25):11265-70 (2010). 스트렙토마이세스 스페시즈 균주 CL190의 전형적인 AACS 뉴클레오티드 서열은 수납 번호 AB540131.1을 포함한다. 스트렙토마이세스 스페시즈 균주 CL190의 전형적인 AACS 단백질 서열은 수납 번호 D7URV0, BAJ10048을 포함한다. 본 명세서에 제공된 조성물 및 방법에 유용한 다른 아세토아세틸-CoA 신타제는 비제한적으로 스트렙토마이세스 스페시즈(AB183750; KO-3988 BAD86806); 에스 아눌라투스(S. anulatus) 균주 9663(FN178498; CAX48662); 스트렙토마이세스 스페시즈 KO-3988(AB212624; BAE78983); 액티노플라네스 스페시즈(Actinoplanes sp.) A40644(AB113568; BAD07381); 스트렙토마이세스 스페시즈 C(NZ_ACEW010000640; ZP_05511702); 노카르디오프시스 다쏜빌레이(Nocardiopsis dassonvillei) DSM 43111(NZ_ABUI01000023; ZP_04335288); 마이코박테리움 울세란스(Mycobacterium ulcerans) Agy99(NC_008611; YP_907152); 마이코박테리움 마리눔(Mycobacterium marinum) M(NC_010612; YP_001851502); 스트렙토마이세스 스페시즈 Mg1(NZ_DS570501; ZP_05002626); 스트렙토마이세스 스페시즈 AA4(NZ_ACEV01000037; ZP_05478992); 에스 로세오스포루스(S. roseosporus) NRRL 15998(NZ_ABYB01000295; ZP_04696763); 스트렙토마이세스 스페시즈 ACTE(NZ_ADFD01000030; ZP_06275834); 에스 비리도크로모게네스(S. viridochromogenes) DSM 40736(NZ_ACEZ01000031; ZP_05529691); 프랑키아 스페시즈(Frankia sp.) CcI3 (NC_007777; YP_480101); 노카르디아 브라실리엔시스(Nocardia brasiliensis)(NC_018681; YP_006812440.1); 및 아우스트윅키아 켈로나에(Austwickia chelonae)(NZ_BAGZ01000005; ZP_10950493.1)를 포함한다. 추가적인 적합한 아세토아세틸-CoA 신타제는 미국특허 출원 공보 제 2010/0285549 호 및 제 2011/0281315 호에 기재된 것들을 포함하며, 이들의 내용은 전체가 참고로 인용된다.

본 명세서에 제공된 조성물 및 방법에 또한 유용한 아세토아세틸-CoA 신타제는 본 명세서에 기재된 아세토아세틸-CoA 신타제 중 어느 하나의 "유도체"라고 하는 분자들을 포함한다. 상기와 같은 "유도체"는 하기의 특징들을 갖는다: (1) 상기는 본 명세서에 기재된 아세토아세틸-CoA 신타제 중 어느 하나와 상당한 상동성을 공유하고; (2) 상기는 아세틸-CoA와 말로닐-CoA와의 비가역적인 축합을 촉매화하여 아세토아세틸-CoA를 형성시킬 수 있다. 아세토아세틸-CoA 신타제의 유도체는 상기 유도체의 아미노산 서열이 아세토아세틸-CoA 신타제의 서열과 적어도 80%, 및 보다 바람직하게 적어도 90%, 및 가장 바람직하게 적어도 95% 동일한 경우 아세토아세틸-CoA 신타제와 "상당한 상동성"을 공유한다고 한다.

6.6.2 아세토아세틸-CoA의 HMG-CoA로의 전환

일부 실시태양에서, 상기 숙주 세포는 아세토아세틸-CoA를 아세틸-CoA의 또 다른 분자와 축합시켜 3-하이드록시-3-메틸글루타릴-CoA(HMG-CoA)를 형성시킬 수 있는 효소, 예를 들어 HMG-CoA 신타제를 암호화하는 이종 뉴클레오티드 서열을 포함한다. 상기와 같은 효소를 암호화하는 뉴클레오티드 서열의 예시적인 예는 비제한적으로 (NC_001145. 보체 19061.20536; 사카로마이세스 세레비지아에), (X96617; 사카로마이세스 세레비지아에), (X83882; 아라비도프시스 탈리아나), (AB037907; 키타사토스포라 그리세올라(Kitasatospora griseola)), (BT007302; 호모 사피엔스(Homo sapiens)), 및 (NC_002758, 유전자좌 태그 SAV2546, 유전자ID 1122571; 스타필로코커스 아우레우스(Staphylococcus aureus))를 포함한다.

6.6.3 HMG-CoA의 메발로네이트로의 전환

일부 실시태양에서, 상기 숙주 세포는 HMG-CoA를 메발로네이트로 전환시킬 수 있는 효소, 예를 들어 HMG-CoA 리덕타제를 암호화하는 이종 뉴클레오티드 서열을 포함한다. 일부 실시태양에서, HMG-CoA 리덕타제는 NADH-사용 하이드록시메틸글루타릴-CoA 리덕타제-CoA 리덕타제이다. HMG-CoA 리덕타제(EC 1.1.1.34; EC 1.1.1.88)는 (S)-HMG-CoA의 (R)-메발로네이트로의 환원적 데아실화를 촉매화하며 2개의 부류, I 부류 및 II 부류 HMG로 분류될 수 있다. I 부류는 진핵생물 및 대부분의 고세균으로부터의 효소를 포함하고, II 부류는 몇몇 원핵생물 및 고세균의 HMG-CoA 리덕타제를 포함한다. 상기 서열의 차이 외에, 상기 두 부류의 효소들은 또한 그들의 보조인자 특이성에 관하여 상이하다. NADPH를 독점적으로 사용하는 I 부류 효소와 달리, II 부류 HMG-CoA 리덕타제는 NADPH와 NADH를 식별하는 능력이 서로 다르다. 예를 들어 문헌[Hedl et al., Journal of Bacteriology 186 (7): 1927-1932 (2004)]을 참조하시오. II 부류 HMG-CoA 리덕타제 선택에 대한 보조인자 특이성을 하기에 제공한다.

[표 1]

본 명세서에 제공된 조성물 및 방법에 유용한 HMG-CoA 리덕타제는 보조인자로서 NADH를 사용할 수 있는 HMG-CoA 리덕타제, 예를 들어 피 메발로니이, 에이 풀기두스 또는 에스 아우레우스로부터의 HMG-CoA 리덕타제를 포함한다. 특정한 실시태양에서, 상기 HMG-CoA 리덕타제, 예를 들어 피 메발로니이, 에스 포메로이(S. pomeroyi) 또는 디 아시도보란스(D. acidovorans)로부터의 HMG-CoA 리덕타제는 보조인자로서 오직 NADH만을 사용할 수 있다.

일부 실시태양에서, 상기 NADH-사용 HMG-CoA 리덕타제는 슈도모나스 메발로니이로부터 유래된다. 슈도모나스 메발로니이의 야생형 mvaA 유전자(HMG-CoA 리덕타제(EC 1.1.1.88)를 암호화한다)의 서열은 앞서 기재되었다. 문헌[Beach and Rodwell, J. Bacteriol. 171:2994-3001 (1989)]을 참조하시오. 슈도모나스 메발로니이의 전형적인 mvaA 뉴클레오티드 서열은 수납 번호 M24015를 포함한다. 슈도모나스 메발로니이의 전형적인 HMG-CoA 리덕타제 단백질 서열은 수납 번호 AAA25837, P13702, MVAA_PSEMV를 포함한다.

일부 실시태양에서, 상기 NADH-사용 MHG-CoA 리덕타제는 실리시박터 포메로이(Silicibacter pomeroyi)로부터 유래된다. 실리시박터 포메로이의 전형적인 HMG-CoA 리덕타제 뉴클레오티드 서열은 수납 번호 NC_006569.1을 포함한다. 실리시박터 포메로이의 전형적인 HMG-CoA 리덕타제 단백질 서열은 수납 번호 YP_164994를 포함한다.

일부 실시태양에서, 상기 NADH-사용 HMG-CoA 리덕타제는 델프티아 아시도보란스(Delftia acidovorans)로부터 유래된다. 델프티아 아시도보란스의 전형적인 HMG-CoA 리덕타제 뉴클레오티드 서열은 NC_010002 REGION: 보체(319980..321269)를 포함한다. 델프티아 아시도보란스의 전형적인 HMG-CoA 리덕타제 단백질 서열은 수납 번호 YP_001561318을 포함한다.

일부 실시태양에서, 상기 NADH-사용 HMG-CoA 리덕타제는 솔라눔 투베로숨(Solanum tuberosum)으로부터 유래된다(Crane et al., J. Plant Physiol. 159:1301-1307(2002)).

본 명세서에 제공된 조성물 및 방법에 또한 유용한 NADH-사용 HMG-CoA 리덕타제는 예를 들어 피 메발로니이, 에스 포메로이 및 디 아시도보란스로부터의, 본 명세서에 기재된 NADH-사용 HMG-CoA 리덕타제 중 어느 하나의 "유도체"라고 하는 분자들을 포함한다. 상기와 같은 "유도체"는 하기의 특징들을 갖는다: (1) 상기는 본 명세서에 기재된 NADH-사용 HMG-COA 리덕타제 중 어느 하나와 상당한 상동성을 공유하고; (2) 상기는 보조인자로서 NADH를 우선적으로 사용하면서 (S)-HMG-CoA의 (R)-메발로네이트로의 환원적 데아실화를 촉매화할 수 있다. NADH-사용 HMG-CoA 리덕타제의 유도체는 상기 유도체의 아미노산 서열이 NADH-사용 HMG-CoA 리덕타제의 서열과 적어도 80%, 및 보다 바람직하게 적어도 90%, 및 가장 바람직하게 적어도 95% 동일한 경우 NADH-사용 HMG-CoA 리덕타제와 "상당한 상동성"을 공유한다고 한다.

본 명세서에 사용되는 바와 같이, "NADH-사용"이란 어구는 상기 NADH-사용 HMG-CoA 리덕타제가, 예를 들어 NADPH의 경우보다 NADH에 대해 더 높은 비활성을 나타냄으로써, 보조인자로서 NADPH보다 NADH에 대해 선택성임을 의미한다. 일부 실시태양에서, 보조인자로서 NADH에 대한 선택성을 k _cat ^(NADH)/k _cat ^(NADPH) 비로서 나타낸다. 일부 실시태양에서, 상기 NADH-사용 HMG-CoA 리덕타제는 적어도 5, 10, 15, 20, 25 또는 25 초과의 k _cat ^(NADH)/k _cat ^(NADPH) 비를 갖는다. 일부 실시태양에서, 상기 NADH-사용 HMG-CoA 리덕타제는 NADH를 독점적으로 사용한다. 예를 들어, NADH를 독점적으로 사용하는 NADH-사용 HMG-CoA 리덕타제는 시험관내에서 유일한 보조인자로서 공급되는 NADH와 약간의 활성을 나타며, NADPH가 유일한 보조인자로서 공급되는 경우에는 검출 가능한 활성을 나타내지 않는다. 당해 분야에 공지된 보조인자 특이성의 임의의 측정 방법, 예를 들어 문헌[Kim et al., Protein Science 9:1226-1234 (2000)]; 및 문헌[Wilding et al., J. Bacteriol. 182(18):5147-52 (2000)](이들의 내용은 전체가 참고로 인용된다)에 기재된 방법들을 사용하여 보조인자로서 NADH를 선호하는 HMG-CoA 리덕타제를 식별할 수 있다.

일부 실시태양에서, 상기 NADH-사용 HMG-CoA 리덕타제를, 예를 들어 보조인자-결합 포켓의 부위-지향된 돌연변이유발을 통해 NAPDH보다 NADH에 대해 선택성이도록 조작한다. NADH-선택성 조작 방법은 문헌[Watanabe et al., Microbiology 153:3044-3054 (2007)]에 기재되어 있고, HMG-CoA 리덕타제의 보조인자 선택성 측정 방법은 문헌[Kim et al., Protein Sci. 9:1226-1234 (2000)](이들의 내용은 전체가 본 명세서에 참고로 인용된다)에 기재되어 있다.

일부 실시태양에서, 상기 NADH-사용 HMG-CoA 리덕타제는 메발로네이트 분해 경로를 고유로 포함하는 숙주 종들, 예를 들어 유일한 탄소원으로서 메발로네이트를 이화하는 숙주 종들로부터 유래된다. 이들 실시태양 내에서, 상기 NADH-사용 HMG-CoA 리덕타제(상기는 그의 고유 숙주 세포내에서 내면화된 (R)-메발로네이트의 (S)-HMG-CoA로의 산화적 아실화를 통상적으로 촉매화한다)를 사용하여 유전자 변형된 숙주 세포에서 메발로네이트 생합성 경로를 포함하는 상기 역 반응, 즉 (S)-HMG-CoA의 (R)-메발로네이트로의 환원적 데아실화를 촉매화한다. 유일한 탄소원으로서 메발로네이트상에서 생육할 수 있는 원핵생물들이 하기 문헌들에 기재되었다: Anderson et al., J. Bacteriol, 171(12):6468-6472 (1989); Beach et al., J. Bacteriol. 171:2994-3001 (1989); Bensch et al., J. Biol. Chem. 245:3755-3762; Fimongnari et al., Biochemistry 4:2086-2090 (1965); Siddiqi et al., Biochem. Biophys. Res. Commun. 8:110-113 (1962); Siddiqi et al., J. Bacteriol. 93:207-214 (1967); 및 Takatsuji et al., Biochem. Biophys. Res. Commun.110:187-193 (1983)(이들 문헌의 내용은 전체가 본 명세서에 참고로 인용된다).

본 명세서에 제공된 조성물 및 방법의 일부 실시태양에서, 상기 숙주 세포는 NADH-사용 HMGr 및 NADPH-사용 HMG-CoA 리덕타제를 모두 포함한다. NADPH-사용 HMG-CoA 리덕타제를 암호화하는 뉴클레오티드 서열의 예시적인 예는 비제한적으로 (NM_206548; 드로소필라 멜라노가스테르(Drosophila melanogaster)), (NC_002758, 유전자좌 태그 SAV2545, 유전자ID 1122570; 스타필로코커스 아우레우스(Staphylococcus aureus)), (AB015627; 스트렙토마이세스 스페시즈 KO 3988), (AX128213, 절두된 HMG-CoA 리덕타제를 암호화하는 서열을 제공한다; 사카로마이세스 세레비지아에), 및 (NC_001145: 보체(115734.118898; 사카로마이세스 세레비지아에)를 포함한다.

6.6.4 메발로네이트의 메발로네이트-5-포스페이트로의 전환

일부 실시태양에서, 상기 숙주 세포는 메발로네이트를 메발로네이트 5-포스페이트로 전환시킬 수 있는 효소, 예를 들어 메발로네이트 키나제를 암호화하는 이종 뉴클레오티드 서열을 포함한다. 상기와 같은 효소를 암호화하는 뉴클레오티드 서열의 예시적인 예는 비제한적으로 (L77688; 아라비도프시스 탈리아나) 및 (X55875; 사카로마이세스 세레비지아에)를 포함한다.

6.6.5 메발로네이트-5-포스페이트의 메발로네이트-5-피로포스페이트로의 전환

일부 실시태양에서, 상기 숙주 세포는 메발로네이트 5-포스페이트를 메발로네이트 5-피로포스페이트로 전환시킬 수 있는 효소, 예를 들어 포스포메발로네이트 키나제를 암호화하는 이종 뉴클레오티드 서열을 포함한다. 상기와 같은 효소를 암호화하는 뉴클레오티드 서열의 예시적인 예는 비제한적으로 (AF429385; 헤베아 브라실리엔시스(Hevea brasiliensis), (NM_006556; 호모 사피엔스), 및 (NC_001145. 보체 712315.713670; 사카로마이세스 세레비지아에)를 포함한다.

6.6.6 메발로네이트-5-피로포스페이트의 IPP로의 전환

일부 실시태양에서, 상기 숙주 세포는 메발로네이트-5-피로포스페이트를 이소펜테닐 디포스페이트(IPP)로 전환시킬 수 있는 효소, 예를 들어 메발로네이트 피로포스페이트 데카복실라제를 암호화하는 이종 뉴클레오티드 서열을 포함한다. 상기와 같은 효소를 암호화하는 뉴클레오티드 서열의 예시적인 예는 비제한적으로 (X97557; 사카로마이세스 세레비지아에), (AF290095; 엔테로코커스 파에시움), 및 (U49260; 호모 사피엔스)를 포함한다.

6.6.7 IPP의 DMAPP로의 전환

일부 실시태양에서, 상기 숙주 세포는 MEV 경로를 통해 생성된 IPP를 디메틸알릴 피로포스페이트(DMAPP)로 전환시킬 수 있는 효소, 예를 들어 IPP 이소머라제를 암호화하는 이종 뉴클레오티드 서열을 추가로 포함한다. 상기와 같은 효소를 암호화하는 뉴클레오티드 서열의 예시적인 예는 비제한적으로 (NC_000913, 3031087.3031635; 에스케리키아 콜라이), 및 (AF082326; 하에마토코커스 플루비알리스(Haematococcus pluvialis))를 포함한다.

6.6.8 폴리프레닐 신타제

일부 실시태양에서, 상기 숙주 세포는 IPP 및/또는 DMAPP 분자를 축합시켜 5개 초과의 탄소를 함유하는 폴리프레닐 화합물을 형성시킬 수 있는 폴리프레닐 신타제를 암호화하는 이종 뉴클레오티드 서열을 추가로 포함한다.

일부 실시태양에서, 상기 숙주 세포는 한 분자의 IPP와 한 분자의 DMAPP를 축합시켜 한 분자의 제라닐 피로포스페이트("GPP")를 형성시킬 수 있는 효소, 예를 들어 GPP 신타제를 암호화하는 이종 뉴클레오티드 서열을 포함한다. 상기와 같은 효소를 암호화하는 뉴클레오티드 서열의 예시적인 예는 비제한적으로 하기를 포함한다: (AF513111; 아비에스 그란디스(Abies grandis)), (AF513112; 아비에스 그란디스), (AF513113; 아비에스 그란디스), (AY534686; 안티리눔 마주스(Antirrhinum majus)), (AY534687; 안티리눔 마주스), (Y17376; 아라비도프시스 탈리아나), (AE016877, 유전자좌 AP11092; 바실러스 세레우스(Bacillus cereus); ATCC 14579), (AJ243739; 시트루스 시넨시스(Citrus sinensis)), (AY534745; 클라르키아 브레웨리(Clarkia breweri)), (AY953508; 입스 피니(Ips pini)), (DQ286930; 라이코페르시콘 에스쿨렌툼(Lycopersicon esculentum)), (AF182828; 멘타 엑스 피페리타(Mentha x piperita)), (AF182827; 멘타 엑스 피페리타), (MPI249453; 멘타 엑스 피페리타), (PZE431697, 유전자좌 CAD24425; 파라코커스 제아잔티니파시엔스(Paracoccus zeaxanthinifaciens)), (AY866498; 피크로리자 쿠루아(Picrorhiza kurrooa)), (AY351862; 비티스 비니페라(Vitis vinifera)), 및 (AF203881, 유전자좌 AAF12843; 지모모나스 모빌리스(Zymomonas mobilis)).

일부 실시태양에서, 상기 숙주 세포는 2 분자의 IPP를 한 분자의 DMAPP와 축합시키거나 또는 한 분자의 IPP를 한 분자의 GPP에 가하여 한 분자의 파르네실 피로포스페이트("FPP")를 형성시킬 수 있는 효소, 예를 들어 FPP 신타제를 암호화하는 이종 뉴클레오티드 서열을 포함한다. 상기와 같은 효소를 암호화하는 뉴클레오티드 서열의 예시적인 예는 비제한적으로 (ATU80605; 아라비도프시스 탈리아나), (ATHFPS2R; 아라비도프시스 탈리아나), (AAU36376; 아르테미시아 안누아(Artemisia annua)), (AF461050; 보스 타우루스(Bos taurus)), (D00694; 에스케리키아 콜라이 K-12), (AE009951, 유전자좌 AAL95523; 푸소박테리움 누클레아툼 서브스페시즈 누클레아툼(Fusobacterium nucleatum subsp. nucleatum) ATCC 25586), (GFFPPSGEN; 지베렐라 푸지쿠로이), (CP000009, 유전자좌 AAW60034; 글루코노박터 옥시단스(Gluconobacter oxydans) 621H), (AF019892; 헬리안투스 안누스(Helianthus annuus)), (HUMFAPS; 호모 사피엔스), (KLPFPSQCR; 클루이베로마이세스 락티스), (LAU15777; 루피누스 알부스(Lupinus albus)), (LAU20771; 루피누스 알부스), (AF309508; 무스 무스쿨루스), (NCFPPSGEN; 뉴로스포라 크라싸(Neurospora crassa)), (PAFPS1; 파르테니움 아르젠타툼(Parthenium argentatum)), (PAFPS2; 파르테니움 아르젠타움), (RATFAPS; 라투스 노르베기쿠스(Rattus norvegicus)), (YSCFPP; 사카로마이세스 세레비지아에), (D89104; 스키조사카로마이세스 폼베(Schizosaccharomyces pombe)), (CP000003, 유전자좌 AAT87386; 스트렙토코커스 피오게네스), (CP000017, Locus AAZ51849; 스트렙토코커스 피오게네스), (NC_008022, 유전자좌 YP_598856; 스트렙토코커스 피오게네스 MGAS10270), (NC_008023, 유전자좌 YP_600845; 스트렙토코커스 피오게네스 MGAS2096), (NC_008024, 유전자좌 YP_602832; 스트렙토코커스 피오게네스 MGAS10750), (MZEFPS; 제아 마이스), (AE000657, 유전자좌 AAC06913; 아퀴펙스 아에올리쿠스(Aquifex aeolicus) VF5), (NM_202836; 아라비도프시스 탈리아나), (D84432, 유전자좌 BAA12575; 바실러스 서브틸리스(Bacillus subtilis)), (U12678, 유전자좌 AAC28894; 브래디리조비움 자포니쿰(Bradyrhizobium japonicum) USDA 110), (BACFDPS; 제오바실러스 스테아로써모필루스(Geobacillus stearothermophilus)), (NC_002940, 유전자좌 NP_873754; 하에모필루스 듀크레이(Haemophilus ducreyi) 35000HP), (L42023, 유전자좌 AAC23087; 하에모필루스 인플루엔자에(Haemophilus influenzae) Rd KW20), (J05262; 호모 사피엔스), (YP_395294; 락토바실러스 사케이 서브스페시즈 사케이(Lactobacillus sakei subsp. sakei) 23K), (NC_005823, 유전자좌 YP_000273; 렙토스피라 인테로간스 혈청형 코펜하게니 균주 피오크루즈(Leptospira interrogans serovar Copenhageni str. Fiocruz) L1-130), (AB003187; 미크로코커스 루테우스(Micrococcus luteus)), (NC_002946, 유전자좌 YP_208768; 네이쎄리아 고노로에아에(Neisseria gonorrhoeae) FA 1090), (U00090, 유전자좌 AAB91752; 리조비움 스페시즈(Rhizobium sp.) NGR234), (J05091; 사카로마이세스 세레비지아에), (CP000031, 유전자좌 AAV93568; 실리시박터 포메로이 DSS-3), (AE008481, 유전자좌 AAK99890; 스트렙토코커스 뉴모니아에(Streptococcus pneumoniae) R6), 및 (NC_004556, 유전자좌 NP 779706; 자일렐라 파스티디오사 테메쿨라1(Xylella fastidiosa Temecula1))을 포함한다.

일부 실시태양에서, 상기 숙주 세포는 IPP 및 DMAPP 또는 IPP 및 FPP를 조합하여 제라닐제라닐 피로포스페이트("GGPP")를 형성시킬 수 있는 효소를 암호화하는 이종 뉴클레오티드 서열을 추가로 포함한다. 상기와 같은 효소를 암호화하는 뉴클레오티드 서열의 예시적인 예는 비제한적으로 하기를 포함한다: (ATHGERPYRS; 아라비도프시스 탈리아나), (BT005328; 아라비도프시스 탈리아나), (NM_119845; 아라비도프시스 탈리아나), (NZ_AAJM01000380, 유전자좌 ZP_00743052; 바실러스 튜린지엔시스 혈청형 이스라엘렌시스(Bacillus thuringiensis serovar israelensis), ATCC 35646 sq1563), (CRGGPPS; 카타란투스 로제우스(Catharanthus roseus)), (NZ_AABF02000074, 유전자좌 ZP_00144509; 푸소박테리움 누클레아툼 서브스페시즈 빈센티이(Fusobacterium nucleatum subsp. vincentii), ATCC 49256), (GFGGPPSGN; 지베렐라 푸지쿠로이), (AY371321; 징코 빌로바(Ginkgo biloba)), (AB055496; 헤베아 브라실리엔시스), (AB017971; 호모 사피엔스), (MCI276129; 뮤코르 시르시넬로이데스 에프 루시타니쿠스(Mucor circinelloides f. lusitanicus)), (AB016044; 무스 무스쿨루스(Mus musculus)), (AABX01000298, 유전자좌 NCU01427; 뉴로스포라 크라싸), (NCU20940; 뉴로스포라 크라싸), (NZ_AAKL01000008, 유전자좌 ZP_00943566; 랄스토니아 솔라나세아룸(Ralstonia solanacearum) UW551), (AB118238; 라투스 노르베기쿠스(Rattus norvegicus)), (SCU31632; 사카로마이세스 세레비지아에), (AB016095; 시네코코커스 신장물), (SAGGPS; 시나피스 알바(Sinapis alba)), (SSOGDS; 설포로부스 아시도칼다리우스), (NC_007759, 유전자좌 YP_461832; 신트로푸스 아시디트로피쿠스(Syntrophus aciditrophicus) SB), (NC_006840, 유전자좌 YP_204095; 비브리오 피스케리(Vibrio fischeri) ES114), (NM_112315; 아라비도프시스 탈리아나), (ERWCRTE; 판토에아 아글로메란스(Pantoea agglomerans)), (D90087, 유전자좌 BAA14124; 판토에아 아나나티스(Pantoea ananatis)), (X52291, 유전자좌 CAA36538; 로도박터 캅술라투스(Rhodobacter capsulatus)), (AF195122, 유전자좌 AAF24294; 로도박터 스파에로이데스(Rhodobacter sphaeroides)), 및 (NC_004350, 유전자좌 NP_721015; 스트렙토코커스 뮤탄스(Streptococcus mutans)UA159).

상기 메발로네이트 경로의 효소들의 예를 상기에 기재하지만, 몇몇 실시태양에서 상기 DXP 경로의 효소들을 대안의 또는 추가적인 경로로서 사용하여 본 명세서에 기재된 숙주 세포, 조성물 및 방법에서 DMAPP 및 IPP를 생성시킬 수 있다. 상기 DXP 경로의 효소들을 암호화하는 효소 및 핵산들은 당해 분야에 주지되어 있고 특성화되어 있다. WO 2012/135591 A2.

6.7 스테비올 글리코시드의 생산 방법

또 다른 태양에서, 본 명세서는 본 명세서에 기재된 임의의 UDP-글리코실트랜스퍼라제(예를 들어 UGT40087 또는 임의의 변형 UGT40087)를 사용하여 하나의 스테비올 글리코시드를 또 다른 스테비올 글리코시드로 전환시킴으로서 스테비올 글리코시드를 생산하는 방법을 제공한다. 몇몇 실시태양에서, 본 명세서는 RebA를 RebD로 전환시킬 수 있는, 본 명세서에 기재된 UDP-글리코실트랜스퍼라제 중 어느 하나를 사용하여 RebA를 RebD로 전환시킴을 포함하는 RebD의 생산 방법을 제공한다. 몇몇 실시태양에서, 본 명세서는 RebA를 RebD로 전환시킬 수 있는, 본 명세서에 기재된 UDP-글리코실트랜스퍼라제 중 어느 하나를 사용하여 RebA를 RebD로 전환시킴; 및 RebD를 RebM으로 전환시킬 수 있는 UDP-글리코실트랜스퍼라제를 사용하여 RebD를 RebM으로 전환시킴을 포함하는 RebM의 생산 방법을 제공한다.

몇몇 실시태양에서, 스테비올 글리코시드(예를 들어 RebA 또는 RebD) 또는 스테비올 글리코시드를 포함하는 조성물을 적합한 조건하에서 본 명세서에 기재된 UDP-글리코실트랜스퍼라제 중 어느 하나 및 UDP-당과 접촉시켜 목적하는 스테비올 글리코시드(예를 들어 RebM)를 생산할 수 있다. 상기와 같은 방법을 생체내에서 또는 시험관내에서 수행할 수 있다. 예시적인 UDP-당은 UDP-글리코스, UDP-자일로스 또는 UDP-람노스를 포함한다.

또 다른 태양에서, 본 명세서는 스테비올 글리코시드의 생산 방법을 제공하며, 상기 방법은 (a) 스테비올 글리코시드 화합물 생성에 적합한 조건하에서 탄소원을 갖는 배지 중에서 스테비올 글리코시드를 생산할 수 있는 본 명세서에 기재된 유전자 변형된 숙주 세포 중 어느 하나의 집단을 배양하고; (b) 상기 배지로부터 상기 스테비올 글리코시드 화합물을 회수하는 단계를 포함한다.

일부 실시태양에서, 상기 유전자 변형된 숙주 세포는 하나 이상의 변형을 포함하지 않는 모 세포, 또는 유전자 변형된 숙주 세포의 하나 이상의 변형의 단지 부분집합만을 포함하지만 달리 유전학적으로는 동일한 모 세포에 비해 증가량의 스테비올 글리코시드를 생산한다. 일부 실시태양에서, 상기 증가량은 예를 들어 수율, 생산, 생산성, 세포 배양물의 리터당 그램, 건조 세포 중량의 그램당 밀리그램으로, 세포 배양물 기준 단위 부피에 따라, 단위 건조 세포 중량 기준에 따라, 단위 시간 기준 세포 배양물의 단위 부피에 따라, 또는 단위 시간 기준 단위 건조 세포 중량에 따라 측정시, 적어도 1%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100% 또는 100% 초과이다.

일부 실시태양에서, 상기 숙주 세포는 발효 배지 리터당 약 10 그램 초과의 상승된 수준의 스테비올 글리코시드를 생산한다. 일부 상기와 같은 실시태양에서, 상기 스테비올 글리코시드는 세포 배양물 리터당 약 10 내지 약 50 그램, 세포 배양물 리터당 약 15 그램 초과, 세포 배양물 리터당 약 20 그램 초과, 세포 배양물 리터당 약 25 그램 초과, 세포 배양물 리터당 약 30 그램 초과, 세포 배양물 리터당 약 35 그램 초과, 세포 배양물 리터당 약 40 그램 초과, 세포 배양물 리터당 약 45 그램 초과, 또는 세포 배양물 리터당 약 50 그램 초과의 양으로 생산된다.

일부 실시태양에서, 상기 숙주 세포는 건조 세포 중량 그램당 약 50 밀리그램 초과의 상승된 수준의 스테비올 글리코시드를 생산한다. 일부 상기와 같은 실시태양에서, 상기 스테비올 글리코시드는 건조 세포 중량 그램당 약 50 내지 약 1500 밀리그램, 약 100 밀리그램 초과, 약 150 밀리그램 초과, 약 200 밀리그램 초과, 약 250 밀리그램 초과, 약 500 밀리그램 초과, 약 750 밀리그램 초과, 또는 약 1000 밀리그램 초과의 양으로 생산된다.

일부 실시태양에서, 상기 숙주 세포는 세포 배양 기준 단위 부피에 따라, 모 세포에 의해 생산된 스테비올 글리코시드의 수준의 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배 초과, 또는 그 이상의 상승된 수준의 스테비올 글리코시드를 생산한다.

일부 실시태양에서, 상기 숙주 세포는 단위 건조 세포 중량 기준에 따라, 모 세포에 의해 생산된 스테비올 글리코시드의 수준의 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배 초과 또는 그 이상의 상승된 수준의 스테비올 글리코시드를 생산한다.

일부 실시태양에서, 상기 숙주 세포는 단위 시간 기준당 세포 배양물의 단위 부피에 따라, 모 세포에 의해 생산된 스테비올 글리코시드의 수준의 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배 초과, 또는 그 이상의 상승된 수준의 스테비올 글리코시드를 생산한다.

일부 실시태양에서, 상기 숙주 세포는 단위 시간 기준당 단위 건조 세포 중량에 따라, 모 세포에 의해 생산된 스테비올 글리코시드의 수준의 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배 초과, 또는 그 이상의 상승된 수준의 스테비올 글리코시드를 생산한다.

대부분의 실시태양에서, 상기 숙주 세포에 의한 상승된 수준의 스테비올 글리코시드의 생산은 억압(repressing) 화합물에 의해 조절된다. 상기와 같은 숙주 세포는 상기 억압 화합물의 존재하에서 용이하게 조작될 수 있다. 이어서 상기 억압 화합물을 제거하여 상기 숙주 세포에 의한 상승된 수준의 스테비올 글리코시드의 생산을 유도한다. 다른 실시태양에서, 상기 숙주 세포에 의한 상승된 수준의 스테비올 글리코시드의 생산은 배양 조건, 예를 들어 생육 온도, 배지 구성성분 등의 변화에 의해 유도될 수 있다.

6.8 배양 배지 및 조건

미생물 배양물의 유지 및 생육을 위한 물질 및 방법은 미생물학 또는 발효과학 분야의 숙련가들에게 주지되어 있다(예를 들어 문헌[Bailey et al., Biochemical Engineering Fundamentals, second edition, McGraw Hill, New York, 1986]을 참조하시오). 상기 숙주 세포, 발효 및 공정의 특정한 요건에 따라, 적합한 배양 배지, pH, 온도, 및 호기성, 미세호기성, 또는 혐기성 조건에 대한 요구를 고려해야 한다.

본 명세서에 제공된 스테비올 글리코시드의 생산 방법을 적합한 용기, 예를 들어 비제한적으로 세포 배양 플레이트, 플라스크 또는 발효기에서 적합한 배양 배지(예를 들어 판토테네이트 보충이 있거나 없는)에서 수행할 수 있다. 더욱이, 상기 방법들을 미생물 제품의 산업적인 생산을 지지하는 것으로 당해 분야에 공지된 임의의 발효 규모로 수행할 수 있다. 교반식 탱크 발효기, 에어리프트 발효기, 버블 발효기, 또는 이들의 임의의 조합을 포함하는 임의의 적합한 발효기를 사용할 수 있다. 숙주 세포로서 사카로마이세스 세레비지아에를 사용하는 특정한 실시태양에서, 균주를 문헌[Kosaric, et al, in Ullmann's Encyclopedia of Industrial Chemistry, Sixth Edition, Volume 12, pages 398-473, Wiley-VCH Verlag GmbH & Co. KDaA, Weinheim, Germany]에 상세히 기재된 발효기에서 생육시킬 수 있다.

일부 실시태양에서, 상기 배양 배지는 스테비올 글리코시드를 생산할 수 있는 유전자 변형된 미생물이 존속될 수 있는, 즉 생육 및 생육성을 유지할 수 있는 임의의 배양 배지이다. 일부 실시태양에서, 상기 배양 배지는 동화가능 탄소, 질소 및 포스페이트 공급원을 포함하는 수성 배지이다. 상기와 같은 배지는 또한 적합한 염, 무기물, 금속 및 다른 영양소를 포함할 수 있다. 일부 실시태양에서, 상기 탄소원 및 각각의 필수 세포 영양소를 상기 발효 배지에 증분적으로 또는 연속적으로 첨가하며, 각각의 요구되는 영양소를, 세포를 예를 들어 상기 탄소원을 바이오매스로 전환시키는 상기 세포의 대사 또는 호흡기능에 기반한 소정의 세포 생육 곡선에 따라 생육시킴으로써 효율적인 동화에 필요한 필수적으로 최소 수준으로 유지시킨다.

미생물 배양에 적합한 조건 및 적합한 배지는 당해 분야에 주지되어 있다. 일부 실시태양에서, 상기 적합한 배지에는 하나 이상의 추가적인 인자들, 예를 들어 유도인자(예를 들어 유전자 산물을 암호화하는 하나 이상의 뉴클레오티드 서열이 유도성 프로모터의 조절하에 있는 경우), 억제인자(예를 들어 유전자 산물을 암호화하는 하나 이상의 뉴클레오티드 서열이 억제성 프로모터의 조절하에 있는 경우), 또는 선택인자(예를 들어 유전자 변형을 포함하는 미생물을 선택하기 위한 항생제)가 보충된다.

일부 실시태양에서, 상기 탄소원은 모노사카라이드(단당류), 디사카라이드, 폴리사카라이드, 비-발효성 탄소원, 또는 이들의 하나 이상의 조합이다. 적합한 모노사카라이드의 비제한적인 예는 글루코스, 만노스, 프럭토스, 자일로스, 리보스 및 이들의 조합을 포함한다. 적합한 디사카라이드의 비제한적인 예는 슈크로스, 락토스, 말토스, 갈락토스, 트레할로스, 셀로비오스 및 이들의 조합을 포함한다. 적합한 폴리사카라이드의 비제한적인 예는 전분, 글리코겐, 셀룰로스, 키틴 및 이들의 조합을 포함한다. 적합한 비발효성 탄소원의 비제한적인 예는 아세테이트 및 글리세롤을 포함한다.

상기 배양 배지 중의 탄소원, 예를 들어 글루코스의 농도는 세포 생육을 촉진해야 하지만, 상기 사용되는 미생물의 생육을 억제할 정도로 너무 높아서는 안 된다. 전형적으로, 발효 배양물은, 목적하는 수준의 생육 및 바이오매스를 성취하는 수준이지만 검출할 수 없는 수준(검출 한계는 약 <0.1 g/ℓ이다)으로 첨가되는 탄소원, 예를 들어 글루코스를 받아들인다. 다른 실시태양에서, 상기 배양 배지 중의 탄소원, 예를 들어 글루코스의 농도는 약 1 g/ℓ 초과, 바람직하게는 약 2 g/ℓ 초과, 및 보다 바람직하게는 약 5 g/ℓ 초과이다. 또한, 상기 배양 배지 중의 탄소원, 예를 들어 글루코스의 농도는 전형적으로 약 100 g/ℓ 미만, 바람직하게는 약 50 g/ℓ 미만, 및 보다 바람직하게는 약 20 g/ℓ 미만이다. 배양 성분 농도에 대한 언급은 초기 및/또는 진행중인 성분 농도 모두를 지칭할 수 있음에 유의해야 한다. 일부의 경우에, 상기 배양 배지는 배양 동안 탄소원이 고갈되게 하는 것이 바람직할 수도 있다.

적합한 배양 배지에 사용될 수 있는 동화가능 질소원은 비제한적으로 단순 질소원, 유기 질소원 및 복합 질소원을 포함한다. 상기와 같은 질소원은 무수 암모니아, 암모늄염 및 동물, 식물 및/또는 미생물 기원의 물질을 포함한다. 적합한 질소원은 비제한적으로 단백질 가수분해산물, 미생물 바이오매스 가수분해산물, 펩톤, 효모 추출물, 암모늄 설페이트, 우레아 및 아미노산을 포함한다. 전형적으로, 상기 배양 배지 중 질소원의 농도는 약 0.1 g/ℓ 초과, 바람직하게 약 0.25 g/ℓ 초과, 및 보다 바람직하게 약 1.0 g/ℓ 초과이다. 그러나, 일정 농도를 벗어난, 배양 배지에의 질소원의 첨가는 미생물 생육에 유리하지 않다. 그 결과, 상기 배양 배지 중 질소원의 농도는 약 20 g/ℓ 미만, 바람직하게는 약 10 g/ℓ 미만, 및 보다 바람직하게는 약 5 g/ℓ 미만이다. 더욱이, 일부의 경우에 상기 배양 배지는 배양 동안 질소원이 고갈되게 하는 것이 바람직할 수도 있다.

유효 배양 배지는 다른 화합물, 예를 들어 무기염, 비타민, 미량금속 또는 성장 촉진제를 함유할 수 있다. 상기와 같은 다른 화합물은 또한 상기 유효 배지 중에 탄소, 질소 또는 무기물 공급원 중에 존재하거나, 또는 상기 배지 중에 특별히 첨가될 수 있다.

상기 배양 배지는 또한 적합한 포스페이트원을 함유할 수 있다. 상기와 같은 포스페이트원은 무기 및 유기 포스페이트원을 모두 포함한다. 바람직한 포스페이트원은 비제한적으로 포스페이트염, 예를 들어 일 또는 이염기성 나트륨 및 칼륨 포스페이트, 암모늄 포스페이트 및 이들의 혼합물을 포함한다. 전형적으로, 상기 배양 배지 중의 포스페이트의 농도는 약 1.0 g/ℓ 초과, 바람직하게는 약 2.0 g/ℓ 초과 및 보다 바람직하게는 약 5.0 g/ℓ 초과이다. 그러나, 일정 농도를 벗어난, 배양 배지에의 포스페이트의 첨가는 미생물 생육에 유리하지 않다. 상응하게, 상기 배양 배지 중 포스페이트의 농도는 약 20 g/ℓ 미만, 바람직하게는 약 15 g/ℓ 미만, 및 보다 바람직하게는 약 10 g/ℓ 미만이다.

적합한 배양 배지는 또한 마그네슘원을, 바람직하게는 생리학적으로 허용 가능한 염의 형태, 예를 들어 마그네슘 설페이트 헵타하이드레이트로 포함할 수 있지만, 유사한 양의 마그네슘에 기여하는 농도의 다른 마그네슘원을 사용할 수 있다. 전형적으로, 상기 배양 배지 중 마그네슘의 농도는 약 0.5 g/ℓ 초과, 바람직하게는 약 1.0 g/ℓ 초과, 및 보다 바람직하게는 약 2.0 g/ℓ 초과이다. 그러나, 일정 농도를 벗어난, 배양 배지에의 마그네슘의 첨가는 미생물 생육에 유리하지 않다. 상응하게, 상기 배양 배지 중 마그네슘의 농도는 전형적으로 약 10 g/ℓ 미만, 바람직하게는 약 5 g/ℓ 미만, 및 보다 바람직하게는 약 3 g/ℓ 미만이다. 더욱이, 일부의 경우에 상기 배양 배지는 배양 동안 마그네슘원이 고갈되게 하는 것이 바람직할 수도 있다.

일부 실시태양에서, 상기 배양 배지는 또한 생물학적으로 허용 가능한 킬레이트제, 예를 들어 삼나트륨 시트레이트의 디하이드레이트를 포함할 수 있다. 상기와 같은 경우에, 상기 배양 배지 중 킬레이트제의 농도는 약 0.2 g/ℓ 초과, 바람직하게는 약 0.5 g/ℓ 초과 및 보다 바람직하게는 약 1 g/ℓ 초과이다. 그러나, 일정 농도를 벗어난, 배양 배지에의 킬레이트제의 첨가는 미생물 생육에 유리하지 않다. 상응하게, 상기 배양 배지 중 킬레이트제의 농도는 전형적으로 약 10 g/ℓ 미만, 바람직하게는 약 5 g/ℓ 미만, 및 보다 바람직하게는 약 2 g/ℓ 미만이다.

상기 배양 배지는 또한 처음에 상기 배양 배지의 목적하는 pH를 유지시키기 위해 생물학적으로 허용 가능한 산 또는 염기를 포함할 수 있다. 생물학적으로 허용 가능한 산은 비제한적으로 염산, 황산, 질산, 인산 및 이들의 혼합물을 포함한다. 생물학적으로 허용 가능한 염기는 비제한적으로 수산화 암모늄, 수산화 나트륨, 수산화 칼륨 및 이들의 혼합물을 포함한다. 일부 실시태양에서, 상기 사용되는 염기는 수산화 암모늄이다.

상기 배양 배지는 또한 생물학적으로 허용 가능한 칼슘원, 예를 들어 비제한적으로 염화 칼슘을 포함할 수 있다. 전형적으로, 상기 배양 배지 중 칼슘원, 예를 들어 염화 칼슘, 디하이드레이트의 농도는 약 5 ㎎/ℓ 내지 약 2000 ㎎/ℓ의 범위 이내, 바람직하게는 약 20 ㎎/ℓ 내지 약 1000 ㎎/ℓ의 범위 이내, 및 보다 바람직하게는 약 50 ㎎/ℓ 내지 약 500 ㎎/ℓ의 범위 이내이다.

상기 배양 배지는 또한 염화 나트륨을 포함할 수 있다. 전형적으로, 상기 배양 배지 중 염화 나트륨의 농도는 약 0.1 g/ℓ 내지 약 5 g/ℓ의 범위 이내, 바람직하게는 약 1 g/ℓ 내지 약 4 g/ℓ의 범위 이내, 및 보다 바람직하게는 약 2 g/ℓ 내지 약 4 g/ℓ의 범위 이내이다.

일부 실시태양에서, 상기 배양 배지는 또한 미량 금속을 포함할 수 있다. 상기와 같은 미량 금속을, 편의상 상기 배양 배지의 나머지와 별도로 제조될 수 있는 모액으로서 상기 배양 배지에 첨가할 수 있다. 전형적으로, 상기 배양 배지에 첨가되는 상기와 같은 미량 금속의 양은 약 1 ㎖/ℓ 초과, 바람직하게는 약 5 ㎖/ℓ 초과, 및 보다 바람직하게는 약 10 ㎖/ℓ 초과이다. 그러나, 일정 농도를 벗어난, 배양 배지에의 미량 금속의 첨가는 미생물 생육에 유리하지 않다. 상응하게, 상기 배양 배지에 첨가되는 미량 금속 용액의 양은 전형적으로 약 100 ㎖/ℓ 미만, 바람직하게는 약 50 ㎖/ℓ 미만, 및 보다 바람직하게는 약 30 ㎖/ℓ 미만이다. 모액에 미량 금속을 첨가하는 외에, 개별적인 성분들을 별도로 첨가할 수 있으며, 이들은 각각 상기 미량 금속 용액의 범위에 의해 지시되는 성분들의 양과 독립적으로 상응하는 범위이내임에 유의해야 한다.

상기 배양 배지는 다른 비타민, 예를 들어 판토테네이트, 비오틴, 칼슘, 판토테네이트, 이노시톨, 피리독신-HCl, 및 티아민-HCl을 포함할 수 있다. 상기와 같은 비타민을, 편의상 상기 배양 배지의 나머지와 별도로 제조될 수 있는 모액으로서 상기 배양 배지에 첨가할 수 있다. 그러나, 일정 농도를 벗어난, 배양 배지에의 비타민의 첨가는 미생물 생육에 유리하지 않다.

본 명세서에 기재된 발효 방법을 통상적인 배양 방식(비제한적으로 배치, 유가, 세포 재순환, 연속 및 반-연속 방식을 포함한다)으로 수행할 수 있다. 일부 실시태양에서, 상기 발효를 유가 방식으로 수행한다. 상기와 같은 경우에, 상기 배지의 성분들 중 일부가 배양 중에, 예를 들어 상기 발효의 생산 단계 동안 판토테네이트가 고갈된다. 일부 실시태양에서, 상기 배양물에, 생육 및/또는 스테비올 글리코시드 생산이 첨가가 요구되기 전의 기간 동안 지지되도록, 예를 들어 생산 단계의 시작시 비교적 높은 농도의 상기와 같은 성분들을 보충할 수 있다. 이들 성분의 바람직한 범위를, 배양 전체를 통해 배양에 의해 고갈되는 수준만큼 첨가함으로써 유지시킨다. 상기 배양 배지 중 성분들의 수준을, 예를 들어 상기 배양 배지를 주기적으로 샘플링하고 농도를 분석함으로써 모니터할 수 있다. 한편으로, 일단 표준 배양 과정이 전개되면, 상기 배양 전체를 통해 특정한 시기에 공지된 수준에 상응하는 시간 간격으로 첨가를 수행할 수 있다. 당해 분야의 숙련가들에 의해 인식되는 바와 같이, 영양소의 소비율은 배양 동안 배지의 세포 밀도가 증가함에 따라 증가한다. 더욱이, 상기 배양 배지내로 외부 미생물의 도입을 피하기 위해서, 당해 분야에 공지된 바와 같은 무균 첨가 방법을 사용하여 첨가를 수행한다. 또한, 소량의 소포제를 상기 배양 중에 첨가할 수도 있다.

상기 배양 배지의 온도는 상기 유전자 변형된 세포의 생육 및/또는 스테비올 글리코시드의 생산에 적합한 임의의 온도일 수 있다. 예를 들어, 상기 배양 배지를 접종물로 접종하기에 앞서, 상기 배양 배지를 약 20 ℃ 내지 약 45 ℃ 범위의 온도, 바람직하게는 약 25 ℃ 내지 약 40 ℃ 범위, 및 보다 바람직하게는 약 28 ℃ 내지 약 32 ℃ 범위의 온도로 만들어 유지시킬 수 있다.

상기 배양 배지의 pH는 상기 배양 배지에 산 또는 염기를 가하여 조절할 수 있다. 상기와 같은 경우에 암모니아를 사용하여 pH를 조절하는 경우, 편의상 상기를 배양 배지에 질소원으로서 제공한다. 바람직하게는, 상기 pH를 약 3.0 내지 약 8.0, 보다 바람직하게는 약 3.5 내지 약 7.0, 및 가장 바람직하게는 약 4.0 내지 약 6.5로 유지시킨다.

일부 실시태양에서, 상기 배양 배지의 탄소원 농도, 예를 들어 글루코스 농도를 배양 중 모니터한다. 상기 배양 배지의 글루코스 농도를 공지된 기법, 예를 들어 글루코스 옥시다제 효소 시험 또는 고압 액체 크로마토그래피(상기는 상등액 중의 글루코스 농도, 예를 들어 배양 배지 중 무세포 성분을 모니터하는데 사용될 수 있다)를 사용하여 모니터할 수 있다. 앞서 서술된 바와 같이, 상기 탄소원 농도를 세포 생육 억제가 일어나는 수준 미만에서 유지시켜야 한다. 상기와 같은 농도는 유기체마다 다를 수 있지만, 탄소원으로서 글루코스의 경우 세포 생육 억제는 약 60 g/ℓ를 초과하는 글루코스 농도에서 발생하며, 이는 시험에 의해 쉽게 측정될 수 있다. 상응하게, 글루코스를 탄소원으로서 사용하는 경우, 상기 글루코스를 바람직하게는 발효기에 공급하여 검출 한계 미만에서 유지시킨다. 한편으로, 상기 배양 배지 중 글루코스 농도를 약 1 g/ℓ 내지 약 100 g/ℓ의 범위, 보다 바람직하게는 약 2 g/ℓ 내지 약 50 g/ℓ의 범위, 및 더욱 더 바람직하게는 약 5 g/ℓ 내지 약 20 g/ℓ의 범위에서 유지시킨다. 상기 탄소원 농도를 예를 들어 실질적으로 순수한 글루코스 용액의 첨가에 의해 목적하는 수준 이내에서 유지시킬 수 있지만, 원래 배양 배지의 분액의 첨가에 의해 상기 배양 배지의 탄소원 농도를 유지시키는 것이 허용 가능하며 바람직할 수 있다. 상기 원래 배양 배지의 분액의 사용은 상기 배지 중 다른 영양소(예를 들어 질소 및 포스페이트원)의 농도를 동시에 유지시킬 수 있기 때문에 바람직하다. 마찬가지로, 상기 미량금속 농도를 상기 미량금속 용액의 분액의 첨가에 의해 상기 배양 배지 중에서 유지시킬 수 있다.

다른 적합한 발효 배지 및 방법은 예를 들어 WO 2016/196321에 기재되어 있다.

6.9 발효 조성물

또 다른 태양에서, 본 명세서는 본 명세서에 기재된 유전자 변형된 숙주 세포 및 유전자 변형된 숙주 세포로부터 생산된 스테비올 글리코시드를 포함하는 발효 조성물을 제공한다. 상기 발효 조성물은 배지를 추가로 포함할 수 있다. 몇몇 실시태양에서, 상기 발효 조성물은 유전자 변형된 숙주 세포를 포함하고, RebA, RebD 및 RebM을 추가로 포함한다. 몇몇 실시태양에서, 본 명세서에 제공된 발효 조성물은 상기 유전자 변형된 숙주 세포로부터 생산된 스테비올 글리코시드의 주성분으로서 RebM을 포함한다. 몇몇 실시태양에서, 상기 발효 조성물은 RebA, RebD 및 RebM을 적어도 1:7:50의 비로 포함한다. 다른 실시태양에서, 상기 발효 조성물은 적어도 8:50의 비로 (RebA+RebD) 및 RebM을 포함한다. 몇몇 실시태양에서, 상기 발효 조성물은 RebA, RebD 및 RebM을 적어도 1:7:50 내지 1:100:1000의 비로 포함한다. 다른 실시태양에서, 상기 발효 조성물은 (RebA+RebD) 및 RebM을 적어도 8:50 내지 101:1000의 비로 포함한다. 다른 실시태양에서, 상기 발효 조성물은 적어도 1:7:50 내지 1:200:2000의 비로 포함한다. 다른 실시태양에서, 상기 발효 조성물은 (RebA+RebD) 및 RebM을 적어도 8:50 내지 201:2000의 비로 포함한다. 몇몇 실시태양에서, 상기 RebA, RebD 및 RebM의 비는 상기 유전자 변형된 숙주 세포 및 배지와 관련된 이들 3개의 스테비올 글리코시드의 총 함량을 기준으로 한다. 몇몇 실시태양에서, 상기 RebA, RebD 및 RebM의 비는 상기 배지 중의 이들 3개의 스테비올 글리코시드의 총 함량을 기준으로 한다. 몇몇 실시태양에서, 상기 RebA, RebD 및 RebM의 비는 상기 유전자 변형된 숙주 세포와 관련된 이들 3개의 스테비올 글리코시드의 총 함량을 기준으로 한다.

다른 실시태양에서, 상기 발효 조성물은 유전자 변형된 숙주 세포를 포함하고, RebA 및 RebM을 추가로 포함한다. 몇몇 실시태양에서, 상기 발효 조성물은 RebA 및 RebM을 적어도 1:50의 RebA:RebM 비로 포함한다. 몇몇 실시태양에서, 상기 발효 조성물은 RebA 및 RebM을 적어도 1:50 내지 1:1000의 RebA:RebM 비로 포함한다. 몇몇 실시태양에서, 상기 발효 조성물은 RebA 및 RebM을 적어도 1:50 내지 1:2000의 RebA:RebM 비로 포함한다. 몇몇 실시태양에서, 상기 RebA 및 RebM의 비는 상기 유전자 변형된 숙주 세포 및 배지와 관련된 이들 2개의 스테비올 글리코시드의 총 함량을 기준으로 한다. 몇몇 실시태양에서, 상기 RebA 및 RebM의 비는 상기 배지 중의 이들 2개의 스테비올 글리코시드의 총 함량을 기준으로 한다. 몇몇 실시태양에서, 상기 RebA 및 RebM의 비는 상기 유전자 변형된 숙주 세포와 관련된 이들 2개의 스테비올 글리코시드의 총 함량을 기준으로 한다.

추가의 실시태양에서, 상기 발효 조성물은 유전자 변형된 숙주 세포를 포함하고, RebD 및 RebM을 추가로 포함한다. 몇몇 실시태양에서, 상기 발효 조성물은 RebD 및 RebM을 적어도 7:50의 RebD:RebM 비로 포함한다. 몇몇 실시태양에서, 상기 발효 조성물은 RebD 및 RebM을 적어도 7:50 내지 7:100의 RebD:RebM 비로 포함한다. 몇몇 실시태양에서, 상기 발효 조성물은 RebD 및 RebM을 적어도 7:50 내지 7:200의 RebD:RebM 비로 포함한다. 몇몇 실시태양에서, 상기 RebA, RebD 및 RebM의 비는 상기 유전자 변형된 숙주 세포 및 배지와 관련된 이들 2개의 스테비올 글리코시드의 총 함량을 기준으로 한다. 몇몇 실시태양에서, 상기 RebD 및 RebM의 비는 상기 배지 중의 이들 2개의 스테비올 글리코시드의 총 함량을 기준으로 한다. 몇몇 실시태양에서, 상기 RebD 및 RebM의 비는 상기 유전자 변형된 숙주 세포와 관련된 이들 2개의 스테비올 글리코시드의 총 함량을 기준으로 한다.

몇몇 실시태양에서, 본 명세서에 제공된 발효 조성물은 RebM2를 검출 가능하지 않은 수준으로 함유한다. 몇몇 실시태양에서, 본 명세서에 제공된 발효 조성물은 비-천연 스테비올 글리코시드를 검출 가능하지 않은 수준으로 함유한다. 몇몇 실시태양에서, 본 명세서에 제공된 발효 조성물은 GC-크로마토그래피 수행시 RebA 피크와 RebB 사이에 "스테비올+2 글루코스" 피크를 검출 가능한 수준으로 생산하지 않는다.

6.10 스테비올 글리코시드의 회수

일단 상기 스테비올 글리코시드가 숙주 세포에 의해 생산되면, 상기를 후속 사용을 위해, 당해 분야에 공지된 임의의 적합한 분리 및 정제 방법, 예를 들어 임의의 적합한 스테비올 글리코시드 분리 및 정제 방법을 사용하여 회수하거나 단리할 수 있다. 적합한 방법은 예를 들어 미국특허 제 7,838,044 호 및 제 8,981,081 호; 미국특허 출원 제 14/603,941, 14/033,563, 14/362,275, 14/613,615, 14/615,888 호; PCT 출원 제 PCT/US12/070562 호, 및 제 PCT/US14/031129 호에 기재되어 있다. 이들 문서의 내용은 전체가 본 명세서에 참고로 인용된다. 일부 실시태양에서, 상기 스테비올 글리코시드를 포함하는 수성상을 원심분리에 의해 상기 발효로부터 분리시킨다. 다른 실시태양에서, 상기 스테비올 글리코시드를 포함하는 수성상을 상기 발효로부터 자발적으로 분리시킨다. 다른 실시태양에서, 상기 스테비올 글리코시드를 포함하는 수성상을, 상기 발효 반응에 해유화제(demulsifier) 및/또는 핵형성제를 첨가함으로써 상기 발효로부터 분리시킨다. 해유화제의 예시적인 예는 응집제 및 응고제를 포함한다. 핵형성제의 예시적인 예는 상기 스테비올 글리코시드 자체의 소적 및 유기 용매, 예를 들어 도데칸, 이소프로필 미리스트레이트 및 메틸 올리에이트를 포함한다.

이들 세포에서 생산된 스테비올 글리코시드는 상기 배양 상등액 중에 존재하고/하거나 숙주 세포와 결합될 수 있다. 상기 스테비올 글리코시드가 숙주 세포와 결합되어 있는 실시태양에서, 상기 스테비올 글리코시드의 회수는 상기 세포의 삼투 또는 용해 방법을 포함할 수 있다. 한편으로 또는 동시에, 상기 배양 배지 중의 스테비올 글리코시드를 회수 공정, 예를 들어 비제한적으로 크로마토그래피, 흡착 크로마토그래피, 추출, 용매 추출, 막 분리, 전기투석, 역삼투, 증류, 화학적 유도체화 및 결정화를 사용하여 회수할 수 있다.

일부 실시태양에서, 상기 스테비올 글리코시드를 상기 수성상 중에 존재할 수 있는 다른 생성물들로부터 분리시킨다. 일부 실시태양에서, 분리를 흡착, 증류, 기체-액체 추출(스트립핑), 액체-액체 추출(용매 추출), 진공 추출, 증발, 한외여과, 및 표준 크로마토그래피 기법을 사용하여 성취한다. 다른 적합한 발효 배지 및 방법들이 예를 들어 미국특허 출원 공보 제 2016/0185813, 2017/0190728, WO/2017/093895 호에 기재되어 있다. 다른 적합한 방법들이 예를 들어 미국특허 제 7,838,044 호 및 제 8,981,081 호; 미국특허 출원 제 14/603,941, 14/033,563, 14/362,275, 14/613,615 및 14/615,888 호; PCT 출원 제 PCT/US12/070562, 및 PCT/US14/031129 호에 기재되어 있다. 이들 문서의 내용은 전체가 본 명세서에 참고로 인용된다.

몇몇 실시태양에서, 상기 회수된 스테비올 글리코시드(들)를 다양한 최종 제품에 사용할 수 있다. 예를 들어, 정제된 RebM 화합물 또는 RebM을 포함하는 조성물을 임의의 상품, 예를 들어 식품, 약학 제품, 식이성 보충제, 또는 영양 보충제에 사용할 수 있다. 특정한 실시태양에서, RebM을 포함하는 상품을, RebM 생성에 적합한 조건하에서 탄소원이 있는 배지 중에서 선행 청구항들 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 배양하고; 상기 배지로부터 상기 RebM 화합물을 회수하는 공정에 의해 제조한다.

본 명세서에 사용되는 바와 같은 감미료(sweetener) 조성물은 적어도 하나의 감미 성분을 적어도 하나의 다른 물질, 예를 들어 또 다른 감미료 또는 첨가제와 함께 함유하는 조성물을 의미한다.

본 명세서에 사용되는 바와 같은 감미가능한 조성물은 인간이나 동물의 입과 접촉하는 물질, 예를 들어 입으로 섭취되고 후속적으로 상기 입으로부터 배출되는 물질 및 마시거나, 먹거나, 삼키거나 또는 달리 섭취되며 일반적으로 허용 가능한 범위로 사용될 때 인간이나 동물 소비에 안전한 물질을 의미한다.

본 명세서에 사용되는 바와 같은 감미된 조성물은 감미가능한 조성물 및 감미료 또는 감미료 조성물을 모두 함유하는 물질을 의미한다. 예를 들어, 감미료 성분이 없는 음료는 일종의 감미가능한 조성물이다. 본 발명의 방법에 의해 생성된 RebM을 포함하는 감미료 조성물, 및 에리쓰리톨을 상기 감미되지 않은 음료에 가할 수 있으며, 이에 의해 감미된 음료를 제공할 수 있다. 상기 감미된 음료는 일종의 감미된 조성물이다. 적합한 감미료 조성물, 감미된 조성물 및 이의 제조 방법은 예를 들어 PCT 출원 PCT/US12/070562에 기재되어 있으며, 이의 내용은 전체가 본 명세서에 참고로 인용된다.

하나의 실시태양에서, RebM을 포함하는 감미료를, RebM 생성에 적합한 조건하에서 탄소원이 있는 배지 중에서 선행 청구항들 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 배양하고; 상기 배지로부터 상기 RebM 화합물을 회수하는 공정에 의해 제조한다. 또 다른 실시태양에서, 적어도 하나의 다른 물질 및 RebM을 포함하는 감미료 조성물을, RebM 생성에 적합한 조건하에서 탄소원이 있는 배지 중에서 선행 청구항들 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 배양하고; 상기 배지로부터 상기 RebM 화합물을 회수하는 공정에 의해 제조한다. 또 다른 실시태양에서, RebM을 포함하는 감미된 조성물을, RebM 생성에 적합한 조건하에서 탄소원이 있는 배지 중에서 선행 청구항들 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 배양하고; 상기 배지로부터 상기 RebM 화합물을 회수하는 공정에 의해 제조한다. 하나의 실시태양은, RebM 생성에 적합한 조건하에서 탄소원이 있는 배지 중에서 선행 청구항들 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 배양하고; 상기 배지로부터 상기 RebM 화합물을 회수하는 공정에 의해 제조된, RebM을 적어도 하나의 다른 물질과 조합함을 포함하는 감미료 조성물의 제조 방법을 포함한다. 또 다른 실시태양은, RebM 생성에 적합한 조건하에서 탄소원이 있는 배지 중에서 선행 청구항들 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 배양하고; 상기 배지로부터 상기 RebM 화합물을 회수하는 공정에 의해 제조된, RebM을 적어도 하나의 감미가능한 조성물과 조합함을 포함하는 감미된 조성물의 제조 방법을 포함한다.

6.11 유전자 변형된 세포의 생성 방법

본 명세서는 또한 상기 기재된 변형들 중 하나 이상, 예를 들어 스테비올 글리코시드 화합물의 경우, UGT40087 및/또는 생합성 경로 효소를 암호화하는 하나 이상의 이종 핵산을 포함하도록 유전자 조작된 숙주 세포의 생성 방법을 제공한다. 숙주 세포에서 이종 효소의 발현을, 상기 숙주 세포에 상기 숙주 세포에서 발현을 허용하는 조절 요소의 조절하에서 상기 효소를 암호화하는 뉴클레오티드 서열을 포함하는 핵산을 도입시킴으로써 수행할 수 있다. 일부 실시태양에서, 상기 핵산은 염색체외 플라스미드이다. 다른 실시태양에서, 상기 핵산을 상기 숙주 세포의 염색체내에 통합시킨다.

단백질을 암호화하는 핵산을 비제한적으로 당해 분야의 숙련가에게 공지된 임의의 방법에 의해 숙주 세포내에 도입시킬 수 있다(예를 들어 하기 문헌들을 참조하시오: Hinnen et al. (1978) Proc. Natl. Acad. Sci. USA 75:1292-3; Cregg et al. (1985) Mol. Cell. Biol. 5:3376-3385; Goeddel et al. eds, 1990, Methods in Enzymology, vol. 185, Academic Press, Inc., CA; Krieger, 1990, Gene Transfer and Expression -- A Laboratory Manual, Stockton Press, NY; Sambrook et al. , 1989, Molecular Cloning -- A Laboratory Manual, Cold Spring Harbor Laboratory, NY; 및 Ausubel et al., eds., Current Edition, Current Protocols in Molecular Biology, Greene Publishing Associates and Wiley Interscience, NY). 예시적인 기법은 비제한적으로 스페로플라스팅, 일렉트로포레이션, PEG 1000 매개된 형질전환, 및 리튬 아세테이트 또는 리튬 클로라이드 매개된 형질전환을 포함한다.

숙주 세포에서 효소의 활성을 상기 효소를 암호화하는 유전자의 전사를 변형시킴으로써 변경시킬 수 있다. 이를 예를 들어 상기 효소를 암호화하는 뉴클레오티드 서열의 사본수를 변형시킴으로써(예를 들어 상기 뉴클레오티드 서열을 포함하는 보다 높거나 보다 낮은 사본수의 발현 벡터를 사용함으로써, 또는 상기 뉴클레오티드 서열의 추가적인 사본을 상기 숙주 세포의 게놈에 도입시킴으로써 또는 상기 뉴클레오티드 서열을 상기 숙주 세포의 게놈 중에서 결실시키거나 파괴시킴으로써), 오페론의 폴리시스트론성 mRNA상의 암호화 서열들의 순서를 바꾸거나 또는 각각 자신의 조절 요소를 갖는 개별적인 유전자로 오페론을 분해시킴으로써, 또는 뉴클레오티드 서열이 작동적으로 연결된 프로모터 또는 오퍼레이터의 강도를 증가시킴으로써) 성취할 수 있다. 한편으로 또는 또한, 숙주 세포에서 효소의 활성을, 상기 효소를 암호화하는 mRNA의 번역 수준을 변형시킴으로써 변경시킬 수 있다. 이를, 예를 들어 상기 mRNA의 안정성을 변형시키고, 리보솜 결합 부위의 서열을 변형시키고, 상기 리보솜 결합 부위와 상기 효소 암호화 서열의 출발 코돈간의 거리 또는 서열을 변형시키고, 상기 효소 암호화 영역의 출발 코돈의 "상류"에 위치하거나 또는 5' 쪽에 인접한 전체 시스트론사이 영역을 변형시키고, 헤어핀 및 전문화된 서열을 사용하여 mRNA 전사물의 3'-단부를 안정화시키고, 효소의 코돈 사용을 변형시키고, 상기 효소의 생합성에 사용된 희귀 코돈 tRNA의 발현을 변경시키고, 및/또는 예를 들어 암호화 서열의 돌연변이를 통해 상기 효소의 안정성을 증가시킴으로서 성취할 수 있다.

숙주 세포에서 효소의 활성을 다수의 방식으로, 예를 들어 비제한적으로 상기 숙주 세포에서 증가되거나 감소된 용해도를 나타내는 효소의 변형된 형태를 발현시키거나, 상기 효소 활성의 억제를 통해 도메인이 결여된 효소의 변경된 형태를 발현시키거나, 기질에 대해 보다 높거나 낮은 Kcat 또는 보다 낮거나 높은 Km을 갖는 효소의 변형된 형태를 발현시키거나, 또는 상기 경로에서 또 다른 분자에 의한 피드백 또는 피드포워드 조절에 의해 다소 영향을 받는 효소의 변경된 형태를 발현시켜 변경시킬 수 있다.

일부 실시태양에서, 숙주 세포를 유전자 변형시키는데 사용되는 핵산은 형질전환된 숙주 세포의 선택 및 외부 DNA를 유지시키기 위해 숙주 세포상에 선택압을 놓기에 유용한 하나 이상의 선택성 마커를 포함한다.

일부 실시태양에서, 상기 선택성 마커는 항생제 내성 마커이다. 항생제 내성 마커의 예시적인 예는 비제한적으로 BLA, NAT1, PAT, AUR1-C, PDR4, SMR1, CAT, 마우스 dhfr, HPH, DSDA, KAN ^R , 및 SH BLE 유전자 산물을 포함한다. 이 콜라이로부터의 BLA 유전자 산물은 베타-락탐 항생제(예를 들어 좁은 범위 세팔로스포린, 세파마이신, 및 카바페넴(에르타페넴), 세파만돌, 및 세포페라존), 및 테모실린을 제외한 모든 항-그람-음성-세균 페니실린에 대한 내성을 부여하고; 에스 노우르제이(S. noursei)로부터의 NAT1 유전자 산물은 나우르세오트리신에 대한 내성을 부여하며; 에스 비리도크로모게네스(S. viridochromogenes) Tu94로부터의 PAT 유전자 산물은 비알로포스에 대한 내성을 부여하고; 사카로마이세스 세레비지아에로부터의 AUR1-C 유전자 산물은 아우에로바시딘 A(AbA)에 대한 내성을 부여하며; PDR4 유전자 산물은 세룰레닌에 대한 내성을 부여하고; SMR1 유전자 산물은 설포메투론 메틸에 대한 내성을 부여하며; Tn9 트랜스포손으로부터의 CAT 유전자 산물은 클로람페니콜에 대한 내성을 부여하고; 마우스 dhfr 유전자 산물은 메토트렉세이트에 대한 내성을 부여하고; 클렙시엘라 뉴모니아의 HPH 유전자 산물은 하이그로마이신 B에 대한 내성을 부여하며; 이 콜라이의 DSDA 유전자 산물은 세포가 유일한 질소원으로서 D-세린을 갖는 플레이트상에서 생육될 수 있게 하고; Tn903 트랜스포손의 KAN ^R 유전자는 G418에 대한 내성을 부여하며; 스트렙토알로테이쿠스 힌두스타누스(Streptoalloteichus hindustanus)로부터의 SH BLE 유전자 산물은 제오신(블레오마이신)에 대한 내성을 부여한다. 일부 실시태양에서, 상기 항생제 내성 마커를 본 명세서에 개시된 유전자 변형된 숙주 세포 단리 후에 결실시킨다.

일부 실시태양에서, 상기 선택성 마커는 상기 유전자 변형된 미생물에서 영양요구성(예를 들어 영양소 영양요구성)을 구제한다. 상기와 같은 실시태양에서, 모 미생물은, 아미노산 또는 뉴클레오티드 생합성 경로에서 기능하고 비-기능성인 경우 모 세포를 하나 이상의 영양소 보충이 없는 배지에서 생육할 수 없게 만드는 하나 이상의 유전자 산물에서의 기능적 붕괴를 포함한다. 상기와 같은 유전자 산물은 비제한적으로 효모에서 HIS3, LEU2, LYS1, LYS2, MET15, TRP1, ADE2, 및 URA3 유전자 산물을 포함한다. 이어서 상기 영양요구성 표현형은 상기 모 세포를 상기 붕괴된 유전자 산물의 기능성 사본을 암호화하는 발현 벡터 또는 염색체 통합 구조물로 형질전환시킴으로써 구제될 수 있으며, 상기 생성된 유전자 변형된 숙주 세포를 상기 모세포의 영양요구성 표현형의 상실을 근거로 선택할 수 있다. 선택성 마커로서 URA3, TRP1, 및 LYS2 유전자의 사용은 양성 및 음성 선택을 모두 가능하게 하기 때문에 현저한 장점을 갖는다. 양성 선택은 상기 URA3, TRP1, 및 LYS2 돌연변이의 영양요구성 상보성에 의해 수행되는 반면, 음성 선택은 독립영양성 균주의 생육은 방지하지만 각각 상기 URA3, TRP1, 및 LYS2 돌연변이체의 생육은 허용하는 특정한 억제제, 즉 각각 5-플루오로-오로트산(FOA), 5-플루오로안트라닐산 및 아미노아디프산(aAA)에 기반한다. 다른 실시태양에서, 상기 선택성 마커는 공지된 선택 방법에 의해 식별될 수 있는 다른 비-치명적인 결함 또는 표현형들을 구제한다.

본 명세서는 본 명세의 방법, 조성물 및 유기체에 유용한 특정한 유전자 및 단백질을 기재하지만; 상기와 같은 유전자에 대한 절대적인 동일성이 필요한 것은 아님을 알 것이다. 예를 들어, 폴리펩티드 또는 효소를 암호화하는 서열을 포함하는 특정 유전자 또는 폴리뉴클레오티드의 변화를 수행할 수 있으며 활성에 대해 선별할 수 있다. 전형적으로 상기와 같은 변화는 보존적 돌연변이 및 침묵 돌연변이를 포함한다. 상기와 같은 변형되거나 돌연변이된 폴리뉴클레오티드 및 폴리펩티드를 당해 분야에 공지된 방법을 사용하여 기능성 효소의 발현에 대해 선별할 수 있다.

유전자 암호의 내재하는 축퇴성으로 인해, 실질적으로 동일하거나 기능상 균등한 폴리펩티드를 암호화하는 다른 폴리뉴클레오티드를 또한 사용하여 상기와 같은 효소를 암호화하는 폴리뉴클레오티드를 클로닝하고 발현시킬 수 있다.

당해 분야의 숙련가들에 의해 이해되는 바와 같이, 특정한 숙주에서 발현을 증대시키도록 암호화 서열을 변형시키는 것이 유리할 수 있다. 상기 유전자 암호는 64개의 가능한 코돈이 불필요하지만, 대부분의 유기체는 전형적으로 이들 코돈의 부분집합을 사용한다. 하나의 종에서 가장 종종 사용되는 코돈을 최적 코돈이라 칭하며, 그다지 종종 사용되지 않는 코돈은 희귀 또는 저사용 코돈으로 분류된다. 때때로 "코돈 최적화" 또는 "종 코돈 편향을 위한 조절"이라 칭하는 공정에서 숙주의 바람직한 코돈 사용빈도를 반영하도록 코돈을 치환시킬 수 있다. 다른 숙주 세포에 대한 코돈 최적화를 코돈 사용빈도표를 사용하여 쉽게 측정하거나 또는 상업적으로 입수할 수 있는 소프트웨어, 예를 들어 인티그레이티드 DNA 테크놀로지스(Integrated DNA Technologies)로부터의 CodonOp(www.idtdna.com/CodonOptfrom)를 사용하여 수행할 수 있다.

특정한 원핵생물 또는 진핵생물 숙주에 의해 바람직한 코돈을 함유하는 최적화된 암호화 서열(Murray et al., 1989, Nucl Acids Res. 17: 477-508)을, 예를 들어 번역속도를 증가시키거나 또는 목적하는 성질, 예를 들어 최적화되지 않은 서열로부터 생성된 전사물에 비해 보다 긴 반감기를 갖는 재조합 RNA 전사물을 생성시키기 위해 제조할 수 있다. 번역 정지 코돈을 또한 숙주 선호를 반영하도록 변형시킬 수 있다. 예를 들어 에스 세레비지아에 및 포유동물에 전형적인 정지 코돈은 각각 UAA 및 UGA이다. 외떡잎 식물에 전형적인 정지 코돈은 UGA인 반면, 곤충 및 이 콜라이는 통상적으로 정지 코돈으로서 UAA를 사용한다(Dalphin et al., 1996, Nucl Acids Res. 24: 216-8).

당해 분야의 숙련가들은 상기 유전자 암호의 축퇴 성질로 인해, 뉴클레오티드 서열이 상이한 다양한 DNA 분자들을 사용하여 본 명세의 주어진 효소를 암호화할 수 있음을 알 것이다. 상술한 생합성 효소들을 암호화하는 고유 DNA 서열은 단지 본 명세의 실시태양을 예시하기 위해 본 발명에 참조되며, 본 명세는 본 명세의 방법에 사용되는 효소들의 폴리펩티드 및 단백질의 아미노산 서열을 암호화하는 임의의 서열의 DNA 분자들을 포함한다. 유사한 방식으로, 폴리펩티드는 전형적으로 목적하는 활성의 상실 또는 현저한 상실 없이 그의 아미노산 서열의 하나 이상의 아미노산 치환, 결실 및 삽입을 허용할 수 있다. 본 명세는 상기 변형된 또는 변형 폴리펩티드가 상기 참조 폴리펩티드의 효소적 동화 또는 이화 활성을 갖는 한, 본 명세서에 기재된 특정한 단백질들과 상이한 아미노산 서열을 갖는 상기와 같은 폴리펩티드를 포함한다. 더욱 또한, 본 명세서에 나타낸 DNA 서열에 의해 암호화된 아미노산 서열은 단지 본 명세의 실시태양들을 예시한다.

또한, 본 명세서에 제공된 조성물 및 방법에 유용한 효소들의 상동체가 본 명세에 의해 포함된다. 일부 실시태양에서, 2개의 단백질(또는 상기 단백질들의 일부)은 아미노산 서열이 적어도 약 30%, 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 경우 실질적으로 상동성이다. 2개의 아미노산 서열 또는 2개의 핵산 서열의 동일성 퍼센트를 측정하기 위해서, 상기 서열들을 최적의 비교를 목적으로 정렬시킨다(예를 들어 최적의 정렬을 위해 제1 및 제2 아미노산 또는 핵산 서열 중 하나 또는 둘 다에 끊김을 도입시키며 비-상동성 서열을 비교 목적으로 무시할 수 있다). 하나의 실시태양에서, 비교 목적으로 정렬된 참조 서열의 길이는 상기 참조 서열의 길이의 적어도 30%, 전형적으로는 적어도 40%, 보다 전형적으로는 적어도 50%, 훨씬 더 전형적으로는 적어도 60%, 및 훨씬 더 전형적으로는 적어도 70%, 80%, 90%, 100%이다. 이어서 상응하는 아미노산 위치 또는 뉴클레오티드 위치에서 아미노산 잔기 또는 뉴클레오티드를 비교한다. 상기 제1 서열 중 하나의 위치를 제2 서열 중의 상응하는 위치로서 동일한 아미노산 잔기 또는 뉴클레오티드가 점유하는 경우, 상기 분자는 상기 위치에서 일치한다(본 명세서에 사용되는 바와 같이 아미노산 또는 핵산 "동일성"은 아미노산 또는 핵산 "상동성"과 같다). 상기 2개 서열간의 동일성 퍼센트는 상기 2개 서열의 최적의 정렬을 위해 도입시킬 필요가 있는 끊김의 수, 및 각 끊김의 길이를 고려하여, 상기 서열들에 의해 공유된 일치하는 위치들의 수의 함수이다.

"상동성"이 단백질 또는 펩티드와 관련하여 사용되는 경우, 일치하지 않는 잔기 위치들이 종종 보존적 아미노산 치환에 의해 상이한 것으로 인식된다. "보존적 아미노산 치환"은 아미노산 잔기가, 유사한 화학적 성질(예를 들어 전하 또는 소수성)을 갖는 측쇄(R 기)를 갖는 또 다른 아미노산 잔기에 의해 치환된 것이다. 일반적으로, 보존적 아미노산 치환은 단백질의 기능적 성질을 실질적으로 변화시키지 않을 것이다. 2개 이상의 아미노산 서열이 보존적 치환에 의해 서로 상이한 경우, 서열 동일성 퍼센트 또는 상동성 정도를 상기 치환의 보존적 성질을 보정하는 쪽으로 조절할 수 있다. 이러한 조절을 수행하는 수단은 당해 분야의 숙련가들에게 주지되어 있다(예를 들어 문헌[Pearson W. R., 1994, Methods in Mol Biol 25: 365-89]을 참조하시오).

하기의 6개 그룹은 각각 서로에 대해 보존적인 치환인 아미노산들을 함유한다: 1) 세린(S), 쓰레오닌(T); 2) 아스파트산(D), 글루탐산(E); 3) 아스파라진(N), 글루타민(Q); 4) 아르기닌(R), 리신(K); 5) 이소류신(I), 류신(L), 알라닌(A), 발린(V), 및 6) 페닐알라닌(F), 티로신(Y), 트립토판(W).

폴리펩티드에 대한 서열 상동성(또한 서열 동일성 퍼센트라 칭한다)을 전형적으로는 서열 분석 소프트웨어를 사용하여 측정한다. 분자 서열을 상이한 유기체들로부터의 다수의 서열을 함유하는 데이터베이스와 비교하는데 사용되는 전형적인 알고리즘은 컴퓨터 프로그램 BLAST이다. 다수의 상이한 유기체들로부터의 서열을 함유하는 데이터베이스를 검색하는 경우, 아미노산 서열들을 비교하는 것이 전형적이다.

더욱 또한, 외부 효소(또는 본 명세서에서 언급된 임의의 다른 효소(또는 그의 발현을 조절하거나 조정하는 조절 요소들 중 어느 하나))를 암호화하는 유전자들 중 어느 하나를 당해 분야의 통상적인 숙련가들에게 공지된 유전자/단백질 조작 기법, 예를 들어 유도 진화 또는 합리적인 돌연변이유발에 의해 최적화할 수 있다. 상기와 같은 행위는 당해 분야의 통상적인 숙련가들로 하여금 효모 중 상기 효소들을 발현 및 활성에 최적화하게 한다.

또한, 이들 효소를 암호화하는 유전자를 다른 진균 및 세균 종들로부터 식별할 수 있으며 상기 경로의 조절을 위해 발현시킬 수 있다. 다양한 유기체들, 예를 들어 비제한적으로 사카로마이세스 스페시즈, 예를 들어 에스 세레비지아에 및 에스 우바룸(S. uvarum), 클루이베로마이세스 스페시즈(Kluyveromyces spp.), 예를 들어 케이 써모톨레란스(K. thermotolerans), 케이 락티스(K. lactis) 및 케이 마르시아누스(K. marxianus), 피키아 스페시즈(Pichia spp.), 한세눌라 스페시즈(Hansenula spp.), 예를 들어 에이치 폴리모르파(H. polymorpha), 칸디다 스페시즈(Candida spp.), 트리코스포론 스페시즈(Trichosporon spp.), 야마다지마 스페시즈(Yamadazyma spp.), 예를 들어 와이 스페시즈 스티피티스(Y. spp. stipitis), 토룰라스포라 프레토리엔시스(Torulaspora pretoriensis), 이사트첸키아 오리엔탈리스(Issatchenkia orientalis), 스키조사카로마이세스 스페시즈, 예를 들어 에스 폼베(S. pombe), 크립토코커스 스페시즈(Cryptococcus spp.), 아스퍼질러스 스페시즈(Aspergillus spp.), 뉴로스포라 스페시즈(Neurospora spp.) 또는 우스틸라고 스페시즈(Ustilago spp.)가 이들 효소에 대한 공급원으로서 작용할 수 있다. 혐기성 진균으로부터의 유전자의 공급원은 비제한적으로 피로마이세스 스페시즈(Piromyces spp.), 오르피노마이세스 스페시즈(Orpinomyces spp.), 또는 네오칼리마스틱스 스페시즈(Neocallimastix spp.)를 포함한다. 유용한 원핵생물 효소의 공급원은 비제한적으로 에스케리키아 콜라이, 지모모나스 모빌리스, 스타필로코커스 아우레우스, 바실러스 스페시즈, 클로스트리디움 스페시즈, 코리네박테리움 스페시즈, 슈도모나스 스페시즈, 락토코커스 스페시즈, 엔테로박터 스페시즈 및 살모넬라 스페시즈를 포함한다.

당해 분야의 숙련가들에게 공지된 기법이 추가적인 상동성 유전자 및 상동성 효소를 식별하기에 적합할 수 있다. 일반적으로, 유사한 유전자 및/또는 유사한 효소들을 기능성 분석에 의해 식별할 수 있으며 이들은 기능적 유사성을 가질 것이다. 당해 분야의 숙련가들에게 공지된 기법이 유사한 유전자 및 유사한 효소를 식별하기에 적합할 수 있다. 예를 들어, 상동성 또는 유사성 UDP 글리코실트랜스퍼라제, PTA, 또는 임의의 생합성 경로 유전자, 단백질 또는 효소를 식별하기 위한 기법들은 비제한적으로 관심 유전자/효소의 공개된 서열을 기본으로 하는 프라이머를 사용하는 PCR에 의한, 또는 관심 유전자 가운데 보존된 영역을 증폭하도록 설계된 축퇴 프라이머를 사용하는 축퇴 PCR에 의한 유전자 클로닝을 포함할 수 있다. 더욱이, 당해 분야의 숙련가는 기능적 상동성 또는 유사성을 갖는 상동성 또는 유사성 유전자, 단백질 또는 효소를 식별하기 위한 기법을 사용할 수 있다. 기법은 세포 또는 세포 배양물을, 효소의 촉매 활성에 대한 시험관내 효소 분석을 통해 상기 활성에 대해 검사하고(예를 들어 본 명세서 또는 문헌[Kiritani, K., Branched-Chain Amino Acids Methods Enzymology, 1970]에 기재된 바와 같이), 이어서 상기 활성을 갖는 효소를 정제를 통해 단리하고, Edman 분해, 있음직한 핵산 서열에 대한 PCR 프라이머의 설계, PCR을 통한 상기 DNA 서열의 증폭, 및 상기 핵산 서열의 클로닝과 같은 기법을 통해 상기 효소의 단백질 서열을 측정함을 포함한다. 상동성 또는 유사한 유전자 및/또는 상동성 또는 유사한 효소, 유사한 유전자 및/또는 유사한 효소 또는 단백질을 식별하기 위해서, 기법들은 또한 후보 유전자 또는 효소에 관한 데이터와 BRENDA, KEGG 또는 MetaCYC와 같은 데이터베이스와의 비교를 포함한다. 상기 후보 유전자 또는 효소를 본 명세서의 교시에 따라 상기 언급된 데이터베이스내에서 식별할 수 있다.

7. 실시예

실시예 1: 파르네실피로포스페이트(FPP) 및 이소프레노이드 파르네신으로 고도로 흐를 수 있는 염기성 효모 균주의 생성

파르네신 생산 균주를 GAL1 또는 GAL10 프로모터의 조절하에서 메발로네이트 경로(도 1C)의 유전자를 발현시킴으로써 야생형 사카로마이세스 세레비지아에 균주(CEN.PK2)로부터 생성시켰다. 상기 균주는 하기의 에스 세레비지아에로부터의 염색체 통합된 메발로네이트 경로 유전자들을 포함하였다: 아세틸-CoA 티올라제, HMG-CoA 신타제, HMG-CoA 리덕타제, 메발로네이트 키나제, 포스포메발로네이트 키나제, 메발로네이트 피로포스페이트 데카복실라제, 및 IPP:DMAPP 이소머라제. 본 명세서에 기재된 모든 유전자들은 공개적으로 입수할 수 있거나 다른 적합한 알고리즘을 사용하여 코돈 최적화되었다. 또한, 상기 균주는 또한 GAL1 또는 GLA10 프로모터의 조절하에서 아르테미시닌 안누아(Artemisinin annua)로부터의 파르네신 신타제의 6개 사본을 함유하였다. 상기 균주는 또한 GAL4oc 프로모터하에서 GAL4의 추가적인 사본 및 GAL80 유전자의 결실을 함유하였으며, 여기에서 상기 사카로마이세스 세레비지아에의 GAL4 유전자의 암호화 서열은 그의 고유 프로모터(PGAL4oc; 예를 들어 문헌[Griggs & Johnston (1991) PNAS 88(19):8597-8601]을 참조하시오)의 "작동성 구성" 버전의 조절성 조절하에 있다. 마지막으로 스쿠알렌 신타제를 암호화하는 ERG9 유전자를, 상기 고유 프로모터를 효모 유전자 MET3의 프로모터(Westfall et al PNAS 2012)로 교체시킴으로써 하향조절한다.

실시예 2. RebA로 고도로 흐를 수 있는 염기성 효모 균주의 생성

도 2A는 FPP에서 스테비올로의 예시적인 생합성 경로를 도시한다. 도 2B는 스테비올에서 글리코시드 RebM으로의 예시적인 생합성 경로를 도시한다. 상술한 파르네신 염기성 균주를 C-20 이소프레노이드 카우렌으로 고도로 흐르도록 전환시키기 위해서, 제라닐제라닐피로포스페이트 신타제(GGPPS)의 6개 사본을 게놈내에 통합시킨 다음, 각각 코팔릴디포스페이트 신타제 및 카우렌 신타제의 4개 사본을 통합시켰다. 이 시점에서 파르네신 신타제의 6개 사본을 상기 균주로부터 제거하였다. 일단 상기 새로운 균주가 ent-카우렌을 생성시키는 것으로 확인되었으면, ent-카우렌을 RebA로 전환시키는 나머지 유전자들을 상기 게놈내에 삽입하였다. 표 4는 FPP를 RebA로 전환시키는데 사용된 모든 유전자 및 프로모터를 나열한다. 카우렌 신타제 뒤의 각각의 유전자를, 2개의 사본을 갖는 Sr.KAH 효소를 제외하고, 단일 사본과 통합시켰다(표 4). 표 1에 기재된 모든 유전자를 함유하는 균주는 주로 RebA를 생성시켰다. 효소 UGT91D_유사3은 RebA에서 레바우디오시드 D(RebD)로의 약간 낮은 활성을 갖는다. 우리는 UGT91D_유사3의 단일 사본이 상기 기재된 효모 균주 중에서 생체내에서 상기 균주 중 RebA의 대략 3%를 RebD로 전환시킬 수 있음을 측정하였다(도 3 및 표 5). 이어서 UGT76G1은 RebD를 최종 생성물 RebM으로 전환시킬 수 있다.

실시예 3. RebA를 RebD로 전환시키는 신규의 UDP-글리코실트랜스퍼라제(UGT) 효소를 선별하기 위한 균주의 생성

생체내에서 RebA의 RebD로의 전환을 신속하게 선별하기 위한 선별 균주를 생성시키기 위해서, 랜딩 패드(landing pad)를 상술한 RebA 균주내에 삽입하였다. 상기 랜딩 패드는 ALG1 개방 판독 프레임의 하류 게놈 영역에 대한 상기 구조물의 어느 한 단부상에 500 bp의 유전자좌-표적화 DNA 서열들로 이루어졌다(도 4). 내부적으로, 상기 랜딩 패드는 PGAL1 프로모터 및 엔도뉴클레아제 인식 부위(F-CphI)의 측면에 인접한 효모 종결자를 함유하였다.

실시예 4. 생체내에서 RebA를 RebD로 고효율로 전환시키는 UGT 유전자에 대한 선별

진뱅크(Genbank)로부터 수득한 100개의 UGT 효소에 대해서 에스 세레비지아에에서의 최적 발현을 위해 코돈 최적화하고 상술한 랜딩 패드에서 F-CphI 서열에 측면 인접한 효모 종결자 및 PGAL1에 대해 60 bp의 서열 상동성으로 합성하였다. 각각의 합성된 UGT 유전자를, 상술한 효모 균주에서 생체내에서 RebA를 RebD로 전환시키는 능력에 대해 단일 사본으로 개별적으로 시험하였다. 효모를 UGT 공여체 DNA 및 엔도뉴클레아제 F-CphI를 함유하는 플라스미드로 형질전환시켜 상기 랜딩 패드 중의 상기 DNA를 절단하였다. 정확한 통합을 각각의 형질전환에서 특정한 UGT 유전자 내부의 역방향 프라이머 및 ALG1 ORF의 단부의 범용 순방향 프라이머를 사용하여 콜로니 PCR에 의해 확인하였다.

실시예 5. 효모 형질전환 방법

각각의 DNA 구조물을 최적화된 리튬 아세테이트(LiAc) 형질전환에서 표준 분자 생물학 기법으로 사카로마이세스 세레비지아에(CEN.PK2)에 통합시켰다. 간단히, 세포를, 100 ㎖ YPD 중에서 0.1의 OD₆₀₀으로 희석한 효모 추출물 펩톤 덱스트로스(YPD) 배지에서 30 ℃에서 진탕시키면서(200 rpm) 밤새 생육시키고, 0.6 내지 0.8의 OD₆₀₀으로 증식시켰다. 각각의 형질전환에 대해서, 5 ㎖의 배양물을 원심분리에 의해 수확하고, 5 ㎖의 멸균수로 세척하고, 다시 회전시키고, 1 ㎖의 100 mM LiAc에 재현탁시키고, 미세원심분리기 튜브로 옮겼다. 세포를 30초 동안 회전시키고(13,000xg), 상등액을 제거하고, 세포를 240 ㎕ 50% PEG, 36 ㎕ 1 M LiAc, 10 ㎕ 끓인 연어 정자 DNA, 및 74 ㎕의 공여체 DNA로 이루어진 형질전환 믹스에 재현탁시켰다. 엔도뉴클레아제 F-Cph1의 발현이 필요한 형질전환의 경우, 상기 공여체 DNA는 발현을 위해 효모 TDH3 프로모터하에서 발현되는 F-CphI 유전자를 갖는 플라스미드를 포함하였다. 상기는 랜딩 패드 중 F-CphI 엔도뉴클레아제 인식 부위를 절단하여 상기 UGT 유전자의 통합을 용이하게 할 것이다. 42 ℃에서 40분간 열충격에 이어서, 세포를 선택성 배지상에 도말 전에 YPD 배지에서 밤새 회수하였다. DNA 통합을 상기 통합에 특이적인 프라이머와 함께 콜로니 PCR에 의해 확인하였다.

실시예 6. 효모 배양 조건

예상되는 UGT 유전자를 함유하는 것으로 확인된 효모 콜로니를, 20 g/ℓ 슈크로스 및 37.5 g/ℓ 암모늄 설페이트와 함께 버드 시드 배지(BSM, 문헌[van Hoek et al., Biotechnology and Bioengineering 68(5), 2000, pp. 517-523]에 최초로 기재됨)를 함유하는 96-웰 미세적정 플레이트에 채집하였다. 세포를 30 ℃ 및 80% 습도에서 1000 rpm에서 진탕하는 고용량 미세적정 플레이트 배양기에서 3일간 배양물이 탄소 고갈에 도달할 때까지 배양하였다. 상기 증식-포화된 배양물을 40 g/ℓ 슈크로스 및 150 g/ℓ 암모늄 설페이트와 함께 BSM을 함유하는 신선한 플레이트내로, 상기 포화된 배양물로부터 14.4 ㎕를 취하고 360 ㎕의 신선한 배지에 희석함으로써 계대배양하였다. 상기 생산 배지 중의 세포를 추출 및 분석에 앞서 1000 rpm 및 80% 습도에서 추가로 3일 동안 고용량 미세적정 플레이트 진탕기에서 30 ℃에서 배양하였다. 종료시 상기 전세포 브로쓰를 360 uL의 100% 에탄올로 희석하고, 호일 씰로 밀봉하고, 1250 rpm에서 30분간 진탕시켜 스테비올 글리코시드를 추출하였다. 490 uL의 50:50 에탄올:수를 새로운 1.1 ㎖ 분석 플레이트에 가하고 10 uL의 배양물/에탄올 혼합물을 상기 분석 플레이트에 가한다. 상기 혼합물을 원심분리시켜 임의의 고체를 펠릿화하고, 400 uL의 상기 용액을 새로운 1.1 ㎖ 플레이트로 옮기고 LC-MS에 의해 분석하였다.

실시예 7. 분석 방법

샘플을 하기의 구배(이동상 A: H2O 중 0.1% 포름산; 이동상 B: 아세토니트릴 중 0.1% 포름산)로 시그마 아센티스 익스프레스 펩티드(Sigma Ascentis Express Peptide) ES-C18(5 ㎝, 2.1 ㎜, 2.7 um; 파트 #53301-U)를 사용하여 LC-MS 질량 분광계(AB QTrap 4000)에 의해 분석하였다:

[표 2]

상기 질량 분광계를 음이온 다중 반응 모니터링 방식으로 작동시켰다. 각각의 레바우디오시드 이성질체를, 진성 표준 및 MRM 이행으로부터 측정된 체류 시간에 의해 식별하였다:

[표 3]

질량 분광계로부터의 크로마토그램으로부터 피크 면적을 사용하여 보정 곡선을 생성시켰다. 관련 화합물들(즉 RebA, RebD, RebM)의 몰비를, 진성 표준을 사용하여 외부 보정을 통해 각 화합물의 몰량을 정량분석하고 이어서 적합한 비를 취함으로써 측정하였다.

NMR 분석을 수행하여 RebM이 유전자 변형된 균주로부터 생산되었음을 확인하였다. 발효 후에, 균주를 발효 브로쓰로부터 제거하였다. 스테비올 글리코시드를 남아있는 액체 배지로부터 정제하였다. NMR 분석에 적합한 임의의 방법, 예를 들어 WO/2017/093895 및 WO/2016/028899에 기재된 것들을 사용할 수 있다.

실시예 8. RebA를 RebD로 전환시키는 능력이 큰 것으로 밝혀진 UGT 효소들

6개의 UGT 효소가 RebA를 RebD로 전환시키는 능력이 큰 것으로 밝혀졌다(도 3). 이들 효소의 성능을, 또한 RebA의 RebD로의 전환을 수행하는 것으로서 문헌에 기재된 2개의 다른 UGT 효소, Os_UGT_91C1(즉 WO 2013/022989 A2에 기재된 EUGT11) 및 Sl_UGT_101249881(즉 WO2014/193888 A1에 기재된 UGTSL2)에 대해 벤치마킹하였다. 표 5는 [Reb(D+M)의 마이크로몰/(A+D+M)의 마이크로몰]의 중간비를 나열하며; RebA, RebD, 및 RebM을 상술한 바와 같이 생체내에서 측정하였다. 상기 비는 RebA에서 RebD로의 전환 효율의 척도이다. [Reb(A+D+M)]의 uM의 합은 세포에서 생성되었던 총 RebA이다. [Reb(D+M)]의 uM의 합은 세포에서 생성되었던 총 RebD이다. 도 5a-i는 도 3 및 표 2의 모든 UGT 유전자들에 대한 RebE, RebA, RebD, RebM, 및 RebM2의 크로마토그램을 나타낸다. RebM2는 단일의 잘못된 글루코스 결합을 갖는 RebM의 이성질체이다. RebM2는 19번 탄소 위치(COOH)에 RebM에 대한 목적하는 Glcβ(1-2)[Glcβ(1-3)]Glcβ1- 대신에 Glcβ(1-2)[Glcβ(1-6)]Glcβ1-을 갖는다.

실시예 7에 기재된 NMR 방법을 사용하여, UGT40087을 포함하는 균주로부터 생성된 샘플 생성물을 ID 및 2D NMR 분광학에 대해 표준 RebM과 비교하였다. 메탄올 및 피리딘 중에서 기록된 1D 및 2D NMR 스펙트럼의 오버레이는 상기 두 화합물이 모두 일치함을 입증하였다. 2D NMR 데이터의 상세한 해석 및 문헌에 공개된 데이터와의 비교는 상기 두 샘플이 모두 RebM임을 입증하였다.

0.5 또는 2.0 리터의 발효 용기에서, UGT40087은 상이한 균주 배경에서 발현시, RebA, RebD 및 RebM을 약 1:7:50의 약 RebA:RebD:RebM의 비로 생성시켰다.

[표 4]

[표 5]

실시예 9: RebA를 RebD로 전환시키는 표 5의 효소들의 특이성

표 5에 나열된 효소들은 베타-1,2-연결된 글리코시드 결합의 형성을 통해 RebA의 19-O-글루코스의 C-2' 위치상에 글루코스 당의 첨가에 의해 RebA의 RebD로의 전환을 촉매화할 수 있다. 몇몇 실시태양에서, 이종 숙주에서 RebM의 생물공학적 생산은 RebM을 (1) 고순도로 (2) 임의의 "비-천연" 스테비올 글리코시드의 생산 없이 생산하는 것이 바람직할 수 있다. 시중에 판매된 임의의 제품은 아마도 최상의 풍미 프로파일을 보장하고 다수의 인간 식품 규제 표준을 충족시키기 위해 대단히 높은 순도를 요할 것이다. RebM 이외의 스테비올 글리코시드의 존재는 아마도 고도로 순수한 RebM을 수득하기 위한 하류 가공 비용을 증가시킬 것이다. 상당량의 비-RebM 스테비올 글리코시드가 존재한다면, 이는 상기 RebM 생성물의 최종 순도를 잠재적으로 훼손시킬 수 있을 것이다. 몇몇 실시태양에서, 이종 효소가 어떠한 "비-천연" 스테비올 글리코시드도 생산하지 않는 것이 유리할 수 있을 것이다. "비-천연" 스테비올 글리코시드는 본 명세서에서 스테비아 레바우디아나 식물에서 자연적으로 발생하지 않는 것으로 공지된 임의의 스테비올 글리코시드로서 정의된다.

상술한 이유들로 인해, 표 5에 나열된 모든 효소를 그들의 불순도 프로파일에 대해 검사하여, 이들이 임의의 예상치않은 또는 비-천연 스테비올 글리코시드를 생성시키는 지의 여부를 측정하였다(도 2B에 나타내지 않는다). 표 2에 나열된 모든 효소에 대한 보다 긴 체류 시간 동안의 크로마토그래피 자취를 추가로 분석하였다. 50%를 초과하는 전환 효율을 갖는 모든 효소 중에서, 예상치않은 생성물을 생성시키지 않은 유일한 효소들은 UGT40087 및 Os_UGT_91C1(EUGT11)이었다. 예상된 바와 같이, UGT91D_유사3은 상기 크로마토그램 중에 예상치않은 피크들을 생성시키지 않았다.

50%를 초과하는 전환 효율을 갖는 효소들 중에서, 이들 효소의 크로마토그래픽 자취는 비천연 글리코시드와 관련된 하나 이상의 예상치않은 피크들을 생성시켰다. 예를 들어, Ob_UGT91B1_유사의 크로마토그래픽 자취는 약 6.61분의 체류 시간에서 RebA 피크와 RebB 피크간에 예상치않은 피크(스테비올+2 글루코스)를 생성시켰다. 상기 Ob_UGT91B1_유사의 예상치않은 피크의 강도는 RebA 피크의 경우보다 적어도 31배는 더 컸다. 도 9c를 참조하시오. 상기 예상치않은 피크(스테비올+2 글루코스)는 모 대조용 균주(UGT74G1, UGT85C2, UGT76G1, 및 UGT91D_유사3)로부터 또는 UGT40087을 포함하는 균주로부터의 크로마토그래픽 자취 중에 존재하지 않는다. 도 9b 및 9c를 참조하시오. 또 다른 예에서, Hv_UGT_V1의 크로마토그래픽 자취는 약 6.61분의 체류 시간에서 RebA 피크와 RebB 피크간에 예상치않은 피크(스테비올+2 글루코스)를 생성시켰다. 상기 Hv_UGT_V1의 예상치않은 피크의 강도는 RebA 피크의 경우보다 0.6 인자 더 낮았다. 또 다른 예에서, Sl_UGT_101249881의 크로마토그래픽 자취는 약 6.67분의 체류 시간에서 RebA 피크와 RebB 피크간에 예상치않은 피크(스테비올+2 글루코스)를 생성시켰다. 상기 Sl_UGT101249881의 예상치않은 피크의 강도는 RebA 피크의 경우보다 약 1.11배 더 컸다. 또 다른 예에서, Sr.UGT_g252778의 크로마토그래픽 자취는 약 6.67분의 체류 시간에서 RebA 피크와 RebB 피크간에 예상치않은 피크(스테비올+2 글루코스)를 생성시켰다. 상기 Sr.UGT_g252778의 예상치않은 피크의 강도는 RebA 피크의 경우보다 약 0.96인자 더 낮았다. 이들 효소 중 일부는 또한 추가적인 예상치않은 피크들을 생성시켰다. Hv_UGT_V1, Sl_UGT_101249881, 및 Sr.UGT_g252778에 대한 크로마토그래픽 자취는 생략된다.

이들 결과는 상기 2개 효소 UGT40087 및 Os_UGT_91C1(EUGT11)에 비해, 50% 초과의 A에서 D로의 전환 효율을 갖는 다른 3개의 효소(즉 Hv_UGTV1, SI_UGT_101249881, 및 Sr.UGT_g252778)가 추가적인 반응들을 촉매화하여, 스테비아 레바우디아나 식물에서 RebM으로의 경로에서 통상적으로 생성되지 않는 스테비올 글리코시드를 잠재적으로 생산할 수 있음을 가리킨다.

[표 6]

실시예 10: UGT40087 효소 활성은 19-O-글루코스 스테비올 글리코시드의 C-2' 위치에 특이성이다.

UGT40087은 스테비오시드 또는 RebA의 19-O-글루코스의 C-2'에의 제2 당 부분의 부가 반응을 촉매화한다. 도 5a 및 5i에 나타낸 바와 같이, UGT40087이 없는 모 대조용 균주(실시예 2에 기재된 바와 같은)는 RebA를 생성시킬 수 있지만, 검출 가능한 양의 RebE, RebD 또는 RebM은 생성시키지 못한다. 이제 상기 모 세포에의 UGT40087의 첨가는 검출 가능한 양의 RebE를 생성시키며, 이는 UGT40087이 스테비오시드의 베타-1,2 결합에서 19-O-글루코스의 C-2' 위치에 제2 글루코스 부분의 첨가를 촉매화하여 RebE를 생성시킴을 가리킨다. 또한, RebD 및 RebM에 대한 2개의 새로운 피크가 UGT40087을 함유하는 균주에 대한 크로마토그램에 나타나는 반면, RebA에 대한 피크는 UGT40087이 없는 모 균주에 비해 현저하게 감소된다. 따라서, UGT40087은 레바우디오시드 A의 레바우디오시드 D에의 베타-1,2 결합에서 19-O-글루코스의 C-2' 위치에 제2 글루코스 부분의 첨가를 촉매화할 수 있다. 상기 균주 중의 UGT76G1의 존재는 최종 글루코수 첨가를 촉매화하여 RebD를 RebM으로 전환시킨다.

스테비올모노시드 또는 루부소시드의 베타-1,2 결합에서 13-O-글루코스의 C-2' 위치에 당을 첨가하는 능력을 선별하기 위해서, 오직 루보소시드로만 고도의 흐름을 갖는 염기성 균주를 제조하였다. 상기 루부소시드 염기성 균주는, 상기 루부소시드 염기성 균주가 효소 UGT91D_유사3을 함유하지 않음을 제외하고, 실시예 2에 기재된 RebA 염기성 균주와 유전학적으로 동일성이다. 표 7에 나타낸 바와 같이, UGT74G1, UGT85C2, 및 UGT76G1을 갖는 루부소시드 염기성 균주는 오직 19-글리코시드, 스테비올모노시드 및 루부소시드를 생성시킬 수 있을 뿐이다. 상기 균주에 UGT40087을 첨가하는 것은 상기 프로파일을 전혀 변화시키지 않는다. UGT40087이 스테비올모노시드 또는 루부소시드의 베타-1,2 결합에서 13-O-글루코스의 C-2' 위치에 당을 첨가할 수 있었다면, 스테비올비오시드 또는 스테비오시드 중 어느 하나 또는 둘 다는 검출가능한 양으로 존재해야 한다. 스테비올비오시드, 스테비오시드 및 또한 RebA는 상기 균주를 UGT91D_유사3(상기는 스테비올모노시드 및 루부소시드 모두의 베타-1,2 결합에서 13-O-글루코스의 C-2' 위치에 당을 첨가할 수 있다)으로 형절전환시킬 때 나타난다.

EUGT 11(Os_UGT_91C1)은 앞서 19-O-스테비올 글리코시드 또는 13-O-스테비올 글리코시드의 C-2' 위치에 제2 당 부분의 첨가를 촉매화하는 다른 것들에 의해 특성화되었다. WO 2013/022989의 도 5를 참조하시오. 상기에 나타낸 바와 같이, UGT40087은 스테비올모노시드 또는 루부소시드의 베타-1,2 결합에서 13-O-글루코스의 C-2' 위치에의 당 첨가를 검출 가능한 수준으로 촉매화하는 것으로 보이지 않는다. 이러한 결과는 UGT40087이 EUGT11에 비해 기능적으로 구별가능하고 상이한 결과를 생성시키는 UDP-글리코실트랜스퍼라제임을 가리킨다.

[표 7]

실시예 11. N-말단 도메인 교환에 의한 UGT 키메라의 조작

식물 UDP-글리코실트랜스퍼라제(UGT)들은 비교적 낮은 아미노산 서열 상동성을 갖는다 하더라도 고도로 보존된 단백질 구조를 공유한다. 이들 UGT(소위 GT-B 구조적 폴드를 채용한다)는 2개의 도메인으로 이루어지며, 그들의 1차 아미노산 서열의 중간-점에서 대충 끊긴다. N-말단 도메인은 주로 기질 특이성을 결정하는 당 수용체 도메인이다. 예상되는 바와 같이, 상기 도메인은 그의 아미노산 서열의 면에서 보다 가변적인 도메인이며, UGT에 의해 글리코실화될 수 있는 다양한 기질들을 반영한다. 보다 보존된 C-말단 도메인은 당 공여체 도메인이며, 여기에서 UDP-글루코스가 결합된다. 상기 두 도메인은 대개 가요성 링커에 의해 연결되어 도메인 교환 디자인을 위해 상기 단백질을 분할하기에 이상적인 영역을 생성시킨다(도 6). UGT의 고도로 보존된 도메인 구조의 성질이 주어진다면, 임의의 2개의 UGT로부터의 도메인들을 재조합시켜 기질 특이성을 변경시키거나 목적하는 기능, 예를 들어 촉매 활성을 증대시킬 수 있을 것이다. 본 실시예에서, 우리는 다수의 UGT 키메라를 도메인 교환을 통해 설계함으로써 기질 특이성, 즉 RebA를 RebD로 전환시키는 활성에 관하여 UGT40087의 N-말단 도메인의 역할을 조사하였다.

도메인 교환 실험을 설계하기 위해 고려되는 일반적인 접근법은 하기의 단계들을 수반한다: 1) 교환 후보 쌍을 선택하고, 2) 상기 UGT 쌍 사이에 키메라를 생성시키기 위한 도메인 교환 부위를 선택하고(임의로 표적화된 기질과의 상호작용을 개선시키기 위한 C-말단 도메인 및 N-말단 도메인을 돌연변이시키기 위해), 3) 목적하는 활성을 위해 키메릭 단백질을 생성시키고, 시험하고 전개시킨다. 상기 접근법은 본 실시예에서 하기에 기재되는 바와 같은 도메인 교환을 수행하기 위해 고려되었다.

4개의 UGT를 키메라 구성을 위한 모체로서 선택하였다: UGT40087 (서열번호 11), UGT Si91D유사 (서열번호 12), OS_UGT_91C1 (서열번호 8), 및 91D유사3 (서열번호 7). UGT40087의 N-말단 도메인을 사용하여 Si91D유사, OS_UGT_91C1 및 91D유사3의 N-말단 도메인을 교체시켜, UGT40087에 대해 각각 97%, 79% 및 71%의 전체 서열 동일성을 갖는 3개의 키메라를 생성시켰다.

SWISS-MODEL을 사용하여 4개의 UGT 모두에 대한 구조적 모델을 생성시켰다. 정확한 아미노산 위치("교환 부위")를 구조적 정렬 및 서열 정렬에 기반하여 선택하였다. 상기 키메릭 단백질의 3차원 폴딩에 대한 동요를 최소화하기 위해서, 상기 효소의 2개의 분명한 절반을 구성하는 N- 및 C-말단 도메인 사이에 위치한 가요성 영역(도 6)을 교환 부위에 사용하였다. 상기 영역 중 Gly215 및 Leu216(아미노산 번호는 UGT40087에 관한 것이다)는 본 실시예에서 4개의 UGT를 포함하여 모든 UGT에서 고도로 보존된다. 따라서, 상기 2개의 도메인은 도메인 교환을 위해 상기 2개 잔기 사이에서 분할되었다(도 6).

도메인 교환 효과를 시험하기 위해서, 상이한 UGT를 포함함을 제외하고 유전학적으로 일치하는 효모 균주들에서 실험을 수행하였다. 상기 효모 균주는 그러나 실시예 4에 기재된 UGT 다양성 선별에 사용된 것들과 유전학적으로 상이하다. 실시예 4 내지 7에 기재된 일반적인 방법을 균주 형질전환, 배양 및 분석에 사용하였다. 다양한 도메인 교환 디자인의 RebA에서 RebD로의 전환비를 하기 표 8에 나타낸다.

[표 8]

UGT40087은 Si91D유사, Os_UGT_91C1 및 91D유사3과 각각 90%, 54% 및 36%의 전체적인 서열 동일성을 공유한다. 91D유사3(UGT40087에 대해 N- 및 C-말단 서열 모두에서 대략적으로 40%의 서열 동일성을 갖는다)을 제외하고, 상기 Si91D유사 및 Os_UGT_91C1의 UGT40087 N-말단 도메인 및 C-말단 도메인의 키메라들은 RebA에서 RebD로의 전환에서 활성이다(표 8). Si91D유사가 검출 가능한 활성을 갖지 않는다 하더라도, 그의 N-말단 도메인의 UGT40087의 N-말단 도메인에 의한 교체는 상기 UGT40087 활성의 전부를 부여하였으며, 이는 UGT40087의 N-말단 도메인이 RebA에서 RebD로의 전환에 중요함을 가리킨다.

상기 4개의 모 UGT의 정렬은 또한, RebA에서 RebD로의 전환에 대해서 2개의 활성 효소(UGT40087 및 Os_UGT_91C1)에 의해 공유되지만 2개의 불활성 효소(Si9D유사 및 91D유사3)의 경우와 상이한 6개의 N-말단 아미노산 잔기(UGT40087에서 V11, I12, P55, E90, S203, E223, 및 V413; 도 8 - 서열 정렬 도면)를 밝혀낸다.

실시예 12. N-말단 고리 교환에 의한 UGT 변체의 조작

UGT40087 및 Os_UGT_91C1의 모델 구조의 비교는 N 말단 당 수용체 도메인에서 현저한 입체형태적 차이를 갖는 4개의 고리를 밝혀내었다. 상기 고리 위치를 도 6에 나타낸다. RebA에서 RebD로의 전환에 대한 UGT40087의 우수한 활성에 기여할 수 있는 고리들을 식별하기 위해서, 이들 각각의 고리를 상기 2개의 단백질에서 교환하여 총 12개의 UGT 변체를 생성시켰다. 고리_3 및 고리_4의 2개의 버전을, 2개의 가능한 고리 길이를 설명하기 위해 설계하였다. 상세한 디자인들을 표 9 및 10에 나열한다.

[표 9]

표 9에서, 아래첨자를 갖는 2개의 아미노산 잔기들간의 서열 ID 번호를 갖는 아미노산 서열은 Os_UGT_91C에서부터 UGT40087 염기로 교환되는 고리 영역이다. Os_UGT_91C로부터 교환된 고리 영역에 인접한 아래첨자를 갖는 2개 아미노산 잔기 및 아래첨자 번호는 각각, 상기 교환된 고리 영역의 통합 전에 UGT40087의 아미노산 잔기 및 아미노산 위치에 상응한다. 표 9에 나열된 새로운 키메릭 UGT에서, Os_UGT_91C로부터의 교환된 고리 영역은 상기 UGT40087 염기의 상응하는 고리 영역과 교체되었다.

UGT40087_고리1에 통합된, 교환된 고리 영역인 서열번호 27의 아미노산 서열은 Os_UGT_91C1의 원래 고리 1의 변형된 버전임에 유의한다. 보다 구체적으로, 서열번호 27의 서열 중 12번째 아미노산 잔기는 프롤린(서열번호 8을 갖는 Os_UGT_91C의 원래 고리1 중 상응하는 위치에 존재하는 아르기닌 대신에)이다. 따라서, UGT40087_고리1에서, 서열번호 11을 갖는 UGT40087의 원래 서열에 비해, 51번 위치에 단일 아미노산 치환, 프롤린이 존재한다. UGT40087_고리1 중 51번 위치에서 치환된 프롤린의 위치를 표 9에 굵은 글씨로 나타낸다.

[표 10]

표 10에서, 아래첨자를 갖는 2개의 아미노산 잔기들간의 서열 ID 번호를 갖는 아미노산 서열은 UGT40087에서 Os_UGT_91C1 염기로 교환되는 고리 영역이다. UGT40087로부터 교환된 고리 영역에 인접한 아래첨자를 갖는 2개 아미노산 잔기 및 아래첨자 번호는 각각, 상기 교환된 고리 영역의 통합 전에 Os_UGT_91C1의 아미노산 잔기 및 아미노산 위치에 상응한다. 표 10에 나열된 새로운 키메릭 UGT에서, UGT40087로부터의 교환된 고리 영역은 상기 Os_UGT_91C1 염기의 상응하는 고리 영역과 교체되었다.

Os_UGT_91C1_고리1에 통합된, 교환된 고리 영역인 서열번호 28의 아미노산 서열은 UGT40087의 원래 고리 1의 변형된 버전임에 유의한다. 보다 구체적으로, 서열번호 28의 서열 중 12번째 아미노산 잔기는 아르기닌(서열번호 11을 갖는 UGT40087의 원래 고리1 중 상응하는 위치에 존재하는 프롤린 대신에)이다. 따라서, Os_UGT_91C1_고리1에서, 서열번호 8을 갖는 Os_UGT_91C1의 원래 서열에 비해, 58번 위치에 단일 아미노산 치환, 아르기닌이 존재한다. Os_UGT_91C1_고리1 중 58번 위치에서 치환된 아르기닌의 위치를 표 10에 굵은 글씨로 나타낸다.

상기 변형 단백질들을 실시예 4에 기재된 랜딩 패드 중의 GAL1 프로모터 및 F-CphI 서열에 측면 인접하는 효모 종결자에 상동성인 60 bp의 서열로 트위스트 바이오사이언스(Twist Bioscience)에 의해 합성하였다. 각각의 합성된 UGT 변체를 UGT 도메인 교환 키메라 실험을 위해 실시예 11에서와 동일한 균주 배경에서 RebA에서 RebD로의 전환에 대한 그의 활성에 대해서 단일 염색체 사본으로서 개별적으로 시험하였다. 상기 균주를 생성시키기 위해서, UGT 키메라 공여체 DNA 및 엔도뉴클레아제 F-CphI를 함유하는 플라스미드를 상기 효모 숙주내로 형질전환시켰다. 상기 통합 유전자좌의 단부에서 범용 순방향 프라이머 및 특이적인 UGT 유전자 내부의 역방향 프라이머를 사용하여 콜로니 PCR에 의해 정확한 통합을 확인하였다. 상기 확인된 균주들을 상술한 바와 같이 RebA에서 RebD로의 전환에 대해 시험하였다.

[표 11]

[표 12]

모체로서 UGT40087을 사용하는 경우, 상기 고리-교환 변체는, UGT40087_고리4_2를 제외하고, 모두 RebA에서 RebD로의 전환에 활성이었다(표 11). 고리4_2는 N- 및 C-말단 도메인 계면에 가깝게 위치하는 긴 서열이며, 그의 교체는 상기 변체의 전체적인 구조에 현저한 동요를 생성시킬 수 있다. 상기 모든 활성 변체 중에서, UGT40087에 대한 N-말단 서열 동일성 범위는 84%(고리4_1) 내지 99%(고리1)이다.

모체로서 Os_UGT_91C1을 사용하는 경우, 상기 고리-교환 변체의 대부분은 또한 RebA에서 RebD로의 전환에 활성을 나타내었다(표 12). 다시, 고리4_2 교환은 상기 활성을 없앴으며, 이는 그의 교체가 상기 변체의 구조적 완전성에 영향을 미칠 수 있다는 가설을 지지한다. 현저하게, 상기 고리4_1의 통합은 증가된 RebA에서 RebD로의 전환(88%에서 97%로)을 도출하였으며, 이는 고리4_1이 UGT40087의 우수한 활성 부여에 기여함을 가리킨다. 또한, 모체로서 상기 두 단백질 모두를 사용한 고리 교환 실험으로부터의 결과는 또한 이들 고리 영역이 RebA에서 RebD로의 활성을 갖는 UGT의 활성 및 기질 특이성에 있어서 차이를 부여하는데 중요하며, 이들 고리 영역의 상동성 고리 변체의 추가적인 교환 또는 돌연변이유발을 사용하여 RebA의 RebD로의 전환에 개선된 UGT 변체를 생성시킬 수 있음을 입증하였다.

본 명세서에 인용된 모든 공보, 특허 및 특허 출원들은 각각의 개별적인 공보 또는 특허 출원이 구체적이고 개별적으로 참고로 인용됨을 가리키는 바와 같이 본 명세서에 참고로 인용된다. 상기 발명을 이해의 명확성을 위해 예시 및 실시예에 의해 일부 상세히 기재하였지만, 당해 분야의 숙련가들에게는 본 발명의 교시에 비추어 첨부된 청구항들의 진의 또는 범위로부터 이탈됨 없이 본 발명에 대해 몇몇 변화 및 변형을 수행할 수 있음이 쉽게 자명할 것이다.

SEQUENCE LISTING <110> AMYRIS, INC. <120> UDP-DEPENDENT GLYCOSYLTRANSFERASE FOR HIGH EFFICIENCY PRODUCTION OF REBAUDIOSIDES <130> IPA190070-US <150> US 62/374,408 <151> 2016-08-12 <160> 30 <170> PatentIn version 3.5 <210> 1 <211> 436 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: UGT40087 version 1 <400> 1 Met Asp Ala Ser Asp Ser Ser Pro Leu His Ile Val Ile Phe Pro Trp 1 5 10 15 Leu Ala Phe Gly His Met Leu Ala Ser Leu Glu Leu Ala Glu Arg Leu 20 25 30 Ala Ala Arg Gly His Arg Val Ser Phe Val Ser Thr Pro Arg Asn Ile 35 40 45 Ser Arg Leu Arg Pro Val Pro Pro Ala Leu Ala Pro Leu Ile Asp Phe 50 55 60 Val Ala Leu Pro Leu Pro Arg Val Asp Gly Leu Pro Asp Gly Ala Glu 65 70 75 80 Ala Thr Ser Asp Ile Pro Pro Gly Lys Thr Glu Leu His Leu Lys Ala 85 90 95 Leu Asp Gly Leu Ala Ala Pro Phe Ala Ala Phe Leu Asp Ala Ala Cys 100 105 110 Ala Asp Gly Ser Thr Asn Lys Val Asp Trp Leu Phe Leu Asp Asn Phe 115 120 125 Gln Tyr Trp Ala Ala Ala Ala Ala Ala Asp His Lys Ile Pro Cys Ala 130 135 140 Leu Asn Leu Thr Phe Ala Ala Ser Thr Ser Ala Glu Tyr Gly Val Pro 145 150 155 160 Arg Val Glu Pro Pro Val Asp Gly Ser Thr Ala Ser Ile Leu Gln Arg 165 170 175 Phe Val Leu Thr Leu Glu Lys Cys Gln Phe Val Ile Gln Arg Ala Cys 180 185 190 Phe Glu Leu Glu Pro Glu Pro Leu Pro Leu Leu Ser Asp Ile Phe Gly 195 200 205 Lys Pro Val Ile Pro Tyr Gly Leu Val Pro Pro Cys Pro Pro Ala Glu 210 215 220 Gly His Lys Arg Glu His Gly Asn Ala Ala Leu Ser Trp Leu Asp Lys 225 230 235 240 Gln Gln Pro Glu Ser Val Leu Phe Ile Ala Leu Gly Ser Glu Pro Pro 245 250 255 Val Thr Val Glu Gln Leu His Glu Ile Ala Leu Gly Leu Glu Leu Ala 260 265 270 Gly Thr Thr Phe Leu Trp Ala Leu Lys Lys Pro Asn Gly Leu Leu Leu 275 280 285 Glu Ala Asp Gly Asp Ile Leu Pro Pro Gly Phe Glu Glu Arg Thr Arg 290 295 300 Asp Arg Gly Leu Val Ala Met Gly Trp Val Pro Gln Pro Ile Ile Leu 305 310 315 320 Ala His Ser Ser Val Gly Ala Phe Leu Thr His Gly Gly Trp Ala Ser 325 330 335 Thr Ile Glu Gly Val Met Ser Gly His Pro Met Leu Phe Leu Thr Phe 340 345 350 Leu Asp Glu Gln Arg Ile Asn Ala Gln Leu Ile Glu Arg Lys Lys Ala 355 360 365 Gly Leu Arg Val Pro Arg Arg Glu Lys Asp Gly Ser Tyr Asp Arg Gln 370 375 380 Gly Ile Ala Gly Ala Ile Arg Ala Val Met Cys Glu Glu Glu Ser Lys 385 390 395 400 Ser Val Phe Ala Ala Asn Ala Lys Lys Met Gln Glu Ile Val Ser Asp 405 410 415 Arg Asn Cys Gln Glu Lys Tyr Ile Asp Glu Leu Ile Gln Arg Leu Gly 420 425 430 Ser Phe Glu Lys 435 <210> 2 <211> 449 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: sr.UGT_g252778 <400> 2 Met Ala Thr Asn Asp Asp Asp Arg Lys Gln Leu His Val Ala Met Phe 1 5 10 15 Pro Trp Leu Ala Phe Gly His Ile Leu Pro Phe Leu Glu Leu Ser Lys 20 25 30 Leu Ile Ala Gln Asn Gly His Lys Val Ser Phe Leu Ser Thr Thr Arg 35 40 45 Asn Ile Gln Arg Leu Pro Ser His Leu Thr Pro Leu Ile Asn Leu Val 50 55 60 Lys Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp Ala Glu Ala 65 70 75 80 Thr Thr Asp Ile Lys His Asp Asp Gln Asp His Leu Leu Asn Ala Ser 85 90 95 Asp Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Glu Glu Ser Pro 100 105 110 Asp Trp Ile Ile Phe Asp Tyr Ser Tyr Tyr Trp Leu Pro Pro Val Ala 115 120 125 Ala Glu Leu Gly Ile Ser Arg Ala Phe Phe Met Thr Phe Pro Thr Trp 130 135 140 Thr Met Ala Leu Thr Arg Leu Pro Ser Asp Gln Leu Thr Ala Glu Asp 145 150 155 160 Leu Met Thr Leu Ser Lys Ile Ser Phe Lys Lys His Glu Ile Val Asn 165 170 175 Leu Met Tyr Gly Thr Ser Thr Gln Gly Asp Leu Tyr Arg Leu Thr Met 180 185 190 Ala Cys Asn Gly Ser Asp Cys Ile Leu Ile Arg Cys Cys Tyr Glu Phe 195 200 205 Glu Pro Gln Trp Leu Thr Leu Leu Glu Lys Leu Leu Pro Val Pro Val 210 215 220 Val Pro Val Gly Leu Leu Pro Pro Glu Ile His Gly Asp Glu Lys Asp 225 230 235 240 Asp Asp Thr Trp Val Ser Val Lys Glu Trp Leu Asp Gly Gln His Lys 245 250 255 Gly His Val Val Tyr Val Ala Leu Gly Ser Glu Ala Met Val Ser Lys 260 265 270 Asp Glu Leu Gly Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly Leu Pro 275 280 285 Phe Phe Trp Ala Leu Arg Lys Pro Pro Gly Ser Thr Glu Ser Asp Ser 290 295 300 Val Glu Leu Pro Asp Gly Phe Met Glu Arg Thr Arg Asn Arg Gly Val 305 310 315 320 Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His Glu Ser 325 330 335 Val Cys Gly Phe Leu Thr His Cys Gly Val Ser Ser Ile Val Glu Gly 340 345 350 Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly Asp Gln 355 360 365 Ile Met Asn Ala Gln Val Leu Ala Asp Lys Gln Val Gly Ile Glu Ile 370 375 380 Pro Arg Asn Glu Glu Asp Gly Trp Phe Thr Lys Glu Ser Val Ala Lys 385 390 395 400 Ser Leu Arg Ser Val Val Val Asp Asp Glu Gly Glu Ile Tyr Lys Ala 405 410 415 Asn Ala Arg Glu Leu Ser Lys Ile Phe Ser Asp Thr Asp Leu Gly Lys 420 425 430 Lys Tyr Ile Ser His Phe Ile Asp Phe Leu Met Met Glu Ile Val Lys 435 440 445 Thr <210> 3 <211> 460 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Bd_UGT10840 <400> 3 Met Asp Asn Gly Ser Ser Ser Ser Ser Ser Ser Pro Leu His Val Val 1 5 10 15 Ile Cys Pro Trp Leu Ala Phe Gly His Gln Leu Pro Cys Leu Asp Leu 20 25 30 Ala Glu Arg Leu Ala Leu Arg Gly His Arg Val Ser Phe Val Ser Thr 35 40 45 Pro Arg Ile Ile Ala Arg Leu Pro Pro Val Arg Pro Val Ala Ala Ser 50 55 60 Leu Val Asp Leu Val Ala Leu Pro Leu Pro Arg Val Asp Gly Leu Pro 65 70 75 80 Glu Gly Ala Glu Ser Thr Asn Asp Val Pro Tyr Glu Lys Phe Glu Leu 85 90 95 His Arg Lys Ala Phe Asp Gly Leu Ala Val Pro Phe Ser Glu Phe Leu 100 105 110 Arg Ala Ala Cys Ala Glu Glu Gly Lys Lys Pro Asp Trp Ile Ile Val 115 120 125 Asp Thr Phe His His Trp Ala Ala Ala Ala Ala Ile Glu His Lys Val 130 135 140 Pro Cys Ala Met Leu Met Leu Gly Ala Ala Gly Leu Ile Val Ala Trp 145 150 155 160 Ala Thr Gln Pro Ser Lys His Val Thr Ser Glu Gln Gln Glu Gln Ser 165 170 175 Ala Ala Glu Pro Pro Arg Phe Glu Thr Glu Arg Arg Lys Leu Ala Thr 180 185 190 Thr Gln Arg Ala Ser Gly Met Ser Ile Ala Glu Arg Cys Ser Val Thr 195 200 205 Leu Glu Arg Cys Asn Leu Val Ala Met Arg Ser Cys Leu Glu Trp Glu 210 215 220 Pro Glu Ser Ile Pro Leu Ala Thr Thr Ile Gly Gly Lys Gln Leu Val 225 230 235 240 Pro Leu Gly Leu Leu Pro Pro Ser Pro Glu Gly Gly Arg Gly Val Ser 245 250 255 Lys Glu Asp Ala Thr Val Arg Trp Leu Asp Ala Gln Pro Thr Lys Ser 260 265 270 Val Val Tyr Val Ala Leu Gly Ser Glu Val Pro Leu Gly Ala Lys Glu 275 280 285 Val His Glu Leu Ala Leu Gly Leu Glu Leu Ala Gly Thr Arg Phe Leu 290 295 300 Trp Ser Leu Arg Lys Pro Ser Gly Val Ser Asp Ala Asp Ile Leu Pro 305 310 315 320 Ser Gly Phe Glu Glu Arg Thr Arg Gly Arg Gly Leu Val Thr Met Gly 325 330 335 Trp Val Pro Gln Ile Ser Val Leu Ala His Gly Ala Val Gly Ala Phe 340 345 350 Leu Thr His Cys Gly Trp Asn Ser Ile Ile Glu Gly Leu Gln Phe Gly 355 360 365 His Pro Leu Val Met Leu Pro Ile Phe Gly Asp Gln Gly Pro Asn Ala 370 375 380 Arg Met Met Glu Gly Arg Lys Val Gly Val Gln Val Pro Arg Asp Glu 385 390 395 400 Ser Asn Gly Ser Phe Asp Arg Glu Gly Val Ala Thr Thr Val Arg Ala 405 410 415 Val Ala Val Glu Glu Glu Gly Asn Arg Ile Phe Thr Ala Asn Ala Lys 420 425 430 Lys Met Gln Glu Ile Val Ala Asp Lys Gly Cys His Asp Lys Tyr Val 435 440 445 Asp Lys Phe Ile Gln Lys Leu Arg Ser Tyr Met Glu 450 455 460 <210> 4 <211> 463 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Hv_UGT_V1 <400> 4 Met Asp Gly Asp Gly Asn Ser Ser Ser Ser Ser Ser Pro Leu His Val 1 5 10 15 Val Ile Cys Pro Trp Leu Ala Leu Gly His Leu Leu Pro Cys Leu Asp 20 25 30 Ile Ala Glu Arg Leu Ala Ser Arg Gly His Arg Val Ser Phe Val Ser 35 40 45 Thr Pro Arg Asn Ile Ala Arg Leu Pro Pro Leu Arg Pro Ala Val Ala 50 55 60 Pro Leu Val Glu Phe Val Ala Leu Pro Leu Pro His Val Asp Gly Leu 65 70 75 80 Pro Glu Gly Ala Glu Ser Thr Asn Asp Val Pro Tyr Asp Lys Phe Glu 85 90 95 Leu His Arg Lys Ala Phe Asp Gly Leu Ala Ala Pro Phe Ser Glu Phe 100 105 110 Leu Arg Ala Ala Cys Ala Glu Gly Ala Gly Ser Arg Pro Asp Trp Leu 115 120 125 Ile Val Asp Thr Phe His His Trp Ala Ala Ala Ala Ala Val Glu Asn 130 135 140 Lys Val Pro Cys Val Met Leu Leu Leu Gly Ala Ala Thr Val Ile Ala 145 150 155 160 Gly Phe Ala Arg Gly Val Ser Glu His Ala Ala Ala Ala Val Gly Lys 165 170 175 Glu Arg Pro Ala Ala Glu Ala Pro Ser Phe Glu Thr Glu Arg Arg Lys 180 185 190 Leu Met Thr Thr Gln Asn Ala Ser Gly Met Thr Val Ala Glu Arg Tyr 195 200 205 Phe Leu Thr Leu Met Arg Ser Asp Leu Val Ala Ile Arg Ser Cys Ala 210 215 220 Glu Trp Glu Pro Glu Ser Val Ala Ala Leu Thr Thr Leu Ala Gly Lys 225 230 235 240 Pro Val Val Pro Leu Gly Leu Leu Pro Pro Ser Pro Glu Gly Gly Arg 245 250 255 Gly Val Ser Lys Glu Asp Ala Ala Val Arg Trp Leu Asp Ala Gln Pro 260 265 270 Ala Lys Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Pro Leu Arg 275 280 285 Ala Glu Gln Val His Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly Ala 290 295 300 Arg Phe Leu Trp Ala Leu Arg Lys Pro Thr Asp Ala Pro Asp Ala Ala 305 310 315 320 Val Leu Pro Pro Gly Phe Glu Glu Arg Thr Arg Gly Arg Gly Leu Val 325 330 335 Val Thr Gly Trp Val Pro Gln Ile Gly Val Leu Ala His Gly Ala Val 340 345 350 Ala Ala Phe Leu Thr His Cys Gly Trp Asn Ser Thr Ile Glu Gly Leu 355 360 365 Leu Phe Gly His Pro Leu Ile Met Leu Pro Ile Ser Ser Asp Gln Gly 370 375 380 Pro Asn Ala Arg Leu Met Glu Gly Arg Lys Val Gly Met Gln Val Pro 385 390 395 400 Arg Asp Glu Ser Asp Gly Ser Phe Arg Arg Glu Asp Val Ala Ala Thr 405 410 415 Val Arg Ala Val Ala Val Glu Glu Asp Gly Arg Arg Val Phe Thr Ala 420 425 430 Asn Ala Lys Lys Met Gln Glu Ile Val Ala Asp Gly Ala Cys His Glu 435 440 445 Arg Cys Ile Asp Gly Phe Ile Gln Gln Leu Arg Ser Tyr Lys Ala 450 455 460 <210> 5 <211> 464 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Bd_UGT10850 <400> 5 Met Asp Ala Ala Gly Ser Ser Ser Pro Met His Ile Val Ile Phe Pro 1 5 10 15 Trp Leu Ala Ser Gly His Leu Leu Pro Cys Leu Glu Leu Ala Glu Arg 20 25 30 Leu Ala Ala Arg Gly His Leu Val Ser Phe Val Ser Thr Pro Arg Asn 35 40 45 Leu Ala Arg Leu Pro Pro Val Ser Pro Ala Leu Ala Pro Leu Val Asp 50 55 60 Leu Val Ala Leu Pro Leu Pro Arg Val Ala Gly Leu Pro Asp Gly Ala 65 70 75 80 Glu Ser Thr Ala Asp Val Pro Ala Asp Lys Phe Asp Leu His Arg Gln 85 90 95 Ala Phe Asp Gly Leu Ala Ala Pro Phe Ala Ala Phe Leu Asp Ala Asp 100 105 110 Val Gly Lys Lys Lys Lys Pro Asp Trp Ile Val Ala Asp Phe Val His 115 120 125 His Trp Val Ala Ala Ala Ala Gln Glu Arg Glu Val Pro Cys Ala Met 130 135 140 Leu Val Pro Cys Ala Ala Ala Val Ala Val Leu Ala Gly Pro Pro Pro 145 150 155 160 Glu Ser Ile Ser Asn Ala Asp Glu Arg Gln Val Ile Val Lys Val Met 165 170 175 Asp Ala Ala Pro Arg Phe Glu Ala Glu Gln Ala Met Glu Glu Phe Ala 180 185 190 Ala Glu Asp Ala Ser Gly Ser Ser Ser Gly Leu Ser Val Leu Ser Arg 195 200 205 Phe Tyr Met Thr Leu Lys Arg Cys Lys Val Val Ala Leu Arg Ser Cys 210 215 220 Pro Glu Leu Glu Pro Asp Ala Phe Pro Leu Leu Thr Arg Leu Tyr Gly 225 230 235 240 Lys Pro Ala Val Pro Leu Gly Leu Leu Pro Pro Pro Pro Asn Gly Thr 245 250 255 Arg Ser Arg Gly Met Asp Asp Glu Ala Ile Ile Arg Trp Leu Asn Ala 260 265 270 Gln Pro Ala Ser Ser Val Val Tyr Val Ala Leu Gly Ser Glu Ala Pro 275 280 285 Leu Arg Ala Glu Leu Leu Arg Glu Leu Ala His Gly Leu Glu Leu Ala 290 295 300 Gly Thr Arg Phe Leu Trp Ala Leu Arg Lys Pro Val Gly Val Gln Asp 305 310 315 320 Gly Asp Ser Val Leu Pro Asp Gly Phe Val Glu Arg Thr Ser Arg Arg 325 330 335 Gly Leu Val Val Ala Arg Trp Val Ser Gln Val Ser Ile Leu Ala His 340 345 350 Gly Ala Val Gly Ala Phe Leu Thr His Cys Gly Trp Gly Ser Val Val 355 360 365 Glu Gly Leu Gln Phe Gly Arg Pro Leu Ile Met Leu Pro Ile Ala Gly 370 375 380 Asp Gln Gly Pro Asn Ala Arg Leu Met Glu Glu Arg Lys Val Gly Val 385 390 395 400 Ser Val Pro Arg Asp Glu Lys Asp Gly Ser Phe Thr Arg Gly Gly Val 405 410 415 Ala Gly Ala Ile Arg Ala Val Val Val Glu Glu Asp Gly Arg Leu Phe 420 425 430 Ala Ala Asn Ala Glu Lys Leu Arg Glu Ile Val Ala Ser Arg Glu Cys 435 440 445 His Glu Arg Cys Ile Asp Gly Phe Ile Gln His Leu Arg Cys Cys Lys 450 455 460 <210> 6 <211> 464 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Ob_UGT91B1_like <400> 6 Met Glu Asn Gly Ser Ser Pro Leu His Val Val Ile Phe Pro Trp Leu 1 5 10 15 Ala Phe Gly His Leu Leu Pro Phe Leu Asp Leu Ala Glu Arg Leu Ala 20 25 30 Ala Arg Gly His Arg Val Ser Phe Val Ser Thr Pro Arg Asn Leu Ala 35 40 45 Arg Leu Arg Pro Val Arg Pro Ala Leu Arg Gly Leu Val Asp Leu Val 50 55 60 Ala Leu Pro Leu Pro Arg Val His Gly Leu Pro Asp Gly Ala Glu Ala 65 70 75 80 Thr Ser Asp Val Pro Phe Glu Lys Phe Glu Leu His Arg Lys Ala Phe 85 90 95 Asp Gly Leu Ala Ala Pro Phe Ser Ala Phe Leu Asp Ala Ala Cys Ala 100 105 110 Gly Asp Lys Arg Pro Asp Trp Val Ile Pro Asp Phe Met His Tyr Trp 115 120 125 Val Ala Ala Ala Ala Gln Lys Arg Gly Val Pro Cys Ala Val Leu Ile 130 135 140 Pro Cys Ser Ala Asp Val Met Ala Leu Tyr Gly Gln Pro Thr Glu Thr 145 150 155 160 Ser Thr Glu Gln Pro Glu Ala Ile Ala Arg Ser Met Ala Ala Glu Ala 165 170 175 Pro Ser Phe Glu Ala Glu Arg Asn Thr Glu Glu Tyr Gly Thr Ala Gly 180 185 190 Ala Ser Gly Val Ser Ile Met Thr Arg Phe Ser Leu Thr Leu Lys Trp 195 200 205 Ser Lys Leu Val Ala Leu Arg Ser Cys Pro Glu Leu Glu Pro Gly Val 210 215 220 Phe Thr Thr Leu Thr Arg Val Tyr Ser Lys Pro Val Val Pro Phe Gly 225 230 235 240 Leu Leu Pro Pro Arg Arg Asp Gly Ala His Gly Val Arg Lys Asn Gly 245 250 255 Glu Asp Asp Gly Ala Ile Ile Arg Trp Leu Asp Glu Gln Pro Ala Lys 260 265 270 Ser Val Val Tyr Val Ala Leu Gly Ser Glu Ala Pro Val Ser Ala Asp 275 280 285 Leu Leu Arg Glu Leu Ala His Gly Leu Glu Leu Ala Gly Thr Arg Phe 290 295 300 Leu Trp Ala Leu Arg Arg Pro Ala Gly Val Asn Asp Gly Asp Ser Ile 305 310 315 320 Leu Pro Asn Gly Phe Leu Glu Arg Thr Gly Glu Arg Gly Leu Val Thr 325 330 335 Thr Gly Trp Val Pro Gln Val Ser Ile Leu Ala His Ala Ala Val Cys 340 345 350 Ala Phe Leu Thr His Cys Gly Trp Gly Ser Val Val Glu Gly Leu Gln 355 360 365 Phe Gly His Pro Leu Ile Met Leu Pro Ile Ile Gly Asp Gln Gly Pro 370 375 380 Asn Ala Arg Phe Leu Glu Gly Arg Lys Val Gly Val Ala Val Pro Arg 385 390 395 400 Asn His Ala Asp Gly Ser Phe Asp Arg Ser Gly Val Ala Gly Ala Val 405 410 415 Arg Ala Val Ala Val Glu Glu Glu Gly Lys Ala Phe Ala Ala Asn Ala 420 425 430 Arg Lys Leu Gln Glu Ile Val Ala Asp Arg Glu Arg Asp Glu Arg Cys 435 440 445 Thr Asp Gly Phe Ile His His Leu Thr Ser Trp Asn Glu Leu Glu Ala 450 455 460 <210> 7 <211> 485 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: UGT91D_like3 <400> 7 Met Tyr Asn Val Thr Tyr His Gln Asn Ser Lys Ala Met Ala Thr Ser 1 5 10 15 Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Val Ala Thr Phe Pro 20 25 30 Trp Leu Ala Phe Gly His Ile Leu Pro Tyr Leu Gln Leu Ser Lys Leu 35 40 45 Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser Thr Thr Arg Asn 50 55 60 Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile Asn Val Val Gln 65 70 75 80 Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp Ala Glu Ala Thr 85 90 95 Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys Lys Ala Ser Asp 100 105 110 Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Gln His Ser Pro Asp 115 120 125 Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro Ser Ile Ala Ala 130 135 140 Ser Leu Gly Ile Ser Arg Ala His Phe Ser Val Thr Thr Pro Trp Ala 145 150 155 160 Ile Ala Tyr Met Gly Pro Ser Ala Asp Ala Met Ile Asn Gly Ser Asp 165 170 175 Gly Arg Thr Thr Val Glu Asp Leu Thr Thr Pro Pro Lys Trp Phe Pro 180 185 190 Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu Ala Arg Leu Val 195 200 205 Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg Met Gly Leu Val 210 215 220 Leu Lys Gly Ser Asp Cys Leu Leu Ser Lys Cys Tyr His Glu Phe Gly 225 230 235 240 Thr Gln Trp Leu Pro Leu Leu Glu Thr Leu His Gln Val Pro Val Val 245 250 255 Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp Glu Lys Asp Glu 260 265 270 Thr Trp Val Ser Ile Lys Lys Trp Leu Asp Gly Lys Gln Lys Gly Ser 275 280 285 Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val Ser Gln Thr Glu 290 295 300 Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly Leu Pro Phe Val 305 310 315 320 Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser Asp Ser Val Glu 325 330 335 Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg Gly Leu Val Trp 340 345 350 Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His Glu Ser Val Cys 355 360 365 Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val Glu Gly Leu Met 370 375 380 Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly Asp Gln Pro Leu 385 390 395 400 Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile Glu Ile Pro Arg 405 410 415 Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val Ala Arg Ser Leu 420 425 430 Arg Ser Val Val Val Glu Lys Glu Gly Glu Ile Tyr Lys Ala Asn Ala 435 440 445 Arg Glu Leu Ser Lys Ile Tyr Asn Asp Thr Lys Val Glu Lys Glu Tyr 450 455 460 Val Ser Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala Arg Ala Val Ala 465 470 475 480 Ile Asp His Glu Ser 485 <210> 8 <211> 462 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Os_UGT_91C1 <400> 8 Met Asp Ser Gly Tyr Ser Ser Ser Tyr Ala Ala Ala Ala Gly Met His 1 5 10 15 Val Val Ile Cys Pro Trp Leu Ala Phe Gly His Leu Leu Pro Cys Leu 20 25 30 Asp Leu Ala Gln Arg Leu Ala Ser Arg Gly His Arg Val Ser Phe Val 35 40 45 Ser Thr Pro Arg Asn Ile Ser Arg Leu Pro Pro Val Arg Pro Ala Leu 50 55 60 Ala Pro Leu Val Ala Phe Val Ala Leu Pro Leu Pro Arg Val Glu Gly 65 70 75 80 Leu Pro Asp Gly Ala Glu Ser Thr Asn Asp Val Pro His Asp Arg Pro 85 90 95 Asp Met Val Glu Leu His Arg Arg Ala Phe Asp Gly Leu Ala Ala Pro 100 105 110 Phe Ser Glu Phe Leu Gly Thr Ala Cys Ala Asp Trp Val Ile Val Asp 115 120 125 Val Phe His His Trp Ala Ala Ala Ala Ala Leu Glu His Lys Val Pro 130 135 140 Cys Ala Met Met Leu Leu Gly Ser Ala His Met Ile Ala Ser Ile Ala 145 150 155 160 Asp Arg Arg Leu Glu Arg Ala Glu Thr Glu Ser Pro Ala Ala Ala Gly 165 170 175 Gln Gly Arg Pro Ala Ala Ala Pro Thr Phe Glu Val Ala Arg Met Lys 180 185 190 Leu Ile Arg Thr Lys Gly Ser Ser Gly Met Ser Leu Ala Glu Arg Phe 195 200 205 Ser Leu Thr Leu Ser Arg Ser Ser Leu Val Val Gly Arg Ser Cys Val 210 215 220 Glu Phe Glu Pro Glu Thr Val Pro Leu Leu Ser Thr Leu Arg Gly Lys 225 230 235 240 Pro Ile Thr Phe Leu Gly Leu Met Pro Pro Leu His Glu Gly Arg Arg 245 250 255 Glu Asp Gly Glu Asp Ala Thr Val Arg Trp Leu Asp Ala Gln Pro Ala 260 265 270 Lys Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Pro Leu Gly Val 275 280 285 Glu Lys Val His Glu Leu Ala Leu Gly Leu Glu Leu Ala Gly Thr Arg 290 295 300 Phe Leu Trp Ala Leu Arg Lys Pro Thr Gly Val Ser Asp Ala Asp Leu 305 310 315 320 Leu Pro Ala Gly Phe Glu Glu Arg Thr Arg Gly Arg Gly Val Val Ala 325 330 335 Thr Arg Trp Val Pro Gln Met Ser Ile Leu Ala His Ala Ala Val Gly 340 345 350 Ala Phe Leu Thr His Cys Gly Trp Asn Ser Thr Ile Glu Gly Leu Met 355 360 365 Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly Asp Gln Gly Pro 370 375 380 Asn Ala Arg Leu Ile Glu Ala Lys Asn Ala Gly Leu Gln Val Ala Arg 385 390 395 400 Asn Asp Gly Asp Gly Ser Phe Asp Arg Glu Gly Val Ala Ala Ala Ile 405 410 415 Arg Ala Val Ala Val Glu Glu Glu Ser Ser Lys Val Phe Gln Ala Lys 420 425 430 Ala Lys Lys Leu Gln Glu Ile Val Ala Asp Met Ala Cys His Glu Arg 435 440 445 Tyr Ile Asp Gly Phe Ile Gln Gln Leu Arg Ser Tyr Lys Asp 450 455 460 <210> 9 <211> 442 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Sl_UGT_101249881 <400> 9 Met Ala Thr Asn Leu Arg Val Leu Met Phe Pro Trp Leu Ala Tyr Gly 1 5 10 15 His Ile Ser Pro Phe Leu Asn Ile Ala Lys Gln Leu Ala Asp Arg Gly 20 25 30 Phe Leu Ile Tyr Leu Cys Ser Thr Arg Ile Asn Leu Glu Ser Ile Ile 35 40 45 Lys Lys Ile Pro Glu Lys Tyr Ala Asp Ser Ile His Leu Ile Glu Leu 50 55 60 Gln Leu Pro Glu Leu Pro Glu Leu Pro Pro His Tyr His Thr Thr Asn 65 70 75 80 Gly Leu Pro Pro His Leu Asn Pro Thr Leu His Lys Ala Leu Lys Met 85 90 95 Ser Lys Pro Asn Phe Ser Arg Ile Leu Gln Asn Leu Lys Pro Asp Leu 100 105 110 Leu Ile Tyr Asp Val Leu Gln Pro Trp Ala Glu His Val Ala Asn Glu 115 120 125 Gln Asn Ile Pro Ala Gly Lys Leu Leu Thr Ser Cys Ala Ala Val Phe 130 135 140 Ser Tyr Phe Phe Ser Phe Arg Lys Asn Pro Gly Val Glu Phe Pro Phe 145 150 155 160 Pro Ala Ile His Leu Pro Glu Val Glu Lys Val Lys Ile Arg Glu Ile 165 170 175 Leu Ala Lys Glu Pro Glu Glu Gly Gly Arg Leu Asp Glu Gly Asn Lys 180 185 190 Gln Met Met Leu Met Cys Thr Ser Arg Thr Ile Glu Ala Lys Tyr Ile 195 200 205 Asp Tyr Cys Thr Glu Leu Cys Asn Trp Lys Val Val Pro Val Gly Pro 210 215 220 Pro Phe Gln Asp Leu Ile Thr Asn Asp Ala Asp Asn Lys Glu Leu Ile 225 230 235 240 Asp Trp Leu Gly Thr Lys His Glu Asn Ser Thr Val Phe Val Ser Phe 245 250 255 Gly Ser Glu Tyr Phe Leu Ser Lys Glu Asp Met Glu Glu Val Ala Phe 260 265 270 Ala Leu Glu Leu Ser Asn Val Asn Phe Ile Trp Val Ala Arg Phe Pro 275 280 285 Lys Gly Glu Glu Arg Asn Leu Glu Asp Ala Leu Pro Lys Gly Phe Leu 290 295 300 Glu Arg Ile Gly Glu Arg Gly Arg Val Leu Asp Lys Phe Ala Pro Gln 305 310 315 320 Pro Arg Ile Leu Asn His Pro Ser Thr Gly Gly Phe Ile Ser His Cys 325 330 335 Gly Trp Asn Ser Ala Met Glu Ser Ile Asp Phe Gly Val Pro Ile Ile 340 345 350 Ala Met Pro Ile His Asn Asp Gln Pro Ile Asn Ala Lys Leu Met Val 355 360 365 Glu Leu Gly Val Ala Val Glu Ile Val Arg Asp Asp Asp Gly Lys Ile 370 375 380 His Arg Gly Glu Ile Ala Glu Thr Leu Lys Ser Val Val Thr Gly Glu 385 390 395 400 Thr Gly Glu Ile Leu Arg Ala Lys Val Arg Glu Ile Ser Lys Asn Leu 405 410 415 Lys Ser Ile Arg Asp Glu Glu Met Asp Ala Val Ala Glu Glu Leu Ile 420 425 430 Gln Leu Cys Arg Asn Ser Asn Lys Ser Lys 435 440 <210> 10 <211> 500 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Sr.KAH <400> 10 Met Glu Ala Ser Tyr Leu Tyr Ile Ser Ile Leu Leu Leu Leu Ala Ser 1 5 10 15 Tyr Leu Phe Thr Thr Gln Leu Arg Arg Lys Ser Ala Asn Leu Pro Pro 20 25 30 Thr Val Phe Pro Ser Ile Pro Ile Ile Gly His Leu Tyr Leu Leu Lys 35 40 45 Lys Pro Leu Tyr Arg Thr Leu Ala Lys Ile Ala Ala Lys Tyr Gly Pro 50 55 60 Ile Leu Gln Leu Gln Leu Gly Tyr Arg Arg Val Leu Val Ile Ser Ser 65 70 75 80 Pro Ser Ala Ala Glu Glu Cys Phe Thr Asn Asn Asp Val Ile Phe Ala 85 90 95 Asn Arg Pro Lys Thr Leu Phe Gly Lys Ile Val Gly Gly Thr Ser Leu 100 105 110 Gly Ser Leu Ser Tyr Gly Asp Gln Trp Arg Asn Leu Arg Arg Val Ala 115 120 125 Ser Ile Glu Ile Leu Ser Val His Arg Leu Asn Glu Phe His Asp Ile 130 135 140 Arg Val Asp Glu Asn Arg Leu Leu Ile Arg Lys Leu Arg Ser Ser Ser 145 150 155 160 Ser Pro Val Thr Leu Ile Thr Val Phe Tyr Ala Leu Thr Leu Asn Val 165 170 175 Ile Met Arg Met Ile Ser Gly Lys Arg Tyr Phe Asp Ser Gly Asp Arg 180 185 190 Glu Leu Glu Glu Glu Gly Lys Arg Phe Arg Glu Ile Leu Asp Glu Thr 195 200 205 Leu Leu Leu Ala Gly Ala Ser Asn Val Gly Asp Tyr Leu Pro Ile Leu 210 215 220 Asn Trp Leu Gly Val Lys Ser Leu Glu Lys Lys Leu Ile Ala Leu Gln 225 230 235 240 Lys Lys Arg Asp Asp Phe Phe Gln Gly Leu Ile Glu Gln Val Arg Lys 245 250 255 Ser Arg Gly Ala Lys Val Gly Lys Gly Arg Lys Thr Met Ile Glu Leu 260 265 270 Leu Leu Ser Leu Gln Glu Ser Glu Pro Glu Tyr Tyr Thr Asp Ala Met 275 280 285 Ile Arg Ser Phe Val Leu Gly Leu Leu Ala Ala Gly Ser Asp Thr Ser 290 295 300 Ala Gly Thr Met Glu Trp Ala Met Ser Leu Leu Val Asn His Pro His 305 310 315 320 Val Leu Lys Lys Ala Gln Ala Glu Ile Asp Arg Val Ile Gly Asn Asn 325 330 335 Arg Leu Ile Asp Glu Ser Asp Ile Gly Asn Ile Pro Tyr Ile Gly Cys 340 345 350 Ile Ile Asn Glu Thr Leu Arg Leu Tyr Pro Ala Gly Pro Leu Leu Phe 355 360 365 Pro His Glu Ser Ser Ala Asp Cys Val Ile Ser Gly Tyr Asn Ile Pro 370 375 380 Arg Gly Thr Met Leu Ile Val Asn Gln Trp Ala Ile His His Asp Pro 385 390 395 400 Lys Val Trp Asp Asp Pro Glu Thr Phe Lys Pro Glu Arg Phe Gln Gly 405 410 415 Leu Glu Gly Thr Arg Asp Gly Phe Lys Leu Met Pro Phe Gly Ser Gly 420 425 430 Arg Arg Gly Cys Pro Gly Glu Gly Leu Ala Ile Arg Leu Leu Gly Met 435 440 445 Thr Leu Gly Ser Val Ile Gln Cys Phe Asp Trp Glu Arg Val Gly Asp 450 455 460 Glu Met Val Asp Met Thr Glu Gly Leu Gly Val Thr Leu Pro Lys Ala 465 470 475 480 Val Pro Leu Val Ala Lys Cys Lys Pro Arg Ser Glu Met Thr Asn Leu 485 490 495 Leu Ser Glu Leu 500 <210> 11 <211> 435 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: UGT40087 version 2 <400> 11 Met Asp Ala Ser Ser Ser Pro Leu His Ile Val Ile Phe Pro Trp Leu 1 5 10 15 Ala Phe Gly His Met Leu Ala Ser Leu Glu Leu Ala Glu Arg Leu Ala 20 25 30 Ala Arg Gly His Arg Val Ser Phe Val Ser Thr Pro Arg Asn Ile Ser 35 40 45 Arg Leu Arg Pro Val Pro Pro Ala Leu Ala Pro Leu Ile Asp Phe Val 50 55 60 Ala Leu Pro Leu Pro Arg Val Asp Gly Leu Pro Asp Gly Ala Glu Ala 65 70 75 80 Thr Ser Asp Ile Pro Pro Gly Lys Thr Glu Leu His Leu Lys Ala Leu 85 90 95 Asp Gly Leu Ala Ala Pro Phe Ala Ala Phe Leu Asp Ala Ala Cys Ala 100 105 110 Asp Gly Ser Thr Asn Lys Val Asp Trp Leu Phe Leu Asp Asn Phe Gln 115 120 125 Tyr Trp Ala Ala Ala Ala Ala Ala Asp His Lys Ile Pro Cys Ala Leu 130 135 140 Asn Leu Thr Phe Ala Ala Ser Thr Ser Ala Glu Tyr Gly Val Pro Arg 145 150 155 160 Val Glu Pro Pro Val Asp Gly Ser Thr Ala Ser Ile Leu Gln Arg Phe 165 170 175 Val Leu Thr Leu Glu Lys Cys Gln Phe Val Ile Gln Arg Ala Cys Phe 180 185 190 Glu Leu Glu Pro Glu Pro Leu Pro Leu Leu Ser Asp Ile Phe Gly Lys 195 200 205 Pro Val Ile Pro Tyr Gly Leu Val Pro Pro Cys Pro Pro Ala Glu Gly 210 215 220 His Lys Arg Glu His Gly Asn Ala Ala Leu Ser Trp Leu Asp Lys Gln 225 230 235 240 Gln Pro Glu Ser Val Leu Phe Ile Ala Leu Gly Ser Glu Pro Pro Val 245 250 255 Thr Val Glu Gln Leu His Glu Ile Ala Leu Gly Leu Glu Leu Ala Gly 260 265 270 Thr Thr Phe Leu Trp Ala Leu Lys Lys Pro Asn Gly Leu Leu Leu Glu 275 280 285 Ala Asp Gly Asp Ile Leu Pro Pro Gly Phe Glu Glu Arg Thr Arg Asp 290 295 300 Arg Gly Leu Val Ala Met Gly Trp Val Pro Gln Pro Ile Ile Leu Ala 305 310 315 320 His Ser Ser Val Gly Ala Phe Leu Thr His Gly Gly Trp Ala Ser Thr 325 330 335 Ile Glu Gly Val Met Ser Gly His Pro Met Leu Phe Leu Thr Phe Leu 340 345 350 Asp Glu Gln Arg Ile Asn Ala Gln Leu Ile Glu Arg Lys Lys Ala Gly 355 360 365 Leu Arg Val Pro Arg Arg Glu Lys Asp Gly Ser Tyr Asp Arg Gln Gly 370 375 380 Ile Ala Gly Ala Ile Arg Ala Val Met Cys Glu Glu Glu Ser Lys Ser 385 390 395 400 Val Phe Ala Ala Asn Ala Lys Lys Met Gln Glu Ile Val Ser Asp Arg 405 410 415 Asn Cys Gln Glu Lys Tyr Ile Asp Glu Leu Ile Gln Arg Leu Gly Ser 420 425 430 Phe Glu Lys 435 <210> 12 <211> 435 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Si91Dlike <400> 12 Met Asp Ser Ser Gln Ser Pro Pro Leu His Ile Ala Val Phe Pro Trp 1 5 10 15 Leu Ala Phe Gly His Leu Leu Pro Asn Leu Glu Leu Ala Glu Arg Leu 20 25 30 Ala Ala Arg Gly His Arg Val Ser Phe Val Ser Thr Pro Arg Ile Ile 35 40 45 Ser Arg Leu Arg Pro Val Pro Leu Ala Leu Ala Pro Leu Ile Asp Phe 50 55 60 Val Ala Leu Pro Leu Pro Arg Val Asp Gly Leu Pro Asp Gly Ala Glu 65 70 75 80 Ala Thr Ser Asp Ile Pro Pro Gly Lys Thr Asp Leu His Leu Lys Ala 85 90 95 Leu Asp Gly Leu Ala Ala Pro Phe Ala Ala Phe Leu Asp Ala Ala Cys 100 105 110 Ala Asp Gly Ser Thr Asn Lys Val Asp Trp Leu Phe Val Asp Ser Phe 115 120 125 Gln Tyr Trp Ala Ala Ala Ala Ala Ala Asp Arg Lys Ile Pro Cys Ala 130 135 140 Leu Ile Leu Pro Phe Ala Ser Ser Thr Leu Ala Glu Phe Gly Val Pro 145 150 155 160 Arg Leu Glu Pro Pro Val Glu Gly Ser Thr Ala Ser Ile Leu Gln Arg 165 170 175 Phe Val Leu Thr Phe Glu Lys Cys Gln Leu Val Ile His Arg Ala Cys 180 185 190 Ser Glu Leu Glu Pro Glu His Thr Pro Leu Leu Pro Gly Ile Phe Gly 195 200 205 Lys Pro Val Ile Gln Tyr Gly Leu Val Pro Pro Cys Pro Pro Ala Gln 210 215 220 Gly His Ile Glu His Asp Asn Ala Ala Leu Ser Trp Leu Asp Lys Gln 225 230 235 240 Gln Pro Glu Ser Val Leu Phe Ile Ala Leu Gly Ser Glu Pro Pro Val 245 250 255 Thr Val Glu Gln Leu His Glu Ile Ala Leu Gly Leu Glu Leu Ala Gly 260 265 270 Thr Thr Phe Leu Trp Ala Leu Lys Lys Pro Asn Gly Leu Leu Leu Glu 275 280 285 Ala Asp Gly Asp Ile Leu Pro Pro Gly Phe Glu Glu Arg Thr Arg Asp 290 295 300 Arg Gly Leu Val Ala Met Gly Trp Val Pro Gln Leu Ser Ile Leu Ala 305 310 315 320 His Ser Ser Val Gly Ala Phe Leu Thr His Gly Gly Trp Ser Ser Thr 325 330 335 Ile Glu Gly Ala Met Ser Gly His Pro Met Val Phe Leu Thr Phe Leu 340 345 350 Asp Glu Gln Arg Ile Asn Ala Gln Leu Ile Glu Arg Lys Lys Ala Gly 355 360 365 Leu Arg Val Pro Arg Cys Glu Lys Asp Gly Ser Tyr Asp Arg Gln Gly 370 375 380 Ile Ala Gly Ala Ile Arg Ala Val Met Cys Glu Glu Glu Ser Lys Ser 385 390 395 400 Val Phe Ala Ala Asn Ala Lys Lys Met Gln Glu Ile Ile Asn Asp Arg 405 410 415 Lys Cys Gln Glu Arg Tyr Ile Asp Glu Leu Ile Gln Arg Leu Arg Ser 420 425 430 Phe Glu Lys 435 <210> 13 <211> 1308 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: UGT40087-1 codon optimized nucleic acid sequence <400> 13 atggatgctt ccagtagtcc tttacacatc gttatctttc catggttagc tttcggtcat 60 atgttggctt ccttggaatt ggctgagaga ttggctgctc gtggtcacag agtctccttc 120 gtttccaccc ctagaaacat ctctagatta cgtccagttc caccagcttt agctccattg 180 attgattttg tcgctttgcc attgcctaga gtcgatggtt taccagatgg tgccgaagct 240 acctctgaca ttccaccagg taagaccgaa ttacacttga aggctttgga cggtttggct 300 gctccattcg ccgctttttt ggacgctgcc tgtgctgatg gttccaccaa caaggttgat 360 tggttgtttt tggacaactt ccaatactgg gctgccgctg ccgctgctga tcacaaaatt 420 ccttgcgcct taaacttgac ttttgccgct tccacctccg ctgaatacgg tgttccacgt 480 gttgaaccac cagttgacgg ttccactgcc tccatcttac aaagatttgt cttaacctta 540 gaaaaatgtc aattcgttat ccaaagagct tgtttcgaat tggaacctga accattgcca 600 ttgttgtccg acattttcgg taagccagtc atcccatacg gtttagttcc tccatgtcca 660 ccagctgaag gtcacaaaag agaacacggt aacgctgctt tgtcctggtt ggataagcaa 720 caaccagaat ctgttttgtt catcgctttg ggttctgaac cacctgttac cgtcgaacaa 780 ttgcacgaaa tcgctttggg tttagaattg gccggtacca ccttcttgtg ggccttgaaa 840 aagccaaacg gtttgttgtt agaagccgat ggtgatattt tgccaccagg tttcgaagaa 900 agaactagag atagaggttt agtcgctatg ggttgggttc cacaaccaat tatcttggcc 960 cattcctctg ttggtgcctt tttgactcac ggtggttggg cctccactat tgaaggtgtc 1020 atgtccggtc accctatgtt gttcttaacc ttcttggacg aacaacgtat caacgcccaa 1080 ttgatcgaaa gaaaaaaggc tggtttaaga gtcccaagaa gagaaaagga tggttcctac 1140 gacagacaag gtattgctgg tgctattaga gccgtcatgt gtgaagaaga atctaagtct 1200 gtcttcgctg ctaacgctaa gaaaatgcaa gagatcgttt ctgacagaaa ctgtcaagaa 1260 aagtacatcg acgaattgat tcaaagattg ggttctttcg aaaagtaa 1308 <210> 14 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: loop2 from Os_UGT_91C1 <400> 14 Glu Gly Leu Pro Asp Gly Ala Glu Ser Thr Asn Asp Val Pro His Asp 1 5 10 15 Arg Pro Asp Met Val 20 <210> 15 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: loop3_1 from Os_UGT_91C1 <400> 15 Ser Glu Phe Leu Gly Thr Ala Cys Ala Asp 1 5 10 <210> 16 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: loop3_2 from Os_UGT_91C1 <400> 16 Ser Glu Phe Leu Gly Thr Ala Cys Ala Asp Trp Val Ile Val Asp Val 1 5 10 15 Phe His His <210> 17 <211> 43 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: loop4_1 from Os_UGT_91C1 <400> 17 Ala Asp Arg Arg Leu Glu Arg Ala Glu Thr Glu Ser Pro Ala Ala Ala 1 5 10 15 Gly Gln Gly Arg Pro Ala Ala Ala Pro Thr Phe Glu Val Ala Arg Met 20 25 30 Lys Leu Ile Arg Thr Lys Gly Ser Ser Gly Met 35 40 <210> 18 <211> 56 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: loop4_2 from Os_UGT_91C1 <400> 18 Met Met Leu Leu Gly Ser Ala His Met Ile Ala Ser Ile Ala Asp Arg 1 5 10 15 Arg Leu Glu Arg Ala Glu Thr Glu Ser Pro Ala Ala Ala Gly Gln Gly 20 25 30 Arg Pro Ala Ala Ala Pro Thr Phe Glu Val Ala Arg Met Lys Leu Ile 35 40 45 Arg Thr Lys Gly Ser Ser Gly Met 50 55 <210> 19 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: loop2 from UGT40087 <400> 19 Asp Gly Leu Pro Asp Gly Ala Glu Ala Thr Ser Asp Ile Pro Pro Gly 1 5 10 15 Lys Thr <210> 20 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: loop3_1 from UGT40087 <400> 20 Ala Ala Phe Leu Asp Ala Ala Cys Ala Asp Gly Ser Thr Asn Lys Val 1 5 10 15 Asp <210> 21 <211> 26 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: loop3_2 from UGT40087 <400> 21 Ala Ala Phe Leu Asp Ala Ala Cys Ala Asp Gly Ser Thr Asn Lys Val 1 5 10 15 Asp Trp Leu Phe Leu Asp Asn Phe Gln Tyr 20 25 <210> 22 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: loop4_1 from UGT40087 <400> 22 Gly Val Pro Arg Val Glu Pro Pro Val Asp Gly Ser Thr Ala 1 5 10 <210> 23 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: loop4_2 from UGT40087 <400> 23 Leu Asn Leu Thr Phe Ala Ala Ser Thr Ser Ala Glu Tyr Gly Val Pro 1 5 10 15 Arg Val Glu Pro Pro Val Asp Gly Ser Thr Ala 20 25 <210> 24 <211> 434 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: UGT40087/Si91Dlike chimera <400> 24 Met Asp Ala Ser Ser Ser Pro Leu His Ile Val Ile Phe Pro Trp Leu 1 5 10 15 Ala Phe Gly His Met Leu Ala Ser Leu Glu Leu Ala Glu Arg Leu Ala 20 25 30 Ala Arg Gly His Arg Val Ser Phe Val Ser Thr Pro Arg Asn Ile Ser 35 40 45 Arg Leu Arg Pro Val Pro Pro Ala Leu Ala Pro Leu Ile Asp Phe Val 50 55 60 Ala Leu Pro Leu Pro Arg Val Asp Gly Leu Pro Asp Gly Ala Glu Ala 65 70 75 80 Thr Ser Asp Ile Pro Pro Gly Lys Thr Glu Leu His Leu Lys Ala Leu 85 90 95 Asp Gly Leu Ala Ala Pro Phe Ala Ala Phe Leu Asp Ala Ala Cys Ala 100 105 110 Asp Gly Ser Thr Asn Lys Val Asp Trp Leu Phe Leu Asp Asn Phe Gln 115 120 125 Tyr Trp Ala Ala Ala Ala Ala Ala Asp His Lys Ile Pro Cys Ala Leu 130 135 140 Asn Leu Thr Phe Ala Ala Ser Thr Ser Ala Glu Tyr Gly Val Pro Arg 145 150 155 160 Val Glu Pro Pro Val Asp Gly Ser Thr Ala Ser Ile Leu Gln Arg Phe 165 170 175 Val Leu Thr Leu Glu Lys Cys Gln Phe Val Ile Gln Arg Ala Cys Phe 180 185 190 Glu Leu Glu Pro Glu Pro Leu Pro Leu Leu Ser Asp Ile Phe Gly Lys 195 200 205 Pro Val Ile Pro Tyr Gly Leu Val Pro Pro Cys Pro Pro Ala Gln Gly 210 215 220 His Ile Glu His Asp Asn Ala Ala Leu Ser Trp Leu Asp Lys Gln Gln 225 230 235 240 Pro Glu Ser Val Leu Phe Ile Ala Leu Gly Ser Glu Pro Pro Val Thr 245 250 255 Val Glu Gln Leu His Glu Ile Ala Leu Gly Leu Glu Leu Ala Gly Thr 260 265 270 Thr Phe Leu Trp Ala Leu Lys Lys Pro Asn Gly Leu Leu Leu Glu Ala 275 280 285 Asp Gly Asp Ile Leu Pro Pro Gly Phe Glu Glu Arg Thr Arg Asp Arg 290 295 300 Gly Leu Val Ala Met Gly Trp Val Pro Gln Leu Ser Ile Leu Ala His 305 310 315 320 Ser Ser Val Gly Ala Phe Leu Thr His Gly Gly Trp Ser Ser Thr Ile 325 330 335 Glu Gly Ala Met Ser Gly His Pro Met Val Phe Leu Thr Phe Leu Asp 340 345 350 Glu Gln Arg Ile Asn Ala Gln Leu Ile Glu Arg Lys Lys Ala Gly Leu 355 360 365 Arg Val Pro Arg Cys Glu Lys Asp Gly Ser Tyr Asp Arg Gln Gly Ile 370 375 380 Ala Gly Ala Ile Arg Ala Val Met Cys Glu Glu Glu Ser Lys Ser Val 385 390 395 400 Phe Ala Ala Asn Ala Lys Lys Met Gln Glu Ile Ile Asn Asp Arg Lys 405 410 415 Cys Gln Glu Arg Tyr Ile Asp Glu Leu Ile Gln Arg Leu Arg Ser Phe 420 425 430 Glu Lys <210> 25 <211> 433 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Os_UGT_91C1_loop4_1 <400> 25 Met Asp Ser Gly Tyr Ser Ser Ser Tyr Ala Ala Ala Ala Gly Met His 1 5 10 15 Val Val Ile Cys Pro Trp Leu Ala Phe Gly His Leu Leu Pro Cys Leu 20 25 30 Asp Leu Ala Gln Arg Leu Ala Ser Arg Gly His Arg Val Ser Phe Val 35 40 45 Ser Thr Pro Arg Asn Ile Ser Arg Leu Pro Pro Val Arg Pro Ala Leu 50 55 60 Ala Pro Leu Val Ala Phe Val Ala Leu Pro Leu Pro Arg Val Glu Gly 65 70 75 80 Leu Pro Asp Gly Ala Glu Ser Thr Asn Asp Val Pro His Asp Arg Pro 85 90 95 Asp Met Val Glu Leu His Arg Arg Ala Phe Asp Gly Leu Ala Ala Pro 100 105 110 Phe Ser Glu Phe Leu Gly Thr Ala Cys Ala Asp Trp Val Ile Val Asp 115 120 125 Val Phe His His Trp Ala Ala Ala Ala Ala Leu Glu His Lys Val Pro 130 135 140 Cys Ala Met Met Leu Leu Gly Ser Ala His Met Ile Ala Ser Ile Gly 145 150 155 160 Val Pro Arg Val Glu Pro Pro Val Asp Gly Ser Thr Ala Ser Leu Ala 165 170 175 Glu Arg Phe Ser Leu Thr Leu Ser Arg Ser Ser Leu Val Val Gly Arg 180 185 190 Ser Cys Val Glu Phe Glu Pro Glu Thr Val Pro Leu Leu Ser Thr Leu 195 200 205 Arg Gly Lys Pro Ile Thr Phe Leu Gly Leu Met Pro Pro Leu His Glu 210 215 220 Gly Arg Arg Glu Asp Gly Glu Asp Ala Thr Val Arg Trp Leu Asp Ala 225 230 235 240 Gln Pro Ala Lys Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Pro 245 250 255 Leu Gly Val Glu Lys Val His Glu Leu Ala Leu Gly Leu Glu Leu Ala 260 265 270 Gly Thr Arg Phe Leu Trp Ala Leu Arg Lys Pro Thr Gly Val Ser Asp 275 280 285 Ala Asp Leu Leu Pro Ala Gly Phe Glu Glu Arg Thr Arg Gly Arg Gly 290 295 300 Val Val Ala Thr Arg Trp Val Pro Gln Met Ser Ile Leu Ala His Ala 305 310 315 320 Ala Val Gly Ala Phe Leu Thr His Cys Gly Trp Asn Ser Thr Ile Glu 325 330 335 Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly Asp 340 345 350 Gln Gly Pro Asn Ala Arg Leu Ile Glu Ala Lys Asn Ala Gly Leu Gln 355 360 365 Val Ala Arg Asn Asp Gly Asp Gly Ser Phe Asp Arg Glu Gly Val Ala 370 375 380 Ala Ala Ile Arg Ala Val Ala Val Glu Glu Glu Ser Ser Lys Val Phe 385 390 395 400 Gln Ala Lys Ala Lys Lys Leu Gln Glu Ile Val Ala Asp Met Ala Cys 405 410 415 His Glu Arg Tyr Ile Asp Gly Phe Ile Gln Gln Leu Arg Ser Tyr Lys 420 425 430 Asp <210> 26 <211> 1621 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: unoptimized nucleic acid sequence of UGT40087 having SEQ ID NO:1 <400> 26 tcgtgacgca acagagcaac tctcgccggc accggtcgcc ccttccgcag gcaggcagca 60 ggctcgcgcg catggacgcc tccgactcct ccccgctgca catcgtcatc ttcccgtggc 120 tcgcgttcgg ccacatgctc gccagcctgg agctcgccga gcgcctggcc gcgcgaggcc 180 accgcgtgtc cttcgtctcc accccgcgca acatcagccg cctccgcccg gtcccgcccg 240 cgctggcgcc gctcatcgac ttcgtggcgc tgccgctgcc gcgcgtcgac ggcctccccg 300 acggcgcgga ggccaccagc gacatcccgc ccggcaagac cgagctccac ctcaaggccc 360 tagacggcct cgccgcgccc ttcgcagctt tcctcgacgc cgcctgcgcc gacgggagca 420 ccaacaaggt ggactggctc ttcctcgaca acttccaata ctgggccgcc gccgccgctg 480 ccgaccataa gataccctgc gcgctgaacc tgacattcgc agcgtcgacg tcagcggagt 540 acggtgtgcc acgcgttgag ccgccggtgg atggctcaac agcctcaata ctccagcgat 600 ttgtgctaac cttggagaaa tgccagtttg tcatccaacg cgcctgcttc gagctggagc 660 cggagcccct gcctctcctg tcagacatct tcggcaagcc ggtgatcccg tacggcctag 720 tcccgccgtg tccccccgca gaaggtcaca aaagagagca cggcaacgca gctctgtcat 780 ggctcgacaa gcagcagccc gagtctgtcc tgttcattgc tctgggaagc gagcctccgg 840 tgaccgtcga acagctgcac gagatcgcgc ttgggctgga gctcgccggg acgacattcc 900 tctgggctct gaagaagcct aacggcctcc tcctcgaggc ggacggcgac atcctgcccc 960 caggtttcga ggagcggacg cgtgaccgtg ggctcgtggc catgggctgg gttcctcagc 1020 ccatcatact ggctcacagc tccgtgggcg cgttcctgac gcacggcgga tgggcctcca 1080 ccattgaagg ggttatgtcc gggcatccca tgctcttcct gacgttctta gatgaacaga 1140 ggataaacgc gcaactgatc gagaggaaga aggccgggtt gcgagtgcca aggcgtgaga 1200 aggacggctc gtacgatcgc caaggcatcg ccggagcgat ccgggctgtc atgtgcgagg 1260 aagaaagtaa gagcgtcttc gcggctaatg ccaagaagat gcaggagatt gtgagcgaca 1320 ggaattgcca ggagaagtac atcgacgagc ttatccagcg tctgggatcc ttcgagaagt 1380 gaaataaggt gaaatatcct acaataaccg cctgttgatg gcttgatgca acgatgtagg 1440 tggccattcg cgcctctgat ctccatgttc cggcaataaa tccaccatat gttatggctc 1500 tgacttactg aatttcctaa tatgtatgcc caaacacatg cataggttgc tagttgcccc 1560 tcgcgccggc attagcgata atgtcaccgc agtcgccagc acaggtgtag caatttgaca 1620 t 1621 <210> 27 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: modified loop1 from Os_UGT_91C1 present in UGT40087_loop1 <400> 27 Thr Pro Arg Asn Ile Ser Arg Leu Pro Pro Val Pro Pro Ala Leu Ala 1 5 10 15 Pro <210> 28 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: modified loop1 from UGT40087 present in Os_UGT_91C1_loop1 <400> 28 Thr Pro Arg Asn Ile Ser Arg Leu Arg Pro Val Arg Pro Ala Leu Ala 1 5 10 15 Pro <210> 29 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: loop1 from Os_UGT_91C1 having SEQ ID NO:8 <400> 29 Thr Pro Arg Asn Ile Ser Arg Leu Pro Pro Val Arg Pro Ala Leu Ala 1 5 10 15 Pro <210> 30 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: loop1 from UGT40087 having SEQ ID NO:11 <400> 30 Thr Pro Arg Asn Ile Ser Arg Leu Arg Pro Val Pro Pro Ala Leu Ala 1 5 10 15 Pro

Claims

서열번호 1 또는 서열번호 11에 적어도 80%, 85%, 90% 또는 95% 서열 동일성(sequence identity)을 갖는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하는 유전자 변형된 숙주 세포.
제1항에 있어서,
RebA를 RebD로 90%, 95%, 96% 또는 97%를 초과하는 효율로 전환시킬 수 있는 유전자 변형된 숙주 세포.
제1항 또는 제2항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 1 또는 서열번호 11의 서열을 갖는 아미노산 서열을 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제3항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가, 스테비올 글리코시드의 19-O 글루코스의 C2' 위치에 대해 베타 1,2 글리코실화시킬 수 있는 유전자 변형된 숙주 세포.
제1항 내지 제4항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 이종 핵산에 의해 암호화되고, 상기 이종 핵산이 서열번호 13에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제5항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 13의 서열을 갖는 이종 핵산에 의해 암호화되는 유전자 변형된 숙주 세포.
제1항 내지 제6항 중 어느 한 항에 있어서,
RebA를 RebD로 90%, 95%, 96% 또는 97%를 초과하는 효율로 전환시킬 수 있고, UDP-글리코실트랜스퍼라제가 서열번호 1 또는 서열번호 11에 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제7항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가, 서열번호 1 또는 서열번호 11의 기능성 도메인에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 기능성 도메인을 갖는 폴리펩티드인 유전자 변형된 숙주 세포.
제8항에 있어서,
기능성 도메인이 당 수용체 도메인인 유전자 변형된 숙주 세포.
제9항에 있어서,
당 수용체 도메인이 UDP-글리코실트랜스퍼라제의 N-말단에 위치하는 유전자 변형된 숙주 세포.
제1항 내지 제10항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 1 또는 서열번호 11의 당 수용체 도메인을 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제11항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 당 수용체 도메인을 포함하고, 상기 당 수용체 도메인의 아미노산 서열이 서열번호 1 또는 서열번호 11의 당 수용체 도메인의 아미노산 서열에 적어도 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 유전자 변형된 숙주 세포.
제12항에 있어서,
UDP-글리코실트랜스퍼라제가
(a) 각각 서열번호 1 또는 서열번호 11의 고리1 위치(loop1 location)에 상응하는 UDP-글리코실트랜스퍼라제의 위치에, 서열번호 1 또는 서열번호 11의 고리1 아미노산 서열, 서열번호 28의 서열, 또는 변형 고리1 아미노산 서열;
(b) 각각 서열번호 1 또는 서열번호 11의 고리2 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에, 서열번호 1 또는 서열번호 11의 고리2 아미노산 서열, 또는 변형 고리2 아미노산 서열;
(c) 각각 서열번호 1 또는 서열번호 11의 고리3_1 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에, 서열번호 1 또는 서열번호 11의 고리3_1 아미노산 서열, 또는 변형 고리3_1 아미노산 서열;
(d) 각각 서열번호 1 또는 서열번호 11의 고리3_2 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에, 서열번호 1 또는 서열번호 11의 고리3_2 아미노산 서열, 또는 변형 고리3_2 아미노산 서열;
(e) 각각 서열번호 1 또는 서열번호 11의 고리4_1 위치에 상응하는 위치에, 서열번호 1 또는 서열번호 11의 고리4_1 아미노산 서열, 또는 변형 고리4_1 아미노산 서열;
(f) 각각 서열번호 1 또는 서열번호 11의 고리4_2 위치에 상응하는 위치에, 서열번호 1 또는 서열번호 11의 고리4_2 아미노산 서열; 또는
(g) (a) 내지 (f)의 임의의 조합
을 포함하는 유전자 변형된 숙주 세포.
제13항에 있어서,
변형 고리1 아미노산 서열, 변형 고리2 아미노산 서열, 변형 고리3_1 아미노산 서열, 변형 고리3_2 아미노산 서열, 및 변형 고리4_1 아미노산 서열 중 어느 하나가 그들 각각의, 서열번호 1 또는 서열번호 11과 상이한 또 다른 UDP-글리코실트랜스퍼라제의 상응하는 고리 위치들로부터 획득되고, 상기 또 다른 UDP-글리코실트랜스퍼라제가 서열번호 1 또는 서열번호 11에 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 유전자 변형된 숙주 세포.
제14항에 있어서,
또 다른 UDP-글리코실트랜스퍼라제가, 스테비올 글리코시드의 19-O-글루코스의 C'2 위치에 대해 베타 1,2 글리코실화시킬 수 있는 유전자 변형된 숙주 세포.
제15항에 있어서,
또 다른 UDP-글리코실트랜스퍼라제가 Os_UGT_91C1인 유전자 변형된 숙주 세포.
제1항 내지 제16항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가
(a) 서열번호 1 또는 서열번호 11의 당 수용체 도메인에 적어도 61%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 또 다른 UDP-글리코실트랜스퍼라제의 당 수용체 도메인; 및
(b) 각각 서열번호 1 또는 서열번호 11의 고리4_1 위치에 상응하는 또 다른 UDP-글리코실트랜스퍼라제의 위치에 서열번호 1 또는 서열번호 11의 고리4_1 아미노산 서열
을 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제17항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 당 수용체 도메인으로서 서열번호 22의 서열을 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제18항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 1 또는 서열번호 11에 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 서열 동일성을 갖는 아미노산 서열을 포함하고 각각 서열번호 1 또는 서열번호 11의 고리4_1 위치에 상응하는 위치에 서열번호 1 또는 서열번호 11의 고리4_1 아미노산 서열을 갖는 유전자 변형된 숙주 세포.
제1항 내지 제19항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 25의 서열을 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제20항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 하기 아미노산 잔기:
(a) 서열번호 11의 아미노산 위치 11에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 발린;
(b) 서열번호 11의 아미노산 위치 12에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 이소류신;
(c) 서열번호 11의 아미노산 위치 55에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 프롤린;
(d) 서열번호 11의 아미노산 위치 90에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 글루탐산;
(e) 서열번호 11의 아미노산 위치 203에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 세린;
(f) 서열번호 11의 아미노산 위치 223에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 글루탐산; 또는
(g) 서열번호 11의 아미노산 위치 413에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 발린
중 하나 이상을 포함하고,
여기서 서열번호 11의 아미노산 위치에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치가 서열 정렬에 의해 측정되는 유전자 변형된 숙주 세포
제1항 내지 제21항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 24의 아미노산 서열을 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제22항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 당 공여체 도메인을 포함하고, 상기 당 공여체 도메인이 서열번호 1 또는 서열번호 11의 당 공여체 도메인의 아미노산 서열에 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제23항 중 어느 한 항에 있어서,
당 공여체 도메인이 UDP-글리코실트랜스퍼라제의 C-말단에 위치하는 유전자 변형된 숙주 세포.
제1항 내지 제24항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 1 또는 서열번호 11에 적어도 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 유전자 변형된 숙주 세포.
서열번호 2에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하는 유전자 변형된 숙주 세포.
제26항에 있어서,
RebA를 RebD로 50%를 초과하는 효율로 전환시킬 수 있는 유전자 변형된 숙주 세포.
제26항 또는 제27항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 2의 서열을 갖는 폴리펩티드인 유전자 변형된 숙주 세포.
제26항 내지 제28항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 2의 기능성 도메인에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 기능성 도메인을 포함하는 폴리펩티드인 유전자 변형된 숙주 세포.
서열번호 5에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하는 유전자 변형된 숙주 세포.
제30항에 있어서,
RebA를 RebD로 40%를 초과하는 효율로 전환시킬 수 있는 유전자 변형된 숙주 세포.
제30항 또는 제31항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 5의 서열을 갖는 아미노산 서열을 포함하는 유전자 변형된 숙주 세포.
제30항 내지 제32항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 5의 기능성 도메인에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 기능성 도메인을 갖는 폴리펩티드를 포함하는 유전자 변형된 숙주 세포.
서열번호 6에 적어도 85%, 90% 또는 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하는 유전자 변형된 숙주 세포.
제34항에 있어서,
RebA를 RebD로 85% 또는 90%를 초과하는 효율로 전환시킬 수 있는 유전자 변형된 숙주 세포.
제34항 또는 제35항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 6의 서열을 갖는 폴리펩티드인 유전자 변형된 숙주 세포.
제34항 내지 제36항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 6의 기능성 도메인에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 기능성 도메인을 갖는 폴리펩티드를 포함하는 유전자 변형된 숙주 세포.
제29항, 제33항 및 제37항 중 어느 한 항에 있어서,
기능성 도메인이 당 수용체 도메인인 유전자 변형된 숙주 세포.
제1항 내지 제38항 중 어느 한 항에 있어서,
RebD를 생산할 수 있는 유전자 변형된 숙주 세포.
제1항 내지 제39항 중 어느 한 항에 있어서,
RebM을 생산할 수 있는 유전자 변형된 숙주 세포.
제1항 내지 제40항 중 어느 한 항에 있어서,
RebM 및 RebM2를 적어도 10:1, 100:1 또는 1000:1의 비로 생산할 수 있는 유전자 변형된 숙주 세포.
제1항 내지 제41항 중 어느 한 항에 있어서,
검출할 수 없는 수준의 RebM2를 생산하는 유전자 변형된 숙주 세포.
제1항 내지 제42항 중 어느 한 항에 있어서,
스테비오시드를 RebE로 전환시킬 수 있는 유전자 변형된 숙주 세포.
제1항 내지 제43항 중 어느 한 항에 있어서,
스테비올 생성 경로의 하나 이상의 효소를 암호화하는 하나 이상의 이종 핵산을 추가로 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제44항 중 어느 한 항에 있어서,
스테비올 글리코시드 생성 경로의 하나 이상의 효소를 암호화하는 하나 이상의 이종 핵산을 추가로 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제45항 중 어느 한 항에 있어서,
RebA 생성 경로의 하나 이상의 효소를 암호화하는 하나 이상의 이종 핵산을 추가로 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제46항 중 어느 한 항에 있어서,
RebM 생성 경로의 하나 이상의 효소를 암호화하는 하나 이상의 이종 핵산을 추가로 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제47항 중 어느 한 항에 있어서,
RebE 생성 경로의 하나 이상의 효소를 암호화하는 하나 이상의 이종 핵산을 추가로 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제48항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소가 제라닐제라닐 디포스페이트 신타제를 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제49항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소가 코팔릴 디포스페이트 신타제를 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제50항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소가 ent-카우렌 신타제를 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제51항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소가 카우렌 옥시다제를 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제52항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소가 카우렌산 하이드록실라제를 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제53항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소가 시토크롬 P450 리덕타제를 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제54항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소가 유리딘 5'-디포스포 글리코실트랜스퍼라제를 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제55항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소가 UGT74G1, UGT76G1, UGT85C2, 및 UGT91D를 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제56항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소가 제라닐제라닐 디포스페이트 신타제, 코팔릴 디포스페이트 신타제, ent-카우렌 신타제, 카우렌 옥시다제, 카우렌산 하이드록실라제, 시토크롬 P450 리덕타제, UGT74G1, UGT76G1, UGT85C2, 및 UGT91D를 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제57항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소가 이작용기(bifunctional) 코팔릴 디포스페이트 신타제 및 카우렌 신타제를 포함하는 유전자 변형된 숙주 세포.
제1항 내지 제58항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소를 암호화하는 하나 이상의 이종 핵산이 단일의 전사 조절제의 조절하에 있는 유전자 변형된 숙주 세포.
제1항 내지 제59항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소를 암호화하는 하나 이상의 이종 핵산이 다수의 이종 전사 조절제의 조절하에 있는 유전자 변형된 숙주 세포.
제1항 내지 제60항 중 어느 한 항에 있어서,
세균 세포, 진균 세포, 조류 세포(algal cell), 곤충 세포, 및 식물 세포로 이루어지는 그룹 중에서 선택되는 유전자 변형된 숙주 세포.
제1항 내지 제61항 중 어느 한 항에 있어서,
효모 세포인 유전자 변형된 숙주 세포.
제1항 내지 제62항 중 어느 한 항에 있어서,
효모가 사카로마이세스 세레비지아에(Saccharomyces cerevisiae)인 유전자 변형된 숙주 세포.
(a) 제1항 내지 제63항 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 RebD 생성에 적합한 조건하에서 탄소원(carbon source)이 있는 배지에서 배양하고;
(b) 상기 배지로부터 상기 RebD 화합물을 회수하는,
RebD의 생산 방법.
(a) 제1항 내지 제64항 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 RebM 생성에 적합한 조건하에서 탄소원이 있는 배지에서 배양하고;
(b) 상기 배지로부터 상기 RebM 화합물을 회수하는,
RebM의 생산 방법.
(a) RebA를, RebD 형성에 적합한 조건하에서 글루코스, 및 RebA를 RebD로 전환시킬 수 있는, 제1항 내지 제63항 중 어느 한 항의 UDP-글리코실트랜스퍼라제와 접촉시키고;
(b) 상기 배지로부터 상기 RebD 화합물을 회수하는,
RebD의 생산 방법.
(a) RebM 형성에 적합한 조건하에서 기질을 글루코스 또는 UDP-당 및
(i) RebA를 RebD로 전환시킬 수 있는, 제1항 내지 제63항 중 어느 한 항의 UDP-글리코실트랜스퍼라제; 및
(ii) RebD를 RebM으로 전환시킬 수 있는 UDP-글리코실트랜스퍼라제
와 접촉시키는, RebM의 생산 방법.
RebA를 RebD로 전환시킬 수 있는, 제1항 내지 제63항 중 어느 한 항의 UDP-글리코실트랜스퍼라제 중 어느 하나를 사용하여 RebA를 RebD로 전환시킴을 포함하는 RebD의 생성 방법.
(a) RebA를 RebD로 전환시킬 수 있는, 제1항 내지 제63항 중 어느 한 항의 UDP-글리코실트랜스퍼라제 중 어느 하나를 사용하여 RebA를 RebD로 전환시키고;
(b) RebD를 RebM으로 전환시킬 수 있는 UDP-글리코실트랜스퍼라제를 사용하여 RebD를 RebM으로 전환시킴
을 포함하는, RebM의 생성 방법.
(a) (i) RebA를 RebD로 전환시킬 수 있는, 제1항 내지 제63항 중 어느 한 항의 UDP-글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하는 유전자 변형된 숙주 세포; 및
(b) 상기 유전자 변형된 숙주 세포로부터 생산된 스테비올 글리코시드
를 포함하는 발효 조성물.
스테비올 글리코시드를 포함하는, 제1항 내지 제63항 중 어느 한 항의 유전자 변형된 숙주 세포에 의해 생산된 발효 조성물로서, 상기 스테비올 글리코시드가 적어도 1:7:50의 RebA:RebD:RebM 비로 RebA, RebD 및 RebM을 포함하는 발효 조성물.
제71항에 있어서,
스테비올 글리코시드가 적어도 1:7:50 내지 1:100:1000의 RebA:RebD:RebM 비로 RebA, RebD 및 RebM을 포함하는 발효 조성물.
제71항에 있어서,
스테비올 글리코시드가 적어도 1:7:50 내지 1:200:2000의 RebA:RebD:RebM 비로 RebA, RebD 및 RebM을 포함하는 발효 조성물.
스테비올 글리코시드를 포함하는, 제1항 내지 제63항 중 어느 한 항의 유전자 변형된 숙주 세포에 의해 생산된 발효 조성물로서, 상기 스테비올 글리코시드가 적어도 7:50의 RebD:RebM 비로 RebD 및 RebM을 포함하는 발효 조성물.
제74항에 있어서,
스테비올 글리코시드가 적어도 7:50 내지 7:100의 RebD:RebM 비로 RebD 및 RebM을 포함하는 발효 조성물.
제74항에 있어서,
스테비올 글리코시드가 적어도 7:50 내지 7:200의 RebD:RebM 비로 RebD 및 RebM을 포함하는 발효 조성물.
스테비올 글리코시드를 포함하는, 제1항 내지 제63항 중 어느 한 항의 유전자 변형된 숙주 세포에 의해 생산된 발효 조성물로서, 상기 스테비올 글리코시드가 적어도 1:50의 RebA:RebM 비로 RebA 및 RebM을 포함하는 발효 조성물.
제77항에 있어서,
스테비올 글리코시드가 적어도 1:50 내지 1:1000의 RebA:RebM 비로 RebA 및 RebM을 포함하는 발효 조성물.
제77항에 있어서,
스테비올 글리코시드가 적어도 1:50 내지 1:2000의 RebA:RebM 비로 RebA 및 RebM을 포함하는 발효 조성물.
서열번호 1 또는 서열번호 11에 적어도 80%, 85%, 90%, 95% 서열 동일성을 갖는 비-천연 UDP-글리코실트랜스퍼라제.
생체내에서 RebA를 RebD로 90%, 95%, 96% 또는 97%를 초과하는 효율로 전환시킬 수 있는 비-천연 UDP-글리코실트랜스퍼라제.
비-천연 UDP-글리코실트랜스퍼라제로서,
(a) 서열번호 1 또는 서열번호 11의 고리4_1 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 서열번호 22를 갖는 고리4_1 아미노산 서열을 포함하고;
(b) 스테비올 글리코시드의 19-O-글루코스의 C2' 위치에 대해 베타 1,2 글리코실화시킬 수 있는
상기 UDP-글리코실트랜스퍼라제.
제80항 내지 제82항 중 어느 한 항에 있어서,
하기 아미노산 잔기:
(a) 서열번호 11의 아미노산 위치 11에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 발린;
(b) 서열번호 11의 아미노산 위치 12에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 이소류신;
(c) 서열번호 11의 아미노산 위치 55에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 프롤린;
(d) 서열번호 11의 아미노산 위치 90에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 글루탐산;
(e) 서열번호 11의 아미노산 위치 203에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 세린;
(f) 서열번호 11의 아미노산 위치 223에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 글루탐산; 또는
(g) 서열번호 11의 아미노산 위치 413에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 발린
중 하나 이상을 포함하고,
서열번호 11의 아미노산 위치에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치가 서열 정렬에 의해 측정되는 비-천연 UDP-글리코실트랜스퍼라제.
제80항 내지 제82항 중 어느 한 항의 비-천연 UDP-글리코실트랜스퍼라제를 암호화하는 비-천연 핵산.
(a) 제1항 내지 제63항 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 RebM 생성에 적합한 조건하에서 탄소원이 있는 배지에서 배양하고;
(b) 상기 배지로부터 상기 RebM 화합물을 회수하는
방법에 의해 제조된 RebM을 포함하는 감미료(sweetener).
(a) 제1항 내지 제63항 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 RebM 생성에 적합한 조건하에서 탄소원이 있는 배지에서 배양하고;
(b) 상기 배지로부터 상기 RebM 화합물을 회수하는
방법에 의해 제조된 RebM 및 적어도 하나의 다른 물질을 포함하는 감미료 조성물.
(a) 제1항 내지 제63항 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 RebM 생성에 적합한 조건하에서 탄소원이 있는 배지에서 배양하고;
(b) 상기 배지로부터 상기 RebM 화합물을 회수하는
방법에 의해 제조된 RebM을 포함하는 감미된 조성물.
(a) 제1항 내지 제63항 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 RebM 생성에 적합한 조건하에서 탄소원이 있는 배지에서 배양하고;
(b) 상기 배지로부터 상기 RebM 화합물을 회수하는
방법에 의해 제조된 RebM을 적어도 하나의 다른 물질과 조합함을 포함하는 감미료 조성물의 생성 방법.
(a) 제1항 내지 제63항 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 RebM 생성에 적합한 조건하에서 탄소원이 있는 배지에서 배양하고;
(b) 상기 배지로부터 상기 RebM 화합물을 회수하는
방법에 의해 제조된 RebM을 적어도 하나의 감미가능한 조성물과 조합함을 포함하는 감미된 조성물의 생성 방법.