KR20220109336A

KR20220109336A - C-글리코실전이효소 변이체 및 이의 용도

Info

Publication number: KR20220109336A
Application number: KR1020220011630A
Authority: KR
Inventors: 이상엽; 양동수; 장우대
Original assignee: 한국과학기술원
Priority date: 2021-01-27
Filing date: 2022-01-26
Publication date: 2022-08-04

Abstract

본 발명은 신규한 C-글리코실전이효소 변이체 및 이의 용도에 관한 것으로, 본 발명에 따른 C-글리코실전이효소 변이체는 야생형 C-글리코실전이효소에 비해 글리코사이드 결합 형성능이 향상되어 있어, 폴리케타이드 군 및 유사 천연물, 특히 타입 I, II, III 폴리케타이드, 비리보솜 펩티드, 페닐프로파노이드 및 그 외 방향족 천연물의 배당체 생산 효과를 증진시킬 수 있는바, C-글리코사이드 화합물을 구성성분으로 하는 약물, 식품 첨가제, 영양 보조제 등의 제조에 유용하게 활용할 수 있을 것이다.

Description

C-글리코실전이효소 변이체 및 이의 용도 {C-glycosyltransferase variants and Use thereof}

본 발명은 신규한 C-글리코실전이효소 변이체 및 이의 용도에 관한 것으로, 더 상세하게는 C-글리코실전이효소의 활성 부위 (acive site)에 위치하는 아미노산이 변이되어 기질 탄소의 글리코실화 반응이 강화된 것을 특징으로 하는 C-글리코실전이효소 변이체 및 폴리케타이드 및 페닐프로파노이드 배당체 생산에 있어서 상기 변이체의 용도에 관한 것이다.

폴리케타이드는 다양한 생물학적 효능을 지니는 매력적인 천연물의 한 분류이며, 일상에서 식품, 화장품, 약물 등에 다양하게 응용되고 있다. 폴리케타이드를 생합성하는 효소군을 폴리케타이드 생합성 효소 (PKS)라 총칭하는데, 이는 생합성 메커니즘에 따라 타입 I, II 및 III의 세 가지 종류로 구분된다. 이 중 타입 I PKS을 통해서는 macrolide 계열 폴리케타이드가 생산되며 타입 II 및 III를 통해서는 방향족 폴리케타이드가 주로 생산된다.

약물 또는 영양 보조제 등과 같이 의약적 효능을 지니는 물질의 경우 전반적으로 글리코시드 결합의 생성을 통하여 비배당체에 비하여 안정성, 가수분해 등에 대한 저항성, 생체이용률 등이 훨씬 개선된 배당체가 선호된다. 특히 안정적인 C-글리코사이드 결합은 화학적으로 O-글리코사이드 결합에 비하여 안정하다. 하지만 대장균에서 천연물의 O-glycosylation은 몇 사례가 보고되었으나 (Chen, D.; Chen, R.; Xie, K.; Duan, Y.; Dai, J., Production of acetophenone C-glucosides using an engineered C-glycosyltransferase in Escherichia coli. Tetrahedron Lett. 2018, 59 (19), 1875-1878), C-glycosylation은 거의 보고된 사례가 없다. 대장균뿐만 아니라 자연계에도 C-glycosylation에 비하여 O-glycosylation에 대하여 많은 보고가 되어 있다.

대표적인 C-글리코사이드 천연물로는 카르민산 (carminic acid), 알로에신 (aloesin) 등이 있다.

카르민산은 널리 사용되는 붉은색 색소이며 음식, 화장품 및 의약품 등으로 활용된다. Cochineal Dactylopius coccus와 같은 비늘 곤충으로부터 직접 추출되는데, 케첩, 딸기 우유, 사탕과 같은 식품에 첨가되고 있으며 아이섀도우, 매니큐어, 립스틱과 같은 화장품에 첨가되고 있다. 하지만 cochineal은 느리게 성장하고, 제한된 영역에서만 성장하여 (덥고 건조한 지역에서만 자랄 수 있다), 생산 용량을 쉽게 증가시키기 어렵다는 상업적 생산의 한계를 보이고 있다. 특히, 추출 과정 또한 굉장히 비효율적인데, 예를 들어 1파운드의 카르민산을 생산하기 위해서는 70,000마리의 암컷 cochineal이 필요하다. 이러한 상황에서 카르민산을 생산하기 위한 보다 지속 가능한 방법의 개발이 필요하였다.

알로에신은 알로에 베라(Aloe vera)로부터 추출되며, 항타이로시네이즈 (anti-tyrosinase) 효과 및 항멜라닌 생성 효과 때문에 화장품 업계에서 미백제로써 널리 활용되고 있다. 뿐만 아니라 알로에신은 항염증 및 항라디칼 효과를 보이므로 다양한 약물 또는 화장품 주성분으로 활용될 수 있다. 하지만 알로에 식물로부터 추출되는 알로에신의 양은 극미량으로, 보다 효율적이고 지속 가능한 바이오 기반 생산 방법의 개발이 필요하였다.

상기 서술된 바와 같이 C-글리코사이드 천연물에 대한 수요는 매우 높은 반면, 그 공급량은 미비하나, 이를 효과적으로 생산할 수 있는 방법에 대한 개발이 거의 이루어지지 않은 실정이었다. 특히, 상기 화합물을 생물학적 공정으로 생산하고자 하여도 이를 위한 효소가 잘 밝혀져 있지 않거나, 낮은 효소의 전환 효율 때문에 미생물 세포 공장으로부터 효율적인 생산이 불가능하였다.

이러한 기술적 배경 아래에서, 본 발명자들은 뛰어난 C-글리코실화 능력을 갖는 C-글리코실전이효소를 개발하기 위해 예의 노력한 결과, 아미노산의 치환을 통해 뛰어난 C-글리코실화 능력을 나타내는 C-글리코실전이효소 변이체를 개발하고, 상기 C-글리코실전이효소 변이체 유전자를 도입한 재조합 미생물에서 타입 I, 타입 II 및 타입 III 폴리케타이드, 비리보솜 펩티드, 페닐프로파노이드, 방향족 천연물에 대해 현저히 뛰어난 C-글리코실전이효소 변이체의 배당체 생산능을 나타내는 것을 확인하고 본 발명을 완성하였다.

본 배경기술 부분에 기재된 상기 정보는 오직 본 발명의 배경에 대한 이해를 향상시키기 위한 것이며, 이에 본 발명이 속하는 기술분야에서 통상의 지식을 가지는 자에게 있어 이미 알려진 선행기술을 형성하는 정보를 포함하지 않을 수 있다.

Chen, D.; Chen, R.; Xie, K.; Duan, Y.; Dai, J., Production of acetophenone C-glucosides using an engineered C-glycosyltransferase in Escherichia coli. Tetrahedron Lett. 2018, 59 (19), 1875-1878

본 발명의 목적은 신규한 C-글리코실전이효소 변이체 및 이의 용도를 제공하는데 있다.

상기 목적을 달성하기 위하여,

본 발명은 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서 F17, V93, V132, Y193, L164 및 R322로 구성된 군에서 선택되는 어느 하나 이상의 아미노산에 변이를 포함하는 C-글리코실전이효소 (C-glycosyltransferase) 변이체를 제공한다.

본 발명은 또한, 상기 C-글리코실전이효소 변이체를 암호화하는 핵산을 제공한다.

본 발명은 또한, 상기 핵산이 도입된 재조합 미생물을 제공한다.

본 발명은 또한, 다음 단계를 포함하는 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 제조방법을 제공한다:

(a) 본 발명의 재조합 미생물을 배양하여 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체를 생성시키는 단계; 및

(b) 상기 생성된 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체를 회수하는 단계.

(a) 본 발명의 C-글리코실전이효소 변이체 또는 상기 C-글리코실전이효소 변이체를 발현하는 미생물과 폴리케타이드 및/또는 페닐프로파노이드를 반응시켜 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체를 생성시키는 단계; 및

본 발명에 따른 C-글리코실전이효소 변이체는 야생형 C-글리코실전이효소에 비해 글리코사이드 결합 생성능이 향상되어 있어, 폴리케타이드 군 및 유사 천연물, 특히 타입 I, II, III 폴리케타이드, 비리보솜 펩티드, 페닐프로파노이드 및 그 외 방향족 천연물의 배당체 생산 효과를 증진시킬 수 있다. 따라서, 본 발명에 따른 C-글리코실전이효소 변이체는 천연물의 폴리케타이드 배당체 생산을 통하여 증가하는 C-글리코사이드 화합물을 구성성분으로 하는 약물, 식품 첨가제, 영양 보조제 등의 제조에 유용하게 활용될 수 있을 것이다.

도 1은 carminic acid 생산 경로를 나타낸다.
도 2는 서로 다른 대사공학 전략을 도입하였을 때 flavokermesic acid 생산량을 나타낸다. 타입 III 폴리케타이드 생합성 효소 (Aloe arborescens 유래 AaPKS5)와 ZhuIJ보다 타입 II 폴리케타이드 생합성 효소 (P. luminescens 유래 AntDEFBG)와 ZhuIJ가 보다 높은 농도의 FK를 생산하였다.
도 3은 DnrF의 도입에 따른 kermesic acid 생산량 변화를 나타낸다.
도 4는 dcII 생산을 위한 후보 C-glycosyltransferase 및 각 후보 효소들의 본래의 효소 반응을 나타낸다.
도 5는 아홉 종류의 효소 후보들의 dcII 생산능을 비교한 것이다
도 6은 KA와 dcII 생산량 증대를 위한 homology modeling 및 docking simulation 결과를 나타낸다: (a) DnrF에 대한 시뮬레이션을 통하여 선별된 변이체들의 KA 생산능. (b) 가장 효과가 좋은 DnrF 변이체 (P217K)에 대한 단백질 구조 시뮬레이션 결과. (c) GtCGT에 대한 시뮬레이션을 통해 선별된 변이체들의 dcII 생산능. (d) 가장 효과가 좋은 GtCGT 변이체 (V93Q/Y193F)에 대한 단백질 구조.
도 7은 포도당으로부터 카르민산 생산을 나타낸다: (a) 서로 다른 조건에서의 카르민산 생산량. (b) LC-MS/MS 분석을 통한 카르민산의 분석. 윗쪽 데이터는 시판되는 카르민산을 분석한 결과, 아랫쪽 데이터는 포도당으로부터 대장균에서 생산된 카르민산 함유 샘플 분석 결과. 왼쪽 그래프들은 추출 이온 크로마토그램 (extracted ion chromatogram; EIC), 오른쪽 그래프들은 MS/MS 조각 패턴 (fragmentation pattern). (c) 최종 균주에 대한 유가식 발효 그래프. 붉은색 화살표는 IPTG를 통한 유전자 발현 개시 시점을 나타내고, DCW는 건조 세포 중량을 나타냄.
도 8은 알로에신 생산 경로를 나타낸다.
도 9는 대장균을 통한 알로에신 생산을 보여준다: (a) 알로에손 증산을 위하여 RpALS를 포함하는 또다른 플라스미드를 구축하여 테스트한 결과. (b) 알로에신 생산을 위한 GtCGT 및 그 변이체 테스트 결과. (c) LC-MS/MS 분석을 통한 알로에신의 분석. 윗쪽 데이터는 시판되는 알로에신을 분석한 결과, 아랫쪽 데이터는 포도당으로부터 대장균에서 생산된 알로에신 함유 샘플 분석 결과. 왼쪽 그래프들은 추출 이온 크로마토그램 (extracted ion chromatogram; EIC), 오른쪽 그래프들은 MS/MS 조각 패턴 (fragmentation pattern)을 나타냄.
도 10은 알로에신 생산량 증대를 위한 GtCGT 추가 변이체 테스트 결과를 나타낸다. 추가 변이체는 GtCGT 변이체 (V93Q/Y193F)의 구조 모델을 분석하여 예측하였다.
도 11은 알로에신 생산량 증대를 위한 GtCGT 추가 변이체 테스트 결과를 나타낸다. 추가 변이체는 GtCGT 변이체 (V93Q/Y193F)를 기반으로 docking simulation을 수행하여 예측하였다.
도 12는 GtCGT 변이체 (V93Q/Y193F)에 의한 여러 페닐프로파노이드 C-glucoside의 생산량 (%전환율로 표기)을 나타낸다.
도 13은 GtCGT 및 GtCGT 변이체(V93Q/Y193F)의 K_M과 V_max 값을 계산하기 위한 Lineweaver-Burk plot을 나타낸다.

다른 식으로 정의되지 않는 한, 본 명세서에서 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 기술분야에서 숙련된 전문가에 의해서 통상적으로 이해되는 것과 동일한 의미를 갖는다. 일반적으로, 본 명세서에서 사용된 명명법은 본 기술분야에서 잘 알려져 있고 통상적으로 사용되는 것이다.

본 발명에서는 야생형 효소에 비해 글리코사이드 결합 생성능이 현저히 개선된 C-글리코실전이효소 변이체를 발굴하기 위하여 단백질 구조를 예측하고, 단백질 구조 분석과 컴퓨터 시뮬레이션을 통하여 활성이 증대된 변이 후보군을 도출하였으며, 이들 중 특히 기질 결합성이 향상되고 글루코실화 반응을 강화시킬 수 있는 효과 좋은 변이체를 선별할 수 있었다.

따라서, 본 발명은 일 관점에서, C-글리코실화 능력이 향상된 C-글리코실전이효소(C-glycosyltransferase) 변이체에 관한 것이다.

본 발명에 있어서, 본 발명의 변이체의 주형(또는 야생형)이 되는 C-글리코실전이효소는 기질(예, 화합물, 단백질 등)의 탄소에 C-글리코시드 결합을 형성시켜 C-글리코실화를 유도하는 효소를 의미한다.

본 발명에 있어서, 상기 C-글리코실전이효소는 서열번호 1로 표시되었으나, 이에 제한되는 것은 아니며, 특정 아미노산 잔기 위치에서, 아미노산 잔기가 보존적으로 치환된 단백질을 포함하는 의미로 해석되어야 한다.

본 명세서에서 "보존적 치환"이란 1개 이상의 아미노산을 C-글리코실전이효소 또는 이의 변이체의 생물학적 또는 생화학적 기능의 손실을 야기하지 않는 유사한 생화학적 특성을 갖는 아미노산으로 치환하는 것을 포함하는 C-글리코실전이효소의 변형을 의미한다.

본 발명의 용어, "보존적 아미노산 치환"은 아미노산 잔기를 유사한 측쇄를 갖는 아미노산 잔기로 대체시키는 치환이다. 유사한 측쇄를 갖는 아미노산 잔기 부류는 해당 기술분야에 규정되어 있으며, 잘 알려져 있다. 이들 부류는 염기성 측쇄를 갖는 아미노산(예를 들어, 라이신, 아르기닌, 히스티딘), 산성 측쇄를 갖는 아미노산(예를 들어, 아스파르트산, 글루탐산), 대전되지 않은 극성 측쇄를 갖는 아미노산(예를 들어, 글리신, 아스파라진, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 비-극성 측쇄를 갖는 아미노산(예를 들어, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지된 측쇄를 갖는 아미노산(예를 들어, 트레오닌, 발린, 이소류신) 및 방향족 측쇄를 갖는 아미노산(예를 들어, 티로신, 페닐알라닌, 트립토판, 히스티딘)을 포함한다.

따라서, 본 발명의 변이체의 주형이 되는 C-글리코실전이효소는 서열번호 1뿐만 아니라, 이와 실질적으로 동일한 기능 및/또는 효과를 가지며, 40% 이상, 50% 이상, 60% 이상, 70% 이상, 바람직하게는 80% 이상 또는 85% 이상, 더욱 바람직하게는 90% 이상 95% 이상, 가장 바람직하게는 99% 이상의 아미노산 서열 상동성을 가지는 C-글리코실전이효소, 재조합 C-글리코실전이효소 및 이의 절편들을 모두 포함하는 의미로 해석된다.

본 발명의 용어, "절편"은 모 단백질이 절단된 일부 단편을 의미하며, C'-말단 및/또는 N'-말단이 절단된 것일 수 있다. 본 발명에 있어서, 상기 절편은 본 발명의 탈당화된 C-글리코실전이효소와 실질적으로 동일한 기능 및/또는 효과를 갖는 절편을 의미한다. 예를 들어, 상기 절편은 전장 단백질에서 신호 서열이 절단된 단편을 포함할 수 있다.

본 발명에 있어서, 상기 C-글리코실전이효소는 서열번호 1로 표시되는 Gentiana triflora 유래 GtUF6CGT이외에도 다른 균주 또는 다른 생물로부터 유래될 수 있다. 예를 들어 E. coli Nissle 유래 IroB (EnCGT); Zea mays 유래 UGT708A6 (ZmCGT) dual C/O-glycosyltransferase; Fagopyrum esculentum 유래 UGT708C2 (FeCGT); Mangifera indica 유래 MiCGT; Oryza sativa 유래 OsCGT; Glycine max 유래 UGT708D1 (GmCGT); Gentiana triflora 유래 GtUF6CGT1 (GtCGT); Aloe vera 유래 AvCGT일 수 있으며, 바람직하게는 Gentiana triflora 유래 GtUF6CGT1 (GtCGT) 또는 Zea mays 유래 UGT708A6 (ZmCGT) dual C/O-glycosyltransferase일 수 있으나, 이에 제한되는 것은 아니다.

본 발명의 일 실시예에서, 야생형 C-글리코실전이효소의 아미노산 일부를 치환하여 변이체를 생성하는 경우, 현저히 뛰어난 C-글리코실화 유도능력을 나타내며, 상기 C-글리코실전이효소를 폴리케타이드 합성용 재조합 균주에 도입하는 경우 C-당화된 폴리케타이드를 현저한 수율로 제조할 수 있음을 확인하였다.

본 발명에 있어서, 상기 C-글리코실전이효소 변이체는 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서 F17, V93, V132, Y193, L164 및 R322로 구성된 군에서 선택되는 어느 하나 이상의 아미노산에 변이를 포함하는 것을 특징으로 할 수 있으며, 보다 바람직하게는 V93 및/또는 Y193의 아미노산에 변이를 포함하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 C-글리코실전이효소 변이체는 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서 F17, V93, V132, Y193, L164 및 R322로 구성된 군에서 선택되는 어느 하나 이상의 아미노산 이외에도 하나 이상의 다른 아미노산에 변이를 포함하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 C-글리코실전이효소 변이체는 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서, F17, V405, P107, L208, L164, P45, I305, L316, F401, Y94, N57, Y187, C16, P319, F167, V132, N206, R406, Q386, V129, L125, L194, I95, S215, L184, Y158, L29, L27, F202, H159, S370, H365, V329, M301, V315, V190, C366, W80, L58, Q210, F312, D61, I207, L363, P196, L106, V93, A394, W314, S155, P88, D99, Y284, E189, G49, H328, E399, T392, F387, A44, P199, E46, R28, V285, I124, R419, L306, Y157, Y200, E373, P191, L214, S376, V15, E332, E51, I417, L98, I323, H161, T383, P127, E309, N84, L313, Q104, T371, N213, G79, L330, N307, K105, L128, A152, , I18, N59, W147, S86, L293, E296, S377, L185, K216, F89, S286, F396, F211, Y303, D223, R415, N96, V22, S153, F154, D192, Y193, H195, P201, Y292, 및 R322로 구성된 군에서 선택되는 어느 하나 이상의 아미노산에 변이를 추가로 포함할 수 있다.

본 발명에 있어서, 상기 C-글리코실전이효소 변이체는 서열번호 1로 표시되는 C-글리코실전이효소에서, I18, Q20, T50, I95, V290, I323, V22, L29, E46, V48, E51, A55, S86, D99, R103, C151, L184, L194, E332 및 P385로 구성된 군에서 선택되는 어느 하나 이상의 아미노산에 변이를 추가로 포함할 수 있다.

본 발명에 있어서, 바람직하게는 상기 C-글리코실전이효소 변이체는 서열번호 1로 표시되는 C-글리코실전이효소에서, I323, T50, I18, I95, Q20, P385, L194, V48로 구성된 군에서 선택되는 어느 하나 이상의 아미노산에 변이를 추가로 포함할 수 있다.

본 발명의 용어 "변이체"는 참조서열(정상 C-글리코실전이효소 서열 예, 서열번호 1)의 아미노산 서열에서, 일부 아미노산 잔기의 변이, 바람직하게는 아미노산 잔기의 치환, 결실 및/또는 삽입, 더욱 바람직하게는 아미노산 잔기의 치환을 포함하는 것뿐 아니라, 그러한 아미노산 잔기의 치환, 결실 및/또는 삽입 과 함께, N-말단 또는 C-말단에서의 일부 아미노산 잔기의 결실이 일어난 것을 모두 포함하는 개념으로 사용된다. 본 발명의 일 실시예에서, 상기 변이체는 서열번호 1의 일부 아미노산을 치환하여 제조하였으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 '변이'는 아미노산의 치환인 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 C-글리코실전이효소 변이체는 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서 F17G, V93Q, V132A, Y193F, L164G 및 R322D로 구성된 군에서 선택되는 어느 하나 이상의 아미노산 치환을 포함하는 것을 특징으로 할 수 있으며, 보다 바람직하게는 V93Q 및/또는 Y193F, 가장 바람직하게는 V93Q 및 Y193F의 아미노산 치환을 포함하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 C-글리코실전이효소 변이체는 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서 F17G, V93Q, V132A, Y193F, L164G 및 R322D로 구성된 군에서 선택되는 어느 하나 이상의 아미노산 치환 이외에도 하나 이상의 다른 아미노산의 치환을 추가로 포함하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 C-글리코실전이효소 변이체는 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서 V93Q 및 Y193F 아미노산 치환 이외에도, 하나 이상의 다른 아미노산의 치환을 추가로 포함하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 추가로 포함 가능한 다른 아미노산의 치환은 C-글리코실전이효소 변이체는 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서, F17G, V405M, P107G, L208G, L164G, P45G, I305A, L316G, F401H, Y94G, N57G, Y187A, C16G, P319G, F167G, V132A, N206E, R406G, Q386H, V129A, L125V, L194A, I95G, S215D, L184G, Y158T, L29A, L27A, F202S, H159G, S370A, H365G, V329T, M301W, V315A, V190A, C366G, W80Y, L58E, Q210G, F312G, D61G, I207P, L363G, P196G, L106G, V93G, A394G, W314C, S155A, P88D, D99G, Y284H, E189A, G49TH328G, E399D, T392A, F387T, A44G, P199E, E46G, R28G, V285I, I124T, R419A, L306M, Y157T, Y200L, E373A, P201G, P191G, L214A, S376G, V15G, E332P, E51C, I417L, L98G, I323A, H161G, T383C, P127A, E309N, N84S, L313T, Q104D, T371A, N213L, G79S, L330G, N307A, K105G, L128D, A152G, S153G, I18A, N59V, W147F, S86V, L293V, E296D, S377A, L185V, K216R, F89A, S286C, F396L, F211G, Y303A, D223G, R415L, N96A, V22H, V93Q, V93L, S153C, F154L, D192S, Y193F, H195Y, H195L, P201T, Y292H, Y292F, R322D 및 R322A로 구성된 군에서 선택되는 어느 하나 이상의 아미노산 치환인 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 추가로 포함 가능한 다른 아미노산의 치환은 서열번호 1로 표시되는 C-글리코실전이효소에서, I18P, Q20M, T50N, T50Q, T50K, T50R, T50V, I95M, I95T, V290G, V290A, I323S, I323A, I95L, V22A, L29A, E46G, V48G, E51C, A55S, S86V, D99G, R103V, C151G, L184G, L194A, E332P, I18A 및 P385A로 구성된 군에서 선택되는 어느 하나 이상의 아미노산 치환인 것을 특징으로 할 수 있다.

본 발명에 있어서, 바람직하게는 상기 추가로 포함 가능한 다른 아미노산의 치환은 서열번호 1로 표시되는 C-글리코실전이효소에서, I323S, T50R, T50V, I18P, I95T, Q20M, I323A, P385A, L194A 및 V48G로 구성된 군에서 선택되는 어느 하나 이상의 아미노산의 치환인 것을 특징으로 할 수 있다.

본 발명의 일 실시예에서,

i) 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서 V93Q 및 Y193F 아미노산 치환;

ii) 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서 V93Q, Y193F 및 I323S 아미노산 치환; 또는

iii) 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서 V93Q, Y193F 및 P385A 아미노산 치환을 포함하는 C-글리코실전이효소 변이체가 가장 뛰어난 C-글리코실화를 나타내는 것을 확인하였으나, 이에 제한되는 것은 아니다.

아미노산 변이의 아미노산 잔기의 상기 위치는 참조로써(as reference) 서열번호 1로 표시되는 아미노산 서열을 사용하여 정확하게 잔기를 넘버링할 수 있으며, 여기서 "잔기 Xn(residue Xn)"은 서열번호 1로 표시되는 아미노산 서열에서 위치 n에 상응하는 잔기 X를 나타내고, n은 양의 정수이며, X는 임의의 아미노산 잔기의 약어이다. 예를 "잔기 V93"은 서열번호 1 표시되는 아미노산 서열에서 위치 93에 상응하는 아미노산 잔기 V를 지칭한다.

본 발명에서 "아미노산 변이"는 "아미노산 치환 Xn(amino acid substitution Xn)"일 수 있으며, 일 양태로서 서열번호 1로 표시되는 아미노산 서열 중 위치 n의 아미노산 잔기 X에서 발생하는 아미노산 치환을 의미하고, 여기서 n은 양의 정수이고, X는 임의의 아미노산 잔기의 약어이다. 예를 들어, "아미노산 치환 V93"은 서열번호 1로 표시되는 아미노산 서열의 위치 93에 상응하는 아미노산 잔기 V에서 발생한 아미노산 치환을 의미한다.

본 발명에 있어서, 참조서열로 사용되는 서열번호 1의 C-글리코실전이효소 외의 다른 아미노산 서열을 갖는 C-글리코실전이효소를 참조서열로 사용하는 경우, 서열번호 1을 참조로 하여 기재된 특정 아미노산 잔기에 "상응하는" 아미노산 잔기는 일반적으로 최적화 조건 하에서 아미노산 서열의 정렬에 의해 얻어 질 수 있다. 상기 서열 정렬은 당업자가 예를 들어 BLAST, BLAST-2, ALIGN, NEEDLE 또는 Megalign (DNASTAR) 소프트웨어 등을 사용하여 이해하는 수단에 의해 수행될 수 있다. 당업자는 비교되는 전장 서열에서 최적의 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하여 정렬에 사용하기 위한 적절한 파라미터를 결정할 수 있다.

본 발명의 아미노산 치환은 비 보존 치환(non-conserved substitutions)일 수 있다. 상기 비 보존 치환은, 예를 들어, 특정 측쇄 크기 또는 특정 특성 (예를 들어, 친수성)을 갖는 아미노산 잔기를 상이한 측쇄 크기 또는 상이한 특성 (예를 들어, 소수성)을 갖는 아미노산 잔기로 대체하는 것과 같은 비 보존 방식으로, 표적 단백질 또는 폴리펩티드의 아미노산 잔기를 변경하는 것을 포함할 수 있다.

상기 아미노산 치환은 또한 보존된 치환(conserved substitutions)일 수 있다. 상기 보존된 치환은, 예를 들어, 특정 측쇄 크기 또는 특정 특징 (예를 들어, 친수성)을 갖는 아미노산 잔기를 동일하거나 유사한 측쇄 크기 또는 동일하거나 유사한 특성 (예 : 여전히 친수성)을 갖는 아미노산 잔기로 대체하는 것과 같이, 보존된 방식으로 표적 단백질 또는 폴리펩티드의 아미노산 잔기를 변경하는 것을 포함할 수 있다. 이러한 보존된 치환은 일반적으로 생산된 단백질의 구조 또는 기능에 큰 영향을 미치지 않는다. 본 출원에서, 융합 단백질의 돌연변이인 아미노산 서열 변이체, 이의 단편, 또는 하나 이상의 아미노산이 치환된 이의 변이체는 단백질의 구조 또는 기능을 현저하게 변화시키지 않는 보존된 아미노산 치환을 포함할 수 있다.

예를 들어, 다음 그룹 각각에서 아미노산 간의 상호 치환(mutual substitutions)은 본 출원에서 보존적 치환으로 간주될 수 있다:

비극성 측쇄를 갖는 아미노산 그룹: 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 트립토판 및 메티오닌.

극성 측쇄를 갖는 비하전 아미노산 그룹: 글리신, 세린, 트레오닌, 시스테인, 티로신, 아스파라긴 및 글루타민.

극성 측쇄를 갖는 음전하 아미노산 그룹: 아스파르트산 및 글루탐산.

양전하를 띤 염기성 아미노산 그룹: 라이신, 아르기닌 및 히스티딘.

페닐을 갖는 아미노산 그룹: 페닐알라닌, 트립토판 및 티로신

본 발명에 포함된 단백질, 폴리펩티드 및/또는 아미노산 서열은 또한 적어도 다음 범위를 포함하는 것으로 이해될 수 있다: 상기 단백질 또는 폴리펩티드와 동일하거나 유사한 기능을 갖는 변이체 또는 상동체(homologues).

본 발명에서, 상기 변이체는 야생형 C-글리코실화전이효소의 아미노산 서열과 비교하여 하나 이상의 아미노산의 치환, 결실 또는 첨가에 의해 생성된 단백질 또는 폴리펩티드 일 수 있다. 예를 들어, 상기 기능적 변이체는 적어도 1 개의 아미노산의 치환, 결실 및/또는 삽입, 예를 들어 1-30, 1-20 또는 1-10, 대안적으로, 예를 들어 1, 2, 3, 4, 또는 5 아미노산의 치환, 결실 및/또는 삽입에 의한 아미노산 변화를 갖는 단백질 또는 폴리펩티드를 포함할 수 있다. 상기 기능적 변이체는 변화 (예를 들어, 치환, 결실 또는 첨가) 전에 상기 단백질 또는 상기 폴리펩티드의 생물학적 특성을 실질적으로 보유할 수 있다. 예를 들어, 상기 기능적 변이체는 변경 전에 상기 단백질 또는 상기 폴리펩티드의 생물학적 활성의 60 %, 70 %, 80 %, 90 % 또는 100 % 이상을 보유할 수 있다.

본 발명에서, 상기 상동체(homologue)는 상기 단백질 및/또는 상기 폴리펩티드의 아미노산 서열과 적어도 약 80 % (예를 들어, 적어도 약 85 %, 약 90 %, 약 91 %, 약 92 %, 약 93 %, 약 94 %, 약 95 %, 약 96 %, 약 97 %, 약 98 %, 약 99 % 이상) 서열 상동성을 갖는 단백질 또는 폴리펩티드 일 수 있다.

본 발명에서, 상기 상동성은 일반적으로 둘 이상의 서열 간의 유사성(similarity), 유의성(analogousness) 또는 연관성(association)을 지칭한다. "서열 상동성 백분율(percent of sequence homology)"은 동일한 핵산 염기 (예: A, T, C, G, I) 또는 동일한 아미노산 잔기 (예 : Ala, Pro, Ser, Thr, Gly, Val, Leu, Ile, Phe, Tyr, Trp, Lys, Arg, His, Asp, Glu, Asn, Gln, Cys 및 Met)가 존재하는 위치의 수를 결정하는 비교 창에서 정렬된 두 서열을 비교하는 방식에 의해 계산될 수 있으며, 비교 창(즉, 윈도우 사이즈)의 일치하는 위치의 수를 제공하기 위하여 일치하는 위치의 수를 총 위치 수로 나누고, 결과에 100을 곱하여 서열 상동성의 백분율을 제공한다. 서열 상동성의 백분율을 결정하기 위한 정렬은 예를 들어 BLAST, BLAST-2, ALIGN 또는 Megalign (DNASTAR) 소프트웨어와 같은 공개적으로 이용 가능한 컴퓨터 소프트웨어를 사용하여 당업계에 알려진 다양한 방식으로 수행될 수 있다. 당업자는 비교되는 전장 서열 내에서 또는 표적 서열 영역 내에서 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하여 서열 정렬을 위한 적절한 파라미터를 결정할 수 있다. 상기 상동성은 또한 다음 방법에 의해 결정될 수 있다: FASTA 및 BLAST. FASTA 알고리즘은 예를 들어 W. R. Pearson and D. J. Lipman's "Improved Tool for Biological Sequence Comparison", Proc. Natl. Acad. Sci., 85: 2444-2448, 1988; 및 D, J. Lipman and W. R. Pearson's "Fast and Sensitive Protein Similarity Search", Science, 227:1435-1441, 1989에 개시되어 있고, BLAST 알고리즘에 대한 설명은 S. Altschul, W. Gish, W. Miller, E. W. Myers and D. Lipman, "A Basic Local Alignment Search Tool", Journal of Molecular Biology, 215: 403-410, 1990를 참조할 수 있다.

본 발명에 있어서, 상기 C-글리코실전이효소 변이체는 야생형에 비해 기질 탄소의 글리코실화(glycosylation) 반응을 강화시키는 것을 특징으로 하는 할 수 있다.

본 발명에 있어서, 상기 변이된 아미노산은 효소의 활성 부위(acive site)에 위치하고, 상기 아미노산에 변이를 통하여 변이체의 기질 결합력이 야생형에 비해 10% 이상, 바람직하게는 20% 이상, 더욱 바람직하게는 50% 이상 향상된 것을 특징으로 할 수 있다.

본 발명의 일 실시예에서, 본 발명의 C-글리코실전이효소 변이체를 사용하는 경우, 다양한 폴리케타이드계 화합물(플라보케르메신 산(flavokermesic acid), 케르메신 산(kermesic acid), 알로에손(aloesone)) 또는 페닐프로파노이드계 화합물(나린제닌(naringenin), 아피제닌(apigenin) 또는 루테올린(luteolin))을 기질로 하여 기질의 종류에 관계없이 야생형에 비해 현저히 높은 C-글리코실화를 나타낼 수 있음을 확인하였다. 따라서, 본 발명의 C-글리코실전이효소 변이체는 다양한 화합물, 단백질을 기질로 하여, 상기 기질을 C-글리코실화 하기위한 용도로 사용될 수 있다. 예를 들어, 상기 폴리케타이드계 화합물 또는 페닐프로파노이드계 화합물의 C-글리코실화에 사용되는 것을 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 기질은 폴리케타이드 또는 페닐프로파노이드계 화합물을 제한없이 사용가능하며, 바람직하게는 일 실시예에서 확인한 것과 같이 플라보케르메신 산(flavokermesic acid), 케르메신 산(kermesic acid), 알로에손(aloesone), 나린제닌(naringenin), 아피제닌(apigenin) 또는 루테올린(luteolin)일 수 있으나, 이에 제한되는 것은 아니다.

상기 기질은 바람직하게는 플라보케르메신 산(flavokermesic acid) 또는 케르메신 산(kermesic acid) 이고, 상기 변이체는 상기 플라보케르메신 산(flavokermesic acid)의 2번 탄소를 글리코실화(glycosylation) 시키는 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.

상기 기질은 바람직하게는 알로에손(aloesone)이고, 상기 변이체는 상기 알로에손의 8번 탄소를 글리코실화(glycosylation)시키는 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.

본 발명은 다른 관점에서, 상기 C-글리코실전이효소 변이체를 암호화하는 핵산에 관한 것이다.

또 다른 관점에서, 본 발명은 상기 핵산을 포함하는 벡터에 관한 것이다.

또 다른 관점에서, 본 발명은 상기 핵산이 도입된 재조합 미생물에 관한 것이다.

본 발명에 있어서, 상기 재조합 미생물에는 숙주 미생물에 상기 핵산이 플라스미드 형태로 도입되어 있거나 게놈에 삽입되어 있는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 재조합 미생물은 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체 생산용인 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.

본 발명에 있어서, 상기 재조합 미생물은 본 발명의 C-글리코실전이효소의 기질로서, 폴리케타이드 및/또는 페닐프로파노이드를 생산하는 능력을 갖는 것을 특징으로 할 수 있으며, 상기 폴리케타이드 및/또는 페닐프로파노이드는 본 발명의 재조합 미생물이 발현하는 C-글리코실전이효소에 의해 당화되어 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체로 전환될 수 있다.

본 발명에 있어서, 상기 폴리케타이드는

라파마이신(rapamycin), 로바스타틴(lovastatin), 에리트로마이신(erythromycin), 리파마이신(rifamycin), 아버멕틴(avermectin), 겔다나마이신(geldanamycin), 이버멕틴(ivermectin), 칼리케아마이신(calicheamicin), 에포타일론(epothilone), 트라이아세트산 락톤(triacetic acid lactone) 및 6-메틸살리실산(6-methylsalicylic acid)로 구성된 군에서 선택되는 타입 I 폴리케타이드;

액티로노딘(actinorhodin), 독소루비신(doxorubicin), 다우노루비신(daunorubicin), 옥시테트라사이클린(oxytetracycline), SEK4, SEK4b, SEK34, SEK15, SEK26, FK506, DMAC, 아클라비논(aklavinone), 아클라노닉산(aklanonic acid), 엡실론 로도마이시논(epsilon-rhodomycinone), 독시사이클린(doxycycline), 안트라마이신(anthramycin), 테트라세노마이신(tetracenomycin), 카르민산(Carminic acid) 및 프레놀리신(frenolicin)로 구성된 군에서 선택되는 타입 II 폴리케타이드; 및

알로에신(aloesin), 알로에닌(aloenin), 바바로인(barbaloin), 5,7-다이하이드록시-2-메틸크로몬(5,7-dihydroxy-2-methylchromone) 및 알로에손(aloesone)로 구성된 군에서 선택되는 타입 III 폴리케타이드;로 구성된 군에서 선택되는 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.

본 발명에 있어서, 상기 페닐프로파노이드는

액티노마이신(actinomycin), 바키트라신(bacitracin), 답토마이신(daptomycin), 밴코마이신(vancomycin), 테익소박틴(teixobactin), 타이로시딘(tyrocidine), 그라미시딘(gramicidin), 즈위터미신 A(zwittermicin A), 블레오마이신(bleomycin), 시클로스포린(ciclosporin), 피오버딘(pyoverdine), 엔테로박틴(enterobactin), 믹소켈린 A(myxochelin A), 인디고이딘(indigoidine), 사이아노피신(cyanophycin) 등으로 구성된 비리보솜 펩티드, 피노켐브린(pinocembrin), 다이하이드로캄페롤(dihydrokaempferol), 에리오딕티올(eriodictyol), 다이하이드로쿼세틴(dihydroquercetin), 코리페릴알코올(coniferyl alcohol), 실리빈 (silybin), 아이소실리빈 (isosilybin), 실리크리스틴 (silychristin), 실리나이드(silinide), 2,3-디하이드로실리빈(2,3-dehydrosilybin), 실리다이아닌(silydianin), 다이드제인(daidzein), 게니스타인(genistein), 아피게닌(apigenin), 루테올린(luteolin), 캄페롤(kaempferol), 쿼세틴(quercetin), 카테킨(catechin), 페라고니딘(pelargonidin), 시아니딘(cyanidin), 압젤레친(afzelechin), 미리세틴(myricetin), 피세틴(fisetin), 갈랑긴(galangin), 헤스페레틴(hesperetin), 탄제리틴(tangeritin), 델피니딘(delphinidin), 에피카테킨(epicatechin), 크리신(chrysin), 레스베라트롤(resveratrol) 및 나린제닌(naringenin)으로 구성된 군에서 선택되는 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.

본 발명에 있어서, 상기 숙주 미생물은 생산하고자 하는 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 전구체의 생산능을 갖는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 전구체는 폴리케타이드 및/또는 페닐프로파노이드 일 수 있으며, 바람직하게는 당화되지 않은 폴리케타이드 및/또는 페닐프로파노이드 일 수 있다.

본 발명에 있어서, 상기 숙주 미생물은 선천적으로 상기 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 전구체를 생산하거나, 유전자 조작을 통해 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 전구체를 생산하도록 제조된 재조합 미생물인 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 재조합 미생물은 도입된 C-글리코실전이효소에 의한 배당체 전환율을 향상시키기 위해, 뉴클레오타이드, 바람직하게는 NTP-당(NTP-sugar)의 생산이 강화된 것을 특징으로 할 수 있다. 예를 들어, 본 발명의 재조합 미생물은 UTP-글루코오스-1-포스페이트 우리딜트렌스퍼라아제 (UTP-glucose-1-phosphate uridylyltransferase), 포스포글루코뮤타아제(phosphoglucomutase) 및/또는 뉴클레오시드-디포스페이트 키나제(nucleoside-diphosphate kinase)를 암호화하는 유전자의 발현이 강화된 것을 추가적인 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 UTP-글루코오스-1-포스페이트 우리딜트렌스퍼라아제, 포스포글루코뮤타아제 및/또는 뉴클레오시드-디포스페이트 키나제는 E. coli 유래;인 것을 특징으로 할 수 있으나, 이에 한정되는 것은 아니며 숙주 균주에 따라 NTP-Sugar의 생성에 관여하는 유전자의 발현이 강화되는 것을 특징으로 할 수 있다.

본 발명의 일 실시예에서, 상기 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 전구체로, 플라보케르메신 산(flavokermesic acid), 케르메신 산(kermesic acid), 알로에손(aloesone), 나린제닌(naringenin), 아피제닌(apigenin) 또는 루테올린(luteolin)을 사용하였으나 이에 제한되는 것은 아니며, 상기 기재한 다양한 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 전구체는 당업계에 자명하게 공지되어 있으므로, 이로부터 용이하게 선택될 수 있다.

본 발명에서 용어 "핵산(nucleic acid)"은 일반적으로 자연 환경으로부터 분리되거나 인공적으로 합성된 분리된 형태의 뉴클레오티드, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 또는 임의의 길이의 이들의 유사체를 의미한다. 본 발명의 핵산은 분리될 수 있다. 예를 들어, 이는 다음과 같은 방법으로 생산 또는 합성될 수 있다: (i) 중합 효소 연쇄 반응 (PCR) 증폭과 같은 시험관 내 증폭, (ii) 클론 재조합, (iii) 정제, 예를 들어 제한 효소 분해에 의한 분별 (fractionation) 및 겔 전기 영동, 또는 (iv) 합성, 예를 들어 화학적 합성. 일부 구체예에서, 상기 단리된 핵산은 재조합 DNA 기술에 의해 제조된 핵산 분자이다. 본 발명에서, 상기 변이체를 암호화하는 핵산은 당업계에 공지된 다양한 방법에 의해 제조될 수 있다. 이러한 방법은 제한 단편 작업 또는 합성 올리고 뉴클레오티드를 사용하는 중첩 연장 PCR(overlap extension PCR)을 포함하지만 이에 한정되지는 않는다. 제조 방법과 원리는 Sambrook et al., Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989; 및 Ausube et al. Current Protocols in Molecular Biology, Greene Publishing and Wiley-Interscience, New York NY, 1993에서 확인할 수 있다.

본 발명에서, 용어 "플라스미드(plasmid)"는 벡터(vector)와 상호 교환적으로 사용될 수 있으며, 일반적으로 삽입된 핵산을 숙주 세포(이는 숙주 미생물을 포함함)로 전달하여, 숙주 세포나 미생물에서 자가 복제가 가능한 핵산 분자를 지칭한다. 상기 벡터는 주로 DNA 또는 RNA를 세포에 삽입하는데 사용되는 벡터, 주로 DNA 또는 RNA 복제에 사용되는 벡터, 및 DNA 또는 RNA의 전사 및/또는 번역 발현에 주로 사용되는 벡터를 포함할 수 있다. 상기 벡터는 또한 다중의 기능을 갖는 벡터를 포함한다. 상기 벡터는 적합한 숙주 세포에 도입될 때 폴리펩티드로 전사 및 번역될 수 있는 폴리뉴클레오티드일 수 있다. 일반적으로, 상기 벡터를 함유하는 적합한 숙주 세포를 배양함으로써, 상기 벡터는 원하는 발현 생성물을 생산할 수 있다. 본 발명에서, 상기 벡터는 상기 핵산 중 하나 이상을 포함할 수 있다. 예를 들어, 상기 벡터는 상기 변이체를 암호화하는데 필요한 모든 핵산 분자를 포함할 수 있다. 이 경우, 본 출원의 융합 단백질을 얻기 위해 오직 하나의 벡터만 필요하다. 일부 구체예에서, 상기 벡터는 상기 변이체의 일부를 암호화하는 핵산 분자를 포함할 수 있다. 대안적으로, 상기 벡터는 예를 들어 상기 재조합 미생물에서 유전자 발현을 조절하기 위한 핵산 분자를 포함할 수 있다. 이때, 본 발명의 재조합 미생물을 얻기 위해서는 2 개 이상의 서로 다른 벡터가 필요할 수 있다.

또한, 상기 벡터는 적절한 숙주 세포 및 적절한 조건 하에서 벡터를 선별하는 마커 유전자와 같은 다른 유전자를 포함할 수도 있다. 또한, 상기 벡터는 적절한 숙주에서 코딩 영역이 적절하게 발현되도록 하는 발현 제어 요소(control element)를 포함할 수도 있다. 이러한 제어 요소는 당업자에게 잘 알려져있다. 예를 들어, 이들은 프로모터, 리보솜 결합 부위, 인핸서 및 유전자 전사 또는 mRNA 번역을 조절하는 기타 제어 요소를 포함할 수 있다. 일부 구체예에서, 상기 발현 제어 서열은 조절 요소(regulatory element)이다. 상기 발현 조절 서열의 특정 구조는 종 또는 세포 유형의 기능에 따라 달라질 수 있지만, 일반적으로 TATA 박스, 캡피드 서열(capped sequences), CAAT 서열 등과 같은 전사 및 번역 개시에 관여하는 5 ' 비-전사 서열 및 5' 및 3' 비-번역 서열을 포함한다. 예를 들어, 5' 비-전사 발현 조절 서열은 프로모터 영역을 포함할 수 있고, 프로모터 영역은 기능적으로 연결된 핵산의 전사 조절을 위한 프로모터 서열을 포함할 수 있다. 본 발명에서, 상기 벡터는 pET-30a-c(+), pET-22b(+), pCDFDuet-1, pACYCDuet-1, pRSFDuet-1, pBBR1MCS, pSC101, pTac15K, pTrc99A, pCOLADuet-1 및 pBR322로 구성된 군에서 선택될 수 있으나, 이에 한정되지는 않으며, 통상의 기술자는 상기한 벡터 이외에도 본 기술분야에서 통상적으로 사용되는 벡터를 적절히 선택하여 사용할 수 있을 것이다.

본 발명에서 용어 "숙주 세포", "세포", "숙주 미생물" 및 "숙주"는 상호 교환적으로 사용될 수 있으며, 일반적으로 본 발명의 핵산을 포함하거나 포함할 수 있는 플라스미드 또는 벡터 또는 본 발명의 변이체 또는 발현이 조절되는 단백질이나 폴리펩티드들을 발현할 수 있는 개별 세포, 세포주, 미생물 또는 세포 배양물을 지칭한다. 상기 숙주 세포는 단일 숙주 세포의 자손을 포함할 수 있다. 자연적, 우발적(accidental) 또는 고의적(deliberate) 돌연변이로 인해, 자손 세포와 원래의 모세포는 본 발명의 목적 단백질이나 폴리펩티드를 발현할 수 있는 한, 형태나 게놈이 반드시 완전히 동일할 수는 없다. 상기 숙주 세포는 본 발명의 벡터로 시험관 내 세포를 형질 감염시킴으로써 수득될 수 있다. 상기 숙주 세포는 바람직하게는 미생물 일 수 있으며, 예컨대, 대장균(E. coli.), 리조비움(Rhizobium), 비피도박테리움 (Bifidobacterium), 칸디다 (Candida), 에르위니아(Erwinia), 엔테로박터 (Enterobacter), 파스테렐라(Pasteurella), 맨하이미아 (Mannheimia), 액티노바실러스 (Actinobacillus), 아그레가티박터 (Aggregatibacter), 잔토모나스(Xanthomonas), 비브리오(Vibrio), 아조토박터(Azotobacter), 애시네토박터(Acinetobacter), 랄스토니아(Ralstonia), 아그로박테리움(Agrobacterium), 로도박터(Rhodobacter), 자이모모나스(Zymomonas), 바실러스(Bacillus), 스테필로코커스(Staphylococcus), 락토코커스(Lactococcus), 스트렙토코커스(Streptococcus), 락토바실러스(Lactobacillus), 클로스트리디움(Clostridium), 코리네박테리움(Corynebacterium), 스트렙토마이세스(Streptomyces), 비피도박테리움(Bifidobacterium), 사이아노박테리움(Cyanobacterium) 및 사이클로박테리움(Cyclobacterium)로 구성된 군에서 선택될 수 있으나, 이에 한정되지는 않는다.

한편, 본 발명에서는 상기 C-글리코실전이효소 변이체를 발현할 수 있는 재조합 미생물을 사용하여, 다양한 폴리케타이드 배당체 또는 페닐프로파노이드 배당체를 효과적으로 생산해 낼 수 있음을 확인하였다.

따라서, 본 발명은 또 다른 관점에서, 본 발명의 C-글리코실전이효소 변이체를 암호화하는 핵산이 도입된 폴리케타이드 배당체 또는 페닐프로파노이드 배당체의 생산용 재조합 미생물에 관한 것이다.

본 발명에 있어서, 상기 폴리케타이드 배당체는 타입 I 폴리케타이드 배당체, 타입 II 폴리케타이드 배당체, 또는 타입 III 폴리케타이드 배당체일 수 있다.

본 발명에 있어서, 상기 폴리케타이드는

본 발명에 있어서, 상기 폴리케타이드 배당체 또는 페닐프로파노이드 배당체의 생산용 재조합 미생물은 각 배당체의 전구체를 생산하는 것을 특징으로 할 수 있다. 예를 들어, 상기 재조합 미생물은 각 배당체의 전구체인 폴리케타이드 또는 페닐프로파노이드를 생산하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 폴리케타이드 배당체 또는 페닐프로파노이드 배당체의 생산용 재조합 미생물은 추가적인 유전자 도입을 통해 폴리케타이드 폴리케타이드 또는 페닐프로파노이드를 생산하는 것을 특징으로 할 수 있다. 유전자 도입을 통한 폴리케타이드 합성능을 갖는 재조합 미생물은 예를 들어, 본 발명자들의 공개 논문인 Yang, D., Kim, W.J., Yoo, S.M., Choi, J.H., Ha, S.H., Lee, M.H., and Lee, S.Y. "Repurposing type III polyketide synthase as a malonyl-CoA biosensor for metabolic engineering in bacteria", Proc. Natl. Acad. Sci. (PNAS), 115 (40) 9835-9844 (https://doi.org/10.1073/pnas.1808567115) (2018.10.2) 및 대한민국 등록특허 제10-2187682호에 기재된 유전자 및 방법으로 제조가능하나, 이에 제한되는 것은 아니다. 통상의 기술자는 당업계에 기재된 다양한 폴리케타이드 또는 페닐프로파노이드의 합성경로 및 이에 관여하는 유전자를 사용하여 다양한 숙주 미생물에 도입함으로써, 폴리케타이드 또는 페닐프로파노이드 합성능을 갖는 재조합 미생물을 제작할 수 있다.

본 발명에 있어서, 상기 폴리케타이드 배당체 또는 페닐프로파노이드 배당체의 생산용 재조합 미생물은 폴리케타이드 합성효소 또는 페닐프로파노이드 합성효소가 도입된 것을 추가적인 특징으로 할 수 있다.

본 발명에 있어서, 상기 폴리케타이드 합성효소는 예를 들어, 타입 I 폴리케타이드 합성효소, 타입 II 폴리케타이드 합성효소 또는 타입 III 폴리케타이드 합성효소일 수 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 폴리케타이드 배당체 또는 페닐프로파노이드 배당체의 생산용 재조합 미생물이 각 배당체의 전구체를 생산하지 않는 경우, 배양 배지에 각 배당체의 전구체를 첨가하여 상기 폴리케타이드 배당체 또는 페닐프로파노이드 배당체를 생산할 수 있다.

본 발명에 있어서, 상기 재조합 미생물은 타입 I 폴리케타이드 배당체의 생산용인 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 타입 I 폴리케타이드 배당체의 생산용 재조합 미생물은 타입 I 폴리케타이드 배당체의 전구체를 생산하는 것을 특징으로 할 수 있다. 예를 들어, 타입 I 폴리케타이드 배당체의 전구체는 라파마이신(rapamycin), 로바스타틴(lovastatin), 에리트로마이신(erythromycin), 리파마이신(rifamycin) 등일 수 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 타입 I 폴리케타이드 배당체의 생산용 재조합 미생물은 추가적인 유전자 도입을 통해 타입 I 폴리케타이드 배당체의 전구체를 생산하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 타입 I 폴리케타이드 배당체의 생산용 재조합 미생물은 예를 들어,

(i) 타입 I 폴리케타이드 생합성 효소를 암호화하는 유전자가 추가로 도입된 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 타입 I 폴리케타이드 생합성 효소는 다양한 단백질 및 유전자 데이터베이스로부터 쉽게 선택될 수 있다.

따라서, 본 발명의 C-글리코실전이효소 변이체를 암호화하는 핵산; 및 타입 I 폴리케타이드 생합성 효소 유전자;가 도입되는 숙주 미생물은 보조효소 A, 바람직하게는 말로닐-CoA 또는 아세틸-CoA의 생산능을 갖는 것을 특징으로 할 수 있다.

따라서, 본 발명에 있어서, 상기 재조합 미생물은 보조효소 A의 생산이 강화된 것을 특징으로 할 수 있다. 예를 들어, 본 발명에 있어서, 상기 재조합 미생물은 (ii) pabA 유전자의 발현이 억제 또는 약화된 것을 추가적인 특징으로 할 수 있으나, 이에 제한되는 것은 아니며, 당업계에 공지된 다양한 보조효소 A의 대량생산 전략을 이용하여 보조효소 A의 생산이 강화된 재조합 미생물을 제조할 수 있다.

본 발명에 있어서, 상기 재조합 미생물은 도입된 C-글리코실전이효소에 의한 배당체 전환율을 향상시키기 위해, 뉴클레오타이드, 바람직하게는 NTP-당(NTP-sugar)의 생산이 강화된 것을 특징으로 할 수 있다. 예를 들어, 본 발명에 있어서, 상기 재조합 미생물은 (iii) UTP-글루코오스-1-포스페이트 우리딜트렌스퍼라아제 (UTP-glucose-1-phosphate uridylyltransferase), 포스포글루코뮤타아제(phosphoglucomutase) 및/또는 뉴클레오시드-디포스페이트 키나제(nucleoside-diphosphate kinase)를 암호화하는 유전자의 발현이 강화된 것을 추가적인 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 재조합 미생물은 타입 II 폴리케타이드 배당체의 생산용인 것을 특징으로 할 수 있다. 예를 들어, 상기 타입 II 폴리케타이드 배당체는 카르민산인 것을 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 타입 II 폴리케타이드 배당체의 생산용 재조합 미생물은 타입 II 폴리케타이드 배당체의 전구체를 생산하는 것을 특징으로 할 수 있다. 예를 들어, 타입 II 폴리케타이드 배당체의 전구체는 플라보케르민산 또는 케르민산인 것을 할 수 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 타입 II 폴리케타이드 배당체의 생산용 재조합 미생물은 추가적인 유전자 도입을 통해 타입 II 폴리케타이드 배당체의 전구체를 생산하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 타입 II 폴리케타이드 배당체의 생산용 재조합 미생물은 (i) 타입 II 폴리케타이드 생합성 효소를 암호화하는 유전자가 추가로 도입된 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 타입 II 폴리케타이드 배당체, 바람직하게는 카르민산의 생산용 재조합 미생물은 예를 들어,

(i) 타입 II 폴리케타이드 생합성 효소를 암호화하는 유전자;

(ii) 4'-포스포판테인닐 전이효소 (4'-phosphopantetheinyl transferase)를 암호화하는 유전자;

(iii) 사이클라아제(cyclase)를 암호화하는 유전자;

(iv) 아세틸-CoA 카르복실화 효소 (acetyl-CoA carboxylase)를 암호화하는 유전자; 및

(v) 아클라비네온 12-수산화효소 (aklavinone 12-hydroxylase)를 암호화하는 유전자로, 구성된 군에서 선택되는 어느 하나 이상의 유전자가 추가로 도입되는 것을 특징으로 할 수 있으며, 바람직하게는 상기 유전자가 전부 도입되는 것을 특징으로 할 수 있다.

도 1에 도시된 것과 같이, 본 발명의 C-글리코실전이효소의 기질인 타입 II 폴리케타이드는 예를 들어, 말로닐-CoA 또는 아세틸-CoA와 같은 보조효소 A(Coenzyme A, CoA)로부터 상기 도입된 유전자가 암호화하는 효소에 의해 본 발명의 C-글리코실전이효소의 기질인 타입 II 폴리케타이드로 변환될 수 있다. 따라서, 상기 C-글리코실전이효소 변이체를 암호화하는 핵산; 및 타입 II 폴리케타이드 생합성 효소 유전자 또는 상기 (i) 내지 (v)의 유전자;가 도입되는 숙주 미생물은 보조효소 A, 바람직하게는 말로닐-CoA 또는 아세틸-CoA의 생산능을 갖는 것을 특징으로 할 수 있다.

본 발명의 실시예에서, pabA 유전자의 발현 억제 또는 약화를 통해 보조효소 A가 축적되며, 결과적으로, 본 발명의 C-글리코실전이효소의 전구체인 폴리케타이드의 합성이 향상되는 것을 확인하였다.

본 발명에 있어서, 상기 타입 II 폴리케타이드 생합성 효소를 암호화하는 유전자는 antD (ketosynthase), antE (chain-length factor), antF (ACP), antB (phosphopantetheinyl transferase) 및 antG (malonyl-CoA:ACP malonyltransferase)로 구성된 군에서 선택되는 어느 하나 이상의 유전자 또는 이들의 조합인 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.

본 발명에 있어서, 상기 아클라비네온 12-수산화효소는 서열번호 2로 표시되는 아미노산 서열에서 217번째 아미노산이 프롤린에서 라이신으로의 변이(P217K)를 포함하는 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.

본 발명에 있어서, 상기 타입 II 폴리케타이드 생합성 효소는 P. luminescens 유래;

상기 4'-포스포판테인닐 전이효소는 Bacillus subtilis 또는 P. luminescens 유래;

상기 사이클라아제는 Streptomyces sp. 유래;

상기 아세틸-CoA 카르복실화 효소는 Corynebacterium glutamicum 유래; 및/또는

상기 아클라비네온 12-수산화효소는 Streptomyces peucetius 유래;인 것을 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 재조합 미생물은 타입 III 폴리케타이드 배당체의 생산용인 것을 특징으로 할 수 있다. 예를 들어 본 발명에 있어서, 상기 타입 III 폴리케타이드 배당체는 알로에신인 것을 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 타입 III 폴리케타이드 배당체의 생산용 재조합 미생물은 타입 III 폴리케타이드 배당체의 전구체를 생산하는 것을 특징으로 할 수 있다. 예를 들어, 타입 III 폴리케타이드 배당체의 전구체는 알로에손인 것을 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 타입 III 폴리케타이드 배당체의 생산용 재조합 미생물은 추가적인 유전자 도입을 통해 타입 III 폴리케타이드 배당체의 전구체를 생산하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 타입 III 폴리케타이드 배당체의 생산용 재조합 미생물은 예를 들어,

(i) 타입 III 폴리케타이드 생합성 효소를 암호화하는 유전자가 도입된 것을 특징으로 할 수 있다. 예를 들어, 상기 타입 III 폴리케타이드 생합성 효소는 알로에손 합성효소(aloesone synthase)일 수 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 알로에손 합성효소는 R. palmatum 유래인 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.

도 8에 도시된 것과 같이, 본 발명의 C-글리코실전이효소의 기질인 타입 III 폴리케타이드(예, 알로에손)는 예를 들어, 말로닐-CoA 또는 아세틸-CoA와 같은 보조효소 A(Coenzyme A, CoA)로부터 상기 도입된 유전자가 암호화하는 효소에 의해 본 발명의 C-글리코실전이효소의 기질인 타입 III 폴리케타이드로 변환될 수 있다. 따라서, C-글리코실전이효소 변이체를 암호화하는 핵산; 및 타입 III 폴리케타이드 생합성 효소 유전자;가 도입되는 숙주 미생물은 보조효소 A, 바람직하게는 말로닐-CoA 또는 아세틸-CoA의 생산능을 갖는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 재조합 미생물은 페닐프로파노이드 배당체의 생산용인 것을 특징으로 할 수 있다. 예를 들어, 상기 페닐프로파노이드 배당체는 비텍신(Vitexin), naringenin-6-C-glucoside 또는 isoorientin인 것을 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 페닐프로파노이드 배당체의 생산용 재조합 미생물은 상기 페닐프로파노이드 배당체의 전구체를 생산하는 것을 특징으로 할 수 있다. 예를 들어, 상기 페닐프로파노이드 배당체의 전구체는 아피제닌(apigenin), 나린제닌(naringenin) 또는 루테올린(luteolin)인 것을 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 페닐프로파노이드 배당체의 생산용 재조합 미생물은 추가적인 유전자 도입을 통해 페닐프로파노이드 배당체의 전구체를 생산하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 페닐프로파노이드 배당체의 생산용 재조합 미생물은 예를 들어,

(i) 페닐프로파노이드 생합성 효소를 암호화하는 유전자가 추가로 도입된 것을 특징으로 할 수 있다.

페닐프로파노이드는, 말로닐-CoA 또는 방향족-CoA(예, 쿠마로일-CoA)와 같은 보조효소 A(Coenzyme A, CoA)로부터 상기 도입된 유전자가 암호화하는 효소에 의해 본 발명의 C-글리코실전이효소의 기질인 페닐프로파노이드로 변환될 수 있다. 따라서, 상기 C-글리코실전이효소 변이체를 암호화하는 핵산; 및 페닐프로파노이드 생합성 효소 유전자가 도입되는 숙주 미생물은 보조효소 A, 바람직하게는 말로닐-CoA 또는 쿠마로일-CoA의 생산능을 갖는 것을 특징으로 할 수 있다.

예를 들어 본 발명의 재조합 미생물은, 본 발명의 C-글리코실전이효소를 암호화하는 핵산이 도입된 재조합 미생물에서,

(i) 타입 II 폴리케타이드 생합성 효소를 암호화하는 유전자의 도입;

(ii) 4'-포스포판테인닐 전이효소 (4'-phosphopantetheinyl transferase)를 암호화하는 유전자의 도입;

(iii) 사이클라아제(cyclase)를 암호화하는 유전자의 도입;

(iv) 아세틸-CoA 카르복실화 효소 (acetyl-CoA carboxylase)를 암호화하는 유전자의 도입;

(v) 아클라비네온 12-수산화효소 (aklavinone 12-hydroxylase)를 암호화하는 유전자의 도입;

(vi) UTP-글루코오스-1-포스페이트 우리딜트렌스퍼라아제 (UTP-glucose-1-phosphate uridylyltransferase), 포스포글루코뮤타아제(phosphoglucomutase) 및/또는 뉴클레오시드-디포스페이트 키나제(nucleoside-diphosphate kinase)를 암호화하는 유전자의 발현 강화; 및

(vii) pabA 유전자의 발현 약화; 로 구성된 군에서 선택되는 어느 하나 이상의 유전자 도입 또는 유전자 발현이 조절되어 있는, 카르민산 생산용 재조합 미생물인 것을 특징으로 할 수 있다.

또 다른 예를 들어, 본 발명의 재조합 미생물은, 본 발명의 C-글리코실전이효소를 암호화하는 핵산이 도입된 재조합 미생물에서,

(i) 알로에손 합성효소(aloesone synthase)를 암호화하는 유전자의 도입;

(ii) pabA 유전자의 발현 약화; 및

(iii) 글루코오스 6-포스페이트 1-디하이드로게나아제(glucose 6-phosphate 1-dehydrogenase)를 암호화하는 유전자의 발현 강화;로 구성된 군에서 선택되는 어느 하나 이상의 유전자 도입 또는 유전자 발현이 조절되어 있는, 알로에신 생산용 재조합 미생물인 것을 특징으로 할 수 있다.

UTP-글루코오스-1-포스페이트 우리딜트렌스퍼라아제 (UTP-glucose-1-phosphate uridylyltransferase), 포스포글루코뮤타아제(phosphoglucomutase) 및/또는 뉴클레오시드-디포스페이트 키나제(nucleoside-diphosphate kinase)를 암호화하는 유전자의 발현이 강화되어 있는, 폴리케타이드 배당체 또는 페닐프로파노이드 배당체 생산용 재조합 미생물인 것을 특징으로 할 수 있다.

본 발명에서, 유전자의 도입이란 외래의 유전자가 숙주 미생물에 벡터와 같은 수단을 통해 도입되거나, 또는 직접적으로 숙주 미생물의 게놈에 삽입된 것을 의미한다.

본 발명에서, 유전자의 발현 강화란 상기 유전자에 의해 생성되는 펩타이드 또는 단백질이 숙주 미생물에 없는 경우 이를 인위적으로 숙주 미생물에서 발현하도록 하여 펩타이드 또는 단백질의 활성 또는 기능을 갖도록 하는 것을 의미하고, 상기 유전자가 이미 숙주 미생물에 있는 경우 그 유전자의 발현을 조절하는 내재적 프로모터를 강력한 상시 발현 프로모터로 교체하거나, 상기 유전자를 외부에서 복제능이 강한 벡터 등을 이용해 추가로 도입하는 등 유전자의 카피 수를 증가시키는 등의 일련의 방법을 사용하여 상기 유전자의 과발현 등을 유도하거나 상기 유전자에 의해 생성되는 펩타이드 또는 단백질의 활성 또는 기능이 내재적 활성 또는 기능에 비하여 강화되도록 변형하는 것을 의미한다.

본 발명에서, 유전자의 발현 약화란 해당 유전자의 일부 또는 전체염기를 변이, 치환 또는 삭제시키거나, 상기 유전자 발현을 억제할 수 있는 억제제(예컨대, sRNA 등)의 도입을 통해 해당유전자가 발현되지 않도록 하거나 발현되더라도 활성 또는 기능을 나타내지 못하도록 하는 것으로, 상기 유전자에 의해 생성되는 펩타이드 또는 단백질의 활성 또는 기능이 내재적 활성 또는 기능에 비하여 약화되도록 변형됨을 포괄하는 개념이다.

본 발명에서 사용되는 용어 "내재적 활성 또는 기능"이란, 본래 미생물이 변형되지 않은 상태에서 가지고 있는 효소, 펩타이드, 단백질 등이 보유하는 활성 또는 기능을 의미한다.

본 발명에서 "내재적 활성 또는 기능에 비하여 강화되도록 변형"되었다는 것은, 활성 또는 기능을 나타내는 유전자가 도입되거나 또는 당해 유전자의 카피수 증가(예를 들어, 유전자가 도입된 플라스미드를 이용한 발현), 상기 유전자 발현의 억제 조절 인자의 결실 또는 발현조절 서열의 변형, 예를 들어 개량된 프로모터의 사용 등과 같이, 조작이 이루어지기 전의 미생물이 가지는 활성에 비하여 조작이 이루어진 이후의 미생물이 가지고 있는 활성 또는 기능이 새로이 발생하거나 증가된 상태를 의미한다.

본 발명에서 "내재적 활성 또는 기능에 비하여 약화되도록 변형"되었다는 것은, 활성 또는 기능을 나타내는 유전자의 결실이나 유전자의 불활성화(예를 들어, 돌연변이 유전자로의 치환), 유전자 발현의 약화(예를 들어, 약한 프로모터로의 치환, siRNA, gRNA, sRNA 등의 도입, 시작 코돈을 ATG에서 GTG 등으로의 치환), 유전자에 의해 발현된 펩타이드의 기능 억제(예를 들어, 비경쟁적 억제자 또는 경쟁적 억제자 첨가) 등과 같은 조작이 이루어지기 전의 미생물이 가지는 기능에 비하여 조작이 이루어진 이후의 미생물이 가지고 있는 기능이 감소되거나 상실된 상태를 의미한다.

본 발명에서, 유전자 또는 프로모터의 "교체"란 종래 유전자 또는 프로모터를 제거하고 이와 상이한 유전자 (예컨대, 변이 유전자 등) 또는 강도가 상이한 프로모터를 새로이 도입하는 것을 의미하는 것으로, 상기 종래 유전자 또는 프로모터를 제거한다는 것은 해당 유전자 또는 프로모터를 결실시키는 것뿐만 아니라 그 기능을 억제시키거나 감소시키는 것도 포괄하는 개념이다.

본 발명에서 "과발현"이란 보통상태에서 세포내 해당유전자가 발현되는 수준보다 높은 수준의 발현을 일컫는 것으로써, 유전체 상에 존재하는 유전자의 프로모터를 강력한 프로모터로 치환하거나, 발현벡터에 해당유전자를 클로닝하여 세포에 형질전환시키는 방법을 통해 발현량을 증가시키는 것 등을 포함하는 개념이다.

본 발명에서 "벡터(vector)"는 적합한 숙주 내에서 DNA를 발현시킬 수 있는 적합한 조절 서열에 작동가능하게 연결된 DNA 서열을 함유하는 DNA 제조물을 의미한다. 벡터는 플라스미드, 파지 입자 또는 간단하게 잠재적 게놈 삽입물일 수 있다. 적당한 숙주로 형질전환되면, 벡터는 숙주 게놈과 무관하게 복제하고 기능할 수 있거나, 또는 일부 경우에 게놈 그 자체에 통합될 수 있다. 플라스미드가 현재 벡터의 가장 통상적으로 사용되는 형태이므로, 본 발명의 명세서에서 "플라스미드(plasmid)" 및 "벡터(vector)"는 때로 상호 교환적으로 사용된다. 본 발명의 목적상, 플라스미드 벡터를 이용하는 게 바람직하다. 이러한 목적에 사용될 수 있는 전형적인 플라스미드 벡터는 (a) 숙주세포당 수 개에서 수백 개의 플라스미드 벡터를 포함하도록 복제가 효율적으로 이루어지도록 하는 복제 개시점, (b) 플라스미드 벡터로 형질전환된 숙주세포가 선발될 수 있도록 하는 항생제 내성 유전자 및 (c) 외래 DNA 절편이 삽입될 수 있는 제한효소 절단부위를 포함하는 구조를 지니고 있다. 적절한 제한효소 절단 부위가 존재하지 않을지라도, 통상의 방법에 따른 합성 올리고뉴클레오타이드 어댑터(oligonucleotide adaptor) 또는 링커(linker)를 사용하면 벡터와 외래 DNA를 용이하게 라이게이션(ligation)할 수 있다. 라이게이션 후에, 벡터는 적절한 숙주세포로 형질전환되어야 한다. 형질전환은 칼슘 클로라이드 방법 또는 전기천공법(electroporation) (Neumann, et al., EMBO J., 1:841, 1982) 등을 사용해서 용이하게 달성될 수 있다.

상기 벡터의 프로모터는 구성적 또는 유도성일 수 있으며, 본 발명의 효과를 위해 추가적으로 변형될 수 있다. 또한 발현벡터는 벡터를 함유하는 숙주 세포를 선택하기 위한 선택성 마커를 포함하고, 복제 가능한 발현벡터인 경우 복제 기원(Ori)을 포함한다. 벡터는 자가 복제하거나 숙주 게놈 DNA에 통합될 수 있다. 바람직하게는 벡터 내로 삽입되어 전달된 유전자가 숙주세포의 게놈 내로 비가역적으로 융합되어 세포 내에서 유전자 발현이 장기간 안정적으로 지속되도록 하는 것이 바람직하다.

염기서열은 다른 핵산 서열과 기능적 관계로 배치될 때 "작동가능하게 연결(operably linked)"된다. 이것은 적절한 분자(예를 들면, 전사 활성화 단백질)가 조절 서열(들)에 결합될 때 유전자 발현을 가능하게 하는 방식으로 연결된 유전자 및 조절 서열(들)일 수 있다. 예를 들면, 전서열(pre-sequence) 또는 분비 리더 (leader)에 대한 DNA는 폴리펩타이드의 분비에 참여하는 전단백질로서 발현되는 경우 폴리펩타이드에 대한 DNA에 작동가능 하게 연결되고; 프로모터 또는 인핸서는 서열의 전사에 영향을 끼치는 경우 코딩서열에 작동가능하게 연결되거나; 또는 리보좀 결합 부위는 서열의 전사에 영향을 끼치는 경우 코딩 서열에 작동가능하게 연결되거나; 또는 리보좀 결합 부위는 번역을 용이하게 하도록 배치되는 경우 코딩 서열에 작동가능하게 연결된다. 일반적으로, "작동가능하게 연결된"은 연결된 DNA 서열이 접촉하고, 또한 분비 리더의 경우 접촉하고 리딩 프레임 내에 존재하는 것을 의미한다. 그러나, 인핸서(enhancer)는 접촉할 필요가 없다. 이들 서열의 연결은 편리한 제한 효소 부위에서 라이게이션(연결)에 의해 수행된다. 그러한 부위가 존재하지 않는 경우, 통상의 방법에 따른 합성 올리고뉴클레오티드 어댑터(oligonucleotide adaptor) 또는 링커(linker)를 사용한다.

당업계에 주지된 바와 같이, 숙주세포에서 형질전환 유전자의 발현 수준을 높이기 위해서는, 해당 유전자가 선택된 발현 숙주 내에서 기능을 발휘하는 전사 및/또는 해독 발현 조절 서열에 작동가능하도록 연결되어야만 한다. 바람직하게는 발현 조절서열 및/또는 해당 유전자는 세균 선택 마커 및 복제 개시점(replication origin)을 같이 포함하고 있는 하나의 재조합벡터 내에 포함되게 된다. 숙주세포가 진핵세포인 경우에는, 재조합벡터는 진핵 발현숙주 내에서 유용한 발현 마커를 더 포함하여야만 한다.

상술한 재조합 벡터에 의해 형질전환된 숙주 세포는 본 발명의 또 다른 측면을 구성한다. 본원 명세서에 사용된 용어 "형질전환"은 DNA를 숙주로 도입하여 DNA가 염색체 외 인자로서 또는 염색체 통합완성에 의해 복제 가능하게 되는 것을 의미한다.

물론 모든 벡터가 본 발명의 DNA 서열을 발현하는데 모두 동등하게 기능을 발휘하지는 않는다는 것을 이해하여야만 한다. 마찬가지로 모든 숙주가 동일한 발현 시스템에 대해 동일하게 기능을 발휘하지는 않는다. 그러나, 당업자라면 과도한 실험적 부담없이 본 발명의 범위를 벗어나지 않는 채로 여러 벡터, 발현 조절 서열 및 숙주 중에서 적절한 선택을 할 수 있다. 예를 들어, 벡터를 선택함에 있어서는 숙주를 고려하여야 하는데, 이는 벡터가 그 안에서 복제되어야만 하기 때문이다.

본 발명은 또 다른 관점에서, 다음의 단계를 포함하는 폴리케타이드 배당체 또는 페닐프로파노이드 배당체의 제조방법에 관한 것이다:

(a) 본 발명의 C-글리코실전이효소 변이체를 암호화하는 핵산이 도입된 재조합 미생물을 배양하여, 폴리케타이드 배당체 또는 페닐프로파노이드 배당체를 생산하는 단계; 및

(b) 상기 생성된 폴리케타이드 배당체 또는 페닐프로파노이드 배당체를 회수하는 단계.

본 발명에 있어서, 상기 (a) 단계는 폴리케타이드 배당체 또는 페닐프로파노이드 배당체의 전구체를 첨가하여 C-글리코실전이효소 변이체를 암호화하는 핵산이 도입된 재조합 미생물을 배양하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 (a) 단계의 C-글리코실전이효소 변이체를 암호화하는 핵산이 도입된 재조합 미생물은 폴리케타이드 배당체 또는 페닐프로파노이드 배당체의 전구체의 생산능을 갖는 숙주 미생물에 C-글리코실전이효소 변이체를 암호화하는 핵산이 도입된 것을 특징으로 할 수 있으며, 상기 숙주 미생물은 외래 유전자의 도입 또는 유전자 발현이 조절된 재조합 미생물인 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 C-글리코실전이효소 변이체를 암호화하는 핵산이 도입된 재조합 미생물은 본 발명의 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체 생산용 재조합 미생물에서 기재된 것과 동일한 특징을 가질 수 있다.

본 발명에 있어서, 상기 (a)단계는 배양시 배양 배지에 아스코르빈산을 첨가하여 미생물을 배양하는 것을 특징으로 할 수 있으며, 이 경우, 바람직하게는 0.1 내지 1.5 g/L, 더욱 바람직하게는 0.2 내지 1.0 g/L의 아스코르빈산을 첨가하여 미생물을 배양하는 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.

본 발명의 제조방법은 별도로 설명되지 않는 한, 통상의 기술자가 이해할 수 있는 범위에 내에서 상기 다른 관점에서 기재된 내용과 동등한 특징을 가질 수 있다.

본 발명은 또 다른 관점에서, 다음 단계를 포함하는 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 제조방법을 제공한다:

본 발명에서는 특정 유전자 명을 기재하였으나, 본 발명이 해당 유전자에 한정되는 것이 아님은 당업자에게 자명할 것이다.

한편, 본 발명에서 도입한 유전자에 있어서도 특정 미생물 유래의 유전자 명을 기재하였으나, 본 발명의 보호범위가 해당 유전자 명에 한정되는 것은 아니고, 당업자가 해당 유전자와 동일한 기능을 가진 것이라고 인정할 수 있는 범위 내에서 유전자 명을 달리하는 다른 미생물 유래의 유전자를 본 발명의 기술적 특징에 따라 도입하는 경우, 해당 재조합 미생물도 본 발명의 보호범위에 속할 수 있음은 자명하다.

실시예

이하, 본 발명을 구체적인 실시예에 의해 보다 상세히 설명하고자 한다. 하지만, 본 발명은 하기 실시예에 의해 한정되는 것은 아니며, 본 발명의 아이디어와 범위 내에서 여러 가지 변형 또는 수정될 수 있음은 통상의 기술자에게는 자명한 것이다.

실시예 1. 실험방법

1-1. 플라스크 배양

플라스크 배양은 다음과 같은 조건으로 진행하였다. 콜로니를 적절한 농도의 항생제가 첨가된 10 mL LB 배지에 접종하였고, 37 ℃에서 하룻밤동안 배양하였다. 그 후 준비된 배양액을 3 g/L yeast extract, 20 g/L 포도당 (그리고 필요시 0.45 g/Lascorbic acid)이 첨가된 50 mL의 R/2 배지를 담고 있는 250 mL 배플 플라스크로 계대한 후, 30℃ 200rpm에서 배양하였다. R/2 배지 (pH 6.8) 조성은 다음과 같다 (리터 당): 2 g (NH4)2HPO4, 6.75 g KH2PO4, 0.85 g citric acid, 0.7 g MgSO4·7H2O, and 5 ml trace metal solution (TMS) [10 g FeSO4·7H2O, 2.25 g ZnSO4·7H2O, 1 g CuSO4··5H2O, 0.5 g MnSO4·5H2O, 0.23 g Na2B4O7·10H2O, 2 g CaCl2·2H2O and 0.1 g (NH4)6Mo7O24 per liter of 5 M HCl]. 배양액의 OD600가 0.6-0.8이 되었을 때 1 mM Isopropyl

-D-1-thiogalactopyranoside (IPTG) 를 첨가하여 외래 유전자 발현을 유도하였다. 유도 후 48시간 동안 배양하였다.

1-2. 유가식 발효

유가식 발효의 경우, 6.6 L BioFlo 320 발효기(Eppendorf)를 이용하여 20 g/L 포도당, 3 g/L yeast extract, 0.45 g/L ascorbic acid 및 적절한 항생제를 포함한 1.95 L R/2 배지 (pH 6.8)에서 수행하였다. 콜로니를 적절한 농도의 항생제가 첨가된 10 mL LB 배지에 접종하였고, 37 ℃에서 하룻밤동안 배양하였다. 그 후 준비된 배양액을 3 g/L yeast extract, 20 g/L 포도당, 0.45 g/L ascorbic acid이 첨가된 50 mL의 R/2 배지를 담고 있는 250 mL 배플 플라스크로 계대한 후, 30 ℃ 200pm에서 OD600이 약 4에 도달할 때까지 배양하였다. 그 후 발효기로 접종되었는데 pH는 암모니아 용액의 자동 첨가를 통해 6.8로 유지되었으며, 온도는 30 ℃로 유지되었다. 산소포화도 (DO)는 공기 포화 수준의 40%로 유지되었고 1 vvm [(air volume) · (working volume) ^-1 · (minute)^-1]의 공기를 지속적으로 불어넣되 교반 속도를 높이거나 첨가되는 순수 산소의 농도를 높이는 방식으로 DO를 유지하였다. IPTG 첨가(0.5 mM)는 OD600이 약 20정도 되었을 때 이루어졌으며, pH-stat 전략을 통하여 고갈된 탄소원 및 기타 영양소를 자동으로 발효기에 첨가하였다. 이 때 첨가액은 리터당 다음과 같은 성분을 포함하였다: 650 g 포도당, 5 g ascorbic acid, 6 mL TMS, 8 g MgSO₄·7H₂O. pH가 6.85보다 높아지면 자동으로 첨가액이 발효기로 첨가되게 조작하였다.

1-3. 생산량 분석

배양 후 다음과 같은 조건으로 생산량 분석을 진행하였다. 플라스크 배양 후 50 mL의 배양액을 4,000 g에서 30 분 동안 원심분리한 후, 상층액의 염을 제거하고 농축하는 과정을 진행하였다. 이 때 Oasis HLB Cartridge (Water)를 사용하였다. FK의 경우 1배, KA의 경우 30배, dcII의 경우 45배, 카르민산의 경우 200배 농축하였다. 농축된 샘플은 적절한 부피의 DMSO에 다시 녹인 후 0.22 μm PTFE필터로 불순물을 제거하였다. 준비된 샘플은 HPLC (1100 series; Agilent)와 연동된 MS (LC/MSD VL; Agilent)로 분석하였다. Eclipse XDB-C18 컬럼을 활용하였고, A 버퍼는 0.1% formic acid를, B 버퍼는 methanol을 활용하였다. ESI negative mode로 분석하였다. 카르민산의 보다 정확한 분석을 위하여 HPLC Triple Quadrupole Mass Spectrometer (LCMS-8050, Shimadzu)를 통하여 LC-MS/MS 분석을 진행하였다 (MRM mode).

한편, 알로에신 분석을 위하여 LC-MS/MS 분석에서는, ultra HPLC (UHPLC; 1290 Infinity II LC System; Agilent)와 연동된 MS (Agilent 6550 iFunnel Q-TOF LC/MS System)을 이용하였다. 이 때 Eclipse-plus C18 column을 사용하였고, 버퍼 A로는 0.1% formic acid, 버퍼 B로는 0.1% formic acid를 첨가한 acetonitrile을 사용하였다.

실시예 2: 카르민산 생산을 위한 C-glycosyltransferase 규명

카르민산의 생산 경로는 아직 구체적으로 규명되어 있지 않지만, 카르민산의 탄소 골격은 안트라퀴논(anthraquinone) 계열의 구조를 지니고 있으므로, PKS를 이용하여 카르미산 생산을 유도하고자 하였다 (도 1).

이에 따라 외래 acyl carrier protein (ACP)의 활성을 위하여 Bacillus subtilis 유래 Sfp가 게놈 상에 도입된 E. coli BAP1 균주 (E. coli BL21(DE3) (Invitrogen)으로부터의 제조방법은 B. Pfeifer et al., Science 2001, 291 (5509), 1790-1792 / D. Yang et al., PNAS 2018, 115(40) 9835-9844 논문 참조)를 활용하였다. 그 후 Photorhabdus luminescens 유래 타입 II PKS를 적용하고자 P. luminescens 유래 antD (ketosynthase), antE (chain-length factor), antF (ACP), antB (phosphopantetheinyl transferase), antG (malonyl-CoA:ACP malonyltransferase)를 도입하기 위하여 pDS00-antDEFBG를 구축하였다. 우선 antDEF유전자를 P. luminescens의 genomic DNA로부터 antDE_F 프라이머와 antDEF_R 프라이머를 이용하여 PCR 증폭한 후, pDS00 (제한효소 배열을 제외하고 pET-30a(+) 프라이머와 동일한 플랫폼 플라스미드, Novagen)의 NdeI과 EcoRI 제한효소 부위에 삽입하였다. pDS00 플라스미드는 다음과 같이 구축되었다. pET-30a(+)로부터 T7 프로모터, multiple cloning site (MCS), T7 터미네이터가 포함된 유전자 조각을 pET_NheI_DraIII와 pET_SpeI_SphI 프라이머를 이용하여 증폭한 후, SphI, DraIII 제한효소 처리하여 pET-30a(+) 플라스미드의 SphI과 DraIII 사이트로 삽입하여 pDS00 플라스미드를 구축하였다. 그 후, P. luminescence genomic DNA로부터 antB를 antB_F 프라이머와 antB_R 프라이머를 이용하여 증폭하여 pDS00의 HindIII 사이트에 삽입하여 pDS00-antB 플라스미드를 구축하였다. 연이어 NdeI와 EcoRI 제한효소를 이용하여 digestion 시킨 후 pDS00-antDEF 플라스미드 역시 NdeI와 EcoRI 제한효소를 이용하여 antDEF 조각을 얻은 후 두 조각을 Gibson assembly를 이용하여 합쳐서 pDS00-antDEFB 플라스미드를 얻었다. 그리고 P. luminescence genomic DNA로부터 antG를 antG_F 프라이머와 antG_R 프라이머를 이용하여 증폭하여 pDS00의 NdeI, EcoRI 사이트에 삽입하여 pDS00-antG 플라스미드를 구축하였다. 구축된 플라스미드를 NheI, SpeI 제한효소로 digestion하여 antG 조각을 얻은 후, pDS00-antDEFB 플라스미드의 NheI 사이트로 삽입하여 pDS00-antDEFBG 플라스미드를 구축하였다.

이름	서열	서열 번호
pET_NheI_DraIII 프라이머 (forward)	5'-AAACACTACGTGGCTAGCCAAAAAACCCCTCAAGACC-3'	3
pET_SpeI_SphI 프라이머 (reverse)	5'-AAAGCATGCACTAGTTAATACGACTCACTATAGGG-3'	4
antDE_F 프라이머(Forward)	5'-CTTTAAGAAGGAGATATACATATGATAATAAATAACAGAAATGAATC-3'	5
antDEF_R 프라이머(Reverse)	5'-CTTGTCGACGGAGCTCGAATTCATTAATTTTTATCGTTTAAACTTGATG -3'	6
antB_F 프라이머 (Forward)	5'-GAATTCGAGCTCCGTCGACAAATAAGGAGATATACCATGGACGATATTTCTTTATCATCTG -3'	7
antB_R 프라이머 (Reverse)	5'-GTGGTGCTCGAGTGCGGCCGCAAGCTTATTACTCATCTTTGTTCCTTATAATC -3'	8
antG_F프라이머 (Forward)	5'-CTTTAAGAAGGAGATATACATATGAAACTAATCTCTATGTTGTTAC -3'	9
antG_R프라이머 (Reverse)	5'- CTTGTCGACGGAGCTCGAATTCATTATTGATTCCTCAATGTAAATAG -3'	10

그 다음으로는 flavokermesic acid (FK) 생산을 위하여 Streptomyces sp. R1128 유래 cyclase인 ZhuI와 ZhuJ를 도입하였는데, 이를 위하여 pFK (pDS00-antDEFBG-zhuIJ) 플라스미드를 구축하였다. 우선 대장균에서의 발현을 위해 코돈 최적화된 zhuIJ DNA를 기반으로 하여 zhuI_F 프라이머와 zhuJ_R 프라이머를 이용하여 zhuIJ조각을 PCR 증폭하였고, pDS00의 NdeI, EcoRI 사이트에 삽입하였다. 이렇게 구축된 pDS00-zhuIJ를 NheI, SpeI 제한효소로 절단하여 zhuIJ조각을 얻었으며, 이를 pDS00-antDEFBG의 NheI 사이트에 삽입하여 pFK를 구축하였다.

BAP1에 pDS00-antDEFBG-zhuIJ가 형질전환된 균주는 포도당으로부터 88 mg/L의 FK를 생산하였다. 배양액의 색이 배양 초반에는 밝은 붉은색이었다가 시간이 갈수록 탁한 갈색으로 변하는 것이 관찰되었다. 이는 FK가 멜라닌 유사체 등으로 전환되는 것이라 가정되는바, FK의 멜라닌화를 막기 위하여 배지에 0.45 g/L의 ascorbic acid를 첨가하였고, 이로써 FK 생산량을 154.9 mg/L까지 증산할 수 있었다.

이름	서열	서열 번호
zhuI_F 프라이머(Forward)	5'- CTTTAAGAAGGAGATATACATATGCGTCATGTAGAGCATACAGTC -3'	11
zhuJ_R 프라이머(Reverse)	5'- CTTGTCGACGGAGCTCGAATTCTTATTAATCCTCTTCCTCTTGCTCG -3'	12

Malonyl-CoA의 세포 내 농도를 증가시키는 것 또한 FK의 생산량을 늘일 수 있는 방안으로 예측하고, Corynebacterium glutamicum 유래 acetyl-CoA carboxylase (accBCD1 유전자에 의해 코딩됨)를 과발현시키거나 pabA 유전자를 낙다운하였다. 그 결과 accBCD1을 과발현시킨 균주에서 FK 생산량이 180.3 mg/L까지 증산되었다 (도 2).

플라스크 배양 시에는 LB 아가 플레이트 상의 콜로니를 10 mL의 LB가 포함된 테스트 튜브 상에 접종하는 것으로 시작하였다. 이 때 적절한 농도의 항생제를 추가하였고, 37 ℃에서 220 rpm으로 밤새 배양하였다. 이렇게 준비된 시드 배양 중 1 mL을 50 mL의 R/2 배지(3 g/L yeast extract, 20 g/L 포도당 추가 포함)를 포함하고 있는 250 mL 배플 플라스크로 접종하였고, 30℃와 200 rpm에서 배양을 진행하였다. R/2 배지의 조성은 다음과 같다 (pH 6.8, 1 L당): 2 g (NH₄)₂HPO₄, 6.75 g KH₂PO₄, 0.85 g citric acid, 0.8 g MgSO₄·7H₂O, 5 ml trace metal solution (TMS). TMS의 조성은 다음과 같다 (0.1 M HCl 기반, 1 L당): 10 g FeSO₄·7H₂O, 2.25 g ZnSO₄·7H₂O, 1 g CuSO₄·5H₂O, 0.58 g MnSO₄·5H₂O, 0.02 g Na₂B₄O₇·10H₂O, 2 g CaCl₂·2H₂O, 0.1 g (NH₄)₆Mo₇O₂₄·4H₂O. 배양액의 OD600이 0.6-0.8이 되었을 때 0.5 mM의 IPTG를 첨가하여 외래 효소 발현을 유도하였다. 그 후 48 시간동안 배양을 진행하였다. Flavokermesic acid, kermesic acid, dcII, carminic acid 생산 실험의 경우에는 모두 0.45 g/L의 ascorbic acid를 추가로 첨가해 주었다.

상기 플라스크 컬쳐 결과, 소량의 kermesic acid (KA) 또한 관찰되었다 (0.14 mg FK equivalent/L; 즉, mg FK eq/L). 이는 대장균 내재 산화효소 또는 ZhuIJ에 의한 것으로 생각되었으나, 전환 효율이 너무 낮고, 해당 반응을 수행하는 효소는 아직 규명되지 않은 바, 본 발명에서는 기존 보고된 문헌과 화합물 데이터베이스를 활용하여 생화학 반응 분석을 수행하였다.

그 결과 Streptomyces peucetius 유래 aklavinone 12-hydroxylase (DnrF)를 암호화하는 유전자가 해당 반응을 수행하는 효소로 예측되어, dnrF_F 프라이머와 dnrF_R 프라이머를 이용하여 증폭 후 pDS00에 NdeI, EcoRI 사이트에 삽입하여 pDS00-dnrF를 구축하고, 해당 플라스미드를 기반으로 pET30a_frag_F 프라이머와 pET30a_frag_R 프라이머를 이용하여 dnrF 유전자를 PCR 증폭하였고, pBBR1-T7 플라스미드 (Kovach, M. E.; Phillips, R. W.; Elzer, P. H.; Roop, R. M., II; Peterson, K. M., pBBR1MCS: a broad-host-range cloning vector. Biotechniques 1994, 16 (5), 800-802.)로부터 S.Y.Park et al., bioRxiv, DOI: 10.1101/2020.11.27.401000 방법으로 구축됨)를 pET30a_IV_R 프라이머와 rrnB_IV_F 프라이머를 이용하여 역 PCR 증폭하여 Gibson assembly를 이용하여 두 DNA 조각을 라이게이션하여 pBBR1-dnrF를 구축하였다. FK 생산 균주에 pBBR1-dnrF를 도입한 후 플라스크 배양을 진행하였다. 그 결과, 1.20 mg FK eq/L의 KA를 생산하였다 (도 3a).

이름	서열	서열 번호
dnrF_F 프라이머(Forward)	5'- CTTTAAGAAGGAGATATACATATGGCCTTGACGAAGCCGGATG -3'	13
dnrF_R 프라이머(Reverse)	5'- CAAGCTTGTCGACGGAGCTCG AGTTGTCGGAGCGGCTGGCC -3'	14
pET30a_frag_F프라이머 (Forward)	5'- CTTTAAGAAGGAGATATACATATG -3'	15
pET30a_frag_R 프라이머 (Reverse)	5'- CAAAACAGCCAAGCTTGCATG CAAGCTTGTCGACGGAGCTC -3'	16
rrnB_IV_F 프라이머 (Forward)	5'- CATGCAAGCTTGGCTGTTTTG -3'	17
pET30a_IV_R프라이머 (Reverse)	5'- CATATGTATATCTCCTTCTTAAAG -3'	18

FK에서 카르민산 (carminic acid; CA)으로의 생산은 두 종류의 생합성 경로를 택할 수 있는데, 모두 monooxygenase와 C-glycosyltransferase를 필요로 한다. FK는 산화되어 KA로 전환되거나 C-글리코실화 되어 dcII로 전환될 수 있다. D. coccus 유래 DcUGT2가 FK에서 dcII (또는 KA에서 CA)로의 전환을 촉매한다는 것이 밝혀졌고 S. cerevisiae에서 활성이 증명되었지만 (Kannangara et al., Nat Commun 2017, 8), 해당 효소가 활성을 지니기 위해서는 글리코실화(glycosylation) 되어야 하고, 막관통 나선(transmembrane helix)과 신호 펩타이드(signal peptide)도 가지고 있기 때문에 대장균과 같은 세포에서는 성공적으로 발현되기 어려울 것으로 예상되었다. 실제로 DcUGT2는 FK 생산 대장균에 도입되었을 때 dcII를 생산하지 못하였다. 이와 같은 DcUGT2의 발현 상의 문제를 해결하기 위하여 N 말단 신호 펩타이드 (signal peptide)를 제거한 Ntr-DcUGT2, C 말단 막관통 나선 (transmembrane helix)을 제거한 Ctr-DcUGT2, N 말단 신호 펩타이드 (signal peptide) 및 C 말단 막관통 나선 (transmembrane helix)을 모두 제거한 Ntr-Ctr-DcUGT2를 제작하고, Ntr-DcUGT2와 Ntr-Ctr-DcUGT2의 N 말단에는 대장균 OmpA signal peptide를 부착한 플라스미드 또한 구축하였지만, 모두 dcII를 생산하는데 실패하였다. 따라서 DcUGT2가 대장균에서 활성을 지니지 않는 것으로 결론내렸다.

대장균에서 천연물의 O-글리코실화 (O-glycosylation)는 몇 사례가 보고되었으나, C-글리코실화 (C-glycosylation)는 거의 보고된 사례가 없다. 따라서 본 발명에서는 생화학 반응 분석을 통하여 대장균에서 C-글리코실화 반응을 수행한다고 밝혀진 UDP-glycosyltransferase를 선정하였다. 선정된 여덟 효소 후보는 다음과 같다: E. coli Nissle 유래 IroB (EnCGT); Zea mays 유래 UGT708A6 (ZmCGT) dual C/O-glycosyltransferase; Fagopyrum esculentum 유래 UGT708C2 (FeCGT); Mangifera indica 유래 MiCGT; Oryza sativa 유래 OsCGT; Glycine max 유래 UGT708D1 (GmCGT); Gentiana triflora 유래 GtUF6CGT1 (GtCGT); Aloe vera 유래 AvCGT (도 4).

상기 선정된 효소에 대해 pCDF-DcCGT, pCDF-MiCGT, pCDF-SfCGT, pCDF-EnCGT, pCDF-OsCGT, pCDF-FeCGT, pCDF-GmCGT, pCDF-AvCGT, pCDF-AvCGT, pCDF-ZmCGT, pCDF-GtCGT를 구축하였는데, E. coli Nissle genomic DNA로부터 iroB_gib_F 프라이머 및 isoB_gib_R 프라이머를 이용하여 증폭된 iroB 유전자 제외하고는 모두 인공 합성하고 pCDFDuet-1 플라스미드 상의 NdeI 사이트에 Gibson assembly를 이용하여 삽입하여 구축되었다.

이름	서열	서열 번호
iroB_gib_F프라이머(Forward)	5'- GTTAAGTATAAGAAGGAGATATACATATGCGTCGACTGCCTGATTTAG -3'	19
iroB_gib_R 프라이머(Reverse)	5'- GATATCCAATTGAGATCTGCCTTATGATTACCCTTTCTGTACCATTGTGATC -3'	20

GtCGT와 ZmCGT만이 FK를 dcII로 성공적으로 전환시킬 수 있었는데, ZmCGT의 경우 주요 생산물은 O-글리코실화된 FK (O-glycosylated FK)였으며 dcII는 매우 소량 생산되었다. GtCGT의 경우, 0.13 mg CA equivalent/L (mg CA eq/L)의 dcII가 생산되었다 (도 5). C-글리코실화 (C-glycosylation) 반응은 높은 수준의 UDP-glucose 양이 필요하므로, galU (encoding UTP-glucose-1-phosphate uridylyltransferase), pgm (encoding phosphoglucomutase), 그리고 ndk (encoding nucleoside-diphosphate kinase)를 과발현하였고, 그 결과 dcII의 생산량이 0.30 mg CA eq/L로 증산되었다 (도 5). pBBR1-galU-pgm-ndk 플라스미드를 제작하기 위하여 (세 유전자 모두 대장균 BL21(DE3) 균주로부터 증폭됨) 우선 galU 유전자가 galU_gib_F와 galU_gib_R 프라이머로부터 증폭되었고, pBBR1TaC 플라스미드 상의 EcoRI 사이트에 Gibson assembly를 통하여 삽입되었다. 그리고 pgm 유전자는 pgm_gib_F와 pgm_gib_R 프라이머로부터 증폭되어 pBBR1TaC-galU 플라스미드의 KpnI 사이트에 삽입되었고, ndk 유전자는 ndk_gib_F와 ndk_gib_R 프라이머로부터 증폭되어 pBBR1-galU-pgm 플라스미드의 SphI 사이트에 삽입되었고, 이로써 pBBR1-galU-pgm-ndk가 구축되었다.

이름	서열	서열 번호
galU_Gib_F 프라이머(Forward)	5'- CAATTTCACACAGGAAACAGAATTCATGGCTGCCATTAATACGAAAG -3'	21
galU_Gib_R 프라이머(Reverse)	5'- CCGGGTACCGAGCTCGAATTC ATTACTTCTTAATGCCCATCTC -3'	22
pgm_Gib_F 프라이머(Forward)	5'- GTAATGAATTCGAGCTCGGTACCCAATTTCACACAGGAAACAGA ATGGCAATCCACAATCGTGC -3'	23
pgm_Gib_R 프라이머(Reverse)	5'- CTCTAGAGGATCCCCGGGTACCATTACGCGTTTTTCAGAACTTC -3'	24
ndk_Gib_F 프라이머(Forward)	5'- CTAGAGTCGACCTGCAGGCATGC CAATTTCACACAGGAAACAGA ATGGCTATTGAACGTACTTTTTCC -3'	25
ndk_Gib_R 프라이머(Reverse)	5'- CAAAACAGCCAAGCTTGCATGC ATTAACGGGTGCGCGGGCAC -3'	26

GtCGT와 DnrF의 활성을 향상시켜 성공적으로 카르민산을 생산하기 위하여 본 발명에서는 컴퓨터 시뮬레이션을 통하여 활성이 증대된 돌연변이를 제작하고자 하였다. 하지만 해당 효소들의 구조가 밝혀져 있지 않았으므로 우선 MODELLER (Webb, B.; Sali, A., Comparative protein structure modeling using MODELLER. Curr Protoc Bioinformatics 2016, 54, 5.6.1-5.6.37)을 이용하여 단백질 구조를 예측하였다. 그 후 PyRosetta를 통한 docking simulation (Chaudhury, S.; Lyskov, S.; Gray, J. J., PyRosetta: a script-based interface for implementing molecular modeling algorithms using Rosetta. Bioinformatics 2010, 26 (5), 689-691)을 통하여 활성이 증대된 돌연변이를 스크리닝하고자 하였다. 컴퓨터 시뮬레이션 기반 예측 외에도 구조 분석 결과를 통해 활성을 증대시킬 것으로 예상되는 돌연변이를 추가적으로 선정하였다.

GtCGT에 대한 homology modelling을 TcCGT (Trollius chinensis 유래 C-glycosyltransferase; PDB ID 6JTD; 단백질 서열 유사도 35.1%)을 비교군으로 활용하여 수행하였다. 산출된 GtCGT 구조 모델을 이용하여 FK를 리간드로 하는 컴퓨터 기반 docking simulation (SW: AutoDock Vina)을 수행하였다. 그 결과 239개의 돌연변이가 산출되었는데, 이 중 122개의 돌연변이가 야생형 효소에 비하여 높은 docking 점수를 보여주었다 (표 6). 이 중 상위 20개의 돌연변이에 대하여 실험을 수행하였는데, GtCGT의 예측된 구조 분석 결과 활성을 증대시킬 수 있을 것으로 예상되는 14개의 돌연변이 또한 추가로 테스트하였다. 상기 34개의 돌연변이를 FK 균주에 형질전환 후 플라스크 배양을 수행한 결과, 야생형 GtCGT 대비 높은 KA 생산량을 보이는 여섯 개의 돌연변이가 선정되었다 (V93Q, Y193F, L164G, F17G, R322D, V132A). 이들 중 가장 높은 dcII 생산량을 보여준 돌연변이는 GtCGT^V93Q였으며, 생산량이 약 2.9배 가량 증가되는 것으로 나타났다 (도 6c). 해당 돌연변이에서 Gln93 아미노산이 활성화 부위(active site)에 위치해 있어, 직접적으로 FK와 결합하는 것으로 판단되었다. Gln93 아미노산은 C6의 히드록시기(hydroxyl group)와 수소결합을 형성하는데, 이는 FK 리간드가 C2에서 C-글리코실화 (C-glycosylation) 되기 위하여 정확한 방향을 잡아주는 것으로 예측된다. Y193F 돌연변이는 두 번째로 높은 dcII 농도를 보여주었는데, 해당 두 돌연변이 간의 시너지 효과를 보기 위하여 이중 돌연변이를 구축한 후 (GtCGT^V93Q/Y193F) FK 균주에 도입하였다. 해당 이중 돌연변이는 0.74 mg CA eq/L의 dcII를 생산하였는데, 이는 야생형 GtCGT에 비하여 5.3배 증산된 결과이다 (도 6c). V93Q 돌연변이에서, Tyr193 아미노산은 C10의 카르보닐기(carbonyl group)와 수소 결합을 형성하면서 Gln93이 C6의 히드록시기(hydroxyl group)와 수소결합을 형성하는 것을 방해한다. 따라서, Tyr193을 Phe193으로 바꾸어 주면서 C10에서의 수소결합이 저해되어 FK의 리간드 결합이 개선된 것으로 예측된다 (도 6d).

*가장 docking 점수가 높은 20개는 볼드체로 표기; 구조 기반 추가로 선택된 돌연변이는 파란색으로 표기함; ??야생형 GtCGT

DnrF에 대해서도 동일한 방법을 이용하여 돌연변이 라이브러리를 제작하였고, 그 결과 가장 높은 KA 생산량을 보여준 돌연변이는 DnrF^P217K였으며, 약 2.2배 KA 생산량이 증가되었다 (2.68 mg FK eq/L) (도 6a, 6b).

특정 서열에 대한 돌연변이 발생은 기존 문헌에서 보고된 바와 동일하게 진행되었다 (Zheng, L.; Baumann, U.; Reymond, J. L., An efficient one-step site-directed and site-saturation mutagenesis protocol. Nucleic Acids Res. 2004, 32 (14), e115.). 이 때 dnrF ^P217K 가 도입된 플라스미드 pBBR1-T7는 pKA로, GtCGT ^V93Q/Y193F 가 도입된 pCDFDuet-1 플라스미드는 pdcII로 명명하였다. DnrF의 P217K 돌연변이를 제작하기 위하여 DnrF_P217K_F프라이머와 DnrF_P217K_R프라이머가 사용되었고, GtCGT의 V93Q 돌연변이를 제작하기 위하여 GtCGT_V93Q_F 프라이머와 GtCGT_V93Q_R 프라이머가 사용되었으며, GtCGT의 Y193F 돌연변이를 제작하기 위하여 GtCGT_Y193F_F 프라이머와 GtCGT_Y193F_R 프라이머가 사용되었다.

이름	서열	서열 번호
DnrF_P217K_F프라이머(Forward)	5'- gtcgtaccgAAGgggtccaccggctggtac-3'	27
DnrF_P217K_R 프라이머(Reverse)	5'- ggtggacccCTTcggtacgacggcggtgag -3'	28
GtCGT_V93Q_F 프라이머 (Forward)	5'- gacgtatggCAAtacatcaatcacttagac -3'	29
GtCGT_V93Q_R 프라이머 (Reverse)	5'- gattgatgtaTTGccatacgtcaaacggtt-3'	30
GtCGT_Y193F_F프라이머 (Forward)	5'- gtgcccgacTTCctgcatccgcgcacaccc-3'	31
GtCGT_Y193F_R 프라이머 (Reverse)	5'- cggatgcagGAAgtcgggcacttcatcata -3'	32

본 발명에서 제작된 GtCGT^V93Q/Y193F(GtUF6CGT1^V93Q/Y193F) 돌연변이의 단백질 서열은 아래와 같다:

MGSLTNNDNLHIFLVCFIGQGVVNPMLRLGKAFASKGLLVTLSAPEIVGTEIRKANNLNDDQPIKVGSGMIRFEFFDDGWESVNGSKPFDVWQYINHLDQTGRQKLPIMLKKHEETGTPVSCLILNPLVPWVADVADSLQIPCATLWVQSCASFSAYYHYHHGLVPFPTESEPEIDVQLPGMPLLKYDEVPDFLHPRTPYPFFGTNILGQFKNLSKNFCILMDTFYELEHEIIDNMCKLCPIKPIGPLFKIPKDPSSNGITGNFMKVDDCKEWLDSRPTSTVVYVSVGSVVYLKQEQVTEMAYGILNSEVSFLWVLRPPSKRIGTEPHVLPEEFWEKAGDRGKVVQWSPQEQVLAHPATVGFLTHCGWNSTQEAISSGVPVITFPQFGDQVTNAKFLVEEFKVGVRLGRGELENRIITRDEVERALREITSGPKAEEVKENALKWKKKAEETVAKGGYSERNLVGFIEEVARKTGTK

상기와 같이 활성이 증대된 DnrF와 GtCGT 돌연변이를 구축한 후, 해당 두 돌연변이 효소를 조합하여 CA 균주를 구축하였다. CA 균주는 pFK와 pCA (pCDF-dnrF^P217K-GtCGT^V93Q/Y193F) 플라스미드를 BAP1 균주에 형질전환하여 제작하였다. 이 때 두 유전자를 하나의 플라스미드로 삽입하기 위하여 pKA로부터 dnrF_NcoI_F와 dnrF_BamHI_R 프라이머를 이용한 PCR 증폭을 통해 dnrF ^P217K 를 증폭하였고, 이는 pdcII에 NcoI, BamHI 사이트로 삽입하여 pCA를 구축하였다. 구축된 CA 균주를 플라스크에서 배양한 결과 22.2 μg/L의 카르민산 (carminic acid)이 생산되었다 (도 7). 포도당으로부터 생산된 카르민산의 진위는 도 7과 같이 LC-MS/MS 분석을 통하여 판별하였다.

카르민산 생산능을 증가시키기 위하여 C. glutamicumacc BCD1 과발현, pabA 낙다운, galU-pgm-ndk 과발현을 각각 또는 조합으로 테스트 하였고, 각 균주의 생산량은 다음과 같다 (도7a): pabA KD, 25.9 μg/L; accBCD1 OE, 74.9 μg/L; galU-pgm-ndk OE, 41.0 μg/L; accBCD1 OE-galU-pgm-ndk OE, 49.9 μg/L; pabA KD-galU-pgm-ndk OE, 57.7 μg/L; pabA KD-accBCD1 OE, 57.2 μg/L; pabA KD-accBCD1 OE-galU-pgm-ndk OE, 25.2 μg/L로 나타나, accBCD1을 과발현한 균주(BL21(DE3) harboring pFK, pCA, pACC; pFK : pDS00 derivative containing antDEFBG from P. luminiscens and codon optimized zhuIJ from Streptomyces sp. R1128 (P _T7 - antDEFBG - T7 _T - P _T7 - zhuIJ - T7 _T ); pCA : pCDFDuet-1 derivative containing dnrF ^P217K and GtCGT ^V93Q/Y193F in different operons (P _T7 - dnrF ^P217K - T7 _T - P _T7 - GtCGT ^V93Q/Y193F - T7 _T ); pACC : pBBR1TaC derivative containing accBC and accD1 from Corynebacterium glutamicum ATCC 13032)에서 가장 높은 카르민산 농도인 74.9 μg/L가 생산되는 것을 확인하였다. 또한, 해당 균주에 대한 유가식 발효 수행 결과 0.65 mg/L의 카르민산이 생산되었다.

이름	서열	서열 번호
dnrF_NcoI_F프라이머(Forward)	5'- CTTTAATAAGGAGATATACCATGGCCTTGACGAAGCCGGATG -3'	33
dnrF_BamHI_R 프라이머(Reverse)	5'- CCGAGCTCGAATTCGGATCCCAAGCTTGTCGACGGAGCTC -3'	34

실시예 3: GtCGT ^V93Q/Y193F 을 통한 알로에신 생산

알로에신은 알로에 베라(Aloe vera)로부터 추출되는 대표적인 화장품 첨가제이다. 알로에신은 anti-tyrosinase와 anti-melanogenesis 효과 때문에 화장품업계에서 미백제로 활용되고 있으며, 항염증 및 항라디칼 특성 때문에 잠재적 약물 또는 화장품 원재료로 각광받고 있다. 하지만 식물에서의 알로에신의 함량은 대단히 낮아 보다 효율적인 제조방법이 필요하였다. 알로에신 생산에 대해서는 기존 논문 발표를 통하여 보고된 바 있다 (D Yang et al., Proc. Natl. Acad. Sci. U. S. A. 2018, 115 (40), 9835-9844.). 하지만 알로에손에서 알로에신으로 전환하는 C-glycosyltransferase는 아직 보고된 바 없어 (도 8), 본 발명에서는 상기 실시예 2를 통하여 개발한 GtCGT 돌연변이가 알로에신을 생산하는 효과가 있는지 테스트하고자 하였다.

본 발명자들은 알로에손 생산을 위하여 E. coli BL21(DE3) 균주에 다음의 플라스미드들이 형질전환하였다: pCDF-RpALS, pWAS-anti-pabA, pBBR1-zwf. 따라서 해당 균주는 다음의 유전자들을 발현하고 있다: RpALS (R. palmatum aloesone synthase를 코딩한다), anti-pabA 합성 조절 sRNA, zwf (E. coli glucose 6-phosphate 1-dehydrogenase를 코딩한다) (Yang, D.; Kim, W. J.; Yoo, S. M.; Choi, J. H.; Ha, S. H.; Lee, M. H.; Lee, S. Y., Repurposing type III polyketide synthase as a malonyl-CoA biosensor for metabolic engineering in bacteria. Proc. Natl. Acad. Sci. U. S. A. 2018, 115 (40), 9835-9844 참조).

해당 균주는 30.9 mg/L의 알로에손을 포도당으로부터 생산한다. 알로에신의 생산에 앞서, 알로에손의 생산량을 증가시키기 위하여 호환 가능한 플라스미드 상에 RpALS를 추가로 도입하여 알로에손의 생산량을 증가시키고자 하였다. 이를 위해 높은 카피 수(copy number)의 RSF 복제 원점을 지닌 pRSFDuet-1 플라스미드 상에 RpALS를 도입하였다. RpALS를 기존 구축한 pCDF-RpALS로부터 ALS_NdeI_F와 ALS_NdeI_R 프라이머를 이용하여 증폭한 후 pRSFDuet-1 상의 NdeI 사이트에 Gibson assembly를 이용하여 삽입하여 해당 플라스미드를 구축하였다. 그 후 pCDF-RpALS와 pRSF-RpALS를 동시에 pWAS-anti-pabA와 pBBR1-zwf 플라스미드를 이미 보유하고 있는 E. coli BL21(DE3) 균주에 형질전환시키고, 해당 균주에 대한 플라스크 배양을 수행하였다. 그 결과, 102.1 mg/L의 알로에손이 생산되어, 개량 전에 비해 알로에손 생산량이 현저히 증가됨을 확인하였다.

이름	서열	서열 번호
ALS_NdeI_F프라이머(Forward)	5'- GTATAAGAAGGAGATATACATATGGCAGATGTCCTGCAGGAG -3'	35
ALS_NdeI_R 프라이머(Reverse)	5'- GATATCCAATTGAGATCTGCCAATTAGGGAATGGGGACGCTAC -3'	36

그 후, 알로에신 생산을 테스트하기 위하여 pWAS-anti-pabA pRSF-RpALS, pBBR1-zwf 플라스미드를 보유하고 있는 BL21(DE3) 균주 상에 pCDF-GtCGT 또는 pCDF-GtCGT^V93Q/Y193F 플라스미드를 형질전환한 후, 플라스크 배양을 수행하였다. 그 결과, GtCGT^V93Q/Y193F를 포함하고 있는 균주가 0.06 μg/L의 알로에신을 생산하여, GtCGT를 포함하고 있는 균주보다 많은 양의 알로에신을 생산하는데 성공하였다 (도9).

알로에손의 증산을 위해 테스트하였던 것과 동일하게 RpALS를 추가 도입하여 알로에신의 생산량을 증가시키고자 하였다. 이를 위해 pCDF-GtCGT^V93Q/Y193F를 도입하는 대신 pCDF-RpALS-GtCGT^V93Q/Y193F를 구축하였다. 이를 위해 RpALS를 pCDF-RpALS로부터 pCDFDuet_F와 pCDFDuet_R 프라이머를 이용하여 증폭하였고, pCA 플라스미드 상의 NcoI, BamHI 사이트로 Gibson assembly를 통하여 도입하였다. 이 후 pRSF-RpALS, pCDF-RpALS-GtCGT^V93Q/Y193, pWAS-anti-pabA, pBBR1-zwf의 네 종의 플라스미드를 E. coli BL21(DE3)에 형질전환한 후 ALS 균주라 명명하였다.

ALS 균주는 포도당으로부터 0.3 μg/L의 알로에신을 생산하는데 성공하였다. 생산된 알로에신의 진위는 도 9와 같이 LC-MS/MS를 통하여 판별되었다.

이와 같이 본 발명자들은 GtCGT의 도입을 통하여 효소조차 밝혀지지 상태로 알로에신 생산에 성공하였고, GtCGT^V93Q/Y193F의 도입을 통하여 알로에신 생산능을 현저히 높일 수 있었다. 이와 같이 GtCGT^V93Q/Y193F 효소 돌연변이는 폴리케타이드 전반에 걸쳐 배당체를 생산할 수 있는 능력이 있는 효소라 할 수 있으며, 본 발명자들은 알로에신 생산능을 더욱 높일 수 있는 돌연변이를 구축하고자 GtCGT^V93Q/Y193F를 기반으로 추가 돌연변이 제작을 진행하게 되었다.

실시예 4: GtCGT ^V93Q/Y193F 에의 추가 돌연변이 도입을 통한 알로에신 증산

본 발명자들은 앞서 개발한 방향족 폴리케타이드에 활성을 보이는 GtCGT ^V93Q/Y193F 돌연변이를 추가로 개량하여 알로에손으로부터 알로에신으로의 전환 효율을 높이고자 하였다. 이를 위해 실시예 2를 통해 산출한 GtCGT^V93Q/Y193F 구조 모델 상에 새로운 기질인 알로에손을 도킹하였다. 이를 통하여 알로에손과 더욱 안정한 결합을 형성하여 효소 활성을 높일 것으로 예상되는 돌연변이를 표 10과 같이 선정하였다.

No.	Mutant
1	I18P
2	Q20M
3	T50N
4	T50Q
5	T50K
6	T50R
7	T50V
8	I95M
9	I95T
10	V290G
11	V290A
12	I323S
13	I323A
14	I95L

특정 서열에 대한 돌연변이 발생은 실시예 2와 동일한 방법으로 진행되었다. 이 때 pCDF-RpALS-GtCGT^V93Q/Y193F를 주형으로 하여 아래 표 11의 프라이머 쌍을 이용하여 유전자 돌연변이를 포함하는 플라스미드를 제작하였다. 제작된 플라스미드들은 각각 pWAS-anti-pabA, pRSF-RpALS, pBBR1-zwf 세 종의 플라스미드와 함께 BL21(DE3) 균주 상에 형질전환된 후, 이와 같이 구축된 균주들을 이용하여 실시예 3과 동일한 조건 하에서 플라스크 배양을 수행하였다. 생산된 알로에신의 농도는 카이스트 바이오코어 센터의 HPLC Triple Quadrupole Mass Spectrometer (LCMS-8050, Shimadzu)의 MRM 모드를 통해 측정되었다.

Name	Sequence (5'-3')	서열번호
GtCGT ^V93Q/Y193F_I18P_F	tgtgcttcCCAggccagggcgtggtcaat	63
GtCGT ^V93Q/Y193F_I18P_R	cgccctggccTGGgaagcacacaagaaaaat	64
GtCGT ^V93Q/Y193F_Q20M_F	ttcatcggcATgggcgtggtcaatcccat	65
GtCGT ^V93Q/Y193F_Q20M_R	tgaccacgcccATgccgatgaagcacacaag	66
GtCGT ^V93Q/Y193F_T50K_F	aatcgttggaaAGgagatccgtaaggcgaa	67
GtCGT ^V93Q/Y193F_T50K_R	tacggatctcCTttccaacgatttccggtg	68
GtCGT ^V93Q/Y193F_T50N_F	aatcgttggaaAtgagatccgtaaggcgaa	69
GtCGT ^V93Q/Y193F_T50N_R	tacggatctcaTttccaacgatttccggtg	70
GtCGT ^V93Q/Y193F_T50Q_F	aatcgttggaCAGgagatccgtaaggcgaa	71
GtCGT ^V93Q/Y193F_T50Q_R	tacggatctcCTGtccaacgatttccggtg	72
GtCGT ^V93Q/Y193F_T50R_F	aatcgttggaCGtgagatccgtaaggcgaa	73
GtCGT ^V93Q/Y193F_T50R_R	tacggatctcaCGtccaacgatttccggtg	74
GtCGT ^V93Q/Y193F_T50V_F	aatcgttggaGTtgagatccgtaaggcgaa	75
GtCGT ^V93Q/Y193F_T50V_R	tacggatctcaACtccaacgatttccggtg	76
GtCGT ^V93Q/Y193F_I95L_F	gtatggcaatacCtcaatcacttagaccagacag	77
GtCGT ^V93Q/Y193F_I95L_R	ggtctaagtgattgaGgtattgccatacgtcaaacg	78
GtCGT ^V93Q/Y193F_I95M_F	gtatggcaatacatGaatcacttagaccagacag	79
GtCGT ^V93Q/Y193F_I95M_R	ggtctaagtgattCatgtattgccatacgtcaaacg	80
GtCGT ^V93Q/Y193F_I95T_F	gtatggcaatacaCTaatcacttagaccagacag	81
GtCGT ^V93Q/Y193F_I95T_R	ggtctaagtgattAGtgtattgccatacgtcaaacg	82
GtCGT ^V93Q/Y193F_V290A_F	gtgtcgggtctgCtgtatatttgaagcaggag	83
GtCGT ^V93Q/Y193F_V290A_R	gcttcaaatatacaGcagacccgacactaacg	84
GtCGT ^V93Q/Y193F_V290G_F	gtgtcgggtctgGtgtatatttgaagcaggag	85
GtCGT ^V93Q/Y193F_V290G_R	gcttcaaatatacaCcagacccgacactaacg	86
GtCGT ^V93Q/Y193F_I323A_F	agcaaacgcGCcggtacggaaccgcatgt	87
GtCGT ^V93Q/Y193F_I323A_R	gttccgtaccgGCgcgtttgctcgg	88
GtCGT ^V93Q/Y193F_I323S_F	agcaaacgcaGcggtacggaaccgcatgt	89
GtCGT ^V93Q/Y193F_I323S_R	gttccgtaccgCtgcgtttgctcgg	90

플라스크 배양 결과 I323S, T50R, T50V, I18P, I95T, Q20M, I323A 추가 돌연변이 도입을 통해 알로에신 생산량이 10배 이상 증가하였으며, 특히 GtCGT V93Q/Y193F/I323S 돌연변이를 통해 7.75 μg/L의 알로에신이 생산되었다 (도 10). 이는 기존 농도인 0.3 μg/L에 비해 25.8배 이상 증가한 결과이다.

구조 기반 추가 돌연변이 탐색 외에도 더욱 효소 활성을 높이기 위해 GtCGT 구조 모델을 이용하여 알로에손을 리간드로 하는 컴퓨터 기반 docking simulation (SW: AutoDock Vina)을 수행하였다. 그 결과 15개의 돌연변이가 야생형 효소에 비하여 높은 docking 점수를 보여주었다 (표 12).

No.	Mutant
1	V22A
2	L29A
3	E46G
4	V48G
5	E51C
6	A55S
7	S86V
8	D99G
9	R103V
10	C151G
11	L184G
12	L194A
13	E332P
14	I18A
15	P385A

특정 서열에 대한 돌연변이 발생은 실시예 2와 동일한 방법으로 진행되었다. 이 때 pCDF-RpALS-GtCGT^V93Q/Y193F를 주형으로 하여 아래 표 13의 프라이머 쌍을 이용하여 유전자 돌연변이를 포함하는 플라스미드를 제작하였다. 제작된 플라스미드들은 각각 pWAS-anti-pabA, pRSF-RpALS, pBBR1-zwf 세 종의 플라스미드와 함께 BL21(DE3) 균주 상에 형질전환된 후, 이와 같이 구축된 균주들을 이용하여 실시예 3과 동일한 조건 하에서 플라스크 배양을 수행하였다. 생산된 알로에신의 농도는 카이스트 바이오코어 센터의 HPLC Triple Quadrupole Mass Spectrometer (LCMS-8050, Shimadzu)의 MRM 모드를 통해 측정되었다.

플라스크 배양 결과 P385A, L194A, V48G 추가 돌연변이 도입을 통해 알로에신 생산량이 5배 이상 증가하였으며, 특히 GtCGT V93Q/Y193F/P385A 돌연변이를 통해 4.23 μg/L의 알로에신이 생산되었다 (도 11). 이는 기존 농도인 0.3 μg/L에 비해 14.1배 이상 증가한 결과이다.

Name	Sequence (5'-3')	서열번호
V22A-f	cggccagggcgCggtcaatcccatgttacg	91
V22A-r	tgggattgaccGcgccctggccgatgaagc	92
L29A-f	catgttacgtGCggggaaggcgttcgcctc	93
L29A-r	cgccttccccGCacgtaacatgggattgac	94
E46G-f	agcgcaccggGCatcgttggaactgagatc	95
E46G-r	tccaacgatGCccggtgcgcttaaagtgac	96
V48G-f	ccggaaatcgGtggaactgagatccgtaag	97
V48G-r	ctcagttccaCcgatttccggtgcgcttaa	98
E51C-f	cgttggaactTGCatccgtaaggcgaataac	99
E51C-r	ccttacggatGCAagttccaacgatttccgg	100
A55S-f	gatccgtaagTcgaataaccttaatgatgaccaac	101
A55S-r	aaggttattcgActtacggatctcagttcc	102
S86V-f	cgtaaacggtGTcaaaccgtttgacgtatgg	103
S86V-r	caaacggtttgACaccgtttacggattccca	104
D99G-f	caatcacttagGccagacaggccgtcaaaaac	105
D99G-r	ggcctgtctggCctaagtgattgatgtattgc	106
R103V-f	ccagacaggcGTtcaaaaacttccgattatg	107
R103V-r	ggaagtttttgaACgcctgtctggtctaagtg	108
C151G-f	ggtccaatctGgtgcaagtttttcagcatat	109
C151G-r	gaaaaacttgcacCagattggacccacaagg	110
L184G-f	ctgggatgccaGGtttgaaatatgatgaagtg	111
L184G-r	catatttcaaaCCtggcatcccaggaagttg	112
L194A-f	cccgacttcGCgcatccgcgcacaccctac	113
L194A-r	gtgcgcggatgcGCgaagtcgggcacttcatc	114
E332P-f	tgtactgcccCCggagttctgggagaaggcc	115
E332P-r	cccagaactccGGgggcagtacatgcggttc	116
I18A-f	tgtgtgcttcGCcggccagggcgtggtcaat	117
I18A-r	cgccctggccgGCgaagcacacaagaaaaat	118
P385A-f	catcactttcGcacaatttggggaccaagtg	119
P385A-r	ccccaaattgtgCgaaagtgatgacgggcac	120

실시예 5: GtCGT ^V93Q/Y193F 을 통한 페닐프로파노이드 배당체 생산

본 발명을 통하여 개발한 C-글리코실전이효소의 페닐프로파노이드 계 천연물로의 확장성을 테스트하기 위하여 본 발명자들은 하기와 같은 실험을 진행하였다.

세포 내 발현된 GtCGT^V93Q/Y193F의 효소 활성을 확인하고자 대장균 BL21(DE3)에 pCDF-GtCGT^V93Q/Y193F 와 pBBR1-galU-pgm-ndk이 모두 형질전환된 균주를 플라스크 배양하였고, 세포의 성장이 OD600 0.6-0.8에 도달하였을 때 1 mM의 IPTG를 투여하였다. 이 때, 70 μM의 luteolin, 0.5 mM의 naringenin 또는 185.2 μM의 apigenin을 함께 투여하였고, 추가로 36 시간동안 배양하였다. LC-MS를 통하여 기질 및 생산물의 양을 분석하였다. 플라스크 배양은 50 mL의 R/2 배지(3 g/L yeast extract, 20 g/L 포도당 추가 포함)를 포함하고 있는 250 mL 배플 플라스크에서 진행되었고, 30 ℃와 200 rpm에서 배양을 진행하였다.

배양 결과, 185.2 μM의 apigenin으로부터 15.0 μM의 vitexin이 생산되었고, 0.5 mM의 naringenin으로부터 51.6 μM의 naringenin-6-C-glucoside가 생산되었으며, 70 μM의 luteolin으로부터 27.9 μM의 isoorientin이 생산되었다. 이는 각각 8.1%, 10.3% 및 27.9%의 전환율에 해당하는 값이다 (도 10).

상기와 같이 본원 발명의 글루코실전이효소는 다양한 페닐프로파노이드 C-glucoside 역시 생산할 수 있는 활성 또한 보이고 있으며, 이는 본원 발명의 효소가 다양한 폴리케타이드 및 페닐프로파노이드 C-glucoside를 생산할 수 있는 범용 효소라는 것을 나타낸다.

실시예 6: GtCGT ^V93Q/Y193F 정제 및 K _M , V _max 측정

본 발명을 통하여 개발한 C-글리코실전이효소 GtCGT^V93Q/Y193F의 특성을 보다 자세히 규명하기 위해 효소를 정제하여 효소반응속도론적 변수를 측정하고자 하였다. His-tag을 이용한 효소 정제를 위하여, N-말단에 각각 6xHis-tag가 연결된 GtCGT와 GtCGT^V93Q/Y193F를 발현시키는 pCDF-NHis-GtCGT와 pCDF-NHis-GtCGTmut 플라스미드를 구축하였다. pCDF-GtCGT와 pCDF-GtCGTmut를 GtCGT_N_His_IV_F / GtCGT_N_His_IV_R 프라이머를 이용하여 PCR 증폭한 후 DpnI 처리 및 T4 PNK와 T4 ligase 처리를 통하여 blunt-end ligation 시킴으로써 각 플라스미드를 구축하였다. 구축된 두 플라스미드를 E. coli BL21(DE3) 균주 상에 각각 형질전환한 후 10 mL LB를 포함한 테스트 튜브 상에서의 시드 배양을 거쳐 500 mL LB를 포함한 플라스크에서 OD₆₀₀ 값이 0.8이 될 때까지 37 ^oC에서 배양하였다. 효소 발현을 위해 1 mM IPTG 처리 후 20 ^oC에서 16 시간 동안 추가 배양하였고, 원심분리를 통해 세포 포집 후 30 mL의 lysis buffer (50 mM NaH₂PO₄, 0.3 M NaCl, 10 mM imidazole, pH 7.5)에 재현탁하였다. 초음파를 통해 세포를 파쇄 후, 10,000 rpm, 4°C, 40 min의 조건으로 원심분리하여 수용성 단백질을 포함하고 있는 상등액을 얻었다. 상등액을 TALON 레진 (Clontech)에 흘려 보냄으로써 His-tag가 결합된 단백질만을 정제하고자 하였다. Wash buffer (50 mM NaH₂PO₄, 0.3 M NaCl, 20 mM imidazole, pH 7.5)를 통해 불순물 제거 후 lysis buffer 상에 90, 160, 230, 300 mM의 imidazole이 첨가된 elution buffer를 처리하여 효소를 정제하였다.

Name	Sequence (5'-3')	서열번호
GtCGT_N_His_IV_F	CACCATCACCATCACCATGGGAGTTTGACTAACAACGATAATC	121
GtCGT_N_His_IV_R	CATATGTATATCTCCTTCTTATAC	122

정제된 효소는 Amicon Ultra-15 Centrifugal Filters (regenerated cellulose, 50,000 NMWL; Merck)를 이용하여 효소 보관 용액 (50 mM HEPES, 20% glycerol, pH 7.5)으로 버퍼 교환되었고, K_M과 V_max 값을 계산하기 위하여 정제된 효소를 이용하여 FK를 dcII로 전환하고자 하였다. 이 때 반응 정도를 파악하기 위하여 UDP-Glo Glycosyltransferase Assay Kit (Promega)를 활용하였다. 해당 kit는 반응의 부산물로 발생하는 free UDP를 발광량으로 측정할 수 있게 해주므로, 0.1 M의 효소 및 다양한 농도의 FK를 포함하는 200 L 효소 반응액 (50 mM HEPES, 0.1 mM UDP-glucose, 5 mM MgCl₂, pH 7.5)을 25 ^oC에서 1 시간 반응시킨 후 25 L를 덜어내어 kit를 활용하여 발관량을 측정하였다. 반응 속도 및 기질의 농도를 Michaelis-Menten 식에 도입한 후 OriginPro 2019 프로그램을 통해 분석함으로써 GtCGT와 GtCGT^V93Q/Y193F의 K_M과 V_max 값을 계산하였다. 그 결과 GtCGT^V93Q/Y193F의 K_M 값은 GtCGT와 비교했을 때 19.5% 감소한 반면, GtCGT^V93Q/Y193F의 V_max 값은 GtCGT에 비해 18.2% 증가하였다 (도 13; 표 15). 즉, GtCGT^V93Q/Y193F의 V_max/K_M 값은 GtCGT에 비해 46.8% 향상되었고, 이는 GtCGT^V93Q/Y193F 돌연변이체의 촉매 효율이 향상되었음을 나타낸다.

	K _M (μM)^a	V _max (μM min^-1)^a	V _max/K _M (min^-1)
DnrF	56.75 ± 4.68	0.99 ± 0.086	1.75 Х 10^-2
DnrF^P217K	43.31 ± 2.64	1.01 ± 0.062	2.34 Х 10^-2
GtCGT	6.30 ± 1.64	1.60 Х 10^-3 ± 1.39 Х 10^-4	2.54 Х 10^-4
GtCGT^V93Q/Y193F	5.07 ± 0.74	1.89 Х 10^-3 ± 1.13 Х 10^-4	3.73 Х 10^-4

^a means ± standard deviation (SD; n = 3)

실시예 7. 유전자 정보

1. ravC from Streptomyces ravidus (서열번호 37)

atgtccagtttcagtattgatgatctgaagcgtatcttgcgcgaaggggcaggggcaacggctgagttagacggtgacattttagacgcctcctttgatgatttggggtatgattctttggctcttcttgaaacgggttcgcgcatcggacgtgaatacggtttggaatttgaggatacagctttcgccgacgtggaaacacctcgtgacttggtcggcgtagttaatgctcagttatcggccccggctccgcgtgggtaa

2. zhuIJ from Streptomyces sp. R1128(서열번호 38)

atgcgtcatgtagagcatacagtcaccgttgcggccccagcagacttggtttgggaggtacttgccgatgtcttaggctatgctgacatcttcccaccgacggaaaaagttgaaattcttgaggaggggcaaggataccaggtagtgcgccttcacgtcgatgttgcgggtgagattaatacatggaccagtcgtcgcgatttagaccctgcgcgccgcgtaattgcttaccgccaacttgagacggctccgatcgtgggccacatgagcggggaatggcgtgctttcacactggatgccgaacgtacccaattagtcctgactcacgatttcgtaacccgtgcagccggggatgacggtttagtcgccggaaaattgaccccagatgaggcgcgcgaaatgttagaagcggtggtagaacgtaactctgtcgccgacttaaacgcggtccttggagaagctgagcgtcgcgtccgcgcagccggtggagttggtaccgtaactgcgtaataataattttgtttaactttaagaaggagatatatccatgtcagggcgcaaaacctttttagacttaagttttgctacccgcgacacaccgtcggaggcgactccggtggtggtagatttgctggaccacgtaactggagccaccgtattaggattatcacctgaggatttccccgatggtatggctatttccaatgagaccgttacgttgacgacccacactggcacgcacatggatgcgccactgcactatggtcccttaagtgggggagttccggcaaagtcgattgaccaagtgcccttggaatggtgctatggacctggagttcgtttggatgttcgccacgtgccggcaggagatggtattactgtcgatcatttgaacgccgcgttggatgcagcagagcacgatttggcccccggtgacattgtgatgctgtggaccggcgcggacgctctgtggggaacccgcgaatacttgagcacgtttccggggttaactgggaaggggacacaatttttggtcgaggcgggtgttaaagtcattggcattgatgcatggggactggatcgcccgatggcagctatgatcgaagaataccgtcgtacgggcgataaaggagcattatggccggctcacgtctatggacgcacacgcgaatacctgcaattagagaagcttaataatttgggcgctttaccaggagctacagggtatgacatttcatgctttccggttgcggttgcaggcactggagctgggtggactcgtgtggtcgccgttttcgagcaagaggaagaggattaataa

3. trTT7 from Arabidopsis thaliana (서열번호 39)

atgtcccatcgccgcaaccgtagccacaacaatcgtttacccccgggacctaatccctggcccattatcggaaacctgccgcacatgggtacgaagccccaccgtacgttgtcggctatggttacgacctatggcccaattctgcacctgcgtctgggttttgtagacgtggtcgtagcggcgtccaagtcggtcgccgagcagttcttgaagattcacgacgctaacttcgcttcacgtccccccaactcaggagccaaacacatggcgtataattatcaagacttggtattcgccccctatggacatcgctggcgcttattgcgcaagatcagctcggtgcatctgttctcggcaaaagcgttggaggactttaaacacgtgcgtcaggaagaggtcggaacactgactcgcgaattagtacgtgtcggcaccaaaccagtgaaccttgggcaactggtgaatatgtgcgttgtcaacgccttaggacgcgaaatgatcggacgccgcttattcggggccgatgccgatcataaggcggatgagttccgctcgatggtcacggagatgatggcgttagcgggggtctttaatatcggcgactttgtaccgtcattagactggcttgatctgcaaggggtcgctggaaagatgaagcgtttacataagcgttttgatgcgttcttaagttcgattttaaaagaacatgaaatgaatgggcaagaccaaaagcataccgatatgttatcgaccttaatcagccttaagggtacagatctggatggggatggcggctccttaacggatactgaaattaaggcgcttttattaaacatgttcacagccggaaccgacacatcagccagtacagtagattgggcaatcgctgaattgatccgccaccccgatatcatggtgaaggctcaggaagaattagatattgttgtaggtcgcgaccgccctgtgaatgagtctgatatcgcccaactgccgtacttacaggcggtaattaaggaaaattttcgtctgcatccacctactcccctgtctttgccgcacattgcgagtgaatcctgtgagattaacggttaccatattcccaaaggttcaacattacttaccaacatctgggctatcgcccgtgatccggaccagtggagcgatccgttagcttttaaaccagaacgttttctgccaggaggagaaaaatctggggttgatgtaaaaggtagtgatttcgagctgattccgttcggtgcaggccgtcgcatttgtgcaggcctgtctctgggtcttcgcacgatccagttcttaacagcgactttagtacaagggtttgattgggagttagctgggggagtgacgcccgaaaaactgaacatggaagaatcgtacgggttaactttgcaacgcgctgtccctctggtagtacacccgaaacctcgtttggccccgaatgtgtacgggctgggcagtggctaa

4. ATR2 from Arabidopsis thaliana (서열번호 40)

atgtcttcttcttcttcttcttctacctctatgatcgacctgatggctgctatcatcaaaggtgaaccggttatcgtttctgacccggctaacgcttctgcttacgaatctgttgctgctgaactgtcttctatgttaattgagaatcgtcagtttgctatgatcgttacaacatccatcgcggtccttattggttgtatcgttatgttggtctggcgccgctctggttccggtaactctaaacgtgtggaaccgcttaaaccgctggtgatcaaacctcgtgaggaggaaatcgacgatggacgtaaaaaagtaacaatctttttcggaacgcagactggcactgcggaaggttttgccaaggcattaggtgaggaagctaaagctcgttatgaaaagacgcgcttcaagattgttgatctggacgattacgctgcagacgatgatgaatacgaggaaaaattaaaaaaagaggatgtagctttcttcttcttagctacgtatggcgatggtgaaccgacagataatgccgctcgtttttataagtggtttaccgaaggcaatgatcgtggtgagtggttgaaaaacttaaaatatggggttttcgggctgggcaatcgtcaatacgagcactttaacaaggtcgcgaaagtggtcgatgacattctggttgagcaaggcgcacagcgtctggtacaagtagggttaggggatgatgaccagtgtatcgaagatgatttcacagcttggcgcgaagcattgtggcccgagttggatacgattctgcgcgaagagggcgatacggctgttgccacaccctacacagccgcagtattagagtatcgcgtaagcatccatgatagcgaggatgccaaattcaatgatattaaccttgctaacggaaacgggtatacagtttttgacgctcaacatccgtataaggccaacgttgcggtcaaacgtgaattgcacaccccggagtccgaccgttcctgtatccatctggaatttgatattgcgggatcaggtttaacatacgaaactggagatcacgttggtgttctgtgcgataacttatccgagacggtggatgaggcactgcgccttttagacatgtcccctgacacgtattttagcttgcatgctgaaaaagaggacggtactccgatcagtagctcgctgccaccgccgtttccaccgtgcaatttacgcacggctttaacacgttacgcgtgcctgttgtcatctcctaagaaatccgccttagtggctttggctgcacacgctagtgatcccactgaggccgagcgcttgaaacacttagcaagccctgcaggtaaagacgagtactccaagtgggtagtagagtcacagcgtagtttattggaggtgatggccgagtttcctagtgcgaagccaccgttgggagttttctttgccggggtggctccgcgtttgcaaccacgtttttatagcatcagtagttctccaaaaatcgccgagactcgcattcacgttacatgtgccctggtctacgaaaaaatgccgactgggcgcatccacaagggtgtatgctcgacttggatgaagaacgccgtaccctacgaaaagtctgaaaactgcagctcggcgccaatcttcgtacgccagtccaatttcaagttgccgtcagattcaaaggtaccgatcattatgatcggtccaggaacggggttagctccgttccgtgggttcttacaggaacgcttagcactggtcgagtcgggggtagaattgggcccctccgtcttgtttttcgggtgtcgtaaccgtcgcatggacttcatctatgaagaagagctgcaacgtttcgtggaaagtggggcgcttgctgaactgtcggtggcgttttcccgcgaaggacccacgaaagaatatgttcaacacaaaatgatggacaaagcgtcggatatctggaacatgatttcacagggcgcttatttatatgtatgtggcgatgcgaaaggcatggcgcgtgacgtccaccgttctctgcacaccattgcgcaagagcaaggtagcatggattcaacgaaagcagaaggcttcgtgaagaatttacaaacctctgggcgctatcttcgtgatgtgtggtaa

5. UrdGT2 ( SfCGT ) from Streptomyces fradiae TU2717(서열번호 41)

atgtttgccctggctccgctggccacagcagctcgtaatgcaggtcatcaggtagtaatggcagcaaaccaggacatgggacctgtcgtaaccggggttggccttccagccgtagcaaccactgatcttccgatccgtcatttcatcactaccgatcgtgaaggacgtcccgaggccattccttctgacccggtcgcgcaggcccgtttcactggtcgctggttcgcccgtatggctgccagttccttgccccgtatgcttgatttttcacgtgcatggcgcccagacttaatcgtcggtggtactatgagctatgtcgctccgctgttagctcttcacctgggagtcccgcacgcccgtcagacttgggatgcggtagacgctgatggaatccacccaggtgctgatgctgagcttcgcccagagttaagcgaattgggattggagcgccttcccgcacccgatttgttcatcgacatttgcccgccctcgttacgtcctgccaacgcagcaccagctcgcatgatgcgccacgtagccacgagccgccaatgcccgttagagccgtggatgtatacacgtgacactcgccagcgtgttttagtgacgtcgggatcgcgtgttgcaaaagaatcttacgatcgtaatttcgattttttacgtggattagcgaaggatttggtgcgctgggatgttgaattaattgtggctgctcctgacaccgtggctgaggctcttcgtgccgaggtgccacaagctcgcgtagggtggacccctttagacgtcgtggcccctacatgcgatttattggtgcatcacgccggcggagtctctacgctgactggtttatcggctggcgagccccaattattaatcccaaagggcagtgtattggaagctcctgcgcgccgcgtagcagattacggcgcggcgattgcactgttgcctggtgaggactcgacggaagctatcgccgatagttgtcaggagttgcacgccaaggacacttatgcccgccgcgctcaagacttaagccgcgaaatttcagggatgcctctgccggccacagtggtgactgcactggaacagttagcctaa

6. DcUGT2 ( DcCGT ) from Dactylopius coccus (서열번호 42)

atggagttccgcttattgattctggcactgtttagtgtcttaatgagtacgtcaaatggtgccgagattcttgccctgtttccaattcacggaatttccaactacaacgtagcagaggcacttcttaaaacgcttgccaaccgtggacataacgtcactgtggtcacgtcattcccccagaagaaacccgtgccaaacttgtatgaaatcgacgtatctggggccaaaggtcttgctaccaactcaattcactttgagcgtcttcagactatcattcaagacgtgaagtccaacttcaagaatatggtgcgtctttcacgcacttactgcgagattatgttctccgatcctcgcgtacttaacatccgcgacaaaaagtttgatttggtaatcaacgcggtgttcggatcggattgtgacgctggctttgcgtggaaaagccaagcacccctgatctcaattttaaatgcacgccacaccccgtgggcgcttcaccgtatgggaaacccttctaaccctgcgtacatgccagtaatccactcacgcttcccagtaaaaatgaatttcttccagcgtatgatcaatacaggctggcatttatactttttgtatatgtacttttattatggcaacggagaagacgcaaataaaatggcgcgtaagtttttcggtaacgacatgcccgacattaacgaaatggtctttaacacatcgttgctttttgttaatactcactttagtgttgatatgccctaccctcttgttcctaactgcattgaaattggtgggattcacgtcaaagagccccaaccgcttcccctggagattcaaaaattcatggatgaagcagagcatggtgtaatctttttcactttgggctcgatggtccgcactagcacctttcccaatcagactatccaagcgtttaaagaggcgttcgcagaacttccacagcgtgttctttggaagtttgaaaacgagaatgaagacatgccttctaacgttttaatccgcaaatggtttccacagaacgatatctttggacataagaacattaaggcgtttatctcgcatggcggtaactcaggggcccttgaagccgtgcatttcggcgtgcccatcatcggcattcctctgttctatgatcagtatcgtaatatcttgagcttcgtgaaagaaggggttgcggtactgctggacgttaatgatttgacaaaggataacattctgtcgtctgttcgtacagtagtgaacgataaatcttacagcgaacgcatgaaagctctgtcccagctgtttcgcgatcgtccaatgagtcccctggacacggctgtctattggacggaatatgtaatccgtcaccgcggagcacatcatctgaagactgctggcgcttttttgcactggtatcagtatttgttgctggatgtgattactttccttttggtaacattctgtgccttttgcttcattgtcaagtacatctgtaaggcgctgattcaccattattggtcgagttccaagagtgaaaaattaaagaaaaactaa

7. UGT708A6 ( ZmCGT ) from Zea mays (서열번호 43)

atggctgctaatgggggggatcatacctccgcgcgcccacatgtggtgttgcttccatccgctggcatgggacatcttgtccctttcgcccgcttagctgtggctttatctgagggacacggctgcaacgtaagtgtagctgcagttcaaccaacggtttcctctgcggagtcgcgtctgttagacgcacttttcgtcgccgccgccccagccgtccgccgtcttgatttccgcctggcccccttcgatgaatccgagttccccggtgcagacccttttttcttacgcttcgaggcgacacgtcgctcggcaccgcttctggggccgttattagatgcggcggaagcctccgcacttgtgactgatattgtccttgcttcggtagcgttgccagtggcgcgcgagcgtggagttccctgctatgtgctttttacgtcatcggccgcaatgctgtcgttgtgtgcgtattttccagcttatttagatgcacatgcagcggccggctcggtcggggtcggagtagggaacgtcgacattccaggggtatttcgcatccctaagtcgagcgtcccgcaagcacttcacgatccagatcatttatttacccagcagtttgtcgcaaatggccgttgtttagttgcctgcgacggcattcttgttaacaccttcgacgccttcgagcccgatgcagtaaccgcactgcgccaagggtcgatcacagtctctggcggttttccaccagttttcaccgtgggcccaatgcttcccgttcgcttccaggcagaggagacggctgactacatgcgttggttgtctgcacaaccaccccgcagtgtcgtctatgtctcgtttggaagtcgcaaggcgattcctcgcgaccagttacgtgaattggccgcagggttagaggctagtggcaagcgttttctgtgggtagtaaagtcgaccatcgtcgaccgcgatgataccgccgatctgggcggcttgttgggggacggctttcttgagcgcgtccaaggtcgtgcatttgtgactatgggatgggtggaacaggaagagattttgcaacatggctcggttggcttgtttatctcgcattgtgggtggaatagccttaccgaagccgccgcgttcggggtaccagttcttgcctggcctcgtttcggagatcagcgtgtgaacgccgccttagttgcgcgctctggattgggagcgtgggaagaagggtggacttgggatggtgaggagggacttactacacgcaaggaagtggcgaaaaagatcaagggcatgatggggtacgatgctgtagccgaaaaggcggccaaagttggtgacgcagctgcggcagcaattgcaaaatgtggcacgagttatcaatctttggaagagtttgtacaacgttgccgcgacgccgagcgtaagtaa

8. OsCGT from Oryza sativa (서열번호 44)

atgccttcctcaggagacgctgccggtcgtcgccctcacgtcgtgctgatcccttcagccggaatggggcacctggtcccgtttggtcgtctggctgtcgcactttcctctgggcacggatgtgatgtgtctttagtaacagttcttcctactgtgagtacagcggagtcaaagcatcttgatgcactttttgacgcattccccgcagttcgccgtcttgacttcgagttggcgccatttgacgcatcagagtttcccggtgctgaccctttcttccttcgttttgaggcgatgcgccgttcggctccattgcttggccctttgctgacgggcgcgggcgctagcgcactggcgacggacattgctttaacgtctgtcgtaattccagtagcaaaagagcaagggcttccgtgtcacattttattcactgcgtcggccgcaatgttatcattgtgtgcctacttcccaacttatttggatgccaacgctggcggagggggcggtgtgggcgacgtggatattcctggagtgtatcgcattccgaaggcatcaattccacaagccttacatgatcccaaccacttgtttactcgtcagtttgtggcgaatggtcgtagtcttacctcggcggccggtattctggtgaacactttcgatgcgttagagccggaggcagtagctgcattgcagcaaggaaaggtagcctccggctttccaccagtattcgcggtggggccgttgctgcctgcctctaaccaggccaaggatccgcaggcaaattacatggagtggctggacgcccagcccgcccgcagcgtagtttatgtaagtttcgggagtcgcaaggcgatttcacgtgaacaacttcgcgagctggctgctggcttagaggggagcggccaccgttttctgtgggtcgtgaaatccaccgtcgtggatcgtgacgacgcggccgagctgggagagctgttggacgagggttttttagagcgtgtcgagaagcgtggattggtgacaaaggcatgggtcgaccaggaggaggtactgaaacatgaaagcgtagccctgtttgtctcacattgcggctggaacagcgtgactgaggcggcggcgagcggtgtgcctgtcctggccttaccccgcttcggggaccaacgtgttaattcaggagtggtggcacgtgcaggattaggagtatgggcggatacttggtcgtgggagggcgaagcaggcgtgattggtgcggaggaaatctcagagaaggtcaaagcagctatggccgacgaagctttacgtatgaaagctgcatcccttgcagaggcagccgccaaggcagtggctggcggtgggagtagtcatcgctgtttagcggaatttgcccgtctgtgtcaaggtggaacttgccgtactaattaa

9. UGT708D1 ( GmCGT ) from Glycine max (서열번호 45)

atgagttctagtgaaggagtggtacatgtagcttttcttccaagtgcaggaatgggccacttgaaccctttccttcgcttggcggcgaccttcattcgttatggttgtaaagtaacgttaatcaccccgaagcctactgtatccctggcagaatcgaatttaatttcacgcttttgttccagctttccacatcaggttacgcaactggacctgaatttagtcagcgttgatccaacgaccgttgacacaatcgacccattcttcttacaatttgaaaccatccgccgtagtctgcatcttttacctcccattttaagtcttcttagcactcctttgtctgccttcatttatgacattactcttatcacgcctttgctttctgtaatcgagaagctgtcgtgccccagctacttgtattttacatcttcagcacgtatgttctctttcttcgcacgtgtctccgtgttgtccgcatctaatcccgggcagactccctcgtcatttatcggtgacgatggagttaagatccctgggttcacaagccccatcccacgcagcagtgttccgcctgcgattcttcaagcgtcctcaaatctttttcagcgcattatgttagaagacagcgcgaacgttaccaagcttaataatggggtcttcatcaatagctttgaagaactggagggcgaagctttagccgctttaaacggggggaaagttcttgaaggtctgccgcccgtgtacggggtgggcccccttatggcgtgtgaatatgagaaaggcgacgaggagggtcaaaagggctgcatgtcttcgatcgtgaagtggctggatgaacagtcgaagggaagcgtggtatacgtgtccttgggcaatcgtacggaaacgcgccgtgagcagattaaggatatggcccttggtttgatcgagtgtggctatggattcttgtgggtcgtcaaactgaagcgcgtcgataaagaagatgaggaaggcttagaagaggtgttaggtagcgagctgagttccaaggttaaggagaagggtgttgtagttaaggaatttgttgaccaagtcgaaattttgggccacccaagtgttgggggatttttgtcgcacgggggttggaacagcgtaactgaaactgtatggaagggagtgccttgtctgtcatggccacagcatagtgatcagaagatgtctgcggaggtaatccgtatgtccggaatgggtatctggcccgaggagtggggctgggggacgcaagatgttgtgaagggagacgaaatcgccaaacgcattaaggaaatgatgtcgaacgaatcgttgcgcgtaaaggcgggagaattgaaggaagcggcgttaaaggcggcaggggtaggggggagttgtgaagtgactattaaacgtcagatcgaagagtggaaacgcaatgcccaggctaattaa

10. GtUF6CGT1 ( GtCGT ) from Gentiana triflora (서열번호 46)

atggggagtttgactaacaacgataatcttcatatttttcttgtgtgcttcatcggccagggcgtggtcaatcccatgttacgtttggggaaggcgttcgcctccaaagggttacttgtcactttaagcgcaccggaaatcgttggaactgagatccgtaaggcgaataaccttaatgatgaccaaccaatcaaggtgggttccgggatgattcgtttcgaatttttcgacgatggatgggaatccgtaaacggtagcaaaccgtttgacgtatgggtctacatcaatcacttagaccagacaggccgtcaaaaacttccgattatgttaaagaaacatgaggagacagggactcctgtatcttgcttgatcctgaatcccttagtcccttgggtcgcggacgtagccgattcacttcagatcccctgcgctaccttgtgggtccaatcttgtgcaagtttttcagcatattaccactaccaccacgggttagtgcctttcccaaccgaatcagagcccgagatcgacgtacaacttcctgggatgccacttttgaaatatgatgaagtgcccgactacctgcatccgcgcacaccctaccccttttttggcacgaacattttaggtcaattcaagaatttatccaagaacttctgtatcctgatggataccttctacgagttggaacacgagatcatcgataatatgtgtaaattgtgtccgattaagccaattggcccgttgtttaagattccgaaagacccaagctccaacggaatcacgggtaatttcatgaaagtggatgactgcaaggagtggctggacagccgtccaacatcaactgtggtttacgttagtgtcgggtctgttgtatatttgaagcaggagcaggttacagaaatggcatacggcattttaaattcggaagtttcgtttttgtgggtgctgcgcccgccgagcaaacgcatcggtacggaaccgcatgtactgcccgaggagttctgggagaaggccggagatcgtggcaaggtggtgcaatggtcaccccaggagcaggtgcttgctcaccccgccactgtcggttttttaacacactgtggatggaatagcactcaagaggcgatttcgagcggagtgcccgtcatcactttcccacaatttggggaccaagtgaccaatgctaagttccttgtggaggaatttaaggtcggggtccgtttaggccgcggagagttagaaaatcgcatcatcacacgcgacgaagtagaacgcgctttacgcgagattacttcaggccccaaggctgaagaggtaaaagagaacgccttaaaatggaagaagaaggcagaagagacagtagctaaaggcggctactccgaacgtaatcttgtaggcttcattgaagaggtggctcgtaagactggtacaaagtaa

11. AvCGT from Aloe vera (서열번호 47)

atggaggaaatttccagtaaagtggagttcttatcccttaagcccagcatgtcaggaagtccccgttacagccccacatttcgtaaaatcggaagcggtcgcaattcccgccgcgactcccgtgctcatgcagggaatttcccctggattcgcaacaatcgtgtttttttttggctgcttttaatcaccatctgggcgtacatcggctttcacgtccaatctcaatgggcacatggcgaccataaagctgagttcgttggatacaagtcggaggtagggaagatgggtgaggacgtcaagtcggtaaatagtacgactacgttctccattgtacacaagggcaatttaactgttgaaggaaagaaagaccccgattccaattttggtatttcactgttgaaaaagggtaaacaggttctttcccgtttaaattcacgcaaaaagggccatcgttcgcgcaaggtgtcggaaaaactggaagaagaaacggacgacaatgggacgggagaaatggatgaggtccttatccagcgcaaaaacacatcttatggcttaattgtagggccttttgccaaactggaagagagtgtgcttgagtggagcccaggcaagcgccgtggtgtctgctatcgtaagggagaatttgcccgcgcggtgtcttctcagcgctttatgttgatcttccacgaattgtcaatgactggcgccccattgtccatgttggaattggccacggagatcctgtcttgcggtgggtctgtgagcgctattgtattatctaagaagggagggttaatgccggaactgaagaagcgtggtattaaggttttgcaagaccgtgacaaggtgagtttcaaggtcgccacgaaagtagacctgattattgcgggatctgctgtatgtagtagctggatcgagccatatctggagtatttccccgctgggtccggacatattgtctggtggatcatggaaaaccgtcgcgaatacttcgaccgtagcaagcatcttttaaaccgtgtgaaaattttggcatttcttagcgatagccagtcaaagcagtggctttcttggtgtgaggaagagaagattaaattcctgatccagccaatgttagtgccgttgtcagttaacgatgagctggccttcgttgccggtattccttgtagcttgaatactccagcattatcagtggagaaaatgatcgaaaagcgtgatttattacgtcacgcagtccgtaaggaaatggggttgggggacaatgacatgcttgtgatgagtttaagtagcatcaacccagccaagggtcagcgctttctgcttgaggcagccttactggtagctgaacacaatgtatcattgaaagatgctaacagttacagtcttatggaggaggagaagttatccgggaacgcacctcaaaatcaaaccatcatgatcggtcaactgaatcctggccacgtacttcagatcgccaatgacactaataagcccgtcaatgcgttacagaagattggcgccacacgtgtctcgtcgaagcgtcgcggcaagctgcatacgaatacagtcacgggcgtgcttcagaaaagccgcaaacttttgtccgaggcagcaggtatgaaggaggaaaccctgaaagtccttgtaggttccgtcggatcgaaatcgaataaggttctgtatgtaaaggcaatcatggaatacatcagccaacattctaatttgtctaaggtcgttctttggaccccagccaccacgtctatcgcagcactgtacgccgccgcggacgtgtacgtcattaacgctcagggacatggagagacattcggtcgcgtgacgatcgaggcgatggcctttggcctgccagtgctggggactgacgccggagggactaaagaaatcatcgaccaccgtgttacgggacttctgcatcctgtgggtcccgagggcactgtactgttagcgcaacacattcaatatcttttaaaaaatcccagcgtgcgcaagaaaatgggtatcaatggtcgccgcaaagtacaagataaatacttaaaacaccagacttacgagtcccttggcaaagtcatgttcaaatcgatgcgtccccgttaa

12. dnrF from Streptomyces peucetius ATCC 29050 (서열번호 48)

gtggccttgacgaagccggatgtcgatgtcctcgtggtgggcggcggtctcggggggctgtccaccgccctgttcctcgcccgccggggggcgcgggtcctgctggtggagcggcatgccagcacctcggtcctgcccaaggcggcaggccagaacccgcgcaccatggaactgttccgcttcggcggcgtggccgacgagatcctggccacggacgacatccgcggcgcccagggcgacttcaccatcaaggtcgtggagcgcgtgggcggtcgcgtcctgcacagcttcgcggagagcttcgaggaactggtcggtgcgacggaacagtgcacgcccatgccctgggcgctcgctccccaggaccgggtggagcccgtcctggtggcccacgccgccaagcacggcgcggagatccggttcgccaccgaactgacctccttccaggcgggcgacgacggtgtcacggcccgcctgcgcgacctgggcacgggagcggagagcaccgtgagcgcccgctacctggtcgccgccgacggaccccgcagcgcgatccgggagagcctgggcatcacccggcacggtcacggcaccctggcccacttcatgggcgtcatcttcgaggccgacctcaccgccgtcgtaccgcccgggtccaccggctggtactacctgcagcacccggacttcaccggcacgttcggccccaccgaccggcccaaccggcacaccttctacgtccgctacgaccccgaacgcggcgagaggccggaggactacacaccgcagcgctgcaccgagctgatccggctggctgtcgacgcgcccgggctcgtcccggacatcctcgacatccaggcctgggacatggcggcgtacatcgccgaccggtggcgcgaagggccggtgctgctggtcggcgatgccgccaaggtcaccccgcccaccgggggcatgggcggcaacaccgccatcggcgacgggttcgacgtggcctggaagctggccgccgtgctgcgcggcgaggcgggcgagcggctcctcgacagctacggggcggagcggtcgctcgtgtcccgcctcgtcgtcgacgagtcactcgccatctacgcccagcgcatggctccccacctgctcggcagcgttcccgaggaacgcggtacggcgcaggtcgtcctgggcttccgctaccgctccaccgccgtcgccgccgaggacgacgaccccgagccgaccgaggatccgcgacgcccgtccgggcgccccggcttccgcgcaccccacgtctggatcgaacaggacggcacacggcgttccaccgtcgagttgttcggcgactgctgggtgctcctggccgcaccggagggcggcgcctggggccaggcggccgcccgcgccgccgcggatctgggcgtccgcctcgacgtccatctcgtcggccgcgatgtcgccgccccctccggcgaactgacgcggacctacgggatcggccgggcgggggccagcttggtgcgcccggacggcgtggtcgcctggcgtacggcagtagcgccgggagcggaggcccaggaccagctgagcaccctgctcacccggctgctggcccgctga

13. antDEF from Photorhabdus luminescens (서열번호 49)

ATGATAATAAATAACAGAAATGAATCTCAACCACGTAGAGTTGTGGTGACAGGGCTAGGTGTTGTCGCACCGACAGGTGTTGGCGTTAATGAATTTTGGAACAATATTCATAACGGCAAATCGGGGGTAAGTGAATATGAGTGGGGAAGAAAAAAATTTGGTTTTAAAAGCGGAGCAATAGGAAAAGTTCACGGTAACGATAGCGATAGCAAAGAGTTTGTGCTGAAAAGTGAGCGTAAATATCTTGAGTTTGCGCTAGAAGCCTCTGAGATGGCAATGCAAGATGCAAATTTAAAACCTTCAGACATTGATGGCCGGCGTTTTGGCGTTGCGATAGCAACAGCGATTGCCGATGCTGCGGGAATGGAAGAGTGTTTGCTCAGGATCACCAAAGGGGGCAAAGAGAATATTCATCCTGATTTAATTAAATCAGAGGATTATGACAGCTTTGATTTCAGCTCTGCCGCCACCTCTGTTGCGAAAAAATATGGCGCATCGATGTCCGTCAGTAACATATCAACTGGGTGTGCGGCAGGACTTGATGCATTAGGCATTGCGATGGAGCATATCCGTTATGGCAGAGCGGATGTGATGCTGGCTGGCGCCAGTGAAGCGCCGCTTTGTCCACTTTCTATCGGCTCTTTTGAAGCTTTAGGGGCGCTATCATCAAGAGAATTGGAAAATCAGCAAGCAGCGACTTGTCCTTTTTCCCTTGAGCGGGATGGATTTGTGATTGCTGAAGGGTGTGGAATATTAATTTTAGAGTCTTATGAACATGCTAAGCAGCGTGGAGCACATATCTATGCTGAATTAGCAGGGTATGCGTCCGTGAATAACGCTTATCATATGACCGACTTGCCTGCGGATGGAATGGCAATGGCGCGGTGCATTGATATGGCGTTGAAGGATGCCCAGATATCGCCATCAGCGGTCAATTATATTAGTGCTCATGGCAGTTCTACGGCTCAAAATGATATTAACGAATCAAATGCGATTAAATTTGTTTTGGGAGAAAATGCATTTGATATTCCAATTAACTCATTAAAGTCAATGACAGGTCATGCTTTAGCTGCCGCTAATGCGATCGAGTCTGTAGCGTTATGTCTGGAAATAGAAAAGCAATATATTCATCCAACAATTAATTATCAAACGCCGGACCCTGATTGCGATTTAGATTATATTCCTAATCAAGGTTGCGCATATCCAATTAAGACCGCATTAAAATTATCGAGTGGTTTTTCTGGTATTCACAGTGTTATTGTTATGAGGGCAGTAGACA ATGCGTAA AAGAGTTGTTGTTACCGGCGTTGGCGCAGTACATCCTGATGGCAATGATGTCACCGCTATAAAAACAAAAGTGATTCAGAAATTATTGGGTCAGGAATCGATAAATAATACCAACAAAAGTTCTGTAATAAGGACATTGAATGATTTCGATGGGGCAAAATATATCAATAACCGCTTAAGACGTAAAATTGATGAATTTTCAGTTTATGGTATCGTCGCCGTTGAAATGGCATTAAAAGCGAGCAGATTGGATGTAGATAAGCTTGATCCTAATCGTGTTGGCATATATGTTGGAAACTGTTTTGGCGGATGGCAGCATATTGAGGATGAAGTTAAAGCGCTCCATGTTGAAGGCATATCGGGGATGGGACCTTATGTTGCTACGGCATGGTTCCCTGCTGCGCTTCAAGGGCAATTGTCACTGCTTTATGGTTTTAGTGCGCAATCTAAGACATTTTCCACCTCCGATGTAGCAGGGATGCAAGCAATAGGCTATGCGGCTGAAGCGATTTCTAATGGTGTTGCCGAAGTGATGTTATGTGGCGCGTCAGAACATCTTTCCAGCCCGTTAGTTAAAAGTTTACTGGAGAAAGAGTCAAGCCAGAAACACTCTGAGGTTTTTGGCGAAAGACAGCCAGGGGACTTTTCCGAAGGCGCTGCATTTCTAGTGCTGGAAGAGAGGCAACATGCTTTAGAACGCGGCGCTTCGATATTGTGTGAATTAACGGGTTTTGTTGATTATTTTTCACCGGATAAAAATACAAGAAATAACACCTTAGAATATACTGCTGAACTATTCAACCATAATGAGAATGCTGTATTTATTATGGATGGAATATATGATGATGAAAAAGAAATAACGAGTAAGGCTTTCTCCAATAAAGAGATAAAAACATCATTTATAAATCTGAGGCCTTACTTGAATAATCAATTTTCAGTCAGCGGCGTAATTGATTCAGTCCTGGCATCATCATTTTTATCAGAAAATAACGGGGATGGAGAACAACAATCTAATAAAATAAATGAACTTTCAAATACTAACCAAATAATAATTCAGCGCTTTAGTAACCAGGGTCATGTATGTGCGTTGAGTTTTTCAGCAATTTAAtctctaaaatatttaattacgcgaggaaaaatatATGAATAATAACCCAGAAGTAAAAATAAAAACGATTTTGTCTCTTTTTCTTAACGTTAATATTGATGATTTCAATATGGATGCAAACCTTGCTGATGCCTATGATATGGATTCTACGGAATTGGCTGACTTGGCAAAAGAGATTACGAAAGAGTTCGGTATTTCCGTGACGAAAAGTCAGTTCAGTCATTGGGAAACAGGAAGAGCCGTTCTTGATTTCGTCTCATCAAGTTTAAACGATAAAAATTAA

밑줄친 부분은 antD 와 antE 의 reading frame이 오버랩되는 부분을 나타내며 (즉, 시작 코돈과 종결 코돈 부위가 겹침), 끝 부분 bold체 소문자는 antE 와 antF 사이 서열

14. antB from Photorhabdus luminescens (서열번호 50)

ATGGACGATATTTCTTTATCATCTGATTTTTTTGATCTTTGGATTATCAAAATCGACGATATTGATTTAGCTTCTATTGAACAGTTAATTCACTGTTCTGATATAGTTCGCCATAACCAAATTTGTTTAGCGGATAGAAGAAAGAGATTTATATTTAGACGGGCTGCATTACGTTATGTTTTGAGTCAATATTTATCTGATTATGAAATCATAACGAATGATAACGGAAAACCTTATATATCCACGGAGCAAGACTTCAAATATTATTTTTCACTGAGTGCTTCAGGAAACTATTGTGCCATTGGTTTTAGCTCAAGGGAAATAGGTGTTGATATTGAAGTCACTCCTTCTAAGGTAAAATTTTCAGAAATTATTGAACGTTTTATTAAGGATAAAGATTTGGAATATATGAAAGGTATAATGTTAAAACAACTATCAGGAGTTAGTCTCGGATTTAATAACTATTATCATTTAATGTCATTATATTATTGGGTTAGACTTGAAGCATATATTAAATTATTTGCTTCGACTTTACATGAGAAATTATTGGTTAATAACTCTGATTCTGTTAAAGATATGAAAGAATTGGAGGCAAGCACATTATTGATTCATAGTCAGCAATTTGTTTGTGCCTTATCTCAAAAGAAAGTCATTTCTACACCAAATATCAAGGAAATAAATTATTCCGAAATTATAAGGAACAAAGATGAGTAA

15. antG from Photorhabdus luminescens (서열번호 51)

ATGAAACTAATCTCTATGTTGTTACATTCAGAGCATGATAACTTACATCATGATTGTATTGTCACTAAGGATTATCATTATACAAGAAAAGAGGTGATATCTTCTGTTTCCCATTTAATTGATGATTTATTGAGTCGAGGAGTGCAAAAAGGTAATAAAGTCATTGTTATATTTGAACATGATGAATTAGGTGTTTTCTTTTTGGCTGCCGCCAGTGCTATGGGGTTGCATTTATTAATGCCCTATAATTTATCATCAGCGACAATCGATGAATGGATTAATTTTACCAATGAAGTGCAATACGATTTTGTTGTTTATCTCAAAAAAGATAAACATTTTGTTGGAAAATTAAAAGAAAACAACATTAATGTTATTGATATTTCAGATCATAAGATCAGAGTTAGTGATGATATTGCGGAAATCCCAATGATAACTTATTCTCCGCAACCTATTGCTAACTTTATTGTCCTGTTCACCAGTGGGAGTACAGGCAAACCAAAAGCCATTAGTATTTCAGAATCGTTAGTATGTCGTCGAATTTATTCGGTGACCGAGAAATTAAAATTTACGCAAGATGCCAAAATATTCATGTCAGGTTTGTTGAATAATACAACTGGAGTGATTTTTTCTTTCGGCTCATTATTGCATCAATCAACACTTTTTATACCCGAAGATAGAAATGTAGAGAGATGGCCTGATTATCTTTCTCGCAATAAAATCACTCATATTATGTTACGCCCAGAATCAATGAAATTATTCGTTAAATCGACAGCAGAACTTAATATTGATCTCTCTTGTTTACGGGTGGTTGCTTATGGCGCTGCGGCGATGCCTCCTAGCGTACTTGAGAAAGGGCGACAATTAATTGGCTGTGAATGGGTGCAGGGATATGGGTTAAGTGAAACTTATGGTCCTTTCTGTTGGGTGGATGAGCAAGATCATCGTGATAAAAGATATCTCAATTCAATTTATTGTGTTGGTAAGATTGATAATACATTGGAAGTGGCAGTTAAACCTATTATAGGTTCATCGGATAATATCGGAGAAATTATACTAAGGGGTAAAAGTATTATGGAAGGATATTATGATGTCCTTTCTGGAGAAATAACGCCTCCTGATGAATGGTTTGCCACTGGTGATCTTGGTTATATAGATGAAGAGGGTTATTTAGTTTTGAAAGGACGTAAGCAAAATACGTTTATGAGTGCTAACGGACACAGAATTTATCCTGAAGAAATTGAATCTATTTTATCCCGAATACCCAATGTGAATGTCGCTACGGTTGTTGGTTTTTCTTTCCATGAAAATGGTGTTGCTATTGATCAGCCGGTTGCTTGCATGAGTGGAGAGATATCTAAGAAGTCATTACCTGAAATTGAAGATATTATTTCATCATTTTTAATGAGTAAACTCAGTCGAGAAAAATGGCCGGATTGGTTCTATGTTACTGATGAATGCTTTCCGAAAAGCCATAATGATAAGATATTGAAATCAGAGTTAATTAAATCAATCGATCCTAAGAAATTATTTACATTGAGGAATCAATAA

16. ScoMCAT from Streptomyces coelicolor (서열번호 52)

Atgctcgtactcgtcgctcccggccagggcgcccagacgcccggcttcctgactgactggctcgccctccccggtgccgctgaccgcgtcgccgcgtggtcggacgccatcggactcgatctcgcccacttcggcaccaaggccgacgcggacgagatccgagacacgtccgtggcccagccgctgctggtcgccgccggaatcctgtccgccgcggcactcggtacgcagacatctgtcgctgacgcgacgggccccgggttcacccccggcgcggtcgccggacacagcgtcggcgagatcaccgccgccgtcttcgcgggcgtcctcgacgacaccgccgcgctgtccctcgtacgccgtcgcggcctggccatggccgaggccgcggcggtcaccgagaccggcatgtcggcgctgctcgggggcgaccccgaggtgagcgtcgcgcacctggagcggctcggcctgaccccggcgaacgtgaacggcgccggtcagatcgtggcggcgggcaccatggagcagctggccgcgctgaacgaggacaagcccgagggtgtgcgcaaggtcgtcccgctgaaggtggccggcgcgttccacacccgccacatggcccccgccgtggacaagctcgccgaggccgccaaggcgctgacgccggccgacccgaaggtgacgtacgtctccaacaaggacgggcgggccgtcgcctccggcaccgaggtgctggaccggctggtcggccaggtcgccaacccggtgcgctgggacctgtgcatggagacgttcaaggagctgggcgtcaccgcgatcatcgaggtgtgtccgggcggcacgctgaccgggctggccaagcgggcgctgcccggagtgaagacgctggccctgaagacccccgacgacctcgacgcggcccgtgagctcgtcgccgagcacacccaggcctaa

17. actVA-orf5 from Streptomyces coelicolor (서열번호 53)

Atgagcgaggacacgatgacccaggagcggccgtccctgacggcacacgcccgccggatcgccgaactcgccgggaagcgggcggccgacgccgaacagcagcgccggctgagccccgacgtcgtcgacgcggtccttcgagccggtttcgccgcccacttcgtaccggtggcgcacggcggccgggccgcgacgttcggggagctggtggagcccgtcgcggtgctcggcgaggcctgtgcctcgaccgcctggtacgcctcgctcacggcgagcctcggccggatggccgcctacctgccggacgagggccaggccgagctgtggtccgacggccccgacgccctgatcgtcggtgccctgatgccgctgggccgggccgagaagaccccgggcggctggcacgtgtcgggcacctggccgttcgtcagcgtcgtggatcactccgactgggcgctgatctgcgccaaggtcggcgaggagccgtggttcttcgcggtgccgcgacaggagtacgggatcgtcgacagctggtacccgatgggtatgcgcggaacgggcagcaacacgctcgtcctcgacggggtgttcgtgccggatgcgcgggcctgcacccgtgcggccatcgcggcaggtctcggtccggatgccgaggcgatctgtcacaccgtgcccatgagggcggtcaacgggctggccttcgcactgccgatgctcggcgcggcccgcggggccgcggccgtgtggacctcgtggaccgccggaagactggccgggccgaccgggcagaacgccgtctcgtcccaggaccgcgtggtgtacgagcacacgctggcccgggccacgggtgagatcgacgcggcccagctgctgttggagcgggtcgcggcggtcgccgacgccggctcggcgaccggcgtactggtcggccgcggggcgcgggactgcgccctggcggcggagctgctgaccgccgcgaccgaccggctgttcgcctcggcgggcacccgggcacaggcccaggacagcccgatgcagcgcctgtggcgcgatgtgcacgcggcgggcagccatatcgggctgcagttcgggcccggggcggcgctgtacgccggagagctgttgaggaggagcaacgatggctga

18. actVB from Streptomyces coelicolor (서열번호 54)

Atggcagccgaccagggaatgctccgggacgccatggcccgggtgccggccggggtggcgctcgtcaccgcccatgaccgcgggggagtcccgcacggtttcaccgccagttcgttcgtgtccgtctcgatggagccgccactggcactggtctgcctggctcgtacggccaactccttcccggtgttcgacagttgcggcgagttcgcggtgagcgtgctgcgcgaggaccacacggacctggccatgcgcttcgcgcgcaagtccgcggacaagttcgcgggcggggagttcgtccgtaccgcgcggggagcgaccgtgctcgacggagcggtcgcggtcgtcgagtgcacggtccacgagcgctacccggcgggcgaccacatcatcctgctcggcgaggtccagtccgtgcacgtcgaggagaagggcgtaccggcggtctacgtggaccgccggttcgccgccctgtgctcggcggcgggtgcctgcccgtccgccaccgggcggggcgtgcccgcgcatgccggctaa

19. pobA from Pseudomonas fluorescens (서열번호 55)

ATGAAAACGCTAAAAACCCAAGTCGCCATTATTGGCGCCGGTCCCTCCGGATTGCTGCTCGGCCAGTTACTGCACAACGCGGGTATCCAGACCCTGATTCTAGAGCGCCAGAGCGCCGACTACGTGCAAGGCCGCATCCGTGCCGGGGTGCTGGAGCAAGGCATGGTCGACCTGCTGCGCGAAGCGGGCGTCAGCCGACGCATGGACGCCGAGGGCCTTGTGCATGACGGTTTCGAATTGGCACTCAATGGCGAACTCACCCACATCGACCTCAAGGCGCTCACCGGCGGCCAGTCGGTGATGATCTACGGCCAGACCGAAGTCACCCGTGACTTGATGGCCGCCCGCGAAGCGGCGGGTGGCATCACTCTATACGAAACGCAGAACGTGCAGCCTCATGGTCACAAAACTGATCGACCCTGGCTGACCTTCGAGCACCAGGGTGAAGCTTTTCGCCTGGAGTGCGACTACATCGCGGGCTGTGATGGTTTTCACGGTGTGGCGCGGCAGTCGATTCCGGCGCAGTCGTTGAAGGTCTTCGAGCGCGTCTATCCCTTCGGTTGGCTGGGCGTCCTCGCCGACACACCGCCGGTGCATGACGAACTGGTGTACGCCAAACATGCGCGTGGCTTTGCCCTGTGCAGCATGCGCTCGCCGACCCGCAGCCGCTATTACCTGCAAGTGCCGGTTGAAGAAGCGCTGGATGAATGGTCGGATCAGCGCTTCTGGGATGAGCTGAAAACCCGTTTGCCCAGTGCACTGGCGGCCCAACTGGTCACCGGGCCATCCATCGAGAAGAGCATCGCGCCGCTGCGCAGCTTTGTGGTCGAGCCGATGCAATACGGGCGCCTGTTCCTGCTGGGGGACGCCGCGCATATCGTGCCGCCCACCGGGGCCAAGGGCTTGAACCTGGCGGCCAGCGACGTGAGTACGCTGTTTCGGATCTTGCTCAAGGTCTATCGCGAGGGGCGGGTGGACCTGCTGGAACAGTACTCAGCGATCTGCTTGCGCCGCGTATGGAAAGCCGAACGGTTTTCCTGGTGGATGACTTCGATGTTGCACCAGTTTCCGGAGGCCGACGGGTTCAGCCAGCGCATTGCCGAGAGCGAGCTTGCGTATTTCATCAGCTCCGAGGCGGGCCGCAAAACCATCGCAGAAAATTACGTCGGGCTTCCTTACGAAGCTATCGAATAA

20. dnrF ^P217K from Streptomyces peucetius (최종 dnrF 돌연변이) (서열번호 56)

gtggccttgacgaagccggatgtcgatgtcctcgtggtgggcggcggtctcggggggctgtccaccgccctgttcctcgcccgccggggggcgcgggtcctgctggtggagcggcatgccagcacctcggtcctgcccaaggcggcaggccagaacccgcgcaccatggaactgttccgcttcggcggcgtggccgacgagatcctggccacggacgacatccgcggcgcccagggcgacttcaccatcaaggtcgtggagcgcgtgggcggtcgcgtcctgcacagcttcgcggagagcttcgaggaactggtcggtgcgacggaacagtgcacgcccatgccctgggcgctcgctccccaggaccgggtggagcccgtcctggtggcccacgccgccaagcacggcgcggagatccggttcgccaccgaactgacctccttccaggcgggcgacgacggtgtcacggcccgcctgcgcgacctgggcacgggagcggagagcaccgtgagcgcccgctacctggtcgccgccgacggaccccgcagcgcgatccgggagagcctgggcatcacccggcacggtcacggcaccctggcccacttcatgggcgtcatcttcgaggccgacctcaccgccgtcgtaccgAAGgggtccaccggctggtactacctgcagcacccggacttcaccggcacgttcggccccaccgaccggcccaaccggcacaccttctacgtccgctacgaccccgaacgcggcgagaggccggaggactacacaccgcagcgctgcaccgagctgatccggctggctgtcgacgcgcccgggctcgtcccggacatcctcgacatccaggcctgggacatggcggcgtacatcgccgaccggtggcgcgaagggccggtgctgctggtcggcgatgccgccaaggtcaccccgcccaccgggggcatgggcggcaacaccgccatcggcgacgggttcgacgtggcctggaagctggccgccgtgctgcgcggcgaggcgggcgagcggctcctcgacagctacggggcggagcggtcgctcgtgtcccgcctcgtcgtcgacgagtcactcgccatctacgcccagcgcatggctccccacctgctcggcagcgttcccgaggaacgcggtacggcgcaggtcgtcctgggcttccgctaccgctccaccgccgtcgccgccgaggacgacgaccccgagccgaccgaggatccgcgacgcccgtccgggcgccccggcttccgcgcaccccacgtctggatcgaacaggacggcacacggcgttccaccgtcgagttgttcggcgactgctgggtgctcctggccgcaccggagggcggcgcctggggccaggcggccgcccgcgccgccgcggatctgggcgtccgcctcgacgtccatctcgtcggccgcgatgtcgccgccccctccggcgaactgacgcggacctacgggatcggccgggcgggggccagcttggtgcgcccggacggcgtggtcgcctggcgtacggcagtagcgccgggagcggaggcccaggaccagctgagcaccctgctcacccggctgctggcccgctga

21. GtCGT ^V93Q/Y193F from Gentiana triflora (최종 GtCGT 돌연변이) (서열번호 57)

a tggggagtttgactaacaacgataatcttcatatttttcttgtgtgcttcatcggccagggcgtggtcaatcccatgttacgtttggggaaggcgttcgcctccaaagggttacttgtcactttaagcgcaccggaaatcgttggaactgagatccgtaaggcgaataaccttaatgatgaccaaccaatcaaggtgggttccgggatgattcgtttcgaatttttcgacgatggatgggaatccgtaaacggtagcaaaccgtttgacgtatggCAAtacatcaatcacttagaccagacaggccgtcaaaaacttccgattatgttaaagaaacatgaggagacagggactcctgtatcttgcttgatcctgaatcccttagtcccttgggtcgcggacgtagccgattcacttcagatcccctgcgctaccttgtgggtccaatcttgtgcaagtttttcagcatattaccactaccaccacgggttagtgcctttcccaaccgaatcagagcccgagatcgacgtacaacttcctgggatgccacttttgaaatatgatgaagtgcccgactTcctgcatccgcgcacaccctaccccttttttggcacgaacattttaggtcaattcaagaatttatccaagaacttctgtatcctgatggataccttctacgagttggaacacgagatcatcgataatatgtgtaaattgtgtccgattaagccaattggcccgttgtttaagattccgaaagacccaagctccaacggaatcacgggtaatttcatgaaagtggatgactgcaaggagtggctggacagccgtccaacatcaactgtggtttacgttagtgtcgggtctgttgtatatttgaagcaggagcaggttacagaaatggcatacggcattttaaattcggaagtttcgtttttgtgggtgctgcgcccgccgagcaaacgcatcggtacggaaccgcatgtactgcccgaggagttctgggagaaggccggagatcgtggcaaggtggtgcaatggtcaccccaggagcaggtgcttgctcaccccgccactgtcggttttttaacacactgtggatggaatagcactcaagaggcgatttcgagcggagtgcccgtcatcactttcccacaatttggggaccaagtgaccaatgctaagttccttgtggaggaatttaaggtcggggtccgtttaggccgcggagagttagaaaatcgcatcatcacacgcgacgaagtagaacgcgctttacgcgagattacttcaggccccaaggctgaagaggtaaaagagaacgccttaaaatggaagaagaaggcagaagagacagtagctaaaggcggctactccgaacgtaatcttgtaggcttcattgaagaggtggctcgtaagactggtacaaagtaa

22. ALS from Rheum palmatum (서열번호 58)

atggcagatgtcctgcaggagatccgcaactcgcagaaggcgagcgggcccgccacggtgctcgccatcggcactgcccatccaccgacgtgctaccctcaggccgactaccccgacttctacttccgagtttgcaagagcgagcacatgaccaaactcaagaagaaaatgcaattcatttgtgacagatcggggataaggcagcggtttatgttccacacggaagagaacctggggaagaacccggggatgtgcacattcgacgggccatcgctgaacgcgcggcaggacatgctgatcatggaagtgccgaagctgggggcggaggcggcggagaaggcgatcaaggagtgggggcaggacaagtcccggatcacccacctcatcttctgcaccaccacgagcaacgacatgcccggggcggactaccagttcgccaccctgttcgggctgaaccccggcgtgagccgcaccatggtctaccagcagggctgcttcgccgggggcaccgtgctgcgcctggtcaaggacatcgcggagaacaacaagggggcgcgcgtgctggtggtgtgctcggagatcgtggccttcgccttccgcgggccccacgaggaccacatcgactccctcatcgggcagctcctgttcggggacggggccgccgccctcgtggtcgggacagacatcgacgagagcgtcgagaggcccatcttccagatcatgtcggcgacccaggcgaccatccccaactcgctgcacaccatggctctccatctgacggaggcggggctgaccttccatctcagcaaggaggtgcccaaggtggtgagcgacaacatggaggagctcatgctcgaggccttcaagccgctcgggataaccgattggaactccatattctggcaagtgcatcccgggggtagagccatccttgacaagatcgaggagaagctggagctcaccaaggataagatgcgggattcccgctacatcttgagcgagtacgggaatctcaccagcgcctgtgtgctctttgtcatggacgagatgaggaagaggtccttccgggaagggaagcagaccaccggagacggctacgagtggggtgtcgccatcggattggggcccggtcttaccgtcgagaccgttgtcttgcgtagcgtccccattccctaa

23. accBC from Corynebacterium glutamicum (서열번호 59)

gtgtcagtcgagactaggaagatcaccaaggttcttgtcgctaaccgtggtgagattgcaatccgcgtgttccgtgcagctcgagatgaaggcatcggatctgtcgccgtctacgcagagccagatgcagatgcaccattcgtgtcatatgcagacgaggcttttgccctcggtggccaaacatccgctgagtcctaccttgtcattgacaagatcatcgatgcggcccgcaagtccggcgccgacgccatccaccccggctacggcttcctcgcagaaaacgctgacttcgcagaagcagtcatcaacgaaggcctgatctggattggaccttcacctgagtccatccgctccctcggcgacaaggtcaccgctcgccacatcgcagataccgccaaggctccaatggctcctggcaccaaggaaccagtaaaagacgcagcagaagttgtggctttcgctgaagaattcggtctcccaatcgccatcaaggcagctttcggtggcggcggacgtggcatgaaggttgcctacaagatggaagaagtcgctgacctcttcgagtccgcaacccgtgaagcaaccgcagcgttcggccgcggcgagtgcttcgtggagcgctacctggacaaggcacgccacgttgaggctcaggtcatcgccgataagcacggcaacgttgttgtcgccggaacccgtgactgctccctgcagcgccgtttccagaagctcgtcgaagaagcaccagcaccattcctcaccgatgaccagcgcgagcgtctccactcctccgcgaaggctatctgtaaggaagctggctactacggtgcaggcaccgttgagtacctcgttggctccgacggcctgatctccttcctcgaggtcaacacccgcctccaggtggaacacccagtcaccgaagagaccaccggcatcgacctggtccgcgaaatgttccgcatcgcagaaggccacgagctctccatcaaggaagatccagctccacgcggccacgcattcgagttccgcatcaacggcgaagacgctggctccaacttcatgcctgcaccaggcaagatcaccagctaccgcgagccacagggcccaggcgtccgcatggactccggtgtcgttgaaggttccgaaatctccggacagttcgactccatgctggcaaagctgatcgtttggggcgacacccgcgagcaggctctccagcgctcccgccgtgcacttgcagagtacgttgtcgagggcatgccaaccgttatcccattccaccagcacatcgtggaaaacccagcattcgtgggcaacgacgaaggcttcgagatctacaccaagtggatcgaagaggtttgggataacccaatcgcaccttacgttgacgcttccgagctcgacgaagatgaggacaagaccccagcacagaaggttgttgtggagatcaacggccgtcgcgttgaggttgcactcccaggcgatctggcactcggtggcaccgctggtcctaagaagaaggccaagaagcgtcgcgcaggtggtgcaaaggctggcgtatccggcgatgcagtggcagctccaatgcagggcactgtcatcaaggtcaacgtcgaagaaggcgctgaagtcaacgaaggcgacaccgttgttgtcctcgaggctatgaagatggaaaaccctgtgaaggctcataagtccggaaccgtaaccggccttactgtcgctgcaggcgagggtgtcaacaagggcgttgttctcctcgagatcaagtaa

24. accD1 from Corynebacterium glutamicum (서열번호 60)

atgaccatttcctcacctttgattgacgtcgccaaccttccagacatcaacaccactgccggcaagatcgccgaccttaaggctcgccgcgcggaagcccatttccccatgggtgaaaaggcagtagagaaggtccacgctgctggacgcctcactgcccgtgagcgcttggattacttactcgatgagggctccttcatcgagaccgatcagctggctcgccaccgcaccaccgctttcggcctgggcgctaagcgtcctgcaaccgacggcatcgtgaccggctggggcaccattgatggacgcgaagtctgcatcttctcgcaggacggcaccgtattcggtggcgcgcttggtgaggtgtacggcgaaaagatgatcaagatcatggagctggcaatcgacaccggccgcccattgatcggtctttacgaaggcgctggcgctcgcattcaggacggcgctgtctccctggacttcatttcccagaccttctaccaaaacattcaggcttctggcgttatcccacagatctccgtcatcatgggcgcatgtgcaggtggcaacgcttacggcccagccctgaccgacttcgtggtcatggtggacaagacctccaagatgttcgttaccggcccagacgtgatcaagaccgtcaccggcgaggaaatcacccaggaagagcttggcggagcaaccacccacatggtgaccgctggcaactcccactacaccgctgcgaccgatgaggaagcactggattgggtacaggacctggtgtccttcctcccatccaacaatcgctcttacacaccactggaagacttcgacgaggaagaaggcggcgttgaagaaaacatcaccgctgacgatctgaagctcgacgagatcatcccagattccgcgaccgttccttacgacgtccgcgatgtcatcgaatgcctcaccgacgatggcgaatacctggaaatccaggcagaccgcgcagaaaacgttgttattgcattcggccgcatcgaaggccagtccgttggatttgttgccaaccagccaacccagttcgctggctgcctggacatcgactcctctgagaaggcagctcgcttcgtccgcacctgcgacgcgtttaacatcccaatcgtcatgcttgtcgacgtccccggcttccttccaggcgcaggccaggagtatggtggcatcctgcgtcgtggcgcaaagctgctctacgcatacggcgaagcaaccgttccaaagattaccgtcaccatgcgtaaggcttacggcggagcgtactgcgtgatgggttccaagggcttgggctctgacatcaaccttgcatggccaaccgcacagatcgccgtcatgggcgctgctggcgcagtcggattcatctaccgcaaggagctcatggcagctgatgccaagggcctcgataccgtagctctggctaagtccttcgagcgcgagtacgaagaccacatgctcaacccgtaccacgctgcagaacgtggcctgatcgacgccgtgatcctgccaagcgaaacccgcggacagatttcccgcaaccttcgcctgctcaagcacaagaacgtcactcgccctgctcgcaagcacggcaacatgccactgtaa

25. GtCGT ^V93Q/Y193F (GtUF6CGT1 ^V93Q/Y193F ) variant (서열번호 61)

26. zhuIJ - Codon optimization for E. coli (서열번호 62)

FK: flavokermesic acid
KA: kermesic acid
CA: carminic acid

<110> Korea Advanced Institute of Science and Technology <120> C-glycosyltransferase variants and Use thereof <130> P21-B265 <150> KR 2021-0011326 <151> 2021-01-27 <160> 122 <170> KoPatentIn 3.0 <210> 1 <211> 477 <212> PRT <213> Gentiana triflora <400> 1 Met Gly Ser Leu Thr Asn Asn Asp Asn Leu His Ile Phe Leu Val Cys 1 5 10 15 Phe Ile Gly Gln Gly Val Val Asn Pro Met Leu Arg Leu Gly Lys Ala 20 25 30 Phe Ala Ser Lys Gly Leu Leu Val Thr Leu Ser Ala Pro Glu Ile Val 35 40 45 Gly Thr Glu Ile Arg Lys Ala Asn Asn Leu Asn Asp Asp Gln Pro Ile 50 55 60 Lys Val Gly Ser Gly Met Ile Arg Phe Glu Phe Phe Asp Asp Gly Trp 65 70 75 80 Glu Ser Val Asn Gly Ser Lys Pro Phe Asp Val Trp Val Tyr Ile Asn 85 90 95 His Leu Asp Gln Thr Gly Arg Gln Lys Leu Pro Ile Met Leu Lys Lys 100 105 110 His Glu Glu Thr Gly Thr Pro Val Ser Cys Leu Ile Leu Asn Pro Leu 115 120 125 Val Pro Trp Val Ala Asp Val Ala Asp Ser Leu Gln Ile Pro Cys Ala 130 135 140 Thr Leu Trp Val Gln Ser Cys Ala Ser Phe Ser Ala Tyr Tyr His Tyr 145 150 155 160 His His Gly Leu Val Pro Phe Pro Thr Glu Ser Glu Pro Glu Ile Asp 165 170 175 Val Gln Leu Pro Gly Met Pro Leu Leu Lys Tyr Asp Glu Val Pro Asp 180 185 190 Tyr Leu His Pro Arg Thr Pro Tyr Pro Phe Phe Gly Thr Asn Ile Leu 195 200 205 Gly Gln Phe Lys Asn Leu Ser Lys Asn Phe Cys Ile Leu Met Asp Thr 210 215 220 Phe Tyr Glu Leu Glu His Glu Ile Ile Asp Asn Met Cys Lys Leu Cys 225 230 235 240 Pro Ile Lys Pro Ile Gly Pro Leu Phe Lys Ile Pro Lys Asp Pro Ser 245 250 255 Ser Asn Gly Ile Thr Gly Asn Phe Met Lys Val Asp Asp Cys Lys Glu 260 265 270 Trp Leu Asp Ser Arg Pro Thr Ser Thr Val Val Tyr Val Ser Val Gly 275 280 285 Ser Val Val Tyr Leu Lys Gln Glu Gln Val Thr Glu Met Ala Tyr Gly 290 295 300 Ile Leu Asn Ser Glu Val Ser Phe Leu Trp Val Leu Arg Pro Pro Ser 305 310 315 320 Lys Arg Ile Gly Thr Glu Pro His Val Leu Pro Glu Glu Phe Trp Glu 325 330 335 Lys Ala Gly Asp Arg Gly Lys Val Val Gln Trp Ser Pro Gln Glu Gln 340 345 350 Val Leu Ala His Pro Ala Thr Val Gly Phe Leu Thr His Cys Gly Trp 355 360 365 Asn Ser Thr Gln Glu Ala Ile Ser Ser Gly Val Pro Val Ile Thr Phe 370 375 380 Pro Gln Phe Gly Asp Gln Val Thr Asn Ala Lys Phe Leu Val Glu Glu 385 390 395 400 Phe Lys Val Gly Val Arg Leu Gly Arg Gly Glu Leu Glu Asn Arg Ile 405 410 415 Ile Thr Arg Asp Glu Val Glu Arg Ala Leu Arg Glu Ile Thr Ser Gly 420 425 430 Pro Lys Ala Glu Glu Val Lys Glu Asn Ala Leu Lys Trp Lys Lys Lys 435 440 445 Ala Glu Glu Thr Val Ala Lys Gly Gly Tyr Ser Glu Arg Asn Leu Val 450 455 460 Gly Phe Ile Glu Glu Val Ala Arg Lys Thr Gly Thr Lys 465 470 475 <210> 2 <211> 536 <212> PRT <213> Streptomyces peucetius <400> 2 Met Ala Leu Thr Lys Pro Asp Val Asp Val Leu Val Val Gly Gly Gly 1 5 10 15 Leu Gly Gly Leu Ser Thr Ala Leu Phe Leu Ala Arg Arg Gly Ala Arg 20 25 30 Val Leu Leu Val Glu Arg His Ala Ser Thr Ser Val Leu Pro Lys Ala 35 40 45 Ala Gly Gln Asn Pro Arg Thr Met Glu Leu Phe Arg Phe Gly Gly Val 50 55 60 Ala Asp Glu Ile Leu Ala Thr Asp Asp Ile Arg Gly Ala Gln Gly Asp 65 70 75 80 Phe Thr Ile Lys Val Val Glu Arg Val Gly Gly Arg Val Leu His Ser 85 90 95 Phe Ala Glu Ser Phe Glu Glu Leu Val Gly Ala Thr Glu Gln Cys Thr 100 105 110 Pro Met Pro Trp Ala Leu Ala Pro Gln Asp Arg Val Glu Pro Val Leu 115 120 125 Val Ala His Ala Ala Lys His Gly Ala Glu Ile Arg Phe Ala Thr Glu 130 135 140 Leu Thr Ser Phe Gln Ala Gly Asp Asp Gly Val Thr Ala Arg Leu Arg 145 150 155 160 Asp Leu Gly Thr Gly Ala Glu Ser Thr Val Ser Ala Arg Tyr Leu Val 165 170 175 Ala Ala Asp Gly Pro Arg Ser Ala Ile Arg Glu Ser Leu Gly Ile Thr 180 185 190 Arg His Gly His Gly Thr Leu Ala His Phe Met Gly Val Ile Phe Glu 195 200 205 Ala Asp Leu Thr Ala Val Val Pro Pro Gly Ser Thr Gly Trp Tyr Tyr 210 215 220 Leu Gln His Pro Asp Phe Thr Gly Thr Phe Gly Pro Thr Asp Arg Pro 225 230 235 240 Asn Arg His Thr Phe Tyr Val Arg Tyr Asp Pro Glu Arg Gly Glu Arg 245 250 255 Pro Glu Asp Tyr Thr Pro Gln Arg Cys Thr Glu Leu Ile Arg Leu Ala 260 265 270 Val Asp Ala Pro Gly Leu Val Pro Asp Ile Leu Asp Ile Gln Ala Trp 275 280 285 Asp Met Ala Ala Tyr Ile Ala Asp Arg Trp Arg Glu Gly Pro Val Leu 290 295 300 Leu Val Gly Asp Ala Ala Lys Val Thr Pro Pro Thr Gly Gly Met Gly 305 310 315 320 Gly Asn Thr Ala Ile Gly Asp Gly Phe Asp Val Ala Trp Lys Leu Ala 325 330 335 Ala Val Leu Arg Gly Glu Ala Gly Glu Arg Leu Leu Asp Ser Tyr Gly 340 345 350 Ala Glu Arg Ser Leu Val Ser Arg Leu Val Val Asp Glu Ser Leu Ala 355 360 365 Ile Tyr Ala Gln Arg Met Ala Pro His Leu Leu Gly Ser Val Pro Glu 370 375 380 Glu Arg Gly Thr Ala Gln Val Val Leu Gly Phe Arg Tyr Arg Ser Thr 385 390 395 400 Ala Val Ala Ala Glu Asp Asp Asp Pro Glu Pro Thr Glu Asp Pro Arg 405 410 415 Arg Pro Ser Gly Arg Pro Gly Phe Arg Ala Pro His Val Trp Ile Glu 420 425 430 Gln Asp Gly Thr Arg Arg Ser Thr Val Glu Leu Phe Gly Asp Cys Trp 435 440 445 Val Leu Leu Ala Ala Pro Glu Gly Gly Ala Trp Gly Gln Ala Ala Ala 450 455 460 Arg Ala Ala Ala Asp Leu Gly Val Arg Leu Asp Val His Leu Val Gly 465 470 475 480 Arg Asp Val Ala Ala Pro Ser Gly Glu Leu Thr Arg Thr Tyr Gly Ile 485 490 495 Gly Arg Ala Gly Ala Ser Leu Val Arg Pro Asp Gly Val Val Ala Trp 500 505 510 Arg Thr Ala Val Ala Pro Gly Ala Glu Ala Gln Asp Gln Leu Ser Thr 515 520 525 Leu Leu Thr Arg Leu Leu Ala Arg 530 535 <210> 3 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 3 aaacactacg tggctagcca aaaaacccct caagacc 37 <210> 4 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 4 aaagcatgca ctagttaata cgactcacta taggg 35 <210> 5 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 5 ctttaagaag gagatataca tatgataata aataacagaa atgaatc 47 <210> 6 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 6 cttgtcgacg gagctcgaat tcattaattt ttatcgttta aacttgatg 49 <210> 7 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 7 gaattcgagc tccgtcgaca aataaggaga tataccatgg acgatatttc tttatcatct 60 g 61 <210> 8 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 8 gtggtgctcg agtgcggccg caagcttatt actcatcttt gttccttata atc 53 <210> 9 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 9 ctttaagaag gagatataca tatgaaacta atctctatgt tgttac 46 <210> 10 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 10 cttgtcgacg gagctcgaat tcattattga ttcctcaatg taaatag 47 <210> 11 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 11 ctttaagaag gagatataca tatgcgtcat gtagagcata cagtc 45 <210> 12 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 12 cttgtcgacg gagctcgaat tcttattaat cctcttcctc ttgctcg 47 <210> 13 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 13 ctttaagaag gagatataca tatggccttg acgaagccgg atg 43 <210> 14 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 14 caagcttgtc gacggagctc gagttgtcgg agcggctggc c 41 <210> 15 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 15 ctttaagaag gagatataca tatg 24 <210> 16 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 16 caaaacagcc aagcttgcat gcaagcttgt cgacggagct c 41 <210> 17 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 17 catgcaagct tggctgtttt g 21 <210> 18 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 18 catatgtata tctccttctt aaag 24 <210> 19 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 19 gttaagtata agaaggagat atacatatgc gtcgactgcc tgatttag 48 <210> 20 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 20 gatatccaat tgagatctgc cttatgatta ccctttctgt accattgtga tc 52 <210> 21 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 21 caatttcaca caggaaacag aattcatggc tgccattaat acgaaag 47 <210> 22 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 22 ccgggtaccg agctcgaatt cattacttct taatgcccat ctc 43 <210> 23 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 23 gtaatgaatt cgagctcggt acccaatttc acacaggaaa cagaatggca atccacaatc 60 gtgc 64 <210> 24 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 24 ctctagagga tccccgggta ccattacgcg tttttcagaa cttc 44 <210> 25 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 25 ctagagtcga cctgcaggca tgccaatttc acacaggaaa cagaatggct attgaacgta 60 ctttttcc 68 <210> 26 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 26 caaaacagcc aagcttgcat gcattaacgg gtgcgcgggc ac 42 <210> 27 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 27 gtcgtaccga aggggtccac cggctggtac 30 <210> 28 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 28 ggtggacccc ttcggtacga cggcggtgag 30 <210> 29 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 29 gacgtatggc aatacatcaa tcacttagac 30 <210> 30 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 30 gattgatgta ttgccatacg tcaaacggtt 30 <210> 31 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 31 gtgcccgact tcctgcatcc gcgcacaccc 30 <210> 32 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 32 cggatgcagg aagtcgggca cttcatcata 30 <210> 33 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 33 ctttaataag gagatatacc atggccttga cgaagccgga tg 42 <210> 34 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 34 ccgagctcga attcggatcc caagcttgtc gacggagctc 40 <210> 35 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 35 gtataagaag gagatataca tatggcagat gtcctgcagg ag 42 <210> 36 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 36 gatatccaat tgagatctgc caattaggga atggggacgc tac 43 <210> 37 <211> 261 <212> DNA <213> Unknown <220> <223> Streptomyces ravidus <400> 37 atgtccagtt tcagtattga tgatctgaag cgtatcttgc gcgaaggggc aggggcaacg 60 gctgagttag acggtgacat tttagacgcc tcctttgatg atttggggta tgattctttg 120 gctcttcttg aaacgggttc gcgcatcgga cgtgaatacg gtttggaatt tgaggataca 180 gctttcgccg acgtggaaac acctcgtgac ttggtcggcg tagttaatgc tcagttatcg 240 gccccggctc cgcgtgggta a 261 <210> 38 <211> 1321 <212> DNA <213> Unknown <220> <223> Streptomyces sp. R1128 <400> 38 atgcgtcatg tagagcatac agtcaccgtt gcggccccag cagacttggt ttgggaggta 60 cttgccgatg tcttaggcta tgctgacatc ttcccaccga cggaaaaagt tgaaattctt 120 gaggaggggc aaggatacca ggtagtgcgc cttcacgtcg atgttgcggg tgagattaat 180 acatggacca gtcgtcgcga tttagaccct gcgcgccgcg taattgctta ccgccaactt 240 gagacggctc cgatcgtggg ccacatgagc ggggaatggc gtgctttcac actggatgcc 300 gaacgtaccc aattagtcct gactcacgat ttcgtaaccc gtgcagccgg ggatgacggt 360 ttagtcgccg gaaaattgac cccagatgag gcgcgcgaaa tgttagaagc ggtggtagaa 420 cgtaactctg tcgccgactt aaacgcggtc cttggagaag ctgagcgtcg cgtccgcgca 480 gccggtggag ttggtaccgt aactgcgtaa taataatttt gtttaacttt aagaaggaga 540 tatatccatg tcagggcgca aaaccttttt agacttaagt tttgctaccc gcgacacacc 600 gtcggaggcg actccggtgg tggtagattt gctggaccac gtaactggag ccaccgtatt 660 aggattatca cctgaggatt tccccgatgg tatggctatt tccaatgaga ccgttacgtt 720 gacgacccac actggcacgc acatggatgc gccactgcac tatggtccct taagtggggg 780 agttccggca aagtcgattg accaagtgcc cttggaatgg tgctatggac ctggagttcg 840 tttggatgtt cgccacgtgc cggcaggaga tggtattact gtcgatcatt tgaacgccgc 900 gttggatgca gcagagcacg atttggcccc cggtgacatt gtgatgctgt ggaccggcgc 960 ggacgctctg tggggaaccc gcgaatactt gagcacgttt ccggggttaa ctgggaaggg 1020 gacacaattt ttggtcgagg cgggtgttaa agtcattggc attgatgcat ggggactgga 1080 tcgcccgatg gcagctatga tcgaagaata ccgtcgtacg ggcgataaag gagcattatg 1140 gccggctcac gtctatggac gcacacgcga atacctgcaa ttagagaagc ttaataattt 1200 gggcgcttta ccaggagcta cagggtatga catttcatgc tttccggttg cggttgcagg 1260 cactggagct gggtggactc gtgtggtcgc cgttttcgag caagaggaag aggattaata 1320 a 1321 <210> 39 <211> 1482 <212> DNA <213> Arabidopsis thaliana <400> 39 atgtcccatc gccgcaaccg tagccacaac aatcgtttac ccccgggacc taatccctgg 60 cccattatcg gaaacctgcc gcacatgggt acgaagcccc accgtacgtt gtcggctatg 120 gttacgacct atggcccaat tctgcacctg cgtctgggtt ttgtagacgt ggtcgtagcg 180 gcgtccaagt cggtcgccga gcagttcttg aagattcacg acgctaactt cgcttcacgt 240 ccccccaact caggagccaa acacatggcg tataattatc aagacttggt attcgccccc 300 tatggacatc gctggcgctt attgcgcaag atcagctcgg tgcatctgtt ctcggcaaaa 360 gcgttggagg actttaaaca cgtgcgtcag gaagaggtcg gaacactgac tcgcgaatta 420 gtacgtgtcg gcaccaaacc agtgaacctt gggcaactgg tgaatatgtg cgttgtcaac 480 gccttaggac gcgaaatgat cggacgccgc ttattcgggg ccgatgccga tcataaggcg 540 gatgagttcc gctcgatggt cacggagatg atggcgttag cgggggtctt taatatcggc 600 gactttgtac cgtcattaga ctggcttgat ctgcaagggg tcgctggaaa gatgaagcgt 660 ttacataagc gttttgatgc gttcttaagt tcgattttaa aagaacatga aatgaatggg 720 caagaccaaa agcataccga tatgttatcg accttaatca gccttaaggg tacagatctg 780 gatggggatg gcggctcctt aacggatact gaaattaagg cgcttttatt aaacatgttc 840 acagccggaa ccgacacatc agccagtaca gtagattggg caatcgctga attgatccgc 900 caccccgata tcatggtgaa ggctcaggaa gaattagata ttgttgtagg tcgcgaccgc 960 cctgtgaatg agtctgatat cgcccaactg ccgtacttac aggcggtaat taaggaaaat 1020 tttcgtctgc atccacctac tcccctgtct ttgccgcaca ttgcgagtga atcctgtgag 1080 attaacggtt accatattcc caaaggttca acattactta ccaacatctg ggctatcgcc 1140 cgtgatccgg accagtggag cgatccgtta gcttttaaac cagaacgttt tctgccagga 1200 ggagaaaaat ctggggttga tgtaaaaggt agtgatttcg agctgattcc gttcggtgca 1260 ggccgtcgca tttgtgcagg cctgtctctg ggtcttcgca cgatccagtt cttaacagcg 1320 actttagtac aagggtttga ttgggagtta gctgggggag tgacgcccga aaaactgaac 1380 atggaagaat cgtacgggtt aactttgcaa cgcgctgtcc ctctggtagt acacccgaaa 1440 cctcgtttgg ccccgaatgt gtacgggctg ggcagtggct aa 1482 <210> 40 <211> 2136 <212> DNA <213> Arabidopsis thaliana <400> 40 atgtcttctt cttcttcttc ttctacctct atgatcgacc tgatggctgc tatcatcaaa 60 ggtgaaccgg ttatcgtttc tgacccggct aacgcttctg cttacgaatc tgttgctgct 120 gaactgtctt ctatgttaat tgagaatcgt cagtttgcta tgatcgttac aacatccatc 180 gcggtcctta ttggttgtat cgttatgttg gtctggcgcc gctctggttc cggtaactct 240 aaacgtgtgg aaccgcttaa accgctggtg atcaaacctc gtgaggagga aatcgacgat 300 ggacgtaaaa aagtaacaat ctttttcgga acgcagactg gcactgcgga aggttttgcc 360 aaggcattag gtgaggaagc taaagctcgt tatgaaaaga cgcgcttcaa gattgttgat 420 ctggacgatt acgctgcaga cgatgatgaa tacgaggaaa aattaaaaaa agaggatgta 480 gctttcttct tcttagctac gtatggcgat ggtgaaccga cagataatgc cgctcgtttt 540 tataagtggt ttaccgaagg caatgatcgt ggtgagtggt tgaaaaactt aaaatatggg 600 gttttcgggc tgggcaatcg tcaatacgag cactttaaca aggtcgcgaa agtggtcgat 660 gacattctgg ttgagcaagg cgcacagcgt ctggtacaag tagggttagg ggatgatgac 720 cagtgtatcg aagatgattt cacagcttgg cgcgaagcat tgtggcccga gttggatacg 780 attctgcgcg aagagggcga tacggctgtt gccacaccct acacagccgc agtattagag 840 tatcgcgtaa gcatccatga tagcgaggat gccaaattca atgatattaa ccttgctaac 900 ggaaacgggt atacagtttt tgacgctcaa catccgtata aggccaacgt tgcggtcaaa 960 cgtgaattgc acaccccgga gtccgaccgt tcctgtatcc atctggaatt tgatattgcg 1020 ggatcaggtt taacatacga aactggagat cacgttggtg ttctgtgcga taacttatcc 1080 gagacggtgg atgaggcact gcgcctttta gacatgtccc ctgacacgta ttttagcttg 1140 catgctgaaa aagaggacgg tactccgatc agtagctcgc tgccaccgcc gtttccaccg 1200 tgcaatttac gcacggcttt aacacgttac gcgtgcctgt tgtcatctcc taagaaatcc 1260 gccttagtgg ctttggctgc acacgctagt gatcccactg aggccgagcg cttgaaacac 1320 ttagcaagcc ctgcaggtaa agacgagtac tccaagtggg tagtagagtc acagcgtagt 1380 ttattggagg tgatggccga gtttcctagt gcgaagccac cgttgggagt tttctttgcc 1440 ggggtggctc cgcgtttgca accacgtttt tatagcatca gtagttctcc aaaaatcgcc 1500 gagactcgca ttcacgttac atgtgccctg gtctacgaaa aaatgccgac tgggcgcatc 1560 cacaagggtg tatgctcgac ttggatgaag aacgccgtac cctacgaaaa gtctgaaaac 1620 tgcagctcgg cgccaatctt cgtacgccag tccaatttca agttgccgtc agattcaaag 1680 gtaccgatca ttatgatcgg tccaggaacg gggttagctc cgttccgtgg gttcttacag 1740 gaacgcttag cactggtcga gtcgggggta gaattgggcc cctccgtctt gtttttcggg 1800 tgtcgtaacc gtcgcatgga cttcatctat gaagaagagc tgcaacgttt cgtggaaagt 1860 ggggcgcttg ctgaactgtc ggtggcgttt tcccgcgaag gacccacgaa agaatatgtt 1920 caacacaaaa tgatggacaa agcgtcggat atctggaaca tgatttcaca gggcgcttat 1980 ttatatgtat gtggcgatgc gaaaggcatg gcgcgtgacg tccaccgttc tctgcacacc 2040 attgcgcaag agcaaggtag catggattca acgaaagcag aaggcttcgt gaagaattta 2100 caaacctctg ggcgctatct tcgtgatgtg tggtaa 2136 <210> 41 <211> 1098 <212> DNA <213> Unknown <220> <223> Streptomyces fradiae Tu2717 <400> 41 atgtttgccc tggctccgct ggccacagca gctcgtaatg caggtcatca ggtagtaatg 60 gcagcaaacc aggacatggg acctgtcgta accggggttg gccttccagc cgtagcaacc 120 actgatcttc cgatccgtca tttcatcact accgatcgtg aaggacgtcc cgaggccatt 180 ccttctgacc cggtcgcgca ggcccgtttc actggtcgct ggttcgcccg tatggctgcc 240 agttccttgc cccgtatgct tgatttttca cgtgcatggc gcccagactt aatcgtcggt 300 ggtactatga gctatgtcgc tccgctgtta gctcttcacc tgggagtccc gcacgcccgt 360 cagacttggg atgcggtaga cgctgatgga atccacccag gtgctgatgc tgagcttcgc 420 ccagagttaa gcgaattggg attggagcgc cttcccgcac ccgatttgtt catcgacatt 480 tgcccgccct cgttacgtcc tgccaacgca gcaccagctc gcatgatgcg ccacgtagcc 540 acgagccgcc aatgcccgtt agagccgtgg atgtatacac gtgacactcg ccagcgtgtt 600 ttagtgacgt cgggatcgcg tgttgcaaaa gaatcttacg atcgtaattt cgatttttta 660 cgtggattag cgaaggattt ggtgcgctgg gatgttgaat taattgtggc tgctcctgac 720 accgtggctg aggctcttcg tgccgaggtg ccacaagctc gcgtagggtg gaccccttta 780 gacgtcgtgg cccctacatg cgatttattg gtgcatcacg ccggcggagt ctctacgctg 840 actggtttat cggctggcga gccccaatta ttaatcccaa agggcagtgt attggaagct 900 cctgcgcgcc gcgtagcaga ttacggcgcg gcgattgcac tgttgcctgg tgaggactcg 960 acggaagcta tcgccgatag ttgtcaggag ttgcacgcca aggacactta tgcccgccgc 1020 gctcaagact taagccgcga aatttcaggg atgcctctgc cggccacagt ggtgactgca 1080 ctggaacagt tagcctaa 1098 <210> 42 <211> 1548 <212> DNA <213> Unknown <220> <223> Dactylopius coccus <400> 42 atggagttcc gcttattgat tctggcactg tttagtgtct taatgagtac gtcaaatggt 60 gccgagattc ttgccctgtt tccaattcac ggaatttcca actacaacgt agcagaggca 120 cttcttaaaa cgcttgccaa ccgtggacat aacgtcactg tggtcacgtc attcccccag 180 aagaaacccg tgccaaactt gtatgaaatc gacgtatctg gggccaaagg tcttgctacc 240 aactcaattc actttgagcg tcttcagact atcattcaag acgtgaagtc caacttcaag 300 aatatggtgc gtctttcacg cacttactgc gagattatgt tctccgatcc tcgcgtactt 360 aacatccgcg acaaaaagtt tgatttggta atcaacgcgg tgttcggatc ggattgtgac 420 gctggctttg cgtggaaaag ccaagcaccc ctgatctcaa ttttaaatgc acgccacacc 480 ccgtgggcgc ttcaccgtat gggaaaccct tctaaccctg cgtacatgcc agtaatccac 540 tcacgcttcc cagtaaaaat gaatttcttc cagcgtatga tcaatacagg ctggcattta 600 tactttttgt atatgtactt ttattatggc aacggagaag acgcaaataa aatggcgcgt 660 aagtttttcg gtaacgacat gcccgacatt aacgaaatgg tctttaacac atcgttgctt 720 tttgttaata ctcactttag tgttgatatg ccctaccctc ttgttcctaa ctgcattgaa 780 attggtggga ttcacgtcaa agagccccaa ccgcttcccc tggagattca aaaattcatg 840 gatgaagcag agcatggtgt aatctttttc actttgggct cgatggtccg cactagcacc 900 tttcccaatc agactatcca agcgtttaaa gaggcgttcg cagaacttcc acagcgtgtt 960 ctttggaagt ttgaaaacga gaatgaagac atgccttcta acgttttaat ccgcaaatgg 1020 tttccacaga acgatatctt tggacataag aacattaagg cgtttatctc gcatggcggt 1080 aactcagggg cccttgaagc cgtgcatttc ggcgtgccca tcatcggcat tcctctgttc 1140 tatgatcagt atcgtaatat cttgagcttc gtgaaagaag gggttgcggt actgctggac 1200 gttaatgatt tgacaaagga taacattctg tcgtctgttc gtacagtagt gaacgataaa 1260 tcttacagcg aacgcatgaa agctctgtcc cagctgtttc gcgatcgtcc aatgagtccc 1320 ctggacacgg ctgtctattg gacggaatat gtaatccgtc accgcggagc acatcatctg 1380 aagactgctg gcgctttttt gcactggtat cagtatttgt tgctggatgt gattactttc 1440 cttttggtaa cattctgtgc cttttgcttc attgtcaagt acatctgtaa ggcgctgatt 1500 caccattatt ggtcgagttc caagagtgaa aaattaaaga aaaactaa 1548 <210> 43 <211> 1428 <212> DNA <213> Zea mays <400> 43 atggctgcta atggggggga tcatacctcc gcgcgcccac atgtggtgtt gcttccatcc 60 gctggcatgg gacatcttgt ccctttcgcc cgcttagctg tggctttatc tgagggacac 120 ggctgcaacg taagtgtagc tgcagttcaa ccaacggttt cctctgcgga gtcgcgtctg 180 ttagacgcac ttttcgtcgc cgccgcccca gccgtccgcc gtcttgattt ccgcctggcc 240 cccttcgatg aatccgagtt ccccggtgca gacccttttt tcttacgctt cgaggcgaca 300 cgtcgctcgg caccgcttct ggggccgtta ttagatgcgg cggaagcctc cgcacttgtg 360 actgatattg tccttgcttc ggtagcgttg ccagtggcgc gcgagcgtgg agttccctgc 420 tatgtgcttt ttacgtcatc ggccgcaatg ctgtcgttgt gtgcgtattt tccagcttat 480 ttagatgcac atgcagcggc cggctcggtc ggggtcggag tagggaacgt cgacattcca 540 ggggtatttc gcatccctaa gtcgagcgtc ccgcaagcac ttcacgatcc agatcattta 600 tttacccagc agtttgtcgc aaatggccgt tgtttagttg cctgcgacgg cattcttgtt 660 aacaccttcg acgccttcga gcccgatgca gtaaccgcac tgcgccaagg gtcgatcaca 720 gtctctggcg gttttccacc agttttcacc gtgggcccaa tgcttcccgt tcgcttccag 780 gcagaggaga cggctgacta catgcgttgg ttgtctgcac aaccaccccg cagtgtcgtc 840 tatgtctcgt ttggaagtcg caaggcgatt cctcgcgacc agttacgtga attggccgca 900 gggttagagg ctagtggcaa gcgttttctg tgggtagtaa agtcgaccat cgtcgaccgc 960 gatgataccg ccgatctggg cggcttgttg ggggacggct ttcttgagcg cgtccaaggt 1020 cgtgcatttg tgactatggg atgggtggaa caggaagaga ttttgcaaca tggctcggtt 1080 ggcttgttta tctcgcattg tgggtggaat agccttaccg aagccgccgc gttcggggta 1140 ccagttcttg cctggcctcg tttcggagat cagcgtgtga acgccgcctt agttgcgcgc 1200 tctggattgg gagcgtggga agaagggtgg acttgggatg gtgaggaggg acttactaca 1260 cgcaaggaag tggcgaaaaa gatcaagggc atgatggggt acgatgctgt agccgaaaag 1320 gcggccaaag ttggtgacgc agctgcggca gcaattgcaa aatgtggcac gagttatcaa 1380 tctttggaag agtttgtaca acgttgccgc gacgccgagc gtaagtaa 1428 <210> 44 <211> 1416 <212> DNA <213> Oryza sativa <400> 44 atgccttcct caggagacgc tgccggtcgt cgccctcacg tcgtgctgat cccttcagcc 60 ggaatggggc acctggtccc gtttggtcgt ctggctgtcg cactttcctc tgggcacgga 120 tgtgatgtgt ctttagtaac agttcttcct actgtgagta cagcggagtc aaagcatctt 180 gatgcacttt ttgacgcatt ccccgcagtt cgccgtcttg acttcgagtt ggcgccattt 240 gacgcatcag agtttcccgg tgctgaccct ttcttccttc gttttgaggc gatgcgccgt 300 tcggctccat tgcttggccc tttgctgacg ggcgcgggcg ctagcgcact ggcgacggac 360 attgctttaa cgtctgtcgt aattccagta gcaaaagagc aagggcttcc gtgtcacatt 420 ttattcactg cgtcggccgc aatgttatca ttgtgtgcct acttcccaac ttatttggat 480 gccaacgctg gcggaggggg cggtgtgggc gacgtggata ttcctggagt gtatcgcatt 540 ccgaaggcat caattccaca agccttacat gatcccaacc acttgtttac tcgtcagttt 600 gtggcgaatg gtcgtagtct tacctcggcg gccggtattc tggtgaacac tttcgatgcg 660 ttagagccgg aggcagtagc tgcattgcag caaggaaagg tagcctccgg ctttccacca 720 gtattcgcgg tggggccgtt gctgcctgcc tctaaccagg ccaaggatcc gcaggcaaat 780 tacatggagt ggctggacgc ccagcccgcc cgcagcgtag tttatgtaag tttcgggagt 840 cgcaaggcga tttcacgtga acaacttcgc gagctggctg ctggcttaga ggggagcggc 900 caccgttttc tgtgggtcgt gaaatccacc gtcgtggatc gtgacgacgc ggccgagctg 960 ggagagctgt tggacgaggg ttttttagag cgtgtcgaga agcgtggatt ggtgacaaag 1020 gcatgggtcg accaggagga ggtactgaaa catgaaagcg tagccctgtt tgtctcacat 1080 tgcggctgga acagcgtgac tgaggcggcg gcgagcggtg tgcctgtcct ggccttaccc 1140 cgcttcgggg accaacgtgt taattcagga gtggtggcac gtgcaggatt aggagtatgg 1200 gcggatactt ggtcgtggga gggcgaagca ggcgtgattg gtgcggagga aatctcagag 1260 aaggtcaaag cagctatggc cgacgaagct ttacgtatga aagctgcatc ccttgcagag 1320 gcagccgcca aggcagtggc tggcggtggg agtagtcatc gctgtttagc ggaatttgcc 1380 cgtctgtgtc aaggtggaac ttgccgtact aattaa 1416 <210> 45 <211> 1443 <212> DNA <213> Glycine max <400> 45 atgagttcta gtgaaggagt ggtacatgta gcttttcttc caagtgcagg aatgggccac 60 ttgaaccctt tccttcgctt ggcggcgacc ttcattcgtt atggttgtaa agtaacgtta 120 atcaccccga agcctactgt atccctggca gaatcgaatt taatttcacg cttttgttcc 180 agctttccac atcaggttac gcaactggac ctgaatttag tcagcgttga tccaacgacc 240 gttgacacaa tcgacccatt cttcttacaa tttgaaacca tccgccgtag tctgcatctt 300 ttacctccca ttttaagtct tcttagcact cctttgtctg ccttcattta tgacattact 360 cttatcacgc ctttgctttc tgtaatcgag aagctgtcgt gccccagcta cttgtatttt 420 acatcttcag cacgtatgtt ctctttcttc gcacgtgtct ccgtgttgtc cgcatctaat 480 cccgggcaga ctccctcgtc atttatcggt gacgatggag ttaagatccc tgggttcaca 540 agccccatcc cacgcagcag tgttccgcct gcgattcttc aagcgtcctc aaatcttttt 600 cagcgcatta tgttagaaga cagcgcgaac gttaccaagc ttaataatgg ggtcttcatc 660 aatagctttg aagaactgga gggcgaagct ttagccgctt taaacggggg gaaagttctt 720 gaaggtctgc cgcccgtgta cggggtgggc ccccttatgg cgtgtgaata tgagaaaggc 780 gacgaggagg gtcaaaaggg ctgcatgtct tcgatcgtga agtggctgga tgaacagtcg 840 aagggaagcg tggtatacgt gtccttgggc aatcgtacgg aaacgcgccg tgagcagatt 900 aaggatatgg cccttggttt gatcgagtgt ggctatggat tcttgtgggt cgtcaaactg 960 aagcgcgtcg ataaagaaga tgaggaaggc ttagaagagg tgttaggtag cgagctgagt 1020 tccaaggtta aggagaaggg tgttgtagtt aaggaatttg ttgaccaagt cgaaattttg 1080 ggccacccaa gtgttggggg atttttgtcg cacgggggtt ggaacagcgt aactgaaact 1140 gtatggaagg gagtgccttg tctgtcatgg ccacagcata gtgatcagaa gatgtctgcg 1200 gaggtaatcc gtatgtccgg aatgggtatc tggcccgagg agtggggctg ggggacgcaa 1260 gatgttgtga agggagacga aatcgccaaa cgcattaagg aaatgatgtc gaacgaatcg 1320 ttgcgcgtaa aggcgggaga attgaaggaa gcggcgttaa aggcggcagg ggtagggggg 1380 agttgtgaag tgactattaa acgtcagatc gaagagtgga aacgcaatgc ccaggctaat 1440 taa 1443 <210> 46 <211> 1434 <212> DNA <213> Gentiana triflora <400> 46 atggggagtt tgactaacaa cgataatctt catatttttc ttgtgtgctt catcggccag 60 ggcgtggtca atcccatgtt acgtttgggg aaggcgttcg cctccaaagg gttacttgtc 120 actttaagcg caccggaaat cgttggaact gagatccgta aggcgaataa ccttaatgat 180 gaccaaccaa tcaaggtggg ttccgggatg attcgtttcg aatttttcga cgatggatgg 240 gaatccgtaa acggtagcaa accgtttgac gtatgggtct acatcaatca cttagaccag 300 acaggccgtc aaaaacttcc gattatgtta aagaaacatg aggagacagg gactcctgta 360 tcttgcttga tcctgaatcc cttagtccct tgggtcgcgg acgtagccga ttcacttcag 420 atcccctgcg ctaccttgtg ggtccaatct tgtgcaagtt tttcagcata ttaccactac 480 caccacgggt tagtgccttt cccaaccgaa tcagagcccg agatcgacgt acaacttcct 540 gggatgccac ttttgaaata tgatgaagtg cccgactacc tgcatccgcg cacaccctac 600 cccttttttg gcacgaacat tttaggtcaa ttcaagaatt tatccaagaa cttctgtatc 660 ctgatggata ccttctacga gttggaacac gagatcatcg ataatatgtg taaattgtgt 720 ccgattaagc caattggccc gttgtttaag attccgaaag acccaagctc caacggaatc 780 acgggtaatt tcatgaaagt ggatgactgc aaggagtggc tggacagccg tccaacatca 840 actgtggttt acgttagtgt cgggtctgtt gtatatttga agcaggagca ggttacagaa 900 atggcatacg gcattttaaa ttcggaagtt tcgtttttgt gggtgctgcg cccgccgagc 960 aaacgcatcg gtacggaacc gcatgtactg cccgaggagt tctgggagaa ggccggagat 1020 cgtggcaagg tggtgcaatg gtcaccccag gagcaggtgc ttgctcaccc cgccactgtc 1080 ggttttttaa cacactgtgg atggaatagc actcaagagg cgatttcgag cggagtgccc 1140 gtcatcactt tcccacaatt tggggaccaa gtgaccaatg ctaagttcct tgtggaggaa 1200 tttaaggtcg gggtccgttt aggccgcgga gagttagaaa atcgcatcat cacacgcgac 1260 gaagtagaac gcgctttacg cgagattact tcaggcccca aggctgaaga ggtaaaagag 1320 aacgccttaa aatggaagaa gaaggcagaa gagacagtag ctaaaggcgg ctactccgaa 1380 cgtaatcttg taggcttcat tgaagaggtg gctcgtaaga ctggtacaaa gtaa 1434 <210> 47 <211> 2112 <212> DNA <213> Aloe vera <400> 47 atggaggaaa tttccagtaa agtggagttc ttatccctta agcccagcat gtcaggaagt 60 ccccgttaca gccccacatt tcgtaaaatc ggaagcggtc gcaattcccg ccgcgactcc 120 cgtgctcatg cagggaattt cccctggatt cgcaacaatc gtgttttttt ttggctgctt 180 ttaatcacca tctgggcgta catcggcttt cacgtccaat ctcaatgggc acatggcgac 240 cataaagctg agttcgttgg atacaagtcg gaggtaggga agatgggtga ggacgtcaag 300 tcggtaaata gtacgactac gttctccatt gtacacaagg gcaatttaac tgttgaagga 360 aagaaagacc ccgattccaa ttttggtatt tcactgttga aaaagggtaa acaggttctt 420 tcccgtttaa attcacgcaa aaagggccat cgttcgcgca aggtgtcgga aaaactggaa 480 gaagaaacgg acgacaatgg gacgggagaa atggatgagg tccttatcca gcgcaaaaac 540 acatcttatg gcttaattgt agggcctttt gccaaactgg aagagagtgt gcttgagtgg 600 agcccaggca agcgccgtgg tgtctgctat cgtaagggag aatttgcccg cgcggtgtct 660 tctcagcgct ttatgttgat cttccacgaa ttgtcaatga ctggcgcccc attgtccatg 720 ttggaattgg ccacggagat cctgtcttgc ggtgggtctg tgagcgctat tgtattatct 780 aagaagggag ggttaatgcc ggaactgaag aagcgtggta ttaaggtttt gcaagaccgt 840 gacaaggtga gtttcaaggt cgccacgaaa gtagacctga ttattgcggg atctgctgta 900 tgtagtagct ggatcgagcc atatctggag tatttccccg ctgggtccgg acatattgtc 960 tggtggatca tggaaaaccg tcgcgaatac ttcgaccgta gcaagcatct tttaaaccgt 1020 gtgaaaattt tggcatttct tagcgatagc cagtcaaagc agtggctttc ttggtgtgag 1080 gaagagaaga ttaaattcct gatccagcca atgttagtgc cgttgtcagt taacgatgag 1140 ctggccttcg ttgccggtat tccttgtagc ttgaatactc cagcattatc agtggagaaa 1200 atgatcgaaa agcgtgattt attacgtcac gcagtccgta aggaaatggg gttgggggac 1260 aatgacatgc ttgtgatgag tttaagtagc atcaacccag ccaagggtca gcgctttctg 1320 cttgaggcag ccttactggt agctgaacac aatgtatcat tgaaagatgc taacagttac 1380 agtcttatgg aggaggagaa gttatccggg aacgcacctc aaaatcaaac catcatgatc 1440 ggtcaactga atcctggcca cgtacttcag atcgccaatg acactaataa gcccgtcaat 1500 gcgttacaga agattggcgc cacacgtgtc tcgtcgaagc gtcgcggcaa gctgcatacg 1560 aatacagtca cgggcgtgct tcagaaaagc cgcaaacttt tgtccgaggc agcaggtatg 1620 aaggaggaaa ccctgaaagt ccttgtaggt tccgtcggat cgaaatcgaa taaggttctg 1680 tatgtaaagg caatcatgga atacatcagc caacattcta atttgtctaa ggtcgttctt 1740 tggaccccag ccaccacgtc tatcgcagca ctgtacgccg ccgcggacgt gtacgtcatt 1800 aacgctcagg gacatggaga gacattcggt cgcgtgacga tcgaggcgat ggcctttggc 1860 ctgccagtgc tggggactga cgccggaggg actaaagaaa tcatcgacca ccgtgttacg 1920 ggacttctgc atcctgtggg tcccgagggc actgtactgt tagcgcaaca cattcaatat 1980 cttttaaaaa atcccagcgt gcgcaagaaa atgggtatca atggtcgccg caaagtacaa 2040 gataaatact taaaacacca gacttacgag tcccttggca aagtcatgtt caaatcgatg 2100 cgtccccgtt aa 2112 <210> 48 <211> 1611 <212> DNA <213> Unknown <220> <223> Streptomyces peucetius ATCC 29050 <400> 48 gtggccttga cgaagccgga tgtcgatgtc ctcgtggtgg gcggcggtct cggggggctg 60 tccaccgccc tgttcctcgc ccgccggggg gcgcgggtcc tgctggtgga gcggcatgcc 120 agcacctcgg tcctgcccaa ggcggcaggc cagaacccgc gcaccatgga actgttccgc 180 ttcggcggcg tggccgacga gatcctggcc acggacgaca tccgcggcgc ccagggcgac 240 ttcaccatca aggtcgtgga gcgcgtgggc ggtcgcgtcc tgcacagctt cgcggagagc 300 ttcgaggaac tggtcggtgc gacggaacag tgcacgccca tgccctgggc gctcgctccc 360 caggaccggg tggagcccgt cctggtggcc cacgccgcca agcacggcgc ggagatccgg 420 ttcgccaccg aactgacctc cttccaggcg ggcgacgacg gtgtcacggc ccgcctgcgc 480 gacctgggca cgggagcgga gagcaccgtg agcgcccgct acctggtcgc cgccgacgga 540 ccccgcagcg cgatccggga gagcctgggc atcacccggc acggtcacgg caccctggcc 600 cacttcatgg gcgtcatctt cgaggccgac ctcaccgccg tcgtaccgcc cgggtccacc 660 ggctggtact acctgcagca cccggacttc accggcacgt tcggccccac cgaccggccc 720 aaccggcaca ccttctacgt ccgctacgac cccgaacgcg gcgagaggcc ggaggactac 780 acaccgcagc gctgcaccga gctgatccgg ctggctgtcg acgcgcccgg gctcgtcccg 840 gacatcctcg acatccaggc ctgggacatg gcggcgtaca tcgccgaccg gtggcgcgaa 900 gggccggtgc tgctggtcgg cgatgccgcc aaggtcaccc cgcccaccgg gggcatgggc 960 ggcaacaccg ccatcggcga cgggttcgac gtggcctgga agctggccgc cgtgctgcgc 1020 ggcgaggcgg gcgagcggct cctcgacagc tacggggcgg agcggtcgct cgtgtcccgc 1080 ctcgtcgtcg acgagtcact cgccatctac gcccagcgca tggctcccca cctgctcggc 1140 agcgttcccg aggaacgcgg tacggcgcag gtcgtcctgg gcttccgcta ccgctccacc 1200 gccgtcgccg ccgaggacga cgaccccgag ccgaccgagg atccgcgacg cccgtccggg 1260 cgccccggct tccgcgcacc ccacgtctgg atcgaacagg acggcacacg gcgttccacc 1320 gtcgagttgt tcggcgactg ctgggtgctc ctggccgcac cggagggcgg cgcctggggc 1380 caggcggccg cccgcgccgc cgcggatctg ggcgtccgcc tcgacgtcca tctcgtcggc 1440 cgcgatgtcg ccgccccctc cggcgaactg acgcggacct acgggatcgg ccgggcgggg 1500 gccagcttgg tgcgcccgga cggcgtggtc gcctggcgta cggcagtagc gccgggagcg 1560 gaggcccagg accagctgag caccctgctc acccggctgc tggcccgctg a 1611 <210> 49 <211> 2678 <212> DNA <213> Photorhabdus luminescens <400> 49 atgataataa ataacagaaa tgaatctcaa ccacgtagag ttgtggtgac agggctaggt 60 gttgtcgcac cgacaggtgt tggcgttaat gaattttgga acaatattca taacggcaaa 120 tcgggggtaa gtgaatatga gtggggaaga aaaaaatttg gttttaaaag cggagcaata 180 ggaaaagttc acggtaacga tagcgatagc aaagagtttg tgctgaaaag tgagcgtaaa 240 tatcttgagt ttgcgctaga agcctctgag atggcaatgc aagatgcaaa tttaaaacct 300 tcagacattg atggccggcg ttttggcgtt gcgatagcaa cagcgattgc cgatgctgcg 360 ggaatggaag agtgtttgct caggatcacc aaagggggca aagagaatat tcatcctgat 420 ttaattaaat cagaggatta tgacagcttt gatttcagct ctgccgccac ctctgttgcg 480 aaaaaatatg gcgcatcgat gtccgtcagt aacatatcaa ctgggtgtgc ggcaggactt 540 gatgcattag gcattgcgat ggagcatatc cgttatggca gagcggatgt gatgctggct 600 ggcgccagtg aagcgccgct ttgtccactt tctatcggct cttttgaagc tttaggggcg 660 ctatcatcaa gagaattgga aaatcagcaa gcagcgactt gtcctttttc ccttgagcgg 720 gatggatttg tgattgctga agggtgtgga atattaattt tagagtctta tgaacatgct 780 aagcagcgtg gagcacatat ctatgctgaa ttagcagggt atgcgtccgt gaataacgct 840 tatcatatga ccgacttgcc tgcggatgga atggcaatgg cgcggtgcat tgatatggcg 900 ttgaaggatg cccagatatc gccatcagcg gtcaattata ttagtgctca tggcagttct 960 acggctcaaa atgatattaa cgaatcaaat gcgattaaat ttgttttggg agaaaatgca 1020 tttgatattc caattaactc attaaagtca atgacaggtc atgctttagc tgccgctaat 1080 gcgatcgagt ctgtagcgtt atgtctggaa atagaaaagc aatatattca tccaacaatt 1140 aattatcaaa cgccggaccc tgattgcgat ttagattata ttcctaatca aggttgcgca 1200 tatccaatta agaccgcatt aaaattatcg agtggttttt ctggtattca cagtgttatt 1260 gttatgaggg cagtagacaa tgcgtaaaag agttgttgtt accggcgttg gcgcagtaca 1320 tcctgatggc aatgatgtca ccgctataaa aacaaaagtg attcagaaat tattgggtca 1380 ggaatcgata aataatacca acaaaagttc tgtaataagg acattgaatg atttcgatgg 1440 ggcaaaatat atcaataacc gcttaagacg taaaattgat gaattttcag tttatggtat 1500 cgtcgccgtt gaaatggcat taaaagcgag cagattggat gtagataagc ttgatcctaa 1560 tcgtgttggc atatatgttg gaaactgttt tggcggatgg cagcatattg aggatgaagt 1620 taaagcgctc catgttgaag gcatatcggg gatgggacct tatgttgcta cggcatggtt 1680 ccctgctgcg cttcaagggc aattgtcact gctttatggt tttagtgcgc aatctaagac 1740 attttccacc tccgatgtag cagggatgca agcaataggc tatgcggctg aagcgatttc 1800 taatggtgtt gccgaagtga tgttatgtgg cgcgtcagaa catctttcca gcccgttagt 1860 taaaagttta ctggagaaag agtcaagcca gaaacactct gaggtttttg gcgaaagaca 1920 gccaggggac ttttccgaag gcgctgcatt tctagtgctg gaagagaggc aacatgcttt 1980 agaacgcggc gcttcgatat tgtgtgaatt aacgggtttt gttgattatt tttcaccgga 2040 taaaaataca agaaataaca ccttagaata tactgctgaa ctattcaacc ataatgagaa 2100 tgctgtattt attatggatg gaatatatga tgatgaaaaa gaaataacga gtaaggcttt 2160 ctccaataaa gagataaaaa catcatttat aaatctgagg ccttacttga ataatcaatt 2220 ttcagtcagc ggcgtaattg attcagtcct ggcatcatca tttttatcag aaaataacgg 2280 ggatggagaa caacaatcta ataaaataaa tgaactttca aatactaacc aaataataat 2340 tcagcgcttt agtaaccagg gtcatgtatg tgcgttgagt ttttcagcaa tttaatctct 2400 aaaatattta attacgcgag gaaaaatata tgaataataa cccagaagta aaaataaaaa 2460 cgattttgtc tctttttctt aacgttaata ttgatgattt caatatggat gcaaaccttg 2520 ctgatgccta tgatatggat tctacggaat tggctgactt ggcaaaagag attacgaaag 2580 agttcggtat ttccgtgacg aaaagtcagt tcagtcattg ggaaacagga agagccgttc 2640 ttgatttcgt ctcatcaagt ttaaacgata aaaattaa 2678 <210> 50 <211> 714 <212> DNA <213> Photorhabdus luminescens <400> 50 atggacgata tttctttatc atctgatttt tttgatcttt ggattatcaa aatcgacgat 60 attgatttag cttctattga acagttaatt cactgttctg atatagttcg ccataaccaa 120 atttgtttag cggatagaag aaagagattt atatttagac gggctgcatt acgttatgtt 180 ttgagtcaat atttatctga ttatgaaatc ataacgaatg ataacggaaa accttatata 240 tccacggagc aagacttcaa atattatttt tcactgagtg cttcaggaaa ctattgtgcc 300 attggtttta gctcaaggga aataggtgtt gatattgaag tcactccttc taaggtaaaa 360 ttttcagaaa ttattgaacg ttttattaag gataaagatt tggaatatat gaaaggtata 420 atgttaaaac aactatcagg agttagtctc ggatttaata actattatca tttaatgtca 480 ttatattatt gggttagact tgaagcatat attaaattat ttgcttcgac tttacatgag 540 aaattattgg ttaataactc tgattctgtt aaagatatga aagaattgga ggcaagcaca 600 ttattgattc atagtcagca atttgtttgt gccttatctc aaaagaaagt catttctaca 660 ccaaatatca aggaaataaa ttattccgaa attataagga acaaagatga gtaa 714 <210> 51 <211> 1548 <212> DNA <213> Photorhabdus luminescens <400> 51 atgaaactaa tctctatgtt gttacattca gagcatgata acttacatca tgattgtatt 60 gtcactaagg attatcatta tacaagaaaa gaggtgatat cttctgtttc ccatttaatt 120 gatgatttat tgagtcgagg agtgcaaaaa ggtaataaag tcattgttat atttgaacat 180 gatgaattag gtgttttctt tttggctgcc gccagtgcta tggggttgca tttattaatg 240 ccctataatt tatcatcagc gacaatcgat gaatggatta attttaccaa tgaagtgcaa 300 tacgattttg ttgtttatct caaaaaagat aaacattttg ttggaaaatt aaaagaaaac 360 aacattaatg ttattgatat ttcagatcat aagatcagag ttagtgatga tattgcggaa 420 atcccaatga taacttattc tccgcaacct attgctaact ttattgtcct gttcaccagt 480 gggagtacag gcaaaccaaa agccattagt atttcagaat cgttagtatg tcgtcgaatt 540 tattcggtga ccgagaaatt aaaatttacg caagatgcca aaatattcat gtcaggtttg 600 ttgaataata caactggagt gattttttct ttcggctcat tattgcatca atcaacactt 660 tttatacccg aagatagaaa tgtagagaga tggcctgatt atctttctcg caataaaatc 720 actcatatta tgttacgccc agaatcaatg aaattattcg ttaaatcgac agcagaactt 780 aatattgatc tctcttgttt acgggtggtt gcttatggcg ctgcggcgat gcctcctagc 840 gtacttgaga aagggcgaca attaattggc tgtgaatggg tgcagggata tgggttaagt 900 gaaacttatg gtcctttctg ttgggtggat gagcaagatc atcgtgataa aagatatctc 960 aattcaattt attgtgttgg taagattgat aatacattgg aagtggcagt taaacctatt 1020 ataggttcat cggataatat cggagaaatt atactaaggg gtaaaagtat tatggaagga 1080 tattatgatg tcctttctgg agaaataacg cctcctgatg aatggtttgc cactggtgat 1140 cttggttata tagatgaaga gggttattta gttttgaaag gacgtaagca aaatacgttt 1200 atgagtgcta acggacacag aatttatcct gaagaaattg aatctatttt atcccgaata 1260 cccaatgtga atgtcgctac ggttgttggt ttttctttcc atgaaaatgg tgttgctatt 1320 gatcagccgg ttgcttgcat gagtggagag atatctaaga agtcattacc tgaaattgaa 1380 gatattattt catcattttt aatgagtaaa ctcagtcgag aaaaatggcc ggattggttc 1440 tatgttactg atgaatgctt tccgaaaagc cataatgata agatattgaa atcagagtta 1500 attaaatcaa tcgatcctaa gaaattattt acattgagga atcaataa 1548 <210> 52 <211> 951 <212> DNA <213> Streptomyces coelicolor <400> 52 atgctcgtac tcgtcgctcc cggccagggc gcccagacgc ccggcttcct gactgactgg 60 ctcgccctcc ccggtgccgc tgaccgcgtc gccgcgtggt cggacgccat cggactcgat 120 ctcgcccact tcggcaccaa ggccgacgcg gacgagatcc gagacacgtc cgtggcccag 180 ccgctgctgg tcgccgccgg aatcctgtcc gccgcggcac tcggtacgca gacatctgtc 240 gctgacgcga cgggccccgg gttcaccccc ggcgcggtcg ccggacacag cgtcggcgag 300 atcaccgccg ccgtcttcgc gggcgtcctc gacgacaccg ccgcgctgtc cctcgtacgc 360 cgtcgcggcc tggccatggc cgaggccgcg gcggtcaccg agaccggcat gtcggcgctg 420 ctcgggggcg accccgaggt gagcgtcgcg cacctggagc ggctcggcct gaccccggcg 480 aacgtgaacg gcgccggtca gatcgtggcg gcgggcacca tggagcagct ggccgcgctg 540 aacgaggaca agcccgaggg tgtgcgcaag gtcgtcccgc tgaaggtggc cggcgcgttc 600 cacacccgcc acatggcccc cgccgtggac aagctcgccg aggccgccaa ggcgctgacg 660 ccggccgacc cgaaggtgac gtacgtctcc aacaaggacg ggcgggccgt cgcctccggc 720 accgaggtgc tggaccggct ggtcggccag gtcgccaacc cggtgcgctg ggacctgtgc 780 atggagacgt tcaaggagct gggcgtcacc gcgatcatcg aggtgtgtcc gggcggcacg 840 ctgaccgggc tggccaagcg ggcgctgccc ggagtgaaga cgctggccct gaagaccccc 900 gacgacctcg acgcggcccg tgagctcgtc gccgagcaca cccaggccta a 951 <210> 53 <211> 1146 <212> DNA <213> Streptomyces coelicolor <400> 53 atgagcgagg acacgatgac ccaggagcgg ccgtccctga cggcacacgc ccgccggatc 60 gccgaactcg ccgggaagcg ggcggccgac gccgaacagc agcgccggct gagccccgac 120 gtcgtcgacg cggtccttcg agccggtttc gccgcccact tcgtaccggt ggcgcacggc 180 ggccgggccg cgacgttcgg ggagctggtg gagcccgtcg cggtgctcgg cgaggcctgt 240 gcctcgaccg cctggtacgc ctcgctcacg gcgagcctcg gccggatggc cgcctacctg 300 ccggacgagg gccaggccga gctgtggtcc gacggccccg acgccctgat cgtcggtgcc 360 ctgatgccgc tgggccgggc cgagaagacc ccgggcggct ggcacgtgtc gggcacctgg 420 ccgttcgtca gcgtcgtgga tcactccgac tgggcgctga tctgcgccaa ggtcggcgag 480 gagccgtggt tcttcgcggt gccgcgacag gagtacggga tcgtcgacag ctggtacccg 540 atgggtatgc gcggaacggg cagcaacacg ctcgtcctcg acggggtgtt cgtgccggat 600 gcgcgggcct gcacccgtgc ggccatcgcg gcaggtctcg gtccggatgc cgaggcgatc 660 tgtcacaccg tgcccatgag ggcggtcaac gggctggcct tcgcactgcc gatgctcggc 720 gcggcccgcg gggccgcggc cgtgtggacc tcgtggaccg ccggaagact ggccgggccg 780 accgggcaga acgccgtctc gtcccaggac cgcgtggtgt acgagcacac gctggcccgg 840 gccacgggtg agatcgacgc ggcccagctg ctgttggagc gggtcgcggc ggtcgccgac 900 gccggctcgg cgaccggcgt actggtcggc cgcggggcgc gggactgcgc cctggcggcg 960 gagctgctga ccgccgcgac cgaccggctg ttcgcctcgg cgggcacccg ggcacaggcc 1020 caggacagcc cgatgcagcg cctgtggcgc gatgtgcacg cggcgggcag ccatatcggg 1080 ctgcagttcg ggcccggggc ggcgctgtac gccggagagc tgttgaggag gagcaacgat 1140 ggctga 1146 <210> 54 <211> 534 <212> DNA <213> Streptomyces coelicolor <400> 54 atggcagccg accagggaat gctccgggac gccatggccc gggtgccggc cggggtggcg 60 ctcgtcaccg cccatgaccg cgggggagtc ccgcacggtt tcaccgccag ttcgttcgtg 120 tccgtctcga tggagccgcc actggcactg gtctgcctgg ctcgtacggc caactccttc 180 ccggtgttcg acagttgcgg cgagttcgcg gtgagcgtgc tgcgcgagga ccacacggac 240 ctggccatgc gcttcgcgcg caagtccgcg gacaagttcg cgggcgggga gttcgtccgt 300 accgcgcggg gagcgaccgt gctcgacgga gcggtcgcgg tcgtcgagtg cacggtccac 360 gagcgctacc cggcgggcga ccacatcatc ctgctcggcg aggtccagtc cgtgcacgtc 420 gaggagaagg gcgtaccggc ggtctacgtg gaccgccggt tcgccgccct gtgctcggcg 480 gcgggtgcct gcccgtccgc caccgggcgg ggcgtgcccg cgcatgccgg ctaa 534 <210> 55 <211> 1194 <212> DNA <213> Pseudomonas fluorescens <400> 55 atgaaaacgc taaaaaccca agtcgccatt attggcgccg gtccctccgg attgctgctc 60 ggccagttac tgcacaacgc gggtatccag accctgattc tagagcgcca gagcgccgac 120 tacgtgcaag gccgcatccg tgccggggtg ctggagcaag gcatggtcga cctgctgcgc 180 gaagcgggcg tcagccgacg catggacgcc gagggccttg tgcatgacgg tttcgaattg 240 gcactcaatg gcgaactcac ccacatcgac ctcaaggcgc tcaccggcgg ccagtcggtg 300 atgatctacg gccagaccga agtcacccgt gacttgatgg ccgcccgcga agcggcgggt 360 ggcatcactc tatacgaaac gcagaacgtg cagcctcatg gtcacaaaac tgatcgaccc 420 tggctgacct tcgagcacca gggtgaagct tttcgcctgg agtgcgacta catcgcgggc 480 tgtgatggtt ttcacggtgt ggcgcggcag tcgattccgg cgcagtcgtt gaaggtcttc 540 gagcgcgtct atcccttcgg ttggctgggc gtcctcgccg acacaccgcc ggtgcatgac 600 gaactggtgt acgccaaaca tgcgcgtggc tttgccctgt gcagcatgcg ctcgccgacc 660 cgcagccgct attacctgca agtgccggtt gaagaagcgc tggatgaatg gtcggatcag 720 cgcttctggg atgagctgaa aacccgtttg cccagtgcac tggcggccca actggtcacc 780 gggccatcca tcgagaagag catcgcgccg ctgcgcagct ttgtggtcga gccgatgcaa 840 tacgggcgcc tgttcctgct gggggacgcc gcgcatatcg tgccgcccac cggggccaag 900 ggcttgaacc tggcggccag cgacgtgagt acgctgtttc ggatcttgct caaggtctat 960 cgcgaggggc gggtggacct gctggaacag tactcagcga tctgcttgcg ccgcgtatgg 1020 aaagccgaac ggttttcctg gtggatgact tcgatgttgc accagtttcc ggaggccgac 1080 gggttcagcc agcgcattgc cgagagcgag cttgcgtatt tcatcagctc cgaggcgggc 1140 cgcaaaacca tcgcagaaaa ttacgtcggg cttccttacg aagctatcga ataa 1194 <210> 56 <211> 1611 <212> DNA <213> Artificial Sequence <220> <223> dnrF P217K from Streptomyces peucetius <400> 56 gtggccttga cgaagccgga tgtcgatgtc ctcgtggtgg gcggcggtct cggggggctg 60 tccaccgccc tgttcctcgc ccgccggggg gcgcgggtcc tgctggtgga gcggcatgcc 120 agcacctcgg tcctgcccaa ggcggcaggc cagaacccgc gcaccatgga actgttccgc 180 ttcggcggcg tggccgacga gatcctggcc acggacgaca tccgcggcgc ccagggcgac 240 ttcaccatca aggtcgtgga gcgcgtgggc ggtcgcgtcc tgcacagctt cgcggagagc 300 ttcgaggaac tggtcggtgc gacggaacag tgcacgccca tgccctgggc gctcgctccc 360 caggaccggg tggagcccgt cctggtggcc cacgccgcca agcacggcgc ggagatccgg 420 ttcgccaccg aactgacctc cttccaggcg ggcgacgacg gtgtcacggc ccgcctgcgc 480 gacctgggca cgggagcgga gagcaccgtg agcgcccgct acctggtcgc cgccgacgga 540 ccccgcagcg cgatccggga gagcctgggc atcacccggc acggtcacgg caccctggcc 600 cacttcatgg gcgtcatctt cgaggccgac ctcaccgccg tcgtaccgaa ggggtccacc 660 ggctggtact acctgcagca cccggacttc accggcacgt tcggccccac cgaccggccc 720 aaccggcaca ccttctacgt ccgctacgac cccgaacgcg gcgagaggcc ggaggactac 780 acaccgcagc gctgcaccga gctgatccgg ctggctgtcg acgcgcccgg gctcgtcccg 840 gacatcctcg acatccaggc ctgggacatg gcggcgtaca tcgccgaccg gtggcgcgaa 900 gggccggtgc tgctggtcgg cgatgccgcc aaggtcaccc cgcccaccgg gggcatgggc 960 ggcaacaccg ccatcggcga cgggttcgac gtggcctgga agctggccgc cgtgctgcgc 1020 ggcgaggcgg gcgagcggct cctcgacagc tacggggcgg agcggtcgct cgtgtcccgc 1080 ctcgtcgtcg acgagtcact cgccatctac gcccagcgca tggctcccca cctgctcggc 1140 agcgttcccg aggaacgcgg tacggcgcag gtcgtcctgg gcttccgcta ccgctccacc 1200 gccgtcgccg ccgaggacga cgaccccgag ccgaccgagg atccgcgacg cccgtccggg 1260 cgccccggct tccgcgcacc ccacgtctgg atcgaacagg acggcacacg gcgttccacc 1320 gtcgagttgt tcggcgactg ctgggtgctc ctggccgcac cggagggcgg cgcctggggc 1380 caggcggccg cccgcgccgc cgcggatctg ggcgtccgcc tcgacgtcca tctcgtcggc 1440 cgcgatgtcg ccgccccctc cggcgaactg acgcggacct acgggatcgg ccgggcgggg 1500 gccagcttgg tgcgcccgga cggcgtggtc gcctggcgta cggcagtagc gccgggagcg 1560 gaggcccagg accagctgag caccctgctc acccggctgc tggcccgctg a 1611 <210> 57 <211> 1434 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F from Gentiana triflora <400> 57 atggggagtt tgactaacaa cgataatctt catatttttc ttgtgtgctt catcggccag 60 ggcgtggtca atcccatgtt acgtttgggg aaggcgttcg cctccaaagg gttacttgtc 120 actttaagcg caccggaaat cgttggaact gagatccgta aggcgaataa ccttaatgat 180 gaccaaccaa tcaaggtggg ttccgggatg attcgtttcg aatttttcga cgatggatgg 240 gaatccgtaa acggtagcaa accgtttgac gtatggcaat acatcaatca cttagaccag 300 acaggccgtc aaaaacttcc gattatgtta aagaaacatg aggagacagg gactcctgta 360 tcttgcttga tcctgaatcc cttagtccct tgggtcgcgg acgtagccga ttcacttcag 420 atcccctgcg ctaccttgtg ggtccaatct tgtgcaagtt tttcagcata ttaccactac 480 caccacgggt tagtgccttt cccaaccgaa tcagagcccg agatcgacgt acaacttcct 540 gggatgccac ttttgaaata tgatgaagtg cccgacttcc tgcatccgcg cacaccctac 600 cccttttttg gcacgaacat tttaggtcaa ttcaagaatt tatccaagaa cttctgtatc 660 ctgatggata ccttctacga gttggaacac gagatcatcg ataatatgtg taaattgtgt 720 ccgattaagc caattggccc gttgtttaag attccgaaag acccaagctc caacggaatc 780 acgggtaatt tcatgaaagt ggatgactgc aaggagtggc tggacagccg tccaacatca 840 actgtggttt acgttagtgt cgggtctgtt gtatatttga agcaggagca ggttacagaa 900 atggcatacg gcattttaaa ttcggaagtt tcgtttttgt gggtgctgcg cccgccgagc 960 aaacgcatcg gtacggaacc gcatgtactg cccgaggagt tctgggagaa ggccggagat 1020 cgtggcaagg tggtgcaatg gtcaccccag gagcaggtgc ttgctcaccc cgccactgtc 1080 ggttttttaa cacactgtgg atggaatagc actcaagagg cgatttcgag cggagtgccc 1140 gtcatcactt tcccacaatt tggggaccaa gtgaccaatg ctaagttcct tgtggaggaa 1200 tttaaggtcg gggtccgttt aggccgcgga gagttagaaa atcgcatcat cacacgcgac 1260 gaagtagaac gcgctttacg cgagattact tcaggcccca aggctgaaga ggtaaaagag 1320 aacgccttaa aatggaagaa gaaggcagaa gagacagtag ctaaaggcgg ctactccgaa 1380 cgtaatcttg taggcttcat tgaagaggtg gctcgtaaga ctggtacaaa gtaa 1434 <210> 58 <211> 1176 <212> DNA <213> Unknown <220> <223> Rheum palmatum <400> 58 atggcagatg tcctgcagga gatccgcaac tcgcagaagg cgagcgggcc cgccacggtg 60 ctcgccatcg gcactgccca tccaccgacg tgctaccctc aggccgacta ccccgacttc 120 tacttccgag tttgcaagag cgagcacatg accaaactca agaagaaaat gcaattcatt 180 tgtgacagat cggggataag gcagcggttt atgttccaca cggaagagaa cctggggaag 240 aacccgggga tgtgcacatt cgacgggcca tcgctgaacg cgcggcagga catgctgatc 300 atggaagtgc cgaagctggg ggcggaggcg gcggagaagg cgatcaagga gtgggggcag 360 gacaagtccc ggatcaccca cctcatcttc tgcaccacca cgagcaacga catgcccggg 420 gcggactacc agttcgccac cctgttcggg ctgaaccccg gcgtgagccg caccatggtc 480 taccagcagg gctgcttcgc cgggggcacc gtgctgcgcc tggtcaagga catcgcggag 540 aacaacaagg gggcgcgcgt gctggtggtg tgctcggaga tcgtggcctt cgccttccgc 600 gggccccacg aggaccacat cgactccctc atcgggcagc tcctgttcgg ggacggggcc 660 gccgccctcg tggtcgggac agacatcgac gagagcgtcg agaggcccat cttccagatc 720 atgtcggcga cccaggcgac catccccaac tcgctgcaca ccatggctct ccatctgacg 780 gaggcggggc tgaccttcca tctcagcaag gaggtgccca aggtggtgag cgacaacatg 840 gaggagctca tgctcgaggc cttcaagccg ctcgggataa ccgattggaa ctccatattc 900 tggcaagtgc atcccggggg tagagccatc cttgacaaga tcgaggagaa gctggagctc 960 accaaggata agatgcggga ttcccgctac atcttgagcg agtacgggaa tctcaccagc 1020 gcctgtgtgc tctttgtcat ggacgagatg aggaagaggt ccttccggga agggaagcag 1080 accaccggag acggctacga gtggggtgtc gccatcggat tggggcccgg tcttaccgtc 1140 gagaccgttg tcttgcgtag cgtccccatt ccctaa 1176 <210> 59 <211> 1776 <212> DNA <213> Unknown <220> <223> Corynebacterium glutamicum <400> 59 gtgtcagtcg agactaggaa gatcaccaag gttcttgtcg ctaaccgtgg tgagattgca 60 atccgcgtgt tccgtgcagc tcgagatgaa ggcatcggat ctgtcgccgt ctacgcagag 120 ccagatgcag atgcaccatt cgtgtcatat gcagacgagg cttttgccct cggtggccaa 180 acatccgctg agtcctacct tgtcattgac aagatcatcg atgcggcccg caagtccggc 240 gccgacgcca tccaccccgg ctacggcttc ctcgcagaaa acgctgactt cgcagaagca 300 gtcatcaacg aaggcctgat ctggattgga ccttcacctg agtccatccg ctccctcggc 360 gacaaggtca ccgctcgcca catcgcagat accgccaagg ctccaatggc tcctggcacc 420 aaggaaccag taaaagacgc agcagaagtt gtggctttcg ctgaagaatt cggtctccca 480 atcgccatca aggcagcttt cggtggcggc ggacgtggca tgaaggttgc ctacaagatg 540 gaagaagtcg ctgacctctt cgagtccgca acccgtgaag caaccgcagc gttcggccgc 600 ggcgagtgct tcgtggagcg ctacctggac aaggcacgcc acgttgaggc tcaggtcatc 660 gccgataagc acggcaacgt tgttgtcgcc ggaacccgtg actgctccct gcagcgccgt 720 ttccagaagc tcgtcgaaga agcaccagca ccattcctca ccgatgacca gcgcgagcgt 780 ctccactcct ccgcgaaggc tatctgtaag gaagctggct actacggtgc aggcaccgtt 840 gagtacctcg ttggctccga cggcctgatc tccttcctcg aggtcaacac ccgcctccag 900 gtggaacacc cagtcaccga agagaccacc ggcatcgacc tggtccgcga aatgttccgc 960 atcgcagaag gccacgagct ctccatcaag gaagatccag ctccacgcgg ccacgcattc 1020 gagttccgca tcaacggcga agacgctggc tccaacttca tgcctgcacc aggcaagatc 1080 accagctacc gcgagccaca gggcccaggc gtccgcatgg actccggtgt cgttgaaggt 1140 tccgaaatct ccggacagtt cgactccatg ctggcaaagc tgatcgtttg gggcgacacc 1200 cgcgagcagg ctctccagcg ctcccgccgt gcacttgcag agtacgttgt cgagggcatg 1260 ccaaccgtta tcccattcca ccagcacatc gtggaaaacc cagcattcgt gggcaacgac 1320 gaaggcttcg agatctacac caagtggatc gaagaggttt gggataaccc aatcgcacct 1380 tacgttgacg cttccgagct cgacgaagat gaggacaaga ccccagcaca gaaggttgtt 1440 gtggagatca acggccgtcg cgttgaggtt gcactcccag gcgatctggc actcggtggc 1500 accgctggtc ctaagaagaa ggccaagaag cgtcgcgcag gtggtgcaaa ggctggcgta 1560 tccggcgatg cagtggcagc tccaatgcag ggcactgtca tcaaggtcaa cgtcgaagaa 1620 ggcgctgaag tcaacgaagg cgacaccgtt gttgtcctcg aggctatgaa gatggaaaac 1680 cctgtgaagg ctcataagtc cggaaccgta accggcctta ctgtcgctgc aggcgagggt 1740 gtcaacaagg gcgttgttct cctcgagatc aagtaa 1776 <210> 60 <211> 1321 <212> DNA <213> Corynebacterium glutamicum <400> 60 atgcgtcatg tagagcatac agtcaccgtt gcggccccag cagacttggt ttgggaggta 60 cttgccgatg tcttaggcta tgctgacatc ttcccaccga cggaaaaagt tgaaattctt 120 gaggaggggc aaggatacca ggtagtgcgc cttcacgtcg atgttgcggg tgagattaat 180 acatggacca gtcgtcgcga tttagaccct gcgcgccgcg taattgctta ccgccaactt 240 gagacggctc cgatcgtggg ccacatgagc ggggaatggc gtgctttcac actggatgcc 300 gaacgtaccc aattagtcct gactcacgat ttcgtaaccc gtgcagccgg ggatgacggt 360 ttagtcgccg gaaaattgac cccagatgag gcgcgcgaaa tgttagaagc ggtggtagaa 420 cgtaactctg tcgccgactt aaacgcggtc cttggagaag ctgagcgtcg cgtccgcgca 480 gccggtggag ttggtaccgt aactgcgtaa taataatttt gtttaacttt aagaaggaga 540 tatatccatg tcagggcgca aaaccttttt agacttaagt tttgctaccc gcgacacacc 600 gtcggaggcg actccggtgg tggtagattt gctggaccac gtaactggag ccaccgtatt 660 aggattatca cctgaggatt tccccgatgg tatggctatt tccaatgaga ccgttacgtt 720 gacgacccac actggcacgc acatggatgc gccactgcac tatggtccct taagtggggg 780 agttccggca aagtcgattg accaagtgcc cttggaatgg tgctatggac ctggagttcg 840 tttggatgtt cgccacgtgc cggcaggaga tggtattact gtcgatcatt tgaacgccgc 900 gttggatgca gcagagcacg atttggcccc cggtgacatt gtgatgctgt ggaccggcgc 960 ggacgctctg tggggaaccc gcgaatactt gagcacgttt ccggggttaa ctgggaaggg 1020 gacacaattt ttggtcgagg cgggtgttaa agtcattggc attgatgcat ggggactgga 1080 tcgcccgatg gcagctatga tcgaagaata ccgtcgtacg ggcgataaag gagcattatg 1140 gccggctcac gtctatggac gcacacgcga atacctgcaa ttagagaagc ttaataattt 1200 gggcgcttta ccaggagcta cagggtatga catttcatgc tttccggttg cggttgcagg 1260 cactggagct gggtggactc gtgtggtcgc cgttttcgag caagaggaag aggattaata 1320 a 1321 <210> 61 <211> 477 <212> PRT <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F (GtUF6CGT1V93Q/Y193F) variant <400> 61 Met Gly Ser Leu Thr Asn Asn Asp Asn Leu His Ile Phe Leu Val Cys 1 5 10 15 Phe Ile Gly Gln Gly Val Val Asn Pro Met Leu Arg Leu Gly Lys Ala 20 25 30 Phe Ala Ser Lys Gly Leu Leu Val Thr Leu Ser Ala Pro Glu Ile Val 35 40 45 Gly Thr Glu Ile Arg Lys Ala Asn Asn Leu Asn Asp Asp Gln Pro Ile 50 55 60 Lys Val Gly Ser Gly Met Ile Arg Phe Glu Phe Phe Asp Asp Gly Trp 65 70 75 80 Glu Ser Val Asn Gly Ser Lys Pro Phe Asp Val Trp Gln Tyr Ile Asn 85 90 95 His Leu Asp Gln Thr Gly Arg Gln Lys Leu Pro Ile Met Leu Lys Lys 100 105 110 His Glu Glu Thr Gly Thr Pro Val Ser Cys Leu Ile Leu Asn Pro Leu 115 120 125 Val Pro Trp Val Ala Asp Val Ala Asp Ser Leu Gln Ile Pro Cys Ala 130 135 140 Thr Leu Trp Val Gln Ser Cys Ala Ser Phe Ser Ala Tyr Tyr His Tyr 145 150 155 160 His His Gly Leu Val Pro Phe Pro Thr Glu Ser Glu Pro Glu Ile Asp 165 170 175 Val Gln Leu Pro Gly Met Pro Leu Leu Lys Tyr Asp Glu Val Pro Asp 180 185 190 Phe Leu His Pro Arg Thr Pro Tyr Pro Phe Phe Gly Thr Asn Ile Leu 195 200 205 Gly Gln Phe Lys Asn Leu Ser Lys Asn Phe Cys Ile Leu Met Asp Thr 210 215 220 Phe Tyr Glu Leu Glu His Glu Ile Ile Asp Asn Met Cys Lys Leu Cys 225 230 235 240 Pro Ile Lys Pro Ile Gly Pro Leu Phe Lys Ile Pro Lys Asp Pro Ser 245 250 255 Ser Asn Gly Ile Thr Gly Asn Phe Met Lys Val Asp Asp Cys Lys Glu 260 265 270 Trp Leu Asp Ser Arg Pro Thr Ser Thr Val Val Tyr Val Ser Val Gly 275 280 285 Ser Val Val Tyr Leu Lys Gln Glu Gln Val Thr Glu Met Ala Tyr Gly 290 295 300 Ile Leu Asn Ser Glu Val Ser Phe Leu Trp Val Leu Arg Pro Pro Ser 305 310 315 320 Lys Arg Ile Gly Thr Glu Pro His Val Leu Pro Glu Glu Phe Trp Glu 325 330 335 Lys Ala Gly Asp Arg Gly Lys Val Val Gln Trp Ser Pro Gln Glu Gln 340 345 350 Val Leu Ala His Pro Ala Thr Val Gly Phe Leu Thr His Cys Gly Trp 355 360 365 Asn Ser Thr Gln Glu Ala Ile Ser Ser Gly Val Pro Val Ile Thr Phe 370 375 380 Pro Gln Phe Gly Asp Gln Val Thr Asn Ala Lys Phe Leu Val Glu Glu 385 390 395 400 Phe Lys Val Gly Val Arg Leu Gly Arg Gly Glu Leu Glu Asn Arg Ile 405 410 415 Ile Thr Arg Asp Glu Val Glu Arg Ala Leu Arg Glu Ile Thr Ser Gly 420 425 430 Pro Lys Ala Glu Glu Val Lys Glu Asn Ala Leu Lys Trp Lys Lys Lys 435 440 445 Ala Glu Glu Thr Val Ala Lys Gly Gly Tyr Ser Glu Arg Asn Leu Val 450 455 460 Gly Phe Ile Glu Glu Val Ala Arg Lys Thr Gly Thr Lys 465 470 475 <210> 62 <211> 1321 <212> DNA <213> Artificial Sequence <220> <223> zhuIJ - Codon optimization for E. coli <400> 62 atgcgtcatg tagagcatac agtcaccgtt gcggccccag cagacttggt ttgggaggta 60 cttgccgatg tcttaggcta tgctgacatc ttcccaccga cggaaaaagt tgaaattctt 120 gaggaggggc aaggatacca ggtagtgcgc cttcacgtcg atgttgcggg tgagattaat 180 acatggacca gtcgtcgcga tttagaccct gcgcgccgcg taattgctta ccgccaactt 240 gagacggctc cgatcgtggg ccacatgagc ggggaatggc gtgctttcac actggatgcc 300 gaacgtaccc aattagtcct gactcacgat ttcgtaaccc gtgcagccgg ggatgacggt 360 ttagtcgccg gaaaattgac cccagatgag gcgcgcgaaa tgttagaagc ggtggtagaa 420 cgtaactctg tcgccgactt aaacgcggtc cttggagaag ctgagcgtcg cgtccgcgca 480 gccggtggag ttggtaccgt aactgcgtaa taataatttt gtttaacttt aagaaggaga 540 tatatccatg tcagggcgca aaaccttttt agacttaagt tttgctaccc gcgacacacc 600 gtcggaggcg actccggtgg tggtagattt gctggaccac gtaactggag ccaccgtatt 660 aggattatca cctgaggatt tccccgatgg tatggctatt tccaatgaga ccgttacgtt 720 gacgacccac actggcacgc acatggatgc gccactgcac tatggtccct taagtggggg 780 agttccggca aagtcgattg accaagtgcc cttggaatgg tgctatggac ctggagttcg 840 tttggatgtt cgccacgtgc cggcaggaga tggtattact gtcgatcatt tgaacgccgc 900 gttggatgca gcagagcacg atttggcccc cggtgacatt gtgatgctgt ggaccggcgc 960 ggacgctctg tggggaaccc gcgaatactt gagcacgttt ccggggttaa ctgggaaggg 1020 gacacaattt ttggtcgagg cgggtgttaa agtcattggc attgatgcat ggggactgga 1080 tcgcccgatg gcagctatga tcgaagaata ccgtcgtacg ggcgataaag gagcattatg 1140 gccggctcac gtctatggac gcacacgcga atacctgcaa ttagagaagc ttaataattt 1200 gggcgcttta ccaggagcta cagggtatga catttcatgc tttccggttg cggttgcagg 1260 cactggagct gggtggactc gtgtggtcgc cgttttcgag caagaggaag aggattaata 1320 a 1321 <210> 63 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_I18P_F <400> 63 tgtgcttccc aggccagggc gtggtcaat 29 <210> 64 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_I18P_R <400> 64 cgccctggcc tgggaagcac acaagaaaaa t 31 <210> 65 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_Q20M_F <400> 65 ttcatcggca tgggcgtggt caatcccat 29 <210> 66 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_Q20M_R <400> 66 tgaccacgcc catgccgatg aagcacacaa g 31 <210> 67 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_T50K_F <400> 67 aatcgttgga aaggagatcc gtaaggcgaa 30 <210> 68 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_T50K_R <400> 68 tacggatctc ctttccaacg atttccggtg 30 <210> 69 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_T50N_F <400> 69 aatcgttgga aatgagatcc gtaaggcgaa 30 <210> 70 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_T50Q_F <400> 70 tacggatctc atttccaacg atttccggtg 30 <210> 71 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_T50Q_R <400> 71 aatcgttgga caggagatcc gtaaggcgaa 30 <210> 72 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_T50R_F <400> 72 tacggatctc ctgtccaacg atttccggtg 30 <210> 73 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_T50R_R <400> 73 aatcgttgga cgtgagatcc gtaaggcgaa 30 <210> 74 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_T50V_F <400> 74 tacggatctc acgtccaacg atttccggtg 30 <210> 75 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_T50V_R <400> 75 aatcgttgga gttgagatcc gtaaggcgaa 30 <210> 76 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_T50V_R <400> 76 tacggatctc aactccaacg atttccggtg 30 <210> 77 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_I95L_F <400> 77 gtatggcaat acctcaatca cttagaccag acag 34 <210> 78 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_I95L_R <400> 78 ggtctaagtg attgaggtat tgccatacgt caaacg 36 <210> 79 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_I95M_F <400> 79 gtatggcaat acatgaatca cttagaccag acag 34 <210> 80 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_I95M_R <400> 80 ggtctaagtg attcatgtat tgccatacgt caaacg 36 <210> 81 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_I95T_F <400> 81 gtatggcaat acactaatca cttagaccag acag 34 <210> 82 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_I95T_R <400> 82 ggtctaagtg attagtgtat tgccatacgt caaacg 36 <210> 83 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_V290A_F <400> 83 gtgtcgggtc tgctgtatat ttgaagcagg ag 32 <210> 84 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_V290A_R <400> 84 gcttcaaata tacagcagac ccgacactaa cg 32 <210> 85 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_V290G_F <400> 85 gtgtcgggtc tggtgtatat ttgaagcagg ag 32 <210> 86 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_V290G_R <400> 86 gcttcaaata tacaccagac ccgacactaa cg 32 <210> 87 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_I323A_F <400> 87 agcaaacgcg ccggtacgga accgcatgt 29 <210> 88 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_I323A_R <400> 88 gttccgtacc ggcgcgtttg ctcgg 25 <210> 89 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_I323S_F <400> 89 agcaaacgca gcggtacgga accgcatgt 29 <210> 90 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> GtCGT V93Q/Y193F_I323S_R <400> 90 gttccgtacc gctgcgtttg ctcgg 25 <210> 91 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> V22A-f <400> 91 cggccagggc gcggtcaatc ccatgttacg 30 <210> 92 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> V22A-R <400> 92 tgggattgac cgcgccctgg ccgatgaagc 30 <210> 93 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> L29A-F <400> 93 catgttacgt gcggggaagg cgttcgcctc 30 <210> 94 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> L29A-R <400> 94 cgccttcccc gcacgtaaca tgggattgac 30 <210> 95 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> E46G-f <400> 95 agcgcaccgg gcatcgttgg aactgagatc 30 <210> 96 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> E46G-R <400> 96 tccaacgatg cccggtgcgc ttaaagtgac 30 <210> 97 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> V48G-f <400> 97 ccggaaatcg gtggaactga gatccgtaag 30 <210> 98 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> V48G-R <400> 98 ctcagttcca ccgatttccg gtgcgcttaa 30 <210> 99 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> E51C-f <400> 99 cgttggaact tgcatccgta aggcgaataa c 31 <210> 100 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> E51C-R <400> 100 ccttacggat gcaagttcca acgatttccg g 31 <210> 101 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> A55S-f <400> 101 gatccgtaag tcgaataacc ttaatgatga ccaac 35 <210> 102 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> A55S-r <400> 102 aaggttattc gacttacgga tctcagttcc 30 <210> 103 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> S86V-F <400> 103 cgtaaacggt gtcaaaccgt ttgacgtatg g 31 <210> 104 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> S86V-r <400> 104 caaacggttt gacaccgttt acggattccc a 31 <210> 105 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> D99G-F <400> 105 caatcactta ggccagacag gccgtcaaaa ac 32 <210> 106 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> D99G-r <400> 106 ggcctgtctg gcctaagtga ttgatgtatt gc 32 <210> 107 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> R103V-F <400> 107 ccagacaggc gttcaaaaac ttccgattat g 31 <210> 108 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> R103V-R <400> 108 ggaagttttt gaacgcctgt ctggtctaag tg 32 <210> 109 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> C151G-F <400> 109 ggtccaatct ggtgcaagtt tttcagcata t 31 <210> 110 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> C151G-r <400> 110 gaaaaacttg caccagattg gacccacaag g 31 <210> 111 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> L184G-F <400> 111 ctgggatgcc aggtttgaaa tatgatgaag tg 32 <210> 112 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> L184G-r <400> 112 catatttcaa acctggcatc ccaggaagtt g 31 <210> 113 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> L194A-F <400> 113 cccgacttcg cgcatccgcg cacaccctac 30 <210> 114 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> L194A-r <400> 114 gtgcgcggat gcgcgaagtc gggcacttca tc 32 <210> 115 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> E332P-F <400> 115 tgtactgccc ccggagttct gggagaaggc c 31 <210> 116 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> E332P-r <400> 116 cccagaactc cgggggcagt acatgcggtt c 31 <210> 117 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> I18A-F <400> 117 tgtgtgcttc gccggccagg gcgtggtcaa t 31 <210> 118 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> I18A-r <400> 118 cgccctggcc ggcgaagcac acaagaaaaa t 31 <210> 119 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> P385A-F <400> 119 catcactttc gcacaatttg gggaccaagt g 31 <210> 120 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> P385A-r <400> 120 ccccaaattg tgcgaaagtg atgacgggca c 31 <210> 121 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> GtCGT_N_His_IV_F <400> 121 caccatcacc atcaccatgg gagtttgact aacaacgata atc 43 <210> 122 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> GtCGT_N_His_IV_R <400> 122 catatgtata tctccttctt atac 24

Claims

서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서 F17, V93, V132, Y193, L164 및 R322로 구성된 군에서 선택되는 어느 하나 이상의 아미노산에 변이를 포함하는 C-글리코실전이효소 (C-glycosyltransferase) 변이체.
제1항에 있어서, 상기 변이체는 서열번호 1로 표시되는 C-글리코실 전이효소에서, 다음으로 구성된 군에서 선택되는 어느 하나 이상의 아미노산에 변이를 추가로 포함하는 C-글리코실전이효소 변이체:
F17, V405, P107, L208, L164, P45, I305, L316, F401, Y94, N57, Y187, C16, P319, F167, V132, N206, R406, Q386, V129, L125, L194, I95, S215, L184, Y158, L29, L27, F202, H159, S370, H365, V329, M301, V315, V190, C366, W80, L58, Q210, F312, D61, I207, L363, P196, L106, V93, A394, W314, S155, P88, D99, Y284, E189, G49, H328, E399, T392, F387, A44, P199, E46, R28, V285, I124, R419, L306, Y157, Y200, E373, P191, L214, S376, V15, E332, E51, I417, L98, I323, H161, T383, P127, E309, N84, L313, Q104, T371, N213, G79, L330, N307, K105, L128, A152, I18, N59, W147, S86, L293, E296, S377, L185, K216, F89, S286, F396, F211, Y303, D223, R415, N96, V22, S153, F154, D192, Y193, H195, P201, Y292, 및 R322.
제1항에 있어서, 상기 아미노산 변이는 V93 및 Y193 아미노산에 변이를 포함하는 것을 특징으로 하는, C-글리코실전이효소 (C-glycosyltransferase) 변이체.
제1항에 있어서, F17G, V93Q, V132A, Y193F, L164G 및 R322D로 구성된 군에서 선택되는 어느 하나 이상의 아미노산 치환을 포함하는 것을 특징으로 하는 C-글리코실전이효소 (C-glycosyltransferase) 변이체.
제3항에 있어서, V93Q 및 Y193F 아미노산 치환을 포함하는 것을 특징으로 하는 C-글리코실전이효소 (C-glycosyltransferase) 변이체.
제2항에 있어서, 다음으로 구성된 군에서 선택되는 어느 하나 이상의 아미노산 치환을 추가로 포함하는 것을 특징으로 하는 C-글리코실 전이효소 변이체:
F17G, V405M, P107G, L208G, L164G, P45G, I305A, L316G, F401H, Y94G, N57G, Y187A, C16G, P319G, F167G, V132A, N206E, R406G, Q386H, V129A, L125V, L194A, I95G, S215D, L184G, Y158T, L29A, L27A, F202S, H159G, S370A, H365G, V329T, M301W, V315A, V190A, C366G, W80Y, L58E, Q210G, F312G, D61G, I207P, L363G, P196G, L106G, V93G, A394G, W314C, S155A, P88D, D99G, Y284H, E189A, G49TH328G, E399D, T392A, F387T, A44G, P199E, E46G, R28G, V285I, I124T, R419A, L306M, Y157T, Y200L, E373A, P201G, P191G, L214A, S376G, V15G, E332P, E51C, I417L, L98G, I323A, H161G, T383C, P127A, E309N, N84S, L313T, Q104D, T371A, N213L, G79S, L330G, N307A, K105G, L128D, A152G, S153G, I18A, N59V, W147F, S86V, L293V, E296D, S377A, L185V, K216R, F89A, S286C, F396L, F211G, Y303A, D223G, R415L, N96A, V22H, V93Q, V93L, S153C, F154L, D192S, Y193F, H195Y, H195L, P201T, Y292H, Y292F, R322D 및 R322A.
제4항에 있어서, 다음으로 구성된 군에서 선택되는 어느 하나 이상의 아미노산 치환을 추가로 포함하는 것을 특징으로 하는 C-글리코실 전이효소 변이체:
I18P, Q20M, T50N, T50Q, T50K, T50R, T50V, I95M, I95T, V290G, V290A, I323S, I323A, I95L, V22A, L29A, E46G, V48G, E51C, A55S, S86V, D99G, R103V, C151G, L184G, L194A, E332P, I18A 및 P385A.
제7항에 있어서, 다음으로 구성된 군에서 선택되는 어느 하나 이상의 아미노산 치환을 추가로 포함하는 것을 특징으로 하는 C-글리코실 전이효소 변이체:
I323S, T50R, T50V, I18P, I95T, Q20M, I323A, P385A, L194A 및 V48G.
제1항 내지 제8항 중 어느 한 항의 변이체를 암호화하는 핵산.
제9항의 핵산이 도입된 재조합 미생물.
제10항에 있어서, 상기 재조합 미생물은 UTP-글루코오스-1-포스페이트 우리딜트렌스퍼라아제 (UTP-glucose-1-phosphate uridylyltransferase), 포스포글루코뮤타아제(phosphoglucomutase) 및/또는 뉴클레오시드-디포스페이트 키나제(nucleoside-diphosphate kinase)를 암호화하는 유전자의 발현이 강화되어 있는 것을 특징으로 하는 재조합 미생물.
제10항에 있어서, 상기 재조합 미생물은 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체 생산용인 것을 특징으로 하는 재조합 미생물.
제12항에 있어서, 상기 재조합 미생물은 폴리케타이드 합성효소 또는 페닐프로파노이드 합성효소가 추가로 도입된 것을 특징으로 하는 재조합 미생물.
제12항에 있어서, 상기 재조합 미생물은 pabA 유전자의 발현이 약화되어 있는 것을 특징으로 하는 재조합 미생물.
제12항에 있어서, 상기 폴리케타이드는
라파마이신(rapamycin), 로바스타틴(lovastatin), 에리트로마이신(erythromycin), 리파마이신(rifamycin), 아버멕틴(avermectin), 겔다나마이신(geldanamycin), 이버멕틴(ivermectin), 칼리케아마이신(calicheamicin), 에포타일론(epothilone), 트라이아세트산 락톤(triacetic acid lactone) 및 6-메틸살리실산(6-methylsalicylic acid)로 구성된 군에서 선택되는 타입 I 폴리케타이드;
액티로노딘(actinorhodin), 독소루비신(doxorubicin), 다우노루비신(daunorubicin), 옥시테트라사이클린(oxytetracycline), SEK4, SEK4b, SEK34, SEK15, SEK26, FK506, DMAC, 아클라비논(aklavinone), 아클라노닉산(aklanonic acid), 엡실론 로도마이시논(epsilon-rhodomycinone), 독시사이클린(doxycycline), 안트라마이신(anthramycin), 테트라세노마이신(tetracenomycin), 카르민산(Carmin acid) 및 프레놀리신(frenolicin)로 구성된 군에서 선택되는 타입 II 폴리케타이드; 및
알로에신(aloesin), 알로에닌(aloenin), 바바로인(barbaloin), 5,7-다이하이드록시-2-메틸크로몬(5,7-dihydroxy-2-methylchromone) 및 알로에손(aloesone)로 구성된 군에서 선택되는 타입 III 폴리케타이드;로 구성된 군에서 선택되고,
상기 페닐프로파노이드는 액티노마이신(actinomycin), 바키트라신(bacitracin), 답토마이신(daptomycin), 밴코마이신(vancomycin), 테익소박틴(teixobactin), 타이로시딘(tyrocidine), 그라미시딘(gramicidin), 즈위터미신 A(zwittermicin A), 블레오마이신(bleomycin), 시클로스포린(ciclosporin), 피오버딘(pyoverdine), 엔테로박틴(enterobactin), 믹소켈린 A(myxochelin A), 인디고이딘(indigoidine), 사이아노피신(cyanophycin) 등으로 구성된 비리보솜 펩티드, 피노켐브린(pinocembrin), 다이하이드로캄페롤(dihydrokaempferol), 에리오딕티올(eriodictyol), 다이하이드로쿼세틴(dihydroquercetin), 코리페릴알코올(coniferyl alcohol), 실리빈 (silybin), 아이소실리빈 (isosilybin), 실리크리스틴 (silychristin), 실리나이드(silinide), 2,3-디하이드로실리빈(2,3-dehydrosilybin), 실리다이아닌(silydianin), 다이드제인(daidzein), 게니스타인(genistein), 아피게닌(apigenin), 루테올린(luteolin), 캄페롤(kaempferol), 쿼세틴(quercetin), 카테킨(catechin), 페라고니딘(pelargonidin), 시아니딘(cyanidin), 압젤레친(afzelechin), 미리세틴(myricetin), 피세틴(fisetin), 갈랑긴(galangin), 헤스페레틴(hesperetin), 탄제리틴(tangeritin), 델피니딘(delphinidin), 에피카테킨(epicatechin), 크리신(chrysin), 레스베라트롤(resveratrol) 및 나린제닌(naringenin)으로 구성된 군에서 선택되는 것을 특징으로 하는 재조합 미생물.
제12항에 있어서,
(i) 타입 II 폴리케타이드 생합성 효소를 암호화하는 유전자;
(ii) 4'-포스포판테인닐 전이효소 (4'-phosphopantetheinyl transferase)를 암호화하는 유전자;
(iii) 사이클라아제(cyclase)를 암호화하는 유전자;
(iv) 아세틸-CoA 카르복실화 효소 (acetyl-CoA carboxylase)를 암호화하는 유전자; 및
(v) 아클라비네온 12-수산화효소 (aklavinone 12-hydroxylase)를 암호화하는 유전자;로 구성된 군에서 선택되는 어느 하나 이상의 유전자가 도입되고,
상기 폴리케타이드 배당체는 카르민산인 것을 특징으로 하는 재조합 미생물.
제16항에 있어서, 상기 타입 II 폴리케타이드 생합성 효소를 암호화하는 유전자는 antD (ketosynthase), antE (chain-length factor), antF (ACP), antB (phosphopantetheinyl transferase) 및 antG (malonyl-CoA:ACP malonyltransferase)로 구성된 군에서 선택되는 어느 하나 이상의 유전자 또는 이들의 조합인 것을 특징으로 하는 재조합 미생물.
제16항에 있어서, 상기 아클라비네온 12-수산화효소는 서열번호 2로 표시되는 아미노산 서열에서 217번째 아미노산이 프롤린에서 라이신으로의 변이(P217K)를 포함하는 것을 재조합 미생물.
제16항에 있어서,
상기 타입 II 폴리케타이드 생합성 효소는 P. luminescens 유래;
상기 4'-포스포판테인닐 전이효소는 Bacillus subtilis 또는 P. luminescens 유래;
상기 사이클라아제는 Streptomyces sp. 유래;
상기 아세틸-CoA 카르복실화 효소는 Corynebacterium glutamicum 유래; 및/또는
상기 아클라비네온 12-수산화효소는 Streptomyces peucetius 유래;인 것을 특징으로 하는 재조합 미생물.
제12항에 있어서,
(i) 알로에손 합성효소(aloesone synthase)를 암호화하는 유전자가 도입되어 있고,
상기 폴리케타이드 배당체는 알로에신인 것을 특징으로 하는 재조합 미생물.
제20항에 있어서,
상기 알로에손 합성효소는 R. palmatum 유래인 것을 특징으로 하는 재조합 미생물.
다음 단계를 포함하는 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 제조방법:
(a) 제10항의 재조합 미생물을 배양하여 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체를 생성시키는 단계; 및
(b) 상기 생성된 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체를 회수하는 단계.
제22항에 있어서, 상기 재조합 미생물은 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 전구체 생산능을 갖는 것을 특징으로 하는 제조방법.
제22항에 있어서, 상기 (a) 단계는 제10항의 재조합 미생물을 폴리케타이드 및/또는 페닐프로파노이드가 첨가된 배지에서 배양하는 것을 특징으로 하는 제조방법.
제22항에 있어서, 상기 폴리케타이드 배당체는 카르민산이고, 상기 (a)단계는 배양시 배양 배지에 아스코르빈산을 첨가하여 미생물을 배양하는 것을 특징으로 하는 제조방법.
다음 단계를 포함하는 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 제조방법:
(a) 제1항 내지 제8항 중 어느 한 항의 C-글리코실전이효소 변이체 또는 상기 C-글리코실전이효소 변이체를 발현하는 미생물과 폴리케타이드 및/또는 페닐프로파노이드를 반응시켜 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체를 생성시키는 단계; 및
(b) 상기 생성된 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체를 회수하는 단계.