KR20220109336A - C-글리코실전이효소 변이체 및 이의 용도 - Google Patents
C-글리코실전이효소 변이체 및 이의 용도 Download PDFInfo
- Publication number
- KR20220109336A KR20220109336A KR1020220011630A KR20220011630A KR20220109336A KR 20220109336 A KR20220109336 A KR 20220109336A KR 1020220011630 A KR1020220011630 A KR 1020220011630A KR 20220011630 A KR20220011630 A KR 20220011630A KR 20220109336 A KR20220109336 A KR 20220109336A
- Authority
- KR
- South Korea
- Prior art keywords
- polyketide
- glycosyltransferase
- recombinant microorganism
- present
- gtcgt
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
- C12N9/0073—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen 1.14.13
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/1029—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1288—Transferases for other substituted phosphate groups (2.7.8)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/04—Polysaccharides, i.e. compounds containing more than five saccharide radicals attached to each other by glycosidic bonds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2500/00—Specific components of cell culture medium
- C12N2500/30—Organic components
- C12N2500/38—Vitamins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/13—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen (1.14.13)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y203/00—Acyltransferases (2.3)
- C12Y203/01—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
- C12Y203/01039—[Acyl-carrier-protein] S-malonyltransferase (2.3.1.39)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
- C12Y204/01121—Indole-3-acetate beta-glucosyltransferase (2.4.1.121)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/08—Transferases for other substituted phosphate groups (2.7.8)
- C12Y207/08007—Holo-[acyl-carrier-protein] synthase (2.7.8.7)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y604/00—Ligases forming carbon-carbon bonds (6.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y604/00—Ligases forming carbon-carbon bonds (6.4)
- C12Y604/01—Ligases forming carbon-carbon bonds (6.4.1)
- C12Y604/01002—Acetyl-CoA carboxylase (6.4.1.2)
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은 신규한 C-글리코실전이효소 변이체 및 이의 용도에 관한 것으로, 본 발명에 따른 C-글리코실전이효소 변이체는 야생형 C-글리코실전이효소에 비해 글리코사이드 결합 형성능이 향상되어 있어, 폴리케타이드 군 및 유사 천연물, 특히 타입 I, II, III 폴리케타이드, 비리보솜 펩티드, 페닐프로파노이드 및 그 외 방향족 천연물의 배당체 생산 효과를 증진시킬 수 있는바, C-글리코사이드 화합물을 구성성분으로 하는 약물, 식품 첨가제, 영양 보조제 등의 제조에 유용하게 활용할 수 있을 것이다.
Description
본 발명은 신규한 C-글리코실전이효소 변이체 및 이의 용도에 관한 것으로, 더 상세하게는 C-글리코실전이효소의 활성 부위 (acive site)에 위치하는 아미노산이 변이되어 기질 탄소의 글리코실화 반응이 강화된 것을 특징으로 하는 C-글리코실전이효소 변이체 및 폴리케타이드 및 페닐프로파노이드 배당체 생산에 있어서 상기 변이체의 용도에 관한 것이다.
폴리케타이드는 다양한 생물학적 효능을 지니는 매력적인 천연물의 한 분류이며, 일상에서 식품, 화장품, 약물 등에 다양하게 응용되고 있다. 폴리케타이드를 생합성하는 효소군을 폴리케타이드 생합성 효소 (PKS)라 총칭하는데, 이는 생합성 메커니즘에 따라 타입 I, II 및 III의 세 가지 종류로 구분된다. 이 중 타입 I PKS을 통해서는 macrolide 계열 폴리케타이드가 생산되며 타입 II 및 III를 통해서는 방향족 폴리케타이드가 주로 생산된다.
약물 또는 영양 보조제 등과 같이 의약적 효능을 지니는 물질의 경우 전반적으로 글리코시드 결합의 생성을 통하여 비배당체에 비하여 안정성, 가수분해 등에 대한 저항성, 생체이용률 등이 훨씬 개선된 배당체가 선호된다. 특히 안정적인 C-글리코사이드 결합은 화학적으로 O-글리코사이드 결합에 비하여 안정하다. 하지만 대장균에서 천연물의 O-glycosylation은 몇 사례가 보고되었으나 (Chen, D.; Chen, R.; Xie, K.; Duan, Y.; Dai, J., Production of acetophenone C-glucosides using an engineered C-glycosyltransferase in Escherichia coli. Tetrahedron Lett. 2018, 59 (19), 1875-1878), C-glycosylation은 거의 보고된 사례가 없다. 대장균뿐만 아니라 자연계에도 C-glycosylation에 비하여 O-glycosylation에 대하여 많은 보고가 되어 있다.
대표적인 C-글리코사이드 천연물로는 카르민산 (carminic acid), 알로에신 (aloesin) 등이 있다.
카르민산은 널리 사용되는 붉은색 색소이며 음식, 화장품 및 의약품 등으로 활용된다. Cochineal Dactylopius coccus와 같은 비늘 곤충으로부터 직접 추출되는데, 케첩, 딸기 우유, 사탕과 같은 식품에 첨가되고 있으며 아이섀도우, 매니큐어, 립스틱과 같은 화장품에 첨가되고 있다. 하지만 cochineal은 느리게 성장하고, 제한된 영역에서만 성장하여 (덥고 건조한 지역에서만 자랄 수 있다), 생산 용량을 쉽게 증가시키기 어렵다는 상업적 생산의 한계를 보이고 있다. 특히, 추출 과정 또한 굉장히 비효율적인데, 예를 들어 1파운드의 카르민산을 생산하기 위해서는 70,000마리의 암컷 cochineal이 필요하다. 이러한 상황에서 카르민산을 생산하기 위한 보다 지속 가능한 방법의 개발이 필요하였다.
알로에신은 알로에 베라(Aloe vera)로부터 추출되며, 항타이로시네이즈 (anti-tyrosinase) 효과 및 항멜라닌 생성 효과 때문에 화장품 업계에서 미백제로써 널리 활용되고 있다. 뿐만 아니라 알로에신은 항염증 및 항라디칼 효과를 보이므로 다양한 약물 또는 화장품 주성분으로 활용될 수 있다. 하지만 알로에 식물로부터 추출되는 알로에신의 양은 극미량으로, 보다 효율적이고 지속 가능한 바이오 기반 생산 방법의 개발이 필요하였다.
상기 서술된 바와 같이 C-글리코사이드 천연물에 대한 수요는 매우 높은 반면, 그 공급량은 미비하나, 이를 효과적으로 생산할 수 있는 방법에 대한 개발이 거의 이루어지지 않은 실정이었다. 특히, 상기 화합물을 생물학적 공정으로 생산하고자 하여도 이를 위한 효소가 잘 밝혀져 있지 않거나, 낮은 효소의 전환 효율 때문에 미생물 세포 공장으로부터 효율적인 생산이 불가능하였다.
이러한 기술적 배경 아래에서, 본 발명자들은 뛰어난 C-글리코실화 능력을 갖는 C-글리코실전이효소를 개발하기 위해 예의 노력한 결과, 아미노산의 치환을 통해 뛰어난 C-글리코실화 능력을 나타내는 C-글리코실전이효소 변이체를 개발하고, 상기 C-글리코실전이효소 변이체 유전자를 도입한 재조합 미생물에서 타입 I, 타입 II 및 타입 III 폴리케타이드, 비리보솜 펩티드, 페닐프로파노이드, 방향족 천연물에 대해 현저히 뛰어난 C-글리코실전이효소 변이체의 배당체 생산능을 나타내는 것을 확인하고 본 발명을 완성하였다.
본 배경기술 부분에 기재된 상기 정보는 오직 본 발명의 배경에 대한 이해를 향상시키기 위한 것이며, 이에 본 발명이 속하는 기술분야에서 통상의 지식을 가지는 자에게 있어 이미 알려진 선행기술을 형성하는 정보를 포함하지 않을 수 있다.
Chen, D.; Chen, R.; Xie, K.; Duan, Y.; Dai, J., Production of acetophenone C-glucosides using an engineered C-glycosyltransferase in Escherichia coli. Tetrahedron Lett. 2018, 59 (19), 1875-1878
본 발명의 목적은 신규한 C-글리코실전이효소 변이체 및 이의 용도를 제공하는데 있다.
상기 목적을 달성하기 위하여,
본 발명은 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서 F17, V93, V132, Y193, L164 및 R322로 구성된 군에서 선택되는 어느 하나 이상의 아미노산에 변이를 포함하는 C-글리코실전이효소 (C-glycosyltransferase) 변이체를 제공한다.
본 발명은 또한, 상기 C-글리코실전이효소 변이체를 암호화하는 핵산을 제공한다.
본 발명은 또한, 상기 핵산이 도입된 재조합 미생물을 제공한다.
본 발명은 또한, 다음 단계를 포함하는 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 제조방법을 제공한다:
(a) 본 발명의 재조합 미생물을 배양하여 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체를 생성시키는 단계; 및
(b) 상기 생성된 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체를 회수하는 단계.
본 발명은 또한, 다음 단계를 포함하는 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 제조방법을 제공한다:
(a) 본 발명의 C-글리코실전이효소 변이체 또는 상기 C-글리코실전이효소 변이체를 발현하는 미생물과 폴리케타이드 및/또는 페닐프로파노이드를 반응시켜 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체를 생성시키는 단계; 및
(b) 상기 생성된 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체를 회수하는 단계.
본 발명에 따른 C-글리코실전이효소 변이체는 야생형 C-글리코실전이효소에 비해 글리코사이드 결합 생성능이 향상되어 있어, 폴리케타이드 군 및 유사 천연물, 특히 타입 I, II, III 폴리케타이드, 비리보솜 펩티드, 페닐프로파노이드 및 그 외 방향족 천연물의 배당체 생산 효과를 증진시킬 수 있다. 따라서, 본 발명에 따른 C-글리코실전이효소 변이체는 천연물의 폴리케타이드 배당체 생산을 통하여 증가하는 C-글리코사이드 화합물을 구성성분으로 하는 약물, 식품 첨가제, 영양 보조제 등의 제조에 유용하게 활용될 수 있을 것이다.
도 1은 carminic acid 생산 경로를 나타낸다.
도 2는 서로 다른 대사공학 전략을 도입하였을 때 flavokermesic acid 생산량을 나타낸다. 타입 III 폴리케타이드 생합성 효소 (Aloe arborescens 유래 AaPKS5)와 ZhuIJ보다 타입 II 폴리케타이드 생합성 효소 (P. luminescens 유래 AntDEFBG)와 ZhuIJ가 보다 높은 농도의 FK를 생산하였다.
도 3은 DnrF의 도입에 따른 kermesic acid 생산량 변화를 나타낸다.
도 4는 dcII 생산을 위한 후보 C-glycosyltransferase 및 각 후보 효소들의 본래의 효소 반응을 나타낸다.
도 5는 아홉 종류의 효소 후보들의 dcII 생산능을 비교한 것이다
도 6은 KA와 dcII 생산량 증대를 위한 homology modeling 및 docking simulation 결과를 나타낸다: (a) DnrF에 대한 시뮬레이션을 통하여 선별된 변이체들의 KA 생산능. (b) 가장 효과가 좋은 DnrF 변이체 (P217K)에 대한 단백질 구조 시뮬레이션 결과. (c) GtCGT에 대한 시뮬레이션을 통해 선별된 변이체들의 dcII 생산능. (d) 가장 효과가 좋은 GtCGT 변이체 (V93Q/Y193F)에 대한 단백질 구조.
도 7은 포도당으로부터 카르민산 생산을 나타낸다: (a) 서로 다른 조건에서의 카르민산 생산량. (b) LC-MS/MS 분석을 통한 카르민산의 분석. 윗쪽 데이터는 시판되는 카르민산을 분석한 결과, 아랫쪽 데이터는 포도당으로부터 대장균에서 생산된 카르민산 함유 샘플 분석 결과. 왼쪽 그래프들은 추출 이온 크로마토그램 (extracted ion chromatogram; EIC), 오른쪽 그래프들은 MS/MS 조각 패턴 (fragmentation pattern). (c) 최종 균주에 대한 유가식 발효 그래프. 붉은색 화살표는 IPTG를 통한 유전자 발현 개시 시점을 나타내고, DCW는 건조 세포 중량을 나타냄.
도 8은 알로에신 생산 경로를 나타낸다.
도 9는 대장균을 통한 알로에신 생산을 보여준다: (a) 알로에손 증산을 위하여 RpALS를 포함하는 또다른 플라스미드를 구축하여 테스트한 결과. (b) 알로에신 생산을 위한 GtCGT 및 그 변이체 테스트 결과. (c) LC-MS/MS 분석을 통한 알로에신의 분석. 윗쪽 데이터는 시판되는 알로에신을 분석한 결과, 아랫쪽 데이터는 포도당으로부터 대장균에서 생산된 알로에신 함유 샘플 분석 결과. 왼쪽 그래프들은 추출 이온 크로마토그램 (extracted ion chromatogram; EIC), 오른쪽 그래프들은 MS/MS 조각 패턴 (fragmentation pattern)을 나타냄.
도 10은 알로에신 생산량 증대를 위한 GtCGT 추가 변이체 테스트 결과를 나타낸다. 추가 변이체는 GtCGT 변이체 (V93Q/Y193F)의 구조 모델을 분석하여 예측하였다.
도 11은 알로에신 생산량 증대를 위한 GtCGT 추가 변이체 테스트 결과를 나타낸다. 추가 변이체는 GtCGT 변이체 (V93Q/Y193F)를 기반으로 docking simulation을 수행하여 예측하였다.
도 12는 GtCGT 변이체 (V93Q/Y193F)에 의한 여러 페닐프로파노이드 C-glucoside의 생산량 (%전환율로 표기)을 나타낸다.
도 13은 GtCGT 및 GtCGT 변이체(V93Q/Y193F)의 KM과 Vmax 값을 계산하기 위한 Lineweaver-Burk plot을 나타낸다.
도 2는 서로 다른 대사공학 전략을 도입하였을 때 flavokermesic acid 생산량을 나타낸다. 타입 III 폴리케타이드 생합성 효소 (Aloe arborescens 유래 AaPKS5)와 ZhuIJ보다 타입 II 폴리케타이드 생합성 효소 (P. luminescens 유래 AntDEFBG)와 ZhuIJ가 보다 높은 농도의 FK를 생산하였다.
도 3은 DnrF의 도입에 따른 kermesic acid 생산량 변화를 나타낸다.
도 4는 dcII 생산을 위한 후보 C-glycosyltransferase 및 각 후보 효소들의 본래의 효소 반응을 나타낸다.
도 5는 아홉 종류의 효소 후보들의 dcII 생산능을 비교한 것이다
도 6은 KA와 dcII 생산량 증대를 위한 homology modeling 및 docking simulation 결과를 나타낸다: (a) DnrF에 대한 시뮬레이션을 통하여 선별된 변이체들의 KA 생산능. (b) 가장 효과가 좋은 DnrF 변이체 (P217K)에 대한 단백질 구조 시뮬레이션 결과. (c) GtCGT에 대한 시뮬레이션을 통해 선별된 변이체들의 dcII 생산능. (d) 가장 효과가 좋은 GtCGT 변이체 (V93Q/Y193F)에 대한 단백질 구조.
도 7은 포도당으로부터 카르민산 생산을 나타낸다: (a) 서로 다른 조건에서의 카르민산 생산량. (b) LC-MS/MS 분석을 통한 카르민산의 분석. 윗쪽 데이터는 시판되는 카르민산을 분석한 결과, 아랫쪽 데이터는 포도당으로부터 대장균에서 생산된 카르민산 함유 샘플 분석 결과. 왼쪽 그래프들은 추출 이온 크로마토그램 (extracted ion chromatogram; EIC), 오른쪽 그래프들은 MS/MS 조각 패턴 (fragmentation pattern). (c) 최종 균주에 대한 유가식 발효 그래프. 붉은색 화살표는 IPTG를 통한 유전자 발현 개시 시점을 나타내고, DCW는 건조 세포 중량을 나타냄.
도 8은 알로에신 생산 경로를 나타낸다.
도 9는 대장균을 통한 알로에신 생산을 보여준다: (a) 알로에손 증산을 위하여 RpALS를 포함하는 또다른 플라스미드를 구축하여 테스트한 결과. (b) 알로에신 생산을 위한 GtCGT 및 그 변이체 테스트 결과. (c) LC-MS/MS 분석을 통한 알로에신의 분석. 윗쪽 데이터는 시판되는 알로에신을 분석한 결과, 아랫쪽 데이터는 포도당으로부터 대장균에서 생산된 알로에신 함유 샘플 분석 결과. 왼쪽 그래프들은 추출 이온 크로마토그램 (extracted ion chromatogram; EIC), 오른쪽 그래프들은 MS/MS 조각 패턴 (fragmentation pattern)을 나타냄.
도 10은 알로에신 생산량 증대를 위한 GtCGT 추가 변이체 테스트 결과를 나타낸다. 추가 변이체는 GtCGT 변이체 (V93Q/Y193F)의 구조 모델을 분석하여 예측하였다.
도 11은 알로에신 생산량 증대를 위한 GtCGT 추가 변이체 테스트 결과를 나타낸다. 추가 변이체는 GtCGT 변이체 (V93Q/Y193F)를 기반으로 docking simulation을 수행하여 예측하였다.
도 12는 GtCGT 변이체 (V93Q/Y193F)에 의한 여러 페닐프로파노이드 C-glucoside의 생산량 (%전환율로 표기)을 나타낸다.
도 13은 GtCGT 및 GtCGT 변이체(V93Q/Y193F)의 KM과 Vmax 값을 계산하기 위한 Lineweaver-Burk plot을 나타낸다.
다른 식으로 정의되지 않는 한, 본 명세서에서 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 기술분야에서 숙련된 전문가에 의해서 통상적으로 이해되는 것과 동일한 의미를 갖는다. 일반적으로, 본 명세서에서 사용된 명명법은 본 기술분야에서 잘 알려져 있고 통상적으로 사용되는 것이다.
본 발명에서는 야생형 효소에 비해 글리코사이드 결합 생성능이 현저히 개선된 C-글리코실전이효소 변이체를 발굴하기 위하여 단백질 구조를 예측하고, 단백질 구조 분석과 컴퓨터 시뮬레이션을 통하여 활성이 증대된 변이 후보군을 도출하였으며, 이들 중 특히 기질 결합성이 향상되고 글루코실화 반응을 강화시킬 수 있는 효과 좋은 변이체를 선별할 수 있었다.
따라서, 본 발명은 일 관점에서, C-글리코실화 능력이 향상된 C-글리코실전이효소(C-glycosyltransferase) 변이체에 관한 것이다.
본 발명에 있어서, 본 발명의 변이체의 주형(또는 야생형)이 되는 C-글리코실전이효소는 기질(예, 화합물, 단백질 등)의 탄소에 C-글리코시드 결합을 형성시켜 C-글리코실화를 유도하는 효소를 의미한다.
본 발명에 있어서, 상기 C-글리코실전이효소는 서열번호 1로 표시되었으나, 이에 제한되는 것은 아니며, 특정 아미노산 잔기 위치에서, 아미노산 잔기가 보존적으로 치환된 단백질을 포함하는 의미로 해석되어야 한다.
본 명세서에서 "보존적 치환"이란 1개 이상의 아미노산을 C-글리코실전이효소 또는 이의 변이체의 생물학적 또는 생화학적 기능의 손실을 야기하지 않는 유사한 생화학적 특성을 갖는 아미노산으로 치환하는 것을 포함하는 C-글리코실전이효소의 변형을 의미한다.
본 발명의 용어, "보존적 아미노산 치환"은 아미노산 잔기를 유사한 측쇄를 갖는 아미노산 잔기로 대체시키는 치환이다. 유사한 측쇄를 갖는 아미노산 잔기 부류는 해당 기술분야에 규정되어 있으며, 잘 알려져 있다. 이들 부류는 염기성 측쇄를 갖는 아미노산(예를 들어, 라이신, 아르기닌, 히스티딘), 산성 측쇄를 갖는 아미노산(예를 들어, 아스파르트산, 글루탐산), 대전되지 않은 극성 측쇄를 갖는 아미노산(예를 들어, 글리신, 아스파라진, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 비-극성 측쇄를 갖는 아미노산(예를 들어, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지된 측쇄를 갖는 아미노산(예를 들어, 트레오닌, 발린, 이소류신) 및 방향족 측쇄를 갖는 아미노산(예를 들어, 티로신, 페닐알라닌, 트립토판, 히스티딘)을 포함한다.
따라서, 본 발명의 변이체의 주형이 되는 C-글리코실전이효소는 서열번호 1뿐만 아니라, 이와 실질적으로 동일한 기능 및/또는 효과를 가지며, 40% 이상, 50% 이상, 60% 이상, 70% 이상, 바람직하게는 80% 이상 또는 85% 이상, 더욱 바람직하게는 90% 이상 95% 이상, 가장 바람직하게는 99% 이상의 아미노산 서열 상동성을 가지는 C-글리코실전이효소, 재조합 C-글리코실전이효소 및 이의 절편들을 모두 포함하는 의미로 해석된다.
본 발명의 용어, "절편"은 모 단백질이 절단된 일부 단편을 의미하며, C'-말단 및/또는 N'-말단이 절단된 것일 수 있다. 본 발명에 있어서, 상기 절편은 본 발명의 탈당화된 C-글리코실전이효소와 실질적으로 동일한 기능 및/또는 효과를 갖는 절편을 의미한다. 예를 들어, 상기 절편은 전장 단백질에서 신호 서열이 절단된 단편을 포함할 수 있다.
본 발명에 있어서, 상기 C-글리코실전이효소는 서열번호 1로 표시되는 Gentiana triflora 유래 GtUF6CGT이외에도 다른 균주 또는 다른 생물로부터 유래될 수 있다. 예를 들어 E. coli Nissle 유래 IroB (EnCGT); Zea mays 유래 UGT708A6 (ZmCGT) dual C/O-glycosyltransferase; Fagopyrum esculentum 유래 UGT708C2 (FeCGT); Mangifera indica 유래 MiCGT; Oryza sativa 유래 OsCGT; Glycine max 유래 UGT708D1 (GmCGT); Gentiana triflora 유래 GtUF6CGT1 (GtCGT); Aloe vera 유래 AvCGT일 수 있으며, 바람직하게는 Gentiana triflora 유래 GtUF6CGT1 (GtCGT) 또는 Zea mays 유래 UGT708A6 (ZmCGT) dual C/O-glycosyltransferase일 수 있으나, 이에 제한되는 것은 아니다.
본 발명의 일 실시예에서, 야생형 C-글리코실전이효소의 아미노산 일부를 치환하여 변이체를 생성하는 경우, 현저히 뛰어난 C-글리코실화 유도능력을 나타내며, 상기 C-글리코실전이효소를 폴리케타이드 합성용 재조합 균주에 도입하는 경우 C-당화된 폴리케타이드를 현저한 수율로 제조할 수 있음을 확인하였다.
본 발명에 있어서, 상기 C-글리코실전이효소 변이체는 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서 F17, V93, V132, Y193, L164 및 R322로 구성된 군에서 선택되는 어느 하나 이상의 아미노산에 변이를 포함하는 것을 특징으로 할 수 있으며, 보다 바람직하게는 V93 및/또는 Y193의 아미노산에 변이를 포함하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 C-글리코실전이효소 변이체는 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서 F17, V93, V132, Y193, L164 및 R322로 구성된 군에서 선택되는 어느 하나 이상의 아미노산 이외에도 하나 이상의 다른 아미노산에 변이를 포함하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 C-글리코실전이효소 변이체는 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서, F17, V405, P107, L208, L164, P45, I305, L316, F401, Y94, N57, Y187, C16, P319, F167, V132, N206, R406, Q386, V129, L125, L194, I95, S215, L184, Y158, L29, L27, F202, H159, S370, H365, V329, M301, V315, V190, C366, W80, L58, Q210, F312, D61, I207, L363, P196, L106, V93, A394, W314, S155, P88, D99, Y284, E189, G49, H328, E399, T392, F387, A44, P199, E46, R28, V285, I124, R419, L306, Y157, Y200, E373, P191, L214, S376, V15, E332, E51, I417, L98, I323, H161, T383, P127, E309, N84, L313, Q104, T371, N213, G79, L330, N307, K105, L128, A152, , I18, N59, W147, S86, L293, E296, S377, L185, K216, F89, S286, F396, F211, Y303, D223, R415, N96, V22, S153, F154, D192, Y193, H195, P201, Y292, 및 R322로 구성된 군에서 선택되는 어느 하나 이상의 아미노산에 변이를 추가로 포함할 수 있다.
본 발명에 있어서, 상기 C-글리코실전이효소 변이체는 서열번호 1로 표시되는 C-글리코실전이효소에서, I18, Q20, T50, I95, V290, I323, V22, L29, E46, V48, E51, A55, S86, D99, R103, C151, L184, L194, E332 및 P385로 구성된 군에서 선택되는 어느 하나 이상의 아미노산에 변이를 추가로 포함할 수 있다.
본 발명에 있어서, 바람직하게는 상기 C-글리코실전이효소 변이체는 서열번호 1로 표시되는 C-글리코실전이효소에서, I323, T50, I18, I95, Q20, P385, L194, V48로 구성된 군에서 선택되는 어느 하나 이상의 아미노산에 변이를 추가로 포함할 수 있다.
본 발명의 용어 "변이체"는 참조서열(정상 C-글리코실전이효소 서열 예, 서열번호 1)의 아미노산 서열에서, 일부 아미노산 잔기의 변이, 바람직하게는 아미노산 잔기의 치환, 결실 및/또는 삽입, 더욱 바람직하게는 아미노산 잔기의 치환을 포함하는 것뿐 아니라, 그러한 아미노산 잔기의 치환, 결실 및/또는 삽입 과 함께, N-말단 또는 C-말단에서의 일부 아미노산 잔기의 결실이 일어난 것을 모두 포함하는 개념으로 사용된다. 본 발명의 일 실시예에서, 상기 변이체는 서열번호 1의 일부 아미노산을 치환하여 제조하였으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 '변이'는 아미노산의 치환인 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 C-글리코실전이효소 변이체는 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서 F17G, V93Q, V132A, Y193F, L164G 및 R322D로 구성된 군에서 선택되는 어느 하나 이상의 아미노산 치환을 포함하는 것을 특징으로 할 수 있으며, 보다 바람직하게는 V93Q 및/또는 Y193F, 가장 바람직하게는 V93Q 및 Y193F의 아미노산 치환을 포함하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 C-글리코실전이효소 변이체는 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서 F17G, V93Q, V132A, Y193F, L164G 및 R322D로 구성된 군에서 선택되는 어느 하나 이상의 아미노산 치환 이외에도 하나 이상의 다른 아미노산의 치환을 추가로 포함하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 C-글리코실전이효소 변이체는 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서 V93Q 및 Y193F 아미노산 치환 이외에도, 하나 이상의 다른 아미노산의 치환을 추가로 포함하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 추가로 포함 가능한 다른 아미노산의 치환은 C-글리코실전이효소 변이체는 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서, F17G, V405M, P107G, L208G, L164G, P45G, I305A, L316G, F401H, Y94G, N57G, Y187A, C16G, P319G, F167G, V132A, N206E, R406G, Q386H, V129A, L125V, L194A, I95G, S215D, L184G, Y158T, L29A, L27A, F202S, H159G, S370A, H365G, V329T, M301W, V315A, V190A, C366G, W80Y, L58E, Q210G, F312G, D61G, I207P, L363G, P196G, L106G, V93G, A394G, W314C, S155A, P88D, D99G, Y284H, E189A, G49TH328G, E399D, T392A, F387T, A44G, P199E, E46G, R28G, V285I, I124T, R419A, L306M, Y157T, Y200L, E373A, P201G, P191G, L214A, S376G, V15G, E332P, E51C, I417L, L98G, I323A, H161G, T383C, P127A, E309N, N84S, L313T, Q104D, T371A, N213L, G79S, L330G, N307A, K105G, L128D, A152G, S153G, I18A, N59V, W147F, S86V, L293V, E296D, S377A, L185V, K216R, F89A, S286C, F396L, F211G, Y303A, D223G, R415L, N96A, V22H, V93Q, V93L, S153C, F154L, D192S, Y193F, H195Y, H195L, P201T, Y292H, Y292F, R322D 및 R322A로 구성된 군에서 선택되는 어느 하나 이상의 아미노산 치환인 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 추가로 포함 가능한 다른 아미노산의 치환은 서열번호 1로 표시되는 C-글리코실전이효소에서, I18P, Q20M, T50N, T50Q, T50K, T50R, T50V, I95M, I95T, V290G, V290A, I323S, I323A, I95L, V22A, L29A, E46G, V48G, E51C, A55S, S86V, D99G, R103V, C151G, L184G, L194A, E332P, I18A 및 P385A로 구성된 군에서 선택되는 어느 하나 이상의 아미노산 치환인 것을 특징으로 할 수 있다.
본 발명에 있어서, 바람직하게는 상기 추가로 포함 가능한 다른 아미노산의 치환은 서열번호 1로 표시되는 C-글리코실전이효소에서, I323S, T50R, T50V, I18P, I95T, Q20M, I323A, P385A, L194A 및 V48G로 구성된 군에서 선택되는 어느 하나 이상의 아미노산의 치환인 것을 특징으로 할 수 있다.
본 발명의 일 실시예에서,
i) 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서 V93Q 및 Y193F 아미노산 치환;
ii) 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서 V93Q, Y193F 및 I323S 아미노산 치환; 또는
iii) 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서 V93Q, Y193F 및 P385A 아미노산 치환을 포함하는 C-글리코실전이효소 변이체가 가장 뛰어난 C-글리코실화를 나타내는 것을 확인하였으나, 이에 제한되는 것은 아니다.
아미노산 변이의 아미노산 잔기의 상기 위치는 참조로써(as reference) 서열번호 1로 표시되는 아미노산 서열을 사용하여 정확하게 잔기를 넘버링할 수 있으며, 여기서 "잔기 Xn(residue Xn)"은 서열번호 1로 표시되는 아미노산 서열에서 위치 n에 상응하는 잔기 X를 나타내고, n은 양의 정수이며, X는 임의의 아미노산 잔기의 약어이다. 예를 "잔기 V93"은 서열번호 1 표시되는 아미노산 서열에서 위치 93에 상응하는 아미노산 잔기 V를 지칭한다.
본 발명에서 "아미노산 변이"는 "아미노산 치환 Xn(amino acid substitution Xn)"일 수 있으며, 일 양태로서 서열번호 1로 표시되는 아미노산 서열 중 위치 n의 아미노산 잔기 X에서 발생하는 아미노산 치환을 의미하고, 여기서 n은 양의 정수이고, X는 임의의 아미노산 잔기의 약어이다. 예를 들어, "아미노산 치환 V93"은 서열번호 1로 표시되는 아미노산 서열의 위치 93에 상응하는 아미노산 잔기 V에서 발생한 아미노산 치환을 의미한다.
본 발명에 있어서, 참조서열로 사용되는 서열번호 1의 C-글리코실전이효소 외의 다른 아미노산 서열을 갖는 C-글리코실전이효소를 참조서열로 사용하는 경우, 서열번호 1을 참조로 하여 기재된 특정 아미노산 잔기에 "상응하는" 아미노산 잔기는 일반적으로 최적화 조건 하에서 아미노산 서열의 정렬에 의해 얻어 질 수 있다. 상기 서열 정렬은 당업자가 예를 들어 BLAST, BLAST-2, ALIGN, NEEDLE 또는 Megalign (DNASTAR) 소프트웨어 등을 사용하여 이해하는 수단에 의해 수행될 수 있다. 당업자는 비교되는 전장 서열에서 최적의 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하여 정렬에 사용하기 위한 적절한 파라미터를 결정할 수 있다.
본 발명의 아미노산 치환은 비 보존 치환(non-conserved substitutions)일 수 있다. 상기 비 보존 치환은, 예를 들어, 특정 측쇄 크기 또는 특정 특성 (예를 들어, 친수성)을 갖는 아미노산 잔기를 상이한 측쇄 크기 또는 상이한 특성 (예를 들어, 소수성)을 갖는 아미노산 잔기로 대체하는 것과 같은 비 보존 방식으로, 표적 단백질 또는 폴리펩티드의 아미노산 잔기를 변경하는 것을 포함할 수 있다.
상기 아미노산 치환은 또한 보존된 치환(conserved substitutions)일 수 있다. 상기 보존된 치환은, 예를 들어, 특정 측쇄 크기 또는 특정 특징 (예를 들어, 친수성)을 갖는 아미노산 잔기를 동일하거나 유사한 측쇄 크기 또는 동일하거나 유사한 특성 (예 : 여전히 친수성)을 갖는 아미노산 잔기로 대체하는 것과 같이, 보존된 방식으로 표적 단백질 또는 폴리펩티드의 아미노산 잔기를 변경하는 것을 포함할 수 있다. 이러한 보존된 치환은 일반적으로 생산된 단백질의 구조 또는 기능에 큰 영향을 미치지 않는다. 본 출원에서, 융합 단백질의 돌연변이인 아미노산 서열 변이체, 이의 단편, 또는 하나 이상의 아미노산이 치환된 이의 변이체는 단백질의 구조 또는 기능을 현저하게 변화시키지 않는 보존된 아미노산 치환을 포함할 수 있다.
예를 들어, 다음 그룹 각각에서 아미노산 간의 상호 치환(mutual substitutions)은 본 출원에서 보존적 치환으로 간주될 수 있다:
비극성 측쇄를 갖는 아미노산 그룹: 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 트립토판 및 메티오닌.
극성 측쇄를 갖는 비하전 아미노산 그룹: 글리신, 세린, 트레오닌, 시스테인, 티로신, 아스파라긴 및 글루타민.
극성 측쇄를 갖는 음전하 아미노산 그룹: 아스파르트산 및 글루탐산.
양전하를 띤 염기성 아미노산 그룹: 라이신, 아르기닌 및 히스티딘.
페닐을 갖는 아미노산 그룹: 페닐알라닌, 트립토판 및 티로신
본 발명에 포함된 단백질, 폴리펩티드 및/또는 아미노산 서열은 또한 적어도 다음 범위를 포함하는 것으로 이해될 수 있다: 상기 단백질 또는 폴리펩티드와 동일하거나 유사한 기능을 갖는 변이체 또는 상동체(homologues).
본 발명에서, 상기 변이체는 야생형 C-글리코실화전이효소의 아미노산 서열과 비교하여 하나 이상의 아미노산의 치환, 결실 또는 첨가에 의해 생성된 단백질 또는 폴리펩티드 일 수 있다. 예를 들어, 상기 기능적 변이체는 적어도 1 개의 아미노산의 치환, 결실 및/또는 삽입, 예를 들어 1-30, 1-20 또는 1-10, 대안적으로, 예를 들어 1, 2, 3, 4, 또는 5 아미노산의 치환, 결실 및/또는 삽입에 의한 아미노산 변화를 갖는 단백질 또는 폴리펩티드를 포함할 수 있다. 상기 기능적 변이체는 변화 (예를 들어, 치환, 결실 또는 첨가) 전에 상기 단백질 또는 상기 폴리펩티드의 생물학적 특성을 실질적으로 보유할 수 있다. 예를 들어, 상기 기능적 변이체는 변경 전에 상기 단백질 또는 상기 폴리펩티드의 생물학적 활성의 60 %, 70 %, 80 %, 90 % 또는 100 % 이상을 보유할 수 있다.
본 발명에서, 상기 상동체(homologue)는 상기 단백질 및/또는 상기 폴리펩티드의 아미노산 서열과 적어도 약 80 % (예를 들어, 적어도 약 85 %, 약 90 %, 약 91 %, 약 92 %, 약 93 %, 약 94 %, 약 95 %, 약 96 %, 약 97 %, 약 98 %, 약 99 % 이상) 서열 상동성을 갖는 단백질 또는 폴리펩티드 일 수 있다.
본 발명에서, 상기 상동성은 일반적으로 둘 이상의 서열 간의 유사성(similarity), 유의성(analogousness) 또는 연관성(association)을 지칭한다. "서열 상동성 백분율(percent of sequence homology)"은 동일한 핵산 염기 (예: A, T, C, G, I) 또는 동일한 아미노산 잔기 (예 : Ala, Pro, Ser, Thr, Gly, Val, Leu, Ile, Phe, Tyr, Trp, Lys, Arg, His, Asp, Glu, Asn, Gln, Cys 및 Met)가 존재하는 위치의 수를 결정하는 비교 창에서 정렬된 두 서열을 비교하는 방식에 의해 계산될 수 있으며, 비교 창(즉, 윈도우 사이즈)의 일치하는 위치의 수를 제공하기 위하여 일치하는 위치의 수를 총 위치 수로 나누고, 결과에 100을 곱하여 서열 상동성의 백분율을 제공한다. 서열 상동성의 백분율을 결정하기 위한 정렬은 예를 들어 BLAST, BLAST-2, ALIGN 또는 Megalign (DNASTAR) 소프트웨어와 같은 공개적으로 이용 가능한 컴퓨터 소프트웨어를 사용하여 당업계에 알려진 다양한 방식으로 수행될 수 있다. 당업자는 비교되는 전장 서열 내에서 또는 표적 서열 영역 내에서 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하여 서열 정렬을 위한 적절한 파라미터를 결정할 수 있다. 상기 상동성은 또한 다음 방법에 의해 결정될 수 있다: FASTA 및 BLAST. FASTA 알고리즘은 예를 들어 W. R. Pearson and D. J. Lipman's "Improved Tool for Biological Sequence Comparison", Proc. Natl. Acad. Sci., 85: 2444-2448, 1988; 및 D, J. Lipman and W. R. Pearson's "Fast and Sensitive Protein Similarity Search", Science, 227:1435-1441, 1989에 개시되어 있고, BLAST 알고리즘에 대한 설명은 S. Altschul, W. Gish, W. Miller, E. W. Myers and D. Lipman, "A Basic Local Alignment Search Tool", Journal of Molecular Biology, 215: 403-410, 1990를 참조할 수 있다.
본 발명에 있어서, 상기 C-글리코실전이효소 변이체는 야생형에 비해 기질 탄소의 글리코실화(glycosylation) 반응을 강화시키는 것을 특징으로 하는 할 수 있다.
본 발명에 있어서, 상기 변이된 아미노산은 효소의 활성 부위(acive site)에 위치하고, 상기 아미노산에 변이를 통하여 변이체의 기질 결합력이 야생형에 비해 10% 이상, 바람직하게는 20% 이상, 더욱 바람직하게는 50% 이상 향상된 것을 특징으로 할 수 있다.
본 발명의 일 실시예에서, 본 발명의 C-글리코실전이효소 변이체를 사용하는 경우, 다양한 폴리케타이드계 화합물(플라보케르메신 산(flavokermesic acid), 케르메신 산(kermesic acid), 알로에손(aloesone)) 또는 페닐프로파노이드계 화합물(나린제닌(naringenin), 아피제닌(apigenin) 또는 루테올린(luteolin))을 기질로 하여 기질의 종류에 관계없이 야생형에 비해 현저히 높은 C-글리코실화를 나타낼 수 있음을 확인하였다. 따라서, 본 발명의 C-글리코실전이효소 변이체는 다양한 화합물, 단백질을 기질로 하여, 상기 기질을 C-글리코실화 하기위한 용도로 사용될 수 있다. 예를 들어, 상기 폴리케타이드계 화합물 또는 페닐프로파노이드계 화합물의 C-글리코실화에 사용되는 것을 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 기질은 폴리케타이드 또는 페닐프로파노이드계 화합물을 제한없이 사용가능하며, 바람직하게는 일 실시예에서 확인한 것과 같이 플라보케르메신 산(flavokermesic acid), 케르메신 산(kermesic acid), 알로에손(aloesone), 나린제닌(naringenin), 아피제닌(apigenin) 또는 루테올린(luteolin)일 수 있으나, 이에 제한되는 것은 아니다.
상기 기질은 바람직하게는 플라보케르메신 산(flavokermesic acid) 또는 케르메신 산(kermesic acid) 이고, 상기 변이체는 상기 플라보케르메신 산(flavokermesic acid)의 2번 탄소를 글리코실화(glycosylation) 시키는 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.
상기 기질은 바람직하게는 알로에손(aloesone)이고, 상기 변이체는 상기 알로에손의 8번 탄소를 글리코실화(glycosylation)시키는 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.
본 발명은 다른 관점에서, 상기 C-글리코실전이효소 변이체를 암호화하는 핵산에 관한 것이다.
또 다른 관점에서, 본 발명은 상기 핵산을 포함하는 벡터에 관한 것이다.
또 다른 관점에서, 본 발명은 상기 핵산이 도입된 재조합 미생물에 관한 것이다.
본 발명에 있어서, 상기 재조합 미생물에는 숙주 미생물에 상기 핵산이 플라스미드 형태로 도입되어 있거나 게놈에 삽입되어 있는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 재조합 미생물은 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체 생산용인 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.
본 발명에 있어서, 상기 재조합 미생물은 본 발명의 C-글리코실전이효소의 기질로서, 폴리케타이드 및/또는 페닐프로파노이드를 생산하는 능력을 갖는 것을 특징으로 할 수 있으며, 상기 폴리케타이드 및/또는 페닐프로파노이드는 본 발명의 재조합 미생물이 발현하는 C-글리코실전이효소에 의해 당화되어 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체로 전환될 수 있다.
본 발명에 있어서, 상기 폴리케타이드는
라파마이신(rapamycin), 로바스타틴(lovastatin), 에리트로마이신(erythromycin), 리파마이신(rifamycin), 아버멕틴(avermectin), 겔다나마이신(geldanamycin), 이버멕틴(ivermectin), 칼리케아마이신(calicheamicin), 에포타일론(epothilone), 트라이아세트산 락톤(triacetic acid lactone) 및 6-메틸살리실산(6-methylsalicylic acid)로 구성된 군에서 선택되는 타입 I 폴리케타이드;
액티로노딘(actinorhodin), 독소루비신(doxorubicin), 다우노루비신(daunorubicin), 옥시테트라사이클린(oxytetracycline), SEK4, SEK4b, SEK34, SEK15, SEK26, FK506, DMAC, 아클라비논(aklavinone), 아클라노닉산(aklanonic acid), 엡실론 로도마이시논(epsilon-rhodomycinone), 독시사이클린(doxycycline), 안트라마이신(anthramycin), 테트라세노마이신(tetracenomycin), 카르민산(Carminic acid) 및 프레놀리신(frenolicin)로 구성된 군에서 선택되는 타입 II 폴리케타이드; 및
알로에신(aloesin), 알로에닌(aloenin), 바바로인(barbaloin), 5,7-다이하이드록시-2-메틸크로몬(5,7-dihydroxy-2-methylchromone) 및 알로에손(aloesone)로 구성된 군에서 선택되는 타입 III 폴리케타이드;로 구성된 군에서 선택되는 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.
본 발명에 있어서, 상기 페닐프로파노이드는
액티노마이신(actinomycin), 바키트라신(bacitracin), 답토마이신(daptomycin), 밴코마이신(vancomycin), 테익소박틴(teixobactin), 타이로시딘(tyrocidine), 그라미시딘(gramicidin), 즈위터미신 A(zwittermicin A), 블레오마이신(bleomycin), 시클로스포린(ciclosporin), 피오버딘(pyoverdine), 엔테로박틴(enterobactin), 믹소켈린 A(myxochelin A), 인디고이딘(indigoidine), 사이아노피신(cyanophycin) 등으로 구성된 비리보솜 펩티드, 피노켐브린(pinocembrin), 다이하이드로캄페롤(dihydrokaempferol), 에리오딕티올(eriodictyol), 다이하이드로쿼세틴(dihydroquercetin), 코리페릴알코올(coniferyl alcohol), 실리빈 (silybin), 아이소실리빈 (isosilybin), 실리크리스틴 (silychristin), 실리나이드(silinide), 2,3-디하이드로실리빈(2,3-dehydrosilybin), 실리다이아닌(silydianin), 다이드제인(daidzein), 게니스타인(genistein), 아피게닌(apigenin), 루테올린(luteolin), 캄페롤(kaempferol), 쿼세틴(quercetin), 카테킨(catechin), 페라고니딘(pelargonidin), 시아니딘(cyanidin), 압젤레친(afzelechin), 미리세틴(myricetin), 피세틴(fisetin), 갈랑긴(galangin), 헤스페레틴(hesperetin), 탄제리틴(tangeritin), 델피니딘(delphinidin), 에피카테킨(epicatechin), 크리신(chrysin), 레스베라트롤(resveratrol) 및 나린제닌(naringenin)으로 구성된 군에서 선택되는 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.
본 발명에 있어서, 상기 숙주 미생물은 생산하고자 하는 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 전구체의 생산능을 갖는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 전구체는 폴리케타이드 및/또는 페닐프로파노이드 일 수 있으며, 바람직하게는 당화되지 않은 폴리케타이드 및/또는 페닐프로파노이드 일 수 있다.
본 발명에 있어서, 상기 숙주 미생물은 선천적으로 상기 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 전구체를 생산하거나, 유전자 조작을 통해 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 전구체를 생산하도록 제조된 재조합 미생물인 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 재조합 미생물은 도입된 C-글리코실전이효소에 의한 배당체 전환율을 향상시키기 위해, 뉴클레오타이드, 바람직하게는 NTP-당(NTP-sugar)의 생산이 강화된 것을 특징으로 할 수 있다. 예를 들어, 본 발명의 재조합 미생물은 UTP-글루코오스-1-포스페이트 우리딜트렌스퍼라아제 (UTP-glucose-1-phosphate uridylyltransferase), 포스포글루코뮤타아제(phosphoglucomutase) 및/또는 뉴클레오시드-디포스페이트 키나제(nucleoside-diphosphate kinase)를 암호화하는 유전자의 발현이 강화된 것을 추가적인 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 UTP-글루코오스-1-포스페이트 우리딜트렌스퍼라아제, 포스포글루코뮤타아제 및/또는 뉴클레오시드-디포스페이트 키나제는 E. coli 유래;인 것을 특징으로 할 수 있으나, 이에 한정되는 것은 아니며 숙주 균주에 따라 NTP-Sugar의 생성에 관여하는 유전자의 발현이 강화되는 것을 특징으로 할 수 있다.
본 발명의 일 실시예에서, 상기 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 전구체로, 플라보케르메신 산(flavokermesic acid), 케르메신 산(kermesic acid), 알로에손(aloesone), 나린제닌(naringenin), 아피제닌(apigenin) 또는 루테올린(luteolin)을 사용하였으나 이에 제한되는 것은 아니며, 상기 기재한 다양한 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 전구체는 당업계에 자명하게 공지되어 있으므로, 이로부터 용이하게 선택될 수 있다.
본 발명에서 용어 "핵산(nucleic acid)"은 일반적으로 자연 환경으로부터 분리되거나 인공적으로 합성된 분리된 형태의 뉴클레오티드, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 또는 임의의 길이의 이들의 유사체를 의미한다. 본 발명의 핵산은 분리될 수 있다. 예를 들어, 이는 다음과 같은 방법으로 생산 또는 합성될 수 있다: (i) 중합 효소 연쇄 반응 (PCR) 증폭과 같은 시험관 내 증폭, (ii) 클론 재조합, (iii) 정제, 예를 들어 제한 효소 분해에 의한 분별 (fractionation) 및 겔 전기 영동, 또는 (iv) 합성, 예를 들어 화학적 합성. 일부 구체예에서, 상기 단리된 핵산은 재조합 DNA 기술에 의해 제조된 핵산 분자이다. 본 발명에서, 상기 변이체를 암호화하는 핵산은 당업계에 공지된 다양한 방법에 의해 제조될 수 있다. 이러한 방법은 제한 단편 작업 또는 합성 올리고 뉴클레오티드를 사용하는 중첩 연장 PCR(overlap extension PCR)을 포함하지만 이에 한정되지는 않는다. 제조 방법과 원리는 Sambrook et al., Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989; 및 Ausube et al. Current Protocols in Molecular Biology, Greene Publishing and Wiley-Interscience, New York NY, 1993에서 확인할 수 있다.
본 발명에서, 용어 "플라스미드(plasmid)"는 벡터(vector)와 상호 교환적으로 사용될 수 있으며, 일반적으로 삽입된 핵산을 숙주 세포(이는 숙주 미생물을 포함함)로 전달하여, 숙주 세포나 미생물에서 자가 복제가 가능한 핵산 분자를 지칭한다. 상기 벡터는 주로 DNA 또는 RNA를 세포에 삽입하는데 사용되는 벡터, 주로 DNA 또는 RNA 복제에 사용되는 벡터, 및 DNA 또는 RNA의 전사 및/또는 번역 발현에 주로 사용되는 벡터를 포함할 수 있다. 상기 벡터는 또한 다중의 기능을 갖는 벡터를 포함한다. 상기 벡터는 적합한 숙주 세포에 도입될 때 폴리펩티드로 전사 및 번역될 수 있는 폴리뉴클레오티드일 수 있다. 일반적으로, 상기 벡터를 함유하는 적합한 숙주 세포를 배양함으로써, 상기 벡터는 원하는 발현 생성물을 생산할 수 있다. 본 발명에서, 상기 벡터는 상기 핵산 중 하나 이상을 포함할 수 있다. 예를 들어, 상기 벡터는 상기 변이체를 암호화하는데 필요한 모든 핵산 분자를 포함할 수 있다. 이 경우, 본 출원의 융합 단백질을 얻기 위해 오직 하나의 벡터만 필요하다. 일부 구체예에서, 상기 벡터는 상기 변이체의 일부를 암호화하는 핵산 분자를 포함할 수 있다. 대안적으로, 상기 벡터는 예를 들어 상기 재조합 미생물에서 유전자 발현을 조절하기 위한 핵산 분자를 포함할 수 있다. 이때, 본 발명의 재조합 미생물을 얻기 위해서는 2 개 이상의 서로 다른 벡터가 필요할 수 있다.
또한, 상기 벡터는 적절한 숙주 세포 및 적절한 조건 하에서 벡터를 선별하는 마커 유전자와 같은 다른 유전자를 포함할 수도 있다. 또한, 상기 벡터는 적절한 숙주에서 코딩 영역이 적절하게 발현되도록 하는 발현 제어 요소(control element)를 포함할 수도 있다. 이러한 제어 요소는 당업자에게 잘 알려져있다. 예를 들어, 이들은 프로모터, 리보솜 결합 부위, 인핸서 및 유전자 전사 또는 mRNA 번역을 조절하는 기타 제어 요소를 포함할 수 있다. 일부 구체예에서, 상기 발현 제어 서열은 조절 요소(regulatory element)이다. 상기 발현 조절 서열의 특정 구조는 종 또는 세포 유형의 기능에 따라 달라질 수 있지만, 일반적으로 TATA 박스, 캡피드 서열(capped sequences), CAAT 서열 등과 같은 전사 및 번역 개시에 관여하는 5 ' 비-전사 서열 및 5' 및 3' 비-번역 서열을 포함한다. 예를 들어, 5' 비-전사 발현 조절 서열은 프로모터 영역을 포함할 수 있고, 프로모터 영역은 기능적으로 연결된 핵산의 전사 조절을 위한 프로모터 서열을 포함할 수 있다. 본 발명에서, 상기 벡터는 pET-30a-c(+), pET-22b(+), pCDFDuet-1, pACYCDuet-1, pRSFDuet-1, pBBR1MCS, pSC101, pTac15K, pTrc99A, pCOLADuet-1 및 pBR322로 구성된 군에서 선택될 수 있으나, 이에 한정되지는 않으며, 통상의 기술자는 상기한 벡터 이외에도 본 기술분야에서 통상적으로 사용되는 벡터를 적절히 선택하여 사용할 수 있을 것이다.
본 발명에서 용어 "숙주 세포", "세포", "숙주 미생물" 및 "숙주"는 상호 교환적으로 사용될 수 있으며, 일반적으로 본 발명의 핵산을 포함하거나 포함할 수 있는 플라스미드 또는 벡터 또는 본 발명의 변이체 또는 발현이 조절되는 단백질이나 폴리펩티드들을 발현할 수 있는 개별 세포, 세포주, 미생물 또는 세포 배양물을 지칭한다. 상기 숙주 세포는 단일 숙주 세포의 자손을 포함할 수 있다. 자연적, 우발적(accidental) 또는 고의적(deliberate) 돌연변이로 인해, 자손 세포와 원래의 모세포는 본 발명의 목적 단백질이나 폴리펩티드를 발현할 수 있는 한, 형태나 게놈이 반드시 완전히 동일할 수는 없다. 상기 숙주 세포는 본 발명의 벡터로 시험관 내 세포를 형질 감염시킴으로써 수득될 수 있다. 상기 숙주 세포는 바람직하게는 미생물 일 수 있으며, 예컨대, 대장균(E. coli.), 리조비움(Rhizobium), 비피도박테리움 (Bifidobacterium), 칸디다 (Candida), 에르위니아(Erwinia), 엔테로박터 (Enterobacter), 파스테렐라(Pasteurella), 맨하이미아 (Mannheimia), 액티노바실러스 (Actinobacillus), 아그레가티박터 (Aggregatibacter), 잔토모나스(Xanthomonas), 비브리오(Vibrio), 아조토박터(Azotobacter), 애시네토박터(Acinetobacter), 랄스토니아(Ralstonia), 아그로박테리움(Agrobacterium), 로도박터(Rhodobacter), 자이모모나스(Zymomonas), 바실러스(Bacillus), 스테필로코커스(Staphylococcus), 락토코커스(Lactococcus), 스트렙토코커스(Streptococcus), 락토바실러스(Lactobacillus), 클로스트리디움(Clostridium), 코리네박테리움(Corynebacterium), 스트렙토마이세스(Streptomyces), 비피도박테리움(Bifidobacterium), 사이아노박테리움(Cyanobacterium) 및 사이클로박테리움(Cyclobacterium)로 구성된 군에서 선택될 수 있으나, 이에 한정되지는 않는다.
한편, 본 발명에서는 상기 C-글리코실전이효소 변이체를 발현할 수 있는 재조합 미생물을 사용하여, 다양한 폴리케타이드 배당체 또는 페닐프로파노이드 배당체를 효과적으로 생산해 낼 수 있음을 확인하였다.
따라서, 본 발명은 또 다른 관점에서, 본 발명의 C-글리코실전이효소 변이체를 암호화하는 핵산이 도입된 폴리케타이드 배당체 또는 페닐프로파노이드 배당체의 생산용 재조합 미생물에 관한 것이다.
본 발명에 있어서, 상기 폴리케타이드 배당체는 타입 I 폴리케타이드 배당체, 타입 II 폴리케타이드 배당체, 또는 타입 III 폴리케타이드 배당체일 수 있다.
본 발명에 있어서, 상기 폴리케타이드는
라파마이신(rapamycin), 로바스타틴(lovastatin), 에리트로마이신(erythromycin), 리파마이신(rifamycin), 아버멕틴(avermectin), 겔다나마이신(geldanamycin), 이버멕틴(ivermectin), 칼리케아마이신(calicheamicin), 에포타일론(epothilone), 트라이아세트산 락톤(triacetic acid lactone) 및 6-메틸살리실산(6-methylsalicylic acid)로 구성된 군에서 선택되는 타입 I 폴리케타이드;
액티로노딘(actinorhodin), 독소루비신(doxorubicin), 다우노루비신(daunorubicin), 옥시테트라사이클린(oxytetracycline), SEK4, SEK4b, SEK34, SEK15, SEK26, FK506, DMAC, 아클라비논(aklavinone), 아클라노닉산(aklanonic acid), 엡실론 로도마이시논(epsilon-rhodomycinone), 독시사이클린(doxycycline), 안트라마이신(anthramycin), 테트라세노마이신(tetracenomycin), 카르민산(Carminic acid) 및 프레놀리신(frenolicin)로 구성된 군에서 선택되는 타입 II 폴리케타이드; 및
알로에신(aloesin), 알로에닌(aloenin), 바바로인(barbaloin), 5,7-다이하이드록시-2-메틸크로몬(5,7-dihydroxy-2-methylchromone) 및 알로에손(aloesone)로 구성된 군에서 선택되는 타입 III 폴리케타이드;로 구성된 군에서 선택되는 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.
본 발명에 있어서, 상기 폴리케타이드 배당체 또는 페닐프로파노이드 배당체의 생산용 재조합 미생물은 각 배당체의 전구체를 생산하는 것을 특징으로 할 수 있다. 예를 들어, 상기 재조합 미생물은 각 배당체의 전구체인 폴리케타이드 또는 페닐프로파노이드를 생산하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 폴리케타이드 배당체 또는 페닐프로파노이드 배당체의 생산용 재조합 미생물은 추가적인 유전자 도입을 통해 폴리케타이드 폴리케타이드 또는 페닐프로파노이드를 생산하는 것을 특징으로 할 수 있다. 유전자 도입을 통한 폴리케타이드 합성능을 갖는 재조합 미생물은 예를 들어, 본 발명자들의 공개 논문인 Yang, D., Kim, W.J., Yoo, S.M., Choi, J.H., Ha, S.H., Lee, M.H., and Lee, S.Y. "Repurposing type III polyketide synthase as a malonyl-CoA biosensor for metabolic engineering in bacteria", Proc. Natl. Acad. Sci. (PNAS), 115 (40) 9835-9844 (https://doi.org/10.1073/pnas.1808567115) (2018.10.2) 및 대한민국 등록특허 제10-2187682호에 기재된 유전자 및 방법으로 제조가능하나, 이에 제한되는 것은 아니다. 통상의 기술자는 당업계에 기재된 다양한 폴리케타이드 또는 페닐프로파노이드의 합성경로 및 이에 관여하는 유전자를 사용하여 다양한 숙주 미생물에 도입함으로써, 폴리케타이드 또는 페닐프로파노이드 합성능을 갖는 재조합 미생물을 제작할 수 있다.
본 발명에 있어서, 상기 폴리케타이드 배당체 또는 페닐프로파노이드 배당체의 생산용 재조합 미생물은 폴리케타이드 합성효소 또는 페닐프로파노이드 합성효소가 도입된 것을 추가적인 특징으로 할 수 있다.
본 발명에 있어서, 상기 폴리케타이드 합성효소는 예를 들어, 타입 I 폴리케타이드 합성효소, 타입 II 폴리케타이드 합성효소 또는 타입 III 폴리케타이드 합성효소일 수 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 폴리케타이드 배당체 또는 페닐프로파노이드 배당체의 생산용 재조합 미생물이 각 배당체의 전구체를 생산하지 않는 경우, 배양 배지에 각 배당체의 전구체를 첨가하여 상기 폴리케타이드 배당체 또는 페닐프로파노이드 배당체를 생산할 수 있다.
본 발명에 있어서, 상기 재조합 미생물은 타입 I 폴리케타이드 배당체의 생산용인 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 타입 I 폴리케타이드 배당체의 생산용 재조합 미생물은 타입 I 폴리케타이드 배당체의 전구체를 생산하는 것을 특징으로 할 수 있다. 예를 들어, 타입 I 폴리케타이드 배당체의 전구체는 라파마이신(rapamycin), 로바스타틴(lovastatin), 에리트로마이신(erythromycin), 리파마이신(rifamycin) 등일 수 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 타입 I 폴리케타이드 배당체의 생산용 재조합 미생물은 추가적인 유전자 도입을 통해 타입 I 폴리케타이드 배당체의 전구체를 생산하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 타입 I 폴리케타이드 배당체의 생산용 재조합 미생물은 예를 들어,
(i) 타입 I 폴리케타이드 생합성 효소를 암호화하는 유전자가 추가로 도입된 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 타입 I 폴리케타이드 생합성 효소는 다양한 단백질 및 유전자 데이터베이스로부터 쉽게 선택될 수 있다.
따라서, 본 발명의 C-글리코실전이효소 변이체를 암호화하는 핵산; 및 타입 I 폴리케타이드 생합성 효소 유전자;가 도입되는 숙주 미생물은 보조효소 A, 바람직하게는 말로닐-CoA 또는 아세틸-CoA의 생산능을 갖는 것을 특징으로 할 수 있다.
따라서, 본 발명에 있어서, 상기 재조합 미생물은 보조효소 A의 생산이 강화된 것을 특징으로 할 수 있다. 예를 들어, 본 발명에 있어서, 상기 재조합 미생물은 (ii) pabA 유전자의 발현이 억제 또는 약화된 것을 추가적인 특징으로 할 수 있으나, 이에 제한되는 것은 아니며, 당업계에 공지된 다양한 보조효소 A의 대량생산 전략을 이용하여 보조효소 A의 생산이 강화된 재조합 미생물을 제조할 수 있다.
본 발명에 있어서, 상기 재조합 미생물은 도입된 C-글리코실전이효소에 의한 배당체 전환율을 향상시키기 위해, 뉴클레오타이드, 바람직하게는 NTP-당(NTP-sugar)의 생산이 강화된 것을 특징으로 할 수 있다. 예를 들어, 본 발명에 있어서, 상기 재조합 미생물은 (iii) UTP-글루코오스-1-포스페이트 우리딜트렌스퍼라아제 (UTP-glucose-1-phosphate uridylyltransferase), 포스포글루코뮤타아제(phosphoglucomutase) 및/또는 뉴클레오시드-디포스페이트 키나제(nucleoside-diphosphate kinase)를 암호화하는 유전자의 발현이 강화된 것을 추가적인 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 재조합 미생물은 타입 II 폴리케타이드 배당체의 생산용인 것을 특징으로 할 수 있다. 예를 들어, 상기 타입 II 폴리케타이드 배당체는 카르민산인 것을 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 타입 II 폴리케타이드 배당체의 생산용 재조합 미생물은 타입 II 폴리케타이드 배당체의 전구체를 생산하는 것을 특징으로 할 수 있다. 예를 들어, 타입 II 폴리케타이드 배당체의 전구체는 플라보케르민산 또는 케르민산인 것을 할 수 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 타입 II 폴리케타이드 배당체의 생산용 재조합 미생물은 추가적인 유전자 도입을 통해 타입 II 폴리케타이드 배당체의 전구체를 생산하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 타입 II 폴리케타이드 배당체의 생산용 재조합 미생물은 (i) 타입 II 폴리케타이드 생합성 효소를 암호화하는 유전자가 추가로 도입된 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 타입 II 폴리케타이드 배당체, 바람직하게는 카르민산의 생산용 재조합 미생물은 예를 들어,
(i) 타입 II 폴리케타이드 생합성 효소를 암호화하는 유전자;
(ii) 4'-포스포판테인닐 전이효소 (4'-phosphopantetheinyl transferase)를 암호화하는 유전자;
(iii) 사이클라아제(cyclase)를 암호화하는 유전자;
(iv) 아세틸-CoA 카르복실화 효소 (acetyl-CoA carboxylase)를 암호화하는 유전자; 및
(v) 아클라비네온 12-수산화효소 (aklavinone 12-hydroxylase)를 암호화하는 유전자로, 구성된 군에서 선택되는 어느 하나 이상의 유전자가 추가로 도입되는 것을 특징으로 할 수 있으며, 바람직하게는 상기 유전자가 전부 도입되는 것을 특징으로 할 수 있다.
도 1에 도시된 것과 같이, 본 발명의 C-글리코실전이효소의 기질인 타입 II 폴리케타이드는 예를 들어, 말로닐-CoA 또는 아세틸-CoA와 같은 보조효소 A(Coenzyme A, CoA)로부터 상기 도입된 유전자가 암호화하는 효소에 의해 본 발명의 C-글리코실전이효소의 기질인 타입 II 폴리케타이드로 변환될 수 있다. 따라서, 상기 C-글리코실전이효소 변이체를 암호화하는 핵산; 및 타입 II 폴리케타이드 생합성 효소 유전자 또는 상기 (i) 내지 (v)의 유전자;가 도입되는 숙주 미생물은 보조효소 A, 바람직하게는 말로닐-CoA 또는 아세틸-CoA의 생산능을 갖는 것을 특징으로 할 수 있다.
본 발명의 실시예에서, pabA 유전자의 발현 억제 또는 약화를 통해 보조효소 A가 축적되며, 결과적으로, 본 발명의 C-글리코실전이효소의 전구체인 폴리케타이드의 합성이 향상되는 것을 확인하였다.
따라서, 본 발명에 있어서, 상기 재조합 미생물은 보조효소 A의 생산이 강화된 것을 특징으로 할 수 있다. 예를 들어, 본 발명에 있어서, 상기 재조합 미생물은 (ii) pabA 유전자의 발현이 억제 또는 약화된 것을 추가적인 특징으로 할 수 있으나, 이에 제한되는 것은 아니며, 당업계에 공지된 다양한 보조효소 A의 대량생산 전략을 이용하여 보조효소 A의 생산이 강화된 재조합 미생물을 제조할 수 있다.
본 발명에 있어서, 상기 재조합 미생물은 도입된 C-글리코실전이효소에 의한 배당체 전환율을 향상시키기 위해, 뉴클레오타이드, 바람직하게는 NTP-당(NTP-sugar)의 생산이 강화된 것을 특징으로 할 수 있다. 예를 들어, 본 발명에 있어서, 상기 재조합 미생물은 (iii) UTP-글루코오스-1-포스페이트 우리딜트렌스퍼라아제 (UTP-glucose-1-phosphate uridylyltransferase), 포스포글루코뮤타아제(phosphoglucomutase) 및/또는 뉴클레오시드-디포스페이트 키나제(nucleoside-diphosphate kinase)를 암호화하는 유전자의 발현이 강화된 것을 추가적인 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 UTP-글루코오스-1-포스페이트 우리딜트렌스퍼라아제, 포스포글루코뮤타아제 및/또는 뉴클레오시드-디포스페이트 키나제는 E. coli 유래;인 것을 특징으로 할 수 있으나, 이에 한정되는 것은 아니며 숙주 균주에 따라 NTP-Sugar의 생성에 관여하는 유전자의 발현이 강화되는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 타입 II 폴리케타이드 생합성 효소를 암호화하는 유전자는 antD (ketosynthase), antE (chain-length factor), antF (ACP), antB (phosphopantetheinyl transferase) 및 antG (malonyl-CoA:ACP malonyltransferase)로 구성된 군에서 선택되는 어느 하나 이상의 유전자 또는 이들의 조합인 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.
본 발명에 있어서, 상기 아클라비네온 12-수산화효소는 서열번호 2로 표시되는 아미노산 서열에서 217번째 아미노산이 프롤린에서 라이신으로의 변이(P217K)를 포함하는 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.
본 발명에 있어서, 상기 타입 II 폴리케타이드 생합성 효소는 P. luminescens 유래;
상기 4'-포스포판테인닐 전이효소는 Bacillus subtilis 또는 P. luminescens 유래;
상기 사이클라아제는 Streptomyces sp. 유래;
상기 아세틸-CoA 카르복실화 효소는 Corynebacterium glutamicum 유래; 및/또는
상기 아클라비네온 12-수산화효소는 Streptomyces peucetius 유래;인 것을 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 재조합 미생물은 타입 III 폴리케타이드 배당체의 생산용인 것을 특징으로 할 수 있다. 예를 들어 본 발명에 있어서, 상기 타입 III 폴리케타이드 배당체는 알로에신인 것을 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 타입 III 폴리케타이드 배당체의 생산용 재조합 미생물은 타입 III 폴리케타이드 배당체의 전구체를 생산하는 것을 특징으로 할 수 있다. 예를 들어, 타입 III 폴리케타이드 배당체의 전구체는 알로에손인 것을 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 타입 III 폴리케타이드 배당체의 생산용 재조합 미생물은 추가적인 유전자 도입을 통해 타입 III 폴리케타이드 배당체의 전구체를 생산하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 타입 III 폴리케타이드 배당체의 생산용 재조합 미생물은 예를 들어,
(i) 타입 III 폴리케타이드 생합성 효소를 암호화하는 유전자가 도입된 것을 특징으로 할 수 있다. 예를 들어, 상기 타입 III 폴리케타이드 생합성 효소는 알로에손 합성효소(aloesone synthase)일 수 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 알로에손 합성효소는 R. palmatum 유래인 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.
도 8에 도시된 것과 같이, 본 발명의 C-글리코실전이효소의 기질인 타입 III 폴리케타이드(예, 알로에손)는 예를 들어, 말로닐-CoA 또는 아세틸-CoA와 같은 보조효소 A(Coenzyme A, CoA)로부터 상기 도입된 유전자가 암호화하는 효소에 의해 본 발명의 C-글리코실전이효소의 기질인 타입 III 폴리케타이드로 변환될 수 있다. 따라서, C-글리코실전이효소 변이체를 암호화하는 핵산; 및 타입 III 폴리케타이드 생합성 효소 유전자;가 도입되는 숙주 미생물은 보조효소 A, 바람직하게는 말로닐-CoA 또는 아세틸-CoA의 생산능을 갖는 것을 특징으로 할 수 있다.
따라서, 본 발명에 있어서, 상기 재조합 미생물은 보조효소 A의 생산이 강화된 것을 특징으로 할 수 있다. 예를 들어, 본 발명에 있어서, 상기 재조합 미생물은 (ii) pabA 유전자의 발현이 억제 또는 약화된 것을 추가적인 특징으로 할 수 있으나, 이에 제한되는 것은 아니며, 당업계에 공지된 다양한 보조효소 A의 대량생산 전략을 이용하여 보조효소 A의 생산이 강화된 재조합 미생물을 제조할 수 있다.
본 발명에 있어서, 상기 재조합 미생물은 도입된 C-글리코실전이효소에 의한 배당체 전환율을 향상시키기 위해, 뉴클레오타이드, 바람직하게는 NTP-당(NTP-sugar)의 생산이 강화된 것을 특징으로 할 수 있다. 예를 들어, 본 발명에 있어서, 상기 재조합 미생물은 (iii) UTP-글루코오스-1-포스페이트 우리딜트렌스퍼라아제 (UTP-glucose-1-phosphate uridylyltransferase), 포스포글루코뮤타아제(phosphoglucomutase) 및/또는 뉴클레오시드-디포스페이트 키나제(nucleoside-diphosphate kinase)를 암호화하는 유전자의 발현이 강화된 것을 추가적인 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 UTP-글루코오스-1-포스페이트 우리딜트렌스퍼라아제, 포스포글루코뮤타아제 및/또는 뉴클레오시드-디포스페이트 키나제는 E. coli 유래;인 것을 특징으로 할 수 있으나, 이에 한정되는 것은 아니며 숙주 균주에 따라 NTP-Sugar의 생성에 관여하는 유전자의 발현이 강화되는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 재조합 미생물은 페닐프로파노이드 배당체의 생산용인 것을 특징으로 할 수 있다. 예를 들어, 상기 페닐프로파노이드 배당체는 비텍신(Vitexin), naringenin-6-C-glucoside 또는 isoorientin인 것을 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 페닐프로파노이드 배당체의 생산용 재조합 미생물은 상기 페닐프로파노이드 배당체의 전구체를 생산하는 것을 특징으로 할 수 있다. 예를 들어, 상기 페닐프로파노이드 배당체의 전구체는 아피제닌(apigenin), 나린제닌(naringenin) 또는 루테올린(luteolin)인 것을 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 페닐프로파노이드 배당체의 생산용 재조합 미생물은 추가적인 유전자 도입을 통해 페닐프로파노이드 배당체의 전구체를 생산하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 페닐프로파노이드 배당체의 생산용 재조합 미생물은 예를 들어,
(i) 페닐프로파노이드 생합성 효소를 암호화하는 유전자가 추가로 도입된 것을 특징으로 할 수 있다.
페닐프로파노이드는, 말로닐-CoA 또는 방향족-CoA(예, 쿠마로일-CoA)와 같은 보조효소 A(Coenzyme A, CoA)로부터 상기 도입된 유전자가 암호화하는 효소에 의해 본 발명의 C-글리코실전이효소의 기질인 페닐프로파노이드로 변환될 수 있다. 따라서, 상기 C-글리코실전이효소 변이체를 암호화하는 핵산; 및 페닐프로파노이드 생합성 효소 유전자가 도입되는 숙주 미생물은 보조효소 A, 바람직하게는 말로닐-CoA 또는 쿠마로일-CoA의 생산능을 갖는 것을 특징으로 할 수 있다.
따라서, 본 발명에 있어서, 상기 재조합 미생물은 보조효소 A의 생산이 강화된 것을 특징으로 할 수 있다. 예를 들어, 본 발명에 있어서, 상기 재조합 미생물은 (ii) pabA 유전자의 발현이 억제 또는 약화된 것을 추가적인 특징으로 할 수 있으나, 이에 제한되는 것은 아니며, 당업계에 공지된 다양한 보조효소 A의 대량생산 전략을 이용하여 보조효소 A의 생산이 강화된 재조합 미생물을 제조할 수 있다.
본 발명에 있어서, 상기 재조합 미생물은 도입된 C-글리코실전이효소에 의한 배당체 전환율을 향상시키기 위해, 뉴클레오타이드, 바람직하게는 NTP-당(NTP-sugar)의 생산이 강화된 것을 특징으로 할 수 있다. 예를 들어, 본 발명에 있어서, 상기 재조합 미생물은 (iii) UTP-글루코오스-1-포스페이트 우리딜트렌스퍼라아제 (UTP-glucose-1-phosphate uridylyltransferase), 포스포글루코뮤타아제(phosphoglucomutase) 및/또는 뉴클레오시드-디포스페이트 키나제(nucleoside-diphosphate kinase)를 암호화하는 유전자의 발현이 강화된 것을 추가적인 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 UTP-글루코오스-1-포스페이트 우리딜트렌스퍼라아제, 포스포글루코뮤타아제 및/또는 뉴클레오시드-디포스페이트 키나제는 E. coli 유래;인 것을 특징으로 할 수 있으나, 이에 한정되는 것은 아니며 숙주 균주에 따라 NTP-Sugar의 생성에 관여하는 유전자의 발현이 강화되는 것을 특징으로 할 수 있다.
예를 들어 본 발명의 재조합 미생물은, 본 발명의 C-글리코실전이효소를 암호화하는 핵산이 도입된 재조합 미생물에서,
(i) 타입 II 폴리케타이드 생합성 효소를 암호화하는 유전자의 도입;
(ii) 4'-포스포판테인닐 전이효소 (4'-phosphopantetheinyl transferase)를 암호화하는 유전자의 도입;
(iii) 사이클라아제(cyclase)를 암호화하는 유전자의 도입;
(iv) 아세틸-CoA 카르복실화 효소 (acetyl-CoA carboxylase)를 암호화하는 유전자의 도입;
(v) 아클라비네온 12-수산화효소 (aklavinone 12-hydroxylase)를 암호화하는 유전자의 도입;
(vi) UTP-글루코오스-1-포스페이트 우리딜트렌스퍼라아제 (UTP-glucose-1-phosphate uridylyltransferase), 포스포글루코뮤타아제(phosphoglucomutase) 및/또는 뉴클레오시드-디포스페이트 키나제(nucleoside-diphosphate kinase)를 암호화하는 유전자의 발현 강화; 및
(vii) pabA 유전자의 발현 약화; 로 구성된 군에서 선택되는 어느 하나 이상의 유전자 도입 또는 유전자 발현이 조절되어 있는, 카르민산 생산용 재조합 미생물인 것을 특징으로 할 수 있다.
또 다른 예를 들어, 본 발명의 재조합 미생물은, 본 발명의 C-글리코실전이효소를 암호화하는 핵산이 도입된 재조합 미생물에서,
(i) 알로에손 합성효소(aloesone synthase)를 암호화하는 유전자의 도입;
(ii) pabA 유전자의 발현 약화; 및
(iii) 글루코오스 6-포스페이트 1-디하이드로게나아제(glucose 6-phosphate 1-dehydrogenase)를 암호화하는 유전자의 발현 강화;로 구성된 군에서 선택되는 어느 하나 이상의 유전자 도입 또는 유전자 발현이 조절되어 있는, 알로에신 생산용 재조합 미생물인 것을 특징으로 할 수 있다.
또 다른 예를 들어, 본 발명의 재조합 미생물은, 본 발명의 C-글리코실전이효소를 암호화하는 핵산이 도입된 재조합 미생물에서,
UTP-글루코오스-1-포스페이트 우리딜트렌스퍼라아제 (UTP-glucose-1-phosphate uridylyltransferase), 포스포글루코뮤타아제(phosphoglucomutase) 및/또는 뉴클레오시드-디포스페이트 키나제(nucleoside-diphosphate kinase)를 암호화하는 유전자의 발현이 강화되어 있는, 폴리케타이드 배당체 또는 페닐프로파노이드 배당체 생산용 재조합 미생물인 것을 특징으로 할 수 있다.
본 발명에서, 유전자의 도입이란 외래의 유전자가 숙주 미생물에 벡터와 같은 수단을 통해 도입되거나, 또는 직접적으로 숙주 미생물의 게놈에 삽입된 것을 의미한다.
본 발명에서, 유전자의 발현 강화란 상기 유전자에 의해 생성되는 펩타이드 또는 단백질이 숙주 미생물에 없는 경우 이를 인위적으로 숙주 미생물에서 발현하도록 하여 펩타이드 또는 단백질의 활성 또는 기능을 갖도록 하는 것을 의미하고, 상기 유전자가 이미 숙주 미생물에 있는 경우 그 유전자의 발현을 조절하는 내재적 프로모터를 강력한 상시 발현 프로모터로 교체하거나, 상기 유전자를 외부에서 복제능이 강한 벡터 등을 이용해 추가로 도입하는 등 유전자의 카피 수를 증가시키는 등의 일련의 방법을 사용하여 상기 유전자의 과발현 등을 유도하거나 상기 유전자에 의해 생성되는 펩타이드 또는 단백질의 활성 또는 기능이 내재적 활성 또는 기능에 비하여 강화되도록 변형하는 것을 의미한다.
본 발명에서, 유전자의 발현 약화란 해당 유전자의 일부 또는 전체염기를 변이, 치환 또는 삭제시키거나, 상기 유전자 발현을 억제할 수 있는 억제제(예컨대, sRNA 등)의 도입을 통해 해당유전자가 발현되지 않도록 하거나 발현되더라도 활성 또는 기능을 나타내지 못하도록 하는 것으로, 상기 유전자에 의해 생성되는 펩타이드 또는 단백질의 활성 또는 기능이 내재적 활성 또는 기능에 비하여 약화되도록 변형됨을 포괄하는 개념이다.
본 발명에서 사용되는 용어 "내재적 활성 또는 기능"이란, 본래 미생물이 변형되지 않은 상태에서 가지고 있는 효소, 펩타이드, 단백질 등이 보유하는 활성 또는 기능을 의미한다.
본 발명에서 "내재적 활성 또는 기능에 비하여 강화되도록 변형"되었다는 것은, 활성 또는 기능을 나타내는 유전자가 도입되거나 또는 당해 유전자의 카피수 증가(예를 들어, 유전자가 도입된 플라스미드를 이용한 발현), 상기 유전자 발현의 억제 조절 인자의 결실 또는 발현조절 서열의 변형, 예를 들어 개량된 프로모터의 사용 등과 같이, 조작이 이루어지기 전의 미생물이 가지는 활성에 비하여 조작이 이루어진 이후의 미생물이 가지고 있는 활성 또는 기능이 새로이 발생하거나 증가된 상태를 의미한다.
본 발명에서 "내재적 활성 또는 기능에 비하여 약화되도록 변형"되었다는 것은, 활성 또는 기능을 나타내는 유전자의 결실이나 유전자의 불활성화(예를 들어, 돌연변이 유전자로의 치환), 유전자 발현의 약화(예를 들어, 약한 프로모터로의 치환, siRNA, gRNA, sRNA 등의 도입, 시작 코돈을 ATG에서 GTG 등으로의 치환), 유전자에 의해 발현된 펩타이드의 기능 억제(예를 들어, 비경쟁적 억제자 또는 경쟁적 억제자 첨가) 등과 같은 조작이 이루어지기 전의 미생물이 가지는 기능에 비하여 조작이 이루어진 이후의 미생물이 가지고 있는 기능이 감소되거나 상실된 상태를 의미한다.
본 발명에서, 유전자 또는 프로모터의 "교체"란 종래 유전자 또는 프로모터를 제거하고 이와 상이한 유전자 (예컨대, 변이 유전자 등) 또는 강도가 상이한 프로모터를 새로이 도입하는 것을 의미하는 것으로, 상기 종래 유전자 또는 프로모터를 제거한다는 것은 해당 유전자 또는 프로모터를 결실시키는 것뿐만 아니라 그 기능을 억제시키거나 감소시키는 것도 포괄하는 개념이다.
본 발명에서 "과발현"이란 보통상태에서 세포내 해당유전자가 발현되는 수준보다 높은 수준의 발현을 일컫는 것으로써, 유전체 상에 존재하는 유전자의 프로모터를 강력한 프로모터로 치환하거나, 발현벡터에 해당유전자를 클로닝하여 세포에 형질전환시키는 방법을 통해 발현량을 증가시키는 것 등을 포함하는 개념이다.
본 발명에서 "벡터(vector)"는 적합한 숙주 내에서 DNA를 발현시킬 수 있는 적합한 조절 서열에 작동가능하게 연결된 DNA 서열을 함유하는 DNA 제조물을 의미한다. 벡터는 플라스미드, 파지 입자 또는 간단하게 잠재적 게놈 삽입물일 수 있다. 적당한 숙주로 형질전환되면, 벡터는 숙주 게놈과 무관하게 복제하고 기능할 수 있거나, 또는 일부 경우에 게놈 그 자체에 통합될 수 있다. 플라스미드가 현재 벡터의 가장 통상적으로 사용되는 형태이므로, 본 발명의 명세서에서 "플라스미드(plasmid)" 및 "벡터(vector)"는 때로 상호 교환적으로 사용된다. 본 발명의 목적상, 플라스미드 벡터를 이용하는 게 바람직하다. 이러한 목적에 사용될 수 있는 전형적인 플라스미드 벡터는 (a) 숙주세포당 수 개에서 수백 개의 플라스미드 벡터를 포함하도록 복제가 효율적으로 이루어지도록 하는 복제 개시점, (b) 플라스미드 벡터로 형질전환된 숙주세포가 선발될 수 있도록 하는 항생제 내성 유전자 및 (c) 외래 DNA 절편이 삽입될 수 있는 제한효소 절단부위를 포함하는 구조를 지니고 있다. 적절한 제한효소 절단 부위가 존재하지 않을지라도, 통상의 방법에 따른 합성 올리고뉴클레오타이드 어댑터(oligonucleotide adaptor) 또는 링커(linker)를 사용하면 벡터와 외래 DNA를 용이하게 라이게이션(ligation)할 수 있다. 라이게이션 후에, 벡터는 적절한 숙주세포로 형질전환되어야 한다. 형질전환은 칼슘 클로라이드 방법 또는 전기천공법(electroporation) (Neumann, et al., EMBO J., 1:841, 1982) 등을 사용해서 용이하게 달성될 수 있다.
상기 벡터의 프로모터는 구성적 또는 유도성일 수 있으며, 본 발명의 효과를 위해 추가적으로 변형될 수 있다. 또한 발현벡터는 벡터를 함유하는 숙주 세포를 선택하기 위한 선택성 마커를 포함하고, 복제 가능한 발현벡터인 경우 복제 기원(Ori)을 포함한다. 벡터는 자가 복제하거나 숙주 게놈 DNA에 통합될 수 있다. 바람직하게는 벡터 내로 삽입되어 전달된 유전자가 숙주세포의 게놈 내로 비가역적으로 융합되어 세포 내에서 유전자 발현이 장기간 안정적으로 지속되도록 하는 것이 바람직하다.
염기서열은 다른 핵산 서열과 기능적 관계로 배치될 때 "작동가능하게 연결(operably linked)"된다. 이것은 적절한 분자(예를 들면, 전사 활성화 단백질)가 조절 서열(들)에 결합될 때 유전자 발현을 가능하게 하는 방식으로 연결된 유전자 및 조절 서열(들)일 수 있다. 예를 들면, 전서열(pre-sequence) 또는 분비 리더 (leader)에 대한 DNA는 폴리펩타이드의 분비에 참여하는 전단백질로서 발현되는 경우 폴리펩타이드에 대한 DNA에 작동가능 하게 연결되고; 프로모터 또는 인핸서는 서열의 전사에 영향을 끼치는 경우 코딩서열에 작동가능하게 연결되거나; 또는 리보좀 결합 부위는 서열의 전사에 영향을 끼치는 경우 코딩 서열에 작동가능하게 연결되거나; 또는 리보좀 결합 부위는 번역을 용이하게 하도록 배치되는 경우 코딩 서열에 작동가능하게 연결된다. 일반적으로, "작동가능하게 연결된"은 연결된 DNA 서열이 접촉하고, 또한 분비 리더의 경우 접촉하고 리딩 프레임 내에 존재하는 것을 의미한다. 그러나, 인핸서(enhancer)는 접촉할 필요가 없다. 이들 서열의 연결은 편리한 제한 효소 부위에서 라이게이션(연결)에 의해 수행된다. 그러한 부위가 존재하지 않는 경우, 통상의 방법에 따른 합성 올리고뉴클레오티드 어댑터(oligonucleotide adaptor) 또는 링커(linker)를 사용한다.
당업계에 주지된 바와 같이, 숙주세포에서 형질전환 유전자의 발현 수준을 높이기 위해서는, 해당 유전자가 선택된 발현 숙주 내에서 기능을 발휘하는 전사 및/또는 해독 발현 조절 서열에 작동가능하도록 연결되어야만 한다. 바람직하게는 발현 조절서열 및/또는 해당 유전자는 세균 선택 마커 및 복제 개시점(replication origin)을 같이 포함하고 있는 하나의 재조합벡터 내에 포함되게 된다. 숙주세포가 진핵세포인 경우에는, 재조합벡터는 진핵 발현숙주 내에서 유용한 발현 마커를 더 포함하여야만 한다.
상술한 재조합 벡터에 의해 형질전환된 숙주 세포는 본 발명의 또 다른 측면을 구성한다. 본원 명세서에 사용된 용어 "형질전환"은 DNA를 숙주로 도입하여 DNA가 염색체 외 인자로서 또는 염색체 통합완성에 의해 복제 가능하게 되는 것을 의미한다.
물론 모든 벡터가 본 발명의 DNA 서열을 발현하는데 모두 동등하게 기능을 발휘하지는 않는다는 것을 이해하여야만 한다. 마찬가지로 모든 숙주가 동일한 발현 시스템에 대해 동일하게 기능을 발휘하지는 않는다. 그러나, 당업자라면 과도한 실험적 부담없이 본 발명의 범위를 벗어나지 않는 채로 여러 벡터, 발현 조절 서열 및 숙주 중에서 적절한 선택을 할 수 있다. 예를 들어, 벡터를 선택함에 있어서는 숙주를 고려하여야 하는데, 이는 벡터가 그 안에서 복제되어야만 하기 때문이다.
본 발명은 또 다른 관점에서, 다음의 단계를 포함하는 폴리케타이드 배당체 또는 페닐프로파노이드 배당체의 제조방법에 관한 것이다:
(a) 본 발명의 C-글리코실전이효소 변이체를 암호화하는 핵산이 도입된 재조합 미생물을 배양하여, 폴리케타이드 배당체 또는 페닐프로파노이드 배당체를 생산하는 단계; 및
(b) 상기 생성된 폴리케타이드 배당체 또는 페닐프로파노이드 배당체를 회수하는 단계.
본 발명에 있어서, 상기 (a) 단계는 폴리케타이드 배당체 또는 페닐프로파노이드 배당체의 전구체를 첨가하여 C-글리코실전이효소 변이체를 암호화하는 핵산이 도입된 재조합 미생물을 배양하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 (a) 단계의 C-글리코실전이효소 변이체를 암호화하는 핵산이 도입된 재조합 미생물은 폴리케타이드 배당체 또는 페닐프로파노이드 배당체의 전구체의 생산능을 갖는 숙주 미생물에 C-글리코실전이효소 변이체를 암호화하는 핵산이 도입된 것을 특징으로 할 수 있으며, 상기 숙주 미생물은 외래 유전자의 도입 또는 유전자 발현이 조절된 재조합 미생물인 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 C-글리코실전이효소 변이체를 암호화하는 핵산이 도입된 재조합 미생물은 본 발명의 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체 생산용 재조합 미생물에서 기재된 것과 동일한 특징을 가질 수 있다.
본 발명에 있어서, 상기 (a)단계는 배양시 배양 배지에 아스코르빈산을 첨가하여 미생물을 배양하는 것을 특징으로 할 수 있으며, 이 경우, 바람직하게는 0.1 내지 1.5 g/L, 더욱 바람직하게는 0.2 내지 1.0 g/L의 아스코르빈산을 첨가하여 미생물을 배양하는 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.
본 발명의 제조방법은 별도로 설명되지 않는 한, 통상의 기술자가 이해할 수 있는 범위에 내에서 상기 다른 관점에서 기재된 내용과 동등한 특징을 가질 수 있다.
본 발명은 또 다른 관점에서, 다음 단계를 포함하는 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 제조방법을 제공한다:
(a) 본 발명의 C-글리코실전이효소 변이체 또는 상기 C-글리코실전이효소 변이체를 발현하는 미생물과 폴리케타이드 및/또는 페닐프로파노이드를 반응시켜 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체를 생성시키는 단계; 및
(b) 상기 생성된 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체를 회수하는 단계.
본 발명에서는 특정 유전자 명을 기재하였으나, 본 발명이 해당 유전자에 한정되는 것이 아님은 당업자에게 자명할 것이다.
한편, 본 발명에서 도입한 유전자에 있어서도 특정 미생물 유래의 유전자 명을 기재하였으나, 본 발명의 보호범위가 해당 유전자 명에 한정되는 것은 아니고, 당업자가 해당 유전자와 동일한 기능을 가진 것이라고 인정할 수 있는 범위 내에서 유전자 명을 달리하는 다른 미생물 유래의 유전자를 본 발명의 기술적 특징에 따라 도입하는 경우, 해당 재조합 미생물도 본 발명의 보호범위에 속할 수 있음은 자명하다.
실시예
이하, 본 발명을 구체적인 실시예에 의해 보다 상세히 설명하고자 한다. 하지만, 본 발명은 하기 실시예에 의해 한정되는 것은 아니며, 본 발명의 아이디어와 범위 내에서 여러 가지 변형 또는 수정될 수 있음은 통상의 기술자에게는 자명한 것이다.
실시예 1. 실험방법
1-1. 플라스크 배양
플라스크 배양은 다음과 같은 조건으로 진행하였다. 콜로니를 적절한 농도의 항생제가 첨가된 10 mL LB 배지에 접종하였고, 37 ℃에서 하룻밤동안 배양하였다. 그 후 준비된 배양액을 3 g/L yeast extract, 20 g/L 포도당 (그리고 필요시 0.45 g/Lascorbic acid)이 첨가된 50 mL의 R/2 배지를 담고 있는 250 mL 배플 플라스크로 계대한 후, 30℃ 200rpm에서 배양하였다. R/2 배지 (pH 6.8) 조성은 다음과 같다 (리터 당): 2 g (NH4)2HPO4, 6.75 g KH2PO4, 0.85 g citric acid, 0.7 g MgSO4·7H2O, and 5 ml trace metal solution (TMS) [10 g FeSO4·7H2O, 2.25 g ZnSO4·7H2O, 1 g CuSO4··5H2O, 0.5 g MnSO4·5H2O, 0.23 g Na2B4O7·10H2O, 2 g CaCl2·2H2O and 0.1 g (NH4)6Mo7O24 per liter of 5 M HCl]. 배양액의 OD600가 0.6-0.8이 되었을 때 1 mM Isopropyl -D-1-thiogalactopyranoside (IPTG) 를 첨가하여 외래 유전자 발현을 유도하였다. 유도 후 48시간 동안 배양하였다.
1-2. 유가식 발효
유가식 발효의 경우, 6.6 L BioFlo 320 발효기(Eppendorf)를 이용하여 20 g/L 포도당, 3 g/L yeast extract, 0.45 g/L ascorbic acid 및 적절한 항생제를 포함한 1.95 L R/2 배지 (pH 6.8)에서 수행하였다. 콜로니를 적절한 농도의 항생제가 첨가된 10 mL LB 배지에 접종하였고, 37 ℃에서 하룻밤동안 배양하였다. 그 후 준비된 배양액을 3 g/L yeast extract, 20 g/L 포도당, 0.45 g/L ascorbic acid이 첨가된 50 mL의 R/2 배지를 담고 있는 250 mL 배플 플라스크로 계대한 후, 30 ℃ 200pm에서 OD600이 약 4에 도달할 때까지 배양하였다. 그 후 발효기로 접종되었는데 pH는 암모니아 용액의 자동 첨가를 통해 6.8로 유지되었으며, 온도는 30 ℃로 유지되었다. 산소포화도 (DO)는 공기 포화 수준의 40%로 유지되었고 1 vvm [(air volume) · (working volume) -1 · (minute)-1]의 공기를 지속적으로 불어넣되 교반 속도를 높이거나 첨가되는 순수 산소의 농도를 높이는 방식으로 DO를 유지하였다. IPTG 첨가(0.5 mM)는 OD600이 약 20정도 되었을 때 이루어졌으며, pH-stat 전략을 통하여 고갈된 탄소원 및 기타 영양소를 자동으로 발효기에 첨가하였다. 이 때 첨가액은 리터당 다음과 같은 성분을 포함하였다: 650 g 포도당, 5 g ascorbic acid, 6 mL TMS, 8 g MgSO4·7H2O. pH가 6.85보다 높아지면 자동으로 첨가액이 발효기로 첨가되게 조작하였다.
1-3. 생산량 분석
배양 후 다음과 같은 조건으로 생산량 분석을 진행하였다. 플라스크 배양 후 50 mL의 배양액을 4,000 g에서 30 분 동안 원심분리한 후, 상층액의 염을 제거하고 농축하는 과정을 진행하였다. 이 때 Oasis HLB Cartridge (Water)를 사용하였다. FK의 경우 1배, KA의 경우 30배, dcII의 경우 45배, 카르민산의 경우 200배 농축하였다. 농축된 샘플은 적절한 부피의 DMSO에 다시 녹인 후 0.22 μm PTFE필터로 불순물을 제거하였다. 준비된 샘플은 HPLC (1100 series; Agilent)와 연동된 MS (LC/MSD VL; Agilent)로 분석하였다. Eclipse XDB-C18 컬럼을 활용하였고, A 버퍼는 0.1% formic acid를, B 버퍼는 methanol을 활용하였다. ESI negative mode로 분석하였다. 카르민산의 보다 정확한 분석을 위하여 HPLC Triple Quadrupole Mass Spectrometer (LCMS-8050, Shimadzu)를 통하여 LC-MS/MS 분석을 진행하였다 (MRM mode).
한편, 알로에신 분석을 위하여 LC-MS/MS 분석에서는, ultra HPLC (UHPLC; 1290 Infinity II LC System; Agilent)와 연동된 MS (Agilent 6550 iFunnel Q-TOF LC/MS System)을 이용하였다. 이 때 Eclipse-plus C18 column을 사용하였고, 버퍼 A로는 0.1% formic acid, 버퍼 B로는 0.1% formic acid를 첨가한 acetonitrile을 사용하였다.
실시예 2: 카르민산 생산을 위한 C-glycosyltransferase 규명
카르민산의 생산 경로는 아직 구체적으로 규명되어 있지 않지만, 카르민산의 탄소 골격은 안트라퀴논(anthraquinone) 계열의 구조를 지니고 있으므로, PKS를 이용하여 카르미산 생산을 유도하고자 하였다 (도 1).
이에 따라 외래 acyl carrier protein (ACP)의 활성을 위하여 Bacillus subtilis 유래 Sfp가 게놈 상에 도입된 E. coli BAP1 균주 (E. coli BL21(DE3) (Invitrogen)으로부터의 제조방법은 B. Pfeifer et al., Science 2001, 291 (5509), 1790-1792 / D. Yang et al., PNAS 2018, 115(40) 9835-9844 논문 참조)를 활용하였다. 그 후 Photorhabdus luminescens 유래 타입 II PKS를 적용하고자 P. luminescens 유래 antD (ketosynthase), antE (chain-length factor), antF (ACP), antB (phosphopantetheinyl transferase), antG (malonyl-CoA:ACP malonyltransferase)를 도입하기 위하여 pDS00-antDEFBG를 구축하였다. 우선 antDEF유전자를 P. luminescens의 genomic DNA로부터 antDE_F 프라이머와 antDEF_R 프라이머를 이용하여 PCR 증폭한 후, pDS00 (제한효소 배열을 제외하고 pET-30a(+) 프라이머와 동일한 플랫폼 플라스미드, Novagen)의 NdeI과 EcoRI 제한효소 부위에 삽입하였다. pDS00 플라스미드는 다음과 같이 구축되었다. pET-30a(+)로부터 T7 프로모터, multiple cloning site (MCS), T7 터미네이터가 포함된 유전자 조각을 pET_NheI_DraIII와 pET_SpeI_SphI 프라이머를 이용하여 증폭한 후, SphI, DraIII 제한효소 처리하여 pET-30a(+) 플라스미드의 SphI과 DraIII 사이트로 삽입하여 pDS00 플라스미드를 구축하였다. 그 후, P. luminescence genomic DNA로부터 antB를 antB_F 프라이머와 antB_R 프라이머를 이용하여 증폭하여 pDS00의 HindIII 사이트에 삽입하여 pDS00-antB 플라스미드를 구축하였다. 연이어 NdeI와 EcoRI 제한효소를 이용하여 digestion 시킨 후 pDS00-antDEF 플라스미드 역시 NdeI와 EcoRI 제한효소를 이용하여 antDEF 조각을 얻은 후 두 조각을 Gibson assembly를 이용하여 합쳐서 pDS00-antDEFB 플라스미드를 얻었다. 그리고 P. luminescence genomic DNA로부터 antG를 antG_F 프라이머와 antG_R 프라이머를 이용하여 증폭하여 pDS00의 NdeI, EcoRI 사이트에 삽입하여 pDS00-antG 플라스미드를 구축하였다. 구축된 플라스미드를 NheI, SpeI 제한효소로 digestion하여 antG 조각을 얻은 후, pDS00-antDEFB 플라스미드의 NheI 사이트로 삽입하여 pDS00-antDEFBG 플라스미드를 구축하였다.
이름 | 서열 | 서열 번호 |
pET_NheI_DraIII 프라이머 (forward) | 5'-AAACACTACGTGGCTAGCCAAAAAACCCCTCAAGACC-3' | 3 |
pET_SpeI_SphI 프라이머 (reverse) | 5'-AAAGCATGCACTAGTTAATACGACTCACTATAGGG-3' | 4 |
antDE_F 프라이머(Forward) | 5'-CTTTAAGAAGGAGATATACATATGATAATAAATAACAGAAATGAATC-3' | 5 |
antDEF_R 프라이머(Reverse) | 5'-CTTGTCGACGGAGCTCGAATTCATTAATTTTTATCGTTTAAACTTGATG -3' | 6 |
antB_F 프라이머 (Forward) | 5'-GAATTCGAGCTCCGTCGACAAATAAGGAGATATACCATGGACGATATTTCTTTATCATCTG -3' | 7 |
antB_R 프라이머 (Reverse) | 5'-GTGGTGCTCGAGTGCGGCCGCAAGCTTATTACTCATCTTTGTTCCTTATAATC -3' | 8 |
antG_F프라이머 (Forward) | 5'-CTTTAAGAAGGAGATATACATATGAAACTAATCTCTATGTTGTTAC -3' | 9 |
antG_R프라이머 (Reverse) | 5'- CTTGTCGACGGAGCTCGAATTCATTATTGATTCCTCAATGTAAATAG -3' | 10 |
그 다음으로는 flavokermesic acid (FK) 생산을 위하여 Streptomyces sp. R1128 유래 cyclase인 ZhuI와 ZhuJ를 도입하였는데, 이를 위하여 pFK (pDS00-antDEFBG-zhuIJ) 플라스미드를 구축하였다. 우선 대장균에서의 발현을 위해 코돈 최적화된 zhuIJ DNA를 기반으로 하여 zhuI_F 프라이머와 zhuJ_R 프라이머를 이용하여 zhuIJ조각을 PCR 증폭하였고, pDS00의 NdeI, EcoRI 사이트에 삽입하였다. 이렇게 구축된 pDS00-zhuIJ를 NheI, SpeI 제한효소로 절단하여 zhuIJ조각을 얻었으며, 이를 pDS00-antDEFBG의 NheI 사이트에 삽입하여 pFK를 구축하였다.
BAP1에 pDS00-antDEFBG-zhuIJ가 형질전환된 균주는 포도당으로부터 88 mg/L의 FK를 생산하였다. 배양액의 색이 배양 초반에는 밝은 붉은색이었다가 시간이 갈수록 탁한 갈색으로 변하는 것이 관찰되었다. 이는 FK가 멜라닌 유사체 등으로 전환되는 것이라 가정되는바, FK의 멜라닌화를 막기 위하여 배지에 0.45 g/L의 ascorbic acid를 첨가하였고, 이로써 FK 생산량을 154.9 mg/L까지 증산할 수 있었다.
이름 | 서열 | 서열 번호 |
zhuI_F 프라이머(Forward) | 5'- CTTTAAGAAGGAGATATACATATGCGTCATGTAGAGCATACAGTC -3' | 11 |
zhuJ_R 프라이머(Reverse) | 5'- CTTGTCGACGGAGCTCGAATTCTTATTAATCCTCTTCCTCTTGCTCG -3' | 12 |
Malonyl-CoA의 세포 내 농도를 증가시키는 것 또한 FK의 생산량을 늘일 수 있는 방안으로 예측하고, Corynebacterium glutamicum 유래 acetyl-CoA carboxylase (accBCD1 유전자에 의해 코딩됨)를 과발현시키거나 pabA 유전자를 낙다운하였다. 그 결과 accBCD1을 과발현시킨 균주에서 FK 생산량이 180.3 mg/L까지 증산되었다 (도 2).
플라스크 배양 시에는 LB 아가 플레이트 상의 콜로니를 10 mL의 LB가 포함된 테스트 튜브 상에 접종하는 것으로 시작하였다. 이 때 적절한 농도의 항생제를 추가하였고, 37 ℃에서 220 rpm으로 밤새 배양하였다. 이렇게 준비된 시드 배양 중 1 mL을 50 mL의 R/2 배지(3 g/L yeast extract, 20 g/L 포도당 추가 포함)를 포함하고 있는 250 mL 배플 플라스크로 접종하였고, 30℃와 200 rpm에서 배양을 진행하였다. R/2 배지의 조성은 다음과 같다 (pH 6.8, 1 L당): 2 g (NH4)2HPO4, 6.75 g KH2PO4, 0.85 g citric acid, 0.8 g MgSO4·7H2O, 5 ml trace metal solution (TMS). TMS의 조성은 다음과 같다 (0.1 M HCl 기반, 1 L당): 10 g FeSO4·7H2O, 2.25 g ZnSO4·7H2O, 1 g CuSO4·5H2O, 0.58 g MnSO4·5H2O, 0.02 g Na2B4O7·10H2O, 2 g CaCl2·2H2O, 0.1 g (NH4)6Mo7O24·4H2O. 배양액의 OD600이 0.6-0.8이 되었을 때 0.5 mM의 IPTG를 첨가하여 외래 효소 발현을 유도하였다. 그 후 48 시간동안 배양을 진행하였다. Flavokermesic acid, kermesic acid, dcII, carminic acid 생산 실험의 경우에는 모두 0.45 g/L의 ascorbic acid를 추가로 첨가해 주었다.
상기 플라스크 컬쳐 결과, 소량의 kermesic acid (KA) 또한 관찰되었다 (0.14 mg FK equivalent/L; 즉, mg FK eq/L). 이는 대장균 내재 산화효소 또는 ZhuIJ에 의한 것으로 생각되었으나, 전환 효율이 너무 낮고, 해당 반응을 수행하는 효소는 아직 규명되지 않은 바, 본 발명에서는 기존 보고된 문헌과 화합물 데이터베이스를 활용하여 생화학 반응 분석을 수행하였다.
그 결과 Streptomyces peucetius 유래 aklavinone 12-hydroxylase (DnrF)를 암호화하는 유전자가 해당 반응을 수행하는 효소로 예측되어, dnrF_F 프라이머와 dnrF_R 프라이머를 이용하여 증폭 후 pDS00에 NdeI, EcoRI 사이트에 삽입하여 pDS00-dnrF를 구축하고, 해당 플라스미드를 기반으로 pET30a_frag_F 프라이머와 pET30a_frag_R 프라이머를 이용하여 dnrF 유전자를 PCR 증폭하였고, pBBR1-T7 플라스미드 (Kovach, M. E.; Phillips, R. W.; Elzer, P. H.; Roop, R. M., II; Peterson, K. M., pBBR1MCS: a broad-host-range cloning vector. Biotechniques 1994, 16 (5), 800-802.)로부터 S.Y.Park et al., bioRxiv, DOI: 10.1101/2020.11.27.401000 방법으로 구축됨)를 pET30a_IV_R 프라이머와 rrnB_IV_F 프라이머를 이용하여 역 PCR 증폭하여 Gibson assembly를 이용하여 두 DNA 조각을 라이게이션하여 pBBR1-dnrF를 구축하였다. FK 생산 균주에 pBBR1-dnrF를 도입한 후 플라스크 배양을 진행하였다. 그 결과, 1.20 mg FK eq/L의 KA를 생산하였다 (도 3a).
이름 | 서열 | 서열 번호 |
dnrF_F 프라이머(Forward) | 5'- CTTTAAGAAGGAGATATACATATGGCCTTGACGAAGCCGGATG -3' | 13 |
dnrF_R 프라이머(Reverse) | 5'- CAAGCTTGTCGACGGAGCTCG AGTTGTCGGAGCGGCTGGCC -3' | 14 |
pET30a_frag_F프라이머 (Forward) | 5'- CTTTAAGAAGGAGATATACATATG -3' | 15 |
pET30a_frag_R 프라이머 (Reverse) | 5'- CAAAACAGCCAAGCTTGCATG CAAGCTTGTCGACGGAGCTC -3' | 16 |
rrnB_IV_F 프라이머 (Forward) | 5'- CATGCAAGCTTGGCTGTTTTG -3' | 17 |
pET30a_IV_R프라이머 (Reverse) | 5'- CATATGTATATCTCCTTCTTAAAG -3' | 18 |
FK에서 카르민산 (carminic acid; CA)으로의 생산은 두 종류의 생합성 경로를 택할 수 있는데, 모두 monooxygenase와 C-glycosyltransferase를 필요로 한다. FK는 산화되어 KA로 전환되거나 C-글리코실화 되어 dcII로 전환될 수 있다. D. coccus 유래 DcUGT2가 FK에서 dcII (또는 KA에서 CA)로의 전환을 촉매한다는 것이 밝혀졌고 S. cerevisiae에서 활성이 증명되었지만 (Kannangara et al., Nat Commun 2017, 8), 해당 효소가 활성을 지니기 위해서는 글리코실화(glycosylation) 되어야 하고, 막관통 나선(transmembrane helix)과 신호 펩타이드(signal peptide)도 가지고 있기 때문에 대장균과 같은 세포에서는 성공적으로 발현되기 어려울 것으로 예상되었다. 실제로 DcUGT2는 FK 생산 대장균에 도입되었을 때 dcII를 생산하지 못하였다. 이와 같은 DcUGT2의 발현 상의 문제를 해결하기 위하여 N 말단 신호 펩타이드 (signal peptide)를 제거한 Ntr-DcUGT2, C 말단 막관통 나선 (transmembrane helix)을 제거한 Ctr-DcUGT2, N 말단 신호 펩타이드 (signal peptide) 및 C 말단 막관통 나선 (transmembrane helix)을 모두 제거한 Ntr-Ctr-DcUGT2를 제작하고, Ntr-DcUGT2와 Ntr-Ctr-DcUGT2의 N 말단에는 대장균 OmpA signal peptide를 부착한 플라스미드 또한 구축하였지만, 모두 dcII를 생산하는데 실패하였다. 따라서 DcUGT2가 대장균에서 활성을 지니지 않는 것으로 결론내렸다.
대장균에서 천연물의 O-글리코실화 (O-glycosylation)는 몇 사례가 보고되었으나, C-글리코실화 (C-glycosylation)는 거의 보고된 사례가 없다. 따라서 본 발명에서는 생화학 반응 분석을 통하여 대장균에서 C-글리코실화 반응을 수행한다고 밝혀진 UDP-glycosyltransferase를 선정하였다. 선정된 여덟 효소 후보는 다음과 같다: E. coli Nissle 유래 IroB (EnCGT); Zea mays 유래 UGT708A6 (ZmCGT) dual C/O-glycosyltransferase; Fagopyrum esculentum 유래 UGT708C2 (FeCGT); Mangifera indica 유래 MiCGT; Oryza sativa 유래 OsCGT; Glycine max 유래 UGT708D1 (GmCGT); Gentiana triflora 유래 GtUF6CGT1 (GtCGT); Aloe vera 유래 AvCGT (도 4).
상기 선정된 효소에 대해 pCDF-DcCGT, pCDF-MiCGT, pCDF-SfCGT, pCDF-EnCGT, pCDF-OsCGT, pCDF-FeCGT, pCDF-GmCGT, pCDF-AvCGT, pCDF-AvCGT, pCDF-ZmCGT, pCDF-GtCGT를 구축하였는데, E. coli Nissle genomic DNA로부터 iroB_gib_F 프라이머 및 isoB_gib_R 프라이머를 이용하여 증폭된 iroB 유전자 제외하고는 모두 인공 합성하고 pCDFDuet-1 플라스미드 상의 NdeI 사이트에 Gibson assembly를 이용하여 삽입하여 구축되었다.
이름 | 서열 | 서열 번호 |
iroB_gib_F프라이머(Forward) | 5'- GTTAAGTATAAGAAGGAGATATACATATGCGTCGACTGCCTGATTTAG -3' | 19 |
iroB_gib_R 프라이머(Reverse) | 5'- GATATCCAATTGAGATCTGCCTTATGATTACCCTTTCTGTACCATTGTGATC -3' | 20 |
GtCGT와 ZmCGT만이 FK를 dcII로 성공적으로 전환시킬 수 있었는데, ZmCGT의 경우 주요 생산물은 O-글리코실화된 FK (O-glycosylated FK)였으며 dcII는 매우 소량 생산되었다. GtCGT의 경우, 0.13 mg CA equivalent/L (mg CA eq/L)의 dcII가 생산되었다 (도 5). C-글리코실화 (C-glycosylation) 반응은 높은 수준의 UDP-glucose 양이 필요하므로, galU (encoding UTP-glucose-1-phosphate uridylyltransferase), pgm (encoding phosphoglucomutase), 그리고 ndk (encoding nucleoside-diphosphate kinase)를 과발현하였고, 그 결과 dcII의 생산량이 0.30 mg CA eq/L로 증산되었다 (도 5). pBBR1-galU-pgm-ndk 플라스미드를 제작하기 위하여 (세 유전자 모두 대장균 BL21(DE3) 균주로부터 증폭됨) 우선 galU 유전자가 galU_gib_F와 galU_gib_R 프라이머로부터 증폭되었고, pBBR1TaC 플라스미드 상의 EcoRI 사이트에 Gibson assembly를 통하여 삽입되었다. 그리고 pgm 유전자는 pgm_gib_F와 pgm_gib_R 프라이머로부터 증폭되어 pBBR1TaC-galU 플라스미드의 KpnI 사이트에 삽입되었고, ndk 유전자는 ndk_gib_F와 ndk_gib_R 프라이머로부터 증폭되어 pBBR1-galU-pgm 플라스미드의 SphI 사이트에 삽입되었고, 이로써 pBBR1-galU-pgm-ndk가 구축되었다.
이름 | 서열 | 서열 번호 |
galU_Gib_F 프라이머(Forward) | 5'- CAATTTCACACAGGAAACAGAATTCATGGCTGCCATTAATACGAAAG -3' | 21 |
galU_Gib_R 프라이머(Reverse) | 5'- CCGGGTACCGAGCTCGAATTC ATTACTTCTTAATGCCCATCTC -3' | 22 |
pgm_Gib_F 프라이머(Forward) | 5'- GTAATGAATTCGAGCTCGGTACCCAATTTCACACAGGAAACAGA ATGGCAATCCACAATCGTGC -3' | 23 |
pgm_Gib_R 프라이머(Reverse) | 5'- CTCTAGAGGATCCCCGGGTACCATTACGCGTTTTTCAGAACTTC -3' | 24 |
ndk_Gib_F 프라이머(Forward) | 5'- CTAGAGTCGACCTGCAGGCATGC CAATTTCACACAGGAAACAGA ATGGCTATTGAACGTACTTTTTCC -3' | 25 |
ndk_Gib_R 프라이머(Reverse) | 5'- CAAAACAGCCAAGCTTGCATGC ATTAACGGGTGCGCGGGCAC -3' | 26 |
GtCGT와 DnrF의 활성을 향상시켜 성공적으로 카르민산을 생산하기 위하여 본 발명에서는 컴퓨터 시뮬레이션을 통하여 활성이 증대된 돌연변이를 제작하고자 하였다. 하지만 해당 효소들의 구조가 밝혀져 있지 않았으므로 우선 MODELLER (Webb, B.; Sali, A., Comparative protein structure modeling using MODELLER. Curr Protoc Bioinformatics 2016, 54, 5.6.1-5.6.37)을 이용하여 단백질 구조를 예측하였다. 그 후 PyRosetta를 통한 docking simulation (Chaudhury, S.; Lyskov, S.; Gray, J. J., PyRosetta: a script-based interface for implementing molecular modeling algorithms using Rosetta. Bioinformatics 2010, 26 (5), 689-691)을 통하여 활성이 증대된 돌연변이를 스크리닝하고자 하였다. 컴퓨터 시뮬레이션 기반 예측 외에도 구조 분석 결과를 통해 활성을 증대시킬 것으로 예상되는 돌연변이를 추가적으로 선정하였다.
GtCGT에 대한 homology modelling을 TcCGT (Trollius chinensis 유래 C-glycosyltransferase; PDB ID 6JTD; 단백질 서열 유사도 35.1%)을 비교군으로 활용하여 수행하였다. 산출된 GtCGT 구조 모델을 이용하여 FK를 리간드로 하는 컴퓨터 기반 docking simulation (SW: AutoDock Vina)을 수행하였다. 그 결과 239개의 돌연변이가 산출되었는데, 이 중 122개의 돌연변이가 야생형 효소에 비하여 높은 docking 점수를 보여주었다 (표 6). 이 중 상위 20개의 돌연변이에 대하여 실험을 수행하였는데, GtCGT의 예측된 구조 분석 결과 활성을 증대시킬 수 있을 것으로 예상되는 14개의 돌연변이 또한 추가로 테스트하였다. 상기 34개의 돌연변이를 FK 균주에 형질전환 후 플라스크 배양을 수행한 결과, 야생형 GtCGT 대비 높은 KA 생산량을 보이는 여섯 개의 돌연변이가 선정되었다 (V93Q, Y193F, L164G, F17G, R322D, V132A). 이들 중 가장 높은 dcII 생산량을 보여준 돌연변이는 GtCGTV93Q였으며, 생산량이 약 2.9배 가량 증가되는 것으로 나타났다 (도 6c). 해당 돌연변이에서 Gln93 아미노산이 활성화 부위(active site)에 위치해 있어, 직접적으로 FK와 결합하는 것으로 판단되었다. Gln93 아미노산은 C6의 히드록시기(hydroxyl group)와 수소결합을 형성하는데, 이는 FK 리간드가 C2에서 C-글리코실화 (C-glycosylation) 되기 위하여 정확한 방향을 잡아주는 것으로 예측된다. Y193F 돌연변이는 두 번째로 높은 dcII 농도를 보여주었는데, 해당 두 돌연변이 간의 시너지 효과를 보기 위하여 이중 돌연변이를 구축한 후 (GtCGTV93Q/Y193F) FK 균주에 도입하였다. 해당 이중 돌연변이는 0.74 mg CA eq/L의 dcII를 생산하였는데, 이는 야생형 GtCGT에 비하여 5.3배 증산된 결과이다 (도 6c). V93Q 돌연변이에서, Tyr193 아미노산은 C10의 카르보닐기(carbonyl group)와 수소 결합을 형성하면서 Gln93이 C6의 히드록시기(hydroxyl group)와 수소결합을 형성하는 것을 방해한다. 따라서, Tyr193을 Phe193으로 바꾸어 주면서 C10에서의 수소결합이 저해되어 FK의 리간드 결합이 개선된 것으로 예측된다 (도 6d).
*가장 docking 점수가 높은 20개는 볼드체로 표기; 구조 기반 추가로 선택된 돌연변이는 파란색으로 표기함; ??야생형 GtCGT
DnrF에 대해서도 동일한 방법을 이용하여 돌연변이 라이브러리를 제작하였고, 그 결과 가장 높은 KA 생산량을 보여준 돌연변이는 DnrFP217K였으며, 약 2.2배 KA 생산량이 증가되었다 (2.68 mg FK eq/L) (도 6a, 6b).
특정 서열에 대한 돌연변이 발생은 기존 문헌에서 보고된 바와 동일하게 진행되었다 (Zheng, L.; Baumann, U.; Reymond, J. L., An efficient one-step site-directed and site-saturation mutagenesis protocol. Nucleic Acids Res. 2004, 32 (14), e115.). 이 때 dnrF P217K 가 도입된 플라스미드 pBBR1-T7는 pKA로, GtCGT V93Q/Y193F 가 도입된 pCDFDuet-1 플라스미드는 pdcII로 명명하였다. DnrF의 P217K 돌연변이를 제작하기 위하여 DnrF_P217K_F프라이머와 DnrF_P217K_R프라이머가 사용되었고, GtCGT의 V93Q 돌연변이를 제작하기 위하여 GtCGT_V93Q_F 프라이머와 GtCGT_V93Q_R 프라이머가 사용되었으며, GtCGT의 Y193F 돌연변이를 제작하기 위하여 GtCGT_Y193F_F 프라이머와 GtCGT_Y193F_R 프라이머가 사용되었다.
이름 | 서열 | 서열 번호 |
DnrF_P217K_F프라이머(Forward) | 5'- gtcgtaccgAAGgggtccaccggctggtac-3' | 27 |
DnrF_P217K_R 프라이머(Reverse) | 5'- ggtggacccCTTcggtacgacggcggtgag -3' | 28 |
GtCGT_V93Q_F 프라이머 (Forward) | 5'- gacgtatggCAAtacatcaatcacttagac -3' | 29 |
GtCGT_V93Q_R 프라이머 (Reverse) | 5'- gattgatgtaTTGccatacgtcaaacggtt-3' | 30 |
GtCGT_Y193F_F프라이머 (Forward) | 5'- gtgcccgacTTCctgcatccgcgcacaccc-3' | 31 |
GtCGT_Y193F_R 프라이머 (Reverse) | 5'- cggatgcagGAAgtcgggcacttcatcata -3' | 32 |
본 발명에서 제작된 GtCGTV93Q/Y193F (GtUF6CGT1V93Q/Y193F) 돌연변이의 단백질 서열은 아래와 같다:
MGSLTNNDNLHIFLVCFIGQGVVNPMLRLGKAFASKGLLVTLSAPEIVGTEIRKANNLNDDQPIKVGSGMIRFEFFDDGWESVNGSKPFDVWQYINHLDQTGRQKLPIMLKKHEETGTPVSCLILNPLVPWVADVADSLQIPCATLWVQSCASFSAYYHYHHGLVPFPTESEPEIDVQLPGMPLLKYDEVPDFLHPRTPYPFFGTNILGQFKNLSKNFCILMDTFYELEHEIIDNMCKLCPIKPIGPLFKIPKDPSSNGITGNFMKVDDCKEWLDSRPTSTVVYVSVGSVVYLKQEQVTEMAYGILNSEVSFLWVLRPPSKRIGTEPHVLPEEFWEKAGDRGKVVQWSPQEQVLAHPATVGFLTHCGWNSTQEAISSGVPVITFPQFGDQVTNAKFLVEEFKVGVRLGRGELENRIITRDEVERALREITSGPKAEEVKENALKWKKKAEETVAKGGYSERNLVGFIEEVARKTGTK
상기와 같이 활성이 증대된 DnrF와 GtCGT 돌연변이를 구축한 후, 해당 두 돌연변이 효소를 조합하여 CA 균주를 구축하였다. CA 균주는 pFK와 pCA (pCDF-dnrFP217K-GtCGTV93Q/Y193F) 플라스미드를 BAP1 균주에 형질전환하여 제작하였다. 이 때 두 유전자를 하나의 플라스미드로 삽입하기 위하여 pKA로부터 dnrF_NcoI_F와 dnrF_BamHI_R 프라이머를 이용한 PCR 증폭을 통해 dnrF P217K 를 증폭하였고, 이는 pdcII에 NcoI, BamHI 사이트로 삽입하여 pCA를 구축하였다. 구축된 CA 균주를 플라스크에서 배양한 결과 22.2 μg/L의 카르민산 (carminic acid)이 생산되었다 (도 7). 포도당으로부터 생산된 카르민산의 진위는 도 7과 같이 LC-MS/MS 분석을 통하여 판별하였다.
카르민산 생산능을 증가시키기 위하여 C. glutamicumacc BCD1 과발현, pabA 낙다운, galU-pgm-ndk 과발현을 각각 또는 조합으로 테스트 하였고, 각 균주의 생산량은 다음과 같다 (도7a): pabA KD, 25.9 μg/L; accBCD1 OE, 74.9 μg/L; galU-pgm-ndk OE, 41.0 μg/L; accBCD1 OE-galU-pgm-ndk OE, 49.9 μg/L; pabA KD-galU-pgm-ndk OE, 57.7 μg/L; pabA KD-accBCD1 OE, 57.2 μg/L; pabA KD-accBCD1 OE-galU-pgm-ndk OE, 25.2 μg/L로 나타나, accBCD1을 과발현한 균주(BL21(DE3) harboring pFK, pCA, pACC; pFK : pDS00 derivative containing antDEFBG from P. luminiscens and codon optimized zhuIJ from Streptomyces sp. R1128 (P T7 - antDEFBG - T7 T - P T7 - zhuIJ - T7 T ); pCA : pCDFDuet-1 derivative containing dnrF P217K and GtCGT V93Q/Y193F in different operons (P T7 - dnrF P217K - T7 T - P T7 - GtCGT V93Q/Y193F - T7 T ); pACC : pBBR1TaC derivative containing accBC and accD1 from Corynebacterium glutamicum ATCC 13032)에서 가장 높은 카르민산 농도인 74.9 μg/L가 생산되는 것을 확인하였다. 또한, 해당 균주에 대한 유가식 발효 수행 결과 0.65 mg/L의 카르민산이 생산되었다.
이름 | 서열 | 서열 번호 |
dnrF_NcoI_F프라이머(Forward) | 5'- CTTTAATAAGGAGATATACCATGGCCTTGACGAAGCCGGATG -3' | 33 |
dnrF_BamHI_R 프라이머(Reverse) | 5'- CCGAGCTCGAATTCGGATCCCAAGCTTGTCGACGGAGCTC -3' | 34 |
실시예 3: GtCGT
V93Q/Y193F
을 통한 알로에신 생산
알로에신은 알로에 베라(Aloe vera)로부터 추출되는 대표적인 화장품 첨가제이다. 알로에신은 anti-tyrosinase와 anti-melanogenesis 효과 때문에 화장품업계에서 미백제로 활용되고 있으며, 항염증 및 항라디칼 특성 때문에 잠재적 약물 또는 화장품 원재료로 각광받고 있다. 하지만 식물에서의 알로에신의 함량은 대단히 낮아 보다 효율적인 제조방법이 필요하였다. 알로에신 생산에 대해서는 기존 논문 발표를 통하여 보고된 바 있다 (D Yang et al., Proc. Natl. Acad. Sci. U. S. A. 2018, 115 (40), 9835-9844.). 하지만 알로에손에서 알로에신으로 전환하는 C-glycosyltransferase는 아직 보고된 바 없어 (도 8), 본 발명에서는 상기 실시예 2를 통하여 개발한 GtCGT 돌연변이가 알로에신을 생산하는 효과가 있는지 테스트하고자 하였다.
본 발명자들은 알로에손 생산을 위하여 E. coli BL21(DE3) 균주에 다음의 플라스미드들이 형질전환하였다: pCDF-RpALS, pWAS-anti-pabA, pBBR1-zwf. 따라서 해당 균주는 다음의 유전자들을 발현하고 있다: RpALS (R. palmatum aloesone synthase를 코딩한다), anti-pabA 합성 조절 sRNA, zwf (E. coli glucose 6-phosphate 1-dehydrogenase를 코딩한다) (Yang, D.; Kim, W. J.; Yoo, S. M.; Choi, J. H.; Ha, S. H.; Lee, M. H.; Lee, S. Y., Repurposing type III polyketide synthase as a malonyl-CoA biosensor for metabolic engineering in bacteria. Proc. Natl. Acad. Sci. U. S. A. 2018, 115 (40), 9835-9844 참조).
해당 균주는 30.9 mg/L의 알로에손을 포도당으로부터 생산한다. 알로에신의 생산에 앞서, 알로에손의 생산량을 증가시키기 위하여 호환 가능한 플라스미드 상에 RpALS를 추가로 도입하여 알로에손의 생산량을 증가시키고자 하였다. 이를 위해 높은 카피 수(copy number)의 RSF 복제 원점을 지닌 pRSFDuet-1 플라스미드 상에 RpALS를 도입하였다. RpALS를 기존 구축한 pCDF-RpALS로부터 ALS_NdeI_F와 ALS_NdeI_R 프라이머를 이용하여 증폭한 후 pRSFDuet-1 상의 NdeI 사이트에 Gibson assembly를 이용하여 삽입하여 해당 플라스미드를 구축하였다. 그 후 pCDF-RpALS와 pRSF-RpALS를 동시에 pWAS-anti-pabA와 pBBR1-zwf 플라스미드를 이미 보유하고 있는 E. coli BL21(DE3) 균주에 형질전환시키고, 해당 균주에 대한 플라스크 배양을 수행하였다. 그 결과, 102.1 mg/L의 알로에손이 생산되어, 개량 전에 비해 알로에손 생산량이 현저히 증가됨을 확인하였다.
이름 | 서열 | 서열 번호 |
ALS_NdeI_F프라이머(Forward) | 5'- GTATAAGAAGGAGATATACATATGGCAGATGTCCTGCAGGAG -3' | 35 |
ALS_NdeI_R 프라이머(Reverse) | 5'- GATATCCAATTGAGATCTGCCAATTAGGGAATGGGGACGCTAC -3' | 36 |
그 후, 알로에신 생산을 테스트하기 위하여 pWAS-anti-pabA pRSF-RpALS, pBBR1-zwf 플라스미드를 보유하고 있는 BL21(DE3) 균주 상에 pCDF-GtCGT 또는 pCDF-GtCGTV93Q/Y193F 플라스미드를 형질전환한 후, 플라스크 배양을 수행하였다. 그 결과, GtCGTV93Q/Y193F를 포함하고 있는 균주가 0.06 μg/L의 알로에신을 생산하여, GtCGT를 포함하고 있는 균주보다 많은 양의 알로에신을 생산하는데 성공하였다 (도9).
알로에손의 증산을 위해 테스트하였던 것과 동일하게 RpALS를 추가 도입하여 알로에신의 생산량을 증가시키고자 하였다. 이를 위해 pCDF-GtCGTV93Q/Y193F를 도입하는 대신 pCDF-RpALS-GtCGTV93Q/Y193F를 구축하였다. 이를 위해 RpALS를 pCDF-RpALS로부터 pCDFDuet_F와 pCDFDuet_R 프라이머를 이용하여 증폭하였고, pCA 플라스미드 상의 NcoI, BamHI 사이트로 Gibson assembly를 통하여 도입하였다. 이 후 pRSF-RpALS, pCDF-RpALS-GtCGTV93Q/Y193, pWAS-anti-pabA, pBBR1-zwf의 네 종의 플라스미드를 E. coli BL21(DE3)에 형질전환한 후 ALS 균주라 명명하였다.
ALS 균주는 포도당으로부터 0.3 μg/L의 알로에신을 생산하는데 성공하였다. 생산된 알로에신의 진위는 도 9와 같이 LC-MS/MS를 통하여 판별되었다.
이와 같이 본 발명자들은 GtCGT의 도입을 통하여 효소조차 밝혀지지 상태로 알로에신 생산에 성공하였고, GtCGTV93Q/Y193F의 도입을 통하여 알로에신 생산능을 현저히 높일 수 있었다. 이와 같이 GtCGTV93Q/Y193F 효소 돌연변이는 폴리케타이드 전반에 걸쳐 배당체를 생산할 수 있는 능력이 있는 효소라 할 수 있으며, 본 발명자들은 알로에신 생산능을 더욱 높일 수 있는 돌연변이를 구축하고자 GtCGTV93Q/Y193F를 기반으로 추가 돌연변이 제작을 진행하게 되었다.
실시예 4: GtCGT
V93Q/Y193F
에의 추가 돌연변이 도입을 통한 알로에신 증산
본 발명자들은 앞서 개발한 방향족 폴리케타이드에 활성을 보이는 GtCGT V93Q/Y193F 돌연변이를 추가로 개량하여 알로에손으로부터 알로에신으로의 전환 효율을 높이고자 하였다. 이를 위해 실시예 2를 통해 산출한 GtCGTV93Q/Y193F 구조 모델 상에 새로운 기질인 알로에손을 도킹하였다. 이를 통하여 알로에손과 더욱 안정한 결합을 형성하여 효소 활성을 높일 것으로 예상되는 돌연변이를 표 10과 같이 선정하였다.
No. | Mutant |
1 | I18P |
2 | Q20M |
3 | T50N |
4 | T50Q |
5 | T50K |
6 | T50R |
7 | T50V |
8 | I95M |
9 | I95T |
10 | V290G |
11 | V290A |
12 | I323S |
13 | I323A |
14 | I95L |
특정 서열에 대한 돌연변이 발생은 실시예 2와 동일한 방법으로 진행되었다. 이 때 pCDF-RpALS-GtCGTV93Q/Y193F를 주형으로 하여 아래 표 11의 프라이머 쌍을 이용하여 유전자 돌연변이를 포함하는 플라스미드를 제작하였다. 제작된 플라스미드들은 각각 pWAS-anti-pabA, pRSF-RpALS, pBBR1-zwf 세 종의 플라스미드와 함께 BL21(DE3) 균주 상에 형질전환된 후, 이와 같이 구축된 균주들을 이용하여 실시예 3과 동일한 조건 하에서 플라스크 배양을 수행하였다. 생산된 알로에신의 농도는 카이스트 바이오코어 센터의 HPLC Triple Quadrupole Mass Spectrometer (LCMS-8050, Shimadzu)의 MRM 모드를 통해 측정되었다.
Name | Sequence (5'-3') | 서열번호 |
GtCGT V93Q/Y193F_I18P_F | tgtgcttcCCAggccagggcgtggtcaat | 63 |
GtCGT V93Q/Y193F_I18P_R | cgccctggccTGGgaagcacacaagaaaaat | 64 |
GtCGT V93Q/Y193F_Q20M_F | ttcatcggcATgggcgtggtcaatcccat | 65 |
GtCGT V93Q/Y193F_Q20M_R | tgaccacgcccATgccgatgaagcacacaag | 66 |
GtCGT V93Q/Y193F_T50K_F | aatcgttggaaAGgagatccgtaaggcgaa | 67 |
GtCGT V93Q/Y193F_T50K_R | tacggatctcCTttccaacgatttccggtg | 68 |
GtCGT V93Q/Y193F_T50N_F | aatcgttggaaAtgagatccgtaaggcgaa | 69 |
GtCGT V93Q/Y193F_T50N_R | tacggatctcaTttccaacgatttccggtg | 70 |
GtCGT V93Q/Y193F_T50Q_F | aatcgttggaCAGgagatccgtaaggcgaa | 71 |
GtCGT V93Q/Y193F_T50Q_R | tacggatctcCTGtccaacgatttccggtg | 72 |
GtCGT V93Q/Y193F_T50R_F | aatcgttggaCGtgagatccgtaaggcgaa | 73 |
GtCGT V93Q/Y193F_T50R_R | tacggatctcaCGtccaacgatttccggtg | 74 |
GtCGT V93Q/Y193F_T50V_F | aatcgttggaGTtgagatccgtaaggcgaa | 75 |
GtCGT V93Q/Y193F_T50V_R | tacggatctcaACtccaacgatttccggtg | 76 |
GtCGT V93Q/Y193F_I95L_F | gtatggcaatacCtcaatcacttagaccagacag | 77 |
GtCGT V93Q/Y193F_I95L_R | ggtctaagtgattgaGgtattgccatacgtcaaacg | 78 |
GtCGT V93Q/Y193F_I95M_F | gtatggcaatacatGaatcacttagaccagacag | 79 |
GtCGT V93Q/Y193F_I95M_R | ggtctaagtgattCatgtattgccatacgtcaaacg | 80 |
GtCGT V93Q/Y193F_I95T_F | gtatggcaatacaCTaatcacttagaccagacag | 81 |
GtCGT V93Q/Y193F_I95T_R | ggtctaagtgattAGtgtattgccatacgtcaaacg | 82 |
GtCGT V93Q/Y193F_V290A_F | gtgtcgggtctgCtgtatatttgaagcaggag | 83 |
GtCGT V93Q/Y193F_V290A_R | gcttcaaatatacaGcagacccgacactaacg | 84 |
GtCGT V93Q/Y193F_V290G_F | gtgtcgggtctgGtgtatatttgaagcaggag | 85 |
GtCGT V93Q/Y193F_V290G_R | gcttcaaatatacaCcagacccgacactaacg | 86 |
GtCGT V93Q/Y193F_I323A_F | agcaaacgcGCcggtacggaaccgcatgt | 87 |
GtCGT V93Q/Y193F_I323A_R | gttccgtaccgGCgcgtttgctcgg | 88 |
GtCGT V93Q/Y193F_I323S_F | agcaaacgcaGcggtacggaaccgcatgt | 89 |
GtCGT V93Q/Y193F_I323S_R | gttccgtaccgCtgcgtttgctcgg | 90 |
플라스크 배양 결과 I323S, T50R, T50V, I18P, I95T, Q20M, I323A 추가 돌연변이 도입을 통해 알로에신 생산량이 10배 이상 증가하였으며, 특히 GtCGT V93Q/Y193F/I323S 돌연변이를 통해 7.75 μg/L의 알로에신이 생산되었다 (도 10). 이는 기존 농도인 0.3 μg/L에 비해 25.8배 이상 증가한 결과이다.
구조 기반 추가 돌연변이 탐색 외에도 더욱 효소 활성을 높이기 위해 GtCGT 구조 모델을 이용하여 알로에손을 리간드로 하는 컴퓨터 기반 docking simulation (SW: AutoDock Vina)을 수행하였다. 그 결과 15개의 돌연변이가 야생형 효소에 비하여 높은 docking 점수를 보여주었다 (표 12).
No. | Mutant |
1 | V22A |
2 | L29A |
3 | E46G |
4 | V48G |
5 | E51C |
6 | A55S |
7 | S86V |
8 | D99G |
9 | R103V |
10 | C151G |
11 | L184G |
12 | L194A |
13 | E332P |
14 | I18A |
15 | P385A |
특정 서열에 대한 돌연변이 발생은 실시예 2와 동일한 방법으로 진행되었다. 이 때 pCDF-RpALS-GtCGTV93Q/Y193F를 주형으로 하여 아래 표 13의 프라이머 쌍을 이용하여 유전자 돌연변이를 포함하는 플라스미드를 제작하였다. 제작된 플라스미드들은 각각 pWAS-anti-pabA, pRSF-RpALS, pBBR1-zwf 세 종의 플라스미드와 함께 BL21(DE3) 균주 상에 형질전환된 후, 이와 같이 구축된 균주들을 이용하여 실시예 3과 동일한 조건 하에서 플라스크 배양을 수행하였다. 생산된 알로에신의 농도는 카이스트 바이오코어 센터의 HPLC Triple Quadrupole Mass Spectrometer (LCMS-8050, Shimadzu)의 MRM 모드를 통해 측정되었다.
플라스크 배양 결과 P385A, L194A, V48G 추가 돌연변이 도입을 통해 알로에신 생산량이 5배 이상 증가하였으며, 특히 GtCGT V93Q/Y193F/P385A 돌연변이를 통해 4.23 μg/L의 알로에신이 생산되었다 (도 11). 이는 기존 농도인 0.3 μg/L에 비해 14.1배 이상 증가한 결과이다.
Name | Sequence (5'-3') | 서열번호 |
V22A-f | cggccagggcgCggtcaatcccatgttacg | 91 |
V22A-r | tgggattgaccGcgccctggccgatgaagc | 92 |
L29A-f | catgttacgtGCggggaaggcgttcgcctc | 93 |
L29A-r | cgccttccccGCacgtaacatgggattgac | 94 |
E46G-f | agcgcaccggGCatcgttggaactgagatc | 95 |
E46G-r | tccaacgatGCccggtgcgcttaaagtgac | 96 |
V48G-f | ccggaaatcgGtggaactgagatccgtaag | 97 |
V48G-r | ctcagttccaCcgatttccggtgcgcttaa | 98 |
E51C-f | cgttggaactTGCatccgtaaggcgaataac | 99 |
E51C-r | ccttacggatGCAagttccaacgatttccgg | 100 |
A55S-f | gatccgtaagTcgaataaccttaatgatgaccaac | 101 |
A55S-r | aaggttattcgActtacggatctcagttcc | 102 |
S86V-f | cgtaaacggtGTcaaaccgtttgacgtatgg | 103 |
S86V-r | caaacggtttgACaccgtttacggattccca | 104 |
D99G-f | caatcacttagGccagacaggccgtcaaaaac | 105 |
D99G-r | ggcctgtctggCctaagtgattgatgtattgc | 106 |
R103V-f | ccagacaggcGTtcaaaaacttccgattatg | 107 |
R103V-r | ggaagtttttgaACgcctgtctggtctaagtg | 108 |
C151G-f | ggtccaatctGgtgcaagtttttcagcatat | 109 |
C151G-r | gaaaaacttgcacCagattggacccacaagg | 110 |
L184G-f | ctgggatgccaGGtttgaaatatgatgaagtg | 111 |
L184G-r | catatttcaaaCCtggcatcccaggaagttg | 112 |
L194A-f | cccgacttcGCgcatccgcgcacaccctac | 113 |
L194A-r | gtgcgcggatgcGCgaagtcgggcacttcatc | 114 |
E332P-f | tgtactgcccCCggagttctgggagaaggcc | 115 |
E332P-r | cccagaactccGGgggcagtacatgcggttc | 116 |
I18A-f | tgtgtgcttcGCcggccagggcgtggtcaat | 117 |
I18A-r | cgccctggccgGCgaagcacacaagaaaaat | 118 |
P385A-f | catcactttcGcacaatttggggaccaagtg | 119 |
P385A-r | ccccaaattgtgCgaaagtgatgacgggcac | 120 |
실시예 5: GtCGT
V93Q/Y193F
을 통한 페닐프로파노이드 배당체 생산
본 발명을 통하여 개발한 C-글리코실전이효소의 페닐프로파노이드 계 천연물로의 확장성을 테스트하기 위하여 본 발명자들은 하기와 같은 실험을 진행하였다.
세포 내 발현된 GtCGTV93Q/Y193F의 효소 활성을 확인하고자 대장균 BL21(DE3)에 pCDF-GtCGTV93Q/Y193F 와 pBBR1-galU-pgm-ndk이 모두 형질전환된 균주를 플라스크 배양하였고, 세포의 성장이 OD600 0.6-0.8에 도달하였을 때 1 mM의 IPTG를 투여하였다. 이 때, 70 μM의 luteolin, 0.5 mM의 naringenin 또는 185.2 μM의 apigenin을 함께 투여하였고, 추가로 36 시간동안 배양하였다. LC-MS를 통하여 기질 및 생산물의 양을 분석하였다. 플라스크 배양은 50 mL의 R/2 배지(3 g/L yeast extract, 20 g/L 포도당 추가 포함)를 포함하고 있는 250 mL 배플 플라스크에서 진행되었고, 30 ℃와 200 rpm에서 배양을 진행하였다.
배양 결과, 185.2 μM의 apigenin으로부터 15.0 μM의 vitexin이 생산되었고, 0.5 mM의 naringenin으로부터 51.6 μM의 naringenin-6-C-glucoside가 생산되었으며, 70 μM의 luteolin으로부터 27.9 μM의 isoorientin이 생산되었다. 이는 각각 8.1%, 10.3% 및 27.9%의 전환율에 해당하는 값이다 (도 10).
상기와 같이 본원 발명의 글루코실전이효소는 다양한 페닐프로파노이드 C-glucoside 역시 생산할 수 있는 활성 또한 보이고 있으며, 이는 본원 발명의 효소가 다양한 폴리케타이드 및 페닐프로파노이드 C-glucoside를 생산할 수 있는 범용 효소라는 것을 나타낸다.
실시예 6: GtCGT
V93Q/Y193F
정제 및 K
M
, V
max
측정
본 발명을 통하여 개발한 C-글리코실전이효소 GtCGTV93Q/Y193F의 특성을 보다 자세히 규명하기 위해 효소를 정제하여 효소반응속도론적 변수를 측정하고자 하였다. His-tag을 이용한 효소 정제를 위하여, N-말단에 각각 6xHis-tag가 연결된 GtCGT와 GtCGTV93Q/Y193F를 발현시키는 pCDF-NHis-GtCGT와 pCDF-NHis-GtCGTmut 플라스미드를 구축하였다. pCDF-GtCGT와 pCDF-GtCGTmut를 GtCGT_N_His_IV_F / GtCGT_N_His_IV_R 프라이머를 이용하여 PCR 증폭한 후 DpnI 처리 및 T4 PNK와 T4 ligase 처리를 통하여 blunt-end ligation 시킴으로써 각 플라스미드를 구축하였다. 구축된 두 플라스미드를 E. coli BL21(DE3) 균주 상에 각각 형질전환한 후 10 mL LB를 포함한 테스트 튜브 상에서의 시드 배양을 거쳐 500 mL LB를 포함한 플라스크에서 OD600 값이 0.8이 될 때까지 37 oC에서 배양하였다. 효소 발현을 위해 1 mM IPTG 처리 후 20 oC에서 16 시간 동안 추가 배양하였고, 원심분리를 통해 세포 포집 후 30 mL의 lysis buffer (50 mM NaH2PO4, 0.3 M NaCl, 10 mM imidazole, pH 7.5)에 재현탁하였다. 초음파를 통해 세포를 파쇄 후, 10,000 rpm, 4°C, 40 min의 조건으로 원심분리하여 수용성 단백질을 포함하고 있는 상등액을 얻었다. 상등액을 TALON 레진 (Clontech)에 흘려 보냄으로써 His-tag가 결합된 단백질만을 정제하고자 하였다. Wash buffer (50 mM NaH2PO4, 0.3 M NaCl, 20 mM imidazole, pH 7.5)를 통해 불순물 제거 후 lysis buffer 상에 90, 160, 230, 300 mM의 imidazole이 첨가된 elution buffer를 처리하여 효소를 정제하였다.
Name | Sequence (5'-3') | 서열번호 |
GtCGT_N_His_IV_F | CACCATCACCATCACCATGGGAGTTTGACTAACAACGATAATC | 121 |
GtCGT_N_His_IV_R | CATATGTATATCTCCTTCTTATAC | 122 |
정제된 효소는 Amicon Ultra-15 Centrifugal Filters (regenerated cellulose, 50,000 NMWL; Merck)를 이용하여 효소 보관 용액 (50 mM HEPES, 20% glycerol, pH 7.5)으로 버퍼 교환되었고, KM과 Vmax 값을 계산하기 위하여 정제된 효소를 이용하여 FK를 dcII로 전환하고자 하였다. 이 때 반응 정도를 파악하기 위하여 UDP-Glo Glycosyltransferase Assay Kit (Promega)를 활용하였다. 해당 kit는 반응의 부산물로 발생하는 free UDP를 발광량으로 측정할 수 있게 해주므로, 0.1 M의 효소 및 다양한 농도의 FK를 포함하는 200 L 효소 반응액 (50 mM HEPES, 0.1 mM UDP-glucose, 5 mM MgCl2, pH 7.5)을 25 oC에서 1 시간 반응시킨 후 25 L를 덜어내어 kit를 활용하여 발관량을 측정하였다. 반응 속도 및 기질의 농도를 Michaelis-Menten 식에 도입한 후 OriginPro 2019 프로그램을 통해 분석함으로써 GtCGT와 GtCGTV93Q/Y193F의 KM과 Vmax 값을 계산하였다. 그 결과 GtCGTV93Q/Y193F의 KM 값은 GtCGT와 비교했을 때 19.5% 감소한 반면, GtCGTV93Q/Y193F의 Vmax 값은 GtCGT에 비해 18.2% 증가하였다 (도 13; 표 15). 즉, GtCGTV93Q/Y193F의 Vmax/KM 값은 GtCGT에 비해 46.8% 향상되었고, 이는 GtCGTV93Q/Y193F 돌연변이체의 촉매 효율이 향상되었음을 나타낸다.
K M (μM) a | V max (μM min-1) a | V max/K M (min-1) | |
DnrF | 56.75 ± 4.68 | 0.99 ± 0.086 | 1.75 Х 10-2 |
DnrFP217K | 43.31 ± 2.64 | 1.01 ± 0.062 | 2.34 Х 10-2 |
GtCGT | 6.30 ± 1.64 | 1.60 Х 10-3 ± 1.39 Х 10-4 | 2.54 Х 10-4 |
GtCGTV93Q/Y193F | 5.07 ± 0.74 | 1.89 Х 10-3 ± 1.13 Х 10-4 | 3.73 Х 10-4 |
a means ± standard deviation (SD; n = 3)
실시예 7. 유전자 정보
1.
ravC
from
Streptomyces ravidus
(서열번호 37)
atgtccagtttcagtattgatgatctgaagcgtatcttgcgcgaaggggcaggggcaacggctgagttagacggtgacattttagacgcctcctttgatgatttggggtatgattctttggctcttcttgaaacgggttcgcgcatcggacgtgaatacggtttggaatttgaggatacagctttcgccgacgtggaaacacctcgtgacttggtcggcgtagttaatgctcagttatcggccccggctccgcgtgggtaa
2.
zhuIJ
from
Streptomyces
sp. R1128(서열번호 38)
atgcgtcatgtagagcatacagtcaccgttgcggccccagcagacttggtttgggaggtacttgccgatgtcttaggctatgctgacatcttcccaccgacggaaaaagttgaaattcttgaggaggggcaaggataccaggtagtgcgccttcacgtcgatgttgcgggtgagattaatacatggaccagtcgtcgcgatttagaccctgcgcgccgcgtaattgcttaccgccaacttgagacggctccgatcgtgggccacatgagcggggaatggcgtgctttcacactggatgccgaacgtacccaattagtcctgactcacgatttcgtaacccgtgcagccggggatgacggtttagtcgccggaaaattgaccccagatgaggcgcgcgaaatgttagaagcggtggtagaacgtaactctgtcgccgacttaaacgcggtccttggagaagctgagcgtcgcgtccgcgcagccggtggagttggtaccgtaactgcgtaataataattttgtttaactttaagaaggagatatatccatgtcagggcgcaaaacctttttagacttaagttttgctacccgcgacacaccgtcggaggcgactccggtggtggtagatttgctggaccacgtaactggagccaccgtattaggattatcacctgaggatttccccgatggtatggctatttccaatgagaccgttacgttgacgacccacactggcacgcacatggatgcgccactgcactatggtcccttaagtgggggagttccggcaaagtcgattgaccaagtgcccttggaatggtgctatggacctggagttcgtttggatgttcgccacgtgccggcaggagatggtattactgtcgatcatttgaacgccgcgttggatgcagcagagcacgatttggcccccggtgacattgtgatgctgtggaccggcgcggacgctctgtggggaacccgcgaatacttgagcacgtttccggggttaactgggaaggggacacaatttttggtcgaggcgggtgttaaagtcattggcattgatgcatggggactggatcgcccgatggcagctatgatcgaagaataccgtcgtacgggcgataaaggagcattatggccggctcacgtctatggacgcacacgcgaatacctgcaattagagaagcttaataatttgggcgctttaccaggagctacagggtatgacatttcatgctttccggttgcggttgcaggcactggagctgggtggactcgtgtggtcgccgttttcgagcaagaggaagaggattaataa
3.
trTT7
from
Arabidopsis thaliana
(서열번호 39)
atgtcccatcgccgcaaccgtagccacaacaatcgtttacccccgggacctaatccctggcccattatcggaaacctgccgcacatgggtacgaagccccaccgtacgttgtcggctatggttacgacctatggcccaattctgcacctgcgtctgggttttgtagacgtggtcgtagcggcgtccaagtcggtcgccgagcagttcttgaagattcacgacgctaacttcgcttcacgtccccccaactcaggagccaaacacatggcgtataattatcaagacttggtattcgccccctatggacatcgctggcgcttattgcgcaagatcagctcggtgcatctgttctcggcaaaagcgttggaggactttaaacacgtgcgtcaggaagaggtcggaacactgactcgcgaattagtacgtgtcggcaccaaaccagtgaaccttgggcaactggtgaatatgtgcgttgtcaacgccttaggacgcgaaatgatcggacgccgcttattcggggccgatgccgatcataaggcggatgagttccgctcgatggtcacggagatgatggcgttagcgggggtctttaatatcggcgactttgtaccgtcattagactggcttgatctgcaaggggtcgctggaaagatgaagcgtttacataagcgttttgatgcgttcttaagttcgattttaaaagaacatgaaatgaatgggcaagaccaaaagcataccgatatgttatcgaccttaatcagccttaagggtacagatctggatggggatggcggctccttaacggatactgaaattaaggcgcttttattaaacatgttcacagccggaaccgacacatcagccagtacagtagattgggcaatcgctgaattgatccgccaccccgatatcatggtgaaggctcaggaagaattagatattgttgtaggtcgcgaccgccctgtgaatgagtctgatatcgcccaactgccgtacttacaggcggtaattaaggaaaattttcgtctgcatccacctactcccctgtctttgccgcacattgcgagtgaatcctgtgagattaacggttaccatattcccaaaggttcaacattacttaccaacatctgggctatcgcccgtgatccggaccagtggagcgatccgttagcttttaaaccagaacgttttctgccaggaggagaaaaatctggggttgatgtaaaaggtagtgatttcgagctgattccgttcggtgcaggccgtcgcatttgtgcaggcctgtctctgggtcttcgcacgatccagttcttaacagcgactttagtacaagggtttgattgggagttagctgggggagtgacgcccgaaaaactgaacatggaagaatcgtacgggttaactttgcaacgcgctgtccctctggtagtacacccgaaacctcgtttggccccgaatgtgtacgggctgggcagtggctaa
4.
ATR2
from
Arabidopsis thaliana
(서열번호 40)
atgtcttcttcttcttcttcttctacctctatgatcgacctgatggctgctatcatcaaaggtgaaccggttatcgtttctgacccggctaacgcttctgcttacgaatctgttgctgctgaactgtcttctatgttaattgagaatcgtcagtttgctatgatcgttacaacatccatcgcggtccttattggttgtatcgttatgttggtctggcgccgctctggttccggtaactctaaacgtgtggaaccgcttaaaccgctggtgatcaaacctcgtgaggaggaaatcgacgatggacgtaaaaaagtaacaatctttttcggaacgcagactggcactgcggaaggttttgccaaggcattaggtgaggaagctaaagctcgttatgaaaagacgcgcttcaagattgttgatctggacgattacgctgcagacgatgatgaatacgaggaaaaattaaaaaaagaggatgtagctttcttcttcttagctacgtatggcgatggtgaaccgacagataatgccgctcgtttttataagtggtttaccgaaggcaatgatcgtggtgagtggttgaaaaacttaaaatatggggttttcgggctgggcaatcgtcaatacgagcactttaacaaggtcgcgaaagtggtcgatgacattctggttgagcaaggcgcacagcgtctggtacaagtagggttaggggatgatgaccagtgtatcgaagatgatttcacagcttggcgcgaagcattgtggcccgagttggatacgattctgcgcgaagagggcgatacggctgttgccacaccctacacagccgcagtattagagtatcgcgtaagcatccatgatagcgaggatgccaaattcaatgatattaaccttgctaacggaaacgggtatacagtttttgacgctcaacatccgtataaggccaacgttgcggtcaaacgtgaattgcacaccccggagtccgaccgttcctgtatccatctggaatttgatattgcgggatcaggtttaacatacgaaactggagatcacgttggtgttctgtgcgataacttatccgagacggtggatgaggcactgcgccttttagacatgtcccctgacacgtattttagcttgcatgctgaaaaagaggacggtactccgatcagtagctcgctgccaccgccgtttccaccgtgcaatttacgcacggctttaacacgttacgcgtgcctgttgtcatctcctaagaaatccgccttagtggctttggctgcacacgctagtgatcccactgaggccgagcgcttgaaacacttagcaagccctgcaggtaaagacgagtactccaagtgggtagtagagtcacagcgtagtttattggaggtgatggccgagtttcctagtgcgaagccaccgttgggagttttctttgccggggtggctccgcgtttgcaaccacgtttttatagcatcagtagttctccaaaaatcgccgagactcgcattcacgttacatgtgccctggtctacgaaaaaatgccgactgggcgcatccacaagggtgtatgctcgacttggatgaagaacgccgtaccctacgaaaagtctgaaaactgcagctcggcgccaatcttcgtacgccagtccaatttcaagttgccgtcagattcaaaggtaccgatcattatgatcggtccaggaacggggttagctccgttccgtgggttcttacaggaacgcttagcactggtcgagtcgggggtagaattgggcccctccgtcttgtttttcgggtgtcgtaaccgtcgcatggacttcatctatgaagaagagctgcaacgtttcgtggaaagtggggcgcttgctgaactgtcggtggcgttttcccgcgaaggacccacgaaagaatatgttcaacacaaaatgatggacaaagcgtcggatatctggaacatgatttcacagggcgcttatttatatgtatgtggcgatgcgaaaggcatggcgcgtgacgtccaccgttctctgcacaccattgcgcaagagcaaggtagcatggattcaacgaaagcagaaggcttcgtgaagaatttacaaacctctgggcgctatcttcgtgatgtgtggtaa
5.
UrdGT2
(
SfCGT
)
from
Streptomyces fradiae
TU2717(서열번호 41)
atgtttgccctggctccgctggccacagcagctcgtaatgcaggtcatcaggtagtaatggcagcaaaccaggacatgggacctgtcgtaaccggggttggccttccagccgtagcaaccactgatcttccgatccgtcatttcatcactaccgatcgtgaaggacgtcccgaggccattccttctgacccggtcgcgcaggcccgtttcactggtcgctggttcgcccgtatggctgccagttccttgccccgtatgcttgatttttcacgtgcatggcgcccagacttaatcgtcggtggtactatgagctatgtcgctccgctgttagctcttcacctgggagtcccgcacgcccgtcagacttgggatgcggtagacgctgatggaatccacccaggtgctgatgctgagcttcgcccagagttaagcgaattgggattggagcgccttcccgcacccgatttgttcatcgacatttgcccgccctcgttacgtcctgccaacgcagcaccagctcgcatgatgcgccacgtagccacgagccgccaatgcccgttagagccgtggatgtatacacgtgacactcgccagcgtgttttagtgacgtcgggatcgcgtgttgcaaaagaatcttacgatcgtaatttcgattttttacgtggattagcgaaggatttggtgcgctgggatgttgaattaattgtggctgctcctgacaccgtggctgaggctcttcgtgccgaggtgccacaagctcgcgtagggtggacccctttagacgtcgtggcccctacatgcgatttattggtgcatcacgccggcggagtctctacgctgactggtttatcggctggcgagccccaattattaatcccaaagggcagtgtattggaagctcctgcgcgccgcgtagcagattacggcgcggcgattgcactgttgcctggtgaggactcgacggaagctatcgccgatagttgtcaggagttgcacgccaaggacacttatgcccgccgcgctcaagacttaagccgcgaaatttcagggatgcctctgccggccacagtggtgactgcactggaacagttagcctaa
6.
DcUGT2
(
DcCGT
)
from
Dactylopius coccus
(서열번호 42)
atggagttccgcttattgattctggcactgtttagtgtcttaatgagtacgtcaaatggtgccgagattcttgccctgtttccaattcacggaatttccaactacaacgtagcagaggcacttcttaaaacgcttgccaaccgtggacataacgtcactgtggtcacgtcattcccccagaagaaacccgtgccaaacttgtatgaaatcgacgtatctggggccaaaggtcttgctaccaactcaattcactttgagcgtcttcagactatcattcaagacgtgaagtccaacttcaagaatatggtgcgtctttcacgcacttactgcgagattatgttctccgatcctcgcgtacttaacatccgcgacaaaaagtttgatttggtaatcaacgcggtgttcggatcggattgtgacgctggctttgcgtggaaaagccaagcacccctgatctcaattttaaatgcacgccacaccccgtgggcgcttcaccgtatgggaaacccttctaaccctgcgtacatgccagtaatccactcacgcttcccagtaaaaatgaatttcttccagcgtatgatcaatacaggctggcatttatactttttgtatatgtacttttattatggcaacggagaagacgcaaataaaatggcgcgtaagtttttcggtaacgacatgcccgacattaacgaaatggtctttaacacatcgttgctttttgttaatactcactttagtgttgatatgccctaccctcttgttcctaactgcattgaaattggtgggattcacgtcaaagagccccaaccgcttcccctggagattcaaaaattcatggatgaagcagagcatggtgtaatctttttcactttgggctcgatggtccgcactagcacctttcccaatcagactatccaagcgtttaaagaggcgttcgcagaacttccacagcgtgttctttggaagtttgaaaacgagaatgaagacatgccttctaacgttttaatccgcaaatggtttccacagaacgatatctttggacataagaacattaaggcgtttatctcgcatggcggtaactcaggggcccttgaagccgtgcatttcggcgtgcccatcatcggcattcctctgttctatgatcagtatcgtaatatcttgagcttcgtgaaagaaggggttgcggtactgctggacgttaatgatttgacaaaggataacattctgtcgtctgttcgtacagtagtgaacgataaatcttacagcgaacgcatgaaagctctgtcccagctgtttcgcgatcgtccaatgagtcccctggacacggctgtctattggacggaatatgtaatccgtcaccgcggagcacatcatctgaagactgctggcgcttttttgcactggtatcagtatttgttgctggatgtgattactttccttttggtaacattctgtgccttttgcttcattgtcaagtacatctgtaaggcgctgattcaccattattggtcgagttccaagagtgaaaaattaaagaaaaactaa
7.
UGT708A6
(
ZmCGT
)
from
Zea mays
(서열번호 43)
atggctgctaatgggggggatcatacctccgcgcgcccacatgtggtgttgcttccatccgctggcatgggacatcttgtccctttcgcccgcttagctgtggctttatctgagggacacggctgcaacgtaagtgtagctgcagttcaaccaacggtttcctctgcggagtcgcgtctgttagacgcacttttcgtcgccgccgccccagccgtccgccgtcttgatttccgcctggcccccttcgatgaatccgagttccccggtgcagacccttttttcttacgcttcgaggcgacacgtcgctcggcaccgcttctggggccgttattagatgcggcggaagcctccgcacttgtgactgatattgtccttgcttcggtagcgttgccagtggcgcgcgagcgtggagttccctgctatgtgctttttacgtcatcggccgcaatgctgtcgttgtgtgcgtattttccagcttatttagatgcacatgcagcggccggctcggtcggggtcggagtagggaacgtcgacattccaggggtatttcgcatccctaagtcgagcgtcccgcaagcacttcacgatccagatcatttatttacccagcagtttgtcgcaaatggccgttgtttagttgcctgcgacggcattcttgttaacaccttcgacgccttcgagcccgatgcagtaaccgcactgcgccaagggtcgatcacagtctctggcggttttccaccagttttcaccgtgggcccaatgcttcccgttcgcttccaggcagaggagacggctgactacatgcgttggttgtctgcacaaccaccccgcagtgtcgtctatgtctcgtttggaagtcgcaaggcgattcctcgcgaccagttacgtgaattggccgcagggttagaggctagtggcaagcgttttctgtgggtagtaaagtcgaccatcgtcgaccgcgatgataccgccgatctgggcggcttgttgggggacggctttcttgagcgcgtccaaggtcgtgcatttgtgactatgggatgggtggaacaggaagagattttgcaacatggctcggttggcttgtttatctcgcattgtgggtggaatagccttaccgaagccgccgcgttcggggtaccagttcttgcctggcctcgtttcggagatcagcgtgtgaacgccgccttagttgcgcgctctggattgggagcgtgggaagaagggtggacttgggatggtgaggagggacttactacacgcaaggaagtggcgaaaaagatcaagggcatgatggggtacgatgctgtagccgaaaaggcggccaaagttggtgacgcagctgcggcagcaattgcaaaatgtggcacgagttatcaatctttggaagagtttgtacaacgttgccgcgacgccgagcgtaagtaa
8.
OsCGT
from
Oryza sativa
(서열번호 44)
atgccttcctcaggagacgctgccggtcgtcgccctcacgtcgtgctgatcccttcagccggaatggggcacctggtcccgtttggtcgtctggctgtcgcactttcctctgggcacggatgtgatgtgtctttagtaacagttcttcctactgtgagtacagcggagtcaaagcatcttgatgcactttttgacgcattccccgcagttcgccgtcttgacttcgagttggcgccatttgacgcatcagagtttcccggtgctgaccctttcttccttcgttttgaggcgatgcgccgttcggctccattgcttggccctttgctgacgggcgcgggcgctagcgcactggcgacggacattgctttaacgtctgtcgtaattccagtagcaaaagagcaagggcttccgtgtcacattttattcactgcgtcggccgcaatgttatcattgtgtgcctacttcccaacttatttggatgccaacgctggcggagggggcggtgtgggcgacgtggatattcctggagtgtatcgcattccgaaggcatcaattccacaagccttacatgatcccaaccacttgtttactcgtcagtttgtggcgaatggtcgtagtcttacctcggcggccggtattctggtgaacactttcgatgcgttagagccggaggcagtagctgcattgcagcaaggaaaggtagcctccggctttccaccagtattcgcggtggggccgttgctgcctgcctctaaccaggccaaggatccgcaggcaaattacatggagtggctggacgcccagcccgcccgcagcgtagtttatgtaagtttcgggagtcgcaaggcgatttcacgtgaacaacttcgcgagctggctgctggcttagaggggagcggccaccgttttctgtgggtcgtgaaatccaccgtcgtggatcgtgacgacgcggccgagctgggagagctgttggacgagggttttttagagcgtgtcgagaagcgtggattggtgacaaaggcatgggtcgaccaggaggaggtactgaaacatgaaagcgtagccctgtttgtctcacattgcggctggaacagcgtgactgaggcggcggcgagcggtgtgcctgtcctggccttaccccgcttcggggaccaacgtgttaattcaggagtggtggcacgtgcaggattaggagtatgggcggatacttggtcgtgggagggcgaagcaggcgtgattggtgcggaggaaatctcagagaaggtcaaagcagctatggccgacgaagctttacgtatgaaagctgcatcccttgcagaggcagccgccaaggcagtggctggcggtgggagtagtcatcgctgtttagcggaatttgcccgtctgtgtcaaggtggaacttgccgtactaattaa
9.
UGT708D1
(
GmCGT
)
from
Glycine max
(서열번호 45)
atgagttctagtgaaggagtggtacatgtagcttttcttccaagtgcaggaatgggccacttgaaccctttccttcgcttggcggcgaccttcattcgttatggttgtaaagtaacgttaatcaccccgaagcctactgtatccctggcagaatcgaatttaatttcacgcttttgttccagctttccacatcaggttacgcaactggacctgaatttagtcagcgttgatccaacgaccgttgacacaatcgacccattcttcttacaatttgaaaccatccgccgtagtctgcatcttttacctcccattttaagtcttcttagcactcctttgtctgccttcatttatgacattactcttatcacgcctttgctttctgtaatcgagaagctgtcgtgccccagctacttgtattttacatcttcagcacgtatgttctctttcttcgcacgtgtctccgtgttgtccgcatctaatcccgggcagactccctcgtcatttatcggtgacgatggagttaagatccctgggttcacaagccccatcccacgcagcagtgttccgcctgcgattcttcaagcgtcctcaaatctttttcagcgcattatgttagaagacagcgcgaacgttaccaagcttaataatggggtcttcatcaatagctttgaagaactggagggcgaagctttagccgctttaaacggggggaaagttcttgaaggtctgccgcccgtgtacggggtgggcccccttatggcgtgtgaatatgagaaaggcgacgaggagggtcaaaagggctgcatgtcttcgatcgtgaagtggctggatgaacagtcgaagggaagcgtggtatacgtgtccttgggcaatcgtacggaaacgcgccgtgagcagattaaggatatggcccttggtttgatcgagtgtggctatggattcttgtgggtcgtcaaactgaagcgcgtcgataaagaagatgaggaaggcttagaagaggtgttaggtagcgagctgagttccaaggttaaggagaagggtgttgtagttaaggaatttgttgaccaagtcgaaattttgggccacccaagtgttgggggatttttgtcgcacgggggttggaacagcgtaactgaaactgtatggaagggagtgccttgtctgtcatggccacagcatagtgatcagaagatgtctgcggaggtaatccgtatgtccggaatgggtatctggcccgaggagtggggctgggggacgcaagatgttgtgaagggagacgaaatcgccaaacgcattaaggaaatgatgtcgaacgaatcgttgcgcgtaaaggcgggagaattgaaggaagcggcgttaaaggcggcaggggtaggggggagttgtgaagtgactattaaacgtcagatcgaagagtggaaacgcaatgcccaggctaattaa
10.
GtUF6CGT1
(
GtCGT
)
from
Gentiana triflora
(서열번호 46)
atggggagtttgactaacaacgataatcttcatatttttcttgtgtgcttcatcggccagggcgtggtcaatcccatgttacgtttggggaaggcgttcgcctccaaagggttacttgtcactttaagcgcaccggaaatcgttggaactgagatccgtaaggcgaataaccttaatgatgaccaaccaatcaaggtgggttccgggatgattcgtttcgaatttttcgacgatggatgggaatccgtaaacggtagcaaaccgtttgacgtatgggtctacatcaatcacttagaccagacaggccgtcaaaaacttccgattatgttaaagaaacatgaggagacagggactcctgtatcttgcttgatcctgaatcccttagtcccttgggtcgcggacgtagccgattcacttcagatcccctgcgctaccttgtgggtccaatcttgtgcaagtttttcagcatattaccactaccaccacgggttagtgcctttcccaaccgaatcagagcccgagatcgacgtacaacttcctgggatgccacttttgaaatatgatgaagtgcccgactacctgcatccgcgcacaccctaccccttttttggcacgaacattttaggtcaattcaagaatttatccaagaacttctgtatcctgatggataccttctacgagttggaacacgagatcatcgataatatgtgtaaattgtgtccgattaagccaattggcccgttgtttaagattccgaaagacccaagctccaacggaatcacgggtaatttcatgaaagtggatgactgcaaggagtggctggacagccgtccaacatcaactgtggtttacgttagtgtcgggtctgttgtatatttgaagcaggagcaggttacagaaatggcatacggcattttaaattcggaagtttcgtttttgtgggtgctgcgcccgccgagcaaacgcatcggtacggaaccgcatgtactgcccgaggagttctgggagaaggccggagatcgtggcaaggtggtgcaatggtcaccccaggagcaggtgcttgctcaccccgccactgtcggttttttaacacactgtggatggaatagcactcaagaggcgatttcgagcggagtgcccgtcatcactttcccacaatttggggaccaagtgaccaatgctaagttccttgtggaggaatttaaggtcggggtccgtttaggccgcggagagttagaaaatcgcatcatcacacgcgacgaagtagaacgcgctttacgcgagattacttcaggccccaaggctgaagaggtaaaagagaacgccttaaaatggaagaagaaggcagaagagacagtagctaaaggcggctactccgaacgtaatcttgtaggcttcattgaagaggtggctcgtaagactggtacaaagtaa
11.
AvCGT
from
Aloe vera
(서열번호 47)
atggaggaaatttccagtaaagtggagttcttatcccttaagcccagcatgtcaggaagtccccgttacagccccacatttcgtaaaatcggaagcggtcgcaattcccgccgcgactcccgtgctcatgcagggaatttcccctggattcgcaacaatcgtgtttttttttggctgcttttaatcaccatctgggcgtacatcggctttcacgtccaatctcaatgggcacatggcgaccataaagctgagttcgttggatacaagtcggaggtagggaagatgggtgaggacgtcaagtcggtaaatagtacgactacgttctccattgtacacaagggcaatttaactgttgaaggaaagaaagaccccgattccaattttggtatttcactgttgaaaaagggtaaacaggttctttcccgtttaaattcacgcaaaaagggccatcgttcgcgcaaggtgtcggaaaaactggaagaagaaacggacgacaatgggacgggagaaatggatgaggtccttatccagcgcaaaaacacatcttatggcttaattgtagggccttttgccaaactggaagagagtgtgcttgagtggagcccaggcaagcgccgtggtgtctgctatcgtaagggagaatttgcccgcgcggtgtcttctcagcgctttatgttgatcttccacgaattgtcaatgactggcgccccattgtccatgttggaattggccacggagatcctgtcttgcggtgggtctgtgagcgctattgtattatctaagaagggagggttaatgccggaactgaagaagcgtggtattaaggttttgcaagaccgtgacaaggtgagtttcaaggtcgccacgaaagtagacctgattattgcgggatctgctgtatgtagtagctggatcgagccatatctggagtatttccccgctgggtccggacatattgtctggtggatcatggaaaaccgtcgcgaatacttcgaccgtagcaagcatcttttaaaccgtgtgaaaattttggcatttcttagcgatagccagtcaaagcagtggctttcttggtgtgaggaagagaagattaaattcctgatccagccaatgttagtgccgttgtcagttaacgatgagctggccttcgttgccggtattccttgtagcttgaatactccagcattatcagtggagaaaatgatcgaaaagcgtgatttattacgtcacgcagtccgtaaggaaatggggttgggggacaatgacatgcttgtgatgagtttaagtagcatcaacccagccaagggtcagcgctttctgcttgaggcagccttactggtagctgaacacaatgtatcattgaaagatgctaacagttacagtcttatggaggaggagaagttatccgggaacgcacctcaaaatcaaaccatcatgatcggtcaactgaatcctggccacgtacttcagatcgccaatgacactaataagcccgtcaatgcgttacagaagattggcgccacacgtgtctcgtcgaagcgtcgcggcaagctgcatacgaatacagtcacgggcgtgcttcagaaaagccgcaaacttttgtccgaggcagcaggtatgaaggaggaaaccctgaaagtccttgtaggttccgtcggatcgaaatcgaataaggttctgtatgtaaaggcaatcatggaatacatcagccaacattctaatttgtctaaggtcgttctttggaccccagccaccacgtctatcgcagcactgtacgccgccgcggacgtgtacgtcattaacgctcagggacatggagagacattcggtcgcgtgacgatcgaggcgatggcctttggcctgccagtgctggggactgacgccggagggactaaagaaatcatcgaccaccgtgttacgggacttctgcatcctgtgggtcccgagggcactgtactgttagcgcaacacattcaatatcttttaaaaaatcccagcgtgcgcaagaaaatgggtatcaatggtcgccgcaaagtacaagataaatacttaaaacaccagacttacgagtcccttggcaaagtcatgttcaaatcgatgcgtccccgttaa
12.
dnrF
from
Streptomyces peucetius
ATCC 29050
(서열번호 48)
gtggccttgacgaagccggatgtcgatgtcctcgtggtgggcggcggtctcggggggctgtccaccgccctgttcctcgcccgccggggggcgcgggtcctgctggtggagcggcatgccagcacctcggtcctgcccaaggcggcaggccagaacccgcgcaccatggaactgttccgcttcggcggcgtggccgacgagatcctggccacggacgacatccgcggcgcccagggcgacttcaccatcaaggtcgtggagcgcgtgggcggtcgcgtcctgcacagcttcgcggagagcttcgaggaactggtcggtgcgacggaacagtgcacgcccatgccctgggcgctcgctccccaggaccgggtggagcccgtcctggtggcccacgccgccaagcacggcgcggagatccggttcgccaccgaactgacctccttccaggcgggcgacgacggtgtcacggcccgcctgcgcgacctgggcacgggagcggagagcaccgtgagcgcccgctacctggtcgccgccgacggaccccgcagcgcgatccgggagagcctgggcatcacccggcacggtcacggcaccctggcccacttcatgggcgtcatcttcgaggccgacctcaccgccgtcgtaccgcccgggtccaccggctggtactacctgcagcacccggacttcaccggcacgttcggccccaccgaccggcccaaccggcacaccttctacgtccgctacgaccccgaacgcggcgagaggccggaggactacacaccgcagcgctgcaccgagctgatccggctggctgtcgacgcgcccgggctcgtcccggacatcctcgacatccaggcctgggacatggcggcgtacatcgccgaccggtggcgcgaagggccggtgctgctggtcggcgatgccgccaaggtcaccccgcccaccgggggcatgggcggcaacaccgccatcggcgacgggttcgacgtggcctggaagctggccgccgtgctgcgcggcgaggcgggcgagcggctcctcgacagctacggggcggagcggtcgctcgtgtcccgcctcgtcgtcgacgagtcactcgccatctacgcccagcgcatggctccccacctgctcggcagcgttcccgaggaacgcggtacggcgcaggtcgtcctgggcttccgctaccgctccaccgccgtcgccgccgaggacgacgaccccgagccgaccgaggatccgcgacgcccgtccgggcgccccggcttccgcgcaccccacgtctggatcgaacaggacggcacacggcgttccaccgtcgagttgttcggcgactgctgggtgctcctggccgcaccggagggcggcgcctggggccaggcggccgcccgcgccgccgcggatctgggcgtccgcctcgacgtccatctcgtcggccgcgatgtcgccgccccctccggcgaactgacgcggacctacgggatcggccgggcgggggccagcttggtgcgcccggacggcgtggtcgcctggcgtacggcagtagcgccgggagcggaggcccaggaccagctgagcaccctgctcacccggctgctggcccgctga
13.
antDEF
from
Photorhabdus luminescens
(서열번호 49)
ATGATAATAAATAACAGAAATGAATCTCAACCACGTAGAGTTGTGGTGACAGGGCTAGGTGTTGTCGCACCGACAGGTGTTGGCGTTAATGAATTTTGGAACAATATTCATAACGGCAAATCGGGGGTAAGTGAATATGAGTGGGGAAGAAAAAAATTTGGTTTTAAAAGCGGAGCAATAGGAAAAGTTCACGGTAACGATAGCGATAGCAAAGAGTTTGTGCTGAAAAGTGAGCGTAAATATCTTGAGTTTGCGCTAGAAGCCTCTGAGATGGCAATGCAAGATGCAAATTTAAAACCTTCAGACATTGATGGCCGGCGTTTTGGCGTTGCGATAGCAACAGCGATTGCCGATGCTGCGGGAATGGAAGAGTGTTTGCTCAGGATCACCAAAGGGGGCAAAGAGAATATTCATCCTGATTTAATTAAATCAGAGGATTATGACAGCTTTGATTTCAGCTCTGCCGCCACCTCTGTTGCGAAAAAATATGGCGCATCGATGTCCGTCAGTAACATATCAACTGGGTGTGCGGCAGGACTTGATGCATTAGGCATTGCGATGGAGCATATCCGTTATGGCAGAGCGGATGTGATGCTGGCTGGCGCCAGTGAAGCGCCGCTTTGTCCACTTTCTATCGGCTCTTTTGAAGCTTTAGGGGCGCTATCATCAAGAGAATTGGAAAATCAGCAAGCAGCGACTTGTCCTTTTTCCCTTGAGCGGGATGGATTTGTGATTGCTGAAGGGTGTGGAATATTAATTTTAGAGTCTTATGAACATGCTAAGCAGCGTGGAGCACATATCTATGCTGAATTAGCAGGGTATGCGTCCGTGAATAACGCTTATCATATGACCGACTTGCCTGCGGATGGAATGGCAATGGCGCGGTGCATTGATATGGCGTTGAAGGATGCCCAGATATCGCCATCAGCGGTCAATTATATTAGTGCTCATGGCAGTTCTACGGCTCAAAATGATATTAACGAATCAAATGCGATTAAATTTGTTTTGGGAGAAAATGCATTTGATATTCCAATTAACTCATTAAAGTCAATGACAGGTCATGCTTTAGCTGCCGCTAATGCGATCGAGTCTGTAGCGTTATGTCTGGAAATAGAAAAGCAATATATTCATCCAACAATTAATTATCAAACGCCGGACCCTGATTGCGATTTAGATTATATTCCTAATCAAGGTTGCGCATATCCAATTAAGACCGCATTAAAATTATCGAGTGGTTTTTCTGGTATTCACAGTGTTATTGTTATGAGGGCAGTAGACA ATGCGTAA AAGAGTTGTTGTTACCGGCGTTGGCGCAGTACATCCTGATGGCAATGATGTCACCGCTATAAAAACAAAAGTGATTCAGAAATTATTGGGTCAGGAATCGATAAATAATACCAACAAAAGTTCTGTAATAAGGACATTGAATGATTTCGATGGGGCAAAATATATCAATAACCGCTTAAGACGTAAAATTGATGAATTTTCAGTTTATGGTATCGTCGCCGTTGAAATGGCATTAAAAGCGAGCAGATTGGATGTAGATAAGCTTGATCCTAATCGTGTTGGCATATATGTTGGAAACTGTTTTGGCGGATGGCAGCATATTGAGGATGAAGTTAAAGCGCTCCATGTTGAAGGCATATCGGGGATGGGACCTTATGTTGCTACGGCATGGTTCCCTGCTGCGCTTCAAGGGCAATTGTCACTGCTTTATGGTTTTAGTGCGCAATCTAAGACATTTTCCACCTCCGATGTAGCAGGGATGCAAGCAATAGGCTATGCGGCTGAAGCGATTTCTAATGGTGTTGCCGAAGTGATGTTATGTGGCGCGTCAGAACATCTTTCCAGCCCGTTAGTTAAAAGTTTACTGGAGAAAGAGTCAAGCCAGAAACACTCTGAGGTTTTTGGCGAAAGACAGCCAGGGGACTTTTCCGAAGGCGCTGCATTTCTAGTGCTGGAAGAGAGGCAACATGCTTTAGAACGCGGCGCTTCGATATTGTGTGAATTAACGGGTTTTGTTGATTATTTTTCACCGGATAAAAATACAAGAAATAACACCTTAGAATATACTGCTGAACTATTCAACCATAATGAGAATGCTGTATTTATTATGGATGGAATATATGATGATGAAAAAGAAATAACGAGTAAGGCTTTCTCCAATAAAGAGATAAAAACATCATTTATAAATCTGAGGCCTTACTTGAATAATCAATTTTCAGTCAGCGGCGTAATTGATTCAGTCCTGGCATCATCATTTTTATCAGAAAATAACGGGGATGGAGAACAACAATCTAATAAAATAAATGAACTTTCAAATACTAACCAAATAATAATTCAGCGCTTTAGTAACCAGGGTCATGTATGTGCGTTGAGTTTTTCAGCAATTTAAtctctaaaatatttaattacgcgaggaaaaatatATGAATAATAACCCAGAAGTAAAAATAAAAACGATTTTGTCTCTTTTTCTTAACGTTAATATTGATGATTTCAATATGGATGCAAACCTTGCTGATGCCTATGATATGGATTCTACGGAATTGGCTGACTTGGCAAAAGAGATTACGAAAGAGTTCGGTATTTCCGTGACGAAAAGTCAGTTCAGTCATTGGGAAACAGGAAGAGCCGTTCTTGATTTCGTCTCATCAAGTTTAAACGATAAAAATTAA
밑줄친 부분은
antD
와
antE
의 reading frame이 오버랩되는 부분을 나타내며 (즉, 시작 코돈과 종결 코돈 부위가 겹침), 끝 부분 bold체 소문자는
antE
와
antF
사이 서열
14.
antB
from
Photorhabdus luminescens
(서열번호 50)
ATGGACGATATTTCTTTATCATCTGATTTTTTTGATCTTTGGATTATCAAAATCGACGATATTGATTTAGCTTCTATTGAACAGTTAATTCACTGTTCTGATATAGTTCGCCATAACCAAATTTGTTTAGCGGATAGAAGAAAGAGATTTATATTTAGACGGGCTGCATTACGTTATGTTTTGAGTCAATATTTATCTGATTATGAAATCATAACGAATGATAACGGAAAACCTTATATATCCACGGAGCAAGACTTCAAATATTATTTTTCACTGAGTGCTTCAGGAAACTATTGTGCCATTGGTTTTAGCTCAAGGGAAATAGGTGTTGATATTGAAGTCACTCCTTCTAAGGTAAAATTTTCAGAAATTATTGAACGTTTTATTAAGGATAAAGATTTGGAATATATGAAAGGTATAATGTTAAAACAACTATCAGGAGTTAGTCTCGGATTTAATAACTATTATCATTTAATGTCATTATATTATTGGGTTAGACTTGAAGCATATATTAAATTATTTGCTTCGACTTTACATGAGAAATTATTGGTTAATAACTCTGATTCTGTTAAAGATATGAAAGAATTGGAGGCAAGCACATTATTGATTCATAGTCAGCAATTTGTTTGTGCCTTATCTCAAAAGAAAGTCATTTCTACACCAAATATCAAGGAAATAAATTATTCCGAAATTATAAGGAACAAAGATGAGTAA
15.
antG
from
Photorhabdus luminescens
(서열번호 51)
ATGAAACTAATCTCTATGTTGTTACATTCAGAGCATGATAACTTACATCATGATTGTATTGTCACTAAGGATTATCATTATACAAGAAAAGAGGTGATATCTTCTGTTTCCCATTTAATTGATGATTTATTGAGTCGAGGAGTGCAAAAAGGTAATAAAGTCATTGTTATATTTGAACATGATGAATTAGGTGTTTTCTTTTTGGCTGCCGCCAGTGCTATGGGGTTGCATTTATTAATGCCCTATAATTTATCATCAGCGACAATCGATGAATGGATTAATTTTACCAATGAAGTGCAATACGATTTTGTTGTTTATCTCAAAAAAGATAAACATTTTGTTGGAAAATTAAAAGAAAACAACATTAATGTTATTGATATTTCAGATCATAAGATCAGAGTTAGTGATGATATTGCGGAAATCCCAATGATAACTTATTCTCCGCAACCTATTGCTAACTTTATTGTCCTGTTCACCAGTGGGAGTACAGGCAAACCAAAAGCCATTAGTATTTCAGAATCGTTAGTATGTCGTCGAATTTATTCGGTGACCGAGAAATTAAAATTTACGCAAGATGCCAAAATATTCATGTCAGGTTTGTTGAATAATACAACTGGAGTGATTTTTTCTTTCGGCTCATTATTGCATCAATCAACACTTTTTATACCCGAAGATAGAAATGTAGAGAGATGGCCTGATTATCTTTCTCGCAATAAAATCACTCATATTATGTTACGCCCAGAATCAATGAAATTATTCGTTAAATCGACAGCAGAACTTAATATTGATCTCTCTTGTTTACGGGTGGTTGCTTATGGCGCTGCGGCGATGCCTCCTAGCGTACTTGAGAAAGGGCGACAATTAATTGGCTGTGAATGGGTGCAGGGATATGGGTTAAGTGAAACTTATGGTCCTTTCTGTTGGGTGGATGAGCAAGATCATCGTGATAAAAGATATCTCAATTCAATTTATTGTGTTGGTAAGATTGATAATACATTGGAAGTGGCAGTTAAACCTATTATAGGTTCATCGGATAATATCGGAGAAATTATACTAAGGGGTAAAAGTATTATGGAAGGATATTATGATGTCCTTTCTGGAGAAATAACGCCTCCTGATGAATGGTTTGCCACTGGTGATCTTGGTTATATAGATGAAGAGGGTTATTTAGTTTTGAAAGGACGTAAGCAAAATACGTTTATGAGTGCTAACGGACACAGAATTTATCCTGAAGAAATTGAATCTATTTTATCCCGAATACCCAATGTGAATGTCGCTACGGTTGTTGGTTTTTCTTTCCATGAAAATGGTGTTGCTATTGATCAGCCGGTTGCTTGCATGAGTGGAGAGATATCTAAGAAGTCATTACCTGAAATTGAAGATATTATTTCATCATTTTTAATGAGTAAACTCAGTCGAGAAAAATGGCCGGATTGGTTCTATGTTACTGATGAATGCTTTCCGAAAAGCCATAATGATAAGATATTGAAATCAGAGTTAATTAAATCAATCGATCCTAAGAAATTATTTACATTGAGGAATCAATAA
16.
ScoMCAT
from
Streptomyces coelicolor
(서열번호 52)
Atgctcgtactcgtcgctcccggccagggcgcccagacgcccggcttcctgactgactggctcgccctccccggtgccgctgaccgcgtcgccgcgtggtcggacgccatcggactcgatctcgcccacttcggcaccaaggccgacgcggacgagatccgagacacgtccgtggcccagccgctgctggtcgccgccggaatcctgtccgccgcggcactcggtacgcagacatctgtcgctgacgcgacgggccccgggttcacccccggcgcggtcgccggacacagcgtcggcgagatcaccgccgccgtcttcgcgggcgtcctcgacgacaccgccgcgctgtccctcgtacgccgtcgcggcctggccatggccgaggccgcggcggtcaccgagaccggcatgtcggcgctgctcgggggcgaccccgaggtgagcgtcgcgcacctggagcggctcggcctgaccccggcgaacgtgaacggcgccggtcagatcgtggcggcgggcaccatggagcagctggccgcgctgaacgaggacaagcccgagggtgtgcgcaaggtcgtcccgctgaaggtggccggcgcgttccacacccgccacatggcccccgccgtggacaagctcgccgaggccgccaaggcgctgacgccggccgacccgaaggtgacgtacgtctccaacaaggacgggcgggccgtcgcctccggcaccgaggtgctggaccggctggtcggccaggtcgccaacccggtgcgctgggacctgtgcatggagacgttcaaggagctgggcgtcaccgcgatcatcgaggtgtgtccgggcggcacgctgaccgggctggccaagcgggcgctgcccggagtgaagacgctggccctgaagacccccgacgacctcgacgcggcccgtgagctcgtcgccgagcacacccaggcctaa
17.
actVA-orf5
from
Streptomyces coelicolor
(서열번호 53)
Atgagcgaggacacgatgacccaggagcggccgtccctgacggcacacgcccgccggatcgccgaactcgccgggaagcgggcggccgacgccgaacagcagcgccggctgagccccgacgtcgtcgacgcggtccttcgagccggtttcgccgcccacttcgtaccggtggcgcacggcggccgggccgcgacgttcggggagctggtggagcccgtcgcggtgctcggcgaggcctgtgcctcgaccgcctggtacgcctcgctcacggcgagcctcggccggatggccgcctacctgccggacgagggccaggccgagctgtggtccgacggccccgacgccctgatcgtcggtgccctgatgccgctgggccgggccgagaagaccccgggcggctggcacgtgtcgggcacctggccgttcgtcagcgtcgtggatcactccgactgggcgctgatctgcgccaaggtcggcgaggagccgtggttcttcgcggtgccgcgacaggagtacgggatcgtcgacagctggtacccgatgggtatgcgcggaacgggcagcaacacgctcgtcctcgacggggtgttcgtgccggatgcgcgggcctgcacccgtgcggccatcgcggcaggtctcggtccggatgccgaggcgatctgtcacaccgtgcccatgagggcggtcaacgggctggccttcgcactgccgatgctcggcgcggcccgcggggccgcggccgtgtggacctcgtggaccgccggaagactggccgggccgaccgggcagaacgccgtctcgtcccaggaccgcgtggtgtacgagcacacgctggcccgggccacgggtgagatcgacgcggcccagctgctgttggagcgggtcgcggcggtcgccgacgccggctcggcgaccggcgtactggtcggccgcggggcgcgggactgcgccctggcggcggagctgctgaccgccgcgaccgaccggctgttcgcctcggcgggcacccgggcacaggcccaggacagcccgatgcagcgcctgtggcgcgatgtgcacgcggcgggcagccatatcgggctgcagttcgggcccggggcggcgctgtacgccggagagctgttgaggaggagcaacgatggctga
18.
actVB
from
Streptomyces coelicolor
(서열번호 54)
Atggcagccgaccagggaatgctccgggacgccatggcccgggtgccggccggggtggcgctcgtcaccgcccatgaccgcgggggagtcccgcacggtttcaccgccagttcgttcgtgtccgtctcgatggagccgccactggcactggtctgcctggctcgtacggccaactccttcccggtgttcgacagttgcggcgagttcgcggtgagcgtgctgcgcgaggaccacacggacctggccatgcgcttcgcgcgcaagtccgcggacaagttcgcgggcggggagttcgtccgtaccgcgcggggagcgaccgtgctcgacggagcggtcgcggtcgtcgagtgcacggtccacgagcgctacccggcgggcgaccacatcatcctgctcggcgaggtccagtccgtgcacgtcgaggagaagggcgtaccggcggtctacgtggaccgccggttcgccgccctgtgctcggcggcgggtgcctgcccgtccgccaccgggcggggcgtgcccgcgcatgccggctaa
19.
pobA
from
Pseudomonas fluorescens
(서열번호 55)
ATGAAAACGCTAAAAACCCAAGTCGCCATTATTGGCGCCGGTCCCTCCGGATTGCTGCTCGGCCAGTTACTGCACAACGCGGGTATCCAGACCCTGATTCTAGAGCGCCAGAGCGCCGACTACGTGCAAGGCCGCATCCGTGCCGGGGTGCTGGAGCAAGGCATGGTCGACCTGCTGCGCGAAGCGGGCGTCAGCCGACGCATGGACGCCGAGGGCCTTGTGCATGACGGTTTCGAATTGGCACTCAATGGCGAACTCACCCACATCGACCTCAAGGCGCTCACCGGCGGCCAGTCGGTGATGATCTACGGCCAGACCGAAGTCACCCGTGACTTGATGGCCGCCCGCGAAGCGGCGGGTGGCATCACTCTATACGAAACGCAGAACGTGCAGCCTCATGGTCACAAAACTGATCGACCCTGGCTGACCTTCGAGCACCAGGGTGAAGCTTTTCGCCTGGAGTGCGACTACATCGCGGGCTGTGATGGTTTTCACGGTGTGGCGCGGCAGTCGATTCCGGCGCAGTCGTTGAAGGTCTTCGAGCGCGTCTATCCCTTCGGTTGGCTGGGCGTCCTCGCCGACACACCGCCGGTGCATGACGAACTGGTGTACGCCAAACATGCGCGTGGCTTTGCCCTGTGCAGCATGCGCTCGCCGACCCGCAGCCGCTATTACCTGCAAGTGCCGGTTGAAGAAGCGCTGGATGAATGGTCGGATCAGCGCTTCTGGGATGAGCTGAAAACCCGTTTGCCCAGTGCACTGGCGGCCCAACTGGTCACCGGGCCATCCATCGAGAAGAGCATCGCGCCGCTGCGCAGCTTTGTGGTCGAGCCGATGCAATACGGGCGCCTGTTCCTGCTGGGGGACGCCGCGCATATCGTGCCGCCCACCGGGGCCAAGGGCTTGAACCTGGCGGCCAGCGACGTGAGTACGCTGTTTCGGATCTTGCTCAAGGTCTATCGCGAGGGGCGGGTGGACCTGCTGGAACAGTACTCAGCGATCTGCTTGCGCCGCGTATGGAAAGCCGAACGGTTTTCCTGGTGGATGACTTCGATGTTGCACCAGTTTCCGGAGGCCGACGGGTTCAGCCAGCGCATTGCCGAGAGCGAGCTTGCGTATTTCATCAGCTCCGAGGCGGGCCGCAAAACCATCGCAGAAAATTACGTCGGGCTTCCTTACGAAGCTATCGAATAA
20.
dnrF
P217K
from
Streptomyces peucetius
(최종 dnrF 돌연변이)
(서열번호 56)
gtggccttgacgaagccggatgtcgatgtcctcgtggtgggcggcggtctcggggggctgtccaccgccctgttcctcgcccgccggggggcgcgggtcctgctggtggagcggcatgccagcacctcggtcctgcccaaggcggcaggccagaacccgcgcaccatggaactgttccgcttcggcggcgtggccgacgagatcctggccacggacgacatccgcggcgcccagggcgacttcaccatcaaggtcgtggagcgcgtgggcggtcgcgtcctgcacagcttcgcggagagcttcgaggaactggtcggtgcgacggaacagtgcacgcccatgccctgggcgctcgctccccaggaccgggtggagcccgtcctggtggcccacgccgccaagcacggcgcggagatccggttcgccaccgaactgacctccttccaggcgggcgacgacggtgtcacggcccgcctgcgcgacctgggcacgggagcggagagcaccgtgagcgcccgctacctggtcgccgccgacggaccccgcagcgcgatccgggagagcctgggcatcacccggcacggtcacggcaccctggcccacttcatgggcgtcatcttcgaggccgacctcaccgccgtcgtaccgAAGgggtccaccggctggtactacctgcagcacccggacttcaccggcacgttcggccccaccgaccggcccaaccggcacaccttctacgtccgctacgaccccgaacgcggcgagaggccggaggactacacaccgcagcgctgcaccgagctgatccggctggctgtcgacgcgcccgggctcgtcccggacatcctcgacatccaggcctgggacatggcggcgtacatcgccgaccggtggcgcgaagggccggtgctgctggtcggcgatgccgccaaggtcaccccgcccaccgggggcatgggcggcaacaccgccatcggcgacgggttcgacgtggcctggaagctggccgccgtgctgcgcggcgaggcgggcgagcggctcctcgacagctacggggcggagcggtcgctcgtgtcccgcctcgtcgtcgacgagtcactcgccatctacgcccagcgcatggctccccacctgctcggcagcgttcccgaggaacgcggtacggcgcaggtcgtcctgggcttccgctaccgctccaccgccgtcgccgccgaggacgacgaccccgagccgaccgaggatccgcgacgcccgtccgggcgccccggcttccgcgcaccccacgtctggatcgaacaggacggcacacggcgttccaccgtcgagttgttcggcgactgctgggtgctcctggccgcaccggagggcggcgcctggggccaggcggccgcccgcgccgccgcggatctgggcgtccgcctcgacgtccatctcgtcggccgcgatgtcgccgccccctccggcgaactgacgcggacctacgggatcggccgggcgggggccagcttggtgcgcccggacggcgtggtcgcctggcgtacggcagtagcgccgggagcggaggcccaggaccagctgagcaccctgctcacccggctgctggcccgctga
21.
GtCGT
V93Q/Y193F
from
Gentiana triflora
(최종 GtCGT 돌연변이)
(서열번호 57)
a tggggagtttgactaacaacgataatcttcatatttttcttgtgtgcttcatcggccagggcgtggtcaatcccatgttacgtttggggaaggcgttcgcctccaaagggttacttgtcactttaagcgcaccggaaatcgttggaactgagatccgtaaggcgaataaccttaatgatgaccaaccaatcaaggtgggttccgggatgattcgtttcgaatttttcgacgatggatgggaatccgtaaacggtagcaaaccgtttgacgtatggCAAtacatcaatcacttagaccagacaggccgtcaaaaacttccgattatgttaaagaaacatgaggagacagggactcctgtatcttgcttgatcctgaatcccttagtcccttgggtcgcggacgtagccgattcacttcagatcccctgcgctaccttgtgggtccaatcttgtgcaagtttttcagcatattaccactaccaccacgggttagtgcctttcccaaccgaatcagagcccgagatcgacgtacaacttcctgggatgccacttttgaaatatgatgaagtgcccgactTcctgcatccgcgcacaccctaccccttttttggcacgaacattttaggtcaattcaagaatttatccaagaacttctgtatcctgatggataccttctacgagttggaacacgagatcatcgataatatgtgtaaattgtgtccgattaagccaattggcccgttgtttaagattccgaaagacccaagctccaacggaatcacgggtaatttcatgaaagtggatgactgcaaggagtggctggacagccgtccaacatcaactgtggtttacgttagtgtcgggtctgttgtatatttgaagcaggagcaggttacagaaatggcatacggcattttaaattcggaagtttcgtttttgtgggtgctgcgcccgccgagcaaacgcatcggtacggaaccgcatgtactgcccgaggagttctgggagaaggccggagatcgtggcaaggtggtgcaatggtcaccccaggagcaggtgcttgctcaccccgccactgtcggttttttaacacactgtggatggaatagcactcaagaggcgatttcgagcggagtgcccgtcatcactttcccacaatttggggaccaagtgaccaatgctaagttccttgtggaggaatttaaggtcggggtccgtttaggccgcggagagttagaaaatcgcatcatcacacgcgacgaagtagaacgcgctttacgcgagattacttcaggccccaaggctgaagaggtaaaagagaacgccttaaaatggaagaagaaggcagaagagacagtagctaaaggcggctactccgaacgtaatcttgtaggcttcattgaagaggtggctcgtaagactggtacaaagtaa
22.
ALS
from
Rheum palmatum
(서열번호 58)
atggcagatgtcctgcaggagatccgcaactcgcagaaggcgagcgggcccgccacggtgctcgccatcggcactgcccatccaccgacgtgctaccctcaggccgactaccccgacttctacttccgagtttgcaagagcgagcacatgaccaaactcaagaagaaaatgcaattcatttgtgacagatcggggataaggcagcggtttatgttccacacggaagagaacctggggaagaacccggggatgtgcacattcgacgggccatcgctgaacgcgcggcaggacatgctgatcatggaagtgccgaagctgggggcggaggcggcggagaaggcgatcaaggagtgggggcaggacaagtcccggatcacccacctcatcttctgcaccaccacgagcaacgacatgcccggggcggactaccagttcgccaccctgttcgggctgaaccccggcgtgagccgcaccatggtctaccagcagggctgcttcgccgggggcaccgtgctgcgcctggtcaaggacatcgcggagaacaacaagggggcgcgcgtgctggtggtgtgctcggagatcgtggccttcgccttccgcgggccccacgaggaccacatcgactccctcatcgggcagctcctgttcggggacggggccgccgccctcgtggtcgggacagacatcgacgagagcgtcgagaggcccatcttccagatcatgtcggcgacccaggcgaccatccccaactcgctgcacaccatggctctccatctgacggaggcggggctgaccttccatctcagcaaggaggtgcccaaggtggtgagcgacaacatggaggagctcatgctcgaggccttcaagccgctcgggataaccgattggaactccatattctggcaagtgcatcccgggggtagagccatccttgacaagatcgaggagaagctggagctcaccaaggataagatgcgggattcccgctacatcttgagcgagtacgggaatctcaccagcgcctgtgtgctctttgtcatggacgagatgaggaagaggtccttccgggaagggaagcagaccaccggagacggctacgagtggggtgtcgccatcggattggggcccggtcttaccgtcgagaccgttgtcttgcgtagcgtccccattccctaa
23.
accBC
from
Corynebacterium glutamicum
(서열번호 59)
gtgtcagtcgagactaggaagatcaccaaggttcttgtcgctaaccgtggtgagattgcaatccgcgtgttccgtgcagctcgagatgaaggcatcggatctgtcgccgtctacgcagagccagatgcagatgcaccattcgtgtcatatgcagacgaggcttttgccctcggtggccaaacatccgctgagtcctaccttgtcattgacaagatcatcgatgcggcccgcaagtccggcgccgacgccatccaccccggctacggcttcctcgcagaaaacgctgacttcgcagaagcagtcatcaacgaaggcctgatctggattggaccttcacctgagtccatccgctccctcggcgacaaggtcaccgctcgccacatcgcagataccgccaaggctccaatggctcctggcaccaaggaaccagtaaaagacgcagcagaagttgtggctttcgctgaagaattcggtctcccaatcgccatcaaggcagctttcggtggcggcggacgtggcatgaaggttgcctacaagatggaagaagtcgctgacctcttcgagtccgcaacccgtgaagcaaccgcagcgttcggccgcggcgagtgcttcgtggagcgctacctggacaaggcacgccacgttgaggctcaggtcatcgccgataagcacggcaacgttgttgtcgccggaacccgtgactgctccctgcagcgccgtttccagaagctcgtcgaagaagcaccagcaccattcctcaccgatgaccagcgcgagcgtctccactcctccgcgaaggctatctgtaaggaagctggctactacggtgcaggcaccgttgagtacctcgttggctccgacggcctgatctccttcctcgaggtcaacacccgcctccaggtggaacacccagtcaccgaagagaccaccggcatcgacctggtccgcgaaatgttccgcatcgcagaaggccacgagctctccatcaaggaagatccagctccacgcggccacgcattcgagttccgcatcaacggcgaagacgctggctccaacttcatgcctgcaccaggcaagatcaccagctaccgcgagccacagggcccaggcgtccgcatggactccggtgtcgttgaaggttccgaaatctccggacagttcgactccatgctggcaaagctgatcgtttggggcgacacccgcgagcaggctctccagcgctcccgccgtgcacttgcagagtacgttgtcgagggcatgccaaccgttatcccattccaccagcacatcgtggaaaacccagcattcgtgggcaacgacgaaggcttcgagatctacaccaagtggatcgaagaggtttgggataacccaatcgcaccttacgttgacgcttccgagctcgacgaagatgaggacaagaccccagcacagaaggttgttgtggagatcaacggccgtcgcgttgaggttgcactcccaggcgatctggcactcggtggcaccgctggtcctaagaagaaggccaagaagcgtcgcgcaggtggtgcaaaggctggcgtatccggcgatgcagtggcagctccaatgcagggcactgtcatcaaggtcaacgtcgaagaaggcgctgaagtcaacgaaggcgacaccgttgttgtcctcgaggctatgaagatggaaaaccctgtgaaggctcataagtccggaaccgtaaccggccttactgtcgctgcaggcgagggtgtcaacaagggcgttgttctcctcgagatcaagtaa
24.
accD1
from
Corynebacterium glutamicum
(서열번호 60)
atgaccatttcctcacctttgattgacgtcgccaaccttccagacatcaacaccactgccggcaagatcgccgaccttaaggctcgccgcgcggaagcccatttccccatgggtgaaaaggcagtagagaaggtccacgctgctggacgcctcactgcccgtgagcgcttggattacttactcgatgagggctccttcatcgagaccgatcagctggctcgccaccgcaccaccgctttcggcctgggcgctaagcgtcctgcaaccgacggcatcgtgaccggctggggcaccattgatggacgcgaagtctgcatcttctcgcaggacggcaccgtattcggtggcgcgcttggtgaggtgtacggcgaaaagatgatcaagatcatggagctggcaatcgacaccggccgcccattgatcggtctttacgaaggcgctggcgctcgcattcaggacggcgctgtctccctggacttcatttcccagaccttctaccaaaacattcaggcttctggcgttatcccacagatctccgtcatcatgggcgcatgtgcaggtggcaacgcttacggcccagccctgaccgacttcgtggtcatggtggacaagacctccaagatgttcgttaccggcccagacgtgatcaagaccgtcaccggcgaggaaatcacccaggaagagcttggcggagcaaccacccacatggtgaccgctggcaactcccactacaccgctgcgaccgatgaggaagcactggattgggtacaggacctggtgtccttcctcccatccaacaatcgctcttacacaccactggaagacttcgacgaggaagaaggcggcgttgaagaaaacatcaccgctgacgatctgaagctcgacgagatcatcccagattccgcgaccgttccttacgacgtccgcgatgtcatcgaatgcctcaccgacgatggcgaatacctggaaatccaggcagaccgcgcagaaaacgttgttattgcattcggccgcatcgaaggccagtccgttggatttgttgccaaccagccaacccagttcgctggctgcctggacatcgactcctctgagaaggcagctcgcttcgtccgcacctgcgacgcgtttaacatcccaatcgtcatgcttgtcgacgtccccggcttccttccaggcgcaggccaggagtatggtggcatcctgcgtcgtggcgcaaagctgctctacgcatacggcgaagcaaccgttccaaagattaccgtcaccatgcgtaaggcttacggcggagcgtactgcgtgatgggttccaagggcttgggctctgacatcaaccttgcatggccaaccgcacagatcgccgtcatgggcgctgctggcgcagtcggattcatctaccgcaaggagctcatggcagctgatgccaagggcctcgataccgtagctctggctaagtccttcgagcgcgagtacgaagaccacatgctcaacccgtaccacgctgcagaacgtggcctgatcgacgccgtgatcctgccaagcgaaacccgcggacagatttcccgcaaccttcgcctgctcaagcacaagaacgtcactcgccctgctcgcaagcacggcaacatgccactgtaa
25. GtCGT
V93Q/Y193F
(GtUF6CGT1
V93Q/Y193F
) variant
(서열번호 61)
MGSLTNNDNLHIFLVCFIGQGVVNPMLRLGKAFASKGLLVTLSAPEIVGTEIRKANNLNDDQPIKVGSGMIRFEFFDDGWESVNGSKPFDVWQYINHLDQTGRQKLPIMLKKHEETGTPVSCLILNPLVPWVADVADSLQIPCATLWVQSCASFSAYYHYHHGLVPFPTESEPEIDVQLPGMPLLKYDEVPDFLHPRTPYPFFGTNILGQFKNLSKNFCILMDTFYELEHEIIDNMCKLCPIKPIGPLFKIPKDPSSNGITGNFMKVDDCKEWLDSRPTSTVVYVSVGSVVYLKQEQVTEMAYGILNSEVSFLWVLRPPSKRIGTEPHVLPEEFWEKAGDRGKVVQWSPQEQVLAHPATVGFLTHCGWNSTQEAISSGVPVITFPQFGDQVTNAKFLVEEFKVGVRLGRGELENRIITRDEVERALREITSGPKAEEVKENALKWKKKAEETVAKGGYSERNLVGFIEEVARKTGTK
26.
zhuIJ
- Codon optimization for
E. coli
(서열번호 62)
atgcgtcatgtagagcatacagtcaccgttgcggccccagcagacttggtttgggaggtacttgccgatgtcttaggctatgctgacatcttcccaccgacggaaaaagttgaaattcttgaggaggggcaaggataccaggtagtgcgccttcacgtcgatgttgcgggtgagattaatacatggaccagtcgtcgcgatttagaccctgcgcgccgcgtaattgcttaccgccaacttgagacggctccgatcgtgggccacatgagcggggaatggcgtgctttcacactggatgccgaacgtacccaattagtcctgactcacgatttcgtaacccgtgcagccggggatgacggtttagtcgccggaaaattgaccccagatgaggcgcgcgaaatgttagaagcggtggtagaacgtaactctgtcgccgacttaaacgcggtccttggagaagctgagcgtcgcgtccgcgcagccggtggagttggtaccgtaactgcgtaataataattttgtttaactttaagaaggagatatatccatgtcagggcgcaaaacctttttagacttaagttttgctacccgcgacacaccgtcggaggcgactccggtggtggtagatttgctggaccacgtaactggagccaccgtattaggattatcacctgaggatttccccgatggtatggctatttccaatgagaccgttacgttgacgacccacactggcacgcacatggatgcgccactgcactatggtcccttaagtgggggagttccggcaaagtcgattgaccaagtgcccttggaatggtgctatggacctggagttcgtttggatgttcgccacgtgccggcaggagatggtattactgtcgatcatttgaacgccgcgttggatgcagcagagcacgatttggcccccggtgacattgtgatgctgtggaccggcgcggacgctctgtggggaacccgcgaatacttgagcacgtttccggggttaactgggaaggggacacaatttttggtcgaggcgggtgttaaagtcattggcattgatgcatggggactggatcgcccgatggcagctatgatcgaagaataccgtcgtacgggcgataaaggagcattatggccggctcacgtctatggacgcacacgcgaatacctgcaattagagaagcttaataatttgggcgctttaccaggagctacagggtatgacatttcatgctttccggttgcggttgcaggcactggagctgggtggactcgtgtggtcgccgttttcgagcaagaggaagaggattaataa
FK: flavokermesic acid
KA: kermesic acid
CA: carminic acid
KA: kermesic acid
CA: carminic acid
<110> Korea Advanced Institute of Science and Technology
<120> C-glycosyltransferase variants and Use thereof
<130> P21-B265
<150> KR 2021-0011326
<151> 2021-01-27
<160> 122
<170> KoPatentIn 3.0
<210> 1
<211> 477
<212> PRT
<213> Gentiana triflora
<400> 1
Met Gly Ser Leu Thr Asn Asn Asp Asn Leu His Ile Phe Leu Val Cys
1 5 10 15
Phe Ile Gly Gln Gly Val Val Asn Pro Met Leu Arg Leu Gly Lys Ala
20 25 30
Phe Ala Ser Lys Gly Leu Leu Val Thr Leu Ser Ala Pro Glu Ile Val
35 40 45
Gly Thr Glu Ile Arg Lys Ala Asn Asn Leu Asn Asp Asp Gln Pro Ile
50 55 60
Lys Val Gly Ser Gly Met Ile Arg Phe Glu Phe Phe Asp Asp Gly Trp
65 70 75 80
Glu Ser Val Asn Gly Ser Lys Pro Phe Asp Val Trp Val Tyr Ile Asn
85 90 95
His Leu Asp Gln Thr Gly Arg Gln Lys Leu Pro Ile Met Leu Lys Lys
100 105 110
His Glu Glu Thr Gly Thr Pro Val Ser Cys Leu Ile Leu Asn Pro Leu
115 120 125
Val Pro Trp Val Ala Asp Val Ala Asp Ser Leu Gln Ile Pro Cys Ala
130 135 140
Thr Leu Trp Val Gln Ser Cys Ala Ser Phe Ser Ala Tyr Tyr His Tyr
145 150 155 160
His His Gly Leu Val Pro Phe Pro Thr Glu Ser Glu Pro Glu Ile Asp
165 170 175
Val Gln Leu Pro Gly Met Pro Leu Leu Lys Tyr Asp Glu Val Pro Asp
180 185 190
Tyr Leu His Pro Arg Thr Pro Tyr Pro Phe Phe Gly Thr Asn Ile Leu
195 200 205
Gly Gln Phe Lys Asn Leu Ser Lys Asn Phe Cys Ile Leu Met Asp Thr
210 215 220
Phe Tyr Glu Leu Glu His Glu Ile Ile Asp Asn Met Cys Lys Leu Cys
225 230 235 240
Pro Ile Lys Pro Ile Gly Pro Leu Phe Lys Ile Pro Lys Asp Pro Ser
245 250 255
Ser Asn Gly Ile Thr Gly Asn Phe Met Lys Val Asp Asp Cys Lys Glu
260 265 270
Trp Leu Asp Ser Arg Pro Thr Ser Thr Val Val Tyr Val Ser Val Gly
275 280 285
Ser Val Val Tyr Leu Lys Gln Glu Gln Val Thr Glu Met Ala Tyr Gly
290 295 300
Ile Leu Asn Ser Glu Val Ser Phe Leu Trp Val Leu Arg Pro Pro Ser
305 310 315 320
Lys Arg Ile Gly Thr Glu Pro His Val Leu Pro Glu Glu Phe Trp Glu
325 330 335
Lys Ala Gly Asp Arg Gly Lys Val Val Gln Trp Ser Pro Gln Glu Gln
340 345 350
Val Leu Ala His Pro Ala Thr Val Gly Phe Leu Thr His Cys Gly Trp
355 360 365
Asn Ser Thr Gln Glu Ala Ile Ser Ser Gly Val Pro Val Ile Thr Phe
370 375 380
Pro Gln Phe Gly Asp Gln Val Thr Asn Ala Lys Phe Leu Val Glu Glu
385 390 395 400
Phe Lys Val Gly Val Arg Leu Gly Arg Gly Glu Leu Glu Asn Arg Ile
405 410 415
Ile Thr Arg Asp Glu Val Glu Arg Ala Leu Arg Glu Ile Thr Ser Gly
420 425 430
Pro Lys Ala Glu Glu Val Lys Glu Asn Ala Leu Lys Trp Lys Lys Lys
435 440 445
Ala Glu Glu Thr Val Ala Lys Gly Gly Tyr Ser Glu Arg Asn Leu Val
450 455 460
Gly Phe Ile Glu Glu Val Ala Arg Lys Thr Gly Thr Lys
465 470 475
<210> 2
<211> 536
<212> PRT
<213> Streptomyces peucetius
<400> 2
Met Ala Leu Thr Lys Pro Asp Val Asp Val Leu Val Val Gly Gly Gly
1 5 10 15
Leu Gly Gly Leu Ser Thr Ala Leu Phe Leu Ala Arg Arg Gly Ala Arg
20 25 30
Val Leu Leu Val Glu Arg His Ala Ser Thr Ser Val Leu Pro Lys Ala
35 40 45
Ala Gly Gln Asn Pro Arg Thr Met Glu Leu Phe Arg Phe Gly Gly Val
50 55 60
Ala Asp Glu Ile Leu Ala Thr Asp Asp Ile Arg Gly Ala Gln Gly Asp
65 70 75 80
Phe Thr Ile Lys Val Val Glu Arg Val Gly Gly Arg Val Leu His Ser
85 90 95
Phe Ala Glu Ser Phe Glu Glu Leu Val Gly Ala Thr Glu Gln Cys Thr
100 105 110
Pro Met Pro Trp Ala Leu Ala Pro Gln Asp Arg Val Glu Pro Val Leu
115 120 125
Val Ala His Ala Ala Lys His Gly Ala Glu Ile Arg Phe Ala Thr Glu
130 135 140
Leu Thr Ser Phe Gln Ala Gly Asp Asp Gly Val Thr Ala Arg Leu Arg
145 150 155 160
Asp Leu Gly Thr Gly Ala Glu Ser Thr Val Ser Ala Arg Tyr Leu Val
165 170 175
Ala Ala Asp Gly Pro Arg Ser Ala Ile Arg Glu Ser Leu Gly Ile Thr
180 185 190
Arg His Gly His Gly Thr Leu Ala His Phe Met Gly Val Ile Phe Glu
195 200 205
Ala Asp Leu Thr Ala Val Val Pro Pro Gly Ser Thr Gly Trp Tyr Tyr
210 215 220
Leu Gln His Pro Asp Phe Thr Gly Thr Phe Gly Pro Thr Asp Arg Pro
225 230 235 240
Asn Arg His Thr Phe Tyr Val Arg Tyr Asp Pro Glu Arg Gly Glu Arg
245 250 255
Pro Glu Asp Tyr Thr Pro Gln Arg Cys Thr Glu Leu Ile Arg Leu Ala
260 265 270
Val Asp Ala Pro Gly Leu Val Pro Asp Ile Leu Asp Ile Gln Ala Trp
275 280 285
Asp Met Ala Ala Tyr Ile Ala Asp Arg Trp Arg Glu Gly Pro Val Leu
290 295 300
Leu Val Gly Asp Ala Ala Lys Val Thr Pro Pro Thr Gly Gly Met Gly
305 310 315 320
Gly Asn Thr Ala Ile Gly Asp Gly Phe Asp Val Ala Trp Lys Leu Ala
325 330 335
Ala Val Leu Arg Gly Glu Ala Gly Glu Arg Leu Leu Asp Ser Tyr Gly
340 345 350
Ala Glu Arg Ser Leu Val Ser Arg Leu Val Val Asp Glu Ser Leu Ala
355 360 365
Ile Tyr Ala Gln Arg Met Ala Pro His Leu Leu Gly Ser Val Pro Glu
370 375 380
Glu Arg Gly Thr Ala Gln Val Val Leu Gly Phe Arg Tyr Arg Ser Thr
385 390 395 400
Ala Val Ala Ala Glu Asp Asp Asp Pro Glu Pro Thr Glu Asp Pro Arg
405 410 415
Arg Pro Ser Gly Arg Pro Gly Phe Arg Ala Pro His Val Trp Ile Glu
420 425 430
Gln Asp Gly Thr Arg Arg Ser Thr Val Glu Leu Phe Gly Asp Cys Trp
435 440 445
Val Leu Leu Ala Ala Pro Glu Gly Gly Ala Trp Gly Gln Ala Ala Ala
450 455 460
Arg Ala Ala Ala Asp Leu Gly Val Arg Leu Asp Val His Leu Val Gly
465 470 475 480
Arg Asp Val Ala Ala Pro Ser Gly Glu Leu Thr Arg Thr Tyr Gly Ile
485 490 495
Gly Arg Ala Gly Ala Ser Leu Val Arg Pro Asp Gly Val Val Ala Trp
500 505 510
Arg Thr Ala Val Ala Pro Gly Ala Glu Ala Gln Asp Gln Leu Ser Thr
515 520 525
Leu Leu Thr Arg Leu Leu Ala Arg
530 535
<210> 3
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 3
aaacactacg tggctagcca aaaaacccct caagacc 37
<210> 4
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 4
aaagcatgca ctagttaata cgactcacta taggg 35
<210> 5
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 5
ctttaagaag gagatataca tatgataata aataacagaa atgaatc 47
<210> 6
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 6
cttgtcgacg gagctcgaat tcattaattt ttatcgttta aacttgatg 49
<210> 7
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 7
gaattcgagc tccgtcgaca aataaggaga tataccatgg acgatatttc tttatcatct 60
g 61
<210> 8
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 8
gtggtgctcg agtgcggccg caagcttatt actcatcttt gttccttata atc 53
<210> 9
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 9
ctttaagaag gagatataca tatgaaacta atctctatgt tgttac 46
<210> 10
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 10
cttgtcgacg gagctcgaat tcattattga ttcctcaatg taaatag 47
<210> 11
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 11
ctttaagaag gagatataca tatgcgtcat gtagagcata cagtc 45
<210> 12
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 12
cttgtcgacg gagctcgaat tcttattaat cctcttcctc ttgctcg 47
<210> 13
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 13
ctttaagaag gagatataca tatggccttg acgaagccgg atg 43
<210> 14
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 14
caagcttgtc gacggagctc gagttgtcgg agcggctggc c 41
<210> 15
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 15
ctttaagaag gagatataca tatg 24
<210> 16
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 16
caaaacagcc aagcttgcat gcaagcttgt cgacggagct c 41
<210> 17
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 17
catgcaagct tggctgtttt g 21
<210> 18
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 18
catatgtata tctccttctt aaag 24
<210> 19
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 19
gttaagtata agaaggagat atacatatgc gtcgactgcc tgatttag 48
<210> 20
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 20
gatatccaat tgagatctgc cttatgatta ccctttctgt accattgtga tc 52
<210> 21
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 21
caatttcaca caggaaacag aattcatggc tgccattaat acgaaag 47
<210> 22
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 22
ccgggtaccg agctcgaatt cattacttct taatgcccat ctc 43
<210> 23
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 23
gtaatgaatt cgagctcggt acccaatttc acacaggaaa cagaatggca atccacaatc 60
gtgc 64
<210> 24
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 24
ctctagagga tccccgggta ccattacgcg tttttcagaa cttc 44
<210> 25
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 25
ctagagtcga cctgcaggca tgccaatttc acacaggaaa cagaatggct attgaacgta 60
ctttttcc 68
<210> 26
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 26
caaaacagcc aagcttgcat gcattaacgg gtgcgcgggc ac 42
<210> 27
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 27
gtcgtaccga aggggtccac cggctggtac 30
<210> 28
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 28
ggtggacccc ttcggtacga cggcggtgag 30
<210> 29
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 29
gacgtatggc aatacatcaa tcacttagac 30
<210> 30
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 30
gattgatgta ttgccatacg tcaaacggtt 30
<210> 31
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 31
gtgcccgact tcctgcatcc gcgcacaccc 30
<210> 32
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 32
cggatgcagg aagtcgggca cttcatcata 30
<210> 33
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 33
ctttaataag gagatatacc atggccttga cgaagccgga tg 42
<210> 34
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 34
ccgagctcga attcggatcc caagcttgtc gacggagctc 40
<210> 35
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 35
gtataagaag gagatataca tatggcagat gtcctgcagg ag 42
<210> 36
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 36
gatatccaat tgagatctgc caattaggga atggggacgc tac 43
<210> 37
<211> 261
<212> DNA
<213> Unknown
<220>
<223> Streptomyces ravidus
<400> 37
atgtccagtt tcagtattga tgatctgaag cgtatcttgc gcgaaggggc aggggcaacg 60
gctgagttag acggtgacat tttagacgcc tcctttgatg atttggggta tgattctttg 120
gctcttcttg aaacgggttc gcgcatcgga cgtgaatacg gtttggaatt tgaggataca 180
gctttcgccg acgtggaaac acctcgtgac ttggtcggcg tagttaatgc tcagttatcg 240
gccccggctc cgcgtgggta a 261
<210> 38
<211> 1321
<212> DNA
<213> Unknown
<220>
<223> Streptomyces sp. R1128
<400> 38
atgcgtcatg tagagcatac agtcaccgtt gcggccccag cagacttggt ttgggaggta 60
cttgccgatg tcttaggcta tgctgacatc ttcccaccga cggaaaaagt tgaaattctt 120
gaggaggggc aaggatacca ggtagtgcgc cttcacgtcg atgttgcggg tgagattaat 180
acatggacca gtcgtcgcga tttagaccct gcgcgccgcg taattgctta ccgccaactt 240
gagacggctc cgatcgtggg ccacatgagc ggggaatggc gtgctttcac actggatgcc 300
gaacgtaccc aattagtcct gactcacgat ttcgtaaccc gtgcagccgg ggatgacggt 360
ttagtcgccg gaaaattgac cccagatgag gcgcgcgaaa tgttagaagc ggtggtagaa 420
cgtaactctg tcgccgactt aaacgcggtc cttggagaag ctgagcgtcg cgtccgcgca 480
gccggtggag ttggtaccgt aactgcgtaa taataatttt gtttaacttt aagaaggaga 540
tatatccatg tcagggcgca aaaccttttt agacttaagt tttgctaccc gcgacacacc 600
gtcggaggcg actccggtgg tggtagattt gctggaccac gtaactggag ccaccgtatt 660
aggattatca cctgaggatt tccccgatgg tatggctatt tccaatgaga ccgttacgtt 720
gacgacccac actggcacgc acatggatgc gccactgcac tatggtccct taagtggggg 780
agttccggca aagtcgattg accaagtgcc cttggaatgg tgctatggac ctggagttcg 840
tttggatgtt cgccacgtgc cggcaggaga tggtattact gtcgatcatt tgaacgccgc 900
gttggatgca gcagagcacg atttggcccc cggtgacatt gtgatgctgt ggaccggcgc 960
ggacgctctg tggggaaccc gcgaatactt gagcacgttt ccggggttaa ctgggaaggg 1020
gacacaattt ttggtcgagg cgggtgttaa agtcattggc attgatgcat ggggactgga 1080
tcgcccgatg gcagctatga tcgaagaata ccgtcgtacg ggcgataaag gagcattatg 1140
gccggctcac gtctatggac gcacacgcga atacctgcaa ttagagaagc ttaataattt 1200
gggcgcttta ccaggagcta cagggtatga catttcatgc tttccggttg cggttgcagg 1260
cactggagct gggtggactc gtgtggtcgc cgttttcgag caagaggaag aggattaata 1320
a 1321
<210> 39
<211> 1482
<212> DNA
<213> Arabidopsis thaliana
<400> 39
atgtcccatc gccgcaaccg tagccacaac aatcgtttac ccccgggacc taatccctgg 60
cccattatcg gaaacctgcc gcacatgggt acgaagcccc accgtacgtt gtcggctatg 120
gttacgacct atggcccaat tctgcacctg cgtctgggtt ttgtagacgt ggtcgtagcg 180
gcgtccaagt cggtcgccga gcagttcttg aagattcacg acgctaactt cgcttcacgt 240
ccccccaact caggagccaa acacatggcg tataattatc aagacttggt attcgccccc 300
tatggacatc gctggcgctt attgcgcaag atcagctcgg tgcatctgtt ctcggcaaaa 360
gcgttggagg actttaaaca cgtgcgtcag gaagaggtcg gaacactgac tcgcgaatta 420
gtacgtgtcg gcaccaaacc agtgaacctt gggcaactgg tgaatatgtg cgttgtcaac 480
gccttaggac gcgaaatgat cggacgccgc ttattcgggg ccgatgccga tcataaggcg 540
gatgagttcc gctcgatggt cacggagatg atggcgttag cgggggtctt taatatcggc 600
gactttgtac cgtcattaga ctggcttgat ctgcaagggg tcgctggaaa gatgaagcgt 660
ttacataagc gttttgatgc gttcttaagt tcgattttaa aagaacatga aatgaatggg 720
caagaccaaa agcataccga tatgttatcg accttaatca gccttaaggg tacagatctg 780
gatggggatg gcggctcctt aacggatact gaaattaagg cgcttttatt aaacatgttc 840
acagccggaa ccgacacatc agccagtaca gtagattggg caatcgctga attgatccgc 900
caccccgata tcatggtgaa ggctcaggaa gaattagata ttgttgtagg tcgcgaccgc 960
cctgtgaatg agtctgatat cgcccaactg ccgtacttac aggcggtaat taaggaaaat 1020
tttcgtctgc atccacctac tcccctgtct ttgccgcaca ttgcgagtga atcctgtgag 1080
attaacggtt accatattcc caaaggttca acattactta ccaacatctg ggctatcgcc 1140
cgtgatccgg accagtggag cgatccgtta gcttttaaac cagaacgttt tctgccagga 1200
ggagaaaaat ctggggttga tgtaaaaggt agtgatttcg agctgattcc gttcggtgca 1260
ggccgtcgca tttgtgcagg cctgtctctg ggtcttcgca cgatccagtt cttaacagcg 1320
actttagtac aagggtttga ttgggagtta gctgggggag tgacgcccga aaaactgaac 1380
atggaagaat cgtacgggtt aactttgcaa cgcgctgtcc ctctggtagt acacccgaaa 1440
cctcgtttgg ccccgaatgt gtacgggctg ggcagtggct aa 1482
<210> 40
<211> 2136
<212> DNA
<213> Arabidopsis thaliana
<400> 40
atgtcttctt cttcttcttc ttctacctct atgatcgacc tgatggctgc tatcatcaaa 60
ggtgaaccgg ttatcgtttc tgacccggct aacgcttctg cttacgaatc tgttgctgct 120
gaactgtctt ctatgttaat tgagaatcgt cagtttgcta tgatcgttac aacatccatc 180
gcggtcctta ttggttgtat cgttatgttg gtctggcgcc gctctggttc cggtaactct 240
aaacgtgtgg aaccgcttaa accgctggtg atcaaacctc gtgaggagga aatcgacgat 300
ggacgtaaaa aagtaacaat ctttttcgga acgcagactg gcactgcgga aggttttgcc 360
aaggcattag gtgaggaagc taaagctcgt tatgaaaaga cgcgcttcaa gattgttgat 420
ctggacgatt acgctgcaga cgatgatgaa tacgaggaaa aattaaaaaa agaggatgta 480
gctttcttct tcttagctac gtatggcgat ggtgaaccga cagataatgc cgctcgtttt 540
tataagtggt ttaccgaagg caatgatcgt ggtgagtggt tgaaaaactt aaaatatggg 600
gttttcgggc tgggcaatcg tcaatacgag cactttaaca aggtcgcgaa agtggtcgat 660
gacattctgg ttgagcaagg cgcacagcgt ctggtacaag tagggttagg ggatgatgac 720
cagtgtatcg aagatgattt cacagcttgg cgcgaagcat tgtggcccga gttggatacg 780
attctgcgcg aagagggcga tacggctgtt gccacaccct acacagccgc agtattagag 840
tatcgcgtaa gcatccatga tagcgaggat gccaaattca atgatattaa ccttgctaac 900
ggaaacgggt atacagtttt tgacgctcaa catccgtata aggccaacgt tgcggtcaaa 960
cgtgaattgc acaccccgga gtccgaccgt tcctgtatcc atctggaatt tgatattgcg 1020
ggatcaggtt taacatacga aactggagat cacgttggtg ttctgtgcga taacttatcc 1080
gagacggtgg atgaggcact gcgcctttta gacatgtccc ctgacacgta ttttagcttg 1140
catgctgaaa aagaggacgg tactccgatc agtagctcgc tgccaccgcc gtttccaccg 1200
tgcaatttac gcacggcttt aacacgttac gcgtgcctgt tgtcatctcc taagaaatcc 1260
gccttagtgg ctttggctgc acacgctagt gatcccactg aggccgagcg cttgaaacac 1320
ttagcaagcc ctgcaggtaa agacgagtac tccaagtggg tagtagagtc acagcgtagt 1380
ttattggagg tgatggccga gtttcctagt gcgaagccac cgttgggagt tttctttgcc 1440
ggggtggctc cgcgtttgca accacgtttt tatagcatca gtagttctcc aaaaatcgcc 1500
gagactcgca ttcacgttac atgtgccctg gtctacgaaa aaatgccgac tgggcgcatc 1560
cacaagggtg tatgctcgac ttggatgaag aacgccgtac cctacgaaaa gtctgaaaac 1620
tgcagctcgg cgccaatctt cgtacgccag tccaatttca agttgccgtc agattcaaag 1680
gtaccgatca ttatgatcgg tccaggaacg gggttagctc cgttccgtgg gttcttacag 1740
gaacgcttag cactggtcga gtcgggggta gaattgggcc cctccgtctt gtttttcggg 1800
tgtcgtaacc gtcgcatgga cttcatctat gaagaagagc tgcaacgttt cgtggaaagt 1860
ggggcgcttg ctgaactgtc ggtggcgttt tcccgcgaag gacccacgaa agaatatgtt 1920
caacacaaaa tgatggacaa agcgtcggat atctggaaca tgatttcaca gggcgcttat 1980
ttatatgtat gtggcgatgc gaaaggcatg gcgcgtgacg tccaccgttc tctgcacacc 2040
attgcgcaag agcaaggtag catggattca acgaaagcag aaggcttcgt gaagaattta 2100
caaacctctg ggcgctatct tcgtgatgtg tggtaa 2136
<210> 41
<211> 1098
<212> DNA
<213> Unknown
<220>
<223> Streptomyces fradiae Tu2717
<400> 41
atgtttgccc tggctccgct ggccacagca gctcgtaatg caggtcatca ggtagtaatg 60
gcagcaaacc aggacatggg acctgtcgta accggggttg gccttccagc cgtagcaacc 120
actgatcttc cgatccgtca tttcatcact accgatcgtg aaggacgtcc cgaggccatt 180
ccttctgacc cggtcgcgca ggcccgtttc actggtcgct ggttcgcccg tatggctgcc 240
agttccttgc cccgtatgct tgatttttca cgtgcatggc gcccagactt aatcgtcggt 300
ggtactatga gctatgtcgc tccgctgtta gctcttcacc tgggagtccc gcacgcccgt 360
cagacttggg atgcggtaga cgctgatgga atccacccag gtgctgatgc tgagcttcgc 420
ccagagttaa gcgaattggg attggagcgc cttcccgcac ccgatttgtt catcgacatt 480
tgcccgccct cgttacgtcc tgccaacgca gcaccagctc gcatgatgcg ccacgtagcc 540
acgagccgcc aatgcccgtt agagccgtgg atgtatacac gtgacactcg ccagcgtgtt 600
ttagtgacgt cgggatcgcg tgttgcaaaa gaatcttacg atcgtaattt cgatttttta 660
cgtggattag cgaaggattt ggtgcgctgg gatgttgaat taattgtggc tgctcctgac 720
accgtggctg aggctcttcg tgccgaggtg ccacaagctc gcgtagggtg gaccccttta 780
gacgtcgtgg cccctacatg cgatttattg gtgcatcacg ccggcggagt ctctacgctg 840
actggtttat cggctggcga gccccaatta ttaatcccaa agggcagtgt attggaagct 900
cctgcgcgcc gcgtagcaga ttacggcgcg gcgattgcac tgttgcctgg tgaggactcg 960
acggaagcta tcgccgatag ttgtcaggag ttgcacgcca aggacactta tgcccgccgc 1020
gctcaagact taagccgcga aatttcaggg atgcctctgc cggccacagt ggtgactgca 1080
ctggaacagt tagcctaa 1098
<210> 42
<211> 1548
<212> DNA
<213> Unknown
<220>
<223> Dactylopius coccus
<400> 42
atggagttcc gcttattgat tctggcactg tttagtgtct taatgagtac gtcaaatggt 60
gccgagattc ttgccctgtt tccaattcac ggaatttcca actacaacgt agcagaggca 120
cttcttaaaa cgcttgccaa ccgtggacat aacgtcactg tggtcacgtc attcccccag 180
aagaaacccg tgccaaactt gtatgaaatc gacgtatctg gggccaaagg tcttgctacc 240
aactcaattc actttgagcg tcttcagact atcattcaag acgtgaagtc caacttcaag 300
aatatggtgc gtctttcacg cacttactgc gagattatgt tctccgatcc tcgcgtactt 360
aacatccgcg acaaaaagtt tgatttggta atcaacgcgg tgttcggatc ggattgtgac 420
gctggctttg cgtggaaaag ccaagcaccc ctgatctcaa ttttaaatgc acgccacacc 480
ccgtgggcgc ttcaccgtat gggaaaccct tctaaccctg cgtacatgcc agtaatccac 540
tcacgcttcc cagtaaaaat gaatttcttc cagcgtatga tcaatacagg ctggcattta 600
tactttttgt atatgtactt ttattatggc aacggagaag acgcaaataa aatggcgcgt 660
aagtttttcg gtaacgacat gcccgacatt aacgaaatgg tctttaacac atcgttgctt 720
tttgttaata ctcactttag tgttgatatg ccctaccctc ttgttcctaa ctgcattgaa 780
attggtggga ttcacgtcaa agagccccaa ccgcttcccc tggagattca aaaattcatg 840
gatgaagcag agcatggtgt aatctttttc actttgggct cgatggtccg cactagcacc 900
tttcccaatc agactatcca agcgtttaaa gaggcgttcg cagaacttcc acagcgtgtt 960
ctttggaagt ttgaaaacga gaatgaagac atgccttcta acgttttaat ccgcaaatgg 1020
tttccacaga acgatatctt tggacataag aacattaagg cgtttatctc gcatggcggt 1080
aactcagggg cccttgaagc cgtgcatttc ggcgtgccca tcatcggcat tcctctgttc 1140
tatgatcagt atcgtaatat cttgagcttc gtgaaagaag gggttgcggt actgctggac 1200
gttaatgatt tgacaaagga taacattctg tcgtctgttc gtacagtagt gaacgataaa 1260
tcttacagcg aacgcatgaa agctctgtcc cagctgtttc gcgatcgtcc aatgagtccc 1320
ctggacacgg ctgtctattg gacggaatat gtaatccgtc accgcggagc acatcatctg 1380
aagactgctg gcgctttttt gcactggtat cagtatttgt tgctggatgt gattactttc 1440
cttttggtaa cattctgtgc cttttgcttc attgtcaagt acatctgtaa ggcgctgatt 1500
caccattatt ggtcgagttc caagagtgaa aaattaaaga aaaactaa 1548
<210> 43
<211> 1428
<212> DNA
<213> Zea mays
<400> 43
atggctgcta atggggggga tcatacctcc gcgcgcccac atgtggtgtt gcttccatcc 60
gctggcatgg gacatcttgt ccctttcgcc cgcttagctg tggctttatc tgagggacac 120
ggctgcaacg taagtgtagc tgcagttcaa ccaacggttt cctctgcgga gtcgcgtctg 180
ttagacgcac ttttcgtcgc cgccgcccca gccgtccgcc gtcttgattt ccgcctggcc 240
cccttcgatg aatccgagtt ccccggtgca gacccttttt tcttacgctt cgaggcgaca 300
cgtcgctcgg caccgcttct ggggccgtta ttagatgcgg cggaagcctc cgcacttgtg 360
actgatattg tccttgcttc ggtagcgttg ccagtggcgc gcgagcgtgg agttccctgc 420
tatgtgcttt ttacgtcatc ggccgcaatg ctgtcgttgt gtgcgtattt tccagcttat 480
ttagatgcac atgcagcggc cggctcggtc ggggtcggag tagggaacgt cgacattcca 540
ggggtatttc gcatccctaa gtcgagcgtc ccgcaagcac ttcacgatcc agatcattta 600
tttacccagc agtttgtcgc aaatggccgt tgtttagttg cctgcgacgg cattcttgtt 660
aacaccttcg acgccttcga gcccgatgca gtaaccgcac tgcgccaagg gtcgatcaca 720
gtctctggcg gttttccacc agttttcacc gtgggcccaa tgcttcccgt tcgcttccag 780
gcagaggaga cggctgacta catgcgttgg ttgtctgcac aaccaccccg cagtgtcgtc 840
tatgtctcgt ttggaagtcg caaggcgatt cctcgcgacc agttacgtga attggccgca 900
gggttagagg ctagtggcaa gcgttttctg tgggtagtaa agtcgaccat cgtcgaccgc 960
gatgataccg ccgatctggg cggcttgttg ggggacggct ttcttgagcg cgtccaaggt 1020
cgtgcatttg tgactatggg atgggtggaa caggaagaga ttttgcaaca tggctcggtt 1080
ggcttgttta tctcgcattg tgggtggaat agccttaccg aagccgccgc gttcggggta 1140
ccagttcttg cctggcctcg tttcggagat cagcgtgtga acgccgcctt agttgcgcgc 1200
tctggattgg gagcgtggga agaagggtgg acttgggatg gtgaggaggg acttactaca 1260
cgcaaggaag tggcgaaaaa gatcaagggc atgatggggt acgatgctgt agccgaaaag 1320
gcggccaaag ttggtgacgc agctgcggca gcaattgcaa aatgtggcac gagttatcaa 1380
tctttggaag agtttgtaca acgttgccgc gacgccgagc gtaagtaa 1428
<210> 44
<211> 1416
<212> DNA
<213> Oryza sativa
<400> 44
atgccttcct caggagacgc tgccggtcgt cgccctcacg tcgtgctgat cccttcagcc 60
ggaatggggc acctggtccc gtttggtcgt ctggctgtcg cactttcctc tgggcacgga 120
tgtgatgtgt ctttagtaac agttcttcct actgtgagta cagcggagtc aaagcatctt 180
gatgcacttt ttgacgcatt ccccgcagtt cgccgtcttg acttcgagtt ggcgccattt 240
gacgcatcag agtttcccgg tgctgaccct ttcttccttc gttttgaggc gatgcgccgt 300
tcggctccat tgcttggccc tttgctgacg ggcgcgggcg ctagcgcact ggcgacggac 360
attgctttaa cgtctgtcgt aattccagta gcaaaagagc aagggcttcc gtgtcacatt 420
ttattcactg cgtcggccgc aatgttatca ttgtgtgcct acttcccaac ttatttggat 480
gccaacgctg gcggaggggg cggtgtgggc gacgtggata ttcctggagt gtatcgcatt 540
ccgaaggcat caattccaca agccttacat gatcccaacc acttgtttac tcgtcagttt 600
gtggcgaatg gtcgtagtct tacctcggcg gccggtattc tggtgaacac tttcgatgcg 660
ttagagccgg aggcagtagc tgcattgcag caaggaaagg tagcctccgg ctttccacca 720
gtattcgcgg tggggccgtt gctgcctgcc tctaaccagg ccaaggatcc gcaggcaaat 780
tacatggagt ggctggacgc ccagcccgcc cgcagcgtag tttatgtaag tttcgggagt 840
cgcaaggcga tttcacgtga acaacttcgc gagctggctg ctggcttaga ggggagcggc 900
caccgttttc tgtgggtcgt gaaatccacc gtcgtggatc gtgacgacgc ggccgagctg 960
ggagagctgt tggacgaggg ttttttagag cgtgtcgaga agcgtggatt ggtgacaaag 1020
gcatgggtcg accaggagga ggtactgaaa catgaaagcg tagccctgtt tgtctcacat 1080
tgcggctgga acagcgtgac tgaggcggcg gcgagcggtg tgcctgtcct ggccttaccc 1140
cgcttcgggg accaacgtgt taattcagga gtggtggcac gtgcaggatt aggagtatgg 1200
gcggatactt ggtcgtggga gggcgaagca ggcgtgattg gtgcggagga aatctcagag 1260
aaggtcaaag cagctatggc cgacgaagct ttacgtatga aagctgcatc ccttgcagag 1320
gcagccgcca aggcagtggc tggcggtggg agtagtcatc gctgtttagc ggaatttgcc 1380
cgtctgtgtc aaggtggaac ttgccgtact aattaa 1416
<210> 45
<211> 1443
<212> DNA
<213> Glycine max
<400> 45
atgagttcta gtgaaggagt ggtacatgta gcttttcttc caagtgcagg aatgggccac 60
ttgaaccctt tccttcgctt ggcggcgacc ttcattcgtt atggttgtaa agtaacgtta 120
atcaccccga agcctactgt atccctggca gaatcgaatt taatttcacg cttttgttcc 180
agctttccac atcaggttac gcaactggac ctgaatttag tcagcgttga tccaacgacc 240
gttgacacaa tcgacccatt cttcttacaa tttgaaacca tccgccgtag tctgcatctt 300
ttacctccca ttttaagtct tcttagcact cctttgtctg ccttcattta tgacattact 360
cttatcacgc ctttgctttc tgtaatcgag aagctgtcgt gccccagcta cttgtatttt 420
acatcttcag cacgtatgtt ctctttcttc gcacgtgtct ccgtgttgtc cgcatctaat 480
cccgggcaga ctccctcgtc atttatcggt gacgatggag ttaagatccc tgggttcaca 540
agccccatcc cacgcagcag tgttccgcct gcgattcttc aagcgtcctc aaatcttttt 600
cagcgcatta tgttagaaga cagcgcgaac gttaccaagc ttaataatgg ggtcttcatc 660
aatagctttg aagaactgga gggcgaagct ttagccgctt taaacggggg gaaagttctt 720
gaaggtctgc cgcccgtgta cggggtgggc ccccttatgg cgtgtgaata tgagaaaggc 780
gacgaggagg gtcaaaaggg ctgcatgtct tcgatcgtga agtggctgga tgaacagtcg 840
aagggaagcg tggtatacgt gtccttgggc aatcgtacgg aaacgcgccg tgagcagatt 900
aaggatatgg cccttggttt gatcgagtgt ggctatggat tcttgtgggt cgtcaaactg 960
aagcgcgtcg ataaagaaga tgaggaaggc ttagaagagg tgttaggtag cgagctgagt 1020
tccaaggtta aggagaaggg tgttgtagtt aaggaatttg ttgaccaagt cgaaattttg 1080
ggccacccaa gtgttggggg atttttgtcg cacgggggtt ggaacagcgt aactgaaact 1140
gtatggaagg gagtgccttg tctgtcatgg ccacagcata gtgatcagaa gatgtctgcg 1200
gaggtaatcc gtatgtccgg aatgggtatc tggcccgagg agtggggctg ggggacgcaa 1260
gatgttgtga agggagacga aatcgccaaa cgcattaagg aaatgatgtc gaacgaatcg 1320
ttgcgcgtaa aggcgggaga attgaaggaa gcggcgttaa aggcggcagg ggtagggggg 1380
agttgtgaag tgactattaa acgtcagatc gaagagtgga aacgcaatgc ccaggctaat 1440
taa 1443
<210> 46
<211> 1434
<212> DNA
<213> Gentiana triflora
<400> 46
atggggagtt tgactaacaa cgataatctt catatttttc ttgtgtgctt catcggccag 60
ggcgtggtca atcccatgtt acgtttgggg aaggcgttcg cctccaaagg gttacttgtc 120
actttaagcg caccggaaat cgttggaact gagatccgta aggcgaataa ccttaatgat 180
gaccaaccaa tcaaggtggg ttccgggatg attcgtttcg aatttttcga cgatggatgg 240
gaatccgtaa acggtagcaa accgtttgac gtatgggtct acatcaatca cttagaccag 300
acaggccgtc aaaaacttcc gattatgtta aagaaacatg aggagacagg gactcctgta 360
tcttgcttga tcctgaatcc cttagtccct tgggtcgcgg acgtagccga ttcacttcag 420
atcccctgcg ctaccttgtg ggtccaatct tgtgcaagtt tttcagcata ttaccactac 480
caccacgggt tagtgccttt cccaaccgaa tcagagcccg agatcgacgt acaacttcct 540
gggatgccac ttttgaaata tgatgaagtg cccgactacc tgcatccgcg cacaccctac 600
cccttttttg gcacgaacat tttaggtcaa ttcaagaatt tatccaagaa cttctgtatc 660
ctgatggata ccttctacga gttggaacac gagatcatcg ataatatgtg taaattgtgt 720
ccgattaagc caattggccc gttgtttaag attccgaaag acccaagctc caacggaatc 780
acgggtaatt tcatgaaagt ggatgactgc aaggagtggc tggacagccg tccaacatca 840
actgtggttt acgttagtgt cgggtctgtt gtatatttga agcaggagca ggttacagaa 900
atggcatacg gcattttaaa ttcggaagtt tcgtttttgt gggtgctgcg cccgccgagc 960
aaacgcatcg gtacggaacc gcatgtactg cccgaggagt tctgggagaa ggccggagat 1020
cgtggcaagg tggtgcaatg gtcaccccag gagcaggtgc ttgctcaccc cgccactgtc 1080
ggttttttaa cacactgtgg atggaatagc actcaagagg cgatttcgag cggagtgccc 1140
gtcatcactt tcccacaatt tggggaccaa gtgaccaatg ctaagttcct tgtggaggaa 1200
tttaaggtcg gggtccgttt aggccgcgga gagttagaaa atcgcatcat cacacgcgac 1260
gaagtagaac gcgctttacg cgagattact tcaggcccca aggctgaaga ggtaaaagag 1320
aacgccttaa aatggaagaa gaaggcagaa gagacagtag ctaaaggcgg ctactccgaa 1380
cgtaatcttg taggcttcat tgaagaggtg gctcgtaaga ctggtacaaa gtaa 1434
<210> 47
<211> 2112
<212> DNA
<213> Aloe vera
<400> 47
atggaggaaa tttccagtaa agtggagttc ttatccctta agcccagcat gtcaggaagt 60
ccccgttaca gccccacatt tcgtaaaatc ggaagcggtc gcaattcccg ccgcgactcc 120
cgtgctcatg cagggaattt cccctggatt cgcaacaatc gtgttttttt ttggctgctt 180
ttaatcacca tctgggcgta catcggcttt cacgtccaat ctcaatgggc acatggcgac 240
cataaagctg agttcgttgg atacaagtcg gaggtaggga agatgggtga ggacgtcaag 300
tcggtaaata gtacgactac gttctccatt gtacacaagg gcaatttaac tgttgaagga 360
aagaaagacc ccgattccaa ttttggtatt tcactgttga aaaagggtaa acaggttctt 420
tcccgtttaa attcacgcaa aaagggccat cgttcgcgca aggtgtcgga aaaactggaa 480
gaagaaacgg acgacaatgg gacgggagaa atggatgagg tccttatcca gcgcaaaaac 540
acatcttatg gcttaattgt agggcctttt gccaaactgg aagagagtgt gcttgagtgg 600
agcccaggca agcgccgtgg tgtctgctat cgtaagggag aatttgcccg cgcggtgtct 660
tctcagcgct ttatgttgat cttccacgaa ttgtcaatga ctggcgcccc attgtccatg 720
ttggaattgg ccacggagat cctgtcttgc ggtgggtctg tgagcgctat tgtattatct 780
aagaagggag ggttaatgcc ggaactgaag aagcgtggta ttaaggtttt gcaagaccgt 840
gacaaggtga gtttcaaggt cgccacgaaa gtagacctga ttattgcggg atctgctgta 900
tgtagtagct ggatcgagcc atatctggag tatttccccg ctgggtccgg acatattgtc 960
tggtggatca tggaaaaccg tcgcgaatac ttcgaccgta gcaagcatct tttaaaccgt 1020
gtgaaaattt tggcatttct tagcgatagc cagtcaaagc agtggctttc ttggtgtgag 1080
gaagagaaga ttaaattcct gatccagcca atgttagtgc cgttgtcagt taacgatgag 1140
ctggccttcg ttgccggtat tccttgtagc ttgaatactc cagcattatc agtggagaaa 1200
atgatcgaaa agcgtgattt attacgtcac gcagtccgta aggaaatggg gttgggggac 1260
aatgacatgc ttgtgatgag tttaagtagc atcaacccag ccaagggtca gcgctttctg 1320
cttgaggcag ccttactggt agctgaacac aatgtatcat tgaaagatgc taacagttac 1380
agtcttatgg aggaggagaa gttatccggg aacgcacctc aaaatcaaac catcatgatc 1440
ggtcaactga atcctggcca cgtacttcag atcgccaatg acactaataa gcccgtcaat 1500
gcgttacaga agattggcgc cacacgtgtc tcgtcgaagc gtcgcggcaa gctgcatacg 1560
aatacagtca cgggcgtgct tcagaaaagc cgcaaacttt tgtccgaggc agcaggtatg 1620
aaggaggaaa ccctgaaagt ccttgtaggt tccgtcggat cgaaatcgaa taaggttctg 1680
tatgtaaagg caatcatgga atacatcagc caacattcta atttgtctaa ggtcgttctt 1740
tggaccccag ccaccacgtc tatcgcagca ctgtacgccg ccgcggacgt gtacgtcatt 1800
aacgctcagg gacatggaga gacattcggt cgcgtgacga tcgaggcgat ggcctttggc 1860
ctgccagtgc tggggactga cgccggaggg actaaagaaa tcatcgacca ccgtgttacg 1920
ggacttctgc atcctgtggg tcccgagggc actgtactgt tagcgcaaca cattcaatat 1980
cttttaaaaa atcccagcgt gcgcaagaaa atgggtatca atggtcgccg caaagtacaa 2040
gataaatact taaaacacca gacttacgag tcccttggca aagtcatgtt caaatcgatg 2100
cgtccccgtt aa 2112
<210> 48
<211> 1611
<212> DNA
<213> Unknown
<220>
<223> Streptomyces peucetius ATCC 29050
<400> 48
gtggccttga cgaagccgga tgtcgatgtc ctcgtggtgg gcggcggtct cggggggctg 60
tccaccgccc tgttcctcgc ccgccggggg gcgcgggtcc tgctggtgga gcggcatgcc 120
agcacctcgg tcctgcccaa ggcggcaggc cagaacccgc gcaccatgga actgttccgc 180
ttcggcggcg tggccgacga gatcctggcc acggacgaca tccgcggcgc ccagggcgac 240
ttcaccatca aggtcgtgga gcgcgtgggc ggtcgcgtcc tgcacagctt cgcggagagc 300
ttcgaggaac tggtcggtgc gacggaacag tgcacgccca tgccctgggc gctcgctccc 360
caggaccggg tggagcccgt cctggtggcc cacgccgcca agcacggcgc ggagatccgg 420
ttcgccaccg aactgacctc cttccaggcg ggcgacgacg gtgtcacggc ccgcctgcgc 480
gacctgggca cgggagcgga gagcaccgtg agcgcccgct acctggtcgc cgccgacgga 540
ccccgcagcg cgatccggga gagcctgggc atcacccggc acggtcacgg caccctggcc 600
cacttcatgg gcgtcatctt cgaggccgac ctcaccgccg tcgtaccgcc cgggtccacc 660
ggctggtact acctgcagca cccggacttc accggcacgt tcggccccac cgaccggccc 720
aaccggcaca ccttctacgt ccgctacgac cccgaacgcg gcgagaggcc ggaggactac 780
acaccgcagc gctgcaccga gctgatccgg ctggctgtcg acgcgcccgg gctcgtcccg 840
gacatcctcg acatccaggc ctgggacatg gcggcgtaca tcgccgaccg gtggcgcgaa 900
gggccggtgc tgctggtcgg cgatgccgcc aaggtcaccc cgcccaccgg gggcatgggc 960
ggcaacaccg ccatcggcga cgggttcgac gtggcctgga agctggccgc cgtgctgcgc 1020
ggcgaggcgg gcgagcggct cctcgacagc tacggggcgg agcggtcgct cgtgtcccgc 1080
ctcgtcgtcg acgagtcact cgccatctac gcccagcgca tggctcccca cctgctcggc 1140
agcgttcccg aggaacgcgg tacggcgcag gtcgtcctgg gcttccgcta ccgctccacc 1200
gccgtcgccg ccgaggacga cgaccccgag ccgaccgagg atccgcgacg cccgtccggg 1260
cgccccggct tccgcgcacc ccacgtctgg atcgaacagg acggcacacg gcgttccacc 1320
gtcgagttgt tcggcgactg ctgggtgctc ctggccgcac cggagggcgg cgcctggggc 1380
caggcggccg cccgcgccgc cgcggatctg ggcgtccgcc tcgacgtcca tctcgtcggc 1440
cgcgatgtcg ccgccccctc cggcgaactg acgcggacct acgggatcgg ccgggcgggg 1500
gccagcttgg tgcgcccgga cggcgtggtc gcctggcgta cggcagtagc gccgggagcg 1560
gaggcccagg accagctgag caccctgctc acccggctgc tggcccgctg a 1611
<210> 49
<211> 2678
<212> DNA
<213> Photorhabdus luminescens
<400> 49
atgataataa ataacagaaa tgaatctcaa ccacgtagag ttgtggtgac agggctaggt 60
gttgtcgcac cgacaggtgt tggcgttaat gaattttgga acaatattca taacggcaaa 120
tcgggggtaa gtgaatatga gtggggaaga aaaaaatttg gttttaaaag cggagcaata 180
ggaaaagttc acggtaacga tagcgatagc aaagagtttg tgctgaaaag tgagcgtaaa 240
tatcttgagt ttgcgctaga agcctctgag atggcaatgc aagatgcaaa tttaaaacct 300
tcagacattg atggccggcg ttttggcgtt gcgatagcaa cagcgattgc cgatgctgcg 360
ggaatggaag agtgtttgct caggatcacc aaagggggca aagagaatat tcatcctgat 420
ttaattaaat cagaggatta tgacagcttt gatttcagct ctgccgccac ctctgttgcg 480
aaaaaatatg gcgcatcgat gtccgtcagt aacatatcaa ctgggtgtgc ggcaggactt 540
gatgcattag gcattgcgat ggagcatatc cgttatggca gagcggatgt gatgctggct 600
ggcgccagtg aagcgccgct ttgtccactt tctatcggct cttttgaagc tttaggggcg 660
ctatcatcaa gagaattgga aaatcagcaa gcagcgactt gtcctttttc ccttgagcgg 720
gatggatttg tgattgctga agggtgtgga atattaattt tagagtctta tgaacatgct 780
aagcagcgtg gagcacatat ctatgctgaa ttagcagggt atgcgtccgt gaataacgct 840
tatcatatga ccgacttgcc tgcggatgga atggcaatgg cgcggtgcat tgatatggcg 900
ttgaaggatg cccagatatc gccatcagcg gtcaattata ttagtgctca tggcagttct 960
acggctcaaa atgatattaa cgaatcaaat gcgattaaat ttgttttggg agaaaatgca 1020
tttgatattc caattaactc attaaagtca atgacaggtc atgctttagc tgccgctaat 1080
gcgatcgagt ctgtagcgtt atgtctggaa atagaaaagc aatatattca tccaacaatt 1140
aattatcaaa cgccggaccc tgattgcgat ttagattata ttcctaatca aggttgcgca 1200
tatccaatta agaccgcatt aaaattatcg agtggttttt ctggtattca cagtgttatt 1260
gttatgaggg cagtagacaa tgcgtaaaag agttgttgtt accggcgttg gcgcagtaca 1320
tcctgatggc aatgatgtca ccgctataaa aacaaaagtg attcagaaat tattgggtca 1380
ggaatcgata aataatacca acaaaagttc tgtaataagg acattgaatg atttcgatgg 1440
ggcaaaatat atcaataacc gcttaagacg taaaattgat gaattttcag tttatggtat 1500
cgtcgccgtt gaaatggcat taaaagcgag cagattggat gtagataagc ttgatcctaa 1560
tcgtgttggc atatatgttg gaaactgttt tggcggatgg cagcatattg aggatgaagt 1620
taaagcgctc catgttgaag gcatatcggg gatgggacct tatgttgcta cggcatggtt 1680
ccctgctgcg cttcaagggc aattgtcact gctttatggt tttagtgcgc aatctaagac 1740
attttccacc tccgatgtag cagggatgca agcaataggc tatgcggctg aagcgatttc 1800
taatggtgtt gccgaagtga tgttatgtgg cgcgtcagaa catctttcca gcccgttagt 1860
taaaagttta ctggagaaag agtcaagcca gaaacactct gaggtttttg gcgaaagaca 1920
gccaggggac ttttccgaag gcgctgcatt tctagtgctg gaagagaggc aacatgcttt 1980
agaacgcggc gcttcgatat tgtgtgaatt aacgggtttt gttgattatt tttcaccgga 2040
taaaaataca agaaataaca ccttagaata tactgctgaa ctattcaacc ataatgagaa 2100
tgctgtattt attatggatg gaatatatga tgatgaaaaa gaaataacga gtaaggcttt 2160
ctccaataaa gagataaaaa catcatttat aaatctgagg ccttacttga ataatcaatt 2220
ttcagtcagc ggcgtaattg attcagtcct ggcatcatca tttttatcag aaaataacgg 2280
ggatggagaa caacaatcta ataaaataaa tgaactttca aatactaacc aaataataat 2340
tcagcgcttt agtaaccagg gtcatgtatg tgcgttgagt ttttcagcaa tttaatctct 2400
aaaatattta attacgcgag gaaaaatata tgaataataa cccagaagta aaaataaaaa 2460
cgattttgtc tctttttctt aacgttaata ttgatgattt caatatggat gcaaaccttg 2520
ctgatgccta tgatatggat tctacggaat tggctgactt ggcaaaagag attacgaaag 2580
agttcggtat ttccgtgacg aaaagtcagt tcagtcattg ggaaacagga agagccgttc 2640
ttgatttcgt ctcatcaagt ttaaacgata aaaattaa 2678
<210> 50
<211> 714
<212> DNA
<213> Photorhabdus luminescens
<400> 50
atggacgata tttctttatc atctgatttt tttgatcttt ggattatcaa aatcgacgat 60
attgatttag cttctattga acagttaatt cactgttctg atatagttcg ccataaccaa 120
atttgtttag cggatagaag aaagagattt atatttagac gggctgcatt acgttatgtt 180
ttgagtcaat atttatctga ttatgaaatc ataacgaatg ataacggaaa accttatata 240
tccacggagc aagacttcaa atattatttt tcactgagtg cttcaggaaa ctattgtgcc 300
attggtttta gctcaaggga aataggtgtt gatattgaag tcactccttc taaggtaaaa 360
ttttcagaaa ttattgaacg ttttattaag gataaagatt tggaatatat gaaaggtata 420
atgttaaaac aactatcagg agttagtctc ggatttaata actattatca tttaatgtca 480
ttatattatt gggttagact tgaagcatat attaaattat ttgcttcgac tttacatgag 540
aaattattgg ttaataactc tgattctgtt aaagatatga aagaattgga ggcaagcaca 600
ttattgattc atagtcagca atttgtttgt gccttatctc aaaagaaagt catttctaca 660
ccaaatatca aggaaataaa ttattccgaa attataagga acaaagatga gtaa 714
<210> 51
<211> 1548
<212> DNA
<213> Photorhabdus luminescens
<400> 51
atgaaactaa tctctatgtt gttacattca gagcatgata acttacatca tgattgtatt 60
gtcactaagg attatcatta tacaagaaaa gaggtgatat cttctgtttc ccatttaatt 120
gatgatttat tgagtcgagg agtgcaaaaa ggtaataaag tcattgttat atttgaacat 180
gatgaattag gtgttttctt tttggctgcc gccagtgcta tggggttgca tttattaatg 240
ccctataatt tatcatcagc gacaatcgat gaatggatta attttaccaa tgaagtgcaa 300
tacgattttg ttgtttatct caaaaaagat aaacattttg ttggaaaatt aaaagaaaac 360
aacattaatg ttattgatat ttcagatcat aagatcagag ttagtgatga tattgcggaa 420
atcccaatga taacttattc tccgcaacct attgctaact ttattgtcct gttcaccagt 480
gggagtacag gcaaaccaaa agccattagt atttcagaat cgttagtatg tcgtcgaatt 540
tattcggtga ccgagaaatt aaaatttacg caagatgcca aaatattcat gtcaggtttg 600
ttgaataata caactggagt gattttttct ttcggctcat tattgcatca atcaacactt 660
tttatacccg aagatagaaa tgtagagaga tggcctgatt atctttctcg caataaaatc 720
actcatatta tgttacgccc agaatcaatg aaattattcg ttaaatcgac agcagaactt 780
aatattgatc tctcttgttt acgggtggtt gcttatggcg ctgcggcgat gcctcctagc 840
gtacttgaga aagggcgaca attaattggc tgtgaatggg tgcagggata tgggttaagt 900
gaaacttatg gtcctttctg ttgggtggat gagcaagatc atcgtgataa aagatatctc 960
aattcaattt attgtgttgg taagattgat aatacattgg aagtggcagt taaacctatt 1020
ataggttcat cggataatat cggagaaatt atactaaggg gtaaaagtat tatggaagga 1080
tattatgatg tcctttctgg agaaataacg cctcctgatg aatggtttgc cactggtgat 1140
cttggttata tagatgaaga gggttattta gttttgaaag gacgtaagca aaatacgttt 1200
atgagtgcta acggacacag aatttatcct gaagaaattg aatctatttt atcccgaata 1260
cccaatgtga atgtcgctac ggttgttggt ttttctttcc atgaaaatgg tgttgctatt 1320
gatcagccgg ttgcttgcat gagtggagag atatctaaga agtcattacc tgaaattgaa 1380
gatattattt catcattttt aatgagtaaa ctcagtcgag aaaaatggcc ggattggttc 1440
tatgttactg atgaatgctt tccgaaaagc cataatgata agatattgaa atcagagtta 1500
attaaatcaa tcgatcctaa gaaattattt acattgagga atcaataa 1548
<210> 52
<211> 951
<212> DNA
<213> Streptomyces coelicolor
<400> 52
atgctcgtac tcgtcgctcc cggccagggc gcccagacgc ccggcttcct gactgactgg 60
ctcgccctcc ccggtgccgc tgaccgcgtc gccgcgtggt cggacgccat cggactcgat 120
ctcgcccact tcggcaccaa ggccgacgcg gacgagatcc gagacacgtc cgtggcccag 180
ccgctgctgg tcgccgccgg aatcctgtcc gccgcggcac tcggtacgca gacatctgtc 240
gctgacgcga cgggccccgg gttcaccccc ggcgcggtcg ccggacacag cgtcggcgag 300
atcaccgccg ccgtcttcgc gggcgtcctc gacgacaccg ccgcgctgtc cctcgtacgc 360
cgtcgcggcc tggccatggc cgaggccgcg gcggtcaccg agaccggcat gtcggcgctg 420
ctcgggggcg accccgaggt gagcgtcgcg cacctggagc ggctcggcct gaccccggcg 480
aacgtgaacg gcgccggtca gatcgtggcg gcgggcacca tggagcagct ggccgcgctg 540
aacgaggaca agcccgaggg tgtgcgcaag gtcgtcccgc tgaaggtggc cggcgcgttc 600
cacacccgcc acatggcccc cgccgtggac aagctcgccg aggccgccaa ggcgctgacg 660
ccggccgacc cgaaggtgac gtacgtctcc aacaaggacg ggcgggccgt cgcctccggc 720
accgaggtgc tggaccggct ggtcggccag gtcgccaacc cggtgcgctg ggacctgtgc 780
atggagacgt tcaaggagct gggcgtcacc gcgatcatcg aggtgtgtcc gggcggcacg 840
ctgaccgggc tggccaagcg ggcgctgccc ggagtgaaga cgctggccct gaagaccccc 900
gacgacctcg acgcggcccg tgagctcgtc gccgagcaca cccaggccta a 951
<210> 53
<211> 1146
<212> DNA
<213> Streptomyces coelicolor
<400> 53
atgagcgagg acacgatgac ccaggagcgg ccgtccctga cggcacacgc ccgccggatc 60
gccgaactcg ccgggaagcg ggcggccgac gccgaacagc agcgccggct gagccccgac 120
gtcgtcgacg cggtccttcg agccggtttc gccgcccact tcgtaccggt ggcgcacggc 180
ggccgggccg cgacgttcgg ggagctggtg gagcccgtcg cggtgctcgg cgaggcctgt 240
gcctcgaccg cctggtacgc ctcgctcacg gcgagcctcg gccggatggc cgcctacctg 300
ccggacgagg gccaggccga gctgtggtcc gacggccccg acgccctgat cgtcggtgcc 360
ctgatgccgc tgggccgggc cgagaagacc ccgggcggct ggcacgtgtc gggcacctgg 420
ccgttcgtca gcgtcgtgga tcactccgac tgggcgctga tctgcgccaa ggtcggcgag 480
gagccgtggt tcttcgcggt gccgcgacag gagtacggga tcgtcgacag ctggtacccg 540
atgggtatgc gcggaacggg cagcaacacg ctcgtcctcg acggggtgtt cgtgccggat 600
gcgcgggcct gcacccgtgc ggccatcgcg gcaggtctcg gtccggatgc cgaggcgatc 660
tgtcacaccg tgcccatgag ggcggtcaac gggctggcct tcgcactgcc gatgctcggc 720
gcggcccgcg gggccgcggc cgtgtggacc tcgtggaccg ccggaagact ggccgggccg 780
accgggcaga acgccgtctc gtcccaggac cgcgtggtgt acgagcacac gctggcccgg 840
gccacgggtg agatcgacgc ggcccagctg ctgttggagc gggtcgcggc ggtcgccgac 900
gccggctcgg cgaccggcgt actggtcggc cgcggggcgc gggactgcgc cctggcggcg 960
gagctgctga ccgccgcgac cgaccggctg ttcgcctcgg cgggcacccg ggcacaggcc 1020
caggacagcc cgatgcagcg cctgtggcgc gatgtgcacg cggcgggcag ccatatcggg 1080
ctgcagttcg ggcccggggc ggcgctgtac gccggagagc tgttgaggag gagcaacgat 1140
ggctga 1146
<210> 54
<211> 534
<212> DNA
<213> Streptomyces coelicolor
<400> 54
atggcagccg accagggaat gctccgggac gccatggccc gggtgccggc cggggtggcg 60
ctcgtcaccg cccatgaccg cgggggagtc ccgcacggtt tcaccgccag ttcgttcgtg 120
tccgtctcga tggagccgcc actggcactg gtctgcctgg ctcgtacggc caactccttc 180
ccggtgttcg acagttgcgg cgagttcgcg gtgagcgtgc tgcgcgagga ccacacggac 240
ctggccatgc gcttcgcgcg caagtccgcg gacaagttcg cgggcgggga gttcgtccgt 300
accgcgcggg gagcgaccgt gctcgacgga gcggtcgcgg tcgtcgagtg cacggtccac 360
gagcgctacc cggcgggcga ccacatcatc ctgctcggcg aggtccagtc cgtgcacgtc 420
gaggagaagg gcgtaccggc ggtctacgtg gaccgccggt tcgccgccct gtgctcggcg 480
gcgggtgcct gcccgtccgc caccgggcgg ggcgtgcccg cgcatgccgg ctaa 534
<210> 55
<211> 1194
<212> DNA
<213> Pseudomonas fluorescens
<400> 55
atgaaaacgc taaaaaccca agtcgccatt attggcgccg gtccctccgg attgctgctc 60
ggccagttac tgcacaacgc gggtatccag accctgattc tagagcgcca gagcgccgac 120
tacgtgcaag gccgcatccg tgccggggtg ctggagcaag gcatggtcga cctgctgcgc 180
gaagcgggcg tcagccgacg catggacgcc gagggccttg tgcatgacgg tttcgaattg 240
gcactcaatg gcgaactcac ccacatcgac ctcaaggcgc tcaccggcgg ccagtcggtg 300
atgatctacg gccagaccga agtcacccgt gacttgatgg ccgcccgcga agcggcgggt 360
ggcatcactc tatacgaaac gcagaacgtg cagcctcatg gtcacaaaac tgatcgaccc 420
tggctgacct tcgagcacca gggtgaagct tttcgcctgg agtgcgacta catcgcgggc 480
tgtgatggtt ttcacggtgt ggcgcggcag tcgattccgg cgcagtcgtt gaaggtcttc 540
gagcgcgtct atcccttcgg ttggctgggc gtcctcgccg acacaccgcc ggtgcatgac 600
gaactggtgt acgccaaaca tgcgcgtggc tttgccctgt gcagcatgcg ctcgccgacc 660
cgcagccgct attacctgca agtgccggtt gaagaagcgc tggatgaatg gtcggatcag 720
cgcttctggg atgagctgaa aacccgtttg cccagtgcac tggcggccca actggtcacc 780
gggccatcca tcgagaagag catcgcgccg ctgcgcagct ttgtggtcga gccgatgcaa 840
tacgggcgcc tgttcctgct gggggacgcc gcgcatatcg tgccgcccac cggggccaag 900
ggcttgaacc tggcggccag cgacgtgagt acgctgtttc ggatcttgct caaggtctat 960
cgcgaggggc gggtggacct gctggaacag tactcagcga tctgcttgcg ccgcgtatgg 1020
aaagccgaac ggttttcctg gtggatgact tcgatgttgc accagtttcc ggaggccgac 1080
gggttcagcc agcgcattgc cgagagcgag cttgcgtatt tcatcagctc cgaggcgggc 1140
cgcaaaacca tcgcagaaaa ttacgtcggg cttccttacg aagctatcga ataa 1194
<210> 56
<211> 1611
<212> DNA
<213> Artificial Sequence
<220>
<223> dnrF P217K from Streptomyces peucetius
<400> 56
gtggccttga cgaagccgga tgtcgatgtc ctcgtggtgg gcggcggtct cggggggctg 60
tccaccgccc tgttcctcgc ccgccggggg gcgcgggtcc tgctggtgga gcggcatgcc 120
agcacctcgg tcctgcccaa ggcggcaggc cagaacccgc gcaccatgga actgttccgc 180
ttcggcggcg tggccgacga gatcctggcc acggacgaca tccgcggcgc ccagggcgac 240
ttcaccatca aggtcgtgga gcgcgtgggc ggtcgcgtcc tgcacagctt cgcggagagc 300
ttcgaggaac tggtcggtgc gacggaacag tgcacgccca tgccctgggc gctcgctccc 360
caggaccggg tggagcccgt cctggtggcc cacgccgcca agcacggcgc ggagatccgg 420
ttcgccaccg aactgacctc cttccaggcg ggcgacgacg gtgtcacggc ccgcctgcgc 480
gacctgggca cgggagcgga gagcaccgtg agcgcccgct acctggtcgc cgccgacgga 540
ccccgcagcg cgatccggga gagcctgggc atcacccggc acggtcacgg caccctggcc 600
cacttcatgg gcgtcatctt cgaggccgac ctcaccgccg tcgtaccgaa ggggtccacc 660
ggctggtact acctgcagca cccggacttc accggcacgt tcggccccac cgaccggccc 720
aaccggcaca ccttctacgt ccgctacgac cccgaacgcg gcgagaggcc ggaggactac 780
acaccgcagc gctgcaccga gctgatccgg ctggctgtcg acgcgcccgg gctcgtcccg 840
gacatcctcg acatccaggc ctgggacatg gcggcgtaca tcgccgaccg gtggcgcgaa 900
gggccggtgc tgctggtcgg cgatgccgcc aaggtcaccc cgcccaccgg gggcatgggc 960
ggcaacaccg ccatcggcga cgggttcgac gtggcctgga agctggccgc cgtgctgcgc 1020
ggcgaggcgg gcgagcggct cctcgacagc tacggggcgg agcggtcgct cgtgtcccgc 1080
ctcgtcgtcg acgagtcact cgccatctac gcccagcgca tggctcccca cctgctcggc 1140
agcgttcccg aggaacgcgg tacggcgcag gtcgtcctgg gcttccgcta ccgctccacc 1200
gccgtcgccg ccgaggacga cgaccccgag ccgaccgagg atccgcgacg cccgtccggg 1260
cgccccggct tccgcgcacc ccacgtctgg atcgaacagg acggcacacg gcgttccacc 1320
gtcgagttgt tcggcgactg ctgggtgctc ctggccgcac cggagggcgg cgcctggggc 1380
caggcggccg cccgcgccgc cgcggatctg ggcgtccgcc tcgacgtcca tctcgtcggc 1440
cgcgatgtcg ccgccccctc cggcgaactg acgcggacct acgggatcgg ccgggcgggg 1500
gccagcttgg tgcgcccgga cggcgtggtc gcctggcgta cggcagtagc gccgggagcg 1560
gaggcccagg accagctgag caccctgctc acccggctgc tggcccgctg a 1611
<210> 57
<211> 1434
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F from Gentiana triflora
<400> 57
atggggagtt tgactaacaa cgataatctt catatttttc ttgtgtgctt catcggccag 60
ggcgtggtca atcccatgtt acgtttgggg aaggcgttcg cctccaaagg gttacttgtc 120
actttaagcg caccggaaat cgttggaact gagatccgta aggcgaataa ccttaatgat 180
gaccaaccaa tcaaggtggg ttccgggatg attcgtttcg aatttttcga cgatggatgg 240
gaatccgtaa acggtagcaa accgtttgac gtatggcaat acatcaatca cttagaccag 300
acaggccgtc aaaaacttcc gattatgtta aagaaacatg aggagacagg gactcctgta 360
tcttgcttga tcctgaatcc cttagtccct tgggtcgcgg acgtagccga ttcacttcag 420
atcccctgcg ctaccttgtg ggtccaatct tgtgcaagtt tttcagcata ttaccactac 480
caccacgggt tagtgccttt cccaaccgaa tcagagcccg agatcgacgt acaacttcct 540
gggatgccac ttttgaaata tgatgaagtg cccgacttcc tgcatccgcg cacaccctac 600
cccttttttg gcacgaacat tttaggtcaa ttcaagaatt tatccaagaa cttctgtatc 660
ctgatggata ccttctacga gttggaacac gagatcatcg ataatatgtg taaattgtgt 720
ccgattaagc caattggccc gttgtttaag attccgaaag acccaagctc caacggaatc 780
acgggtaatt tcatgaaagt ggatgactgc aaggagtggc tggacagccg tccaacatca 840
actgtggttt acgttagtgt cgggtctgtt gtatatttga agcaggagca ggttacagaa 900
atggcatacg gcattttaaa ttcggaagtt tcgtttttgt gggtgctgcg cccgccgagc 960
aaacgcatcg gtacggaacc gcatgtactg cccgaggagt tctgggagaa ggccggagat 1020
cgtggcaagg tggtgcaatg gtcaccccag gagcaggtgc ttgctcaccc cgccactgtc 1080
ggttttttaa cacactgtgg atggaatagc actcaagagg cgatttcgag cggagtgccc 1140
gtcatcactt tcccacaatt tggggaccaa gtgaccaatg ctaagttcct tgtggaggaa 1200
tttaaggtcg gggtccgttt aggccgcgga gagttagaaa atcgcatcat cacacgcgac 1260
gaagtagaac gcgctttacg cgagattact tcaggcccca aggctgaaga ggtaaaagag 1320
aacgccttaa aatggaagaa gaaggcagaa gagacagtag ctaaaggcgg ctactccgaa 1380
cgtaatcttg taggcttcat tgaagaggtg gctcgtaaga ctggtacaaa gtaa 1434
<210> 58
<211> 1176
<212> DNA
<213> Unknown
<220>
<223> Rheum palmatum
<400> 58
atggcagatg tcctgcagga gatccgcaac tcgcagaagg cgagcgggcc cgccacggtg 60
ctcgccatcg gcactgccca tccaccgacg tgctaccctc aggccgacta ccccgacttc 120
tacttccgag tttgcaagag cgagcacatg accaaactca agaagaaaat gcaattcatt 180
tgtgacagat cggggataag gcagcggttt atgttccaca cggaagagaa cctggggaag 240
aacccgggga tgtgcacatt cgacgggcca tcgctgaacg cgcggcagga catgctgatc 300
atggaagtgc cgaagctggg ggcggaggcg gcggagaagg cgatcaagga gtgggggcag 360
gacaagtccc ggatcaccca cctcatcttc tgcaccacca cgagcaacga catgcccggg 420
gcggactacc agttcgccac cctgttcggg ctgaaccccg gcgtgagccg caccatggtc 480
taccagcagg gctgcttcgc cgggggcacc gtgctgcgcc tggtcaagga catcgcggag 540
aacaacaagg gggcgcgcgt gctggtggtg tgctcggaga tcgtggcctt cgccttccgc 600
gggccccacg aggaccacat cgactccctc atcgggcagc tcctgttcgg ggacggggcc 660
gccgccctcg tggtcgggac agacatcgac gagagcgtcg agaggcccat cttccagatc 720
atgtcggcga cccaggcgac catccccaac tcgctgcaca ccatggctct ccatctgacg 780
gaggcggggc tgaccttcca tctcagcaag gaggtgccca aggtggtgag cgacaacatg 840
gaggagctca tgctcgaggc cttcaagccg ctcgggataa ccgattggaa ctccatattc 900
tggcaagtgc atcccggggg tagagccatc cttgacaaga tcgaggagaa gctggagctc 960
accaaggata agatgcggga ttcccgctac atcttgagcg agtacgggaa tctcaccagc 1020
gcctgtgtgc tctttgtcat ggacgagatg aggaagaggt ccttccggga agggaagcag 1080
accaccggag acggctacga gtggggtgtc gccatcggat tggggcccgg tcttaccgtc 1140
gagaccgttg tcttgcgtag cgtccccatt ccctaa 1176
<210> 59
<211> 1776
<212> DNA
<213> Unknown
<220>
<223> Corynebacterium glutamicum
<400> 59
gtgtcagtcg agactaggaa gatcaccaag gttcttgtcg ctaaccgtgg tgagattgca 60
atccgcgtgt tccgtgcagc tcgagatgaa ggcatcggat ctgtcgccgt ctacgcagag 120
ccagatgcag atgcaccatt cgtgtcatat gcagacgagg cttttgccct cggtggccaa 180
acatccgctg agtcctacct tgtcattgac aagatcatcg atgcggcccg caagtccggc 240
gccgacgcca tccaccccgg ctacggcttc ctcgcagaaa acgctgactt cgcagaagca 300
gtcatcaacg aaggcctgat ctggattgga ccttcacctg agtccatccg ctccctcggc 360
gacaaggtca ccgctcgcca catcgcagat accgccaagg ctccaatggc tcctggcacc 420
aaggaaccag taaaagacgc agcagaagtt gtggctttcg ctgaagaatt cggtctccca 480
atcgccatca aggcagcttt cggtggcggc ggacgtggca tgaaggttgc ctacaagatg 540
gaagaagtcg ctgacctctt cgagtccgca acccgtgaag caaccgcagc gttcggccgc 600
ggcgagtgct tcgtggagcg ctacctggac aaggcacgcc acgttgaggc tcaggtcatc 660
gccgataagc acggcaacgt tgttgtcgcc ggaacccgtg actgctccct gcagcgccgt 720
ttccagaagc tcgtcgaaga agcaccagca ccattcctca ccgatgacca gcgcgagcgt 780
ctccactcct ccgcgaaggc tatctgtaag gaagctggct actacggtgc aggcaccgtt 840
gagtacctcg ttggctccga cggcctgatc tccttcctcg aggtcaacac ccgcctccag 900
gtggaacacc cagtcaccga agagaccacc ggcatcgacc tggtccgcga aatgttccgc 960
atcgcagaag gccacgagct ctccatcaag gaagatccag ctccacgcgg ccacgcattc 1020
gagttccgca tcaacggcga agacgctggc tccaacttca tgcctgcacc aggcaagatc 1080
accagctacc gcgagccaca gggcccaggc gtccgcatgg actccggtgt cgttgaaggt 1140
tccgaaatct ccggacagtt cgactccatg ctggcaaagc tgatcgtttg gggcgacacc 1200
cgcgagcagg ctctccagcg ctcccgccgt gcacttgcag agtacgttgt cgagggcatg 1260
ccaaccgtta tcccattcca ccagcacatc gtggaaaacc cagcattcgt gggcaacgac 1320
gaaggcttcg agatctacac caagtggatc gaagaggttt gggataaccc aatcgcacct 1380
tacgttgacg cttccgagct cgacgaagat gaggacaaga ccccagcaca gaaggttgtt 1440
gtggagatca acggccgtcg cgttgaggtt gcactcccag gcgatctggc actcggtggc 1500
accgctggtc ctaagaagaa ggccaagaag cgtcgcgcag gtggtgcaaa ggctggcgta 1560
tccggcgatg cagtggcagc tccaatgcag ggcactgtca tcaaggtcaa cgtcgaagaa 1620
ggcgctgaag tcaacgaagg cgacaccgtt gttgtcctcg aggctatgaa gatggaaaac 1680
cctgtgaagg ctcataagtc cggaaccgta accggcctta ctgtcgctgc aggcgagggt 1740
gtcaacaagg gcgttgttct cctcgagatc aagtaa 1776
<210> 60
<211> 1321
<212> DNA
<213> Corynebacterium glutamicum
<400> 60
atgcgtcatg tagagcatac agtcaccgtt gcggccccag cagacttggt ttgggaggta 60
cttgccgatg tcttaggcta tgctgacatc ttcccaccga cggaaaaagt tgaaattctt 120
gaggaggggc aaggatacca ggtagtgcgc cttcacgtcg atgttgcggg tgagattaat 180
acatggacca gtcgtcgcga tttagaccct gcgcgccgcg taattgctta ccgccaactt 240
gagacggctc cgatcgtggg ccacatgagc ggggaatggc gtgctttcac actggatgcc 300
gaacgtaccc aattagtcct gactcacgat ttcgtaaccc gtgcagccgg ggatgacggt 360
ttagtcgccg gaaaattgac cccagatgag gcgcgcgaaa tgttagaagc ggtggtagaa 420
cgtaactctg tcgccgactt aaacgcggtc cttggagaag ctgagcgtcg cgtccgcgca 480
gccggtggag ttggtaccgt aactgcgtaa taataatttt gtttaacttt aagaaggaga 540
tatatccatg tcagggcgca aaaccttttt agacttaagt tttgctaccc gcgacacacc 600
gtcggaggcg actccggtgg tggtagattt gctggaccac gtaactggag ccaccgtatt 660
aggattatca cctgaggatt tccccgatgg tatggctatt tccaatgaga ccgttacgtt 720
gacgacccac actggcacgc acatggatgc gccactgcac tatggtccct taagtggggg 780
agttccggca aagtcgattg accaagtgcc cttggaatgg tgctatggac ctggagttcg 840
tttggatgtt cgccacgtgc cggcaggaga tggtattact gtcgatcatt tgaacgccgc 900
gttggatgca gcagagcacg atttggcccc cggtgacatt gtgatgctgt ggaccggcgc 960
ggacgctctg tggggaaccc gcgaatactt gagcacgttt ccggggttaa ctgggaaggg 1020
gacacaattt ttggtcgagg cgggtgttaa agtcattggc attgatgcat ggggactgga 1080
tcgcccgatg gcagctatga tcgaagaata ccgtcgtacg ggcgataaag gagcattatg 1140
gccggctcac gtctatggac gcacacgcga atacctgcaa ttagagaagc ttaataattt 1200
gggcgcttta ccaggagcta cagggtatga catttcatgc tttccggttg cggttgcagg 1260
cactggagct gggtggactc gtgtggtcgc cgttttcgag caagaggaag aggattaata 1320
a 1321
<210> 61
<211> 477
<212> PRT
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F (GtUF6CGT1V93Q/Y193F) variant
<400> 61
Met Gly Ser Leu Thr Asn Asn Asp Asn Leu His Ile Phe Leu Val Cys
1 5 10 15
Phe Ile Gly Gln Gly Val Val Asn Pro Met Leu Arg Leu Gly Lys Ala
20 25 30
Phe Ala Ser Lys Gly Leu Leu Val Thr Leu Ser Ala Pro Glu Ile Val
35 40 45
Gly Thr Glu Ile Arg Lys Ala Asn Asn Leu Asn Asp Asp Gln Pro Ile
50 55 60
Lys Val Gly Ser Gly Met Ile Arg Phe Glu Phe Phe Asp Asp Gly Trp
65 70 75 80
Glu Ser Val Asn Gly Ser Lys Pro Phe Asp Val Trp Gln Tyr Ile Asn
85 90 95
His Leu Asp Gln Thr Gly Arg Gln Lys Leu Pro Ile Met Leu Lys Lys
100 105 110
His Glu Glu Thr Gly Thr Pro Val Ser Cys Leu Ile Leu Asn Pro Leu
115 120 125
Val Pro Trp Val Ala Asp Val Ala Asp Ser Leu Gln Ile Pro Cys Ala
130 135 140
Thr Leu Trp Val Gln Ser Cys Ala Ser Phe Ser Ala Tyr Tyr His Tyr
145 150 155 160
His His Gly Leu Val Pro Phe Pro Thr Glu Ser Glu Pro Glu Ile Asp
165 170 175
Val Gln Leu Pro Gly Met Pro Leu Leu Lys Tyr Asp Glu Val Pro Asp
180 185 190
Phe Leu His Pro Arg Thr Pro Tyr Pro Phe Phe Gly Thr Asn Ile Leu
195 200 205
Gly Gln Phe Lys Asn Leu Ser Lys Asn Phe Cys Ile Leu Met Asp Thr
210 215 220
Phe Tyr Glu Leu Glu His Glu Ile Ile Asp Asn Met Cys Lys Leu Cys
225 230 235 240
Pro Ile Lys Pro Ile Gly Pro Leu Phe Lys Ile Pro Lys Asp Pro Ser
245 250 255
Ser Asn Gly Ile Thr Gly Asn Phe Met Lys Val Asp Asp Cys Lys Glu
260 265 270
Trp Leu Asp Ser Arg Pro Thr Ser Thr Val Val Tyr Val Ser Val Gly
275 280 285
Ser Val Val Tyr Leu Lys Gln Glu Gln Val Thr Glu Met Ala Tyr Gly
290 295 300
Ile Leu Asn Ser Glu Val Ser Phe Leu Trp Val Leu Arg Pro Pro Ser
305 310 315 320
Lys Arg Ile Gly Thr Glu Pro His Val Leu Pro Glu Glu Phe Trp Glu
325 330 335
Lys Ala Gly Asp Arg Gly Lys Val Val Gln Trp Ser Pro Gln Glu Gln
340 345 350
Val Leu Ala His Pro Ala Thr Val Gly Phe Leu Thr His Cys Gly Trp
355 360 365
Asn Ser Thr Gln Glu Ala Ile Ser Ser Gly Val Pro Val Ile Thr Phe
370 375 380
Pro Gln Phe Gly Asp Gln Val Thr Asn Ala Lys Phe Leu Val Glu Glu
385 390 395 400
Phe Lys Val Gly Val Arg Leu Gly Arg Gly Glu Leu Glu Asn Arg Ile
405 410 415
Ile Thr Arg Asp Glu Val Glu Arg Ala Leu Arg Glu Ile Thr Ser Gly
420 425 430
Pro Lys Ala Glu Glu Val Lys Glu Asn Ala Leu Lys Trp Lys Lys Lys
435 440 445
Ala Glu Glu Thr Val Ala Lys Gly Gly Tyr Ser Glu Arg Asn Leu Val
450 455 460
Gly Phe Ile Glu Glu Val Ala Arg Lys Thr Gly Thr Lys
465 470 475
<210> 62
<211> 1321
<212> DNA
<213> Artificial Sequence
<220>
<223> zhuIJ - Codon optimization for E. coli
<400> 62
atgcgtcatg tagagcatac agtcaccgtt gcggccccag cagacttggt ttgggaggta 60
cttgccgatg tcttaggcta tgctgacatc ttcccaccga cggaaaaagt tgaaattctt 120
gaggaggggc aaggatacca ggtagtgcgc cttcacgtcg atgttgcggg tgagattaat 180
acatggacca gtcgtcgcga tttagaccct gcgcgccgcg taattgctta ccgccaactt 240
gagacggctc cgatcgtggg ccacatgagc ggggaatggc gtgctttcac actggatgcc 300
gaacgtaccc aattagtcct gactcacgat ttcgtaaccc gtgcagccgg ggatgacggt 360
ttagtcgccg gaaaattgac cccagatgag gcgcgcgaaa tgttagaagc ggtggtagaa 420
cgtaactctg tcgccgactt aaacgcggtc cttggagaag ctgagcgtcg cgtccgcgca 480
gccggtggag ttggtaccgt aactgcgtaa taataatttt gtttaacttt aagaaggaga 540
tatatccatg tcagggcgca aaaccttttt agacttaagt tttgctaccc gcgacacacc 600
gtcggaggcg actccggtgg tggtagattt gctggaccac gtaactggag ccaccgtatt 660
aggattatca cctgaggatt tccccgatgg tatggctatt tccaatgaga ccgttacgtt 720
gacgacccac actggcacgc acatggatgc gccactgcac tatggtccct taagtggggg 780
agttccggca aagtcgattg accaagtgcc cttggaatgg tgctatggac ctggagttcg 840
tttggatgtt cgccacgtgc cggcaggaga tggtattact gtcgatcatt tgaacgccgc 900
gttggatgca gcagagcacg atttggcccc cggtgacatt gtgatgctgt ggaccggcgc 960
ggacgctctg tggggaaccc gcgaatactt gagcacgttt ccggggttaa ctgggaaggg 1020
gacacaattt ttggtcgagg cgggtgttaa agtcattggc attgatgcat ggggactgga 1080
tcgcccgatg gcagctatga tcgaagaata ccgtcgtacg ggcgataaag gagcattatg 1140
gccggctcac gtctatggac gcacacgcga atacctgcaa ttagagaagc ttaataattt 1200
gggcgcttta ccaggagcta cagggtatga catttcatgc tttccggttg cggttgcagg 1260
cactggagct gggtggactc gtgtggtcgc cgttttcgag caagaggaag aggattaata 1320
a 1321
<210> 63
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_I18P_F
<400> 63
tgtgcttccc aggccagggc gtggtcaat 29
<210> 64
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_I18P_R
<400> 64
cgccctggcc tgggaagcac acaagaaaaa t 31
<210> 65
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_Q20M_F
<400> 65
ttcatcggca tgggcgtggt caatcccat 29
<210> 66
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_Q20M_R
<400> 66
tgaccacgcc catgccgatg aagcacacaa g 31
<210> 67
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_T50K_F
<400> 67
aatcgttgga aaggagatcc gtaaggcgaa 30
<210> 68
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_T50K_R
<400> 68
tacggatctc ctttccaacg atttccggtg 30
<210> 69
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_T50N_F
<400> 69
aatcgttgga aatgagatcc gtaaggcgaa 30
<210> 70
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_T50Q_F
<400> 70
tacggatctc atttccaacg atttccggtg 30
<210> 71
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_T50Q_R
<400> 71
aatcgttgga caggagatcc gtaaggcgaa 30
<210> 72
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_T50R_F
<400> 72
tacggatctc ctgtccaacg atttccggtg 30
<210> 73
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_T50R_R
<400> 73
aatcgttgga cgtgagatcc gtaaggcgaa 30
<210> 74
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_T50V_F
<400> 74
tacggatctc acgtccaacg atttccggtg 30
<210> 75
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_T50V_R
<400> 75
aatcgttgga gttgagatcc gtaaggcgaa 30
<210> 76
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_T50V_R
<400> 76
tacggatctc aactccaacg atttccggtg 30
<210> 77
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_I95L_F
<400> 77
gtatggcaat acctcaatca cttagaccag acag 34
<210> 78
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_I95L_R
<400> 78
ggtctaagtg attgaggtat tgccatacgt caaacg 36
<210> 79
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_I95M_F
<400> 79
gtatggcaat acatgaatca cttagaccag acag 34
<210> 80
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_I95M_R
<400> 80
ggtctaagtg attcatgtat tgccatacgt caaacg 36
<210> 81
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_I95T_F
<400> 81
gtatggcaat acactaatca cttagaccag acag 34
<210> 82
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_I95T_R
<400> 82
ggtctaagtg attagtgtat tgccatacgt caaacg 36
<210> 83
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_V290A_F
<400> 83
gtgtcgggtc tgctgtatat ttgaagcagg ag 32
<210> 84
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_V290A_R
<400> 84
gcttcaaata tacagcagac ccgacactaa cg 32
<210> 85
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_V290G_F
<400> 85
gtgtcgggtc tggtgtatat ttgaagcagg ag 32
<210> 86
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_V290G_R
<400> 86
gcttcaaata tacaccagac ccgacactaa cg 32
<210> 87
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_I323A_F
<400> 87
agcaaacgcg ccggtacgga accgcatgt 29
<210> 88
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_I323A_R
<400> 88
gttccgtacc ggcgcgtttg ctcgg 25
<210> 89
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_I323S_F
<400> 89
agcaaacgca gcggtacgga accgcatgt 29
<210> 90
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT V93Q/Y193F_I323S_R
<400> 90
gttccgtacc gctgcgtttg ctcgg 25
<210> 91
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> V22A-f
<400> 91
cggccagggc gcggtcaatc ccatgttacg 30
<210> 92
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> V22A-R
<400> 92
tgggattgac cgcgccctgg ccgatgaagc 30
<210> 93
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> L29A-F
<400> 93
catgttacgt gcggggaagg cgttcgcctc 30
<210> 94
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> L29A-R
<400> 94
cgccttcccc gcacgtaaca tgggattgac 30
<210> 95
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> E46G-f
<400> 95
agcgcaccgg gcatcgttgg aactgagatc 30
<210> 96
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> E46G-R
<400> 96
tccaacgatg cccggtgcgc ttaaagtgac 30
<210> 97
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> V48G-f
<400> 97
ccggaaatcg gtggaactga gatccgtaag 30
<210> 98
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> V48G-R
<400> 98
ctcagttcca ccgatttccg gtgcgcttaa 30
<210> 99
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> E51C-f
<400> 99
cgttggaact tgcatccgta aggcgaataa c 31
<210> 100
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> E51C-R
<400> 100
ccttacggat gcaagttcca acgatttccg g 31
<210> 101
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> A55S-f
<400> 101
gatccgtaag tcgaataacc ttaatgatga ccaac 35
<210> 102
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> A55S-r
<400> 102
aaggttattc gacttacgga tctcagttcc 30
<210> 103
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> S86V-F
<400> 103
cgtaaacggt gtcaaaccgt ttgacgtatg g 31
<210> 104
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> S86V-r
<400> 104
caaacggttt gacaccgttt acggattccc a 31
<210> 105
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> D99G-F
<400> 105
caatcactta ggccagacag gccgtcaaaa ac 32
<210> 106
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> D99G-r
<400> 106
ggcctgtctg gcctaagtga ttgatgtatt gc 32
<210> 107
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> R103V-F
<400> 107
ccagacaggc gttcaaaaac ttccgattat g 31
<210> 108
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> R103V-R
<400> 108
ggaagttttt gaacgcctgt ctggtctaag tg 32
<210> 109
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> C151G-F
<400> 109
ggtccaatct ggtgcaagtt tttcagcata t 31
<210> 110
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> C151G-r
<400> 110
gaaaaacttg caccagattg gacccacaag g 31
<210> 111
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> L184G-F
<400> 111
ctgggatgcc aggtttgaaa tatgatgaag tg 32
<210> 112
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> L184G-r
<400> 112
catatttcaa acctggcatc ccaggaagtt g 31
<210> 113
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> L194A-F
<400> 113
cccgacttcg cgcatccgcg cacaccctac 30
<210> 114
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> L194A-r
<400> 114
gtgcgcggat gcgcgaagtc gggcacttca tc 32
<210> 115
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> E332P-F
<400> 115
tgtactgccc ccggagttct gggagaaggc c 31
<210> 116
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> E332P-r
<400> 116
cccagaactc cgggggcagt acatgcggtt c 31
<210> 117
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> I18A-F
<400> 117
tgtgtgcttc gccggccagg gcgtggtcaa t 31
<210> 118
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> I18A-r
<400> 118
cgccctggcc ggcgaagcac acaagaaaaa t 31
<210> 119
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> P385A-F
<400> 119
catcactttc gcacaatttg gggaccaagt g 31
<210> 120
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> P385A-r
<400> 120
ccccaaattg tgcgaaagtg atgacgggca c 31
<210> 121
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT_N_His_IV_F
<400> 121
caccatcacc atcaccatgg gagtttgact aacaacgata atc 43
<210> 122
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> GtCGT_N_His_IV_R
<400> 122
catatgtata tctccttctt atac 24
Claims (26)
- 서열번호 1로 표시되는 C-글리코실전이효소(C-glycosyltransferase)에서 F17, V93, V132, Y193, L164 및 R322로 구성된 군에서 선택되는 어느 하나 이상의 아미노산에 변이를 포함하는 C-글리코실전이효소 (C-glycosyltransferase) 변이체.
- 제1항에 있어서, 상기 변이체는 서열번호 1로 표시되는 C-글리코실 전이효소에서, 다음으로 구성된 군에서 선택되는 어느 하나 이상의 아미노산에 변이를 추가로 포함하는 C-글리코실전이효소 변이체:
F17, V405, P107, L208, L164, P45, I305, L316, F401, Y94, N57, Y187, C16, P319, F167, V132, N206, R406, Q386, V129, L125, L194, I95, S215, L184, Y158, L29, L27, F202, H159, S370, H365, V329, M301, V315, V190, C366, W80, L58, Q210, F312, D61, I207, L363, P196, L106, V93, A394, W314, S155, P88, D99, Y284, E189, G49, H328, E399, T392, F387, A44, P199, E46, R28, V285, I124, R419, L306, Y157, Y200, E373, P191, L214, S376, V15, E332, E51, I417, L98, I323, H161, T383, P127, E309, N84, L313, Q104, T371, N213, G79, L330, N307, K105, L128, A152, I18, N59, W147, S86, L293, E296, S377, L185, K216, F89, S286, F396, F211, Y303, D223, R415, N96, V22, S153, F154, D192, Y193, H195, P201, Y292, 및 R322.
- 제1항에 있어서, 상기 아미노산 변이는 V93 및 Y193 아미노산에 변이를 포함하는 것을 특징으로 하는, C-글리코실전이효소 (C-glycosyltransferase) 변이체.
- 제1항에 있어서, F17G, V93Q, V132A, Y193F, L164G 및 R322D로 구성된 군에서 선택되는 어느 하나 이상의 아미노산 치환을 포함하는 것을 특징으로 하는 C-글리코실전이효소 (C-glycosyltransferase) 변이체.
- 제3항에 있어서, V93Q 및 Y193F 아미노산 치환을 포함하는 것을 특징으로 하는 C-글리코실전이효소 (C-glycosyltransferase) 변이체.
- 제2항에 있어서, 다음으로 구성된 군에서 선택되는 어느 하나 이상의 아미노산 치환을 추가로 포함하는 것을 특징으로 하는 C-글리코실 전이효소 변이체:
F17G, V405M, P107G, L208G, L164G, P45G, I305A, L316G, F401H, Y94G, N57G, Y187A, C16G, P319G, F167G, V132A, N206E, R406G, Q386H, V129A, L125V, L194A, I95G, S215D, L184G, Y158T, L29A, L27A, F202S, H159G, S370A, H365G, V329T, M301W, V315A, V190A, C366G, W80Y, L58E, Q210G, F312G, D61G, I207P, L363G, P196G, L106G, V93G, A394G, W314C, S155A, P88D, D99G, Y284H, E189A, G49TH328G, E399D, T392A, F387T, A44G, P199E, E46G, R28G, V285I, I124T, R419A, L306M, Y157T, Y200L, E373A, P201G, P191G, L214A, S376G, V15G, E332P, E51C, I417L, L98G, I323A, H161G, T383C, P127A, E309N, N84S, L313T, Q104D, T371A, N213L, G79S, L330G, N307A, K105G, L128D, A152G, S153G, I18A, N59V, W147F, S86V, L293V, E296D, S377A, L185V, K216R, F89A, S286C, F396L, F211G, Y303A, D223G, R415L, N96A, V22H, V93Q, V93L, S153C, F154L, D192S, Y193F, H195Y, H195L, P201T, Y292H, Y292F, R322D 및 R322A.
- 제4항에 있어서, 다음으로 구성된 군에서 선택되는 어느 하나 이상의 아미노산 치환을 추가로 포함하는 것을 특징으로 하는 C-글리코실 전이효소 변이체:
I18P, Q20M, T50N, T50Q, T50K, T50R, T50V, I95M, I95T, V290G, V290A, I323S, I323A, I95L, V22A, L29A, E46G, V48G, E51C, A55S, S86V, D99G, R103V, C151G, L184G, L194A, E332P, I18A 및 P385A.
- 제7항에 있어서, 다음으로 구성된 군에서 선택되는 어느 하나 이상의 아미노산 치환을 추가로 포함하는 것을 특징으로 하는 C-글리코실 전이효소 변이체:
I323S, T50R, T50V, I18P, I95T, Q20M, I323A, P385A, L194A 및 V48G.
- 제1항 내지 제8항 중 어느 한 항의 변이체를 암호화하는 핵산.
- 제9항의 핵산이 도입된 재조합 미생물.
- 제10항에 있어서, 상기 재조합 미생물은 UTP-글루코오스-1-포스페이트 우리딜트렌스퍼라아제 (UTP-glucose-1-phosphate uridylyltransferase), 포스포글루코뮤타아제(phosphoglucomutase) 및/또는 뉴클레오시드-디포스페이트 키나제(nucleoside-diphosphate kinase)를 암호화하는 유전자의 발현이 강화되어 있는 것을 특징으로 하는 재조합 미생물.
- 제10항에 있어서, 상기 재조합 미생물은 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체 생산용인 것을 특징으로 하는 재조합 미생물.
- 제12항에 있어서, 상기 재조합 미생물은 폴리케타이드 합성효소 또는 페닐프로파노이드 합성효소가 추가로 도입된 것을 특징으로 하는 재조합 미생물.
- 제12항에 있어서, 상기 재조합 미생물은 pabA 유전자의 발현이 약화되어 있는 것을 특징으로 하는 재조합 미생물.
- 제12항에 있어서, 상기 폴리케타이드는
라파마이신(rapamycin), 로바스타틴(lovastatin), 에리트로마이신(erythromycin), 리파마이신(rifamycin), 아버멕틴(avermectin), 겔다나마이신(geldanamycin), 이버멕틴(ivermectin), 칼리케아마이신(calicheamicin), 에포타일론(epothilone), 트라이아세트산 락톤(triacetic acid lactone) 및 6-메틸살리실산(6-methylsalicylic acid)로 구성된 군에서 선택되는 타입 I 폴리케타이드;
액티로노딘(actinorhodin), 독소루비신(doxorubicin), 다우노루비신(daunorubicin), 옥시테트라사이클린(oxytetracycline), SEK4, SEK4b, SEK34, SEK15, SEK26, FK506, DMAC, 아클라비논(aklavinone), 아클라노닉산(aklanonic acid), 엡실론 로도마이시논(epsilon-rhodomycinone), 독시사이클린(doxycycline), 안트라마이신(anthramycin), 테트라세노마이신(tetracenomycin), 카르민산(Carmin acid) 및 프레놀리신(frenolicin)로 구성된 군에서 선택되는 타입 II 폴리케타이드; 및
알로에신(aloesin), 알로에닌(aloenin), 바바로인(barbaloin), 5,7-다이하이드록시-2-메틸크로몬(5,7-dihydroxy-2-methylchromone) 및 알로에손(aloesone)로 구성된 군에서 선택되는 타입 III 폴리케타이드;로 구성된 군에서 선택되고,
상기 페닐프로파노이드는 액티노마이신(actinomycin), 바키트라신(bacitracin), 답토마이신(daptomycin), 밴코마이신(vancomycin), 테익소박틴(teixobactin), 타이로시딘(tyrocidine), 그라미시딘(gramicidin), 즈위터미신 A(zwittermicin A), 블레오마이신(bleomycin), 시클로스포린(ciclosporin), 피오버딘(pyoverdine), 엔테로박틴(enterobactin), 믹소켈린 A(myxochelin A), 인디고이딘(indigoidine), 사이아노피신(cyanophycin) 등으로 구성된 비리보솜 펩티드, 피노켐브린(pinocembrin), 다이하이드로캄페롤(dihydrokaempferol), 에리오딕티올(eriodictyol), 다이하이드로쿼세틴(dihydroquercetin), 코리페릴알코올(coniferyl alcohol), 실리빈 (silybin), 아이소실리빈 (isosilybin), 실리크리스틴 (silychristin), 실리나이드(silinide), 2,3-디하이드로실리빈(2,3-dehydrosilybin), 실리다이아닌(silydianin), 다이드제인(daidzein), 게니스타인(genistein), 아피게닌(apigenin), 루테올린(luteolin), 캄페롤(kaempferol), 쿼세틴(quercetin), 카테킨(catechin), 페라고니딘(pelargonidin), 시아니딘(cyanidin), 압젤레친(afzelechin), 미리세틴(myricetin), 피세틴(fisetin), 갈랑긴(galangin), 헤스페레틴(hesperetin), 탄제리틴(tangeritin), 델피니딘(delphinidin), 에피카테킨(epicatechin), 크리신(chrysin), 레스베라트롤(resveratrol) 및 나린제닌(naringenin)으로 구성된 군에서 선택되는 것을 특징으로 하는 재조합 미생물.
- 제12항에 있어서,
(i) 타입 II 폴리케타이드 생합성 효소를 암호화하는 유전자;
(ii) 4'-포스포판테인닐 전이효소 (4'-phosphopantetheinyl transferase)를 암호화하는 유전자;
(iii) 사이클라아제(cyclase)를 암호화하는 유전자;
(iv) 아세틸-CoA 카르복실화 효소 (acetyl-CoA carboxylase)를 암호화하는 유전자; 및
(v) 아클라비네온 12-수산화효소 (aklavinone 12-hydroxylase)를 암호화하는 유전자;로 구성된 군에서 선택되는 어느 하나 이상의 유전자가 도입되고,
상기 폴리케타이드 배당체는 카르민산인 것을 특징으로 하는 재조합 미생물.
- 제16항에 있어서, 상기 타입 II 폴리케타이드 생합성 효소를 암호화하는 유전자는 antD (ketosynthase), antE (chain-length factor), antF (ACP), antB (phosphopantetheinyl transferase) 및 antG (malonyl-CoA:ACP malonyltransferase)로 구성된 군에서 선택되는 어느 하나 이상의 유전자 또는 이들의 조합인 것을 특징으로 하는 재조합 미생물.
- 제16항에 있어서, 상기 아클라비네온 12-수산화효소는 서열번호 2로 표시되는 아미노산 서열에서 217번째 아미노산이 프롤린에서 라이신으로의 변이(P217K)를 포함하는 것을 재조합 미생물.
- 제16항에 있어서,
상기 타입 II 폴리케타이드 생합성 효소는 P. luminescens 유래;
상기 4'-포스포판테인닐 전이효소는 Bacillus subtilis 또는 P. luminescens 유래;
상기 사이클라아제는 Streptomyces sp. 유래;
상기 아세틸-CoA 카르복실화 효소는 Corynebacterium glutamicum 유래; 및/또는
상기 아클라비네온 12-수산화효소는 Streptomyces peucetius 유래;인 것을 특징으로 하는 재조합 미생물.
- 제12항에 있어서,
(i) 알로에손 합성효소(aloesone synthase)를 암호화하는 유전자가 도입되어 있고,
상기 폴리케타이드 배당체는 알로에신인 것을 특징으로 하는 재조합 미생물.
- 제20항에 있어서,
상기 알로에손 합성효소는 R. palmatum 유래인 것을 특징으로 하는 재조합 미생물.
- 다음 단계를 포함하는 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 제조방법:
(a) 제10항의 재조합 미생물을 배양하여 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체를 생성시키는 단계; 및
(b) 상기 생성된 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체를 회수하는 단계.
- 제22항에 있어서, 상기 재조합 미생물은 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 전구체 생산능을 갖는 것을 특징으로 하는 제조방법.
- 제22항에 있어서, 상기 (a) 단계는 제10항의 재조합 미생물을 폴리케타이드 및/또는 페닐프로파노이드가 첨가된 배지에서 배양하는 것을 특징으로 하는 제조방법.
- 제22항에 있어서, 상기 폴리케타이드 배당체는 카르민산이고, 상기 (a)단계는 배양시 배양 배지에 아스코르빈산을 첨가하여 미생물을 배양하는 것을 특징으로 하는 제조방법.
- 다음 단계를 포함하는 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체의 제조방법:
(a) 제1항 내지 제8항 중 어느 한 항의 C-글리코실전이효소 변이체 또는 상기 C-글리코실전이효소 변이체를 발현하는 미생물과 폴리케타이드 및/또는 페닐프로파노이드를 반응시켜 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체를 생성시키는 단계; 및
(b) 상기 생성된 폴리케타이드 배당체 및/또는 페닐프로파노이드 배당체를 회수하는 단계.
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023545885A JP2024505906A (ja) | 2021-01-27 | 2022-01-27 | C-グリコシルトランスフェラーゼ変異体およびその用途 |
US18/263,127 US20240102068A1 (en) | 2021-01-27 | 2022-01-27 | C-glycosyltransferase variants and use thereof |
EP22746252.0A EP4286515A1 (en) | 2021-01-27 | 2022-01-27 | C-glycosyltransferase variants and use thereof |
CN202280016203.2A CN117425727A (zh) | 2021-01-27 | 2022-01-27 | C-葡糖基转移酶变体及其用途 |
PCT/KR2022/001485 WO2022164226A1 (ko) | 2021-01-27 | 2022-01-27 | C-글리코실전이효소 변이체 및 이의 용도 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20210011326 | 2021-01-27 | ||
KR1020210011326 | 2021-01-27 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220109336A true KR20220109336A (ko) | 2022-08-04 |
Family
ID=82836914
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220011630A KR20220109336A (ko) | 2021-01-27 | 2022-01-26 | C-글리코실전이효소 변이체 및 이의 용도 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20220109336A (ko) |
-
2022
- 2022-01-26 KR KR1020220011630A patent/KR20220109336A/ko unknown
Non-Patent Citations (1)
Title |
---|
Chen, D.; Chen, R.; Xie, K.; Duan, Y.; Dai, J., Production of acetophenone C-glucosides using an engineered C-glycosyltransferase in Escherichia coli. Tetrahedron Lett. 2018, 59 (19), 1875-1878 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7510187B2 (ja) | イソオイゲノールからのバニリンの生合成 | |
JP2012531198A (ja) | Crm197及びその誘導体の産生のための人工遺伝子の細菌発現 | |
CN117965408A (zh) | 酰基氨基酸的产生 | |
JP7387194B2 (ja) | イソオイゲノールからのバニリンの生合成 | |
WO2020077367A1 (en) | Biosynthesis of homoeriodictyol | |
US6753173B1 (en) | Methods to mediate polyketide synthase module effectiveness | |
KR20220109336A (ko) | C-글리코실전이효소 변이체 및 이의 용도 | |
WO2002059322A9 (en) | Compositions and methods relating to the daptomycin biosynthetic gene cluster | |
EP4286515A1 (en) | C-glycosyltransferase variants and use thereof | |
US7998702B2 (en) | Mutant arabinose promoter for inducible gene expression | |
CA2322105A1 (en) | Antibiotic production (ii) | |
JP4850064B2 (ja) | 無細胞タンパク質生合成用溶解物の産生法 | |
US20240052381A1 (en) | Biosynthesis of vanillin from isoeugenol | |
US20240060098A1 (en) | Amycolatopsis strains for vanillin production with suppressed vanillic acid formation | |
US20240052380A1 (en) | Biosynthesis of vanillin from isoeugenol | |
CN117425727A (zh) | C-葡糖基转移酶变体及其用途 | |
US7198932B1 (en) | Gdp-4-keto-6-deoxy-d-mannose-3,5-epimerase-4-reductase gene derived from arabidopsis thaliana | |
JP6635535B1 (ja) | Efpタンパク質を発現する大腸菌およびそれを用いたフラボノイド化合物製造方法 | |
CA2130238A1 (en) | Dna fragment carrying the gene encoding the enzyme for fragmenting n-acetylheparosan and the adjacent sequences permitting its expression, recombinant enzyme intended for fragmenting n-acetylheparosan and its use | |
US5928925A (en) | Rice ornithine carbamyltransferase gene, and a vector containing said gene and a transformant | |
Suh et al. | Chalcone and stilbene synthases expressed in eucaryotes exhibit reduced cross-reactivity in vitro | |
WO2022133269A1 (en) | Bioconversion of ferulic acid to vanillin | |
GB2620254A (en) | Method for preparing multisubunit SCF E3 ligase with fusion protein through in vitro reconstitution, and use of multisubunit SCF E3 ligase | |
CN113337485A (zh) | 一种抗噬菌体和抗病毒系统 | |
JPS61247393A (ja) | L−トリプトフアンの製造方法 |