KR20160005093A - 폴리페놀의 글리코실화를 촉매 작용하는 효소 - Google Patents

폴리페놀의 글리코실화를 촉매 작용하는 효소 Download PDF

Info

Publication number
KR20160005093A
KR20160005093A KR1020157034404A KR20157034404A KR20160005093A KR 20160005093 A KR20160005093 A KR 20160005093A KR 1020157034404 A KR1020157034404 A KR 1020157034404A KR 20157034404 A KR20157034404 A KR 20157034404A KR 20160005093 A KR20160005093 A KR 20160005093A
Authority
KR
South Korea
Prior art keywords
glu
leu
val
ile
lys
Prior art date
Application number
KR1020157034404A
Other languages
English (en)
Inventor
울리히 라바우스취
볼프강 스트라이트
줄리아 위르겐센
Original Assignee
함부르크대학교
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 함부르크대학교 filed Critical 함부르크대학교
Publication of KR20160005093A publication Critical patent/KR20160005093A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/60Preparation of O-glycosides, e.g. glucosides having an oxygen of the saccharide radical directly bound to a non-saccharide heterocyclic ring or a condensed ring system containing a non-saccharide heterocyclic ring, e.g. coumermycin, novobiocin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)

Abstract

본 발명은 폴리페놀, 특히, 플라보노이드, 벤조산 유도체, 스틸베노이드, 칼코노이드, 크로몬, 및 쿠마린 유도체의 글리코실화를 촉매 작용하는 효소에 관한 것이다. 한 가지 양태로, 본 발명은 폴리페놀의 글리코실화를 촉매 작용하는 효소로서, a) SEQ ID NO: 7-12의 서열 중 하나에 따른 아미노산 서열을 포함하거나, b) SEQ ID NO: 1-6의 서열 중 하나의 뉴클레오타이드 서열을 포함하는 핵산에 의해서 인코딩(encoding)되거나, c) 상기 a) 또는 b)에서 정의된 효소 중 하나와 상동성이거나, d) SEQ ID NO: 1-6의 서열 중 하나의 뉴클레오타이드 서열을 포함하는 서열에 상보적인 핵산과 엄격한 조건 하에 혼성화하는 핵산에 의해서 인코딩되는 효소를 제공한다.

Description

폴리페놀의 글리코실화를 촉매 작용하는 효소{ENZYMES CATALYZING THE GLYCOSYLATION OF POLYPHENOLS}
본 발명은 폴리페놀, 특히, 플라보노이드, 벤조산 유도체, 스틸베노이드(stilbenoid), 칼코노이드(chalconoid), 크로몬(chromone) 및 쿠마린 유도체(coumarin derivative)의 글리코실화를 촉매 작용하는 효소에 관한 것이다.
폴리페놀은 시키미산(Shikimic acid) 및 페닐프로파노이드 경로를 통해서 생합성되는 이차 식물 대사 산물이다. 이들은 이들의 고리 계에 하이드록실 기를 지니는 방향족 화합물 또는 이의 유도체이다. 플라보노이드 및 벤조산 유도체는 폴리페놀의 예이다. 고리 계의 하이드록실 기(들)의 이차적인 변형을 통해서, 이들 화합물의 광범위하게 다양한 천연 유도체가 형성된다. 당 변형(Sugar modification)은 자연에서 흔히 발생하는데, 그 이유는 이들이 화합물의 용해도 및 기능에 상당한 영향을 받을 수 있기 때문이다. 폴리페놀계 화합물은 과일 및 야채 형태의 우리의 일일 영양물 중 일부이고, 인간의 건강에 긍정적인 영향을 주는 것으로 공지되어 있다. 항산화 및 라디칼 스캐빈징 기능 외에도, 이들은, 예를 들어, 항알레르기, 항균, 항진균, 항바이러스, 항염증, 진통 및 또한 암 방지 작용을 할 수 있다(21). 이들의 광범위한 효과 때문에, 화장료 산업, 제약 산업 및 기능성 식품 산업에서 폴리페놀, 예를 들어, 특정의 플라보노이드에 대한 수요가 증가하고 있다(22-24). 이러한 수요를 맞추려면, 이들의 제한된 이용성으로부터 중요한 문제가 발생한다. 플라보노이드는, 예를 들어, 오로지 식물에서 낮은 수준으로 생산된다. 추출은 다량의 솔벤트(solvent)의 사용과 연관이 있으며, 이들의 상당히 복잡한 구조로 인해서 화학적 변형이 용이하게 달성되지 않는다(25).
폴리페놀, 예컨대, 플라보노이드의 위치-특이적 변형(regio-specific modification)이 여전히 어려운데, 그 이유는 직접적인 화학적 변형이 대체로 실패하기 때문이다. 따라서, 효소가 관심의 대상이 되고 있는데, 그 이유는 이들이 폴리페놀의 위치- 및 입체 화학적 변형을 매개할 수 있기 때문이다(26). 특히, 연구는 폴리페놀, 예를 들어, 플라보노이드의 수용성 및 생체이용성에 영향을 주기 위한 변형으로서 특이적 글리코실화에 중점을 두고 있다(27, 28). 이러한 반응을 촉매 작용하는 효소는 글리코실트랜스퍼라제(glycosyltransferases: GT)이다. 일반적으로, GT는 공여체 기질로부터 수용체 분자로의 당 잔기의 전달을 매개한다. 이들의 서열 유사성을 기초로 하여, GT는 현재 94개의 패밀리(family)로 분류된다(29). GT 패밀리 1(GT1)은 작은 친지성 분자의 글리코실화를 촉매 작용하는 효소를 포함한다(30). 누클레오티드-활성화 공여체를 사용하는 이들 효소(EC 2.4.1.x)는 UDP-글리코실트랜스퍼라제(UGT) 수퍼패밀리에 속하고, 또한, 를루아르 효소(Leloir enzyme)로 일컬어진다(31, 32). 플라보노이드에 작용하는 글리코실트랜스퍼라제가 또한 GT1에 속한다(33). GT1의 효소는 GT-B 폴드 구조(GT-B fold structure)를 지니며 전달된 당 잔기의 연결과 관련하여 반전형 반응 기전(inverting reaction mechanism)을 나타낸다(34). EP 2 128 265 A1은 플라보노이드의 글리코실화에 대한 진균 기원, 즉, 트리코데르마속(genus Trichoderma)으로부터의 글리코실트랜스퍼라제를 기재하고 있다. EP 1 985 704 A1은 플라보노이드에도 작용하는 식물 장미로부터의 글리코실트랜스퍼라제를 개시하고 있다. 현재까지, 매우 소수의 원핵세포 기원의 플라보노이드-작용 GT1이 동정되었으며 상세히 특성화되었다. 그램-음성 박테리아로부터 유래된 현재 공지된 플라보노이드 수용 UGT는 모두 마크로사이드 글리코실트랜스퍼라제(macroside glycosyltransferase: MGT) 수퍼패밀리에 속하며, 바실러스(Bacilli) 및 스트렙토마이세테(Streptomycete)로부터 기원한다(35-37; 또한 참조 EP 1 867 729 A1 및 WO 2009/015268 A1). 추가로, 그램-음성 잔토모나스 캄페스트리스(Gram-negative Xanthomonas campestris)로부터 유래되는 일회성 플라보노이드 작용 UGT가 공지되어 있다(38).
그 결과, 플라보노이드, 및 크로몬 등과 같은 폴리페놀을 변형시키기 위한 수단에 대한 요구가 여전하다. 따라서, 본 발명의 목적은 그러한 수단을 제공하는 것이다. 이러한 목적은 독립항의 주제에 의해서 해결된다. 본 발명의 유리한 구체예는 종속항에 특정되어 있다.
첫 번째 양태로, 본 발명은 폴리페놀, 예를 들어, 페놀산 유도체, 칼코노이드, 크로몬, 쿠마린 유도체, 플라보노이드 및 스틸베노이드의 글리코실화를 촉매 작용하는 효소로서,
a) SEQ ID NO: 7-12의 서열 중 하나에 따른 아미노산 서열을 포함하거나,
b) SEQ ID NO: 1-6의 서열 중 하나의 뉴클레오타이드 서열을 포함하는 핵산에 의해서 인코딩(encoding)되거나,
c) 상기 a) 또는 b)에서 정의된 효소 중 하나와 상동성이거나,
d) SEQ ID NO: 1-6의 서열 중 하나의 뉴클레오타이드 서열을 포함하는 서열에 상보적인 핵산과 엄격한 조건(stringent condition) 하에 혼성화하는 핵산에 의해서 인코딩되는 효소를 제공한다.
GtfC, MgtB, MgtC, MgtS, MgtT 및 MgtW로 지정된 본원에 기재된 신규한 효소는 GT 패밀리 1에 속하며 플라보노이드와 같은 폴리페놀 및 유사 분자에 대해서 고도로 활성이다.
본원에서 사용된 용어 "포함하는"은 용어 "지니는"을 포괄한다. 즉, 이러한 용어는 추가의 요소가 명시적으로 언급된 요소에 추가로 구체에에 반드시 존재해야 함을 의미하는 것으로 구성되는 것이 아니다. 예를 들어, 표현 "SEQ ID NO:X에 따른 아미노산 서열을 포함하는 효소"는 SEQ ID NO:X에 따른 아미노산 서열을 지니는 효소를 또한 포함하며, 이러한 문맥에서의 "지니는"은 SEQ ID NO:X에 있는 아미노산으로 배타적으로 구성됨을 의미한다.
핵산, 단백질, 또는 펩타이드에 관한 본원에서 사용된 용어 "상동성"은, 핵산 또는 단백질 또는 펩타이드가 그것이 비교되는 것과 완전히 동일한 것은 아니지만, 핵산이 이의 뉴클레오타이드 서열에서 또 다른 핵산과 기본적으로는 동일 또는 유사하거나, 단백질 또는 펩타이드가 이의 아미노산 서열에서 또 다른 단백질 또는 펩타이드와 기본적으로는 동일 또는 유사함을 의미한다. 두 개의 핵산 또는 단백질 또는 펩타이드 사이의 상동성의 존재는 동일 또는 유사 잔기가 그 위치에 존재하는지를 측정하기 위해서 첫 번째 서열에서의 위치를 두 번째 서열에서의 대응하는 위치와 비교함으로써 측정될 수 있다. 두 개의 비교된 서열은 동일 또는 유사 뉴클레오타이드 또는 아미노산의 특정의 최소 백분율이 존재하는 때에 서로 상동성이다. 동일성(identity)은 동등한 위치에서 두 서열을 비교하는 때에 동일한 뉴클레오타이드 또는 아미노산이 존재함을 의미한다. 최상의 가능한 정렬을 생성시키기 위해서 서열 갭을 고려하는 것이 임의로 필요할 수 있다. 유사한 아미노산은 동일 또는 동등한 화학적 및/또는 물리적 성질을 지니는 비-동일성 아미노산이다. 아미노산을 동일 또는 동등한 물리적 및/또는 화학적 성질을 지니는 또 다른 아미노산으로 대체하는 것은 "보존적 치환(conservative substitution)"이라 일컬어진다. 아미노산의 물리 화학적 성질의 예는 소수성 또는 전하(charge)이다. 핵산과 관련하여, 이것은 유사한 뉴클레오타이드를 나타내거나, 코딩 서열(coding sequence)에서, 코돈(codon) 내의 뉴클레오타이드가 또 다른 뉴클레오타이드로 대체되는 때의 보존적 치환, 즉, 동일 또는 유사한 아미노산을 여전히 인코딩하는, 예를 들어, 유전 코드의 축퇴(degeneracy)로 인한 새로운 코돈을 나타낸다. 당업자는 어느 뉴클레오타이드 또는 아미노산 치환이 보존적 치환인지를 알고 있다. 두 핵산 사이의 유사성 또는 동일성의 정도를 측정하기 위해서, 60개의 뉴클레오타이드 또는 염기쌍의 최소 길이, 바람직하게는 70, 80, 90, 100, 110, 120, 140, 160, 180, 200, 250, 300, 350 또는 400개의 뉴클레오타이드 또는 염기쌍의 최소 길이, 또는 각각의 뉴클레오타이드 서열 내의 적어도 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.2% 또는 99.5%의 뉴클레오타이드의 길이를 취하는 것이 바람직하다. 단백질/펩타이드의 경우에, 20개의 아미노산의 최소 길이, 바람직하게는 25, 30, 35, 40, 45, 50, 60, 80 또는 100개의 아미노산의 최소 길이, 더욱 바람직하게는 120, 140, 160, 180 또는 200개의 아미노산의 최소 길이, 또는 비교되는 각각의 아미노산 서열의 적어도 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.2% 또는 99.5%의 아미노산의 최소 길이를 취하는 것이 바람직하다. 특히 바람직하게는, 각각의 단백질(들) 또는 핵산(들)의 전체 길이가 비교를 위해서 사용된다. 두 서열의 유사성 또는 동일성의 정도는, 예를 들어, 표준 파라미터를 사용하는 컴퓨터 프로그램 BLAST(19), 참조예, http://www.ncbi.nlm.nih.gov/BLAST/)를 사용함으로써 측정될 수 있다. 상동성의 측정은 비교되는 서열의 길이에 좌우된다. 본 발명의 목적을 위해서, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96% , 적어도 97%, 적어도 98%, 적어도 99%, 적어도 99.2% 또는 99.5%의 뉴클레오티드가 동일하고/거나 유사(BLAST에 따른 "동일" 또는 "양성(positive)), 바람직하게는 동일한 때에, 더 짧은 것이 100개 이상의 뉴클레오티드를 포함하는 두 개의 핵산이 상동인 것으로 여겨질 것이다. 50 내지 99개의 뉴클레오티드의 서열 길이의 경우에, 적어도 80%, 바람직하게는 적어도 85%, 86%, 87%, 88%, 89%, 또는 90%의 뉴클레오티드가 동일하고/거나 유사한 때에 두 핵산은 상동인 것으로 여겨진다. 15 내지 49개의 뉴클레오티드의 서열 길이의 경우에, 적어도 90%, 바람직하게는 적어도 95%, 96%, 97%, 98%, 99%, 99.2% 또는 99.5%의 뉴클레오티드가 동일하고/거나 유사한 때에, 두 핵산은 상동인 것으로 여겨진다. 단백질 또는 펩타이드를 코딩하는 핵산의 경우에, 번역된 아미노산 서열이 상동이면 상동성이 존재하는 것으로 추정된다. 유사하게, BLOSUM62 치환 행렬(Henikoff, S. and Henikoff, J. Amino acid substitution matrices from protein blocks. Proc Natl. Acad. Sci. USA 89: 10915-10919, 1992)을 이용한, BLAST로 약자로 표현되는 컴퓨터 프로그램 "Basic Local Alignment Search Tool"(19): 참조예, http://www.ncbi.nlm.nih.gov/BLAST/)을 기초로 하여, "양성"으로 지정되는, 즉, BLOSUM62 치환 행렬에서 양성 스코어를 지니는 아미노산들, 특히 비-동일 아미노산들이 고려된다. 본 발명의 목적을 위해서,적어도 55%, 바람직하게는, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 98%, 적어도 99%, 적어도 99.2% 또는 적어도 99.5%의 아미노산이 동일 또는 유사, 바람직하게는 동일하면, 두 아미노산 서열 사이에 상동성이 존재하는 것으로 추정된다. 특히, 표준 파라미터 및 BLOSUM62 치환 행렬(20)을 이용한 컴퓨터 프로그램 BLAST(19); 참조예, http://www.ncbi.nlm.nih.gov/BLAST/)를 사용하여, 적어도 55%, 바람직하게는, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 98%, 적어도 99%, 적어도 99.2% 또는 적어도 99.5%의 동일성 또는 유사성("양성")이 얻어지는 때에, 두 서열 사이에 상동성이 존재하는 것으로 추정된다. 당업자는, 자신의 전문 지식을 이용하여, 이용 가능한 BLAST 프로그램, 예를 들어, BLASTp 또는 PLASTn중 어느 것이 상동성의 측정에 적합한지를 용이하게 측정할 것이다. 추가로, 당업자는, 필요하면 자신이 이용할 수 있는, 상동성을 검정하기 위한 추가의 프로그램을 알고 있다. 그러한 프로그램은, 예를 들어, European Bioinformatics Institute(EMBL)(참조예, http://www.ebi.ac.uk/Tools/similarity.html)의 웹사이트에서 이용 가능하다. 여기서, "에 대해서 x% 상동" 또는 "x%의 상동성"과 같은 용어가 본원에서 사용되면, 이는 두 단백질 또는 핵산이 상동인 것으로 여겨지고 x%, 예를 들어, 80%의 서열 유사성 또는 동일성, 바람직하게는 동일성을 지님을 의미하는 것으로 구성되는 것이다.
용어 "혼성화"는 본원에서 상보성 핵산들의 쌍 형성을 나타내는 것으로 사용된다. 혼성화 및 혼성화의 강도(즉, 핵산들 사이의 회합의 강도)는 핵산들 사이의 상보성의 정도, 관련되는 조건의 엄격성, 형성된 하이브리드(hybrid)의 핵산의 Tm("융점") 및 핵산 내의 G:C 비와 같은 인자에 영향을 받는다.
용어 "엄격한 조건하의 혼성화"는 핵산 혼성화가 수행되는 온도, 이온 강도, 및 유기 용매와 같은 다른 화합물의 존재와 관련하여 높은 엄격성의 조건을 나타낸다. "높은 엄격성" 조건에 의해서, 핵산 염기 쌍 형성은 높은 빈도의 상보성 염기 서열을 지니는 핵산들 사이에서만 발생할 것이다. 엄격한 혼성화 조건은 당업자에게는 공지되어 있다(참고예, Green M.R., Sambrook, J., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press; 4th edition, 2012). 엄격한 혼성화 조건에 대한 예는, 길이 약 500개의 뉴클레오티드의 프로브가 사용되는 때에, 5 x SSPE(43.8 g/1 NaCl, 6.9 g/l NaH2P04H20 및 1.85 g/1 EDTA, NaOH에 의해서 7.4로 조정된 pH), 0.5% SDS, 5 x Denhardt 시약 및 100 μg/ml 변성 연어 정자(denatured salmon sperm) DNA로 이루어진 용액 중 42℃에서의 혼성화에 이어진 42℃에서의 O.l x SSPE, 1.0% SDS를 포함하는 용액 중에서의 세척이다.
용어 "글리코실화"는 글리코실 공여체로서의 탄수화물이 하이드록실 또는 또 다른 분자(글리코실 수용체)의 하이드록실 또는 다른 작용기에 결합되는 반응에 관한 것이다.
용어 "글리코실 공여체"는 적합한 수용체 화합물과 반응하여 새로운 글리코사이드 결합을 형성하는 탄수화물, 예를 들어, 모노- 또는 올리고사카라이드에 관한 것이다.
용어 "탄수화물"은 탄소의 수화물, 즉, 화학양론적 식 CnH20)n을 지니는 화합물을 포함한다. 일반식은 모노사카라이드, 올리고사카라이드 및 폴리사카라이드 뿐만 아니라, 카르보닐기의 환원(알디톨), 카르복실산으로의 하나 이상의 말단기의 산화, 또는 수소 원자, 아미노기, 티올기 또는 유사한 기에 의한 하나 이상의 하이드록시기(들)의 대체에 의해서 모노사카라이드로부터 유래된 물질을 포함한다. 이는 또한 이들 화합물의 유도체를 포함한다(참조, IUPAC. Compendium of Chemical Terminology, 2nd ed. (the "Gold Book"). Compiled by A. D. McNaught and A. Wilkinson. Blackwell Scientific Publications, Oxford (1997). XML on-line corrected version: http://goldbook.iupac.org (2006-) created by M. Nic, J. Jirat, B. Kosata; updates compiled by A. Jenkins. ISBN 0-9678550-9-8. doi: 10.1351/goldbook. Last update: 2014-02-24; version: 2.3.3; doi: 10.1351/goldbook.C00820).
용어 "폴리페놀"은 시키미산과 페닐프로파노이드 경로를 통해서 생합성되고 고리 시스템에 직접 결합된 하나, 또는 둘 이상의 하이드록실기를 지니는 방향족 화합물 또는 이들의 유도체인 이차 식물 대사산물에 관한 것이다. 폴리페놀의 예는 플라보노이드, 벤조산 유도체, 스틸베노이드, 칼콘(chalcone), 크로몬 및 쿠마린 유도체이다.
용어 "플라보노이드"는 2-페닐크로멘-4-온(2-페닐-1,4-벤조피론)(예, 퀘르세틴(quercetin), 루틴(rutin))로부터 유래된 플라본, 3-페닐크로멘-4-온(3-페닐-1,4-벤조피론)으로부터 유래된 이소플라보노이드, 및 4-페닐쿠마린(4-페닐-l,2-벤조피론)으로부터 유래된 네오 플라보노이드를 포함하는 화합물의 군에 관한 것이다. 그러한 용어는, 예를 들어, 플라본류(예, 루테올린, 아피게닌(apigenin)), 플라바논류(예, 헤스페레틴(hesperetin), 나린게닌(naringenin), 에리오딕티올(eriodictyol)), 플라보놀류(예, 모린(morin), 케르세틴, 루틴, 캠프페롤(kaempferol), 미리세틴(myricetin), 이소람네틴(isorhamnetin), 피세틴(fisetin)), 플라바놀류(예, 카테킨, 갈로카테킨(gallocatechin), 에피카테킨(epicatechin), 에피갈로카테킨갈라트(epigallocatechingallat)), 플라바노놀류(예, 탁시폴린), 칼콘류(칼콘 유도체, 예를 들어, 이소리퀴리티게닌(isoliquiritigenin), 플로레틴(phloretin), 잔토휴몰(xanthohumol)), 이소플라본류(예, 게니스테인(genistein), 다이드제인(daidzein), 리코리시딘(licoricidin)), 크로몬류, 즉, 크로몬의 유도체(1,4-벤조피론, 크로몬-4-온)의 유도체, 특히, 하이드록실화된 크로몬 유도체(예, 노류게닌(noreugenin)), 안토시아니딘류(예, 시아니딘, 델피니딘(delphinidin), 말비딘(malvidin), 펠라르고니딘(pelargonidin), 페오니딘(peonidin), 페투니딘(petunidin)), 및 아우론류(aurones)(예, 아우류시딘(aureusidin)), 및 상기 언급된 화합물 부류의 아실화된, 글리코실화된, 메톡실화된 설포일화된 유도체를 포함한다. 또한 참조예: IUPAC. Compendium of Chemical Terminology, 2nd ed. (the "Gold Book"). Compiled by A. D. McNaught and A. Wilkinson. Blackwell Scientific Publications, Oxford (1997). XML on-line corrected version: http://goldbook.iupac.org (2006-) created by M. Nic, J. Jirat, B. Kosata; updates compiled by A. Jenkins. ISBN 0-9678550-9-8. doi: 10.1351/goldbook. Last update: 2014-02-24; version: 2.3.3; doi: 10.1351/goldbook.F02424.
용어 "스틸베노이드"는 스틸벤의 하이드록실화된 유도체 및 이의 유도체에 관한 것이고, 그 예는 레스베라트롤(resveratrol)이다.
용어 "쿠마린"은 쿠마린 (2H-크로멘-2-온, l-벤조피란-2-온)의 유도체, 특히, 하이드록실화된 유도체, 예를 들어, 7-하이드록시-4-메틸쿠마린(4-MU, 4-메틸움벨리페론(4-methylumbelliferone))에 관한 것이다. 또한 참조예: IUPAC. Compendium of Chemical Terminology, 2nd ed. (the "Gold Book"). Compiled by A. D. McNaught and A. Wilkinson. Blackwell Scientific Publications, Oxford (1997). XML on-line corrected version: http://goldbook.iupac.org (2006-) created by M. Nic, J. Jirat, B. Kosata; updates compiled by A. Jenkins. ISBN 0-9678550-9-8. doi: 10.1351/goldbook. Last update: 2014-02-24; version: 2.3.3; doi: 10.1351/goldbook.CO 1369.
용어 "벤조산 유도체"는 벤조산의 유도체, 특히, 하이드록실화된 유도체에 관한 것이다.
바람직한 구체예에서, 본 발명의 효소와 상동인 효소는 상기 a) 또는 b)에 정의된 효소에 적어도 75%, 더욱 바람직하게는 적어도 80% 또는 85%, 가장 바람직하게는, 적어도 90%, 95%, 96%, 97%, 98%, 99%, 99.2% 또는 적어도 99.5% 상동이다.
특히 바람직한 구체예에서, 본 발명의 효소는 SEQ ID NO: 7에 따른 아미노산 서열을 포함하거나 이를 지니거나, SEQ ID NO: 1에 따른 뉴클레오티드 서열을 포함하거나 이를 지니는 핵산에 의해서 인코딩되거나, SEQ ID NO: 7에 따른 아미노산 서열을 포함하거나 이를 지니거나 SEQ ID NO: 1에 따른 뉴클레오티드 서열을 포함하거나 이를 지니는 핵산에 의해서 인코딩되는 효소에 적어도 75%, 더욱 바람직하게는, 적어도 80% 또는 85%, 가장 바람직하게는, 적어도 90%, 95%, 96%, 97%, 98% 또는 적어도 99% 상동인 효소이다.
두 번째 양태로, 본 발명은 또한 첫 번째 양태에 따른 효소의 단편으로서, 상기 효소의 적어도 60, 바람직하게는, 적어도 65, 70, 75, 80, 85, 90, 100, 110 또는 적어도 120 개의 연속 아미노산을 포함하고, 폴리페놀의 글리코실화를 촉매 작용하는 단편에 관한 것이다.
세 번째 양태로, 본 발명은 본 발명의 첫 번째 양태에 따른 효소 또는 본 발명의 두 번째 양태에 따른 단편을 인코딩하는 핵산에 관한 것이다. 바람직하게는 그러한 핵산은,
a) SEQ ID NO: 1-6 또는 이들의 단편에 따른 뉴클레오티드 서열 중 하나를 포함하거나,
b) 상기 a)에 정의된 핵산 중 하나와 상동이거나,
c) 상기 a)에 정의된 핵산에 상보적인 핵산과 엄격한 조건하에 혼성화한다.
본 발명이 핵산의 단편 또는 효소의 단편에 관한 경우에, 그러한 단편은, 핵산의 경우, 폴리페놀의 글리코실화를 촉매 작용하는 펩타이드를 인코딩하거나, 펩타이드의 경우, 폴리페놀의 글리코실화를 촉매 작용함이 이해된다.
핵산 또는 이의 단편은 핵산을 숙주 세포, 예들 들어, 진균, 박테리아 또는 식물 세포 내로 도입하기 위한 수단으로서 벡터, 예컨대, 플라스미드에 혼입될 수 있다. 핵산은 세포에서의 핵산 또는 단편의 발현을 달성시키기 위해서 적합한 프로모터 및/또는 다른 규칙성 서열(들)에 기능적으로 연결될 수 있다. 광범위하게 다양한 적합한 벡터 및 그러한 벡터를 숙주 세포내로 도입하기 위한 방법이 당업자에게는 공지되어 있다.
네 번째 양태로, 본 발명은 폴리페놀, 바람직하게는, 페놀산 유도체, 플라보노이드, 벤조산 유도체, 스틸베노이드, 칼코노이드, 크로몬 및 쿠마린 유도체의 글리코실화를 위한 본 발명의 첫 번째 양태에 따른 효소의 사용 또는 두 번째 양태에 따른 단편의 사용에 관한 것이다.
다섯 번째 양태로, 본 발명은 폴리페놀, 바람직하게는, 플라보노이드, 벤조산 유도체, 스틸베노이드, 칼코노이드, 크로몬 및 쿠마린 유도체의 글리코사이드를 제조하는 방법으로서, 글리코실 공여체를 폴리페놀의 하이드록실기 또는 다른 작용기에 전달하는 것을 발생시키기 위한 효소적 반응에 적합한 조건하에, 폴리페놀 및 글리코실 공여체를 청구항 제 1항 내지 제 3항 중 한 항에 따른 효소 또는 청구항 제 4항에 따른 이의 단편과 반응시키는 단계를 포함하는 방법에 관한 것이다.
효소적 글리코실화 반응에 적합한 조건은 당업자에게는 공지되어 있으며, 또한 하기 실시예 및 본원에 참조된 종래 기술 문헌으로부터 유도될 수 있다.
본 발명이 이제 오로지 예시적인 목적으로 하기 실시예에 의해서 기재된다.
박테리아 균주, 플라스미드 및 화학적 시약
본 연구에서 사용된 박테리아 균주 및 플라스미드가 표 S1에 열거되며, 프라이머가 이하 표 S2에 열거된다.
표 S1: 사용된 박테리아 균주, 벡터 및 구성물(construct)
Figure pct00001
Figure pct00002
Figure pct00003
표 S2: 유전 증폭 및 서열 분석을 위해서 사용된 올리고뉴클레오티드 및 프라이머. 제한 엔도뉴클레아제의 인식 부위가 밑줄로 표시된다(ID = SEQ ID NO:.
Figure pct00004
달리 언급되지 않으면, 대장균(Escherichia coli)은 적절한 항생제로 보충된 LB 배지(1% 트립톤, 0.5% 효모 추출물, 0.5% NaCl) 중의 37℃에서 성장되었다. 실러스 단리물(Bacillus isolate)은 동일한 배지 중의 30℃에서 성장되었다. 모든 사용된 화학적 시약은 분석적 실험실 등급이었다. 폴리페놀 물질은 독일에 있는 다음 회사로부터 구매하였다: Merck KGaA, Darmstadt; Carl Roth GmbH, Karlsruhe; Sigma- Aldrich, Heidelberg and Applichem GmbH, Darmstadt. 추가의 플라보노이드는 Extrasynthese(Lyon, France)로부터 주문하였다. 폴리페놀의 원액을 100mM의 농도로 DMSO 중에 제조하였다.
DNA 및 포스미드 라이브러리 구성물의 분리
균주 바실러스 sp. HH1500을 University of Hamburg의 식물 정원의 토양 샘플로부터 최초로 분리하였다. 바실러스 sp. HH1500으로부터의 DNA를 peqGOLD Bacterial DNA Kit(PEQLAB Biotechnologie GmbH, Erlangen, Germany)를 사용하여 제조자 원안에 따라서 분리하였다. 코끼리 배설물 라이브러리의 구성을 위한 샘플은 Hagenbeck Zoo(Hamburg, Germany)로부터 유도되었다. 이름이 캔디인 건강한 6세의 암컷 아시아 코끼리(Elephas maximus)의 신선한 배설물을 취하고, DNA 추출까지 30%(v/v) 글리세롤을 함유하는 TE 완충액(10 mM TRIS-HCl, 1 mM EDTA, pH 8) 중의 -20℃에서 저장하였다. DNA 추출의 경우에, QIAamp DNA Stool Mini Kit (Qiagen, Hilden, Germany)를 사용하였다. 그러한 키트는 제조자의 원안에 따라서 적용되었다. 권장되는 바와 같이, ASL 완충액에서의 인큐베이션 온도를 95℃로 상승시켰다. Elbe 강 침강물로부터의 DNA의 분리를 썰물 시의 Gluckstadt(Germany) 근처의 Elbe 강의 조수 평탄 구역((53°44'40" N, 009°, 26?4" E))으로부터의 침강 샘플로 수행하였다. Zhou 및 공동 저자(39)에 의해서 공개된 SDS-기반 DNA 추출 방법을 시용하여 환경 DNA를 추출하였다.
플라스미드 pCClFOS를 수확하는 대장균 EPI300 세포에서의 게놈 및 메타게놈 라이브러리의 구성은 이전에 공개(40)된 바와 같은 작은 변형을 이용한 제조자의 원안에 따른 CopyControl™ Fosmid Library Production Kit (Epicentre Biotechnologies, Madison, USA)로 달성되었다. 클론을 12.5 μg/mL의 클로람페니콜과 함께 150 액체 LB 배지를 함유하는 96 웰 미세역가 플레이트내로 전달하고 밤새 성장시켰다. 100μL의 86% 글리세롤을 각각의 미세역가 플레이트에 첨가한 후에 라이브러리를 -70℃에서 저장하였다. 바실러스 sp. HH1500의 게놈 포스미드 라이브러리는 1,920개의 클론을 포함하였다: 전체 35,000개의 클론을 Elbe 강 침강물 라이브러리에 대해서 얻었고, 코끼리 배설물 라이브러리는 전체 20,000개의 클론을 포함하였다. 모든 라이브러리는 35 kb의 평균 인서트 크기(average insert size)를 지니는 포스미드를 함유하였다.
분자 클로닝 전략
pCClFOS 포스미드의 단편을 포스미드 클론 pFOS4B2 및 pF0S144C11의 제한에 따른 HindIII을 사용하는 pBluescript II SK+ 벡터로 서브클로닝시켰다. 생성되는 플라스미드를 각각 pSK4B2 및 pSK144C11로 지정하였다. pSK144C11-유래된 단편의 추가의 서브클로닝을 제한 효소 EcoRI 및 Pstl에 의해서 pTZ19R-Cm에서 달성시켰다. 얻은 클론을 각각 pTZ144E 및 pTZ144P로서 지정하였다. 대장균 DH5α를 열 쇼크에 의해서 플라스미드로 형질전환시키고, 서브클론을 지니는 플라스미드를 밤새 성장시킨 후에 10 μM의 5-브로모-4-클로로-인돌릴-P-D-갈락토피라노사이드(X-Gal) 및 400 μM의 이소프로필-P-D-티오갈락토피라노사이드(IPTG)를 함유한 LB 한천 플레이트상에서 블루 화이트 스크리닝(blue white screening)에 의해서 동정하였다. 다양한 클론을 플라스미드 정제에 이어진 효소적 분해 및 한천 겔 전기영동 및/또는 DNA 서열화에 의해서 분석하였다.
오픈 리딩 프레임(open reading frame: ORF)의 PCR 증폭을 주형으로서 포스미드 DNA로 수행하였다. 반응은 30 사이클로 수행시켰다. mgtB를 증폭시키기 위해서, 프라이머 mgtl-XhoI-for 및 mgtl-XhoI-rev를 사용하여, ORF의 XhoI 엔도뉴클레아제 제한 부위 5' 및 3'를 삽입시켰다(표 S2 참조). gtfC 프라이머의 클로닝을 위해서, gtf-Nde-for 및 gtf-Bam-rev 쌍을 사용하여, ORF의 출발 코돈 5' 및 BamHI 부위 3'를 포함하는 NdeI 부위를 삽입시켰다(표 S2). PCR 단편을 QIAGEN PCR Cloning Kit (Qiagen, Hilden, Germany)를 사용하여 pDrive 내로 결찰시키고, 대장균 DH5α내로 클로닝시켰다. 각각 pOmgtB 및 pOgtfC로 지정된 생성되는 클론을 생체 형질전환에서의 활성에 대해서 그리고 정확한 인서트(insert)에 대한 DNA 서열화에 의해서 분석하였다. 발현 백터 pET19b(Novagen, Darmstadt, Germany)내로의 mgtBgtfC의 결찰은 각각의 ORF의 삽입된 엔도뉴클레아제 제한 부위를 사용하여 달성되었다. 정확한 인서트를 함유하는 플라스미드를 각각 pTl9mgtB 및 pET19gtfC로서 지정하였다. 요망되는 플라스미드를 생성시키는 대장균 DH5α 클론을 각각 mgtB 및 T7 터미네이터 프라이머를 확인하기 위한 T7 터미네이터 프라이머 및 mgtl-XhoI-for 및 gtfC를 입증하기 위한 gtf-Nde-for를 사용한 직접적인 콜로니 PCR에 의해서 검출하였다. 추가로, pET19mgtB 및 pET19gtfC의 인서트를 구성물을 확인하기 위해서 T7 프로모터 및 T7 터미네이터 프라이머(표 S2)를 사용하여 서열화시켰다.
효소의 과생성 및 정제
deca-히스티딘(His10-) 태깅된 단백질의 과생성을 위해서, 대장균 BL21(DE3)을 pET19b 구성물로 형질전환시켰다. 밤샌 예비 배양물을 원심분리에 의해서 수거하고, 1%를 이용하여 발현 배양물을 접종하였다. pET19mgtB를 지니는 세포를 0.7의 OD600까지 22℃에서 성장시켰다. 배양물을 17℃로 옮기고, 100 μM IPTG에 의해서 유도하였다. 16 시간 후에, 배양물을 4℃에서의 7,500 g에서 원심분리에 의해서 수거하였다. 세포를 pH 7.4의 0.3 M NaCl을 함유한 50 mM 인산염 완충 염수(PBS)에 재현탁시키고, 0.5의 사이클 및 75%의 진폭에서의 UP200S(Hielscher, Teltow, Germany)에서 S2 sonotrode에 의해 초음파 분해에 의해서 파괴하였다.
deca-히스티딘-태깅된 GtfC의 과생성이 100의 μM IPTG에 의해서 0.6의 OD600에서의 37℃에서 유도되었다. 이어서 세포를 4 시간 동안 인큐베이션하고, 수거하고, 상기 언급된 바와 같이 MgtB에 대해서 용해시켰다.
미정제 세포 추출물을 15,000g 및 4℃에서 원심분리하여 세포 조각을 침강시켰다. 투명해진 추출물을 AKTAprime plus system (GE Healthcare)을 사용하여 1 mL HisTrap FF Crude 컬럼상에 부하시켰다. 효소를 His-태깅된 단백질의 구배 용리에 대한 제조자 원안에 따라서 정제하였다. 용리된 단백질 용액을 4℃에서 0.3 M NaCl을 함유하는 1,000 용적 50 mM PBS pH 7.4에 대해서 2회 투석하였다. 정제물을 12% SDS-PAGE상에서 분석하였다. 단백질의 농도를 Roti-Quant(Carl Roth GmbH, Karlsruhe, Germany)를 사용한 브래드포드 방법(Bradford method)에 의해서 측정하였다.
생체내 형질전환(biotransformation) 및 생체촉작용
박테리아에서의 플라보노이드 변형의 검출을 위해서, 생체내 형질전환 방법을 이용하였다. 배양물을 적절한 항생제를 지니는 LB 배지에서 밤새 성장시켰다. 발현 배양물을 효소의 과생성을 위해서 상기된 바와 같이 제조하였다. 세포를 4,500 g에서의 원심분리에 의해서 침강시키고, 1% (w/v) α-D-글루코오스가 보충된 50 mM 인산나트륨 완충액 pH7에 재현탁시켰다. DMSO 중의 100mM의 원액, 즉 1% 원액으로부터 접종된 최종 농도의 100 μM 플라보노이드를 30℃ 및 175rpm의 Erlenmeyer 플라스크에서 24 시간까지 인큐베이션하였다. 4 mL의 샘플을 채취하고, 2 mL의 에틸 아세테이트에서의 추출을 위해서 100μL의 1M H3PO4 수용액으로 산성화시켰다. 이들을 1분 동안 진탕시키고, 2,000g 및 4℃에서의 원심분리에 의해서 분리하였다. 상등액을 TLC 분석에 가하였다. 정량화를 위해서 100μL의 샘플을 채취하고, 에틸 아세테이트/아세트산 3:1에 1/10을 용해시켰다. 이들 산성화된 에틸 아세테이트 샘플을 10,000g에서 원심분리하였다. 상등액을 이하 언급된 바와 같이 정량적 TLC 분석을 위해서 사용하였다.
포스미드 클론을 96개의 딥 웰 플레이트(deep well plate)에서 밤새 성장시켰다. 클론을 푸울(pool) 당 96, 48, 8 도는 6개의 클론으로 합류시켰다. 푸울을 4,500 g에서의 원심분리에 의해서 수거하고, 생체내 형질전환을 위해 12.5 μg/mL의 클로람페니콜, CopyControl™ Autoinduction Solution(Epicentre, Madison, WI)(5 mM 아라비노스 최종 농도) 및 100 μM의 플라보노이드를 함유하는 50 mL LB 배지에 재현탁시켰다. 딥 웰 플레이트에 대안적으로, 클론을 한천 플레이트상에서 예비배양하였다. 밤새 인큐베이션한 후에, 50 mM 인산나트륨 완충액 pH 7로 세척된 콜로니를 원심분리에 의해서 수거하고 상기 개괄된 바와 같이 재현탁시켰다. 생체내 형질전환물을 175 rpm에서 진탕시키면서 30℃의 300 mL Erlenmeyer 플라스크에서 인큐베이션하였다. 단일 클론들을 비슷하게 시험하였지만, 5 mL LB에서 예비 배양하고 100 mL 플라스크에서 20 mL의 생체내 형질전환 배지에 재현탁시켰다. 4mL의 샘플을 40μL의 HCl 수용액으로 산성화되고 상기 언급된 바와 같이 TLC 분석을 위해서 제조된 반응물을 16, 24 및 48 시간 후에 채취하였다. 양성 푸울이 두 번째 생체내 형질전환에서 입증되었으며, 이어서, 반응 가능한 단일 클론이 동정될 때까지 체계적으로 크기를 줄여서 상응하는 히트(corresponding hit)를 검출하였다.
1mL의 생체촉매 반응은 5 μg의 정제된 His-태깅된 효소를 함유하였으며, 37℃의 50mM 인산나트륨 완충액 pH 7에서 수행되었다. UDP-α-D-글루코오스 또는 UDP-α-D-칼락토오스를 50 mM 인산나트륨 완충액 pH 7 중의 50mM 원액으로부터 공여체 기질로서 500 μM의 최종 농도로 첨가하였다. 수용체 기질을 100 μM의 농도로 사용하였고, DMSO 중의 100 mM의 원액으로부터 첨가하여 반응 혼합물 중에 0.1%의 최종 함량을 유도하였다. 에틸 아세테이트/아세트산 3:1에 100 μL의 반응 혼합물 1/10을 용해시켜 반응을 중단시켰다. 이들 샘플을 정량적 TLC 분석에 직접적으로 사용하였다.
TLC 분석
HPLC 평탄 바닥 바이알내로 전달된 상등액을 TLC 분석에 사용하였다. 200 pmol의 참조 플라보노이드에 대해서 20 μL의 샘플을 20 x 10 cm2 (HP)TLC 실리카 60 F254 플레이트(Merck KGaA, Darmstadt, Germany)상에 가하였다. 물질의 캐리오버(carryover)를 피하기 위해서, 즉, 거짓 양성을 방지하기 위해서, 샘플을 ATS에 의해서 사이사이에 이중 주사기 세정을 하면서 스폿팅하였다. 샘플 함유된 TLC 플레이트를 에틸 아세테이트/아세트산/포름산/물 100:11:11:27('Universal Pflanzenlaufmittel')(41)에서 전개시켰다. 분리 후에, TLC 플레이트를 80℃ 오븐에서 5분 동안 건조시켰다. 분리된 밴드의 흡광도를 TLC Scanner 3(CAMAG, Muttenz, Switzerland)에서 중수소 램프를 사용하여 285 내지 370 nm에서 적용된 추론 물질의 최대 흡광도에 따라서 농도 측정 방식으로 측정하였다. 후속하여, 전개된 TLC 플레이트 상의 물질을 Chromatogram Immersion Device(CAMAG, Muttenz, Switzerland)를 사용하여 1초 동안 1% (w/v) 디페닐 붕산 β-아미노에틸 에스테르(DPBA)(42)의 메탄올계 용액중에 플레이트를 침지시킨 다음에, TLC 플레이트를 고온 공기 중에서 팬에 의해서 건조시킴으로써 유도체화하였다. 2분 후에, 밴드를 UV 핸드 램프(UV hand lamp)로 365 nm에서 가시화시키고 사진을 찍었다. 대안적으로, 밴드의 형광을 320 내지 370 nm에서 적용된 물질의 최대 흡광도에 따라서 TLC Scanner 3에 의해서 농도 측정 방식으로 측정하였다.
TLC에 의한 플라보노이드의 정량화
생체내 형질전환 및 생체효소 반응에서의 플라보노이드를 정량화하기 위해서, 샘플을 에틸 아세테이트/아세트산 3:1 중에 1/10으로 희석시켜 반응을 중단시켰다. 상이한 양의 각각의 표준 추정 및 생성 물질에 대비해서, 20μL의 샘플을 ATS 4(CAMAG, Muttenz, Switzerland)에 의해서 HPTLC 실리카 60 F254 플레이트(Merck KGaA, Darmstadt, Germany)에 분사하였다. TLC 플레이트를 상기 언급된 바와 같이 전개시키고, 건조시키고, 유도체화시키고, 분석하였다.
회귀 곡선을 적용한 참조 물질의 피크 면적으로부터 계산하여 생성 및 잔류 플라보노이드의 양을 측정하였다.
HPLC-ESI-MS 분석
HPLC를 Rheos 2000 펌프(Flux Instruments, Suisse) 및 0 bar의 최소 및 400bar의 최대 설정 압력 제한이 있는 3 μm의 입자 크기의 Purospher Star RP-18e 125-4 컬럼(Merck, Darmstadt, Germany)상에서 수행하였다. 10μL의 주입 용적을 용매 A, 0.1% TFA로 보충된 물; 및 용매 B, 다음 구배 HPLC 조건중의 0.1% TFA를 함유한 아세토니트릴로 분리하였다: 0분부터, 0.6 mL/min 90% A, 10% B; 14분부터, 0.6 mL/min 75% A, 25% B; 18분부터, 0.6 mL/min 5% A, B=95%; 22분부터, 0.6 mL/min 5% A, 95% B; 22.1분부터, 0.6 mL/min, 90% A, 10% B; 및 28.1분부터, 0.6 mL/min 90% A, 10% B. 용리를 Finnigan Surveyor PDA 검출기로 모니터링하고, 분획을 HTC PAL 오토샘플러(CTC Analytics)에 의해서 수거하였다. 질량 스펙트럼분석(MS)을 양성 이온화에서의 ESI 인터페이스를 지니는 Thermo LCQ Deca XP Plus상에서 수행하였다.
서열 분석 및 유전자은행(GenBank) 엔트리
작은 인서트 플라스미드의 자동화된 DNA 서열화를 제조자 지시에 따른 ABI377 및 염료 터미네이터 화학물질을 사용하여 수행하였다. 큰 포스미드 서열을 454 서열화 기술에 의해서 확립되어었다. 서열은 Gap 4 소프트웨어를 사용함으로써 조합되었다. ORF 찾기는 Clone manager 9 Professional software로 수행되었다. 여기서 언급된 모든 서열이 유전자은행에 기탁되었지만, 우선권 전에 공개되지는 않았다. 바실러스 sp. HH1500 16S rRNA 유전자의 DNA 서열은 GenBank 수탁번호 KC145729을 지닌다. 서브클론 pSK4B2상에서 확인된 바실러스 sp. HH1500으로부터의 포스미드 유래된 유전자는 bspA (JX157885), mgtB (JX157886, SEQ ID NO: 2) 및 bspC (JX157887)이다. Elbe 침강물 메타게놈 유래된 포스미드 서브클론 pSK144C11는 유전자 esmA (JX157626), gtfC (AGH18139, SEQ ID NO: 1), esmB (JX157628), 및 esmC QXl 57629)를 포함하였다.
결과
스크리닝 방법: 플라보노이드-변형 효소 클론의 검출을 위한 TLC-기반 스크리닝 방법의 설정
"천연물질 A". 바실러스 세레우스(B. cereus )바실러스 섭틸리스(B. subtilis)는 플라보노이드의 글리코실화를 매개하는 글리코실트랜스퍼라제에 대해서 인코딩하는 것으로 공지되어 있기 때문에, 출원인의 균주 수집물로부터의 몇 개의 단일 박테리아 분리물을 먼저 이들의 플라보노이드 변형 활성과 관련하여 시험하였다. 야생형 분리물의 전세포를 사용한 생체내 형질전환은 균주들 중 하나에서의 플라보노이드 변형 효소의 존재를 확인시켰다. 이러한 균주는 본래 Hamburg에 있는 식물 가든의 토양 샘플로부터 분리되었으며, 바실러스 sp. HH1500으로 지정되었다. 16S rRNA 유전자(GenBank 엔트리 KC145729)의 서열 분석은 바실러스 세레우스 그룹의 구성원과 100% 동일성을 나타냈다(데이터는 나타내지 않음). 이러한 균주를 양성 대조군으로부터 사용하기 위해서, pCC1F0S내의 이의 게놈 DNA의 포스미드 라이브러리를 구성시켰다. 얻은 라이브러리는 35 kb의 평균 인서트 크기를 지니는 1,920 개의 클론을 함유하였다. 따라서, 라이브러리는 약 67 Mb의 클로닝된 gDNA를 포함하고, 그에 따라서 약 10배의 바실러스 세레우스 그룹 구성원으로부터의 게놈의 평균 크기를 커버한다(43). 추가로, (HP)TLC-기반 검정의 민감성을, TLC 플레이트 상에 10μL의 이소퀘르시트린(isoquercitrin)의 0.78 μM 내지 100 μM의 용액을 분사하고 365nm에서 흡광도를 측정함으로써, 이소퀘르시트린, 퀘르세틴(quercetin)의 3-0-β-D-글루코사이드의 몇 가지 희석액을 사용하여 입증하였다(표 3). 추가로, 10μL의 다른 글리코실화된 플라보노이드를 10μM 농도에서 검정하였고, 흡광도 크로마토그램상의 깨끗한 피크로서 검출될 수 있다(표 3, 및 데이터는 나타내지 않음).
관찰된 민감도를 기반으로 하여, 조직적인 스크리닝 도식이 설계되었다. 먼저, 96개의 포스미드 클론을 37℃의 딥 웰 미세역가 플레이트에서 밤새 성장시켰다. 이어서, 배양물을 푸울링(pooling)하고, 이러한 단계 후에, 세포를 원심분리에 의해서 침강시키고, 수용체 기질로서 적절한 항생제 및 100μM의 퀘르세틴을 함유하는 신선한 LB 배지에 재현탁시켰다. 30℃에서 16, 24 및 48 시간 동안 인큐베이션한 후에, 푸울링된 배양물의 4mL의 샘플을 채취하고, 에틸 아세테이트의 절반 용적으로 추출하였다. 이들 중 추출물 20μL를 TLC 실리카 플레이트에 가하고, 용매로서 "Universal Pflanzenlaufmittel"를 사용하여 분리하였다. 전개된 샘플의 흡광도를 365nm에서 농도 측정 방식으로 측정하였다. 추가로, 기질과 변형된 플라보노이드의 밴드를 메탄올 중의 디페닐붕산-β-아미노에틸에스테르의 1% 용액 및 에탄올 중의 폴리에틸렌글리콜 4000의 5% 용액을 함유하는 "Naturstoffreagenz A"(42)(Carl Roth GmbH, Karlsruhe, Germany)로 염색시킴으로써 가시화시켰다. 우리쪽에서는, 검정의 민감성이 96개의 클론의 혼합물 중에서 단일의 플라보노이드 변형 효소 클론을 검출하기에 매우 충분했다. 양성 신호의 검출 후에, 96개의 포스미드 클론을 48개의 푸울로 분할하여 생성되는 두 개의 절반 미세역가 플레이트 중 하나에 동일한 피크가 자리하게 하였다. 이러한 절차 후에, 48개의 클론을 6 x 8 클론으로 분할하고, 마지막으로 8개의 개별적인 클론을 분석하였다. 이러한 전략은, 전체적으로, 1,920 개의 클론을 지니는 모든 20개의 미세역가 플레이트를 시험하는 바실러스 sp. HH1500 포스미드 라이브러리에서 6개의 중첩 양성 클론을 확인하도록 성공적으로 가해졌다.
이들 6개의 포스미드 클론중에, 약 46kb의 하나의 클론 pFOS4B2를 pBluescript II SK+ 벡터의 HindIII 제한 부위를 사용하여 서브클로닝시켰다. 얻은 서브클론을 상기-언급된 TLC 스크리닝 기술을 이용하여 분석하였다. 그에 따라서, 양성 서브클론 지정된 pSK4B2를 동정하였고 완전히 서열화하였다(GenBank 엔트리 JX157885 - JX157887). 서브클론 pSK4B2는 3,225 bp의 인서트를 지녔으며 402 aa 단백질을 인코딩하는 mgtB로 지정된 유전자를 인코딩하였다. 동정된 ORF를 서브클로닝시켜 플라스미드 pDmgtB를 생성시키고 다시 활성에 대해서 검정하였다. TLC 분석은 또한 이러한 구성물에서의 MgtB 효소의 글리코실화 활성을 명확하게 확인시켰다. MgtB의 추정 아미노산 서열(SEQ ID NO: 8)은 예상된 바실러스 튜링겐시스 마크로사이드 글리코실트랜스퍼라제(B. thuringiensis macroside glycosyltransferase)와 매우 유사하였다(표 1).
표 1: 활성 바실러스 sp. HH1500 포스미드 클론로부터 유래된 서브클론 pSK4B2 및 Elbe 강 침강물 활성 포스미드 클론으로부터 유래된 pSK144C11에 대해서 동정된 오픈 리딩 프레임(ORF).
Figure pct00005
Figure pct00006
플라스미드 pSK4B2 중의 mgtiB-둘러싸인 DNA 서열은 바실러스 튜링겐시스로부터의 유전자와 일관되게 거의 동일한 두 개의 트렁케이션된 유전자를 나타낸다(표 1). 이러한 계통발생 관계는 바실러스 sp. HH1500의 16S rRNA 유전자의 예비 서열 분석에 따랐다.
이들 시험은 스크리닝 과정이 큰 인서트 메타게놈 라이브러리의 기능적 스크리닝에 적합하였음을 제시하였다. 메타게놈의 기능-기반 스크리닝을 위해서, 방법은 META: 메타게놈 추출 TLC 분석(Metagenome Extract TLC Analysis)으로 일컬어졌다. 비록, 완전히 자동화된 고-출력 스크리닝(high-throughput screening: HTS) 기술은 아니지만, META는 예비 배양, 생체내 형질전환 및 분석을 위한 48 시간 내의 TLC 플레이트 당 약 1,200개의 클론의 스크리닝을 가능하게 한다. 이러한 수의 클론은 스크리닝이 한 사람에 의해서 수행되는 경우에 실현 가능한 듯했다. 일반적으로, ATS 4에 의한 시간 약 1개의 당 TLC 플레이트의 샘플링은 방법의 시간 제한 단계이다. 그러나, 본 발명은 여전히 하루에 여러 개의 플레이트의 푸울링된 스크리닝을 가능하게 하고, 그에 따라서, META에 의한 하루에 수천 클론의 출력을 가능하게 한다.
메타게놈 라이브러리로부터의 신규한 글리코실트랜스퍼라제의 동정
메타게놈 라이브러리내의 효소 발견을 위한 스크리닝을 추가로 적용하기 위해서, 출원인의 실험실에서 구성된 두 개의 포스미드 라이브러리를 시험하였다. 하나의 라이브러리는 Elbe 강 침강물로부터 분리된 DNA로부터 구성되고, 다른 것은 신선한 코끼리 배설물로부터 분리된 DNA로부터 구성되었다. 두 라이브러리 모두가 35 kb의 평균 인서트 크기를 지니는 약 50,000개의 클론을 포함하였다. 둘 모두의 라이브러리를 기질로서의 퀘르세틴을 사용하여 스크리닝하였다. 기재된 전략을 사용하여, Elbe 강-침강물-라이브러리에서의 하나의 양성 미세역가 플레이트 푸울이 발견되었다. 이러한 푸울의 추가 스크리닝은 pF0S144C11으로 지정된 단일의 양성 포스미드 클론의 동정을 생성시켰다. 48개의 클론 푸울에 의한 퀘르세틴(Q)의 생체내 형질전환은 퀘르시트린, 퀘르세틴-3-0-β-L-람노사이드의 Rf 값에 비견되는 Rf 값을 지니는 TLC 분리에 의한 하나의 생성물 피크(P2)를 나타냈다. 이용 가능한 참조 퀘르세틴 글리콘보다 더 높은 Rf 값을 지니는 두 번째 피크(P3)가 각각 6-클론-푸울 및 단일의 포스미드 클론에 의한 전환에서 관찰되었다. 클론 pF0S144C11는 약 40 kb의 포스미드를 지녔다. HindIII를 지닌 pBluescript II SK+로의 후속 제한 단편 서브클로닝은 양성 대장균 DH5α 서브클론 pSK144C11의 동정을 생성시켰다. 그러나, pSK144C11를 지니는 생체내 형질전환은 두 개의 생성물 피크, 즉, 퀘르시트린의 Rf 값과 비견되는 Rf 값을 지니는 하나의 주된 피크(P2) 및 이소퀘르시트린과 유산한 하나의 마이너 피크(P1)를 나타냈다. 서브클론 pSK144C11은 여전히 약 8.5 kb의 인서트를 지녔다. pSK144C11의 추가의 서열화 및 서브클로닝은 마지막으로 gtfC로 지정된 변형에 추정적으로 원인이 되는 유전자를 동정시켰다. 상응하는 효소의 추정된 459개의 아미노산 서열(SEQ ID NO: 7 참조)은 UDP-글루쿠로노실/UDP-글루코실트랜스퍼라제에 대한 모티프 유사성(motif similarity)을 나타냈다. GtfC (SEQ ID NO: 7)은 단백질의 92%를 커버하는 그램-음성 박테리움 Fibrisoma limi의 추정성 글리코실트랜스퍼라제에 71%의 유사성을 나타냈다(표 1). pDrive 벡터로의 gtfC ORF의 추가의 클로닝 및 각각의 구성 pOgtfC를 지니는 대장균 DH5α에 의한 생체내 형질전환은 GtfC의 플라보노이드-변형 활성을 확인시켰다.
요약하면, 이들 결과는 개발된 스크리닝 절차 META가 플라보노이드-변형 활성를 나타내는 개별적인 박테리아 게놈(즉, 바실러스 sp. HH1500) 및 복잡한 메타게놈 라이브러리(즉, Elbe 강 침강물 라이브러리)로부터의 큰 인서트 클론의 동정을 가능하게 하기에 충분히 민감함을 입증하였다.
MgtB 및 GtfC의 서열 기반 분류
MgtB 및 GtfC의 소속을 분석하기 위해서, MEGA version 5 소프트웨어(44)를 사용한 계통 발생적 트리(phylogenetic tree)를 계산하였다. MgtB (SEQ ID NO: 8) 및 GtfC (SEQ ID NO: 7)의 아미노산(aa) 서열 및 pBlast에 의해서 측정된 이들의 가장 가까운 서열-기반 친족(sequence-based relatives)을 ClustalW에 의해서 정렬하였다. 추가로, 능동적으로 공개된 원핵생물 플라보노이드 활성 GT들의 서열들을 정렬시키고, 마지막으로, 외부 그룹으로서, 두 개의 원핵생물 효소, 메디카고 트렁 카툴라(Medicago truncatula )로부터의 플라보노이드 글루코실트랜스퍼라제 UGT85H2 및 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터의 플라보노이드 람노실트랜스퍼라제 UGT78D1가 정렬되었다(45-46, 53). 따라서, 100 부트스트랩(bootstrap)을 지니는 이웃-연결 트리가 계산되었다. 예상되는 바와 같이, 바실러스 sp. HH1500로부터의 MgtB는 바실러스 세레우스 그룹으로부터의 다른 MGT와 함께 클러스터를 이룬다. 현재로는, 바실러스 튜링겐시스 (B. thuringiensis ) IBL 200의 MGT와 바실러스 세레우스 G9842의 MGT는 각각 98%의 MgtB에 대한 aa 동일성을 지니는 가장 가까운 친족인 것으로 밝혀졌다. 둘 모두의 MGT는 예상된 효소로서의 주석이 달렸으며, 기질 데이터는 이용 가능하지 않다. MGT 클러스터(MGT cluster)로부터, 다섯 개의 다른 효소가 이미 플라보노이드의 글루코실화를 매개하는 것으로 보고되엇다. 이들 중 셋, 즉, 플라보노이드 활성인 것으로 보고된 가장 가까운 친족인 BcGT-1, BcGT-4, 및 BcGT-3는 모두 바실러스 세레우스 ATCC10987로부터 기원되었다(47-49). BsGT-3으로 지정된 또 다른 플라보노이드 활성 MGT는 바실러스 섭틸리스 168로부터 기원한다(36). 나머지 플라보노이드 활성 MGT는 잘 연구된 스트렙토마이세스 안티바이오티쿠스 ( Streptomyces antibioticus )로부터의 OleD이다(50, 51). GtfC는 UGT의 독특한 클러스터에 자리하였으며, 디아도박터 퍼멘탄 스(Dyadobacter fermentans )피브리소마 리미(Fibrisoma limi)로서의 사이토파가세아이 (Cytophagaceae) 박테리아로부터의 가설적 효소와 다소 관련되는 듯하였다. 이러한 클러스터 내에서, 단지 UGT XcGT-2가 플라보노이드 기질을 수용하는 것으로 공지되어 있다(38). 흥미롭게도, 박테로이드스 sp. 116(Bacteroides sp. 116)으로부터의 BSIG 4748 및 마이코박테리움 아비눔(Mycobacterium avium)으로부터의 RtfA와 같은 람노실트랜스퍼라제가 계통 발생적으로 또한 별도의 브랜치를 형성하지만 이러한 클러스터에 계열임을 나타낸다.
동정된 메타게놈-유래된 GT를 추가로 특성화하기 위해서, C-말단 공여체 결합 영역의 aa 잔기를 가장 가까운 친족의 모티프 및 공지된 플라보노이드 활성 GT와 비교하였다. 여기서, 로스만 폴드 α/β/α 서브도메인, 즉, UGT의 보존된 공여체-결합 영역이 자리된다(52). UGT85H2 및 UGT78D1와 같은 식물 UDP-글리코실트랜스퍼라제는 PSPG(식물 이차 생성물 글리코실트랜스퍼라제: Plant Secondary Product Glycosyltransferase) 모티프로 명명되는 이러한 영역에서의 고도로 보존된 모티프를 나타낸다(45, 53-54). 정렬에 의해서 NDP-당 결합에 중요한 것으로 공지된 주요 aa가 동정될 수 있다. MgtB는 보존된 DQ 및 리보오스 결합을 위한 고도로 보존된 Gln289 및 Glu310 잔기로 이루어진 명확한 UDP-헥소오스 결합 모티프를 나타낸 반면에, GtfC는 이러한 모티프가 결여되었다(45, 55, 56). 그 대신에, GtfC는 데옥시 리보오스 뉴클레오타이드 이용을 위한 전형적인 잔기 Phe336 및 Leu357를 나타냈다. 게다가, MgtB aa 서열에서의 피로인산 결합 부위가 동정될 수 있다. 그러나, GtfC는 이들의 보존된 포스페이트 결합 잔기를 지니지 않아서 GtfC 및 관련된 효소가 또 다른 공여체 결합 방식을 지님을 제시한다. 이러한 문맥에서, GtfC는 낮은 수준의 서열 상동성을 암시하는 신규한 효소 부류에 속하는 듯했다.
MgtB 및 GtfC의 과발현 및 글리코실화 패턴
신규한 효소를 추가로 특성화하고 이들의 기능을 확인하기 위해서, MgtB 및 GtfC를 과발현신키고, 대장균 BL21(DE3) 중의 His-태깅된 단백질로서 정제하였다. 둘 모두의 유전자 mgtBgtfC를 발현 벡터 pET19b내로 결찰시켰다. N-말단 His10-tags를 함유하는 재조합 효소를 본래의 조건 및 구배 용리에서의 Ni-친화성 크로마토그래피에 의해서 정제하였다. MgtB를 5 mg/g 초과의 세포 펠릿(습윤 중량)으로 정제될 수 있다. GtfC의 최대 수율은 3 mg/g의 세포 펠릿이었다. 단백질의 분자 질량을 Laemmli에 따른 변성 조건에서의 SDS-PAGE 분석에 의해서 확인하였다. 코마시-염색(Coomassie-staining) 후에, His10-MgtB는 12% SDS-PAGE상에서 약 50 kDa의 MW의 단일 밴드로서 가시적이었다. 이는 N-말단 His-tag를 포함하는 51.2 kDa의 계산된 분자량(MW)에 따른다. His10-GtfC는 N-말단 His-tag를 포함하는 54.7 kDa의 계산된 MW에 또한 따른 12% SDS-PAGE 상의 약 55 kDa의 MW를 나타냈다. 정제된 재조합 MgtB 단백질에 의한 SDS-PAGE상에서 가시적인 추가의 밴드가 없는 반면에, 일부 소량의 오염 밴드가 여전히 정제된 GtfC로 부하된 SDS-PAGE 상에서 가시적이었다. 요약하면, 둘 모두의 단백질이 추가의 생화학적 특성화를 가능하게 하도록 정제될 수 있다.
정제된 His10-MgtB 단백질은 공여제 기질로서 UDP-α-D-글루코오스를 사용할 수 있다. 재조합 효소는 다양한 폴리페놀로의 α-D-글루코오스 잔기의 이전을 촉매 작용하였다. 생체촉매 반응을 공여체로서의 500 μM UDP-α-D-글루코오스 및 100 μM의 수용체 기질로 수행하였다. 하기 플라보노이드가 수용체 기질로서 작용하였으며 높은 수율로 변형되었다: 루테올린, 퀘르세틴, 캠프페롤(kaempferol),틸리로사이드(tiliroside), 나린게닌(naringenin), 게니스테인(genistein)(TABLE 2).
표 2: 생검정에 의해서 재조합 MgtB에 의해서 전환된 플라보노이드 기질. 1mL의 반응을 500 μM UDP-글루코오소, 100 μM의 각각의 플라보노이드 및 5 μg/mL의 정제된 및 재조합 MgtB와 함께 삼중으로 37℃에서 2 시간 동안 수행하였다.
Figure pct00007
Figure pct00008
a 진한 색의 Rf 값 및 생성물은 생체촉매 반응의 주된 생성물을 나타낸다.
b "-"에 의해서 부호가 붙은 생성물은 이용 가능하지 않은 참조 물질로 인해서 특정화되지 않았다.
그에 따라서, 플라보놀은 최상의 수용체 분자인 것으로 밝혀졌다. 일반적으로, 2 시간 검정 동안의 전환은 나린게닌의 경우에 52% 범위였으며, 퀘르세틴 및 캠프페롤의 경우에 약 100%였다. 흥미롭게도, 퀘르세틴 및 캠프페롤의 존재하에 잔류 유리체가 HPTLC 분석에 의해서 모니터링되지 않을 수 있다. 생체촉매 반응의 특정의 유리체 및 이들의 관찰된 글리콘이 각각의 Rf 값과 함께 표 2에 요약되어 있다. 어글리콘 플라보놀 퀘르세틴(aglycone flavonols quercetin) 및 캠프페롤에서와 같이 접근 가능하다면 MgtB는 C3 하이드록시기에서의 글루코실화를 선호하였다. 추가로, C7-OH가 플라본 쿠테올린뿐만 아니라, 플라바논 나린게닌 및 이소플라본 게니스테인에 대해서 나타낼 수 있는 효소에 의해서 공격을 받고 글루코실화되었다(표 2). C7-OH가 미리 글루코실화되었다면, MgtB는 루테올린을 C3' 하이드록시기에서 또한 글루코실화시켜 루테올린의 3',7-디-O-글루코사이드를 형성시켰다. MgtB는 또한 캠프페롤 유도체 틸리로사이드, 즉, 캠프페롤-3-0-6"-쿠마로일-글루코사이드(kaempferol-3-0-6"-coumaroyl-glucoside)의 전환을 촉매 작용하였다. 0.54의 Rf 값을 지니는 하나의 글루코실화된 생성물이 검출되었다. 칼콘 잔토휴몰(chalcone xanthohumol) 및 스틸벤 t-레스베라트롤(stilbene t-resveratrol)이 생체내 형질전환 반응에서 대장균 발현 mgtB로 시험되었지만, 전환은 정량화되지 않았다(데이터 나타내지 않음). 잔토휴몰은 3개의 검출 가능한 생성물을 생성시키는 반면에, t-레스베라트롤의 생체내 형질전환은 흡광도에 의한 하나의 관찰된 생성물을 생성시켰다.
TLC 분석
수용체 분자로서의 퀘르세틴 및 UDP-α-D-글루코오스 및 UDP-α-D-갈락토오스를 사용한 재조합 및 정제된 GtfC에 의한 시험은 dTDP-활성화된 당 모이어티가 이러한 효소에 의해서 전달됨을 제시하였다. 이러한 발견은 생체내 형질전환의 HPLC-ESI-MS 분석에 의해서 확인되었다(다음 문단 참조). 불행하게도, 데옥시-리보오스 뉴클레오타이드 활성화된 헥소오스, 예를 들어, dTDP-람노사이드는 얻은 반응 생성물을 더욱 상세히 추가로 분석하기 위해서 상업적으로 이용 가능하지 않았다(58).
기질로서 다양한 폴리페놀을 사용한, GtfC를 발현하는 대장균 균주에 의한 생체내 형질전환은 잔토휴몰의 경우의 52%로부터 시험된 대부분의 플라보놀의 경우의 거의 100% 전환에 이르는 범위의 전환을 생성시켰다(표 3).
표 3: 플라보노이드 기질 및 재조합 GtfC에 의한 생체내 형질전환 검정의 생성물. 반응의 정량화는 본원에 기재된 바와 같이 수행되었다. 50mL의 삼중의 반응을 1% (w/v) 글루코오스 및 200 μM의 플라보노이드를 함유하는 50 mM 인산나트륨 완충액(PB) pH 7.0으로 30℃에서 수행하였다.
Figure pct00009
Figure pct00010
a 진한 색의 Rf 값 및 생성물은 생체내 형질전환 반응의 주된 생성물을 나타낸다.
b "-"에 의해서 부호가 붙은 생성물은 이용 가능하지 않은 참조 물질로 인해서 특정화되지 않았다.
퀘르세틴은 4 시간 생체내 형질전환 후에 거의 완전히 형질전환되었고, 세 가지의 검출 가능한 생성물(P1-P3)을 생성시켰다. 세 가지의 생성물을 추가로 특성화하기 위해서, UV 흡광도 스펙트럼을 기록하였으며, 퀘르세틴 이소퀘르시트린 및 퀘르시트린(59)의 참조 글리콘과 비교하였다. P1은 이소퀘르세트린의 값과 동일한 Rf 값을 나타냈다. 추가로, P1의 UV 흡광도 스펙트럼은 이소퀘르시트린의 스펙트럼과 매칭되었다. P2는 퀘르시트린에 대해 공지된 것과 동일한 Rf 값을 나타냈다. P2는 또한 퀘르시트린과 동일한 UV 흡광도 스펙트럼을 나타냈다. P3은 공지된 및 이용 가능한 퀘르세틴 글리콘의 Rf 값과 명확하게 상이한 0.82의 Rf 값을 나타냈다. 이소퀘르시트린에 비해서, P3은 λ최대 363 nm과 유사한 밴드 I의 청색 이동(hypsochromic shift)을 나타냈지만; 이는 280 nm에서의 쇼울더(shoulder)와 함께 단지 5 nm 내지 272nm의 밴드 II에서의 더 적은 청색 이동을 나타냈다. 퀘르세틴의 생체내 형질전환 생성물의 HPLC-ESI-MS 분석이 일관되게 세 가지의 독특한 반응 생성물을 동정했음이 추가로 주목할만하다. P1은 HPLC 분석에서 17.93분의 RT를 지녔으며, 이소퀘르시트린과 동등한 464u의 분자 질량을 나타냈다. P2는 18.06분의 RT를 나타냈으며, 448u의 분자 질량을 지녔다. 이러한 질량은 퀘르시트린의 분자 질량과 잘 상응한다. 마지막으로, 18.31분의 RT를 지니는 P3은 446u의 분자 질량을 나타내어 신규한 추가로 특성화되지 않은 퀘르세틴 글리코사이드의 형성을 나타냈다.
퀘르세틴에 대한 GtfC의 글리코실화 패턴은 상이한 당 잔기의 이전을 매개하는 C3 하이드록시기에 작용하는 것을 선호함을 제시하였다. 그러나, C3 OH-기가 이용 가능하지 않으면, GtfC는 다른 위치의 글리코실화를 효율적으로 촉매 작용하였다. C3의 하이드록시 작용기가 결여된 플라본은 다른 하이드록시기의 이용성에 따라서 전환되었다. 단지 하나의 자유 C7-하이드록시기를 지니는 프라톨(pratol)은 약하게 전환되었으며, 단일의 검출 가능한 생성물을 생성시켰다. 추가로, 3',4'-디하이드록시플라본의 생체내 형질전환은 세 가지의 검출 가능한 글리콘을 생성시켰으며, 5-메톡시-큐파토린(5-methoxy-cupatorin)은 두 가지의 생성물을 생성시켰고(데이터 나타내지 않음); 모노 4'-하이드록시 플라바논은 한 가지의 글리코실화된 생성물을 생성시켰고, 나릴게닌의 글리코실화는 두 가지의 생성물을 생성시켰다. 나린게닌의 주된 생체내 형질전환 생성물은 프루닌(prunin), 즉 나린게닌-7-O-글루코사이드와 동일한 Rf 값 및 흡광도 스펙트럼을 나타냈다(표 3). 두 번째 나린게닌 글리콘은 상업적으로 이용 가능한 참조 물질의 결여로 인해서 추가로 특정화될 수 없다. 이들 결과 모두는 GtfC가 플라보노이드 골격의 C3, C3', C4' 및 C7 하이드록시기에 작용함을 제시하였다.
요약하면, 이들 데이터는 MgtB 및 GtfC가 흥미로운 생체촉매 성질을 지님을 입증하였다. MgtB는 특별히 글루콘 잔기의 이전을 매개하는 반면에, GtfC는 다른 헥소오스 모이어티를 이전시켰다. MgtB는 이미 글리코실화된 플라보노이드의 글루코실화를 촉매 작용하여 디-글리코사이드를 형성시킬 수 있고(예, 루테올린-3',7-디-0-글루코사이드의 형성), 또한 틸리로사이트(tiliroside)의 글루코실화를 촉매작용하여 천연 공급원으로부터 이용 가능하지 않은 신규한 글루코사이드를 생성시켰다. 반면에, GtfC의 글리코실화 패턴은 단지 어글리콘 플라보노이드 형태로의 단일의 당 잔기의 이전을 제시했다. 흥미롭게도, GtfC는 플라보노이드 골격 상의 다양한 위치에서의 이의 활성에 매우 다양한 관련이 있는 듯했다. 이는 자연적으로는 이용 가능하지 않은 진정으로 신규한 플라보노이드의 형성을 유도할 수 있다. 따라서, 효소 둘 모두는 새로운 천연 화합물의 생성에 유용할 수 있다.
신규한 스크리닝 기술을 이용하여, 토양 분리물(즉, 바실러스 sp. HH1500)로부터의 마크로사이드 글리코실트랜스퍼라제 MgtB가 동정되었다. 지방 식물 정원으로부터 분리된 이러한 균주로부터의 DNA에 의해서 확립된 포스미드 라이브러리가 단지 최근에 처음으로 상기 개괄된 스크리닝 기술을 개발하고 입증하기 위해서 사용되었으며; 신규한 스크리닝 기술을 이용하여, MgtB가 거의 2,000개의 클론의 푸울로부터 신속하게 동정되었다. 재조합 MgtB의 분리 및 정제는 신규한 MGT를 나타냈다. MgtB는 플라보노이드에 작용하는 것으로 공개된 가장 가까운 친족인 바실러 스 세레우스 ATCC 10987로부터의 BcGT-1과 89% aa 동일성을 공유했다. BcGT-1은 플라본, 플라보놀, 플라바논 및 이소플라본의 글루코실화를 촉매 작용하는 것으로 보고되었다(47). 플라보놀에 대해서 BcGT-1은 C3-, C7- 및 C4'-하이드록시기에 작용하여 캠프페롤의 트리글루코사이드를 생성시켰다(48). 반면에, MgtB에 의한 캠프페롤의 생체촉매작용은 단지 두 가지의 검출 가능한 글루코실화된 생성물을 생성시켰다. 대신에 퀘르세틴에 의한 반응은 세 가지의 검출 가능한 글리콘을 생성시켰다. 이들 데이터는 MgtB가 C3' OH-기에 작용함을 제시했다. 이러한 가설은 또한 재조합 MgtB가 루테올린을 부산물로서의 루테올린-3',7-디-0-글루코사이드로 전환시킨 관찰에 의해서 지지되었다. 이들 결과는 바실러스 세레우스 ATCC 10987로부터의 또 다른 MGT의 BcGT-3의 글루코실화 패턴과 일치하였다(49). 흥미롭게도, BcGT-3은 MgtB와 단지 40% aa 동일성을 공유하지만, 둘 모두의 효소는 동일한 플라보노이드에 작용하여 동일한 위치에서 플라본 및 플라보놀로부터 디-글루코사이드 및 나린게닌으로부터 단지 모노-글루코사이드를 형성시킨다. MgtB에 대해서 관찰된 가장 두드러진 전환은 틸리로사이드의 전환이었다. 생성물은 MgtB의 글리코실화 패턴을 고려하면 7-O-글루코사이드인 듯하다. 틸리로사이드 글리코사이드는 과학 문헌에서 아직 보고되지 않았다. 이는 새로운 천연 화합물의 생성의 가능성을 불러일으킨다. 바실러스 MGT의 천연 기질은 아직 보고되지 않았다. OleD와 같은 다른 MGT는 일반적으로 마크로사이드 항생제를 해독시키지만, 흔히 광범위한 수용체 관용성을 지닌다(35, 60).
메타게놈-유래된 GtfC는 완전히 신규한 효소인 것으로 밝혀졌다. 5가지의 상이한 원핵생물로부터 기원된 단지 7 가지의 플라보노이드-활성 UGT가 지금까지 보고되었다(35, 36, 38, 47, 49). 그램-음성 X. 캄페스트리스 (X. campestris) ATCC 33913로부터의 XcGT-2외에, 모든 나머지는 그램-양성 바실러스스트렘토마이세 로부터의 MGT 효소이다. MGT는 원핵생물의 생체이물 방어 기전에서 중요한 역할을 하며, 그에 따라서, 광범위한 수용체 특이성을 나타낸다(55, 60). 이는 또한 진핵세포 UGT에 적용되어 해독의 생물학적 원리를 가리킨다((61). 우리의 지식에 의하면, GtfC는 플라보노이드에 작용하는 첫 번째 메타게놈-유래된 GT이다. 게다가, Gtfs와 같은 일반적으로 엄격한 공여체 특수성과는 상반되게 다양한 dTDP 활성화된 헥소오스 당을 폴리페놀에 전달(이하 참조)하는 것으로 보고된 첫 번째 박테리아 효소이다(57). 원핵생물에서의 많은 NDP-당이 dTDP이며 활성화된 UDP가 아니라는 의견과 관련하여, GtfC는 글리코전환 방법에서 유망한 생체촉매일 수 있다(58, 62, 63). GtfC는 사이토파가세이 박테리아로부터의 예상된 GT와 유사하다(64-66). 이들 그램-음성 박테리아는 광범위한 이차 대차 경로를 제시하는 큰 게놈을 지니며, 이들은 트리메토프림 및 반코마이신으로서의 항생제에 대한 내성 기전의 존재에 대해서 잘 공지되어 있다67, 68). 일반적으로 알려진 바와 같이, 생체이물의 글리코실화는 모든 생명의 영역에서의 여기저기에 있는 해독 과정이다. 사이토파가세이의 계통 발생적으로 다양한 구성원은 단지 최근에 연구의 대상이 되었고, 이러한 부류의 계통 발생적 광역성에 대한 확고한 평가와 정확한 분류 등급은 여전히 불명확하다(65, 69). 따라서, 메타게놈-유래된 GtfC의 동정 및 이의 부분적 특성화는 이러한 미생물 군이 아마도 신규 GT 및 또한 다른 효소에 대한 매우 유망한 자원임을 제시한다.
GtfC의 공여체-결합 영역의 ClustalW 정렬은 활성화된 공여체 기질이 데옥시-티미딘 뉴클레오사이드 유래의 것임을 제시했다. GtfC는 데옥시-리보오스 피팅(deoxy-ribose fitting)을 위한 소수성 Leu357 및 티미딘 염기 스태킹(thymine base stacking)을 위한 전형적인 aa 잔기 Phe336를 지닌다. GT의 공여체 결합을 고려하면, GtfC는 피로인산염 결합을 위한 공지된 aa 잔기를 나타내지 않는 듯하다. 현재까지 해석된 단백질 구조에서의 보존된 잔기 His/Arg 대신에, GtfC가 aa 위치 349에서 Asn을 함유한다(52, 70). 이는 또한 가장 가까운 GtfC 친족 Dferl940, F. 리미(F. limi) BUZ 3의 UGT 및 Slin3970 뿐만 아니라, NGTs RebG 및 BSIG4748에 적용된다. 추가로, GtfC는 α-인산염 결합에 원인인 보존된 Ser/Thr 잔기를 나타내지 않는다. 그 대신에, Gly354가 OleD 트랜스페라제와 유사한 α-인산염 결합에 중요한 듯하다(55).
GtfC에 의해서 사용된 dTDP 활성화된 공동-기질의 추정은 446의 분자량을 지니는 글루코오스, 람노오스 및 세 번째 당 잔기가 온전한 대장균 세포를 사용한 생체내 형질전환에서 GtfC에 의해서 전달되었다는 관찰에 의해서 지지되었다. 그 외에, 정제된 GtfC 및 공여체 기질로서의 UDP-α-D-글루코오스 또는 -갈락토오스 중 하나에 의한 생체촉매 방법은 실패했다. 박테리아에서, 활성화된 당, dTDP-α-D-글루코오스, -4-케토-6-데옥시-α-글루코오스 또는 -4-케토-P-L-람노오스 및 -β-L-람노오스는 dTDP-당 생합성 경로의 일부이며, 대장균에 존재한다((71). 게다가, dTDP-당의 수준은 RmlA의 활성을 통한 dTDP-람노오스 수준에 의해서 알로스테릭하게(allosterically) 조절된다(72).
4 가지의 추가의 글리코실트랜스퍼라제가 동정되었으로 MgtT, MgtC, MgtS 및 MgtW로 지정되었다.
MgtT:
397 aa (SEQ ID NO: 11), 유전자 1194 bp (SEQ ID NO: 5), 바실러스 sp. BCHH1500으로부터;
바실러스 세레우스 B4264(YP002367512)로부터의 MGT와 99% aa 동일성
예를 들어, 4-메틸움벨리페론(Methylumbelliferone)(4-MU, 7-하이드록시-4-메틸쿠마린), 플로레틴(phloretin), 호모에리오디티올(homoeriodytiol), 나린게닌 등에 대해서 나타난 대장균 DH5α pDrive: :mgtT에 의한 생체내 형질전환(전세포 촉매)에서의 반응
MgtC:
402 aa (SEQ ID NO: 9), 유전자 1209 bp (SEQ ID NO: 3), 바실러스 sp. BCG+1로부터;
바실러스 세레우스 ATCC10987 (NP978481)과의 95% aa 동일성
아피게닌(apigenin), 루테올린; 퀘르세틴, 나린게닌, 호모에리디티올, 플로레틴, 노류게닌(noreugenin), 등에 대해서 나타낸 대장균 DH5α pDrive: :mgtC에 의한 생체내 형질전환(전세포 촉매)에서의 반응
예시적인 반응 도식:
UDP-α-D-글루코오스 + 플라보노이드 -> 플라보노이드-P-D-글루코사이드 + UDP
MgtS:
392 aa (SEQ ID NO: 10), 유전자 1179 bp (SEQ ID NO: 4), 바실러스 섭틸리스 BSHH14로부터
MGT YjiC aus 바실러스 섭틸리스(YP007533161)와 99% aa 동일성
플로레틴, 호모에리오디티올, 나린게닌, 아피게닌, 루테올린; 퀘르세틴, 4-메틸움벨리페론, 노류게닌 등에 대해 나타난효소에 의한 생체촉매작용 및 대장균 BL21(DE3) pEI 19b ::mgtS에 의한 생체내 형질전환(전세포 촉매)에서의 반응
예시적인 반응 도식:
UDP-α-D-글루코오스 + 폴리페놀 -> 폴리페놀-P-D-글루코사이드 + UDP
MgtW:
402 aa (SEQ ID NO: 12), 유전자 1209 bp (SEQ ID NO:6), 바실러스 sp. BCHH03로부터
바실러스 웨이헨스테파네시스(B. weihenstephanensis ) KBAB4 (YP001644794)로부터의 MGT와 99% aa 동일성
퀘르세틴, 플로레틴, 호모에리오디티올 등에 대해서 나타난 대장균 DH5α pDrive: :mgtW에 의한 생체내 형질전환(전세포 촉매)에서의 반응
예시적인 반응 도식:
UDP-α-D-글루코오스 + 퀘르세틴 -> 퀘르세틴 3-0-P-D-글루코사이드 + UDP
서열의 개관(aa = 아미노산의 수, bp = 염기쌍의 수, PRT = 단백질, nt = 뉴클레오타이드의 수):
Figure pct00011
Figure pct00012
참고 문헌
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
SEQUENCE LISTING <110> Universit채t Hamburg <120> Enzymes catalyzing the glycosylation of polyphenols <130> PAT 1455 PCT <150> EP13169812.8 <151> 2013-05-29 <160> 22 <170> BiSSAP 1.3 <210> 1 <211> 1380 <212> DNA <213> Unknown <220> <223> gtfC gene <220> <221> CDS <222> 1..1380 <223> /transl_table=1 <400> 1 atg agt aat tta ttt tct tca caa acg aac ctt gca tct gta aaa ccc 48 Met Ser Asn Leu Phe Ser Ser Gln Thr Asn Leu Ala Ser Val Lys Pro 1 5 10 15 ctg aaa ggc agg aaa ata ctt ttt gcc aac ttc ccg gca gat ggg cat 96 Leu Lys Gly Arg Lys Ile Leu Phe Ala Asn Phe Pro Ala Asp Gly His 20 25 30 ttt aat cca ttg aca gga ctg gct gtt cac tta caa tgg ctg ggt tgt 144 Phe Asn Pro Leu Thr Gly Leu Ala Val His Leu Gln Trp Leu Gly Cys 35 40 45 gat gta cgc tgg tac act tcc aat aaa tat gca gac aaa ctg cga aga 192 Asp Val Arg Trp Tyr Thr Ser Asn Lys Tyr Ala Asp Lys Leu Arg Arg 50 55 60 ttg aat att ccg cat ttt cct ttc aga aaa gct atg gat ata gct gac 240 Leu Asn Ile Pro His Phe Pro Phe Arg Lys Ala Met Asp Ile Ala Asp 65 70 75 80 ctg gag aat atg ttt ccg gag cgt gat gcc att aaa ggc cag gta gcc 288 Leu Glu Asn Met Phe Pro Glu Arg Asp Ala Ile Lys Gly Gln Val Ala 85 90 95 aaa ctg aag ttc gac ata atc aat gct ttt att ctt cgc ggg ccg gaa 336 Lys Leu Lys Phe Asp Ile Ile Asn Ala Phe Ile Leu Arg Gly Pro Glu 100 105 110 tac tat gtt gac ctg cag gag ata cat aaa agt ttt cca ttt gac gta 384 Tyr Tyr Val Asp Leu Gln Glu Ile His Lys Ser Phe Pro Phe Asp Val 115 120 125 atg gtc gct gat tgc gct ttt aca gga att cct ttt gta aca gat aaa 432 Met Val Ala Asp Cys Ala Phe Thr Gly Ile Pro Phe Val Thr Asp Lys 130 135 140 atg gat ata cct gtt gtt tct gta ggt gtg ttc cct ctt acc gaa aca 480 Met Asp Ile Pro Val Val Ser Val Gly Val Phe Pro Leu Thr Glu Thr 145 150 155 160 tcg aaa gat ctt cct ccc gcc ggc ctc ggg att acg cct tcc ttt tct 528 Ser Lys Asp Leu Pro Pro Ala Gly Leu Gly Ile Thr Pro Ser Phe Ser 165 170 175 tta ccc gga aaa ttt aaa caa agc ata cta cgg tcg gtg gct gac ctg 576 Leu Pro Gly Lys Phe Lys Gln Ser Ile Leu Arg Ser Val Ala Asp Leu 180 185 190 gtc tta ttc cgc gag tcc aat aaa gta atg aga aaa atg ctg acc gaa 624 Val Leu Phe Arg Glu Ser Asn Lys Val Met Arg Lys Met Leu Thr Glu 195 200 205 cat ggc att gat cat ctc tat aca aat gta ttt gac ctg atg gta aaa 672 His Gly Ile Asp His Leu Tyr Thr Asn Val Phe Asp Leu Met Val Lys 210 215 220 aaa tca acg ctg cta ttg caa agc gga aca ccg ggt ttt gaa tat tac 720 Lys Ser Thr Leu Leu Leu Gln Ser Gly Thr Pro Gly Phe Glu Tyr Tyr 225 230 235 240 cgc agt gat ctg gga aaa aat atc cgt ttc att ggt tca tta tta ccc 768 Arg Ser Asp Leu Gly Lys Asn Ile Arg Phe Ile Gly Ser Leu Leu Pro 245 250 255 tac cag tca aaa aaa caa aca act gca tgg tct gat gaa aga ctg aac 816 Tyr Gln Ser Lys Lys Gln Thr Thr Ala Trp Ser Asp Glu Arg Leu Asn 260 265 270 agg tat gaa aaa att gtg gtg gtg aca cag ggc act gtt gaa aag aat 864 Arg Tyr Glu Lys Ile Val Val Val Thr Gln Gly Thr Val Glu Lys Asn 275 280 285 att gaa aag atc ctc gtg ccc act ctg gaa gcc ttt agg gat aca gac 912 Ile Glu Lys Ile Leu Val Pro Thr Leu Glu Ala Phe Arg Asp Thr Asp 290 295 300 tta ttg gta ata gcc aca acg ggt gga agt ggt aca gct gag ttg aaa 960 Leu Leu Val Ile Ala Thr Thr Gly Gly Ser Gly Thr Ala Glu Leu Lys 305 310 315 320 aaa aga tat cct caa ggc aac ctg atc atc gaa gat ttt att ccc ttt 1008 Lys Arg Tyr Pro Gln Gly Asn Leu Ile Ile Glu Asp Phe Ile Pro Phe 325 330 335 ggc gat atc atg cct tat gcg gat gta tat att acc aat gga gga tat 1056 Gly Asp Ile Met Pro Tyr Ala Asp Val Tyr Ile Thr Asn Gly Gly Tyr 340 345 350 ggt ggt gta atg ctg ggt atc gaa aac caa ttg cca ttg gta gta gcg 1104 Gly Gly Val Met Leu Gly Ile Glu Asn Gln Leu Pro Leu Val Val Ala 355 360 365 ggt att cat gaa ggg aaa aat gag atc aat gca agg ata gga tac ttt 1152 Gly Ile His Glu Gly Lys Asn Glu Ile Asn Ala Arg Ile Gly Tyr Phe 370 375 380 gaa ctg gga att aac ctg aaa acc gaa tgg cct aaa ccg gaa cag atg 1200 Glu Leu Gly Ile Asn Leu Lys Thr Glu Trp Pro Lys Pro Glu Gln Met 385 390 395 400 aaa aaa gcc ata gat gaa gtg atc ggc aac aaa aaa tat aaa gag aat 1248 Lys Lys Ala Ile Asp Glu Val Ile Gly Asn Lys Lys Tyr Lys Glu Asn 405 410 415 ata aca aaa ttg gca aaa gaa ttc agc aat tac cat ccc aat gaa cta 1296 Ile Thr Lys Leu Ala Lys Glu Phe Ser Asn Tyr His Pro Asn Glu Leu 420 425 430 tgc gct cag tat ata agc gaa gta tta caa aaa aca ggc agg ctt tat 1344 Cys Ala Gln Tyr Ile Ser Glu Val Leu Gln Lys Thr Gly Arg Leu Tyr 435 440 445 atc agc agt aaa aag gaa gaa gaa aag ata tac taa 1380 Ile Ser Ser Lys Lys Glu Glu Glu Lys Ile Tyr 450 455 <210> 2 <211> 1209 <212> DNA <213> Bacillus sp. <220> <223> mgtB gene <220> <221> CDS <222> 1..1209 <223> /transl_table=11 <400> 2 atg gca aat gta ctc gta ata aat ttc cct ggg gaa ggt cat att aat 48 Met Ala Asn Val Leu Val Ile Asn Phe Pro Gly Glu Gly His Ile Asn 1 5 10 15 ccg act tta gct att gta agt gag tta att cag cga ggg gaa aca gtt 96 Pro Thr Leu Ala Ile Val Ser Glu Leu Ile Gln Arg Gly Glu Thr Val 20 25 30 gtt tct tat tgt att gaa gat tat aga aag aag gtt gaa gca aca ggt 144 Val Ser Tyr Cys Ile Glu Asp Tyr Arg Lys Lys Val Glu Ala Thr Gly 35 40 45 gcg gaa ttc cga gtg ttt gag aat ttt ctc tct caa att aat att atg 192 Ala Glu Phe Arg Val Phe Glu Asn Phe Leu Ser Gln Ile Asn Ile Met 50 55 60 gaa cga gta aat gaa ggt ggg agc cct ttg atg atg cta tct cat atg 240 Glu Arg Val Asn Glu Gly Gly Ser Pro Leu Met Met Leu Ser His Met 65 70 75 80 att gaa gca tca gag cgt att gtt act caa att gta gaa gaa aca aaa 288 Ile Glu Ala Ser Glu Arg Ile Val Thr Gln Ile Val Glu Glu Thr Lys 85 90 95 gag gaa aaa tat gat tat tta ata tat gat aat cat ttt cca gta gga 336 Glu Glu Lys Tyr Asp Tyr Leu Ile Tyr Asp Asn His Phe Pro Val Gly 100 105 110 cgt att ata gca aat att tta caa tta cca agc gtt tca tct tgt aca 384 Arg Ile Ile Ala Asn Ile Leu Gln Leu Pro Ser Val Ser Ser Cys Thr 115 120 125 acg ttt gct gtt aat cag tac att aat ttt cat gat ggg caa gaa tcg 432 Thr Phe Ala Val Asn Gln Tyr Ile Asn Phe His Asp Gly Gln Glu Ser 130 135 140 aga caa gta gac gaa ata aat cca tta tat caa tct tgt tta gcg gga 480 Arg Gln Val Asp Glu Ile Asn Pro Leu Tyr Gln Ser Cys Leu Ala Gly 145 150 155 160 atg gaa aga tgg aat aag cac tat gga atg aaa tgt aat agt atg tat 528 Met Glu Arg Trp Asn Lys His Tyr Gly Met Lys Cys Asn Ser Met Tyr 165 170 175 gat att atg aat cat cct ggt gat att acg att gta tat act tca aaa 576 Asp Ile Met Asn His Pro Gly Asp Ile Thr Ile Val Tyr Thr Ser Lys 180 185 190 gaa tat cag ccg cgt tca gat tta tat gat gaa tcg tat aaa ttt gta 624 Glu Tyr Gln Pro Arg Ser Asp Leu Tyr Asp Glu Ser Tyr Lys Phe Val 195 200 205 ggt cca tca att gct act cga aaa gaa gtg ggg agt ttt cct acc gaa 672 Gly Pro Ser Ile Ala Thr Arg Lys Glu Val Gly Ser Phe Pro Thr Glu 210 215 220 gat tta aaa aat gaa aaa gtg att ttc att tct atg gga aca gtt ttt 720 Asp Leu Lys Asn Glu Lys Val Ile Phe Ile Ser Met Gly Thr Val Phe 225 230 235 240 aat gaa caa cct gct ttg tat gaa aaa tgt ttt gaa gcg ttt aaa gat 768 Asn Glu Gln Pro Ala Leu Tyr Glu Lys Cys Phe Glu Ala Phe Lys Asp 245 250 255 gta gat gcg aca gtc gta tta gtc gtt ggt aag aag ata aat aca agt 816 Val Asp Ala Thr Val Val Leu Val Val Gly Lys Lys Ile Asn Thr Ser 260 265 270 caa ttt gaa aat atc ccg aaa aac ttt aag ttg tat aat tat gtc ccg 864 Gln Phe Glu Asn Ile Pro Lys Asn Phe Lys Leu Tyr Asn Tyr Val Pro 275 280 285 caa tta gaa gtt tta cag cat gct gat gta ttc gtg aca cat ggt ggt 912 Gln Leu Glu Val Leu Gln His Ala Asp Val Phe Val Thr His Gly Gly 290 295 300 atg aat agt tcg agt gaa gcg tta tat tac ggt gtt cca tta gtt gta 960 Met Asn Ser Ser Ser Glu Ala Leu Tyr Tyr Gly Val Pro Leu Val Val 305 310 315 320 att ccg gta aca gga gat cag cca ttc gtt gca aaa cga ttg act gaa 1008 Ile Pro Val Thr Gly Asp Gln Pro Phe Val Ala Lys Arg Leu Thr Glu 325 330 335 gta ggg gca ggc ata aca ctt aat cgt aac gag tta act tct gaa ttg 1056 Val Gly Ala Gly Ile Thr Leu Asn Arg Asn Glu Leu Thr Ser Glu Leu 340 345 350 tta cgt gag act gta aag aaa gta atg gat gat gtg acg ttt aag gaa 1104 Leu Arg Glu Thr Val Lys Lys Val Met Asp Asp Val Thr Phe Lys Glu 355 360 365 aat agt cgt aaa gtg gga gag tcg ctt aga aat gct ggt gga tat caa 1152 Asn Ser Arg Lys Val Gly Glu Ser Leu Arg Asn Ala Gly Gly Tyr Gln 370 375 380 agg gca gtt gag gaa ata ttt gaa tta aaa atg aag ccg tac gta aag 1200 Arg Ala Val Glu Glu Ile Phe Glu Leu Lys Met Lys Pro Tyr Val Lys 385 390 395 400 att aaa tag 1209 Ile Lys <210> 3 <211> 1209 <212> DNA <213> Bacillus sp. <220> <223> mgtC gene <220> <221> CDS <222> 1..1209 <223> /transl_table=11 <400> 3 atg gca aac gta ctc gta ata aat ttc cct gga gaa ggt cat ata aat 48 Met Ala Asn Val Leu Val Ile Asn Phe Pro Gly Glu Gly His Ile Asn 1 5 10 15 ccg act ttg gct att gta agt gag tta att cgg cga gga gag aca gtt 96 Pro Thr Leu Ala Ile Val Ser Glu Leu Ile Arg Arg Gly Glu Thr Val 20 25 30 gtt tcg tat tgt att gaa gat tat aga aag aag att gaa gca aca ggt 144 Val Ser Tyr Cys Ile Glu Asp Tyr Arg Lys Lys Ile Glu Ala Thr Gly 35 40 45 gca gaa ttc cga gtg ttt gag aat ttc ctc tct caa att aat att atg 192 Ala Glu Phe Arg Val Phe Glu Asn Phe Leu Ser Gln Ile Asn Ile Met 50 55 60 gag cga gta aat gaa ggc ggg agt cct ttg acg atg cta tct cat atg 240 Glu Arg Val Asn Glu Gly Gly Ser Pro Leu Thr Met Leu Ser His Met 65 70 75 80 att gaa gca tca gag cgt att gtt act caa att gta gaa gaa aca aaa 288 Ile Glu Ala Ser Glu Arg Ile Val Thr Gln Ile Val Glu Glu Thr Lys 85 90 95 ggg gaa aag tac gat tac atg ata tac gat aat cat ttt ccg gta gga 336 Gly Glu Lys Tyr Asp Tyr Met Ile Tyr Asp Asn His Phe Pro Val Gly 100 105 110 cgt att ata gcc aat gct tta aaa tta cct agc gtt tct tct tgt aca 384 Arg Ile Ile Ala Asn Ala Leu Lys Leu Pro Ser Val Ser Ser Cys Thr 115 120 125 acg ttt gct ttt aat caa tat att act ttt aac gat gaa cat gaa tca 432 Thr Phe Ala Phe Asn Gln Tyr Ile Thr Phe Asn Asp Glu His Glu Ser 130 135 140 aga aaa gta gat gaa acg aat cca ttg tat caa tct tgt tta gcg gga 480 Arg Lys Val Asp Glu Thr Asn Pro Leu Tyr Gln Ser Cys Leu Ala Gly 145 150 155 160 ata gaa aaa tgg aat aaa cag tat gga atg aaa tgt aat agt atg tat 528 Ile Glu Lys Trp Asn Lys Gln Tyr Gly Met Lys Cys Asn Ser Met Tyr 165 170 175 gat att atg aat cat cct ggt gat att act att gta tat act tca aag 576 Asp Ile Met Asn His Pro Gly Asp Ile Thr Ile Val Tyr Thr Ser Lys 180 185 190 gaa tat caa cca cgt tca gat gta ttc gat gaa tcg tat aag ttt gtc 624 Glu Tyr Gln Pro Arg Ser Asp Val Phe Asp Glu Ser Tyr Lys Phe Val 195 200 205 ggc cca tcc att gct atg cgt aaa gaa gta ggc agt ttt cct atg gaa 672 Gly Pro Ser Ile Ala Met Arg Lys Glu Val Gly Ser Phe Pro Met Glu 210 215 220 gat tta aaa gat aaa aaa ttg att ttc att tct atg gga aca gtt ttt 720 Asp Leu Lys Asp Lys Lys Leu Ile Phe Ile Ser Met Gly Thr Val Phe 225 230 235 240 aat gaa caa cct gag cta tat gaa aaa tgt ttt gaa gca ttt aaa gat 768 Asn Glu Gln Pro Glu Leu Tyr Glu Lys Cys Phe Glu Ala Phe Lys Asp 245 250 255 gca gaa gcg aca gtt ata ttg gtt gtt ggt aag aag ata aat ata agt 816 Ala Glu Ala Thr Val Ile Leu Val Val Gly Lys Lys Ile Asn Ile Ser 260 265 270 caa ttt gaa aac att ccg aat aac ttt aaa ttg ttt aat tat gtg ccg 864 Gln Phe Glu Asn Ile Pro Asn Asn Phe Lys Leu Phe Asn Tyr Val Pro 275 280 285 caa tta gaa gtg tta cag tat gct gat gta ttc gtg aca cac ggt ggc 912 Gln Leu Glu Val Leu Gln Tyr Ala Asp Val Phe Val Thr His Gly Gly 290 295 300 atg aat agt tcg agt gaa gca cta tat tac ggt gtt ccg tta gtt gta 960 Met Asn Ser Ser Ser Glu Ala Leu Tyr Tyr Gly Val Pro Leu Val Val 305 310 315 320 att ccg gta aca gga gat cag cct tta gtt gcg aaa cga gtg aat gaa 1008 Ile Pro Val Thr Gly Asp Gln Pro Leu Val Ala Lys Arg Val Asn Glu 325 330 335 gta ggg gct gga ata agg ctt aat cgt aaa gaa tta act tct gaa ttg 1056 Val Gly Ala Gly Ile Arg Leu Asn Arg Lys Glu Leu Thr Ser Glu Leu 340 345 350 tta cgt gaa gct gta gag aaa gtc gcg aat gat gta agg ttt aag gaa 1104 Leu Arg Glu Ala Val Glu Lys Val Ala Asn Asp Val Arg Phe Lys Glu 355 360 365 aat agt cgt aaa gtt gga gag tca ctt cga aat gct ggt gga tat aat 1152 Asn Ser Arg Lys Val Gly Glu Ser Leu Arg Asn Ala Gly Gly Tyr Asn 370 375 380 agg gca gtt gat gaa ata tta aaa atg aaa atg aat tca tac tca aaa 1200 Arg Ala Val Asp Glu Ile Leu Lys Met Lys Met Asn Ser Tyr Ser Lys 385 390 395 400 ctt aaa taa 1209 Leu Lys <210> 4 <211> 1176 <212> DNA <213> Bacillus subtilis <220> <223> mgtS gene <220> <221> CDS <222> 1..1176 <223> /transl_table=11 <400> 4 atg aaa aag tac cat att tcg atg atc aat atc ccg gca tac gga cat 48 Met Lys Lys Tyr His Ile Ser Met Ile Asn Ile Pro Ala Tyr Gly His 1 5 10 15 gtc aat cct acg ctt gct tta gta gag aag ctt tgt gag aaa ggg cac 96 Val Asn Pro Thr Leu Ala Leu Val Glu Lys Leu Cys Glu Lys Gly His 20 25 30 cgt gtc acg tac gcg acg act gag gag ttt gcg ccc gct gtt cag caa 144 Arg Val Thr Tyr Ala Thr Thr Glu Glu Phe Ala Pro Ala Val Gln Gln 35 40 45 gcc ggt gga gaa gca ttg ctc tat cat aca tcc ttg aat att gat cct 192 Ala Gly Gly Glu Ala Leu Leu Tyr His Thr Ser Leu Asn Ile Asp Pro 50 55 60 aag caa atc agg gag atg atg gaa aag aat gac gcg ccc ctc agc ctt 240 Lys Gln Ile Arg Glu Met Met Glu Lys Asn Asp Ala Pro Leu Ser Leu 65 70 75 80 ttg aaa gaa tca ctc agc att ctg ccg cag ctt gag gag tta tat aag 288 Leu Lys Glu Ser Leu Ser Ile Leu Pro Gln Leu Glu Glu Leu Tyr Lys 85 90 95 gat gat cag cct gat ctg atc atc tat gac ttt gtt gcg ctg gct ggt 336 Asp Asp Gln Pro Asp Leu Ile Ile Tyr Asp Phe Val Ala Leu Ala Gly 100 105 110 aaa ttg ttt gct gaa aag ctc aat gtt ccg gtc att aag ctc tgt tcg 384 Lys Leu Phe Ala Glu Lys Leu Asn Val Pro Val Ile Lys Leu Cys Ser 115 120 125 tca tat gcc caa aat gaa tcc ttt cag tta gga aat gaa gac atg ctg 432 Ser Tyr Ala Gln Asn Glu Ser Phe Gln Leu Gly Asn Glu Asp Met Leu 130 135 140 aag aaa ata aaa gaa gca gag gct gaa ttt aaa gcc tac ttg gag caa 480 Lys Lys Ile Lys Glu Ala Glu Ala Glu Phe Lys Ala Tyr Leu Glu Gln 145 150 155 160 gag aag ttg ccg gct gtt tca ttt gaa cag tta gct gtg ccg gaa gca 528 Glu Lys Leu Pro Ala Val Ser Phe Glu Gln Leu Ala Val Pro Glu Ala 165 170 175 tta aat att gtc ttt atg ccg aag tct ttt cag att cag cat gag acg 576 Leu Asn Ile Val Phe Met Pro Lys Ser Phe Gln Ile Gln His Glu Thr 180 185 190 ttc gat gac cgt ttc tgt ttt gtc ggc ccc tct ctc gga gaa cga aag 624 Phe Asp Asp Arg Phe Cys Phe Val Gly Pro Ser Leu Gly Glu Arg Lys 195 200 205 gaa caa gaa ggc ctg ttg att gac aag gat gat cgc ccg ctt atg ctg 672 Glu Gln Glu Gly Leu Leu Ile Asp Lys Asp Asp Arg Pro Leu Met Leu 210 215 220 att tct ttg ggt acg gcg ttt aac gca tgg ccg gaa ttt tac aag atg 720 Ile Ser Leu Gly Thr Ala Phe Asn Ala Trp Pro Glu Phe Tyr Lys Met 225 230 235 240 tgc atc aag gca ttt cgg gat tct tca tgg caa gtg atc atg tcg gtt 768 Cys Ile Lys Ala Phe Arg Asp Ser Ser Trp Gln Val Ile Met Ser Val 245 250 255 ggg aaa acg att gat cca gaa agc ttg gag gat att cct gct aac ttt 816 Gly Lys Thr Ile Asp Pro Glu Ser Leu Glu Asp Ile Pro Ala Asn Phe 260 265 270 act att cgc caa agt gtg ccg cag ctt gag gtg tta gag aaa gct gat 864 Thr Ile Arg Gln Ser Val Pro Gln Leu Glu Val Leu Glu Lys Ala Asp 275 280 285 ttg ttc atc tct cat ggc ggg atg aac agt acg atg gaa gcg atg aac 912 Leu Phe Ile Ser His Gly Gly Met Asn Ser Thr Met Glu Ala Met Asn 290 295 300 gca ggt gtg ccg ctt gtc gtc att ccg caa atg tat gag caa gag ctc 960 Ala Gly Val Pro Leu Val Val Ile Pro Gln Met Tyr Glu Gln Glu Leu 305 310 315 320 act gca aat cgg gtt gat gaa tta ggc ctt ggc gtt tat ttg ccg aaa 1008 Thr Ala Asn Arg Val Asp Glu Leu Gly Leu Gly Val Tyr Leu Pro Lys 325 330 335 gag gaa gtg act gtt tcc agc ctg cag gaa gcg gtt cag gct gta tcc 1056 Glu Glu Val Thr Val Ser Ser Leu Gln Glu Ala Val Gln Ala Val Ser 340 345 350 agt gat caa gag ctg ctc agc cgc gtc aag aat atg caa aaa gat gta 1104 Ser Asp Gln Glu Leu Leu Ser Arg Val Lys Asn Met Gln Lys Asp Val 355 360 365 aaa gaa gct ggc gga gcg gag cgt gcg gca gct gag att gaa gcg ttt 1152 Lys Glu Ala Gly Gly Ala Glu Arg Ala Ala Ala Glu Ile Glu Ala Phe 370 375 380 atg aaa aaa tcc gct gtc ccg cag 1176 Met Lys Lys Ser Ala Val Pro Gln 385 390 <210> 5 <211> 1194 <212> DNA <213> Bacillus sp. <220> <223> mgtT gene <220> <221> CDS <222> 1..1194 <223> /transl_table=11 <400> 5 atg gcg cgt gtt tta ttc att aat gct gga tca gaa gga cat ata aat 48 Met Ala Arg Val Leu Phe Ile Asn Ala Gly Ser Glu Gly His Ile Asn 1 5 10 15 cca act tta caa gtt gta gat gaa ttg att tct cgt ggt gaa gag gtc 96 Pro Thr Leu Gln Val Val Asp Glu Leu Ile Ser Arg Gly Glu Glu Val 20 25 30 gtt tat ttt tca ata gaa gct ttc agg gag cgg att gag aag aca ggt 144 Val Tyr Phe Ser Ile Glu Ala Phe Arg Glu Arg Ile Glu Lys Thr Gly 35 40 45 gct act gta cga acg att gat gat caa aaa ttt ata aaa gcg ttt cta 192 Ala Thr Val Arg Thr Ile Asp Asp Gln Lys Phe Ile Lys Ala Phe Leu 50 55 60 tct gga ggc aga aat tat tta cag gaa aga ata aat ggc ctt cta cat 240 Ser Gly Gly Arg Asn Tyr Leu Gln Glu Arg Ile Asn Gly Leu Leu His 65 70 75 80 aca gcg gat att gta ata cct agc gtt tta gaa caa att gaa ggt gaa 288 Thr Ala Asp Ile Val Ile Pro Ser Val Leu Glu Gln Ile Glu Gly Glu 85 90 95 cat ttt gat tac ata att cat gat tct atg att ggc tgt ggc cat tta 336 His Phe Asp Tyr Ile Ile His Asp Ser Met Ile Gly Cys Gly His Leu 100 105 110 att gct caa atc ctt aaa ctt cca gcc ata aat tca tgc aca tct ttt 384 Ile Ala Gln Ile Leu Lys Leu Pro Ala Ile Asn Ser Cys Thr Ser Phe 115 120 125 gcg cag gat gaa aaa tcc ttt gag caa atg tta ggt cat cta tca aaa 432 Ala Gln Asp Glu Lys Ser Phe Glu Gln Met Leu Gly His Leu Ser Lys 130 135 140 aat atc cca gta gaa att tat gat aaa ata cag aat gat ttt caa aac 480 Asn Ile Pro Val Glu Ile Tyr Asp Lys Ile Gln Asn Asp Phe Gln Asn 145 150 155 160 tta acg aag gga att gct gaa aaa tat ggt gtt gaa ata aaa tca tcg 528 Leu Thr Lys Gly Ile Ala Glu Lys Tyr Gly Val Glu Ile Lys Ser Ser 165 170 175 tat gaa gtt ttc tgt aat cct gca ccc ctt act att gta tat aca att 576 Tyr Glu Val Phe Cys Asn Pro Ala Pro Leu Thr Ile Val Tyr Thr Ile 180 185 190 aag gag ttc cag cct ttt ggt gat acg ttt gat gaa ata tat aaa ttt 624 Lys Glu Phe Gln Pro Phe Gly Asp Thr Phe Asp Glu Ile Tyr Lys Phe 195 200 205 gta gga cca tct atc tct gca caa atg aaa aac aga gac gtt gat ttt 672 Val Gly Pro Ser Ile Ser Ala Gln Met Lys Asn Arg Asp Val Asp Phe 210 215 220 act tca att gaa gaa aaa agt ccg att tat att tca tta ggt act gtt 720 Thr Ser Ile Glu Glu Lys Ser Pro Ile Tyr Ile Ser Leu Gly Thr Val 225 230 235 240 ttt aat gaa gcg att gac ttt tat aaa ctg tgt atg aag gcc ttt gag 768 Phe Asn Glu Ala Ile Asp Phe Tyr Lys Leu Cys Met Lys Ala Phe Glu 245 250 255 aat agt gag cat aca att gtt atg tct att ggt agt aaa aca aaa ata 816 Asn Ser Glu His Thr Ile Val Met Ser Ile Gly Ser Lys Thr Lys Ile 260 265 270 agt gat cta ggc gaa att cct aaa aac ttc att gtg aaa aac tat gta 864 Ser Asp Leu Gly Glu Ile Pro Lys Asn Phe Ile Val Lys Asn Tyr Val 275 280 285 ccc caa act gag ctg ctt aca tat acg aaa cta ttt att aca cac ggc 912 Pro Gln Thr Glu Leu Leu Thr Tyr Thr Lys Leu Phe Ile Thr His Gly 290 295 300 ggg atg aac agt gcg cat gaa gga ctg tat aac ggg gtt ccg ctc gtt 960 Gly Met Asn Ser Ala His Glu Gly Leu Tyr Asn Gly Val Pro Leu Val 305 310 315 320 gta ata ccg caa agt gca gat cag cca gta gtc gca aag caa gtg gag 1008 Val Ile Pro Gln Ser Ala Asp Gln Pro Val Val Ala Lys Gln Val Glu 325 330 335 agt ctt gga gca gga ata aaa tta caa atg caa gga tta act gcg gat 1056 Ser Leu Gly Ala Gly Ile Lys Leu Gln Met Gln Gly Leu Thr Ala Asp 340 345 350 caa cta agt gaa agt gta gaa atg gta tta aat aat ccg tca ttt aaa 1104 Gln Leu Ser Glu Ser Val Glu Met Val Leu Asn Asn Pro Ser Phe Lys 355 360 365 gaa gtt gct ttg aat ttg aag aaa tct ttc caa aaa tca ggt gga tat 1152 Glu Val Ala Leu Asn Leu Lys Lys Ser Phe Gln Lys Ser Gly Gly Tyr 370 375 380 aag gaa gct gtt gat gaa att ttt ata ttt gta ggt cag taa 1194 Lys Glu Ala Val Asp Glu Ile Phe Ile Phe Val Gly Gln 385 390 395 <210> 6 <211> 1209 <212> DNA <213> Bacillus sp. <220> <223> mgtW gene <220> <221> CDS <222> 1..1209 <223> /transl_table=11 <400> 6 atg gca aac gta ctc gta ata aat ttc cct gga gaa ggt cat ata aat 48 Met Ala Asn Val Leu Val Ile Asn Phe Pro Gly Glu Gly His Ile Asn 1 5 10 15 ccg act tta gct att gta agt gag tta att cgg cga ggg gaa aca gtt 96 Pro Thr Leu Ala Ile Val Ser Glu Leu Ile Arg Arg Gly Glu Thr Val 20 25 30 gtt tcg tat tgt att gaa gat tat aga aag aag att gaa gca aca ggt 144 Val Ser Tyr Cys Ile Glu Asp Tyr Arg Lys Lys Ile Glu Ala Thr Gly 35 40 45 gca gaa ttc cga gtg ttt gag aat ttc ctc tct caa att aat att atg 192 Ala Glu Phe Arg Val Phe Glu Asn Phe Leu Ser Gln Ile Asn Ile Met 50 55 60 gaa cga gta aat gaa ggt ggg agt cct ttg acg atg cta tct cat atg 240 Glu Arg Val Asn Glu Gly Gly Ser Pro Leu Thr Met Leu Ser His Met 65 70 75 80 att gaa gca tca gag cgt att gtt act caa att gta gaa gaa aca aaa 288 Ile Glu Ala Ser Glu Arg Ile Val Thr Gln Ile Val Glu Glu Thr Lys 85 90 95 ggg gaa aag tac gat tac ttg ata tac gat aat cat ttt cca gta gga 336 Gly Glu Lys Tyr Asp Tyr Leu Ile Tyr Asp Asn His Phe Pro Val Gly 100 105 110 cgt att ata gcg aat gtt tta aaa tta cct agc gtt tct tct tgt aca 384 Arg Ile Ile Ala Asn Val Leu Lys Leu Pro Ser Val Ser Ser Cys Thr 115 120 125 acg ttt gct ttt aat cag tac att act ttt aat gat gaa caa gaa tcg 432 Thr Phe Ala Phe Asn Gln Tyr Ile Thr Phe Asn Asp Glu Gln Glu Ser 130 135 140 aga caa gta gat gaa act aat cca tta tat caa tct tgt tta gcg gga 480 Arg Gln Val Asp Glu Thr Asn Pro Leu Tyr Gln Ser Cys Leu Ala Gly 145 150 155 160 atg gaa aaa tgg aat agg cag tat gga atg aaa tgt att aat atg tat 528 Met Glu Lys Trp Asn Arg Gln Tyr Gly Met Lys Cys Ile Asn Met Tyr 165 170 175 gat att atg aat cat cct ggt gat att act att gta tat act tca aag 576 Asp Ile Met Asn His Pro Gly Asp Ile Thr Ile Val Tyr Thr Ser Lys 180 185 190 gaa tat cag ccg cgt tca gat gta ttc gat gaa tcg tat aag ttt gtc 624 Glu Tyr Gln Pro Arg Ser Asp Val Phe Asp Glu Ser Tyr Lys Phe Val 195 200 205 ggt cca tca att gct act cga aaa gaa gta gat agc ttt cct atg gaa 672 Gly Pro Ser Ile Ala Thr Arg Lys Glu Val Asp Ser Phe Pro Met Glu 210 215 220 gat tta aaa gat aaa caa ttg att ttc att tct atg gga aca gtt ttt 720 Asp Leu Lys Asp Lys Gln Leu Ile Phe Ile Ser Met Gly Thr Val Phe 225 230 235 240 aat gaa caa cct gag tta tat gaa aaa tgt ttt gaa gcg ttt aaa gat 768 Asn Glu Gln Pro Glu Leu Tyr Glu Lys Cys Phe Glu Ala Phe Lys Asp 245 250 255 gta gaa gcg aca gtc gta tta gtt gtt ggt aag aag ata aat ata agt 816 Val Glu Ala Thr Val Val Leu Val Val Gly Lys Lys Ile Asn Ile Ser 260 265 270 caa ttt gaa aac att ccg aat aac ttt aag ttg tat aat tat gtg ccg 864 Gln Phe Glu Asn Ile Pro Asn Asn Phe Lys Leu Tyr Asn Tyr Val Pro 275 280 285 caa tta gaa gta tta cag tac gct gat gta ttc gtg aca cac ggt ggt 912 Gln Leu Glu Val Leu Gln Tyr Ala Asp Val Phe Val Thr His Gly Gly 290 295 300 atg aat agt tcg agt gaa gca cta tat tac ggt gtc ccg tta gtt gta 960 Met Asn Ser Ser Ser Glu Ala Leu Tyr Tyr Gly Val Pro Leu Val Val 305 310 315 320 att ccg gta aca gga gat cag cct tta gtt gcg aaa cga gtg agt gaa 1008 Ile Pro Val Thr Gly Asp Gln Pro Leu Val Ala Lys Arg Val Ser Glu 325 330 335 gta gga gct gga ata agg ctt aat cgt aaa gaa tta act tct gaa ttg 1056 Val Gly Ala Gly Ile Arg Leu Asn Arg Lys Glu Leu Thr Ser Glu Leu 340 345 350 tta cgt gag act gta aag aaa gta atg tat gat gta acg ttt aag gaa 1104 Leu Arg Glu Thr Val Lys Lys Val Met Tyr Asp Val Thr Phe Lys Glu 355 360 365 aat agt cgc aaa gtt gga gag tca ctt cga aat gct ggt ggg tat aat 1152 Asn Ser Arg Lys Val Gly Glu Ser Leu Arg Asn Ala Gly Gly Tyr Asn 370 375 380 aga gca gtt gat gaa ata ttt aaa atg aaa ctg aat tca tac tta aaa 1200 Arg Ala Val Asp Glu Ile Phe Lys Met Lys Leu Asn Ser Tyr Leu Lys 385 390 395 400 ctt aaa taa 1209 Leu Lys <210> 7 <211> 459 <212> PRT <213> Unknown <220> <223> [CDS]:1..1380 from SEQ ID NO 1 <400> 7 Met Ser Asn Leu Phe Ser Ser Gln Thr Asn Leu Ala Ser Val Lys Pro 1 5 10 15 Leu Lys Gly Arg Lys Ile Leu Phe Ala Asn Phe Pro Ala Asp Gly His 20 25 30 Phe Asn Pro Leu Thr Gly Leu Ala Val His Leu Gln Trp Leu Gly Cys 35 40 45 Asp Val Arg Trp Tyr Thr Ser Asn Lys Tyr Ala Asp Lys Leu Arg Arg 50 55 60 Leu Asn Ile Pro His Phe Pro Phe Arg Lys Ala Met Asp Ile Ala Asp 65 70 75 80 Leu Glu Asn Met Phe Pro Glu Arg Asp Ala Ile Lys Gly Gln Val Ala 85 90 95 Lys Leu Lys Phe Asp Ile Ile Asn Ala Phe Ile Leu Arg Gly Pro Glu 100 105 110 Tyr Tyr Val Asp Leu Gln Glu Ile His Lys Ser Phe Pro Phe Asp Val 115 120 125 Met Val Ala Asp Cys Ala Phe Thr Gly Ile Pro Phe Val Thr Asp Lys 130 135 140 Met Asp Ile Pro Val Val Ser Val Gly Val Phe Pro Leu Thr Glu Thr 145 150 155 160 Ser Lys Asp Leu Pro Pro Ala Gly Leu Gly Ile Thr Pro Ser Phe Ser 165 170 175 Leu Pro Gly Lys Phe Lys Gln Ser Ile Leu Arg Ser Val Ala Asp Leu 180 185 190 Val Leu Phe Arg Glu Ser Asn Lys Val Met Arg Lys Met Leu Thr Glu 195 200 205 His Gly Ile Asp His Leu Tyr Thr Asn Val Phe Asp Leu Met Val Lys 210 215 220 Lys Ser Thr Leu Leu Leu Gln Ser Gly Thr Pro Gly Phe Glu Tyr Tyr 225 230 235 240 Arg Ser Asp Leu Gly Lys Asn Ile Arg Phe Ile Gly Ser Leu Leu Pro 245 250 255 Tyr Gln Ser Lys Lys Gln Thr Thr Ala Trp Ser Asp Glu Arg Leu Asn 260 265 270 Arg Tyr Glu Lys Ile Val Val Val Thr Gln Gly Thr Val Glu Lys Asn 275 280 285 Ile Glu Lys Ile Leu Val Pro Thr Leu Glu Ala Phe Arg Asp Thr Asp 290 295 300 Leu Leu Val Ile Ala Thr Thr Gly Gly Ser Gly Thr Ala Glu Leu Lys 305 310 315 320 Lys Arg Tyr Pro Gln Gly Asn Leu Ile Ile Glu Asp Phe Ile Pro Phe 325 330 335 Gly Asp Ile Met Pro Tyr Ala Asp Val Tyr Ile Thr Asn Gly Gly Tyr 340 345 350 Gly Gly Val Met Leu Gly Ile Glu Asn Gln Leu Pro Leu Val Val Ala 355 360 365 Gly Ile His Glu Gly Lys Asn Glu Ile Asn Ala Arg Ile Gly Tyr Phe 370 375 380 Glu Leu Gly Ile Asn Leu Lys Thr Glu Trp Pro Lys Pro Glu Gln Met 385 390 395 400 Lys Lys Ala Ile Asp Glu Val Ile Gly Asn Lys Lys Tyr Lys Glu Asn 405 410 415 Ile Thr Lys Leu Ala Lys Glu Phe Ser Asn Tyr His Pro Asn Glu Leu 420 425 430 Cys Ala Gln Tyr Ile Ser Glu Val Leu Gln Lys Thr Gly Arg Leu Tyr 435 440 445 Ile Ser Ser Lys Lys Glu Glu Glu Lys Ile Tyr 450 455 <210> 8 <211> 402 <212> PRT <213> Bacillus sp. <220> <223> [CDS]:1..1209 from SEQ ID NO 2 <400> 8 Met Ala Asn Val Leu Val Ile Asn Phe Pro Gly Glu Gly His Ile Asn 1 5 10 15 Pro Thr Leu Ala Ile Val Ser Glu Leu Ile Gln Arg Gly Glu Thr Val 20 25 30 Val Ser Tyr Cys Ile Glu Asp Tyr Arg Lys Lys Val Glu Ala Thr Gly 35 40 45 Ala Glu Phe Arg Val Phe Glu Asn Phe Leu Ser Gln Ile Asn Ile Met 50 55 60 Glu Arg Val Asn Glu Gly Gly Ser Pro Leu Met Met Leu Ser His Met 65 70 75 80 Ile Glu Ala Ser Glu Arg Ile Val Thr Gln Ile Val Glu Glu Thr Lys 85 90 95 Glu Glu Lys Tyr Asp Tyr Leu Ile Tyr Asp Asn His Phe Pro Val Gly 100 105 110 Arg Ile Ile Ala Asn Ile Leu Gln Leu Pro Ser Val Ser Ser Cys Thr 115 120 125 Thr Phe Ala Val Asn Gln Tyr Ile Asn Phe His Asp Gly Gln Glu Ser 130 135 140 Arg Gln Val Asp Glu Ile Asn Pro Leu Tyr Gln Ser Cys Leu Ala Gly 145 150 155 160 Met Glu Arg Trp Asn Lys His Tyr Gly Met Lys Cys Asn Ser Met Tyr 165 170 175 Asp Ile Met Asn His Pro Gly Asp Ile Thr Ile Val Tyr Thr Ser Lys 180 185 190 Glu Tyr Gln Pro Arg Ser Asp Leu Tyr Asp Glu Ser Tyr Lys Phe Val 195 200 205 Gly Pro Ser Ile Ala Thr Arg Lys Glu Val Gly Ser Phe Pro Thr Glu 210 215 220 Asp Leu Lys Asn Glu Lys Val Ile Phe Ile Ser Met Gly Thr Val Phe 225 230 235 240 Asn Glu Gln Pro Ala Leu Tyr Glu Lys Cys Phe Glu Ala Phe Lys Asp 245 250 255 Val Asp Ala Thr Val Val Leu Val Val Gly Lys Lys Ile Asn Thr Ser 260 265 270 Gln Phe Glu Asn Ile Pro Lys Asn Phe Lys Leu Tyr Asn Tyr Val Pro 275 280 285 Gln Leu Glu Val Leu Gln His Ala Asp Val Phe Val Thr His Gly Gly 290 295 300 Met Asn Ser Ser Ser Glu Ala Leu Tyr Tyr Gly Val Pro Leu Val Val 305 310 315 320 Ile Pro Val Thr Gly Asp Gln Pro Phe Val Ala Lys Arg Leu Thr Glu 325 330 335 Val Gly Ala Gly Ile Thr Leu Asn Arg Asn Glu Leu Thr Ser Glu Leu 340 345 350 Leu Arg Glu Thr Val Lys Lys Val Met Asp Asp Val Thr Phe Lys Glu 355 360 365 Asn Ser Arg Lys Val Gly Glu Ser Leu Arg Asn Ala Gly Gly Tyr Gln 370 375 380 Arg Ala Val Glu Glu Ile Phe Glu Leu Lys Met Lys Pro Tyr Val Lys 385 390 395 400 Ile Lys <210> 9 <211> 402 <212> PRT <213> Bacillus sp. <220> <223> [CDS]:1..1209 from SEQ ID NO 3 <400> 9 Met Ala Asn Val Leu Val Ile Asn Phe Pro Gly Glu Gly His Ile Asn 1 5 10 15 Pro Thr Leu Ala Ile Val Ser Glu Leu Ile Arg Arg Gly Glu Thr Val 20 25 30 Val Ser Tyr Cys Ile Glu Asp Tyr Arg Lys Lys Ile Glu Ala Thr Gly 35 40 45 Ala Glu Phe Arg Val Phe Glu Asn Phe Leu Ser Gln Ile Asn Ile Met 50 55 60 Glu Arg Val Asn Glu Gly Gly Ser Pro Leu Thr Met Leu Ser His Met 65 70 75 80 Ile Glu Ala Ser Glu Arg Ile Val Thr Gln Ile Val Glu Glu Thr Lys 85 90 95 Gly Glu Lys Tyr Asp Tyr Met Ile Tyr Asp Asn His Phe Pro Val Gly 100 105 110 Arg Ile Ile Ala Asn Ala Leu Lys Leu Pro Ser Val Ser Ser Cys Thr 115 120 125 Thr Phe Ala Phe Asn Gln Tyr Ile Thr Phe Asn Asp Glu His Glu Ser 130 135 140 Arg Lys Val Asp Glu Thr Asn Pro Leu Tyr Gln Ser Cys Leu Ala Gly 145 150 155 160 Ile Glu Lys Trp Asn Lys Gln Tyr Gly Met Lys Cys Asn Ser Met Tyr 165 170 175 Asp Ile Met Asn His Pro Gly Asp Ile Thr Ile Val Tyr Thr Ser Lys 180 185 190 Glu Tyr Gln Pro Arg Ser Asp Val Phe Asp Glu Ser Tyr Lys Phe Val 195 200 205 Gly Pro Ser Ile Ala Met Arg Lys Glu Val Gly Ser Phe Pro Met Glu 210 215 220 Asp Leu Lys Asp Lys Lys Leu Ile Phe Ile Ser Met Gly Thr Val Phe 225 230 235 240 Asn Glu Gln Pro Glu Leu Tyr Glu Lys Cys Phe Glu Ala Phe Lys Asp 245 250 255 Ala Glu Ala Thr Val Ile Leu Val Val Gly Lys Lys Ile Asn Ile Ser 260 265 270 Gln Phe Glu Asn Ile Pro Asn Asn Phe Lys Leu Phe Asn Tyr Val Pro 275 280 285 Gln Leu Glu Val Leu Gln Tyr Ala Asp Val Phe Val Thr His Gly Gly 290 295 300 Met Asn Ser Ser Ser Glu Ala Leu Tyr Tyr Gly Val Pro Leu Val Val 305 310 315 320 Ile Pro Val Thr Gly Asp Gln Pro Leu Val Ala Lys Arg Val Asn Glu 325 330 335 Val Gly Ala Gly Ile Arg Leu Asn Arg Lys Glu Leu Thr Ser Glu Leu 340 345 350 Leu Arg Glu Ala Val Glu Lys Val Ala Asn Asp Val Arg Phe Lys Glu 355 360 365 Asn Ser Arg Lys Val Gly Glu Ser Leu Arg Asn Ala Gly Gly Tyr Asn 370 375 380 Arg Ala Val Asp Glu Ile Leu Lys Met Lys Met Asn Ser Tyr Ser Lys 385 390 395 400 Leu Lys <210> 10 <211> 392 <212> PRT <213> Bacillus subtilis <220> <223> [CDS]:1..1176 from SEQ ID NO 4 <400> 10 Met Lys Lys Tyr His Ile Ser Met Ile Asn Ile Pro Ala Tyr Gly His 1 5 10 15 Val Asn Pro Thr Leu Ala Leu Val Glu Lys Leu Cys Glu Lys Gly His 20 25 30 Arg Val Thr Tyr Ala Thr Thr Glu Glu Phe Ala Pro Ala Val Gln Gln 35 40 45 Ala Gly Gly Glu Ala Leu Leu Tyr His Thr Ser Leu Asn Ile Asp Pro 50 55 60 Lys Gln Ile Arg Glu Met Met Glu Lys Asn Asp Ala Pro Leu Ser Leu 65 70 75 80 Leu Lys Glu Ser Leu Ser Ile Leu Pro Gln Leu Glu Glu Leu Tyr Lys 85 90 95 Asp Asp Gln Pro Asp Leu Ile Ile Tyr Asp Phe Val Ala Leu Ala Gly 100 105 110 Lys Leu Phe Ala Glu Lys Leu Asn Val Pro Val Ile Lys Leu Cys Ser 115 120 125 Ser Tyr Ala Gln Asn Glu Ser Phe Gln Leu Gly Asn Glu Asp Met Leu 130 135 140 Lys Lys Ile Lys Glu Ala Glu Ala Glu Phe Lys Ala Tyr Leu Glu Gln 145 150 155 160 Glu Lys Leu Pro Ala Val Ser Phe Glu Gln Leu Ala Val Pro Glu Ala 165 170 175 Leu Asn Ile Val Phe Met Pro Lys Ser Phe Gln Ile Gln His Glu Thr 180 185 190 Phe Asp Asp Arg Phe Cys Phe Val Gly Pro Ser Leu Gly Glu Arg Lys 195 200 205 Glu Gln Glu Gly Leu Leu Ile Asp Lys Asp Asp Arg Pro Leu Met Leu 210 215 220 Ile Ser Leu Gly Thr Ala Phe Asn Ala Trp Pro Glu Phe Tyr Lys Met 225 230 235 240 Cys Ile Lys Ala Phe Arg Asp Ser Ser Trp Gln Val Ile Met Ser Val 245 250 255 Gly Lys Thr Ile Asp Pro Glu Ser Leu Glu Asp Ile Pro Ala Asn Phe 260 265 270 Thr Ile Arg Gln Ser Val Pro Gln Leu Glu Val Leu Glu Lys Ala Asp 275 280 285 Leu Phe Ile Ser His Gly Gly Met Asn Ser Thr Met Glu Ala Met Asn 290 295 300 Ala Gly Val Pro Leu Val Val Ile Pro Gln Met Tyr Glu Gln Glu Leu 305 310 315 320 Thr Ala Asn Arg Val Asp Glu Leu Gly Leu Gly Val Tyr Leu Pro Lys 325 330 335 Glu Glu Val Thr Val Ser Ser Leu Gln Glu Ala Val Gln Ala Val Ser 340 345 350 Ser Asp Gln Glu Leu Leu Ser Arg Val Lys Asn Met Gln Lys Asp Val 355 360 365 Lys Glu Ala Gly Gly Ala Glu Arg Ala Ala Ala Glu Ile Glu Ala Phe 370 375 380 Met Lys Lys Ser Ala Val Pro Gln 385 390 <210> 11 <211> 397 <212> PRT <213> Bacillus sp. <220> <223> [CDS]:1..1194 from SEQ ID NO 5 <400> 11 Met Ala Arg Val Leu Phe Ile Asn Ala Gly Ser Glu Gly His Ile Asn 1 5 10 15 Pro Thr Leu Gln Val Val Asp Glu Leu Ile Ser Arg Gly Glu Glu Val 20 25 30 Val Tyr Phe Ser Ile Glu Ala Phe Arg Glu Arg Ile Glu Lys Thr Gly 35 40 45 Ala Thr Val Arg Thr Ile Asp Asp Gln Lys Phe Ile Lys Ala Phe Leu 50 55 60 Ser Gly Gly Arg Asn Tyr Leu Gln Glu Arg Ile Asn Gly Leu Leu His 65 70 75 80 Thr Ala Asp Ile Val Ile Pro Ser Val Leu Glu Gln Ile Glu Gly Glu 85 90 95 His Phe Asp Tyr Ile Ile His Asp Ser Met Ile Gly Cys Gly His Leu 100 105 110 Ile Ala Gln Ile Leu Lys Leu Pro Ala Ile Asn Ser Cys Thr Ser Phe 115 120 125 Ala Gln Asp Glu Lys Ser Phe Glu Gln Met Leu Gly His Leu Ser Lys 130 135 140 Asn Ile Pro Val Glu Ile Tyr Asp Lys Ile Gln Asn Asp Phe Gln Asn 145 150 155 160 Leu Thr Lys Gly Ile Ala Glu Lys Tyr Gly Val Glu Ile Lys Ser Ser 165 170 175 Tyr Glu Val Phe Cys Asn Pro Ala Pro Leu Thr Ile Val Tyr Thr Ile 180 185 190 Lys Glu Phe Gln Pro Phe Gly Asp Thr Phe Asp Glu Ile Tyr Lys Phe 195 200 205 Val Gly Pro Ser Ile Ser Ala Gln Met Lys Asn Arg Asp Val Asp Phe 210 215 220 Thr Ser Ile Glu Glu Lys Ser Pro Ile Tyr Ile Ser Leu Gly Thr Val 225 230 235 240 Phe Asn Glu Ala Ile Asp Phe Tyr Lys Leu Cys Met Lys Ala Phe Glu 245 250 255 Asn Ser Glu His Thr Ile Val Met Ser Ile Gly Ser Lys Thr Lys Ile 260 265 270 Ser Asp Leu Gly Glu Ile Pro Lys Asn Phe Ile Val Lys Asn Tyr Val 275 280 285 Pro Gln Thr Glu Leu Leu Thr Tyr Thr Lys Leu Phe Ile Thr His Gly 290 295 300 Gly Met Asn Ser Ala His Glu Gly Leu Tyr Asn Gly Val Pro Leu Val 305 310 315 320 Val Ile Pro Gln Ser Ala Asp Gln Pro Val Val Ala Lys Gln Val Glu 325 330 335 Ser Leu Gly Ala Gly Ile Lys Leu Gln Met Gln Gly Leu Thr Ala Asp 340 345 350 Gln Leu Ser Glu Ser Val Glu Met Val Leu Asn Asn Pro Ser Phe Lys 355 360 365 Glu Val Ala Leu Asn Leu Lys Lys Ser Phe Gln Lys Ser Gly Gly Tyr 370 375 380 Lys Glu Ala Val Asp Glu Ile Phe Ile Phe Val Gly Gln 385 390 395 <210> 12 <211> 402 <212> PRT <213> Bacillus sp. <220> <223> [CDS]:1..1209 from SEQ ID NO 6 <400> 12 Met Ala Asn Val Leu Val Ile Asn Phe Pro Gly Glu Gly His Ile Asn 1 5 10 15 Pro Thr Leu Ala Ile Val Ser Glu Leu Ile Arg Arg Gly Glu Thr Val 20 25 30 Val Ser Tyr Cys Ile Glu Asp Tyr Arg Lys Lys Ile Glu Ala Thr Gly 35 40 45 Ala Glu Phe Arg Val Phe Glu Asn Phe Leu Ser Gln Ile Asn Ile Met 50 55 60 Glu Arg Val Asn Glu Gly Gly Ser Pro Leu Thr Met Leu Ser His Met 65 70 75 80 Ile Glu Ala Ser Glu Arg Ile Val Thr Gln Ile Val Glu Glu Thr Lys 85 90 95 Gly Glu Lys Tyr Asp Tyr Leu Ile Tyr Asp Asn His Phe Pro Val Gly 100 105 110 Arg Ile Ile Ala Asn Val Leu Lys Leu Pro Ser Val Ser Ser Cys Thr 115 120 125 Thr Phe Ala Phe Asn Gln Tyr Ile Thr Phe Asn Asp Glu Gln Glu Ser 130 135 140 Arg Gln Val Asp Glu Thr Asn Pro Leu Tyr Gln Ser Cys Leu Ala Gly 145 150 155 160 Met Glu Lys Trp Asn Arg Gln Tyr Gly Met Lys Cys Ile Asn Met Tyr 165 170 175 Asp Ile Met Asn His Pro Gly Asp Ile Thr Ile Val Tyr Thr Ser Lys 180 185 190 Glu Tyr Gln Pro Arg Ser Asp Val Phe Asp Glu Ser Tyr Lys Phe Val 195 200 205 Gly Pro Ser Ile Ala Thr Arg Lys Glu Val Asp Ser Phe Pro Met Glu 210 215 220 Asp Leu Lys Asp Lys Gln Leu Ile Phe Ile Ser Met Gly Thr Val Phe 225 230 235 240 Asn Glu Gln Pro Glu Leu Tyr Glu Lys Cys Phe Glu Ala Phe Lys Asp 245 250 255 Val Glu Ala Thr Val Val Leu Val Val Gly Lys Lys Ile Asn Ile Ser 260 265 270 Gln Phe Glu Asn Ile Pro Asn Asn Phe Lys Leu Tyr Asn Tyr Val Pro 275 280 285 Gln Leu Glu Val Leu Gln Tyr Ala Asp Val Phe Val Thr His Gly Gly 290 295 300 Met Asn Ser Ser Ser Glu Ala Leu Tyr Tyr Gly Val Pro Leu Val Val 305 310 315 320 Ile Pro Val Thr Gly Asp Gln Pro Leu Val Ala Lys Arg Val Ser Glu 325 330 335 Val Gly Ala Gly Ile Arg Leu Asn Arg Lys Glu Leu Thr Ser Glu Leu 340 345 350 Leu Arg Glu Thr Val Lys Lys Val Met Tyr Asp Val Thr Phe Lys Glu 355 360 365 Asn Ser Arg Lys Val Gly Glu Ser Leu Arg Asn Ala Gly Gly Tyr Asn 370 375 380 Arg Ala Val Asp Glu Ile Phe Lys Met Lys Leu Asn Ser Tyr Leu Lys 385 390 395 400 Leu Lys <210> 13 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer cfn_GT-1for <400> 13 ttatgtcccg caattagaag 20 <210> 14 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer cfn_GT-for <400> 14 agaaggttga agcaacagg 19 <210> 15 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Primer cfn_GT-rev <400> 15 cctactggaa aatgattatc atatattac 29 <210> 16 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Primer gtf-Nde-for <400> 16 catatgagta atttattttc ttcacaaac 29 <210> 17 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer gtf-Bam-rev <400> 17 ggatccttag tatatctttt cttcttc 27 <210> 18 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer mgt-1-XhoI-for <400> 18 ctcgagatgg caaatgtact cg 22 <210> 19 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer mgt-1-XhoI-rev <400> 19 ctcgagttta atctttacgt acggc 25 <210> 20 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> T3 promoter <400> 20 attaaccctc actaaag 17 <210> 21 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> T7 promoter <400> 21 taatacgact cactatagg 19 <210> 22 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> T7 terminator <400> 22 gctagttatt gctcagcgg 19

Claims (9)

  1. 폴리페놀의 글리코실화를 촉매 작용하는 효소로서,
    a) SEQ ID NO: 7-12의 서열 중 하나에 따른 아미노산 서열을 포함하거나,
    b) SEQ ID NO: 1-6의 서열 중 하나의 뉴클레오타이드 서열을 포함하는 핵산에 의해서 인코딩(encoding)되거나,
    c) 상기 a) 또는 b)에서 정의된 효소 중 하나와 상동성이거나,
    d) SEQ ID NO: 1-6의 서열 중 하나의 뉴클레오타이드 서열을 포함하는 서열에 상보적인 핵산과 엄격한 조건(stringent condition) 하에 혼성화하는 핵산에 의해서 인코딩되는 효소.
  2. 제 1항에 있어서, 상기 a) 또는 b)에 정의된 효소와 적어도 75%, 더욱 바람직하게는, 적어도 80% 또는 85%, 가장 바람직하게는, 적어도 90%, 95%, 96%, 97%, 98%, 99%, 99.2% 또는 99.5% 상동성인 효소.
  3. 제 1항에 있어서, SEQ ID NO: 1에 따른 뉴클레오타이드 서열을 지니는 핵산에 의해서 인코딩되거나 SEQ ID NO: 7에 따른 아미노산 서열을 지니거나, SEQ ID NO: 1에 따른 뉴클레오타이드 서열을 지니는 핵산에 의해서 인코딩되거나 SEQ ID NO: 7에 따른 아미노산 서열을 지니는 효소와 적어도 75%, 더욱 바람직하게는, 적어도 80% 또는 85%, 가장 바람직하게는, 적어도 90%, 95%, 96%, 97%, 98%, 99%, 99.2% 또는 99.5% 상동성인 효소.
  4. 제 1항 내지 제 3항 중 한 항에 따른 효소의 단편으로서, 상기 효소의 적어도 60, 바람직하게는 적어도 65, 70, 75, 80, 85, 90, 100, 110 또는 적어도 120개의 연속 아미노산을 포함하고, 폴리페놀의 글리코실화를 촉매 작용하는 단편.
  5. 제 1항 내지 제 3항 중 어느 한 항에 따른 효소 또는 제 4항에 따른 단편을 인코딩하는 핵산.
  6. 제 5항에 있어서,
    a) SEQ ID NO: 1-6에 따른 뉴클레오타이드 서열중 하나 또는 이의 단편을 포함하거나,
    b)상기 a)에 정의된 핵산 중 하나와 상동성이거나,
    c) 상기 a)에 정의된 핵산에 상보적인 핵산과 엄격한 조건하에 혼성화되는 핵산.
  7. 폴리페놀, 바람직하게는, 페놀산 유도체, 플라보노이드, 벤조산 유도체, 스틸베노이드, 칼코노이드, 크로몬, 및 쿠마린 유도체의 글리코실화를 위한 제 1항 내지 제 3항 중 한 항에 따른 효소 또는 제 4항에 따른 이의 단편의 용도.
  8. 폴리페놀의 글리코사이드를 제조하는 방법으로서, 글리코실 공여체를 폴리페놀의 하이드록실기 또는 다른 작용기에 전달하는 것을 발생시키기 위한 효소적 반응에 적합한 조건하에, 폴리페놀 및 글리코실 공여체를 청구항 제 1항 내지 제 3항 중 한 항에 따른 효소 또는 청구항 제 4항에 따른 이의 단편과 반응시키는 단계를 포함하는 방법.
  9. 제 8항에 있어서, 폴리페놀이 페놀산 유도체, 플라보노이드, 벤조산 유도체, 스틸베노이드, 칼코노이드, 크로몬, 또는 쿠마린 유도체인 방법.
KR1020157034404A 2013-05-29 2014-05-28 폴리페놀의 글리코실화를 촉매 작용하는 효소 KR20160005093A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP13169812.8 2013-05-29
EP13169812 2013-05-29
PCT/EP2014/061185 WO2014191524A1 (en) 2013-05-29 2014-05-28 Enzymes catalyzing the glycosylation of polyphenols

Publications (1)

Publication Number Publication Date
KR20160005093A true KR20160005093A (ko) 2016-01-13

Family

ID=48485073

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157034404A KR20160005093A (ko) 2013-05-29 2014-05-28 폴리페놀의 글리코실화를 촉매 작용하는 효소

Country Status (8)

Country Link
US (1) US20160090578A1 (ko)
EP (1) EP3004336B1 (ko)
JP (1) JP2016518849A (ko)
KR (1) KR20160005093A (ko)
CN (1) CN105247045A (ko)
AU (1) AU2014273088A1 (ko)
CA (1) CA2912987A1 (ko)
WO (1) WO2014191524A1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3011208A1 (en) * 2016-01-15 2017-07-20 Universitat Hamburg Methods for the production of rhamnosylated flavonoids
CA3011192A1 (en) 2016-01-15 2017-07-20 Universitat Hamburg Flavonoide-type compounds bearing an o-rhamnosyl residue
CA3011018A1 (en) 2016-01-15 2017-07-20 Universitat Hamburg Noreugenin-glycoside derivatives
US20220290248A1 (en) * 2019-08-13 2022-09-15 Tata Consultancy Services Limited System and method for assessing the risk of colorectal cancer
CN113265433B (zh) * 2020-02-17 2023-12-26 中国科学院分子植物科学卓越创新中心 双功能碳苷糖基转移酶及其应用
WO2021188456A1 (en) * 2020-03-16 2021-09-23 Doublerainbow Biosciences Inc. Enasidenib glycosides and methods of treating diseases associated with isocitrate dehydrogenase (idh) dysfunction
US20230124589A1 (en) * 2020-03-16 2023-04-20 Doublerainbow Biosciences Inc. Ivacaftor Glycosides, Methods Of Making, And Uses Thereof In Treating Cystic Fibrosis
CN115279915A (zh) * 2020-03-16 2022-11-01 德瑞生物医药股份有限公司 依托泊苷糖苷、其制备方法及其作为抗癌药物的用途
CN114836398B (zh) * 2022-06-06 2023-06-23 南京工业大学 糖基转移酶突变体在定向合成非天然人参皂苷中的应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5184786B2 (ja) * 2007-01-19 2013-04-17 サントリーホールディングス株式会社 フラボノイド類の配糖化方法
EP2463366B1 (en) * 2009-08-07 2015-08-12 National University Corporation Tokyo University Of Agriculture and Technology Novel glycosyltransferase, novel glycosyltransferase gene, and novel glycosyl donor compound

Also Published As

Publication number Publication date
US20160090578A1 (en) 2016-03-31
EP3004336A1 (en) 2016-04-13
CN105247045A (zh) 2016-01-13
JP2016518849A (ja) 2016-06-30
CA2912987A1 (en) 2014-12-04
WO2014191524A1 (en) 2014-12-04
EP3004336B1 (en) 2017-03-29
AU2014273088A1 (en) 2015-11-12

Similar Documents

Publication Publication Date Title
KR20160005093A (ko) 폴리페놀의 글리코실화를 촉매 작용하는 효소
Rabausch et al. Functional screening of metagenome and genome libraries for detection of novel flavonoid-modifying enzymes
Wang et al. Molecular characterization of the C‐glucosylation for puerarin biosynthesis in Pueraria lobata
Kim et al. Flavonoid 3′-O-methyltransferase from rice: cDNA cloning, characterization and functional expression
Brazier-Hicks et al. The c-glycosylation of flavonoids in cereals*♦
Willits et al. Bio-fermentation of modified flavonoids: an example of in vivo diversification of secondary metabolites
Koirala et al. Methylation and subsequent glycosylation of 7, 8-dihydroxyflavone
Ibdah et al. A novel Mg2+-dependent O-methyltransferase in the phenylpropanoid metabolism of Mesembryanthemum crystallinum
Shrestha et al. Biosynthesis of flavone C-glucosides in engineered Escherichia coli
JP4927774B2 (ja) Udp−グルクロン酸転移酵素およびそれをコードするポリヌクレオチド
Ibdah et al. Identification and cloning of an NADPH-dependent hydroxycinnamoyl-CoA double bond reductase involved in dihydrochalcone formation in Malus× domestica Borkh.
Wang et al. Bacillus licheniformis escapes from Myxococcus xanthus predation by deactivating myxovirescin A through enzymatic glucosylation
JP5705550B2 (ja) フラボノイド3位グルクロン酸転移酵素、及びそれをコードするポリヌクレオチド
Parajuli et al. Expanded acceptor substrates flexibility study of flavonol 7-O-rhamnosyltransferase, AtUGT89C1 from Arabidopsis thaliana
JPWO2010026666A1 (ja) グルクロン酸転移酵素およびそれをコードするポリヌクレオチド
Yang et al. Systems metabolic engineering of Escherichia coli to enhance the production of flavonoid glucuronides
JP5680860B2 (ja) フラボノイド3位ガラクトース・グルコース転移酵素、及びそれをコードするポリヌクレオチド
Liu et al. Genome‐wide identification and characterization of macrolide glycosyltransferases from a marine‐derived Bacillus strain and their phylogenetic distribution
Adolfo et al. Evaluation of pathways to the C‐glycosyl isoflavone puerarin in roots of kudzu (Pueraria montana lobata)
JP4418865B2 (ja) 新規グルコシル基転移酵素遺伝子
Zhang et al. Functional characterization of a flavonol 3-O-rhamnosyltransferase and two UDP-rhamnose synthases from Hypericum monogynum
CN109072271A (zh) 用于制备鼠李糖基化类黄酮的方法
Kim et al. Molecular characterization of flavonoid malonyltransferase from Oryza sativa
Clayton-Cuch et al. Biochemical and in silico characterization of glycosyltransferases from red sweet cherry (Prunus avium L.) reveals their broad specificity toward phenolic substrates
Poudel et al. Functional characterization of a naphthalene-O-methyltransferase from Nocardia sp. CS682

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E601 Decision to refuse application