KR102418138B1 - Glycosyltransferases, mutants and applications thereof - Google Patents

Glycosyltransferases, mutants and applications thereof Download PDF

Info

Publication number
KR102418138B1
KR102418138B1 KR1020197037134A KR20197037134A KR102418138B1 KR 102418138 B1 KR102418138 B1 KR 102418138B1 KR 1020197037134 A KR1020197037134 A KR 1020197037134A KR 20197037134 A KR20197037134 A KR 20197037134A KR 102418138 B1 KR102418138 B1 KR 102418138B1
Authority
KR
South Korea
Prior art keywords
seq
amino acid
leu
val
ser
Prior art date
Application number
KR1020197037134A
Other languages
Korean (ko)
Other versions
KR20200016268A (en
Inventor
즈후아 조우
싱 얀
핑핑 왕
웨이 웨이
시아오동 리
Original Assignee
씨에이에스 센터 포 엑셀런스 인 몰큘러 플랜트 사이 언시스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 씨에이에스 센터 포 엑셀런스 인 몰큘러 플랜트 사이 언시스 filed Critical 씨에이에스 센터 포 엑셀런스 인 몰큘러 플랜트 사이 언시스
Publication of KR20200016268A publication Critical patent/KR20200016268A/en
Application granted granted Critical
Publication of KR102418138B1 publication Critical patent/KR102418138B1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P33/00Preparation of steroids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P33/00Preparation of steroids
    • C12P33/20Preparation of steroids containing heterocyclic rings

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Nutrition Science (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Physiology (AREA)
  • Botany (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

본 발명은 글리코실트랜스퍼라제, 돌연변이체 및 이의 응용에 관한 것이다. 구체적으로, 글리코실트랜스퍼라제존재 하에서, 글리코실기 공여체의 글리코실기를 테트라시클릭트리터페노이드계 화합물의 C-3 부위의 히드록실기에 전이시켜; 글리코실화된 테트라시클릭트리터페노이드계 화합물을 형성하는 단계를 포함하고; 여기서, 상기 글리코실트랜스퍼라제는 SEQ ID NO.: 4로 표시되는 글리코실트랜스퍼라제 또는 이의 유도 폴리펩티드; 또는 SEQ ID NO.: 21로 표시되는 글리코실트랜스퍼라제 또는 이의 유도 폴리펩티드인 체외 글리코실화 방법을 제공한다.The present invention relates to glycosyltransferases, mutants and applications thereof. Specifically, in the presence of a glycosyltransferase, the glycosyl group of the glycosyl group donor is transferred to the hydroxyl group of the C-3 site of the tetracyclic triterpenoid compound; forming a glycosylated tetracyclic triterpenoid-based compound; wherein the glycosyltransferase is a glycosyltransferase represented by SEQ ID NO.: 4 or an inducible polypeptide thereof; or a glycosyltransferase represented by SEQ ID NO.: 21 or an in vitro glycosylation method thereof.

Description

글리코실트랜스퍼라제, 돌연변이체 및 이의 응용Glycosyltransferases, mutants and applications thereof

본 발명은 생물 기술 및 식물 생물학 분야에 관한 것으로, 구체적으로, 본 발명은 진세노사이드(ginsenoside) Rh2의 합성에 사용하기 위한 글리코실트랜스퍼라제, 글리코실트랜스퍼라제 돌연변이체 및 이의 응용에 관한 것이다.FIELD OF THE INVENTION The present invention relates to the fields of biological technology and plant biology, and in particular, the present invention relates to glycosyltransferases, glycosyltransferase mutants and applications thereof for use in the synthesis of the ginsenoside Rh2.

진세노사이드는 두릅나무과 인삼 속(예를 들어 인삼, 삼칠, 서양 인삼 등)의 주요 화설 물질로서, 근래 박과 식물 삼칠에서도 일부 진세노사이드를 발견하였다. 현재, 구내외 과학자들은 인삼, 삼칠 등 식물에서 적어도 100가지의 사포닌을 분리하였고, 진세노사이드는 트리테르페노이드 사포닌(triterpenoid saponins)에 속한다. 여기서, 일부 진세노사이드가 항 종양, 면역 조절, 항 피로, 심장 보호, 간 보호 등 기능을 비롯한 광범위한 생리적 기능 및 약용 가치를 갖는 갓을 확인하였다. 여기서, 여러 가지 사포닌은 임상에 사용되었고, 예를 들어, 진세노사이드 Rg3 모노머를 주요 성분으로 하는 약물 Shenyi 캡슐(Shenyi Capsule)은 암 화자의 기허 증상을 개선할 수 있고, 유기체의 면역 기능을 향상시킨다. 진세노사이드 Rh2 모노머를 주요 성분으로 하는 Shenyi 캡슐(Jinxing capsule)은 건강 보조 약품은 유기체의 면역력을 향상시키고, 질병 저항력을 향상시키는데 사용된다.Ginsenosides are major chemical substances in the genus Araliaceae (eg, ginseng, ginseng, western ginseng, etc.). Currently, at least 100 kinds of saponins have been isolated from plants such as ginseng and ginseng, and ginsenosides belong to triterpenoid saponins. Here, it was identified that some ginsenosides have a wide range of physiological functions and medicinal values, including functions such as anti-tumor, immunomodulatory, anti-fatigue, cardioprotective, hepatoprotective, and the like. Here, various saponins have been used clinically, for example, the drug Shenyi Capsule containing ginsenoside Rg3 monomer as a main ingredient can improve the symptoms of giheo of cancer speakers, and improve the immune function of the organism. make it Shenyi capsules (Jinxing capsules) with ginsenoside Rh2 monomer as the main ingredient is a dietary supplement used to enhance the immunity of the organism and improve disease resistance.

구조적으로, 진세노사이드는 사포게닌의 글리코실기화에 의해 형성된 생물 활성 소분자이다. 진세노사이드의 사포게닌으로 제한된 몇 가지가 있고, 주로 담마란(dammarane)형의 프로토파녹사디올(protopanoxadiol) 및 프로토파녹사트리올, 및 올레난(oleanane)형의 아로마 수지이다. 사포게닌의 차이 외에, 진세노사이드 사이의 구조적 차이는 주로 사포게닌의 상이한 글리코실화 변형에 반영된다. 진세노사이드의 당 사슬은 일반적으로 사포게닌의 C3, C6, 또는 C20의 히드록실기에 결합되고, 글리코실기는 글루코스(glucose), 람노오스(rhamnose), 자일로스(xylos) 및 아라비노스(arabinose)일 수 있다.Structurally, ginsenosides are small biologically active molecules formed by glycosylation of sapogenin. There are several limited to sapogenin of ginsenoside, mainly dammarane-type protopanoxadiol and protopanoxadiol, and oleanane-type aroma resin. Besides differences in sapogenins, structural differences between ginsenosides are mainly reflected in the different glycosylation modifications of sapogenins. The sugar chain of ginsenoside is generally bonded to a C3, C6, or C20 hydroxyl group of sapogenin, and the glycosyl group is glucose, rhamnose, xylose, and arabinose. ) can be

상이한 글리코실기 결합 부위, 당 사슬 조성 및 길이는 진세노사이드가 생리 기능 및 약용 가치에서 최대의 차이를 가지도록 한다. 예를 들어, 진세노사이드 Rb1, 진세노사이드 Rd 및 진세노사이드 Rc는 모두 프로토파녹사디올을 사포게닌의 사포닌으로 하고, 이들 사이의 차이는 글리코실기 변형에서의 차이일 뿐이지만, 이들 사이의 생리 기능에는 많은 차이가 있다. Rb1은 중심 뉴런 계통을 안정시키는 기능이 있으나, Rc의 기능은 중심 뉴런 계통을 억제하는 기능으로, Rb1의 생리 기능이 매우 광범위하나, Rd는 매우 제한적이 몇 가지 기능만을 갖는다.Different glycosyl group binding sites, sugar chain composition and length allow ginsenosides to have the greatest difference in physiological function and medicinal value. For example, ginsenoside Rb1, ginsenoside Rd and ginsenoside Rc all use protopanoxadiol as a saponin of sapogenin, and the difference between them is only a difference in glycosyl group modification, but the difference between them is There are many differences in physiological function. Rb1 has a function of stabilizing the central neuronal system, but Rc's function is a function of suppressing the central neuronal system.

희귀 진세노사이드는 인삼 함량이 매우 낮은 사포닌이다. 진세노사이드 Rh2(3-O-β-(D-glucopyranosyl)-20(S)-protopanaxadiol)는 프로토파녹사디올계의 사포닌에 속하고, 사포게닌의 C-3 부위의 히드록실기에 하나의 글루코실기가 연결된 것이다. 진세노사이드 Rh2의 함량은 약 인삼 건조 중량의 1만분의 1 정도에 불과하지만, 진세노사이드 Rh2는 우수한 항 종양 화설을 가지고, 인삼에서 가장 중요한 항 종양 활성 성분 중의 하나이며, 종양 세포 성장을 억제하고, 종양 세포 사멸을 유도하며, 종양 전이에 저항할 수 있다. 연구 결과에 따르면, 진세노사이드 Rh2는 lung cancer cells 3LL (mice), Morris liver cancer cells (rats), B-16 melanoma cells (mice), 및 HeLa cells (human)의 증식을 억제할 수 있는 것으로 나타났다. 임상에서, 진세노사이드 Rh2는 방사선 요법 또는 화학 요법과 병용하여, 방사선 요법 및 화학 요법 효과를 증가시킬 수 있다. 이 외, 진세노사이드 Rh2는 또한 항 알레르기 효과가 있고, 유기체 면역력을 향상시키며, NO 및 PGE에 의한 염증을 억제하는 등 작용도 있다.Rare ginsenosides are saponins with very low ginseng content. Ginsenoside Rh2 (3-O-β-(D-glucopyanosyl)-20(S)-protopanaxadiol) belongs to the saponins of the protopanaxadiol family, and has one A glucosyl group is linked. Although the content of ginsenoside Rh2 is only about 1/10,000 of the dry weight of ginseng, ginsenoside Rh2 has excellent anti-tumor properties, is one of the most important anti-tumor active ingredients in ginseng, and inhibits tumor cell growth It can induce tumor cell death and resist tumor metastasis. According to the study results, ginsenoside Rh2 was shown to be able to inhibit the proliferation of lung cancer cells 3LL (mice), Morris liver cancer cells (rats), B-16 melanoma cells (mice), and HeLa cells (human). . In clinical practice, ginsenoside Rh2 can be used in combination with radiation therapy or chemotherapy to increase the effect of radiation therapy and chemotherapy. In addition, ginsenoside Rh2 also has an anti-allergic effect, improves organism immunity, and inhibits inflammation caused by NO and PGE.

글리코실트랜스퍼라제의 기능은 글리코실기 공여체(뉴클레오시드디포스페이트당(Nucleoside diphosphate sugar), 예를 들어 UDP-글루코스)의 글리코실기가 상이한 글리코실기수용체에 전이된다. 아미노산 서열이 상이함에 따라, 현재 글리코실트랜스퍼라제는 94개 패밀리가 있다. 현재 시퀀싱된 식물 게놈에서, 100 여가지의 상이한 글리코실트랜스퍼라제가 발견되었다. 이러한 글리코실트랜스퍼라제의 글리코실기 수용체는 당, 지질, 단백질, 핵산, 항생제 및 기타 소분자를 포함한다. 인삼에서 사포닌글리코실화에 관여하는 글리코실트랜스퍼라제는 글리코실기 공여체의 글리코실기를 사포게닌 또는 아글리콘의 C3, C6 또는 C20의 히드록실기에 전이시켜 상이한 약용 가치가 있는 사포닌을 형성하는 역할을 한다.The function of glycosyltransferase is transferred to a glycosyl acceptor different from the glycosyl group of a glycosyl group donor (Nucleoside diphosphate sugar, for example UDP-glucose). Due to their different amino acid sequences, there are currently 94 families of glycosyltransferases. In the currently sequenced plant genome, over 100 different glycosyltransferases have been found. Glycosyl receptors of such glycosyltransferases include sugars, lipids, proteins, nucleic acids, antibiotics and other small molecules. Glycosyltransferase involved in saponin glycosylation in ginseng plays a role in transferring the glycosyl group of the glycosyl group donor to the hydroxyl group of sapogenin or C3, C6 or C20 of aglycone to form saponins with different medicinal value. .

현재, 당 업계에서 희귀 진세노사이드 Rh2, 진세노사이드 F2를 생성하는 효과적인 방법이 결여되어 있으므로, 다양한 특이적이고 효율이 높은 글리코실트랜스퍼라제를 개발하는 것이 시급하다.At present, there is a lack of effective methods for generating the rare ginsenoside Rh2 and ginsenoside F2 in the art, so it is urgent to develop various specific and highly efficient glycosyltransferases.

본 발명의 목적은 희귀 진세노사이드 Rh2, 진세노사이드 F2 합성하기 위한 글리코실트랜스퍼라제 및 이의 용도를 제공하고자 한다.An object of the present invention is to provide a glycosyltransferase for synthesizing rare ginsenoside Rh2 and ginsenoside F2, and uses thereof.

본 발명의 제1 양태에서, 분리된 폴리펩티드를 제공하고,In a first aspect of the invention there is provided an isolated polypeptide,

(1) 상기 분리된 폴리펩티드의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제222 부위에서의 아미노산 잔기는 Gln이 아니거나, 및/또는 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제322 부위의 아미노산 잔기는 Ala가 아니며;(1) the amino acid residue at site 222, in which the amino acid sequence of the isolated polypeptide corresponds to the amino acid sequence shown in SEQ ID NO: 19, is not Gin, and/or the amino acid sequence shown in SEQ ID NO: 19 the amino acid residue at site 322 corresponding to Ala is not;

(2) 상기 분리된 폴리펩티드의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제247 부위에서의 아미노산 잔기는 Asn(N)이 아니거나, 및/또는 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제280 부위에서의 아미노산 잔기는 Lys(K)가 아니다.(2) the amino acid residue at site 247, wherein the amino acid sequence of the isolated polypeptide corresponds to the amino acid sequence shown in SEQ ID NO: 19, is not Asn (N), and/or as shown in SEQ ID NO: 19 The amino acid residue at the 280th site corresponding to the amino acid sequence is not Lys(K).

다른 바람직한 예에서, 상기 분리된 폴리펩티드는,In another preferred embodiment, the isolated polypeptide comprises:

i). SEQ ID NO: 19로 표시되는 아미노산 서열을 갖고 제222 부위의 아미노산 잔기는 Gln이 아니거나, 및/또는 제322 부위의 아미노산 잔기는 Ala가 아니거나, 또는i). has the amino acid sequence shown in SEQ ID NO: 19 and the amino acid residue at site 222 is not Gln, and/or the amino acid residue at site 322 is not Ala, or

ⅱ). i)에서 한정된 서열에 하나 또는 복수 개의 아미노산 잔기, 바람직하게는 1 ~ 20개, 보다 바람직하게는 1 ~ 15개, 더 바람직하게는 1 ~ 10개, 보다 더 바람직하게는 1 ~ 3개, 가장 바람직하게는 1개의 아미노산 잔기를 치환, 결실 또는 부가하여 형성된 서열을 갖고, i)에서 한정된 분리된 폴리펩티드 기능을 대체로 가지며 i)로부터 유도된 분리된 폴리펩티드이다.ii). One or a plurality of amino acid residues in the sequence defined in i), preferably 1 to 20, more preferably 1 to 15, more preferably 1 to 10, even more preferably 1 to 3, most It is an isolated polypeptide derived from i), preferably having a sequence formed by the substitution, deletion or addition of one amino acid residue, generally having the isolated polypeptide function defined in i).

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드는,In another preferred embodiment, the isolated polypeptide comprises:

i). SEQ ID NO: 19로 표시되는 아미노산 서열을 갖고 제247 부위의 아미노산 잔기는 Asn(N)이 아니거나, 및/또는 제280 부위의 아미노산 잔기는 Lys(K)가 아니거나, 또는i). has the amino acid sequence shown in SEQ ID NO: 19 and the amino acid residue at site 247 is not Asn(N), and/or the amino acid residue at site 280 is not Lys(K), or

ⅱ). i)에서 한정된 서열에 하나 또는 복수 개의 아미노산 잔기, 바람직하게는 1 ~ 20개, 보다 바람직하게는 1 ~ 15개, 더 바람직하게는 1 ~ 10개, 보다 더 바람직하게는 1 ~ 3개, 가장 바람직하게는 1개의 아미노산 잔기를 치환, 결실 또는 부가하여 형성된 서열을 갖고, i)에서 한정된 분리된 폴리펩티드 기능을 대체로 가지며 i)로부터 유도된 분리된 폴리펩티드이다.ii). One or a plurality of amino acid residues in the sequence defined in i), preferably 1 to 20, more preferably 1 to 15, more preferably 1 to 10, even more preferably 1 to 3, most It is an isolated polypeptide derived from i), preferably having a sequence formed by the substitution, deletion or addition of one amino acid residue, generally having the isolated polypeptide function defined in i).

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드는 i)에서 한정된 서열에 하나 또는 복수 개의 아미노산 잔기, 바람직하게는 1 ~ 20개, 보다 바람직하게는 1 ~ 15개, 더 바람직하게는 1 ~ 10개, 보다 더 바람직하게는 1 ~ 3개, 가장 바람직하게는 1개의 아미노산 잔기를 치환, 결실 또는 부가하여 형성된 서열을 갖고, i)에서 한정된 분리된 폴리펩티드 기능을 대체로 가지며 i)로부터 유도된 분리된 폴리펩티드이다.In another preferred embodiment, said isolated polypeptide comprises one or more amino acid residues, preferably 1-20, more preferably 1-15, more preferably 1-10 amino acid residues in the sequence defined in i), even more preferably an isolated polypeptide derived from i) having a sequence formed by substitution, deletion or addition of 1 to 3, most preferably 1 amino acid residue, generally having the isolated polypeptide function defined in i) .

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제222 부위에서의 아미노산 잔기는 His, Asn, Gln, Lys 및 Arg 중의 적어도 하나의 아미노산으로부터 선택된다.In another preferred embodiment, the amino acid residue at site 222, in which the amino acid sequence of the isolated polypeptide corresponds to the amino acid sequence shown in SEQ ID NO: 19, is selected from at least one of His, Asn, Gin, Lys and Arg. is chosen

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제222 부위에서의 아미노산 잔기는 His이다.In another preferred embodiment, the amino acid residue at the 222 position in which the amino acid sequence of the isolated polypeptide corresponds to the amino acid sequence shown in SEQ ID NO: 19 is His.

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제322 부위에서의 아미노산 잔기는 Val, Ile, Leu, Met 및 Phe 중의 적어도 하나의 아미노산으로부터 선택된다.In another preferred embodiment, the amino acid residue at position 322, in which the amino acid sequence of the isolated polypeptide corresponds to the amino acid sequence shown in SEQ ID NO: 19, is selected from at least one of Val, Ile, Leu, Met and Phe. is chosen

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제322 부위에서의 아미노산 잔기는 Val이다.In another preferred embodiment, the amino acid residue at the 322 position corresponding to the amino acid sequence of the isolated polypeptide corresponds to the amino acid sequence shown in SEQ ID NO: 19 is Val.

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제222 부위에서의 아미노산 잔기는 His이고, SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제322 부위의 아미노산 잔기는 Val이다.In another preferred embodiment, the amino acid residue at position 222 in which the amino acid sequence of the isolated polypeptide corresponds to the amino acid sequence shown in SEQ ID NO: 19 is His, and corresponds to the amino acid sequence shown in SEQ ID NO: 19 The amino acid residue at site 322 to be used is Val.

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제247 부위에서의 아미노산 잔기는 Ser(S), Pro(P), Ala(A) 또는 Thr(T) 중의 적어도 하나의 아미노산으로부터 선택된다.In another preferred embodiment, the amino acid residue at site 247, in which the amino acid sequence of the isolated polypeptide corresponds to the amino acid sequence shown in SEQ ID NO: 19, is Ser(S), Pro(P), Ala(A) or at least one amino acid of Thr(T).

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제247 부위에서의 아미노산 잔기는 Ser(S)이다.In another preferred embodiment, the amino acid residue at site 247 in which the amino acid sequence of the isolated polypeptide corresponds to the amino acid sequence shown in SEQ ID NO: 19 is Ser(S).

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제280 부위에서의 아미노산 잔기는 Ile(I), Asn(N), Ser(S) 또는 Alan(A) 중의 적어도 하나의 아미노산으로부터 선택된다.In another preferred embodiment, the amino acid residue at position 280, in which the amino acid sequence of the isolated polypeptide corresponds to the amino acid sequence shown in SEQ ID NO: 19, is Ile(I), Asn(N), Ser(S) or at least one amino acid of Alan (A).

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제280 부위에서의 아미노산 잔기는 Ile(I)이다.In another preferred embodiment, the amino acid residue at position 280 in which the amino acid sequence of the isolated polypeptide corresponds to the amino acid sequence shown in SEQ ID NO: 19 is Ile(I).

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제247 부위에서의 아미노산 잔기는 Ser(S)이고, SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제280 부위에서의 아미노산 잔기는 Ile(I)이다.In another preferred embodiment, the amino acid residue at site 247 in which the amino acid sequence of the isolated polypeptide corresponds to the amino acid sequence shown in SEQ ID NO: 19 is Ser (S), and the amino acid shown in SEQ ID NO: 19 The amino acid residue at site 280 corresponding to the sequence is Ile(I).

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드는,In another preferred embodiment, the isolated polypeptide comprises:

ⅲ). SEQ ID NO: 19로 표시되는 아미노산 서열을 갖고 제222 부위의 아미노산 잔기는 Gln이 아니거나, 및/또는 제322 부위의 아미노산 잔기는 Ala가 아니며, 또는iii). has the amino acid sequence shown in SEQ ID NO: 19 and the amino acid residue at site 222 is not Gln, and/or the amino acid residue at site 322 is not Ala, or

iv). ⅲ)에서 한정된 서열에 하나 또는 복수 개의 아미노산 잔기, 바람직하게는 1 ~ 20개, 보다 바람직하게는 1 ~ 15개, 더 바람직하게는 1 ~ 10개, 보다 더 바람직하게는 1 ~ 3개, 가장 바람직하게는 1개의 아미노산 잔기를 치환, 결실 또는 부가하여 형성된 서열을 갖고, ⅲ)에서 한정된 분리된 폴리펩티드 기능을 대체로 가지며 ⅲ)으로부터 유도된 분리된 폴리펩티드이다.iv). One or more amino acid residues in the sequence defined in iii), preferably 1 to 20, more preferably 1 to 15, more preferably 1 to 10, even more preferably 1 to 3, most It is an isolated polypeptide derived from iii), preferably having a sequence formed by the substitution, deletion or addition of one amino acid residue, generally having the isolated polypeptide function defined in iii).

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드는,In another preferred embodiment, the isolated polypeptide comprises:

ⅲ). SEQ ID NO: 19로 표시되는 아미노산 서열을 갖고 제247 부위의 아미노산 잔기는 Asn(N)이 아니거나, 및/또는 제280 부위의 아미노산 잔기는 Lys(K)가 아니거나, 또는iii). has the amino acid sequence shown in SEQ ID NO: 19 and the amino acid residue at site 247 is not Asn(N), and/or the amino acid residue at site 280 is not Lys(K), or

iv). ⅲ)에서 한정된 서열에 하나 또는 복수 개의 아미노산 잔기, 바람직하게는 1 ~ 20개, 보다 바람직하게는 1 ~ 15개, 더 바람직하게는 1 ~ 10개, 보다 더 바람직하게는 1 ~ 3개, 가장 바람직하게는 1개의 아미노산 잔기를 치환, 결실 또는 부가하여 형성된 서열을 갖고, ⅲ)에서 한정된 분리된 폴리펩티드 기능을 대체로 가지며 ⅲ)로부터 유도된 분리된 폴리펩티드이다.iv). One or more amino acid residues in the sequence defined in iii), preferably 1 to 20, more preferably 1 to 15, more preferably 1 to 10, even more preferably 1 to 3, most It is an isolated polypeptide derived from iii), preferably having a sequence formed by the substitution, deletion or addition of one amino acid residue, generally having the isolated polypeptide function defined in iii).

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드는 ⅲ)에서 한정된 서열에 하나 또는 복수 개의 아미노산 잔기, 바람직하게는 1 ~ 20개, 보다 바람직하게는 1 ~ 15개, 더 바람직하게는 1 ~ 10개, 보다 더 바람직하게는 1 ~ 3개, 가장 바람직하게는 1개의 아미노산 잔기를 치환, 결실 또는 부가하여 형성된 서열을 갖고, ⅲ)에서 한정된 분리된 폴리펩티드 기능을 대체로 가지며 ⅲ)으로부터 유도된 분리된 폴리펩티드이다.In another preferred embodiment, the isolated polypeptide comprises one or more amino acid residues in the sequence defined in iii), preferably 1 to 20, more preferably 1 to 15, more preferably 1 to 10, even more preferably having a sequence formed by the substitution, deletion or addition of 1 to 3 amino acid residues, most preferably 1 amino acid residue, generally having the isolated polypeptide function defined in iii) and is an isolated polypeptide derived from iii) .

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열의 제222 부위에서의 아미노산 잔기는 His, Asn, Gln, Lys 및 Arg 중의 적어도 하나의 아미노산으로부터 선택된다.In another preferred embodiment, the amino acid residue at position 222 of the amino acid sequence of the amino acid sequence of the isolated polypeptide is represented by SEQ ID NO: 19 is selected from at least one of His, Asn, Gln, Lys and Arg. .

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열의 제222 부위에서의 아미노산 잔기는 His이다.In another preferred embodiment, the amino acid residue at position 222 of the amino acid sequence of the isolated polypeptide is represented by SEQ ID NO: 19 is His.

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열의 제322 부위에서의 아미노산 잔기는 Val, Ile, Leu, Met 및 Phe 중의 적어도 하나의 아미노산으로부터 선택된다.In another preferred embodiment, the amino acid residue at position 322 of the amino acid sequence of the amino acid sequence of the isolated polypeptide is represented by SEQ ID NO: 19 is selected from at least one of Val, Ile, Leu, Met and Phe. .

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열의 제322 부위에서의 아미노산 잔기는 Val이다.In another preferred embodiment, the amino acid residue at position 322 of the amino acid sequence of the isolated polypeptide is shown in SEQ ID NO: 19 is Val.

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열의 제222 부위에서의 아미노산 잔기는 His이고, SEQ ID NO: 19로 표시되는 아미노산 서열의 제322 부위에서의 아미노산 잔기는 Val이다.In another preferred embodiment, the amino acid residue at position 222 of the amino acid sequence of the amino acid sequence shown in SEQ ID NO: 19 of the isolated polypeptide is His, and the amino acid residue at position 322 of the amino acid sequence shown in SEQ ID NO: 19 The amino acid residue in is Val.

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열의 제247 부위에서의 아미노산 잔기는 Ser(S), Pro(P), Ala(A) 또는 Thr(T) 중의 적어도 하나의 아미노산으로부터 선택된다.In another preferred embodiment, the amino acid residue at position 247 of the amino acid sequence, wherein the amino acid sequence of the isolated polypeptide is represented by SEQ ID NO: 19 is Ser(S), Pro(P), Ala(A) or Thr( T) at least one amino acid.

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열의 제247 부위에서의 아미노산 잔기는 Ser(S)이다.In another preferred embodiment, the amino acid residue at position 247 of the amino acid sequence of the amino acid sequence of the isolated polypeptide is represented by SEQ ID NO: 19 is Ser(S).

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드의 아미노산 서이 SEQ ID NO: 19로 표시되는 아미노산 서열의 제280 부위에서의 아미노산 잔기는 Ile(I), Asn(N), Ser(S) 또는 Alan(A) 중의 적어도 하나의 아미노산으로부터 선택된다.In another preferred embodiment, the amino acid residue at position 280 of the amino acid sequence shown in SEQ ID NO: 19 in the amino acid sequence of the isolated polypeptide is Ile(I), Asn(N), Ser(S) or Alan(A) ) is selected from at least one amino acid.

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열의 제280 부위에서의 아미노산 잔기는 Ile(I)이다.In another preferred embodiment, the amino acid residue at position 280 of the amino acid sequence of the isolated polypeptide is shown in SEQ ID NO: 19 is Ile(I).

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열의 제247 부위에서의 아미노산 잔기는 Ser(S)이고, SEQ ID NO: 19로 표시되는 아미노산 서열의 제280 부위에서의 아미노산 잔기는 Ile(I)이다.In another preferred embodiment, the amino acid residue at position 247 of the amino acid sequence represented by SEQ ID NO: 19 in the amino acid sequence of the isolated polypeptide is Ser (S), and the amino acid sequence represented by SEQ ID NO: 19 The amino acid residue at site 280 is Ile(I).

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드는 글리코실트랜스퍼라제이다.In another preferred embodiment, the isolated polypeptide is a glycosyltransferase.

또 다른 바람직한 예에서, 상기 글리코실트랜스퍼라제는 인삼 속 식물로부터 유래된다.In another preferred embodiment, the glycosyltransferase is derived from a plant of the genus Ginseng.

또 다른 바람직한 예에서, 상기 글리코실트랜스퍼라제는 인삼, 서양 인삼 및/또는 삼칠로부터 유래된다.In another preferred embodiment, the glycosyltransferase is derived from ginseng, western ginseng and/or ginseng.

또 다른 바람직한 예에서, 상기 폴리펩티드는,In another preferred embodiment, the polypeptide comprises:

(a) SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 또는 SEQ ID NO.: 41로 표시되는 아미노산 서열을 갖는 폴리펩티드;(a) the amino acid sequence represented by SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 or SEQ ID NO.: 41 a polypeptide having;

(b) SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 또는 SEQ ID NO.: 41로 표시되는 아미노산 서열의 폴리펩티드에 하나 또는 복수 개, 바람직하게는 1 ~ 20개, 보다 바람직하게는 1 ~ 15개, 더 바람직하게는 1 ~ 10개, 보다 더 바람직하게는 1 ~ 3개, 가장 바람직하게는 1개의 아미노산 잔기를 치환, 결실 또는 부가하여 형성되거나, 신호 펩티드 서열 부가 후 형성되고, 글리코실트랜스퍼라제 활성을 갖는 유도 폴리펩티드;(b) of the amino acid sequence represented by SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 or SEQ ID NO.: 41 One or more amino acids in the polypeptide, preferably 1 to 20, more preferably 1 to 15, more preferably 1 to 10, even more preferably 1 to 3, most preferably 1 amino acid inducible polypeptides formed by substituting, deleting or adding residues or formed after addition of a signal peptide sequence and having glycosyltransferase activity;

(c) 서열에 (a) 또는 (b)에 따른 폴리펩티드 서열이 함유된 유도 폴리펩티드; (c) an inducible polypeptide comprising a polypeptide sequence according to (a) or (b) in its sequence;

(d) 아미노산 서열이 SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 또는 SEQ ID NO.: 41로 표시되는 아미노산 서열과 ≥85 %(바람직하게는, ≥ 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 99 %)의 상동성을 갖고, 글리코실트랜스퍼라제 활성을 갖는 유도 폴리펩티드로부터 선택된다.(d) the amino acid sequence is represented by SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 or SEQ ID NO.: 41 has ≥85% (preferably ≥90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%) homology to the amino acid sequence and contains glycosyl inducing polypeptides having transferase activity.

또 다른 바람직한 예에서, 상기 서열(c)는 (a) 또는 (b)에 태그 서열, 신호 서열 또는 분비 신호 서열을 부가하여 형성된 융합 단백질이다.In another preferred embodiment, the sequence (c) is a fusion protein formed by adding a tag sequence, a signal sequence or a secretion signal sequence to (a) or (b).

또 다른 바람직한 예에서, 상기 글리코실트랜스퍼라제 활성은 글리코실기 공여체의 글리코실기를 테트라시클릭트리터페노이드계(tetracyclic triterpenoids) 화합물의 C-3 부위의 히드록실기에 전이시킬 수 있는 활성을 지칭한다.In another preferred embodiment, the glycosyltransferase activity refers to an activity capable of transferring the glycosyl group of a glycosyl group donor to the hydroxyl group of the C-3 site of tetracyclic triterpenoids compounds. .

또 다른 바람직한 예에서, 상기 글리코실트랜스퍼라제는 진세노사이드 Rh2 및/또는 진세노사이드 F2의 산량을 향상시킬 수 있다.In another preferred embodiment, the glycosyltransferase may improve the acid content of ginsenoside Rh2 and/or ginsenoside F2.

또 다른 바람직한 예에서, 인공적으로 구축된 균주에서, 상기 글리코실트랜스퍼라제는 진세노사이드 Rh2의 산량을 향상시킬 수 있고; 바람직하게, 5 ~ 150 %로 향상시키며; 보다 바람직하게, 10 ~ 100 % 향상시키고; 더 바람직하게, 20 ~ 80 % 향상시키며; 가장 바람직하게, 28 ~ 70 % 향상시킨다.In another preferred example, in the artificially constructed strain, the glycosyltransferase can improve the acid content of the ginsenoside Rh2; preferably 5 to 150%; more preferably, 10 to 100% improvement; more preferably, 20 to 80% improvement; Most preferably, it improves by 28 to 70%.

또 다른 바람직한 예에서, 상기 인공적으로 구축된 균주는 출아형 효모 균주, 대장균 균주, 피치아파스토리스 균주, 분열효모 균주, 클루이베로마이세스 균주로부터 선택된다.In another preferred embodiment, the artificially constructed strain is selected from a budding yeast strain, an E. coli strain, a Pichia pastoris strain, a fission yeast strain, and a Kluyveromyces strain.

본 발명의 제2 양태에 있어서, 분리된 폴리 뉴클레오티드를 제공하였고, 상기 폴리 뉴클레오티드는,In the second aspect of the present invention, there is provided an isolated polynucleotide, wherein the polynucleotide comprises:

(A) 본 발명의 제1 양태에 따른 폴리펩티드를 코딩하는 뉴클레오티드 서열;(A) a nucleotide sequence encoding a polypeptide according to the first aspect of the present invention;

(B) SEQ ID NO.: 4 또는 SEQ ID NO.: 21로 표시되는 폴리펩티드 또는 이의 유도 폴리펩티드를 코딩하는 뉴클레오티드 서열;(B) a nucleotide sequence encoding a polypeptide represented by SEQ ID NO.: 4 or SEQ ID NO.: 21 or a derived polypeptide thereof;

(C) SEQ ID NO.: 3 SEQ ID NO.: 22, SEQ ID NO.: 36, SEQ ID NO.: 38, SEQ ID NO.: 40 또는 SEQ ID NO.: 42로 표시되는 뉴클레오티드 서열; (C) a nucleotide sequence represented by SEQ ID NO.: 3 SEQ ID NO.: 22, SEQ ID NO.: 36, SEQ ID NO.: 38, SEQ ID NO.: 40 or SEQ ID NO.: 42;

(D) SEQ ID NO.: 3 SEQ ID NO.: 22, SEQ ID NO.: 36, SEQ ID NO.: 38, SEQ ID NO.: 40 또는 SEQ ID NO.: 42로 표시되는 서열과 ≥ 90 %(바람직하게는, ≥ 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 99 %)의 상동성을 갖는 뉴클레오티드 서열;(D) SEQ ID NO.: 3 with the sequence represented by SEQ ID NO.: 22, SEQ ID NO.: 36, SEQ ID NO.: 38, SEQ ID NO.: 40 or SEQ ID NO.: 42 and >90 % (preferably ≥ 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % or 99 %) homology of nucleotide sequences;

(E) SEQ ID NO.: 3 SEQ ID NO.: 22, SEQ ID NO.: 36, SEQ ID NO.: 38, SEQ ID NO.: 40 또는 SEQ ID NO.: 42로 표시되는 뉴클레오티드 서열의 5’말단 및/또는 3’말단에 1 ~ 60개(바람직하게는 1 ~ 30개, 더 바람직하게는 1 ~ 10개)의 뉴클레오티드를 절단 또는 부가함으로써 형성된 뉴클레오티드 서열;(E) 5 of the nucleotide sequence represented by SEQ ID NO.: 3 SEQ ID NO.: 22, SEQ ID NO.: 36, SEQ ID NO.: 38, SEQ ID NO.: 40 or SEQ ID NO.: 42 a nucleotide sequence formed by cutting or adding 1 to 60 (preferably 1 to 30, more preferably 1 to 10) nucleotides at the 'end and/or 3' end;

(F) (A) ~ (E) 중 어느 하나에 따른 뉴클레오티드 서열에 상보적인 뉴클레오티드 서열로부터 선택된다.(F) a nucleotide sequence complementary to the nucleotide sequence according to any one of (A) to (E).

본 발명의 제3 양태에 있어서, 전달체를 제공하였고, 상기 전달체는 본 발명의 제2 양태에 따른 폴리 뉴클레오티드를 함유한다.In a third aspect of the present invention, there is provided a carrier, wherein the carrier contains the polynucleotide according to the second aspect of the present invention.

또 다른 바람직한 예에서, 상기 전달체는 발현 전달체, 셔틀 전달체, 통합 전달체를 포함한다.In another preferred embodiment, the transporter comprises an expression transporter, a shuttle transporter, and an integrated transporter.

본 발명의 제4 양태에 있어서, 본 발명의 제1 양태에 따른 분리된 폴리펩티드의 용도를 제공하였고, In a fourth aspect of the invention there is provided the use of an isolated polypeptide according to the first aspect of the invention,

(i) 글리코실기 공여체로부터 유래된 글리코실기를 테트라시클릭트리터페노이드계(tetracyclic triterpenoids) 화합물의 C-3 부위의 히드록실기에 전이시키는 반응에 촉매 작용을 하거나, 하기 반응에 촉매 작용을 하기 위한 촉매 제제의 제조에 사용된다.(i) catalyzing the reaction of transferring a glycosyl group derived from a glycosyl group donor to the hydroxyl group of the C-3 site of tetracyclic triterpenoids compounds, or catalyzing the following reaction used in the preparation of catalyst formulations for

또 다른 바람직한 예에서, 상기 글리코실기 공여체는 UDP-글루코스, ADP-글루코스, TDP-글루코스, CDP-글루코스, GDP-글루코스, UDP-아세틸글루코스, ADP-아세틸글루코스, TDP-아세틸글루코스, CDP-아세틸글루코스, GDP-아세틸글루코스, UDP-자일로스, ADP-자일로스, TDP-자일로스, CDP-자일로스, GDP-자일로스, UDP-자일로스, UDP-갈락투론산, ADP-갈락투론산, TDP-갈락투론산, CDP-갈락투론산, GDP-갈락투론산, UDP-갈락토스, ADP-갈락토스, TDP-갈락토스, CDP-갈락토스, GDP-갈락토스, UDP-아라비노스, ADP-아라비노스, TDP-아라비노스, CDP-아라비노스, GDP-아라비노스, UDP-람노오스, ADP-람노오스, TDP-람노오스, CDP-람노오스, GDP-람노오스 또는 기타 뉴클레오시드디포스페이트헥소스 또는 뉴클레오시드디포스페이트펜토스, 또는 이들의 조합으로부터 선택되는 뉴클레오시드디포스페이트당을 포함한다.In another preferred embodiment, the glycosyl group donor is UDP-glucose, ADP-glucose, TDP-glucose, CDP-glucose, GDP-glucose, UDP-acetylglucose, ADP-acetylglucose, TDP-acetylglucose, CDP-acetylglucose , GDP-acetylglucose, UDP-xylose, ADP-xylose, TDP-xylose, CDP-xylose, GDP-xylose, UDP-xylose, UDP-galacturonic acid, ADP-galacturonic acid, TDP- Galacturonic acid, CDP-galacturonic acid, GDP-galacturonic acid, UDP-galactose, ADP-galactose, TDP-galactose, CDP-galactose, GDP-galactose, UDP-arabinose, ADP-arabinose, TDP-arabinose , CDP-arabinose, GDP-arabinose, UDP-rhamnose, ADP-rhamnose, TDP-rhamnose, CDP-rhamnose, GDP-rhamnose or other nucleoside diphosphate hexose or nucleoside diphosphate a nucleoside diphosphate sugar selected from pentose, or a combination thereof.

또 다른 바람직한 예에서, 상기 글리코실기 공여체는 UDP-글루코스, UDP-자일로스, UDP-갈락투론산, UDP-갈락토스, UDP-아라비노스, UDP-람노오스, 또는 기타 피리딘디포스페이트헥소스 또는 피리딘디포스페이트펜토스, 또는 이들의 조합으로부터 선택되는 피리딘디포스페이트(UDP)당을 포함한다.In another preferred embodiment, the glycosyl group donor is UDP-glucose, UDP-xylose, UDP-galacturonic acid, UDP-galactose, UDP-arabinose, UDP-rhamnose, or other pyridinediphosphate hexose or pyridinedi a pyridinediphosphate (UDP) sugar selected from phosphatepentose, or a combination thereof.

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드는 하기반응에 촉매 작용을 하거나 하기 반응에 촉매 작용을 하기 위한 촉매 제제의 제조에 사용된다.In another preferred embodiment, the isolated polypeptide catalyzes the reaction or is used in the preparation of a catalyst formulation for catalyzing the reaction.

Figure 112019129682541-pct00001
Figure 112019129682541-pct00001

식 (I) 화합물 식(Ⅱ) 화합물; Formula (I) compound Formula (II) compound;

상기 식에서, R1은 H 또는 OH이고; R2는 H 또는 OH이며; R3은 H 또는 글리코실기이고; R4는 글리코실기이다.wherein R 1 is H or OH; R2 is H or OH; R3 is H or a glycosyl group; R4 is a glycosyl group.

또 다른 바람직한 예에서, 상기 분리된 폴리펩티드는 하기 반응에 촉매 작용을 하거나 하기 반응에 촉매 작용을 하기 위한 촉매 제제의 제조에 사용된다.In another preferred embodiment, the isolated polypeptide catalyzes or is used in the preparation of a catalyst formulation for catalyzing a reaction.

Figure 112019129682541-pct00002
Figure 112019129682541-pct00002

Figure 112019129682541-pct00003
Figure 112019129682541-pct00003

상기 폴리펩티드는 SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 또는 SEQ ID NO.: 41로 표시되는 폴리펩티드 또는 이의 유도 폴리펩티드로부터 선택된다.The polypeptide is a polypeptide represented by SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 or SEQ ID NO.: 41 or a polypeptide thereof inducible polypeptides.

또 다른 바람직한 예에서, 상기 글리코실기는 글루코실기(Glucosyl group), 갈락투론산기(Galacturonic acid group), 자일로스글리코실기(Xylose glycosyl group), 갈락토실기(Galactosyl group), 아라비노실기(Arabinosyl group), 람노실기(Rhamnosyl group), 및 기타 헥소실기(Hexosyl group) 또는 펜토실기(Pentosyl group)로부터 선택된다.In another preferred embodiment, the glycosyl group is a glucosyl group, a galacturonic acid group, a xylose glycosyl group, a galactosyl group, an arabinosyl group. group), a rhamnosyl group, and other hexosyl groups or pentosyl groups.

또 다른 바람직한 예에서, 상기 반응(A) 및/또는 (B)의 반응 산물은 S 배열 또는 R 배열의 담마란형의 테트라시클릭트리터페노이드계 화합물, 라놀린(Lanolin)형의 테트라시클릭트리터페노이드계 화합물, apotirucallane형의 테트라시클릭트리테르페노이드(tetracyclic triterpenoids), 티루칼라네스(Tirucallanes)형의 테트라시클릭트리터페노이드계 화합물, 시클로아탄(시클로알탄)(cycloartane)형의 테트라시클릭트리터페노이드계 화합물, 쿠커비탄(Cucurbitane)형의 테트라시클릭트리터페노이드계 화합물, 또는 멜리아칸(Decane)형의 테트라시클릭트리터페노이드계 화합물을 포함한다(하지만 이에 한정되지 않음).In another preferred embodiment, the reaction product of the reactions (A) and/or (B) is a dammaran-type tetracyclic triterpenoid compound of S configuration or R configuration, and a tetracyclic tree of Lanolin type. Terpenoid compounds, apotirucallane type tetracyclic triterpenoids, Tirucallanes type tetracyclic triterpenoid compounds, cycloartane type tetracy and a click triterpenoid compound, a Cucurbitane type tetracyclic triterpenoid compound, or a meliacan (Decane) type tetracyclic triterpenoid compound (but not limited thereto).

본 발명의 제5 양태에 있어서, 체외 글리코실화 방법을 제공하였고,In a fifth aspect of the present invention, there is provided a method for in vitro glycosylation,

글리코실트랜스퍼라제존재 하에서, 글리코실기 공여체의 글리코실기를 테트라시클릭트리터페노이드계 화합물의 C-3 부위의 히드록실기에 전이시켜 글리코실화된 테트라시클릭트리터페노이드계 화합물를 형성하는 단계를 포함하고;Transferring the glycosyl group of the glycosyl group donor to the hydroxyl group at the C-3 site of the tetracyclic triterpenoid compound in the presence of a glycosyltransferase to form a glycosylated tetracyclic triterpenoid compound do;

여기서, 상기 글리코실트랜스퍼라제는 본 발명의 제1 양태에 따른 폴리펩티드 또는 이의 유도 폴리펩티드이다.Herein, the glycosyltransferase is a polypeptide according to the first aspect of the present invention or a derived polypeptide thereof.

또 다른 바람직한 예에서, 상기 유도 폴리펩티드는,In another preferred embodiment, the inducing polypeptide comprises:

SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 또는 SEQ ID NO.: 41로 표시되는 아미노산 서열에 폴리펩티드 하나 또는 복수 개의 아미노산 잔기를 치환, 결실 또는 부가하여 형성되거나, 신호 펩티드 서열 부가 후 형성되고, 글리코실트랜스퍼라제 활성을 갖는 유도 폴리펩티드; 또는one polypeptide in the amino acid sequence represented by SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 or SEQ ID NO.: 41; an inducible polypeptide formed by substituting, deleting or adding a plurality of amino acid residues, or formed after addition of a signal peptide sequence, and having glycosyltransferase activity; or

아미노산 서열이 SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 또는 SEQ ID NO.: 41 아미노산 서열과 ≥ 85 %(바람직하게는, ≥ 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 %)의 상동성을 갖고, 글리코실트랜스퍼라제 활성을 갖는 유도 폴리펩티드로부터 선택되며;the amino acid sequence is ≥ 85% with the amino acid sequence of SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 or SEQ ID NO.: 41 (preferably ≥ 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%) of homology and induction with glycosyltransferase activity polypeptides;

여기서, 상기 글리코실트랜스퍼라제 활성은 글리코실기 공여체의 글리코실기를 테트라시클릭트리터페노이드계 화합물의 C-3 부위의 히드록실기에 전이시킬 수 있는 활성을 지칭한다.Here, the glycosyltransferase activity refers to an activity capable of transferring the glycosyl group of the glycosyl group donor to the hydroxyl group of the C-3 site of the tetracyclic triterpenoid compound.

본 발명의 제6 양태에 있어서, 글본 발명의 제1 양태에 따른 폴리펩티드 또는 이의 유도 폴리펩티드 존재 하에서 글리코실 촉매 반응을 수행하는 단계를 포함하는 리코실 촉매 반응을 수행하는 방법을 제공하였다.In a sixth aspect of the present invention, there is provided a method for performing a lycosyl catalyzed reaction comprising performing a glycosyl catalyzed reaction in the presence of a polypeptide according to the first aspect of the present invention or a derived polypeptide thereof.

또 다른 바람직한 예에서, 상기 방법은,In another preferred embodiment, the method comprises:

글리코실기 공여체 및 본 발명의 제1 양태에 따른 폴리펩티드 또는 이의 유도 폴리펩티드의 존재 하에서, 식 (I) 화합물을상기 식 (Ⅱ) 화합물로 전환시키는 단계를 더 포함한다.The method further comprises converting the compound of formula (I) into the compound of formula (II) in the presence of a glycosyl group donor and the polypeptide according to the first aspect of the present invention or a derived polypeptide thereof.

또 다른 바람직한 예에서, 상기 식 (I) 화합물은 프로토파녹사디올 PPD이고, 또한 식 (Ⅱ) 화합물은 진세노사이드 Rh2이거나; 또는 In another preferred embodiment, the compound of formula (I) is protophanoxadiol PPD, and the compound of formula (II) is the ginsenoside Rh2; or

상기 식 (I) 화합물은 화합물 K(Compound K)이고, 또한 식 (II) 화합물은 진세노사이드 F2이다.The compound of formula (I) is compound K (Compound K), and the compound of formula (II) is ginsenoside F2.

또 다른 바람직한 예에서, 상기 방법은 상기 폴리펩티드 및 이의 유도 폴리펩티드를 각각 촉매 반응에 첨가하는 단계; 및/또는 In another preferred embodiment, the method comprises the steps of adding each of the polypeptide and its derivative polypeptide to a catalytic reaction; and/or

상기 폴리펩티드 및 이의 유도 폴리펩티드를 촉매 반응에 동시에 첨가하는 단계를 더 포함한다.The method further comprises the step of simultaneously adding the polypeptide and its derivative polypeptide to the catalytic reaction.

또 다른 바람직한 예에서, 상기 방법은 글리코실트랜스퍼라제를 코딩하는 뉴클레오티드 서열은 다마렌디올 및/또는 프로토파녹사디올 합성대사 경로에서의 관건적인 유전자 및/또는 기타 글리코실트랜스퍼라제 유전자와 숙주 세포에서 공동 발현되어 상기 식 (Ⅱ) 화합물을 얻는 단계를 더 포함한다.In another preferred embodiment, the method comprises a nucleotide sequence encoding a glycosyltransferase in a host cell with a key gene and/or other glycosyltransferase gene in the damarendiol and/or protopanoxadiol metabolic pathway. It further comprises the step of co-expressing to obtain the compound of formula (II).

또 다른 바람직한 예에서, 상기 식 (Ⅱ) 화합물은 진세노사이드 Rh2 또는 진세노사이드 F2이다.In another preferred embodiment, the compound of formula (II) is ginsenoside Rh2 or ginsenoside F2.

또 다른 바람직한 예에서, 상기 숙주 세포는 효모균 또는 대장균이다.In another preferred embodiment, the host cell is yeast or Escherichia coli.

또 다른 바람직한 예에서, 상기 방법은 반응 체계에 효소 활성 조절용 첨가물을 제공하는 단계를 더 포함한다.In another preferred embodiment, the method further comprises providing an additive for regulating enzyme activity to the reaction system.

또 다른 바람직한 예에서, 상기 효소 활성 조절용 첨가물은 효소 활성을 향상시키거나 효소 활성을 억제시키는 첨가물이다.In another preferred embodiment, the additive for regulating enzyme activity is an additive for enhancing enzyme activity or inhibiting enzyme activity.

또 다른 바람직한 예에서, 상기 효소 활성 조절용 첨가물은 Ca2 +, Co2 +, Mn2 +, Ba2+, Al3+, Ni2+, Zn2+ 또는 Fe2+로부터 선택된다.In another preferred embodiment, the additive for regulating enzyme activity is selected from Ca 2+ , Co 2+ , Mn 2+ , Ba 2+ , Al 3+ , Ni 2+ , Zn 2+ or Fe 2+ .

또 다른 바람직한 예에서, 상기 효소 활성 조절용 첨가물은 Ca2 +, Co2 +, Mn2 +, Ba2+, Al3+, Ni2+, Zn2+ 또는 Fe2+의 물질을 생성할 수 있다.In another preferred embodiment, the additive for regulating enzyme activity may produce a material of Ca 2+ , Co 2+ , Mn 2+ , Ba 2+ , Al 3+ , Ni 2+ , Zn 2+ or Fe 2+ . .

또 다른 바람직한 예에서, 상기 글리코실기 공여체는 뉴클레오시드디포스페이트당이고, UDP-글루코스, ADP-글루코스, TDP-글루코스, CDP-글루코스, GDP-글루코스, UDP-아세틸글루코스, ADP-아세틸글루코스, TDP-아세틸글루코스, CDP-아세틸글루코스, GDP-아세틸글루코스, UDP-자일로스, ADP-자일로스, TDP-자일로스, CDP-자일로스, GDP-자일로스, UDP-자일로스, UDP-갈락투론산, ADP-갈락투론산, TDP-갈락투론산, CDP-갈락투론산, GDP-갈락투론산, UDP-갈락토스, ADP-갈락토스, TDP-갈락토스, CDP-갈락토스, GDP-갈락토스, UDP-아라비노스, ADP-아라비노스, TDP-아라비노스, CDP-아라비노스, GDP-아라비노스, UDP-람노오스, ADP-람노오스, TDP-람노오스, CDP-람노오스, GDP-람노오스 또는 기타 뉴클레오시드디포스페이트헥소스 또는 뉴클레오시드디포스페이트펜토스 또는 이들의 조합으로부터 선택된다.In another preferred embodiment, the glycosyl group donor is a nucleoside diphosphate sugar, UDP-glucose, ADP-glucose, TDP-glucose, CDP-glucose, GDP-glucose, UDP-acetylglucose, ADP-acetylglucose, TDP -Acetylglucose, CDP-acetylglucose, GDP-acetylglucose, UDP-xylose, ADP-xylose, TDP-xylose, CDP-xylose, GDP-xylose, UDP-xylose, UDP-galacturonic acid, ADP-galacturonic acid, TDP-galacturonic acid, CDP-galacturonic acid, GDP-galacturonic acid, UDP-galactose, ADP-galactose, TDP-galactose, CDP-galactose, GDP-galactose, UDP-arabinose, ADP -arabinose, TDP-arabinose, CDP-arabinose, GDP-arabinose, UDP-rhamnose, ADP-rhamnose, TDP-rhamnose, CDP-rhamnose, GDP-rhamnose or other nucleoside diphosphate hexose or nucleoside diphosphate pentose or combinations thereof.

또 다른 바람직한 예에서, 상기 글리코실기 공여체는 피리딘디포스페이트당이고, UDP-글루코스, UDP-자일로스, UDP-갈락투론산, UDP-갈락토스, UDP-아라비노스, UDP-람노오스 또는 기타 피리딘디포스페이트헥소스 또는 피리딘디포스페이트펜토스 또는 이들의 조합으로부터 선택된다.In another preferred embodiment, the glycosyl group donor is a pyridinediphosphate sugar, UDP-glucose, UDP-xylose, UDP-galacturonic acid, UDP-galactose, UDP-arabinose, UDP-rhamnose or other pyridinediphosphate hexose or pyridinediphosphatepentose or combinations thereof.

또 다른 바람직한 예에서, 반응체계의 pH는 pH4.0 ~ 10.0이고, 바람직하게 pH는 5.5 ~ 9.0이다.In another preferred embodiment, the pH of the reaction system is pH4.0 to 10.0, preferably, the pH is 5.5 to 9.0.

또 다른 바람직한 예에서, 반응 체계의 온도는 10 ~ 105 ℃이고, 바람직하게 온도는 20 ~ 50 ℃이다.In another preferred embodiment, the temperature of the reaction regime is between 10 and 105 °C, preferably between 20 and 50 °C.

또 다른 바람직한 예에서, 상기 다마렌디올 합성대사 경로에서의 관건적인 유전자는 다마렌디올 합성 효소 유전자를 포함한다(하지만 이에 한정되지 않음).In another preferred embodiment, the key gene in the damarendiol metabolic pathway includes (but is not limited to) a damarendiol synthase gene.

또 다른 바람직한 예에서, 상기 프로토파녹사디올 합성대사 경로에서의 관건적인 유전자는 다마렌디올 합성 효소 유전자, 프로토파녹사디올로 합성된 시토크롬 P450 유전자 CYP716A47 및 이의 환전 효소 유전자 또는 이들의 조합을 포함한다(하지만 이에 한정되지 않음).In another preferred embodiment, the key genes in the protopanoxadiol metabolic pathway include a damarendiol synthase gene, a cytochrome P450 gene CYP716A47 synthesized from protopanoxadiol, and an exchange enzyme gene thereof, or a combination thereof. (but not limited to).

또 다른 바람직한 예에서, 상기 글리코실기 촉매 반응의 기질은 식 (I) 화합물이고, 상기 산물은 식 (Ⅱ) 화합물이다.In another preferred embodiment, the substrate of the glycosyl group catalyzed reaction is a compound of formula (I), and the product is a compound of formula (II).

또 다른 바람직한 예에서, 상기 식 (I) 화합물은 프로토파녹사디올 PPD이고, 식 (Ⅱ) 화합물은 진세노사이드 Rh2이거나; 또는 In another preferred embodiment, the compound of formula (I) is protophanoxadiol PPD, and the compound of formula (II) is the ginsenoside Rh2; or

상기 식 (I) 화합물은 화합물 K이고, 식 (Ⅱ) 화합물은 진세노사이드 F2이다.The compound of formula (I) is compound K, and the compound of formula (II) is ginsenoside F2.

본 발명의 제7 양태에 있어서, 유전자 조작된 숙주 세포를 제공하였고, 상기 숙주 세포는 본 발명의 제3 양태에 따른 전달체를 함유하거나, 또는 이의 게놈에 본 발명의 제2 양태에 따른 폴리 뉴클레오티드가 통합된다.In a seventh aspect of the present invention, there is provided a genetically engineered host cell, wherein the host cell contains the carrier according to the third aspect of the present invention, or in its genome the polynucleotide according to the second aspect of the present invention are integrated

또 다른 바람직한 예에서, 상기 글리코실트랜스퍼라제는 본 발명의 제1 양태에 따른 폴리펩티드 또는 이의 유도 폴리펩티드이다.In another preferred embodiment, the glycosyltransferase is a polypeptide according to the first aspect of the present invention or a derived polypeptide thereof.

또 다른 바람직한 예에서, 상기 글리코실트랜스퍼라제를 코딩하는 뉴클레오티드 서열은 본 발명의 제2 양태에 기재된 바와 같다.In another preferred embodiment, the nucleotide sequence encoding the glycosyltransferase is as described in the second aspect of the present invention.

또 다른 바람직한 예에서, 상기 세포는 원핵 세포 또는 진핵 세포이다.In another preferred embodiment, the cell is a prokaryotic cell or a eukaryotic cell.

또 다른 바람직한 예에서, 상기 숙주 세포는 효모 세포 또는 식물 세포와 같은 진핵 세포이다.In another preferred embodiment, the host cell is a eukaryotic cell such as a yeast cell or a plant cell.

또 다른 바람직한 예에서, 상기 숙주 세포는 출아형 효모 세포이다.In another preferred embodiment, the host cell is a budding yeast cell.

또 다른 바람직한 예에서, 상기 숙주 세포는 대장균과 같은 원핵 세포이다.In another preferred embodiment, the host cell is a prokaryotic cell such as E. coli.

또 다른 바람직한 예에서, 상기 숙주 세포는 인삼 세포이다.In another preferred embodiment, the host cell is a ginseng cell.

또 다른 바람직한 예에서, 상기 숙주 세포는 식 (Ⅱ) 화합물을 자연적으로 생성하지 못하는 세포이다.In another preferred embodiment, the host cell is a cell that does not naturally produce the compound of formula (II).

또 다른 바람직한 예에서, 상기 숙주 세포 진세노사이드 Rh2 또는 진세노사이드 F2를 자연적으로 생성하지 못하는 세포이다.In another preferred embodiment, the host cell is a cell that does not naturally produce ginsenoside Rh2 or ginsenoside F2.

또 다른 바람직한 예에서, 상기 다마렌디올 합성대사 경로에서의 관건적인 유전자는 다마렌디올 합성 효소 유전자를 포함한다(하지만 이에 한정되지 않음).In another preferred embodiment, the key gene in the damarendiol metabolic pathway includes (but is not limited to) a damarendiol synthase gene.

또 다른 바람직한 예에서, 상기 숙주 세포는 프로토파녹사디올 합성대사 경로에서의 관건적인 유전자를 함유하고, 다마렌디올 합성 효소 유전자, 프로토파녹사디올로 합성된 시토크롬 P450 유전자 CYP716A47 및 이의 환원 효소 유전자 또는 이들의 조합을 포함한다(하지만 이에 한정되지 않음).In another preferred embodiment, the host cell contains a key gene in the protopanoxadiol metabolic pathway, a damarendiol synthase gene, a cytochrome P450 gene CYP716A47 synthesized from protopanoxadiol, and a reductase gene thereof, or combinations thereof include (but are not limited to).

본 발명의 제8 양태에 있어서, 제7 양태에 따른 숙주 세포의 용도를 제공하였고, 효소 촉매 시약을 제조하거나, 글리코실트랜스퍼라제를 생성하거나, 촉매 세포로 사용되거나, 글리코실화된 테트라시클릭트리터페노이드계 화합물을 생성하기 위한 것이다.In an eighth aspect of the present invention there is provided the use of a host cell according to the seventh aspect, for preparing an enzyme catalytic reagent, for producing a glycosyltransferase, for use as a catalyst cell, or for a glycosylated tetracyclic tree It is to produce a terpenoid-based compound.

또 다른 바람직한 예에서, 상기 테트라시클릭트리터페노이드계 화합물은 식 (Ⅱ) 화합물이다.In another preferred embodiment, the tetracyclic triterpenoid compound is a compound of formula (II).

또 다른 바람직한 예에서, 상기 숙주 세포는 식 (I) 화합물의 글리코실화 반응에 의해 식 (Ⅱ) 화합물을 생성하는데 사용된다.In another preferred embodiment, the host cell is used to produce a compound of formula (II) by glycosylation of a compound of formula (I).

또 다른 바람직한 예에서, 상기 숙주 세포는 프로토파녹사디올 PPD 및/또는 화합물 K의 글리코실화 반응에 의해 진세노사이드 Rh2 및/또는 진세노사이드 F2를 생성하는데 사용된다.In another preferred embodiment, the host cell is used to produce ginsenoside Rh2 and/or ginsenoside F2 by glycosylation of protopanoxadiol PPD and/or compound K.

본 발명의 제9 양태에 있어서, 본 발명의 제7 양태에 따른 유전자 조작된 숙주 세포를 식물로 재생시키는 단계를 포함하고, 상기 유전자 조작된 숙주 세포는 식물 세포인 유전자 변형 식물을 생성하는 방법을 제공하였다.In a ninth aspect of the present invention, there is provided a method for producing a genetically modified plant comprising the step of regenerating a genetically engineered host cell according to the seventh aspect of the present invention into a plant, wherein said genetically engineered host cell is a plant cell. provided.

또 다른 바람직한 예에서, 상기 유전자 조작된 숙주 세포는 인삼 세포, 화기삼 세포, 삼칠 세포, 담배 세포로부터 선택된다.In another preferred embodiment, the genetically engineered host cell is selected from a ginseng cell, a Korean ginseng cell, a ginseng cell, and a tobacco cell.

본 발명의 범위 내에서, 본 발명이 상기 각 기술적 특징 및 이하(예를 들어 실시예)에서 구체적으로 기술되는 각 기술적 특징은 서로 조합되어 새롭거나 바람직한 기술적 해결 수단을 구성할 수 있음을 이해하여야 한다. 편폭의 제한으로 인해 여기서 일일이 설명하지 않을 것이다.Within the scope of the present invention, it should be understood that each of the above technical features and each technical feature specifically described in the following (eg, embodiments) of the present invention can be combined with each other to constitute a new or preferred technical solution. . Due to the limitation of the side width, it will not be described in detail here.

(1) 본 발명의 출아형 효모를 사용하여 진세노사이드 Rh2를 생성하는 방법은 전통적인 인산 속 식물의 추출 및 글리코실 가수분해에 의존한 방법에 비해 비용이 저렴하고, 주기가 짧으며, 품질이 안정적인 등 장점이 있고; (1) The method for producing ginsenoside Rh2 using the budding yeast of the present invention is cheaper, has a shorter cycle, and has lower quality than the traditional method relying on extraction and glycosyl hydrolysis of phosphate plants. It has advantages such as stable;

(2) 본 발명은 처음으로 사칠로부터 얻은 글리코실트랜스퍼라제 Pn50 PPD 및 Rh2에 촉매 작용을 할 수 있으며, CK에 촉매 작용을 하여 F2를 합성하고, 이를 인삼에서 야생형 글리코실트랜스퍼라제 UGTPg45보다 PPD를 생성하는 균주에 도입하는 것이 희귀 진세노사이드 Rh2를 보다 효율적으로 합상할 수 있으며;(2) The present invention can catalyze the glycosyltransferases Pn50 PPD and Rh2 obtained from Sachil for the first time, and catalyzes CK to synthesize F2, which in ginseng produced PPD than the wild-type glycosyltransferase UGTPg45. Introduction into the producing strain can more efficiently synthesize the rare ginsenoside Rh2;

(3) 본 발명은 인삼에서 야생형 글리코실트랜스퍼라제 UGTPg45가 무작위로 돌연변이되어 돌연변이체 유전자 8E7 또는 삼칠 글리코실트랜스퍼라제 유전자 Pn50을 얻고, 이를 인삼에서 야생형 글리코실트랜스퍼라제 UGTPg45보다 PPD를 생성하는 균주에 도입하는 것이 희귀 진세노사이드 Rh2 합성 효율을 현저하게 향상시킬 수 있으며;(3) In the present invention, wild-type glycosyltransferase UGTPg45 is randomly mutated in ginseng to obtain mutant gene 8E7 or Samchil glycosyltransferase gene Pn50, and this is added to a strain that produces PPD than wild-type glycosyltransferase UGTPg45 in ginseng. introduction can significantly improve the rare ginsenoside Rh2 synthesis efficiency;

(4) 본 발명은 삼칠에서 야생형 글리코실트랜스퍼라제 Pn50를 무작위로 돌연변시켜 돌연변이체 유전자 Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3을 얻고, 이를 삼칠에서 야생형 글리코실트랜스퍼라제 Pn50보다 PPD를 생성하는 균주에 도입하는 것이 희귀 진세노사이드 Rh2의 합성 효율을 현저하게 향상시킬 수 있다.(4) In the present invention, wild-type glycosyltransferase Pn50 is randomly mutated in Samchil to obtain mutant genes Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3, and wild-type glycosyltransferase in Samchil It is possible to significantly improve the synthesis efficiency of the rare ginsenoside Rh2 by introducing it into a strain producing PPD rather than the Rase Pn50.

도 1은 글리코실트랜스퍼라제 유전자 Pn50 아가로스 겔 전기 영동도이다.
도 2는 글리코실트랜스퍼라제 유전자 Pn50 촉매 진세노사이드 TLC 분석도이다.
도 3은 Pn50을 사용하여 구축된 재조합 출아형 효모 균주 구축에 의해 생성된 희귀 진세노사이드 Rh2의 HPLC 분석도이다.
도 4는 Pn50 단백질 돌연변이체 Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2 및 UGT-MUT3을 사용하여 구축된 재조합 출아형 효모 균주에 의해 생성된 희귀 진세노사이드 Rh2의 발효 산물의 비교 분석을 나타낸다.
1 is a glycosyltransferase gene Pn50 agarose gel electrophoresis diagram.
Figure 2 is a glycosyltransferase gene Pn50 catalyst ginsenoside TLC analysis diagram.
3 is an HPLC analysis diagram of the rare ginsenoside Rh2 produced by constructing a recombinant budding yeast strain constructed using Pn50.
4 is a comparative analysis of the fermentation products of the rare ginsenoside Rh2 produced by recombinant budding yeast strains constructed using the Pn50 protein mutants Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2 and UGT-MUT3. indicates.

본 발명자는 광범위하고 심층적인 연구를 걸쳐, 처음으로 테르펜계 화합물 글리코실화 촉매 및 신규 사포닌 합성에서의 삼칠 글리코실트랜스퍼라제 Pn50(SEQ ID NO.: 4)과 인삼으로부터 유래된 글리코실트랜스퍼라제 UGTPg45의 돌연변이체 8E7(SEQ ID NO.: 21), 삼칠 글리코실트랜스퍼라제 Pn50의 돌연변이체 Pn50-Q222H-VE(SEQ ID NO.: 41), UGT-MUT1(SEQ_ID_NO.35), UGT-MUT2(SEQ_ID_NO.37) 및 UGT-MUT3(SEQ_ID_NO.39)의 용도를 제공하였다.The present inventors, through extensive and in-depth research, for the first time, the terpene-based compound glycosylation catalyst and the ginseng-derived glycosyltransferase Pn50 (SEQ ID NO.: 4) and the glycosyltransferase UGTPg45 in novel saponin synthesis. Mutant 8E7 (SEQ ID NO.: 21), mutant Pn50-Q222H-VE (SEQ ID NO.: 41), UGT-MUT1 (SEQ_ID_NO.35), UGT-MUT2 (SEQ_ID_NO. 37) and UGT-MUT3 (SEQ_ID_NO.39).

구체적으로, 본 발명의 글리코실트랜스퍼라제는 테트라시클릭트리테르페노이드 화합물 기질특이적이고 효율적으로 촉매하고 및/또는 글리코실기 공여체로부터 유래된 글리코실기를 테트라시클릭트리터페노이드계 화합물의 C-3 부위의 히드록실기에 이전이시킬 수 있다. 특히, 프로토파녹사디올PPD를 항 종양 활성이 있는 희귀 진세노사이드 Rh2로 효율적으로 전환시킬 수 있고, 희귀 진세노사이드 화합물 K(PPD의 C20 부위에 하나의 글리코실기 변형이 있음)를 산물 진세노사이드 F2로 전환시킨다. 의외로, 프로토파녹사디올을 생성하는 출아형 효모 균주에 삼칠로부터 유래된 글리코실트랜스퍼라제 유전자 Pn50을 도입하여 구축된 재조합 출아형 효모 균주 ZWBY04RS-Pn50으로 희귀 진세노사이드 Rh2를 합성할 수 있고, 야생형 인삼으로부터 유래된 글리코실트랜스퍼라제 유전자 UGTPg45를 도입한 균주 ZWBY04RS-UGTPg45 대비, 균주 ZWBY04RS-Pn50 진세노사이드 Rh2의 산량이 28 %(45.55/35.66 - 1 = 28 %) 향상되었으며; 무작위 돌연변이에 의해 UGTPg45를 개량하여 얻은 돌연변이체 유전자 8E7로 구축된 인공 합성 희귀 진세노사이드 Rh2 균주 ZWBY04RS-8E7의 Rh2 산량은 UGTPg45으로 구축된 균주 ZWBY04RS-UGTPg45의 산량보다 70 %(60.48/35.66 - 1 = 70 %) 향상되었다. 부위 특이적 돌연변이에 의해 Pn50을 개량하여 돌연변이체 유전자 Pn50-Q222H-VE를 얻고, Pn50-Q222H-VE에 의해 구축된 인공 합성 희귀 진세노사이드 Rh2 균주 ZWBY04RS-QE에서, 이의 Rh2 산량은 UGTPg45에 의해 구축된 균주 ZWBY04RS-UGTPg45 산량보다 66 %(59.09/35.66 - 1 = 66 %) 향상되었다. 부위 특이적 돌연변이에 의해 Pn50-Q222H-VE를 더 개량하여 돌연변이체 UGT-MUT1 유전자를 얻고, UGT-MUT1에 의해 구축된 인공 합성 희귀 진세노사이드 Rh2 균주 ZWBY04RS-MUT1에서, 이의 Rh2 산량은 UGTPg45에 의해 구축된 균주 ZWBY04RS-UGTPg45의 산량보다 90 %(67.96/35.66 - 1 = 90 %) 향상되었다. 부위 특이적 돌연변이에 의해 Pn50-Q222H-VE를 더 개량하여 돌연변이체 UGT-MUT2 유전자를 얻고, UGT-MUT2에 의해 구축된 인공 합성 희귀 진세노사이드 Rh2 균주 ZWBY04RS-MUT2에서, 이의 Rh2 산량은 UGTPg45에 의해 구축된 균주 ZWBY04RS-UGTPg45의 산량보다 120 %(78.29/35.66-1=120 %) 향상되었다. 부위 특이적 돌연변이에 의해 Pn50-Q222H-VE를 더 개량하여 돌연변이체 UGT-MUT3 유전자를 얻고, UGT-MUT3에 의해 구축된 인공 합성 희귀 진세노사이드 Rh2 균주 ZWBY04RS-MUT3에서, 이의 Rh2 산량은 UGTPg45에 의해 구축된 균주 ZWBY04RS-UGTPg45의 산량보다 134 %(83.53/35.66-1=134 %) 향상되었다.Specifically, the glycosyltransferase of the present invention catalyzes a tetracyclic triterpenoid compound substrate-specific and efficiently and/or a glycosyl group derived from a glycosyl group donor C-3 of a tetracyclic triterpenoid compound. It can be transferred to the hydroxyl group of the site. In particular, protophanoxadiol PPD can be efficiently converted into a rare ginsenoside Rh2 with anti-tumor activity, and a rare ginsenoside compound K (with one glycosyl group modification at the C20 site of PPD) is produced as a product ginsenoside. Switch to side F2. Surprisingly, the rare ginsenoside Rh2 can be synthesized with the recombinant budding yeast strain ZWBY04RS-Pn50 constructed by introducing the glycosyltransferase gene Pn50 derived from Samchil into the budding yeast strain producing protophanoxadiol, and wild-type Compared to strain ZWBY04RS-UGTPg45 introduced with ginseng-derived glycosyltransferase gene UGTPg45, the acid content of strain ZWBY04RS-Pn50 ginsenoside Rh2 was improved by 28% (45.55/35.66 - 1 = 28%); The Rh2 output of the artificial synthetic rare ginsenoside Rh2 strain ZWBY04RS-8E7 constructed with the mutant gene 8E7 obtained by improving UGTPg45 by random mutation was 70% (60.48/35.66 - 1) than that of the strain ZWBY04RS-UGTPg45 constructed with UGTPg45. = 70%) was improved. In the artificially synthetic rare ginsenoside Rh2 strain ZWBY04RS-QE constructed by Pn50-Q222H-VE by improving Pn50 by site-directed mutagenesis to obtain the mutant gene Pn50-Q222H-VE, and Pn50-Q222H-VE, its Rh2 acid content was determined by UGTPg45 It was improved by 66% (59.09/35.66 - 1 = 66%) than the constructed strain ZWBY04RS-UGTPg45 acid. Pn50-Q222H-VE was further improved by site-directed mutagenesis to obtain a mutant UGT-MUT1 gene, and in the artificial synthetic rare ginsenoside Rh2 strain ZWBY04RS-MUT1 constructed by UGT-MUT1, its Rh2 acid content was in UGTPg45 It was improved by 90% (67.96/35.66 - 1 = 90%) than the acid amount of the strain ZWBY04RS-UGTPg45 constructed by Pn50-Q222H-VE was further improved by site-directed mutagenesis to obtain a mutant UGT-MUT2 gene, and in the artificial synthetic rare ginsenoside Rh2 strain ZWBY04RS-MUT2 constructed by UGT-MUT2, its Rh2 acid content was It was improved by 120% (78.29/35.66-1=120%) than the acid amount of the strain ZWBY04RS-UGTPg45 constructed by Pn50-Q222H-VE was further improved by site-directed mutagenesis to obtain a mutant UGT-MUT3 gene, and in artificial synthetic rare ginsenoside Rh2 strain ZWBY04RS-MUT3 constructed by UGT-MUT3, its Rh2 acid content was It was improved by 134% (83.53/35.66-1=134%) than the acid amount of the strain ZWBY04RS-UGTPg45 constructed by

본 발명은 형질전화 및 촉매 방법을 더 제공하였다. 본 발명의 글리코실트랜스퍼라제는 다마렌디올 및/또는 프로토파녹사디올 합성 대사 경로에서의 관건적인 효소(예를 들어 다마렌디올 합성 효소 유전자 PgDDS, 프로토파녹사디올로 합성된 시토크롬 P450 유전자 CYP716A47 및 이의 환원 효소 유전자 PgCPR1)와 숙주 세포에서 공동 발현될 수 있다. 또는 진세노사이드 Rh2를 제조하는 유전자 조작 세포에 적용되고, 인공 희귀 진세노사이드 Rh2를 구축하는 균주에 적용된다.The present invention further provides transformation and catalytic methods. The glycosyltransferase of the present invention is a key enzyme in the damarendiol and/or protopanoxadiol synthesis metabolic pathway (for example, the damarendiol synthase gene PgDDS, the cytochrome P450 gene CYP716A47 synthesized from protopanoxadiol, and It can be co-expressed in host cells with its reductase gene PgCPR1). Or applied to genetically engineered cells producing ginsenoside Rh2, and applied to strains constructing artificial rare ginsenoside Rh2.

이 외에, 본 발명의 글리코실트랜스퍼라제는 다마렌디올 및/또는 프로토파녹사디올 합성 대사 경로에서의 관건적인 효소와 숙주 세포에어 공동으로 발현될 수 있고, 인공 합성 희귀 진세노사이드 Rh2를 구축하는 균주에 적용된다. 이에 기반하여 본 발명을 완성하였다.In addition, the glycosyltransferase of the present invention can be co-expressed in host cells with enzymes that are key in the damarendiol and/or protopanoxadiol synthesis metabolic pathway, and can be used to construct the artificial synthetic rare ginsenoside Rh2. applied to strains. Based on this, the present invention was completed.

정의Justice

본 발명에 사용된 바와 같이, 용어 “활성 폴리펩티드”, “본 발명의 폴리펩티드 및 이의 유도 폴리펩티드”, “본 발명의 효소”, “글리코실트랜스퍼라제” 또는 “본 발명의 글리코실트랜스퍼라제”는 호환 사용이 가능하고, 당업자가 일반적으로 이해하는 의미를 갖는다. 본 발명의 글리코실트랜스퍼라제는 글리코실기 공여체의 글리코실기를 테트라시클릭트리터페노이드계 화합물의 C-3 부위의 히드록실기에 전이시키는 활성이 있다.As used herein, the terms “active polypeptide”, “polypeptide of the invention and its derivatives”, “enzyme of the invention”, “glycosyltransferase” or “glycosyltransferase of the invention” are interchangeable are available and have the meanings commonly understood by one of ordinary skill in the art. The glycosyltransferase of the present invention has an activity of transferring the glycosyl group of the glycosyl group donor to the hydroxyl group of the C-3 site of the tetracyclic triterpenoid compound.

본 발명의 하나의 바람직한 예에서, 본 발명의 글리코실트랜스퍼라제의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제222 부위에서의 아미노산 잔기는 Gln이 아니거나, 및/또는 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제322 부위에서의 아미노산 잔기는 Ala가 아니다.In one preferred embodiment of the present invention, the amino acid residue at the 222 position corresponding to the amino acid sequence of the glycosyltransferase of the present invention is not Gln, and/or SEQ ID NO: 19 The amino acid residue at site 322 corresponding to the amino acid sequence represented by ID NO: 19 is not Ala.

본 발명의 하나의 바람직한 예에서, 본 발명의 글리코실트랜스퍼라제는,In one preferred embodiment of the present invention, the glycosyltransferase of the present invention comprises:

i). SEQ ID NO: 19로 표시되는 아미노산 서열을 갖고 제222 부위의 아미노산 잔기는 Gln이 아니거나, 및/또는 제322 부위의 아미노산 잔기는 Ala가 아니며, 또는i). has the amino acid sequence shown in SEQ ID NO: 19 and the amino acid residue at site 222 is not Gln, and/or the amino acid residue at site 322 is not Ala, or

ⅱ). i)에서 한정된 서열에 하나 또는 복수 개의 아미노산 잔기, 바람직하게는 1 ~ 20개, 보다 바람직하게는 1 ~ 15개, 더 바람직하게는 1 ~ 10개, 보다 더 바람직하게는 1 ~ 3개, 가장 바람직하게는 1개의 아미노산 잔기를 치환, 결실 또는 부가하여 형성된 서열을 갖고, i)에서 한정된 분리된 폴리펩티드 기능을 대체로 가지며 i)로부터 유도된 분리된 폴리펩티드이다.ii). One or a plurality of amino acid residues in the sequence defined in i), preferably 1 to 20, more preferably 1 to 15, more preferably 1 to 10, even more preferably 1 to 3, most It is an isolated polypeptide derived from i), preferably having a sequence formed by the substitution, deletion or addition of one amino acid residue, generally having the isolated polypeptide function defined in i).

본 발명의 하나의 바람직한 예에서, 본 발명의 글리코실트랜스퍼라제는 i)에서 한정된 서열에 하나 또는 복수 개의 아미노산 잔기, 바람직하게는 1 ~ 20개, 보다 바람직하게는 1 ~ 15개, 더 바람직하게는 1 ~ 10개, 보다 더 바람직하게는 1 ~ 3개, 가장 바람직하게는 1개의 아미노산 잔기를 치환, 결실 또는 부가하여 형성된 서열을 갖고, i)에서 한정된 분리된 폴리펩티드 기능을 대체로 가지며 i)로부터 유도된 분리된 폴리펩티드이다.In one preferred embodiment of the present invention, the glycosyltransferase of the present invention has one or more amino acid residues in the sequence defined in i), preferably 1 to 20, more preferably 1 to 15, more preferably has a sequence formed by the substitution, deletion or addition of 1 to 10, even more preferably 1 to 3, most preferably 1 amino acid residues, generally having the isolated polypeptide function defined in i) and from i) It is an isolated polypeptide derived.

본 발명의 하나의 바람직한 예에서, 본 발명의 글리코실트랜스퍼라제의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제222 부위에서의 아미노산 잔기는 His, Asn, Gln, Lys 및 Arg 중의 적어도 하나의 아미노산으로부터 선택된다.In one preferred embodiment of the present invention, the amino acid residue at the 222 site, in which the amino acid sequence of the glycosyltransferase of the present invention corresponds to the amino acid sequence shown in SEQ ID NO: 19, is His, Asn, Gin, Lys and Arg at least one amino acid.

본 발명의 하나의 바람직한 예에서, 본 발명의 글리코실트랜스퍼라제의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제222 부위에서의 아미노산 잔기는 His이다.In one preferred embodiment of the present invention, the amino acid residue at the 222 site corresponding to the amino acid sequence of the glycosyltransferase of the present invention corresponds to the amino acid sequence shown in SEQ ID NO: 19 is His.

본 발명의 하나의 바람직한 예에서, 본 발명의 글리코실트랜스퍼라제의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제322 부위에서의 아미노산 잔기는 Val, Ile, Leu, Met 및 Phe 중의 적어도 하나의 아미노산으로부터 선택된다.In one preferred embodiment of the present invention, the amino acid residue at the 322 site corresponding to the amino acid sequence of the glycosyltransferase of the present invention corresponds to the amino acid sequence shown in SEQ ID NO: 19 is Val, Ile, Leu, Met and Phe at least one amino acid.

본 발명의 하나의 바람직한 예에서, 본 발명의 글리코실트랜스퍼라제의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제322 부위에서의 아미노산 잔기는 Val이다.In one preferred embodiment of the present invention, the amino acid residue at the 322 site corresponding to the amino acid sequence of the glycosyltransferase of the present invention corresponds to the amino acid sequence shown in SEQ ID NO: 19 is Val.

본 발명의 하나의 바람직한 예에서, 본 발명의 글리코실트랜스퍼라제의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제222 부위에서 아미노산 잔기는 His, SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제322 부위에서의 아미노산 잔기는 Val이다.In one preferred example of the present invention, the amino acid residue at the 222 site corresponding to the amino acid sequence of the glycosyltransferase of the present invention corresponds to the amino acid sequence shown in SEQ ID NO: 19 is His, SEQ ID NO: 19 The amino acid residue at site 322 corresponding to the amino acid sequence is Val.

본 발명의 하나의 바람직한 예에서, 본 발명의 글리코실트랜스퍼라제의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제247 부위의 아미노산 잔기는 Asn(N)이 아니거나 및/또는 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제280 부위에서의 아미노산 잔기는 Lys(K)가 아니다.In one preferred embodiment of the present invention, the amino acid residue at site 247, in which the amino acid sequence of the glycosyltransferase of the present invention corresponds to the amino acid sequence shown in SEQ ID NO: 19, is not Asn (N) and/or The amino acid residue at position 280 corresponding to the amino acid sequence shown in SEQ ID NO: 19 is not Lys(K).

본 발명의 하나의 바람직한 예에서, 본 발명의 글리코실트랜스퍼라제는,In one preferred embodiment of the present invention, the glycosyltransferase of the present invention comprises:

i). SEQ ID NO: 19로 표시되는 아미노산 서열을 갖고 제247 부위의 아미노산 잔기는 Asn(N)이 아니거나, 및/또는 제280 부위의 아미노산 잔기는 Lys(K)가 아니거나, 또는 i). has the amino acid sequence shown in SEQ ID NO: 19 and the amino acid residue at site 247 is not Asn(N), and/or the amino acid residue at site 280 is not Lys(K), or

ⅱ). i)에서 한정된 서열에 하나 또는 복수 개의 아미노산 잔기, 바람직하게는 1 ~ 20개, 보다 바람직하게는 1 ~ 15개, 더 바람직하게는 1 ~ 10개, 보다 더 바람직하게는 1 ~ 3개, 가장 바람직하게는 1개의 아미노산 잔기를 치환, 결실 또는 부가하여 형성된 서열을 갖고, i)에서 한정된 분리된 폴리펩티드 기능을 대체로 가지며 i)로부터 유도된 분리된 폴리펩티드이다.ii). One or a plurality of amino acid residues in the sequence defined in i), preferably 1 to 20, more preferably 1 to 15, more preferably 1 to 10, even more preferably 1 to 3, most It is an isolated polypeptide derived from i), preferably having a sequence formed by the substitution, deletion or addition of one amino acid residue, generally having the isolated polypeptide function defined in i).

본 발명의 하나의 바람직한 예에서, 본 발명의 글리코실트랜스퍼라제는 i)에서 한정된 서열에 하나 또는 복수 개의 아미노산 잔기, 바람직하게는 1 ~ 20개, 보다 바람직하게는 1 ~ 15개, 더 바람직하게는 1 ~ 10개, 보다 더 바람직하게는 1 ~ 3개, 가장 바람직하게는 1개의 아미노산 잔기를 치환, 결실 또는 부가하여 형성된 서열을 갖고, i)에서 한정된 분리된 폴리펩티드 기능을 대체로 가지며 i)로부터 유도된 분리된 폴리펩티드이다.In one preferred embodiment of the present invention, the glycosyltransferase of the present invention has one or more amino acid residues in the sequence defined in i), preferably 1 to 20, more preferably 1 to 15, more preferably has a sequence formed by the substitution, deletion or addition of 1 to 10, even more preferably 1 to 3, most preferably 1 amino acid residues, generally having the isolated polypeptide function defined in i) and from i) It is an isolated polypeptide derived.

본 발명의 하나의 바람직한 예에서, 본 발명의 글리코실트랜스퍼라제의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제247 부위에서의 아미노산 잔기는 Ser(S), Pro(P), Ala(A) 또는 Thr(T) 중의 적어도 하나의 아미노산으로부터 선택된다.In one preferred embodiment of the present invention, the amino acid residue at site 247, in which the amino acid sequence of the glycosyltransferase of the present invention corresponds to the amino acid sequence shown in SEQ ID NO: 19, is Ser (S), Pro (P) , at least one amino acid of Ala(A) or Thr(T).

본 발명의 하나의 바람직한 예에서, 본 발명의 글리코실트랜스퍼라제의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제247 부위에서의 아미노산 잔기는 Ser(S)이다.In one preferred embodiment of the present invention, the amino acid residue at site 247, in which the amino acid sequence of the glycosyltransferase of the present invention corresponds to the amino acid sequence shown in SEQ ID NO: 19, is Ser(S).

본 발명의 하나의 바람직한 예에서, 본 발명의 글리코실트랜스퍼라제의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제280 부위에서의 아미노산 잔기는 Ile(I), Asn(N), Ser(S) 또는 Ala(A) 중의 적어도 하나의 아미노산으로부터 선택된다.In one preferred embodiment of the present invention, the amino acid residue at position 280 corresponding to the amino acid sequence of the glycosyltransferase of the present invention corresponds to the amino acid sequence shown in SEQ ID NO: 19 is Ile (I), Asn (N) , at least one amino acid of Ser(S) or Ala(A).

본 발명의 하나의 바람직한 예에서, 본 발명의 글리코실트랜스퍼라제의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제280 부위에서의 아미노산 잔기는 Ile(I)이다.In one preferred embodiment of the present invention, the amino acid residue at the 280th position, in which the amino acid sequence of the glycosyltransferase of the present invention corresponds to the amino acid sequence shown in SEQ ID NO: 19, is Ile(I).

본 발명의 하나의 바람직한 예에서, 본 발명의 글리코실트랜스퍼라제의 아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제247 부위에서의 아미노산 잔기는 Ser(S)이고, SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제280 부위에서의 아미노산 잔기는 Ile(I)이다.In one preferred embodiment of the present invention, the amino acid residue at site 247 in which the amino acid sequence of the glycosyltransferase of the present invention corresponds to the amino acid sequence shown in SEQ ID NO: 19 is Ser (S), and SEQ ID NO: : The amino acid residue at site 280 corresponding to the amino acid sequence represented by 19 is Ile(I).

본 발명의 하나의 바람직한 예에서, 본 발명의 글리코실트랜스퍼라제는,In one preferred embodiment of the present invention, the glycosyltransferase of the present invention comprises:

(a) SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 또는 SEQ ID NO.: 41로 표시되는 아미노산 서열을 갖는 폴리펩티드;(a) the amino acid sequence represented by SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 or SEQ ID NO.: 41 a polypeptide having;

(b) SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 또는 SEQ ID NO.: 41로 표시되는 아미노산 서열의 폴리펩티드에 하나 또는 복수 개, 바람직하게는 1 ~ 20개, 보다 바람직하게는 1 ~ 15개, 더 바람직하게는 1 ~ 10개, 보다 더 바람직하게는 1 ~ 3개, 가장 바람직하게는 1개의 아미노산 잔기를 치환, 결실 또는 부가하여 형성되거나, 신호 펩티드 서열 부가 후 형성되고, 글리코실트랜스퍼라제 활성을 갖는 유도 폴리펩티드;(b) of the amino acid sequence represented by SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 or SEQ ID NO.: 41 One or more amino acids in the polypeptide, preferably 1 to 20, more preferably 1 to 15, more preferably 1 to 10, even more preferably 1 to 3, most preferably 1 amino acid inducible polypeptides formed by substituting, deleting or adding residues or formed after addition of a signal peptide sequence and having glycosyltransferase activity;

(c) 서열에 (a) 또는 (b)에 따른 폴리펩티드 서열이 함유된 유도 폴리펩티드;(c) an inducible polypeptide comprising a polypeptide sequence according to (a) or (b) in its sequence;

(d) 아미노산 서열이 SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 또는 SEQ ID NO.: 41로 표시되는 아미노산 서열과 ≥85 %(바람직하게는, ≥ 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 99 %)의 상동성을 갖고, 글리코실트랜스퍼라제 활성을 갖는 유도 폴리펩티드로부터 선택된다.(d) the amino acid sequence is represented by SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 or SEQ ID NO.: 41 has ≥85% (preferably ≥90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%) homology to the amino acid sequence and contains glycosyl inducing polypeptides having transferase activity.

발명의 실시를 위한 형태에서, 본 발명의 글리코실트랜스퍼라제 활성은 글리코실기 공여체의 글리코실기를 테트라시클릭트리터페노이드계 화합물의 C-3 부위의 히드록실기에 전이시킬수 있는 활성을 지칭한다.In an embodiment of the present invention, the glycosyltransferase activity of the present invention refers to an activity capable of transferring a glycosyl group of a glycosyl group donor to a hydroxyl group at the C-3 site of a tetracyclic triterpenoid compound.

본 발명의 하나의 바람직한 예에서, 삼칠로부터 클로닝된 하나의 신규 글리코실트랜스퍼라제 유전자 Pn50에서, 이러한 신규 글리코실트랜스퍼라제를 이용하여 다양한 담마란형의 진세노사이드 C3 부위의 글리코실화에 촉매 작용할 수 있다.In one preferred example of the present invention, in one novel glycosyltransferase gene Pn50 cloned from Samchil, this novel glycosyltransferase can be used to catalyze the glycosylation of various dammaran-type ginsenoside C3 sites. have.

삼칠 전사체 데이터 분석을 통하여, 이로부터 전장의 글리코실트랜스퍼라제 유전자 서열을 스플라이싱하고, Pn50으로 명명하였다. 이를 클로닝 전달체 PMDT-18T에 클로닝한 후, 대장균에서 발현하도록 발현 프라이머를 설계하여 대장균 발현 전달체 pET28a에 구축하였다. 얻은 단백질은 프로토파낙사디올과 화합물 K의 C3 부위의 히드록실글리코실화에 촉매 작용을 할 수 있다.Through analysis of the three-fold transcriptome data, the full-length glycosyltransferase gene sequence was spliced therefrom and named as Pn50. After cloning this into the cloning delivery system PMDT-18T, the expression primer was designed to be expressed in E. coli and constructed in the E. coli expression delivery system pET28a. The obtained protein can catalyze the hydroxyl glycosylation of the C3 site of compound K with protopanaxadiol.

상기 삼칠 글리코실트랜스퍼라제 유전자 Pn50로 인삼으로부터 유래된 UGTPg45를 대체하여 Rh2의 산량을 크게 향상시킬 수 있다(28 % 향상시킴).By replacing UGTPg45 derived from ginseng with the ginseng glycosyltransferase gene Pn50, it is possible to significantly improve the acid content of Rh2 (improved by 28%).

본 발명의 다른 하나의 바람직한 예에서, 글리코실트랜스퍼라제 돌연변이체 단백질 8E7을 제공하였다. 상기 글리코실트랜스퍼라제 돌연변이체 단백질은 인삼으로부터 유래된 야생형 유전자 UGTPg45의 돌연변이체 단백질이고, 상기 돌연변이 글리코실트랜스퍼라제 유전자 8E7로 인삼으로부터 유래된 UGTPg45를 대체하여 Rh2의 산량을 크게 향상시킬 수 있다(70 % 향상시킴).In another preferred embodiment of the present invention, a glycosyltransferase mutant protein 8E7 is provided. The glycosyltransferase mutant protein is a mutant protein of the wild-type gene UGTPg45 derived from ginseng, and the mutant glycosyltransferase gene 8E7 can replace UGTPg45 derived from ginseng to greatly improve the production of Rh2 (70). % improvement).

본 발명의 또 다른 하나의 바람직한 예에서, 글리코실트랜스퍼라제 돌연변이체 단백질 Pn50-Q222H-VE를 제공하였다. 상기 글리코실트랜스퍼라제 돌연변이체 단백질은 삼칠로부터 유래된 야생형 유전자 Pn50의 돌연변이체 단백질이고, 상기 돌연변이 글리코실트랜스퍼라제 유전자 Pn50-Q222H-VE로 인삼으로부터 유래된 야생형 유전자 UGTPg45를 대체하여 Rh2의 산량을 크게 향상시킬 수 있다(66 % 향상시킴).In another preferred embodiment of the present invention, a glycosyltransferase mutant protein Pn50-Q222H-VE is provided. The glycosyltransferase mutant protein is a mutant protein of the wild-type gene Pn50 derived from Samchil, and the wild-type gene UGTPg45 derived from ginseng is replaced with the mutant glycosyltransferase gene Pn50-Q222H-VE to greatly increase the output of Rh2. It can improve (66% improvement).

본 발명의 또 다른 하나의 바람직한 예에서, 글리코실트랜스퍼라제 돌연변이체 단백질 UGT-MUT1을 제공하였다. 상기 글리코실트랜스퍼라제 돌연변이체 단백질은 삼칠로부터 유래된 야생형 유전자 Pn50의 돌연변이체 단백질이고, 상기 돌연변이 글리코실트랜스퍼라제 유전자 UGT-MUT1로 인삼으로부터 유래된 야생형 유전자 UGTPg45를 대하여 Rh2의 산량을 크게 향상시킬 수 있다(90 % 향상시킴).In another preferred embodiment of the present invention, a glycosyltransferase mutant protein UGT-MUT1 is provided. The glycosyltransferase mutant protein is a mutant protein of the wild-type gene Pn50 derived from Samchil, and the mutant glycosyltransferase gene UGT-MUT1 can significantly improve the output of Rh2 with respect to the wild-type gene UGTPg45 derived from ginseng. Yes (90% improvement).

본 발명의 또 다른 하나의 바람직한 예에서, 글리코실트랜스퍼라제 돌연변이체 단백질 UGT-MUT2를 제공하였다. 상기 글리코실트랜스퍼라제 돌연변이체 단백질은 삼칠로부터 유래된 야생형 유전자 Pn50의 돌연변이체 단백질이고, 상기 돌연변이 글리코실트랜스퍼라제 유전자 UGT-MUT2로 인삼으로부터 유래된 야생형 유전자 UGTPg45로 대체하여 Rh2의 산량을 크게 향상시킬 수 있다(120 % 향상시킴).In another preferred embodiment of the present invention, a glycosyltransferase mutant protein UGT-MUT2 is provided. The glycosyltransferase mutant protein is a mutant protein of the wild-type gene Pn50 derived from Samchil, and the mutant glycosyltransferase gene UGT-MUT2 is replaced with the wild-type gene UGTPg45 derived from ginseng to greatly improve the output of Rh2. Can (120% improvement).

본 발명의 또 다른 하나의 바람직한 예에서, 글리코실트랜스퍼라제 돌연변이체 단백질을 UGT-MUT3을 제공하였다. 상기 글리코실트랜스퍼라제 돌연변이체 단백질은 삼칠로부터 유래된 야생형 유전자 Pn50의 돌연변이체 단백질이고, 상기 돌연변이 글리코실트랜스퍼라제 유전자 UGT-MUT3으로 인삼으로부터 유래된 야생형 유전자 UGTPg45로 대체하여 Rh2의 산량을 크게 향상시킬 수 있다(134 % 향상시킴).In another preferred embodiment of the present invention, the glycosyltransferase mutant protein is provided as UGT-MUT3. The glycosyltransferase mutant protein is a mutant protein of the wild-type gene Pn50 derived from Samchil, and the mutant glycosyltransferase gene UGT-MUT3 is replaced with the wild-type gene UGTPg45 derived from ginseng to greatly improve the output of Rh2. Can (134% improvement).

폴리펩티드의 일부 영역에서, 예를 들어 중요하지 않은 영역에서 소수의 아미노산 잔기의 변경이 생물학적 활성을 대체로 변경을 일으키지 않으며, 예를 들어, 아미노산을 적절히 대체하여 얻은 서열은 이의 활성에 영향을 미치지 않는 것은 당업자에게 명백할 것이다(Watson 등, Molecular Biology of The Gene, 제4 버전, 1987, The Benjamin/Cummings Pub. Co. P224를 참조할 수 있음). 따라서, 당업자는 이러한 대체를 실시하고 얻은 분자가 여전히 원하는 생물학적 활성을 갖도록 보장할 수 있다.In some regions of a polypeptide, for example, alterations of a small number of amino acid residues in non-critical regions do not substantially alter the biological activity, e.g., a sequence obtained by appropriately replacing amino acids does not affect its activity It will be apparent to those skilled in the art (see Watson et al., Molecular Biology of The Gene, 4th ed., 1987, The Benjamin/Cummings Pub. Co. P224). Thus, one of ordinary skill in the art can make such substitutions and ensure that the resulting molecule still has the desired biological activity.

따라서, 본 발명의 폴리펩티드를 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제222 부위에서의 아미노산 잔기가 Gln이 아니거나, 및/또는 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제322 부위의 아미노산 잔기가 Ala가 아닌 기초 상에서 더 돌연변이시켜도 본 발명의 글리코실트랜스퍼라제의 기능과 활성을 구비할 수 있다. 예를 들어, 본 발명의 글리코실트랜스퍼라제는 (a) 이의 아미노산 서열이 SEQ ID NO: 21로 표시되거나; 또는 (b) (a)에 한정된 서열에 하나 또는 복수 개의 아미노산 잔기, 바람직하게는 1 ~ 20개, 보다 바람직하게는 1 ~ 15개, 더 바람직하게는 1 ~ 10개, 보다 더 바람직하게는 1 ~ 3개, 가장 바람직하게는 1개의 아미노산 잔기를 치환, 결실 또는 부가하여 형성된 서열을 포함하고, (a) 에서 한정된 분리된 폴리펩티드 기능을 대체로 가지며 (a)로부터 유도된 분리된 폴리펩티드이다.Accordingly, in the polypeptide of the present invention, the amino acid residue at the 222 site corresponding to the amino acid sequence represented by SEQ ID NO: 19 is not Gln, and/or the first amino acid residue corresponding to the amino acid sequence represented by SEQ ID NO: 19 Even if the amino acid residue at site 322 is further mutated on a basis other than Ala, the function and activity of the glycosyltransferase of the present invention can be obtained. For example, a glycosyltransferase of the present invention may comprise (a) its amino acid sequence is represented by SEQ ID NO: 21; or (b) one or more amino acid residues in the sequence defined in (a), preferably 1 to 20, more preferably 1 to 15, still more preferably 1 to 10, even more preferably 1 An isolated polypeptide derived from (a) comprising a sequence formed by the substitution, deletion or addition of ˜3, most preferably 1 amino acid residues, usually having the isolated polypeptide function defined in (a).

본 발명에서, 본 발명의 글리코실트랜스퍼라제는, 아미노산 서열이 SEQ ID NO.: 4, SEQ ID NO: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 또는 SEQ ID NO.: 41로 표시되는 글리코실트랜스퍼라제 대비, 최대 20개, 바람직하게는 최대 10개, 보다 바람직하게는 최대 3개, 더욱 바람직하게는 최대 2개, 가장 바람직하게는 최대 1개 아미노산이 성질이 비슷하거나 흡사한 아미노산에 의해 대체되어 형성된 돌연변이체를 포함한다. 이러한 보존적인 돌연변이된 돌연변이체는 예를 들어 하기 표 1에 나타낸 바와 같은 아미노산 대체에 따라 생성될 수 있다.In the present invention, the glycosyltransferase of the present invention has an amino acid sequence of SEQ ID NO.: 4, SEQ ID NO: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 or Compared to the glycosyltransferase represented by SEQ ID NO.: 41, at most 20, preferably at most 10, more preferably at most 3, even more preferably at most 2, most preferably at most 1 amino acid. It includes mutants formed by replacement by amino acids that are similar or similar in this property. Such conservatively mutated mutants can be generated, for example, following amino acid substitutions as shown in Table 1 below.

초기 잔기initial residue 대표적인 치환 잔기Representative substitution residues 바람직한 치환 잔기Preferred substitution residues Ala (A)Ala (A) Val; Leu; IleVal; Leu; Ile ValVal Arg (R)Arg (R) Lys; Gln; AsnLys; Gln; Asn LysLys Asn (N)Asn (N) Gln; His; Lys; ArgGln; His; Lys; Arg GlnGln Asp (D)Asp (D) GluGlu GluGlu Cys (C)Cys (C) SerSer SerSer Gln (Q)Gln (Q) AsnAsn AsnAsn Glu (E)Glu (E) AspAsp AspAsp Gly (G)Gly (G) Pro; AlaPro; Ala AlaAla His (H)His (H) Asn; Gln; Lys; ArgAsn; Gln; Lys; Arg ArgArg Ile (I)Ile (I) Leu; Val; Met; Ala; PheLeu; Val; Met; Ala; Phe LeuLeu Leu (L)Leu (L) Ile; Val; Met; Ala; PheIle; Val; Met; Ala; Phe IleIle Lys (K)Lys (K) Arg; Gln; AsnArg; Gln; Asn ArgArg Met (M)Met (M) Leu; Phe; IleLeu; Phe; Ile LeuLeu Phe (F)Phe (F) Leu; Val; Ile; Ala; TyrLeu; Val; Ile; Ala; Tyr LeuLeu Pro (P)Pro (P) AlaAla AlaAla Ser (S)Ser (S) ThrThr ThrThr Thr (T)Thr (T) SerSer SerSer Trp (W)Trp (W) Tyr; PheTyr; Phe TyrTyr Tyr (Y)Tyr (Y) Trp; Phe; Thr; SerTrp; Phe; Thr; Ser PhePhe Val (V)Val (V) Ile; Leu; Met; Phe; AlaIle; Leu; Met; Phe; Ala LeuLeu

본 발명은 본 발명의 폴리펩티드를 코딩하는 폴리 뉴클레오티드를 더 제공하였다. 용어 “폴리펩티드를 코딩하는 폴리 뉴클레오티드”는 이 폴리펩티드를 코딩하는 것을 포함하는 폴리 뉴클레오티드일 수 있고, 추가적인 코딩 및/또는 비코딩 서열을 더 포함하는 폴리 뉴클레오티드일 수도 있다.The present invention further provides a polynucleotide encoding a polypeptide of the present invention. The term “polynucleotide encoding a polypeptide” may be a polynucleotide comprising encoding the polypeptide, or a polynucleotide further comprising additional coding and/or non-coding sequences.

따라서, 본 명세서에 사용된 “함유”, “구비” 또는 “포함”은 “포함”, “주로......으로 이루어지다”, “대체로......으로 이루어지다” 및“......으로 이루어지다”를 포함하고; “주로......으로 이루어지다”, “대체로......으로 이루어지다” 및 “......으로 이루어지다”는 “함유”, “구비” 또는 “포함”의 하위 개념에 속한다.Accordingly, as used herein, “comprising”, “having” or “including” means “including”, “consisting primarily of”, “consisting mostly of” and “ including “consisting of…”; "Consisting mainly of...", "consisting mostly of..." and "consisting of..." are the meanings of "including", "having" or "including". belong to a sub-concept.

SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제222 부위/제322 부위/제247 부위/제280 부위의 아미노산 잔기SEQ ID NO: the amino acid residue of the 222 site / 322 site / 247 site / 280 site corresponding to the amino acid sequence shown in 19

치환, 첨가 또는 결실과 같은 다양한 돌연변이가 일부 단백질의 아미노산 서열에서 일부분의 아미노산 잔기에서 이루어질 수 있지만, 얻은 돌연변이체는 여전히 원래 단백질의 기능 또는 활성을 보유할 수 있다는 것이 당업자에게 공지되어 있다. 따라서, 당업자는 여전히 원하는 활성을 갖는 돌연변이체를 얻기 위해 본 발명에 구체적으로 개시된 아미노산 서열을 특정 변화시킬 수 있고, 이러한 돌연변이체에서 SEQ ID NO: 19로 표시되는 아미노산 서열의 제222 부위/제322 부위/제247 부위/제280 부위의 아미노산 잔기와 대응되는 아미노산 잔기는 제222 부위/제322 부위/제247 부위/제280 부위가 아닐 수 있지만, 얻은 돌연변이체는 여전히 본 발명의 범위 내에 속해야 한다.It is known to those skilled in the art that various mutations such as substitutions, additions or deletions may be made at some amino acid residues in the amino acid sequence of some proteins, but the resulting mutants may still retain the function or activity of the original protein. Thus, one of ordinary skill in the art can make certain changes to the amino acid sequence specifically disclosed in the present invention to obtain a mutant with still desired activity, and in such a mutant the 222 region/322 of the amino acid sequence represented by SEQ ID NO: 19 The amino acid residue corresponding to the amino acid residue of site/site 247/site 280 may not be site 222/site 322/site 247/site 280, but the resulting mutant should still fall within the scope of the present invention. .

본 명세서에 사용된 용어“대응되는”은 당업자에게 일반적으로 이해되는 의미를 갖는다. 구체적으로, “대응되는”은 두 가닥의 서열을 상동성 또는 서열 동일성 대비 후, 한 가닥의 서열이 다른 한 가닥의 서열에서의 특정 부위에 대응되는 부위를 나타낸다. 따라서, “SEQ ID NO: 19로 표시되는 아미노산 서열의 제222 부위/제322 부위/제247 부위/제280 부위에 대응되는 아미노산 잔기”에서, SEQ ID NO: 19로 표시되는 아미노산 서열의 일단에 6-His 태그를 추가하면, 얻은 돌연변이체에서 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제222 부위/제322 부위/제247 부위/제280 부위가 제228 부위/제328 부위/제253 부위/제286 부위일 수 있고; SEQ ID NO: 19로 표시되는 아미노산 서열에서의 소수의 아미노산 잔기(예를 들어 2개)가 결실되면, 얻은 돌연변이체에서 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제222 부위/제322 부위/제247 부위/제280 부위가 제220 부위/제320 부위/제245 부위/제278 부위일 수 있으며, 등등이다. 또한 예를 들어, 한 가닥에 400개의 아미노산 잔기가 있는 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열의 제20 ~ 420 부위와의 상동성 또는 서열 동일성이 비교적 높으면, 얻은 돌연변이체에서 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제222 부위/제322 부위/제247 부위/제280 부위가 제202 부위/제302 부위/제227 부위/제260 부위일 수 있다.As used herein, the term “corresponding” has the meaning commonly understood by one of ordinary skill in the art. Specifically, "corresponding" refers to a region in which the sequence of one strand corresponds to a specific site in the sequence of the other strand after comparing the sequences of two strands for homology or sequence identity. Therefore, in “amino acid residues corresponding to the 222th region/322nd region/247th region/280th region of the amino acid sequence shown in SEQ ID NO: 19”, at one end of the amino acid sequence shown in SEQ ID NO: 19 When the 6-His tag is added, the 222 site / 322 site / 247 site / 280 site corresponding to the amino acid sequence shown in SEQ ID NO: 19 in the obtained mutant is the 228 site / 328 site / 253 site/286 site; When a few amino acid residues (eg, two) in the amino acid sequence represented by SEQ ID NO: 19 are deleted, the 222 site/322 corresponding to the amino acid sequence represented by SEQ ID NO: 19 in the obtained mutant Site/Site 247/Site 280 may be Site 220/Site 320/Site 245/Site 278, and so on. Also, for example, if the sequence having 400 amino acid residues in one strand has relatively high homology or sequence identity with the 20 to 420 sites of the amino acid sequence represented by SEQ ID NO: 19, then the mutant obtained has SEQ ID NO. : The 222th site/322nd site/247th site/280th site corresponding to the amino acid sequence represented by 19 may be the 202nd site/302nd site/227th site/260th site.

발명의 실시를 위한 형태에서, 상기 상동성 또는 서열 동일성은 80 % 이상일 수 있고, 바람직하게는 90 %이며, 더욱 바람직하게는 95 ~ 98 %이고, 가장 바람직하게는 99 % 이상이다.In an embodiment of the present invention, the homology or sequence identity may be 80% or more, preferably 90%, more preferably 95-98%, and most preferably 99% or more.

당업자에게 공지된 서열 상동성 또는 동일성을 측정하는 방법으로 컴퓨터 분자 생물학(Computational Molecular Biology), Lesk, A.M.편, 옥스포드 대학 출판사, 뉴욕, 1988; 생물학적 컴퓨팅: 정보학 및 유전체학 프로젝트(Biocomputing:Informatics and Genome Projects), Smith, D.W.편, 아카데미 출판사, 뉴욕, 1993; 서열 데이터의 컴퓨터 분석(Computer Analysis of Sequence Data), 제1 부분, Griffin, A.M. 및 Griffin, H.G.편, Humana Press, 뉴저지, 1994; 분자 생물학에서의 서열 분석(Sequence Analysis in Molecular Biology), von Heinje, G., 아카데미 출판사, 1987 및 서열 분석 프라이머(Sequence Analysis Primer), Gribskov, M 및 Devereux, J.편 M Stockton Press, 뉴욕, 1991 및 Carillo, H.및 Lipman, D., SIAM J. Applied Math., 48:1073(1988)을 포함하지만 이에 한정되지 않는다. 동일성을 측정하는 바람직한 방법은 테스트되는 서열 사이에서 가장 많이 대응되는 것이다. 동일성을 측정하는 방법을 대중들이 이용 가능한 컴퓨터 프로그램에 컴파일하였다. 두 가닥의 서열 사이의 동일성을 측정하는 바람직한 컴퓨터 프로그램 방법으로 GCG 패키지(Devereux, J. 등, 1984), BLASTP, BLASTN 和 FASTA(Altschul, S, F. 등, 1990)를 포함하지만 이에 한정되지 않는다. 대중들이 NCBI와 다른 소스로부터 얻은 BLASTX 프로그램(BLAST 수첩, Altschul, S. 등, NCBI NLM NIH Bethesda, Md.20894; Altschul, S. 등, 1990)을 얻을 수 있다. 공지된 Smith Waterman 알고리즘을 동일성 측정에 적용할 수도 있다.Methods for determining sequence homology or identity known to those skilled in the art include Computational Molecular Biology, Lesk, A.M. ed., Oxford University Press, New York, 1988; Biocomputing: Informatics and Genome Projects, edited by Smith, D.W., Academy Press, New York, 1993; Computer Analysis of Sequence Data, Part 1, Griffin, A.M. and Griffin, edited by H.G., Humana Press, New Jersey, 1994; Sequence Analysis in Molecular Biology, von Heinje, G., Academy Press, 1987 and Sequence Analysis Primer, Gribskov, M and Devereux, J. ed. M Stockton Press, New York, 1991 and Carillo, H. and Lipman, D., SIAM J. Applied Math., 48:1073 (1988). A preferred method of determining identity is the greatest correspondence between the sequences being tested. Methods for determining identity were compiled into a publicly available computer program. Preferred computer program methods for determining the identity between the sequences of two strands include, but are not limited to, the GCG package (Devereux, J. et al., 1984), BLASTP, BLASTN and FASTA (Altschul, S, F. et al., 1990). . The public may obtain BLASTX programs (BLAST Handbook, Altschul, S. et al., NCBI NLM NIH Bethesda, Md. 20894; Altschul, S. et al., 1990) from NCBI and other sources. The known Smith Waterman algorithm can also be applied to the identity measurement.

다른 설명이 없으면, 본 명세서에 언급된 진세노사이드와 사포게닌는 C20 부위의 S배열 및/또는 R배열의 진세노사이드와 사포게닌이다.Unless otherwise specified, the ginsenosides and sapogenins mentioned herein are ginsenosides and sapogenins in the S and/or R configuration of the C20 region.

본 명세서에 사용된 바와 같이, “분리된 폴리펩티드”는 상기 폴리펩티드가 천연적이고 이와 관련된 기타 단백질, 지질류, 당류 또는 기타 물질을 대체 함유하지 않은 것을 의미한다. 당업자는 표준 단백질 정제 기술을 사용하여 폴리펩티드를 정제할 수 있다. 대체로 순수한 폴리펩티드는 비환원성 폴리아크릴아미드 겔에서 단일 주 밴드를 생성할 수 있다. 상기 폴리펩티드의 순도는 아미노산 서열로 더 분석할 수도 있다.As used herein, "isolated polypeptide" means that the polypeptide is native and free of other proteins, lipids, sugars or other substances associated therewith. One skilled in the art can purify the polypeptide using standard protein purification techniques. Generally pure polypeptides can produce a single main band in a non-reducing polyacrylamide gel. The purity of the polypeptide may be further analyzed by amino acid sequence.

본 발명의 활성 폴리펩티드는 재조합 폴리펩티드, 천연 폴리펩티드, 합성 폴리펩티드일 수 있다. 본 발명의 폴리펩티드는 천연적으로 정제한 산물, 또는 화학적으로 합성한 산물, 또는 재조합 기술을 사용하여 원핵 또는 진핵 숙주(예를 들어, 세균, 효모, 식물)에서 생성한 것일 수 있다. 재조합 생산 수단에 사용된 숙주에 따라, 본 발명의 폴리펩티드는 글리코실화된 것이거나, 비글리코실화된 것일 수 있다. 본 발명의 폴리펩티드는 초기 메티오닌 잔기를 포함하거나 포함하지 않을 수 있다.The active polypeptides of the present invention may be recombinant, native or synthetic polypeptides. The polypeptides of the present invention may be naturally purified products, chemically synthesized products, or produced in prokaryotic or eukaryotic hosts (eg, bacteria, yeast, plants) using recombinant technology. Depending on the host used in the recombinant production means, the polypeptides of the present invention may be glycosylated or aglycosylated. Polypeptides of the invention may or may not contain an initial methionine residue.

본 발명은 상기 폴리펩티드의 단편, 유도체 및 유사체를 더 포함한다. 본 명세서에 사용된 바와 같이, 용어 "단편", “유도체” 및 “유사체”는 상기 폴리펩티드와 동일한 생물학적 기능 또는 활성을 대체로 부유하는 폴리펩티드를 지칭한다.The present invention further includes fragments, derivatives and analogs of the above polypeptides. As used herein, the terms “fragment,” “derivative,” and “analog” refer to a polypeptide that retains substantially the same biological function or activity as the polypeptide.

본 발명의 폴리펩티드 단편, 유도체 또는 유사체는 (i) 하나 또는 복수 개의 보존적 또는 비보존적인 아미노산 잔기(바람직하게는 보존적인 아미노산 잔기)가 치환된 폴리펩티드가 있고, 이렇게 치환된 아미노산 잔기는 윤전자 코드에 의해 코딩된 것일 수 있거나 아닐 수도 있으며, 또는 (ⅱ) 하나 또는 복수 개의 아미노산 잔기에 치환기가 있는 폴리펩티드, 또는 (ⅲ) 성숙된 폴리펩티드가 다른 하나의 화합물(폴리에틸렌 글리콜과 같은 예를 들어 폴리펩티드의 반감기를 연장시키는 화합물)과 융합시켜 형성된 폴리펩티드, 또는 (iv) 추가 아미노산 서열을 이 폴리펩티드 서열에 융합하여 형성된 폴리펩티드(예를 들어, 리더 서열 또는 분비 서열 또는 이 폴리펩티드를 정제하기 위한 서열, 또는 단백질원 서열, 또는 항원 IgG 단편과 형성된 융합 단백질)일 수 있다. 본 명세서의 교시에 따르면, 이러한 단편, 유도체 및 유사체는 당업자에게 공지된 범위 내에 속한다.Polypeptide fragments, derivatives or analogs of the present invention include polypeptides in which (i) one or a plurality of conservative or non-conservative amino acid residues (preferably conservative amino acid residues) are substituted, wherein the substituted amino acid residues have the rotary code may or may not be encoded by, or (ii) a polypeptide having a substituent at one or multiple amino acid residues, or (iii) a mature polypeptide of another compound (e.g., the half-life of a polypeptide such as polyethylene glycol) a polypeptide formed by fusion with a compound extending , or a fusion protein formed with an antigen IgG fragment). In accordance with the teachings herein, such fragments, derivatives and analogs are within the scope known to those skilled in the art.

본 발명의 활성 폴리펩티드는 글리코실트랜스퍼라제 활성을 갖으며 하기와 같은 하나 또는 복수의 반응을 촉진할 수 있다.The active polypeptide of the present invention has glycosyltransferase activity and can promote one or more reactions as follows.

Figure 112019129682541-pct00004
Figure 112019129682541-pct00004

Figure 112019129682541-pct00005
Figure 112019129682541-pct00005

상기 폴리펩티드 서열은 SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 또는 SEQ ID NO: 41 또는 이의 유도 폴리펩티드이고, 상기 용어는 상기 폴리펩티드와 동일한 기능을 갖는 SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37 또는 SEQ ID NO.: 39 또는 SEQ ID NO: 41 서열의 변형 형태를 더 포함한다. 이러한 변형 형태는 하나 또는 복수 개(통상적으로 1 ~ 50개, 바람직하게는 1 ~ 30개, 더욱 바람직하게는 1 ~ 20개, 가장 바람직하게는 1 ~ 10개)의 아미노산의 결실, 삽입 및/또는 치환, 및 C 말단 및/또는 N 말단에 하나 또는 복수 개(통상적으로 20개 이내, 바람직하게는 10개 이내, 더욱 바람직하게는 5개 이내)의 아미노산을 첨가하는 것을 포함한다(하지만, 이에 한정되지 않음). 예를 들어, 당 업계에서, 성능이 비슷하거나 유사한 아미노산에 의해 치환될 때, 단백질의 기능은 일반적으로 변하지 않는다. 또한 예를 들어, C 말단 및/또는 N 말단에 하나 또는 복수 개의 아미노산의 첨가는 일반적으로 단백질의 기능을 변화시키지 않는다. 상기 용어 본 발명의 단백질의 활성 단편 및 활성 유도체를 더 포함한다. 본 발명은 상기 폴리펩티드의 유사체를 더 제공하였다. 이러한 유사체와 천연 폴리펩티드의 차이는 아미노산 서열의 차이일 수 있고, 서열에 영향을 미치지 않는 변형 형태의 차이일 수도 있거나, 또는 둘 다일 수 있다. 이러한 폴리펩티드는 천연 또는 유도된 유전자 변이체를 포함한다. 유도된 변이체는 다양한 기술에 의해 얻을 수 있으며, 예를 들어, 복사 또는 유도제에 노출되어 생성된 무작위 돌연변이를 통해 얻을 수 있고, 부위 특이적 돌연변이법 또는 기타 분자 생물학에 공지된 기술에 의해 얻을 수도 있다. 유사체는 천연 L-아미노산의 잔기(예를 들어 D-아미노산)를 갖는 유사체, 및 비천연적으로 존재하거나 합성된 아미노산(예를 들어 β, γ-아미노산)을 갖는 유사체를 더 포함한다. 본 발명의 폴리펩티드는 상기에서 예를 든 대표적인 폴리펩티드에 제한되지 않는 것을 이해해야 한다.wherein said polypeptide sequence is SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 or SEQ ID NO: 41 or a derivative thereof; The term refers to SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37 or SEQ ID NO.: 39 or SEQ ID NO: 41 having the same function as the polypeptide It further includes modified forms of the sequence. Such modifications may include deletions, insertions and/or insertions of one or more amino acids (usually 1-50, preferably 1-30, more preferably 1-20, most preferably 1-10) amino acids. or substitution and addition of one or more (usually within 20, preferably within 10, more preferably within 5) amino acids at the C-terminus and/or N-terminus (however, this includes but not limited to). For example, in the art, when substituted by amino acids of comparable or similar performance, the function of a protein generally does not change. Also, for example, the addition of one or more amino acids to the C-terminus and/or the N-terminus generally does not change the function of the protein. The term further includes active fragments and active derivatives of the proteins of the present invention. The present invention further provides analogs of the above polypeptides. The difference between these analogues and the native polypeptide may be a difference in amino acid sequence, a difference in a modified form that does not affect the sequence, or both. Such polypeptides include natural or derived genetic variants. Derived variants may be obtained by a variety of techniques, for example, through random mutations generated by copying or exposure to inducing agents, site-directed mutagenesis or other techniques known in molecular biology. . Analogs further include analogs having residues of natural L-amino acids (eg D-amino acids), and analogs having non-naturally occurring or synthetic amino acids (eg β, γ-amino acids). It should be understood that the polypeptides of the present invention are not limited to the representative polypeptides exemplified above.

변형(통상적으로 1차 구조를 변경하지 않음) 형태로 체내 또는 체외의 폴리펩티드의 아세틸화 또는 카르복실화와 같은 화학적으로 유도된 형태를 포함한다. 변형은 글리코실화를 더 포함하고, 예를 들어, 폴리펩티드는 그러한 폴리펩티드의 합성 및 가공 또는 추가 가공 단계에서 글리코실화 변형에 의해 생성된다. 이러한 변형은 폴리펩티드를 글리코실화를 수행하는 효소(예를 들어, 포유 동물의 글리코실라제 또는 탈글리코실라제)에 노출시킴으로써 완성된다. 변형 형태는 인산화 아미노산 잔기(예를 들어, 포스포티로신, 포스포세린, 포스포레오닌)를 갖는 서열을 더 포함한다. 단백질 분해 효소 가수 분해에 대한 내성을 향상시키거나 용해성을 최적화하도록 변형된 폴리펩티드를 더 포함한다.includes chemically derived forms such as acetylation or carboxylation of the polypeptide in vivo or ex vivo in a modified (usually not altering the primary structure) form. Modifications further include glycosylation, eg, polypeptides are produced by glycosylation modifications in the synthesis and processing or further processing steps of such polypeptides. Such modifications are accomplished by exposing the polypeptide to an enzyme that performs glycosylation (eg, mammalian glycosylase or deglycosylase). Modified forms further include sequences having phosphorylated amino acid residues (eg, phosphotyrosine, phosphoserine, phosphoreonine). It further comprises a polypeptide modified to improve resistance to proteolytic enzyme hydrolysis or to optimize solubility.

본 발명의 Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 폴리펩티드 또는 이의 유도 폴리펩티드의 아미노기 말단 또는 카르복실기 말단은 단백질 태그로서 하나 또는 복수 개의 폴리펩티드 단편을 더 포함한다. 임의의 적합한 태그는 제한없이 본 발명에 사용될 수 있다. 예를 들어, 상기 태그는 FLAG, HA, HA1, c-Myc, Poly -His, Poly-Arg, Strep-TagII, AU1, EE, T7, 4A6, ε, B, gE 및 Ty1일 수 있다. 이러한 태그는 단백질의 정제에 사용될 수 있다. 표 2에는 이러한 태그 중 일부와 이의 서열을 나타냈다.The amino terminus or carboxyl terminus of the Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 polypeptide or derivative polypeptide thereof of the present invention further comprises one or a plurality of polypeptide fragments as a protein tag. Any suitable tag may be used in the present invention without limitation. For example, the tag may be FLAG, HA, HA1, c-Myc, Poly-His, Poly-Arg, Strep-TagII, AU1, EE, T7, 4A6, ε, B, gE and Ty1. Such tags can be used for purification of proteins. Table 2 lists some of these tags and their sequences.

태그tag 잔기 수number of residues 서열order Poly-ArgPoly-Arg 5 ~ 6개(통상적으로 5개)5 to 6 (usually 5) RRRRRRRRRR Poly-HisPoly-His 2 ~ 10개(통상적으로 6개)2 to 10 (usually 6) HHHHHHHHHHHH FLAGFLAG 8개8 pieces DYKDDDDKDYKDDDDK Strep-TagIIStrep-TagII 8개8 pieces WSHPQFEKWSHPQFEK C-mycC-myc 10개10 things WQKLISEEDLWQKLISEEDL GSTGST 220개220 pieces 마지막 6개는 LVPRGSThe last 6 are LVPRGS

번역된 단백질이 분비되어 발현하도록 하기 위해(예를 들어 세포 외에 분비됨), 상기 Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 폴리펩티드 또는 이의 유도 폴리펩티드의 아미노산 아미노기 말단에 pelB 신호 펩티드 등과 같은 신호 펩티드 서열을 추가할 수도 있다. 신호 펩티드는 폴리펩티드에서 세포 내로부터 분비되어 나오는 과정에서 절단될 수 있다.Amino acid amino groups of the Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 polypeptides or derivatives thereof to allow the translated protein to be secreted and expressed (eg extracellularly secreted). A signal peptide sequence such as a pelB signal peptide may be added at the end. The signal peptide may be cleaved in the process of being secreted out of the cell from the polypeptide.

본 발명의 폴리 뉴클레오티드는 DNA 형태 또는 RNA 형태일 수 있다. DNA 형태는 cDNA, 게놈 DNA 또는 인공 합성된 DNA를 포함한다. DNA는 단일 가닥 또는 이중 가닥일 수 있다. DNA는 코딩 가닥 또는 비코딩 가닥일 수 있다. 성숙 폴리펩티드를 코딩하는 코딩 영역 서열은 SEQ ID NO.: 3, SEQ ID NO.: 22, SEQ ID NO.: 36, SEQ ID NO.: 38, SEQ ID NO.: 40 또는 SEQ ID NO.: 42로 표시되는 코딩 영역 서열과 동일하거나 축퇴 변이체일 수 있다. 본 명세서에 사용된 바와 같이, “축퇴 변이체”는 본 발명에서 SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39, SEQ ID NO.: 41로 표시되는 아미노산 서열을 갖는 폴리펩티드 또는 이의 유도 폴리펩티드를 코딩하지만, SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39, SEQ ID NO.: 41 또는 이의 유도 폴리펩티드의 코딩 서열, 바람직하게는 SEQ ID NO.: 3, SEQ ID NO.: 22, SEQ ID NO.: 36, SEQ ID NO.: 38, SEQ ID NO.: 40 또는 SEQ ID NO.: 42로 표시되는 서열과 차별되는 핵산 서열을 지칭한다. SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 또는 SEQ ID NO.: 41로 표시되는 폴리펩티드 또는 이의 유도 폴리펩티드의 성숙 폴리펩티드를 코딩하는 폴리 뉴클레오티드는 성숙 폴리펩티드만을 코딩하는 코딩 서열; 성숙 폴리펩티드의 코딩 서열 및 다양한 추가 코딩 서열; 성숙 폴리펩티드의 코딩 서열(및 임의의 추가 코딩 서열) 및 비코딩 서열을 포함한다.The polynucleotide of the present invention may be in the form of DNA or RNA. DNA forms include cDNA, genomic DNA, or artificially synthesized DNA. DNA can be single-stranded or double-stranded. DNA may be the coding strand or the non-coding strand. The coding region sequence encoding the mature polypeptide is SEQ ID NO.: 3, SEQ ID NO.: 22, SEQ ID NO.: 36, SEQ ID NO.: 38, SEQ ID NO.: 40 or SEQ ID NO.: 42 It may be the same as the coding region sequence represented by or may be a degenerate variant. As used herein, a “degenerate variant” means in the present invention SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 , which encodes a polypeptide having an amino acid sequence represented by SEQ ID NO.: 41 or a derivative polypeptide thereof, but SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37 , the coding sequence of SEQ ID NO.: 39, SEQ ID NO.: 41 or a derived polypeptide thereof, preferably SEQ ID NO.: 3, SEQ ID NO.: 22, SEQ ID NO.: 36, SEQ ID NO. : 38, SEQ ID NO.: 40 or SEQ ID NO.: refers to a nucleic acid sequence that is different from the sequence represented by the sequence. of the polypeptide represented by SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 or SEQ ID NO.: 41 or a derived polypeptide thereof A polynucleotide encoding a mature polypeptide comprises a coding sequence encoding only the mature polypeptide; the coding sequence of the mature polypeptide and various additional coding sequences; the coding sequence (and any additional coding sequences) of the mature polypeptide and non-coding sequences.

용어 “폴리펩티드를 코딩하는 폴리 뉴클레오티드”는 폴리펩티드를 코딩하는 것을 포함하는 폴리 뉴클레오티드일 수 있고, 추가적인 코딩 및/또는 비코딩 서열을 더 포함하는 폴리 뉴클레오티드일 수도 있다.The term “polynucleotide encoding a polypeptide” may be a polynucleotide comprising encoding a polypeptide, or a polynucleotide further comprising additional coding and/or non-coding sequences.

또한 본 발명은 상기 폴리 뉴클레오티드의 변이체, 본 발명과 동일한 아미노산 서열을 갖는 폴리펩티드 또는 폴리펩티드를 코딩하는 이의 단편, 유사체 및 유도체에 관한 것이다. 이 폴리 뉴클레오티드의 변이체는 천연적으로 발생되는 대립 변이체 또는 비천연적으로 발생되는 변이체일 수 있다. 이러한 뉴클레오티드 변이체는 치환 변이체, 결실 변이체 및 삽입 변이체를 포함한다. 당 업계에 공지된 바와 같이, 대립 변이체는 하나의 폴리 뉴클레오티드의 대체 형태이고, 이는 하나 또는 복수 개의 뉴클레오티드의 치환, 결실 또는 삽입일 수 있지만, 실질적으로 이의 코딩된 폴리펩티드의 기능을 변화시키지 않는다.The present invention also relates to variants of the polynucleotides, polypeptides having the same amino acid sequence as the present invention or fragments, analogs and derivatives thereof encoding the polypeptides. Variants of this polynucleotide may be naturally occurring allelic variants or non-naturally occurring variants. Such nucleotide variants include substitutional variants, deletional variants and insertional variants. As is known in the art, an allelic variant is an alternative form of one polynucleotide, which may be a substitution, deletion or insertion of one or multiple nucleotides, but does not substantially change the function of its encoded polypeptide.

또한 본 발명은 상기의 서열 혼성화되고 2개의 서열 사이에 적어도 50 %, 바람직하게는 적어도 70 %, 더욱 바람직하게 적어도 80 %의 동일성을 갖는 폴리 뉴클레오티드에 관한 것이다. 본 발명은 특히 엄격한 조건(또는 엄한 조건) 하에서 본 발명에 따른 폴리 뉴클레오티드와 혼성화될 수 있는 폴리 뉴클레오티드에 관한 것이다. 본 발명에서, “엄격한 조건”은, (1) 비교적 낮은 이온 강도와 비교적 높은 온도 하에서의 혼성화 및 용리, 예를 들어 0.2 × SSC, 0.1 %의 SDS, 60 ℃; 또는 (2) 혼성화시 변성제 첨가, 예를 들어, 50 %(v/v)의 포름아미드, 0.1 %의 소태아 혈청/0.1 %의 Ficoll, 42 ℃ 등; 또는 (3) 두 가닥의 서열 사이의 동일성이 적어도 90 % 이상이고, 바람직하게는 95 % 이상일 때만 혼성화된다. 또한, 혼성화 가능한 폴리 뉴클레오티드에 의해 코딩된 폴리펩티드는 SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 또는 SEQ ID NO.: 41로 표시되는 성숙 폴리펩티드와 동일한 생물학적 기능과 활성을 갖는다.The present invention also relates to a polynucleotide that hybridizes to the above sequences and has at least 50%, preferably at least 70%, more preferably at least 80% identity between the two sequences. The present invention particularly relates to polynucleotides capable of hybridizing with a polynucleotide according to the present invention under stringent conditions (or stringent conditions). In the present invention, “stringent conditions” include (1) hybridization and elution under relatively low ionic strength and relatively high temperature, for example, 0.2×SSC, 0.1% SDS, 60° C.; or (2) addition of a denaturant upon hybridization, for example, 50% (v/v) formamide, 0.1% fetal bovine serum/0.1% Ficoll, 42° C., and the like; or (3) hybridizes only when the identity between the sequences of the two strands is at least 90% or more, preferably 95% or more. In addition, the polypeptide encoded by the hybridizable polynucleotide is SEQ ID NO.: 4, SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 or SEQ ID NO. It has the same biological function and activity as the mature polypeptide represented by .: 41.

또한 본 발명은 상기의 서열과 혼성화된 핵산 단편에 관한 것이다. 본 명세서에 사용된 바와 같이, “핵산 단편”의 길이는 적어도 15개의 뉴클레오티드, 바람직하게는 적어도 30개의 뉴클레오티드, 더욱 바람직하게는 50개의 뉴클레오티드, 가장 바람직하게는 100개의 뉴클레오티드를 포함한다. 핵산 단편은 핵산 증폭 기술(예를 들어 PCR)에 적용하여 Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 폴리펩티드 또는 이의 유도 폴리펩티드를 코딩하는 폴리뉴클레오티드를 결정 및/또는 분리한다.The present invention also relates to a nucleic acid fragment hybridized with the above sequence. As used herein, the length of a “nucleic acid fragment” comprises at least 15 nucleotides, preferably at least 30 nucleotides, more preferably 50 nucleotides, and most preferably 100 nucleotides. Nucleic acid fragments are subjected to nucleic acid amplification techniques (eg PCR) to determine polynucleotides encoding Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 polypeptides or derivatives thereof. or separate.

본 발명에서의 폴리펩티드와 폴리 뉴클레오티드는 바람직하게 분리된 형식으로 제공되고, 더욱 바람직하게는 정제 내지 균질화 형식으로 제공된다.Polypeptides and polynucleotides in the present invention are preferably provided in an isolated format, and more preferably in a purified or homogenized format.

본 발명의 Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 폴리펩티드 또는 이의 유도 폴리펩티드뉴클레오티드 전장 서열 또는 이의 단편은 통상적으로 PCR 증폭법, 재조합법 또는 인공 합성의 방법에 의해 얻는다. PCR 증폭법에 관하여, 본 발명에 개시된 관련 뉴클레오티드 서열, 특히 개방 판독 프레임 서열에 따라 프라이머를 설계할 수 있고, 시판되는 cDNA 라이브러리 또는 당업자에게 공지된 통상적인 방법에 의해 제조된 cDNA 라이브러리를 주형으로 증폭하여 관련 서열을 얻을 수 있다. 서열이 비교적 길 경우, 2회 또는 여러 회 PCR 증폭을 수행할 필요가 있고, 다음 각각의 증폭된 단편을 정확한 순서에 따라 함께 스플라이싱한다.The Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 polypeptide of the present invention or the full-length nucleotide sequence of a derived polypeptide nucleotide sequence or a fragment thereof of the present invention is typically used in PCR amplification, recombinant or artificial synthesis. obtained by With respect to the PCR amplification method, primers can be designed according to the relevant nucleotide sequence disclosed in the present invention, in particular, an open reading frame sequence, and a commercially available cDNA library or a cDNA library prepared by a conventional method known to those skilled in the art is amplified as a template. to obtain the relevant sequence. If the sequence is relatively long, it is necessary to perform two or several PCR amplifications, and then each amplified fragment is spliced together in the correct order.

관련 서열을 얻으면, 재조합법에 따라 관련 서열을 대량으로 얻을 수 있다. 이는 일반적으로 전달체로 클로닝되고 다시 세포로 전달된 후, 통상적인 방법에 의해 증식된 숙주 세포로부터 분리하여 얻은 관련 서열이다.When the related sequence is obtained, a large amount of the related sequence can be obtained by recombination. This is generally a related sequence obtained by isolation from a host cell propagated by a conventional method after being cloned into a carrier and transferred back into a cell.

이 외에, 특히 단편 길이가 짧을 경우 인공 합성 방법 관련 서열을 합성할 수도 있다. 통상적으로, 먼저 복수 개의 작은 단편을 합성한 후, 다시 연결하여 긴 단편을 얻을 수 있다.In addition, especially when the fragment length is short, it is also possible to synthesize sequences related to artificial synthesis methods. In general, a long fragment can be obtained by first synthesizing a plurality of small fragments and then ligating them again.

현재, 본 발명의 단백질(또는 이의 단편, 또는 이의 유도체)을 코딩하는 DNA 서열은 화학적 합성에 의해 완전히 얻을 수 있다. 이후, 이 DNA 서열은 당 업계에 공지된 다양한 기존 DNA 분자 (또는 예를 들어 전달체) 및 세포에 도입될 수 있다. 이 외에, 화학 합성에 의해 돌연변이를 본 발명의 단백질 서열에 도입할 수도 있다.Currently, the DNA sequence encoding the protein of the present invention (or a fragment thereof, or a derivative thereof) can be completely obtained by chemical synthesis. This DNA sequence can then be introduced into various existing DNA molecules (or, for example, carriers) and cells known in the art. In addition, mutations may be introduced into the protein sequence of the present invention by chemical synthesis.

PCR 기술에 의해 DNA/RNA를 증폭시키는 방법은 바람직하게는 본 발명의 유전자를 얻기 위해 사용된다. 특히, 라이브러리로부터 전장의 cDNA를 얻는 것이 어려운 경우, 바람직하게 RACE법(RACE-cDNA 말단 고속 증폭법)을 사용할 수 있고, PCR에 사용된 프라이머는 본 명세서에 개시된 본 발명의 서열 정보에 따라 적절히 선택될 수 있으며, 통상적인 방법에 따라 합성될 수도 있다. 증폭된 DNA/RNA는 전기 영동과 같은 통상적인 방법에 의해 분리 및 정제될 수 있다.The method of amplifying DNA/RNA by PCR technique is preferably used to obtain the gene of the present invention. In particular, when it is difficult to obtain full-length cDNA from the library, the RACE method (RACE-cDNA terminal high-speed amplification method) can be preferably used, and the primers used for PCR are appropriately selected according to the sequence information of the present invention disclosed herein. may be, and may be synthesized according to a conventional method. The amplified DNA/RNA can be isolated and purified by conventional methods such as electrophoresis.

또한 본 발명은 본 발명의 폴리 뉴클레오티드를 포함하는 전달체, 본 발명의 전달체 또는 Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 폴리펩티드 또는 이의 유도 폴리펩티드의 코딩 서열로 유전자 조작에 의해 생성된 숙주 세포, 및 재조합 기술에 의해 본 발명에 따른 폴리펩티드를 생성하는 방법에 관한 것이다.In addition, the present invention provides a delivery system comprising the polynucleotide of the present invention, a delivery system of the present invention, or a gene with a coding sequence of a Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 polypeptide or its derivative polypeptide. It relates to host cells produced by the manipulation, and to methods for producing the polypeptides according to the invention by recombinant techniques.

본 발명의 폴리뉴클레오티드 서열은 통상적인 재조합 DNA 기술에 의해 재조합된 Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 폴리펩티드 또는 이의 유도 폴리펩티드를 발현하거나 생산할 수 있다. 일반적으로 하기 단계를 포함한다.The polynucleotide sequence of the present invention can express or produce a recombinant Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 polypeptide or a derived polypeptide thereof by conventional recombinant DNA techniques. It generally comprises the following steps.

(1) 본 발명의 Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3폴리펩티드 또는 이의 유도 폴리펩티드를 코딩하는 폴리 뉴클레오티드(또는 변이체), 또는 상기 폴리 뉴클레오티드를 포함하는 재조합 발현 전달체로 숙주 세포에 형질 전환시키거나 형질 도입시키는 단계; (1) a polynucleotide (or a variant) encoding a Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 polypeptide of the present invention or a derived polypeptide thereof, or a recombinant comprising the polynucleotide transforming or transducing the host cell with an expression vehicle;

(2) 적합한 배지에서 숙주 세포를 배양하는 단계;(2) culturing the host cells in a suitable medium;

(3) 배지 또는 세포로부터 단백질을 분리, 정제하는 단계.(3) isolating and purifying the protein from the medium or cells.

본 발명에서, Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 폴리펩티드 또는 이의 유도 폴리펩티드를 코딩하는 폴리 뉴클레오티드 서열은 재조합 발현 전달체에 삽입될 수 있다. 용어 “재조합 발현 전달체”는 당 업계에 공지된 박테리아 플라스미드, 파지, 효모 플라스미드, 식물 세포 바이러스, 아데노바이러스와 같은 포유 동물 세포 바이러스, 레트로바이러스 또는 기타 전달체를 지칭한다. 숙주 체내에서 복제 및 안정화될 수 있는 플라스미드 및 전달체라면 임의의 것을 사용할 수 있다. 발현 전달체의 하나의 중요한 특징은 통상적으로 복제 기점, 프로모터, 마커 유전자 및 번역 제어 요소를 함유한다는 것이다.In the present invention, a polynucleotide sequence encoding a Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 polypeptide or a derived polypeptide thereof may be inserted into a recombinant expression vehicle. The term “recombinant expression vehicle” refers to a mammalian cell virus such as a bacterial plasmid, phage, yeast plasmid, plant cell virus, adenovirus, retrovirus or other carrier known in the art. Any plasmid and delivery system that can be replicated and stabilized in a host body can be used. One important characteristic of an expression vehicle is that it typically contains an origin of replication, a promoter, a marker gene and translational control elements.

당업자에게 공지된 방법은 Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 폴리펩티드 또는 이의 유도 폴리펩티드의 코딩 DNA 서열 및 적합한 전사/번역 제어 신호를 함유한 발현 전달체의 구축에 사용될 수 있다. 이러한 방법은 체외 재조합 DNA 기술, DNA 합성 기술, 체내 재조합 기술 등을 포함한다. 상기 DNA 서열은 발현 전달체 중의 적합한 프로모터에 효과적으로 연결되어 mRNA 합성을 지시할 수 있다. 이러한 프로모터의 대표적인 예로, 대장균의 lac 또는 trp 프로모터; λ파지 PL 프로모터; CMV 즉시 초기 프로모터, HSV 티미딘키나제 프로모터, 초기 및 말기 SV40프로모터, 역전사 바이러스의 LTRs 및 기타 일부 공지된 제어 가능한 유전자가 원핵 또는 진핵 세포 또는 이의 바이러스에서 발현되는 프로모터를 비롯한 진핵 프로모터가 있다. 발현 전달체는 번역 개시용의 리보솜 결합 부위 및 전사 종결자를 더 포함한다.Methods known to those skilled in the art include the construction of expression vehicles containing the coding DNA sequence of the Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 polypeptide or its derivative polypeptide and suitable transcriptional/translational control signals. can be used for Such methods include in vitro recombinant DNA technology, DNA synthesis technology, in vivo recombination technology, and the like. The DNA sequence can be effectively linked to a suitable promoter in an expression vehicle to direct mRNA synthesis. Representative examples of such promoters include E. coli lac or trp promoter; λ phage PL promoter; There are eukaryotic promoters, including the CMV immediate early promoter, the HSV thymidine kinase promoter, the early and late SV40 promoters, the LTRs of reverse transcription viruses, and promoters in which some other known controllable genes are expressed in prokaryotic or eukaryotic cells or viruses thereof. The expression vehicle further comprises a ribosome binding site for initiating translation and a transcription terminator.

이 외에, 바람직하게 발현 전달체는 진핵 세포 배양을 위한 디히드로폴레이트리덕타제(dihydrofolate reductase), 네오마이신(neomycin) 내성 및 녹색 형광 단백질(GFP)과 같은 형질 전환 된 숙주 세포 선택하기 위한 표현형 특성을 제공하거나, 대장균의 테트라사이클린(tetracycline) 또는 암피실린 내성을 제공하기 위한 하나 또는 복수 개의 선별 마커 유전자를 포함한다.In addition to this, preferably the expression vehicle has phenotypic properties for selection of transformed host cells such as dihydrofolate reductase, neomycin resistance and green fluorescent protein (GFP) for eukaryotic cell culture. or contains one or a plurality of selectable marker genes for providing E. coli tetracycline or ampicillin resistance.

상기의 적합한 DNA 서열 및 적합한 프로모터 또는 제어 서열을 전달체를 단백질의 발현을 가능하게 하는 적절한 숙주 세포에 형질 전환시킬 수 있다.The above suitable DNA sequences and suitable promoter or control sequences can be transformed into an appropriate host cell that allows expression of the protein in the carrier.

숙주 세포는 박테리아 세포와 같은 원핵 세포; 또는 효모 세포와 같은 하등 진핵 세포; 또는 포유 동물 세포와 같은 고등 진핵 세포일 수 있다. 대표적인 예로 대장균, 스트렙토마이세스 속; 살모넬라티피무리움의 박테리아 세포; 효모와 같은 진균 세포; 식물 세포; 초파리 S2 또는 Sf9의 곤충 세포; CHO, COS, 293세포, 또는 Bowes 흑색종 세포의 동물 세포 등이 있다.Host cells include prokaryotic cells such as bacterial cells; or lower eukaryotic cells such as yeast cells; or higher eukaryotic cells such as mammalian cells. Representative examples include Escherichia coli, Streptomyces genus; bacterial cells of Salmonella typhimurium; fungal cells such as yeast; plant cells; insect cells of Drosophila S2 or Sf9; animal cells of CHO, COS, 293 cells, or Bowes melanoma cells.

본 발명의 폴리 뉴클레오티드가 고등 진핵 세포에서 발현될 때, 인핸서 서열이 전달체에 삽입되면 전사가 향상된다. 인핸서는 DNA의 시스 작용 인자로, 통상적으로 약 10개 내지 300개의 염기쌍이 있으며, 프로모터에 작용하여 유전자의 전사를 증가시킨다. 복제 개시점 말기 일측의 100개 내지 270개의 염시쌍의 SV40인핸서, 복제 개시점 말기 일측의 폴리마 인핸서 및 아데노 바이러스 인핸서 등을 포함하는 것을 예로 들 수 있다.When the polynucleotide of the present invention is expressed in higher eukaryotic cells, insertion of an enhancer sequence into the transporter enhances transcription. An enhancer is a cis-acting factor of DNA, usually about 10 to 300 base pairs, and acts on a promoter to increase the transcription of a gene. Examples include the SV40 enhancer of 100 to 270 salt pairs at the end of the replication initiation point, the polyma enhancer and the adenovirus enhancer at the end of the replication initiation point.

적절한 전달체, 프로모터, 인핸서 및 숙주 세포를 선택하는 방법은 당업자에게 명백할 것이다.Methods for selecting appropriate carriers, promoters, enhancers and host cells will be apparent to those skilled in the art.

재조합 DNA에 의한 숙주 세포의 형질 전환은 당업자에게 공지된 통상적인 기술을 사용하여 수행될 수 있다. 숙주가 대장균과 같은 원핵 생물일 때, DNA를 흡수할 수 있는 컴피턴트 세포는 지수 생장기 이후에 획득할 수 있고, CaCl2법에 의해 처리되며, 사용된 단계는 당 업계에 잘 알려져 있다. 다른 방법은 MgCl2를 사용하는 것이다. 필요하면, 형질 전환은 전기 천공에 의해 수행될 수도 있다. 숙주가 진핵 생물일 경우, 인산칼슘 공침법, 미세 주사법, 전기 천공법, 리포좀 패키징 등과 같은 통상적인 기계적 방법과 같은 DNA 형질 감염 방법을 선택하여 사용할 수 있다.Transformation of host cells with recombinant DNA can be performed using conventional techniques known to those skilled in the art. When the host is a prokaryotic organism such as E. coli, competent cells capable of taking up DNA can be obtained after the exponential growth phase, treated by the CaCl 2 method, and the steps used are well known in the art. Another method is to use MgCl 2 . If necessary, transformation can also be performed by electroporation. When the host is a eukaryote, a DNA transfection method such as a calcium phosphate co-precipitation method, a micro-injection method, an electroporation method, and a conventional mechanical method such as liposome packaging can be selected and used.

얻은 형질 전환체는 통상의 방법에 따라 배양하여 본 발명의 유전자에 의해 코딩된 폴리펩티드를 발현시킬 수 있다. 사용된 숙주 세포에 따라, 배양에 사용된 배지는 다양한 통상적인 배지로부터 선택될 수 있다. 숙주 세포 성장에 적합한 조건 하에서 배양하였다. 숙주 세포가 적절한 세포 밀도까지 성장한 후, 선택된 프로모터는 적합한 방법(예를 들어 온조 전환 또는 화학적 유도)에 의해 유도되고, 세포를 일정 시간 동안 더 배양하였다.The obtained transformant can be cultured according to a conventional method to express the polypeptide encoded by the gene of the present invention. Depending on the host cell used, the medium used for culturing can be selected from a variety of conventional media. Cultured under conditions suitable for host cell growth. After the host cells have grown to an appropriate cell density, the selected promoter is induced by a suitable method (eg, temperature-controlled switching or chemical induction), and the cells are further cultured for a period of time.

상기 방법에서의 재조합 폴리펩티드는 세포 내 또는 세포 막 상에서 발현되거나 세포 외로 분비될 수 있다. 필요하면, 재조합 단백질은 이의 물리적, 화학적 및 기타 특성을 이용하여 다양한 분리 방법에 의해 분리 및 정제할 수 있다. 이러한 방법은 당업자에게 잘 알려져 있다. 이러한 방법의 예로 통상적인 재생 처리, 단백질 침전제 처리(염석 방법), 원심 분리, 침투 파균, 울트라 처리, 울트라 원심 분리, 분자체 크로마토그래피(겔 여과), 흡착 크로마토그래피, 이온 교환 크로마토그래피, 고성능 액체 크로마토그래피 (HPLC) 및 기타 다양한 액상 크로마토그래피 기술 및 이러한 방법의 조합을 포함하지만 이에 한정되지 않는다.The recombinant polypeptide in the method may be expressed intracellularly or on a cell membrane or secreted extracellularly. If necessary, the recombinant protein can be isolated and purified by various separation methods using its physical, chemical and other properties. Such methods are well known to those skilled in the art. Examples of such methods include conventional regeneration treatment, protein precipitant treatment (salting-out method), centrifugation, permeabilization, ultra treatment, ultra centrifugation, molecular sieve chromatography (gel filtration), adsorption chromatography, ion exchange chromatography, high performance liquid chromatography (HPLC) and various other liquid chromatography techniques and combinations of such methods.

응용Applications

본 발명에 관한 활성 폴리펩티드 또는 글리코실트랜스퍼라제 Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 폴리펩티드 또는 이의 유도 폴리펩티드의 용도로 글리코실기 공여체로부터 유래된 글리코실기를 테트라시클릭트리터페노이드계 화합물의 C-3 부위의 히드록실기에 특이적이고 효율적으로 전이시키는 것을 포함한다(하지만 이에 한정되지 않음). 특히, 식 (I) 화합물을 상기 식 (II) 화합물로 전환시킬 수 있고, 예를 들어, 프로토파녹사디올 PPD를 항 종양 활성이 더 우수한 희귀 진세노사이드 Rh2로 전환시키며; 화합물 K를 진세노사이드 F2로 전환시킨다.For use in the active polypeptides or glycosyltransferases Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 polypeptides or derivatives thereof according to the present invention, the glycosyl group derived from the glycosyl group donor is tetra Specific and efficient transfer to the hydroxyl group of the C-3 site of a cyclic triterpenoid compound includes (but is not limited to). In particular, the compound of formula (I) can be converted into the compound of formula (II), for example, protophanoxadiol PPD is converted to the rare ginsenoside Rh2 with better anti-tumor activity; Compound K is converted to ginsenoside F2.

상기 테트라시클릭트리테르페노이드 화합물로 S배열 또는 R배열의 담마란형, 라놀린형, 티루칼라네스형, 시클로아탄(시클로알탄)형, apotirucallane형, 쿠커비탄형, 멜리아칸형 등 테트라시클릭트리터페노이드계 화합물을 포함한다(하지만 이에 한정되지 않음).As the tetracyclic triterpenoid compound, S- or R-configured dammaran-type, lanolin-type, tyrucalanes-type, cycloatan (cycloaltan)-type, apotirucallane-type, cucurbitan-type, meliacan-type, etc. tetracyclic tri terpenoid compounds.

본 발명은 공업 촉매 방법을 제공하였고, 글리코실기 공여체를 제공하는 조건 하에서, 본 발명의 Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 폴리펩티드 또는 이의 유도 폴리펩티드로 진세노사이드 Rh2와 진세노사이드 F2를 얻었다. 구체적으로, 상기 (A)반응에 사용된 폴리펩티드는 SEQ ID NO.: 4 또는 SEQ ID NO.: 21로 표시되는 폴리펩티드 또는 이의 유도 폴리펩티드로부터 선택되고; 상기 (B)반응에 사용된 폴리펩티드는 SEQ ID NO.:4로 표시되는 폴리펩티드 또는 이의 유도 폴리펩티드이다.The present invention provides an industrial catalytic method, wherein the Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 polypeptide or derivative polypeptide thereof of the present invention can be used under conditions to provide a glycosyl group donor. Senoside Rh2 and ginsenoside F2 were obtained. Specifically, the polypeptide used in the reaction (A) is selected from a polypeptide represented by SEQ ID NO.: 4 or SEQ ID NO.: 21 or a derivative thereof; The polypeptide used in the reaction (B) is a polypeptide represented by SEQ ID NO.:4 or a derivative thereof.

본 발명의 하나의 바람직한 예에서, 전술한 삼칠의 글리코실트랜스퍼라제 Pn50 및 글리코실트랜스퍼라제 돌연변이체 단백질 8E7을 사용하여 출아형 효모에서 진세노사이드 Rh2를 합성하는 방법을 제공하였다.In one preferred example of the present invention, a method for synthesizing ginsenoside Rh2 in budding yeast using the above-mentioned ginseng glycosyltransferase Pn50 and glycosyltransferase mutant protein 8E7 was provided.

본 발명의 하나의 바람직한 예에서, 전술한 삼칠의 글리코실트랜스퍼라제 Pn50 돌연변이체 단백질 Pn50-Q222H-VE을 사용하여 출아형 효모에서 진세노사이드 Rh2를 합성하는 방법을 제공하였다.In one preferred embodiment of the present invention, a method for synthesizing ginsenoside Rh2 in budding yeast using the above-mentioned ginseng glycosyltransferase Pn50 mutant protein Pn50-Q222H-VE is provided.

본 발명의 하나의 바람직한 예에서, 전술한 삼칠의 글리코실트랜스퍼라제 Pn50 돌연변이체 단백질 UGT-MUT1을 사용하여 출아형 효모에서 진세노사이드 Rh2를 합성하는 방법을 제공하였다.In one preferred example of the present invention, a method for synthesizing ginsenoside Rh2 in budding yeast using the above-mentioned ginseng glycosyltransferase Pn50 mutant protein UGT-MUT1 is provided.

본 발명의 하나의 바람직한 예에서, 전술한 삼칠의 글리코실트랜스퍼라제 Pn50 돌연변이체 단백질 UGT-MUT2를 사용하여 출아형 효모에서 진세노사이드 Rh2를 합성하는 방법을 제공하였다.In one preferred example of the present invention, a method for synthesizing ginsenoside Rh2 in budding yeast using the above-described ginseng glycosyltransferase Pn50 mutant protein UGT-MUT2 is provided.

본 발명의 하나의 바람직한 예에서, 전술한 삼칠의 글리코실트랜스퍼라제 Pn50 돌연변이체 단백질 UGT-MUT3을 사용하여 출아형 효모에서 진세노사이드 Rh2를 합성하는 방법을 제공하였다.In one preferred example of the present invention, a method for synthesizing ginsenoside Rh2 in budding yeast using the above-mentioned ginseng glycosyltransferase Pn50 mutant protein UGT-MUT3 was provided.

상기 글리코실기 공여체는 뉴클레오시드디포스페이트당이고,UDP-글루코스, ADP-글루코스, TDP-글루코스, CDP-글루코스, GDP-글루코스, UDP-아세틸글루코스, ADP-아세틸글루코스, TDP-아세틸글루코스, CDP-아세틸글루코스, GDP-아세틸글루코스, UDP-자일로스, ADP-자일로스, TDP-자일로스, CDP-자일로스, UDP-자일로스, GDP-자일로스, UDP-갈락투론산, ADP-갈락투론산, TDP-갈락투론산, CDP-갈락투론산, GDP-갈락투론산, UDP-갈락토스, ADP-갈락토스, TDP-갈락토스, CDP-갈락토스, GDP-갈락토스, UDP-아라비노스, ADP-아라비노스, TDP-아라비노스, CDP-아라비노스, GDP-아라비노스, UDP-람노오스, ADP-람노오스, TDP-람노오스, CDP-람노오스, GDP-람노오스 또는 기타 뉴클레오시드디포스페이트헥소스 또는 뉴클레오시드디포스페이트펜토스 또는 이들의 조합으로부터 선택된다.The glycosyl group donor is a nucleoside diphosphate sugar, UDP-glucose, ADP-glucose, TDP-glucose, CDP-glucose, GDP-glucose, UDP-acetylglucose, ADP-acetylglucose, TDP-acetylglucose, CDP- Acetylglucose, GDP-acetylglucose, UDP-xylose, ADP-xylose, TDP-xylose, CDP-xylose, UDP-xylose, GDP-xylose, UDP-galacturonic acid, ADP-galacturonic acid, TDP-galacturonic acid, CDP-galacturonic acid, GDP-galacturonic acid, UDP-galactose, ADP-galactose, TDP-galactose, CDP-galactose, GDP-galactose, UDP-arabinose, ADP-arabinose, TDP- arabinose, CDP-arabinose, GDP-arabinose, UDP-rhamnose, ADP-rhamnose, TDP-rhamnose, CDP-rhamnose, GDP-rhamnose or other nucleoside diphosphate hexose or nucleoside diphosphate pentose or a combination thereof.

바람직하게 상기 글리코실기 공여체는 피리딘디포스페이트당이고, UDP-글루코스, UDP-자일로스, UDP-람노오스, UDP-갈락투론산, UDP-갈락토스, UDP-아라비노스 또는 기타 피리딘디포스페이트헥소스 또는 피리딘디포스페이트펜토스 또는 이들의 조합으로부터 선택된다.Preferably, the glycosyl group donor is a pyridinediphosphate sugar, UDP-glucose, UDP-xylose, UDP-rhamnose, UDP-galacturonic acid, UDP-galactose, UDP-arabinose or other pyridinediphosphatehexose or pyridine diphosphate pentose or a combination thereof.

상기 방법에서, 효소 활성 첨가물(효소 활성을 향상시키거나 효소활성을 억제하는 첨가물)을 더 첨가할 수 있다. 상기 효소 활성 첨가물은 Ca2 +, Co2 +, Mn2 +, Ba2+, Al3 +, Ni2 +, Zn2 + 또는 Fe2 +; 또는 Ca2 +, Co2 +, Mn2 +, Ba2 +, Al3 +, Ni2 +, Zn2 + 또는 Fe2+의 물질을 생성할 수 있는 것으로부터 선택될 수 있다.In the above method, an enzyme activity additive (additive for enhancing enzyme activity or inhibiting enzyme activity) may be further added. The enzyme active additive is Ca 2+ , Co 2+ , Mn 2+ , Ba 2+ , Al 3+ , Ni 2+ , Zn 2+ or Fe 2+ ; or Ca 2+ , Co 2+ , Mn 2+ , Ba 2+ , Al 3+ , Ni 2+ , Zn 2+ or Fe 2+ .

상기 방법의 pH 조건은 pH4.0 ~ 10.0이고, 바람직하게는 pH6.0 ~ 8.5이며, 더욱 바람직하게는 pH8.5이다.The pH conditions of the method are pH4.0 to 10.0, preferably pH6.0 to 8.5, and more preferably pH8.5.

상기 방법의 온도 조건은 10 ~ 105 ℃이고, 바람직하게는 25 ~ 35 ℃이며, 더욱 바람직하게는 35 ℃이다.The temperature condition of the method is 10 to 105 °C, preferably 25 to 35 °C, more preferably 35 °C.

본 발명의 조성물을 더 제공하였고, 이의는 유효량의 본 발명의 활성 폴리펩티드 또는 글리코실트랜스퍼라제 Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 폴리펩티드 또는 이의 유도 폴리펩티드, 및 식품학적 또는 공업적으로 허용 가능한 담체 또는 부형제를 함유한다. 이러한 담체는 물, 완충액, 글루코스, 물, 글리세린, 에탄올 및 이들의 조합을 포함한다(하지만 이에 한정되지 않음).Further provided is a composition of the present invention, comprising an effective amount of an active polypeptide of the present invention or glycosyltransferase Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 polypeptide or a derivative thereof; and food or industrially acceptable carriers or excipients. Such carriers include, but are not limited to, water, buffers, glucose, water, glycerin, ethanol, and combinations thereof.

상기 조성물에 본 발명의 글리코실트랜스퍼라제의 활성을 조절하는 물질을 더 첨가할 수 있다. 효소 활성 기능을 향상시키는 임의의 물질은 모두 사용 가능하다. 바람직하게, 상기 본 발명의 글리코실트랜스퍼라제 활성을 향상시키는 물질은 메르캅토에탄올로부터 선택된다. 이 외에, 많은 물질들이 효소 활성을 감소시킬 수 있으며, Ca2 +, Co2 +, Mn2 +, Ba2 +, Al3 +, Ni2 +, Zn2 + 및 Fe2 +; 또는 기질 첨가 후 가수분해되어 Ca2 +, Co2 +, Mn2 +, Ba2 +, Al3 +, Ni2 +, Zn2 + 및 Fe2 +의 물질을 형성할 수 있는 것을 포함하지만 이에 한정되지 않는다.A substance that modulates the activity of the glycosyltransferase of the present invention may be further added to the composition. Any substance that enhances the enzyme activity function can be used. Preferably, the substance for enhancing the glycosyltransferase activity of the present invention is selected from mercaptoethanol. Besides this, many substances can reduce enzyme activity, Ca 2+ , Co 2+ , Mn 2+ , Ba 2+ , Al 3+ , Ni 2+ , Zn 2+ and Fe 2+ ; or which may be hydrolyzed after addition of a substrate to form materials of Ca 2+ , Co 2+ , Mn 2+ , Ba 2+ , Al 3+ , Ni 2+ , Zn 2+ and Fe 2+ doesn't happen

본 발명의 Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 폴리펩티드 또는 이의 유도 폴리펩티드를 얻은 후, 당업자는 상기 효소를 편리하게 적용하여 글리코실 전이 반응, 특히 다마렌디올, 프로토파녹사디올에 관한 글리코실 전이 반응을 발휘할 수 있다. 본 발명의 바람직한 형태에 있어서, 희귀 진세노사이드를 형성하는 두 가지 방법을 더 제공하였고, 상기 방법 중의 하나는 본 발명에 따른 Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 폴리펩티드 또는 이의 유도 폴리펩티드로 글리코실 전이될 기질을 처리하고, 상기 기질은 다마렌디올, 프로토파녹사디올 및 이의 유도체 등 테트라시클릭트리터페노이드계 화합물을 포함하는 단계를 포함한다. 바람직하게, pH 3.5~ 10인 조건 하에서, 상기 Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 폴리펩티드 또는 이의 유도 폴리펩티드로 글리코실 전이될 기질을 효소 처리하였다. 바람직하게, 30 ~ 105 ℃의 온도의 조건 하에서, 상기 Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3폴리펩티드 또는 이의 유도 폴리펩티드로 글리코실 전이될 기질을 효소 처리하였다.After obtaining the Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 polypeptide or its derivative polypeptide of the present invention, those skilled in the art can conveniently apply the enzyme to a glycosyl transfer reaction, especially damarene It can exert a glycosyl transfer reaction with respect to diol and protophanoxadiol. In a preferred embodiment of the present invention, two methods for forming rare ginsenosides are further provided, one of the methods according to the present invention is Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, and treating a substrate to be glycosyl-transferred with the UGT-MUT3 polypeptide or its derivative polypeptide, wherein the substrate includes a tetracyclic triterpenoid compound such as damarendol, protopanoxadiol and derivatives thereof. Preferably, under the conditions of pH 3.5-10, the substrate to be glycosyl-transferred to the Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 polypeptide or its derivative polypeptide was enzymatically treated. Preferably, the substrate to be glycosyl transferred to the Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 polypeptide or its derivative polypeptide under a temperature of 30 to 105° C. was enzymatically treated. .

상기 방법 중의 다른 하나는, 본 발명에 따른 Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 폴리펩티드 또는 이의 유도 폴리펩티드 유전자를 프로토파녹사디올 PPD를 합성할 수 있는 조작균(예를 들어, 효모 또는 대장균 조작균)으로 옮기거나, Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 폴리펩티드 또는 이의 유도 폴리펩티드 유전자를 다마렌디올, 프로토파녹사디올 PPD 합성 대사 경로에서의 관건적인 유전자 및 임의의 기타 글리코실트랜스퍼라제 유전자와 숙주 세포(예를 들어, 효모 세포 또는 대장균)에서 공동으로 발현시켜 희귀 진세노사이드 Rh2 및/또는 진세노사이드 F2를 직접적으로 생성하는 재조합 박테리아를 얻는 단계를 포함한다. 또는, Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 폴리펩티드 또는 이의 유도 폴리펩티드의 코딩 뉴클레오티드 서열을 다마렌디올 및/또는 프로토파녹사디올 PPD 합성 대사 경로에서의 관건적인 효소 및 임의의 기타 글리코실트랜스퍼라제 및 UDP-람노오스를 합성하는 관건적일 효소와 숙주 세포에서 공동으로 발현시켜, 인공 합성희귀 진세노사이드 Rh2 및 진세노사이드 F2를 인공 합성하기 위한 재조합 균주의 구축에 적용하였다.Another one of the above methods, Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 polypeptide or its derivative polypeptide gene according to the present invention is an engineering capable of synthesizing protopanoxadiol PPD Bacteria (eg, yeast or E. coli engineered bacteria), or Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 polypeptide or its derived polypeptide gene is damarendiol, protopa Rare ginsenoside Rh2 and/or ginsenoside F2 by co-expression in host cells (eg yeast cells or E. coli) with genes key in the noxadiol PPD synthesis metabolic pathway and any other glycosyltransferase genes It includes the step of obtaining a recombinant bacterium that directly produces Alternatively, the coding nucleotide sequence of the Pn50, 8E7, Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3 polypeptide or its derivative polypeptide is key in the damarendiol and/or protopanoxadiol PPD synthesis metabolic pathway. of a recombinant strain for artificial synthesis of artificially synthesized rare ginsenosides Rh2 and ginsenoside F2 by co-expression in host cells with enzymes and other glycosyltransferases and a key enzyme for synthesizing UDP-rhamnose. applied to the construction.

상기 다마렌디올 합성 대사 경로에서의 관건적인 유전자는 다마렌디올 합성 효소 유전자를 포함한다(하지만 이에 한정되지 않음).Key genes in the damarendiol synthesis metabolic pathway include, but are not limited to, a damarendiol synthase gene.

또 다른 바람직한 예에서, 상기 프로토파녹사디올 합성 대사 경로에서의 관건적인 유전자는 다마렌디올 합성 효소 유전자PgDDS, 프로토파녹사디올로 합성된 시토크롬 P450 유전자 CYP716A47 및 이의 환원 효소 유전자 또는 이들의 조합을 포함한다(하지만 이에 한정되지 않음). 또는 상기 다양한 효소의 동질효소 및 이들의 조합을 포함한다. 여기서, 다마렌디올 합성 효소는 에폭시스쿠알렌(epoxy squalene)(출아형 효모자체 합성)을 다마렌디올, 시토크롬 P450 CYP716A47로 전환시키고 이의 환원 효소는 다시 다마렌디올을 프로토파녹사디올PPD로 전환시킨다(Han et.al, plant & cell physiology, 2011, 52.2062-73).In another preferred embodiment, the key genes in the protopanoxadiol synthesis metabolic pathway include damarendiol synthase gene PgDDS, cytochrome P450 gene CYP716A47 synthesized from protopanoxadiol, and a reductase gene thereof, or a combination thereof. (but not limited to). or isoenzymes of the various enzymes and combinations thereof. Here, the damarendiol synthetase converts epoxy squalene (synthesized by budding yeast itself) into damarenediol and cytochrome P450 CYP716A47, and its reductase again converts damarenediol into protopanoxadiol PPD ( Han et.al, plant & cell physiology, 2011, 52.2062-73).

본 발명의 장점:Advantages of the present invention:

(1) 본 발명의 출아형 효모를 사용하여 진세노사이드 Rh2를 생성하는 방법은 전통적인 인산 속 식물의 추출 및 글리코실 가수분해에 의존한 방법에 비해 비용이 저렴하고, 주기가 짧으며, 품질이 안정적인 등 장점이 있고; (1) The method for producing ginsenoside Rh2 using the budding yeast of the present invention is cheaper, has a shorter cycle, and has lower quality than the traditional method relying on extraction and glycosyl hydrolysis of phosphate plants. It has advantages such as stable;

(2) 본 발명은 처음으로 사칠로부터 얻은 글리코실트랜스퍼라제 Pn50 PPD 및 Rh2에 촉매 작용을 할 수 있으며, CK에 촉매 작용을 하여 F2를 합성하고, 이를 인삼에서 야생형 글리코실트랜스퍼라제 UGTPg45보다 PPD를 생성하는 균주에 도입하는 것이 희귀 진세노사이드 Rh2를 보다 효율적으로 합성할 수 있으며;(2) The present invention can catalyze the glycosyltransferases Pn50 PPD and Rh2 obtained from Sachil for the first time, and catalyzes CK to synthesize F2, which in ginseng produced PPD than the wild-type glycosyltransferase UGTPg45. introduction into the producing strain can more efficiently synthesize the rare ginsenoside Rh2;

(3) 본 발명은 인삼에서 야생형 글리코실트랜스퍼라제 UGTPg45가 무작위로 돌연변이되어 돌연변이체 유전자 8E7 또는 삼칠 글리코실트랜스퍼라제 유전자 Pn50을 얻고, 이를 인삼에서 야생형 글리코실트랜스퍼라제 UGTPg45보다 PPD를 생성하는 균주에 도입하는 것이 희귀 진세노사이드 Rh2 합성 효율을 현저하게 향상시킬 수 있으며;(3) In the present invention, wild-type glycosyltransferase UGTPg45 is randomly mutated in ginseng to obtain mutant gene 8E7 or Samchil glycosyltransferase gene Pn50, and this is added to a strain that produces PPD than wild-type glycosyltransferase UGTPg45 in ginseng. introduction can significantly improve the rare ginsenoside Rh2 synthesis efficiency;

(4) 본 발명은 삼칠에서 야생형 글리코실트랜스퍼라제 Pn50를 무작위로 돌연변시켜 돌연변이체 유전자 Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3을 얻고, 이를 삼칠에서 야생형 글리코실트랜스퍼라제 Pn50보다 PPD를 생성하는 균주에 도입하는 것이 희귀 진세노사이드 Rh2의 합성 효율을 현저하게 향상시킬 수 있다.(4) In the present invention, wild-type glycosyltransferase Pn50 is randomly mutated in Samchil to obtain mutant genes Pn50-Q222H-VE, UGT-MUT1, UGT-MUT2, UGT-MUT3, and wild-type glycosyltransferase in Samchil It is possible to significantly improve the synthesis efficiency of the rare ginsenoside Rh2 by introducing it into a strain producing PPD rather than the Rase Pn50.

아래, 구체적인 실시예에 결부하여, 본 발명을 더 설명하고자 한다. 이러한 실시예는 단지 본 발명을 설명하기 위한 것으로, 본 발명의 범위는 이에 한정되지 않는다. 하기 실시예에서 구체적인 조건을 명시하지 않은 실험 방법은 통상적인 조건 예를 들어 Sambrook 등, 분자 클론: 실험실 수첩(New York: Cold Spring Harbor Laboratory Press, 1989)에 기술된 조건, 또는 제조 업체에서 건의하는 조건에 따른다. 다른 설명이 없으면, 백분율은 중량에 따라 계산된다.Hereinafter, in conjunction with specific examples, the present invention will be further described. These examples are merely for illustrating the present invention, and the scope of the present invention is not limited thereto. Experimental methods that do not specify specific conditions in the following examples are conventional conditions, for example, Sambrook et al., Molecular Clone: The conditions described in the laboratory handbook (New York: Cold Spring Harbor Laboratory Press, 1989), or as suggested by the manufacturer. subject to conditions Unless otherwise stated, percentages are calculated by weight.

하기 구체적인 실시 방법을 통하여 본 발명의 구체적인 과정을 더 이해할 수 있을 것이다.The specific process of the present invention can be further understood through the following specific implementation methods.

실시예1. 삼칠 글리코실트랜스퍼라제 유전자 Pn50의 클로닝Example 1. Cloning of Samchil glycosyltransferase gene Pn50

서열 Pn50 클로닝 프라이머F, SEQ ID NO: 1(ATGGAGAGAGAAATGTTGAGCA) 및 Pn5 클로닝 프라이머R, SEQ ID NO: 2(TCAGGAGGAAACAAGCTTTGAA)와 같은 두 가닥의 프라이머를 합성하였다. 삼칠에서 추출한 RNA를 역전사하여 얻은 cDNA를 주형으로, 상기와 같은 프라이머를 이용하여 PCR을 수행하였다. DNA 중합 효소는 TaKaRa Bio Group유한회사의 충실도가 높은 KOD DNA 중합 효소이다. PCR 증폭 절차는 다음과 같다. 94 ℃의 온도에서 2분; 94 ℃의 온도에서 15초, 58 ℃의 온도에서 30초, 68 ℃의 온도에서 2분 동안의 총 35개 사이클을 수행하고; 68 ℃의 온도에서 10분 내에 10 ℃로 감소시켰다. PCR 산물은 아가로스 겔 전기 영동에 의해 검출되고 결과는 도 1에 도시된 바와 같다.Two-stranded primers were synthesized with the sequence Pn50 cloning primer F, SEQ ID NO: 1 (ATGGAGAGAGAAATGTTGAGCA) and Pn5 cloning primer R, SEQ ID NO: 2 (TCAGGAGGAAACAAGCTTTGAA). PCR was performed using the cDNA obtained by reverse transcription of RNA extracted from Samchil as a template and the same primers as above. DNA polymerase is a high-fidelity KOD DNA polymerase from TaKaRa Bio Group Co., Ltd. The PCR amplification procedure is as follows. 2 min at a temperature of 94 °C; A total of 35 cycles were performed for 15 seconds at a temperature of 94°C, 30 seconds at a temperature of 58°C, and 2 minutes at a temperature of 68°C; The temperature of 68 °C was reduced to 10 °C in 10 minutes. The PCR product was detected by agarose gel electrophoresis and the results are as shown in FIG. 1 .

자외선 조사 하에서, 표적 DNA 밴드를 절단하였다. 다음 Axygen Gel Extraction Kit(AEYGEN회사)를 사용하여 아가로스 겔로붜 DNA, 즉 증폭된 글리코실트랜스퍼라제 유전자의 DNA 단편을 회수하였다. TaKaRa Bio Group(따리엔)유한 회사(Takara)의 PMD18-T클로닝 키트를 이용하여, 회수된 PCR 산물을 PMDT 전달체에 클로닝하고, 구축된 전달체를 PMDT-Pn50라고 명명하였다. 시퀀싱하여 Pn50의 유전자 서열을 얻었다.Under ultraviolet irradiation, the target DNA band was cleaved. Then, using the Axygen Gel Extraction Kit (AEYGEN Co.), agarose gelatinized DNA, that is, the DNA fragment of the amplified glycosyltransferase gene was recovered. Using the PMD18-T cloning kit of TaKaRa Bio Group (Taarien) Co., Ltd. (Takara), the recovered PCR product was cloned into a PMDT delivery system, and the constructed delivery system was named PMDT-Pn50. By sequencing, the gene sequence of Pn50 was obtained.

Pn50 유전자는 SEQ ID NO: 3의 뉴클레오티드 서열을 갖는다. SEQ ID NO: 3의 5’단 제1 ~ 1368 부위 뉴클레오티드는 Pn50의 오픈 리딩 프레임(Open Reading Frame, ORF)이고, SEQ ID NO: 3의 5’말단의 제1 ~ 3부위 뉴클레오티드는 Pn50 유전자의 개시 코돈 ATG이며, SEQ ID NO: 3의 5’말단의 제1366 ~ 1368부위 뉴클레오티드는 Pn50 유전자의 종료 코돈 TGA이다. 글리코실트랜스퍼라제 Pn50 유전자는 455개의 아미노산을 함유하는 단백질 Pn50을 코딩하고, SEQ ID NO: 4를 갖는 아미노산 잔기 서열을 소프트웨어에 의해 51.1 kDa의 이론적 분자량 및 5.10의 등전점 pI를 갖는 것으로 예측되었다. SEQ ID NO: 4의 아미노산 말단의 제332 ~ 375부위 아미노산은 글리코실트랜스퍼라제 PSPG 보존적 기능 영역이다.The Pn50 gene has the nucleotide sequence of SEQ ID NO: 3. The first to 1368 site nucleotides at the 5' end of SEQ ID NO: 3 are the Open Reading Frame (ORF) of Pn50, and the first to third site nucleotides at the 5' end of SEQ ID NO: 3 are of the Pn50 gene. The start codon is ATG, and the nucleotides 1366 to 1368 at the 5' end of SEQ ID NO: 3 are the stop codon TGA of the Pn50 gene. The glycosyltransferase Pn50 gene encodes a protein Pn50 containing 455 amino acids, and the amino acid residue sequence with SEQ ID NO: 4 was predicted by software to have a theoretical molecular weight of 51.1 kDa and an isoelectric point pI of 5.10. The amino acids at the 332 to 375 sites of the amino acid terminus of SEQ ID NO: 4 are glycosyltransferase PSPG conservative functional regions.

Pn50 뉴클레오티드 서열 SEQ ID NO:3Pn50 nucleotide sequence SEQ ID NO:3

ATGGAGAGAGAAATGTTGAGCAAAACTCACATTATGTTCATCCCATTCCCAGCTCAAGGCCACATGAGCCCAATGATGCAATTCGTCAAGCGTTTAGCCTGGAAAGGCGTGCGAATCACGATAGTTCTTCCGGCTGAGATTCGAGATTCTATGCAAATAAACAACTCATTGATCAACACTGAGTGCATCTCCTTTGATTTTGATAAAGATGATGAGATGCCATACAGCATGCGGGCTTATATGGGAGTTGTAAAGCTCAAGGTCACAAATAAACTGAGTGACCTACTCGAGAAGCAAAAAACAAATGGCTACCCTGTTAATTTGCTAGTGGTCGATTCATTATATCCATCTCGGGTAGAAATGTGCCACCAACTTGGGGTAAAAGGAGCTCCATTTTTCACTCACTCTTGTGCTGTTGGTGCCATTTATTATAATGCTCGCTTAGGGAAATTGAAGATACCTCCTGAGGAAGGGTTGACTTCTGTTTCATTGCCTTCAATTCCATTGTTGGGGAGAAATGATTTGCCAATTATTAGGACTGGCACCTTTCCTGATCTCTTTGAGCATTTGGGGAATCAGTTTTCAGATCTTGATAAAGCGGATTGGATCTTTTTCAATACTTTTGATAAGCTTGAAAATGAGGAAGCAAAATGGCTATCTAGCCAATGGCCAATTACATCCATCGGACCATTAATCCCTTCAATGTACTTAGACAAACAATTACCAAATGACAAAGACAATGACATTAATTTCTACAAGGCAGACGTCGGATCGTGCATCAAGTGGCTAGACGCCAAAGACCCTGGCTCGGTAGTCTACGCCTCATTCGGGAGCGTGAAGCACAACCTCGGCGATGACTACATGGACGAAGTAGCATGGGGCTTGTTACACAGCAAATATCACTTCATATGGGTTGTTATAGAATCCGAACGTACAAAGCTCTCTAGCGATTTCTTGGCAGAGGCAGAGGAAAAAGGCCTAATAGTGAGTTGGTGCCCTCAACTCGAAGTTTTGTCACATAAATCTATAGGTAGTTTTATGACTCATTGTGGTTGGAACTCGACGGTTGAGGCATTGAGTTTGGGCGTGCCAATGGTGGCAGTGCCACAACAGTTTGATCAGCCTGTTAATGCCAAGTATATCGTGGATGTATGGCGAATTGGGGTTCAGGTTCCGATTGGTGAAAATGGGGTTCTTTTGAGGGGAGAAGTTGCTAACTGTATAAAGGATGTTATGGAGGGGGAAATAGGGGATGAGCTTAGAGGGAATGCTTTGAAATGGAAGGGGTTGGCTGTGGAGGCAATGGAGAAAGGGGGTAGCTCTGATAAGAATATTGATGAGTTCATTTCAAAGCTTGTTTCCTCCTGAATGGAGAGAGAAATGTTGAGCAAAACTCACATTATGTTCATCCCATTCCCAGCTCAAGGCCACATGAGCCCAATGATGCAATTCGTCAAGCGTTTAGCCTGGAAAGGCGTGCGAATCACGATAGTTCTTCCGGCTGAGATTCGAGATTCTATGCAAATAAACAACTCATTGATCAACACTGAGTGCATCTCCTTTGATTTTGATAAAGATGATGAGATGCCATACAGCATGCGGGCTTATATGGGAGTTGTAAAGCTCAAGGTCACAAATAAACTGAGTGACCTACTCGAGAAGCAAAAAACAAATGGCTACCCTGTTAATTTGCTAGTGGTCGATTCATTATATCCATCTCGGGTAGAAATGTGCCACCAACTTGGGGTAAAAGGAGCTCCATTTTTCACTCACTCTTGTGCTGTTGGTGCCATTTATTATAATGCTCGCTTAGGGAAATTGAAGATACCTCCTGAGGAAGGGTTGACTTCTGTTTCATTGCCTTCAATTCCATTGTTGGGGAGAAATGATTTGCCAATTATTAGGACTGGCACCTTTCCTGATCTCTTTGAGCATTTGGGGAATCAGTTTTCAGATCTTGATAAAGCGGATTGGATCTTTTTCAATACTTTTGATAAGCTTGAAAATGAGGAAGCAAAATGGCTATCTAGCCAATGGCCAATTACATCCATCGGACCATTAATCCCTTCAATGTACTTAGACAAACAATTACCAAATGACAAAGACAATGACATTAATTTCTACAAGGCAGACGTCGGATCGTGCATCAAGTGGCTAGACGCCAAAGACCCTGGCTCGGTAGTCTACGCCTCATTCGGGAGCGTGAAGCACAACCTCGGCGATGACTACATGGACGAAGTAGCATGGGGCTTGTTACACAGCAAATATCACTTCATATGGGTTGTTATAGAATCCGAACGTACAAAGCTCTCTAGCGATTTCTTGGCAGAGGCAGAGGAAAAAGGCCTAATAGTGAGTTGGTGCCCTC AACTCGAAGTTTTGTCACATAAATCTATAGGTAGTTTTATGACTCATTGTGGTTGGAACTCGACGGTTGAGGCATTGAGTTTGGGCGTGCCAATGGTGGCAGTGCCACAACAGTTTGATCAGCCTGTTAATGCCAAGTATATCGTGGATGTATGGCGAATTGGGGTTCAGGTTCCGATTGGTGAAAATGGGGTTCTTTTGAGGGGAGAAGTTGCTAACTGTATAAAGGATGTTATGGAGGGGGAAATAGGGGATGAGCTTAGAGGGAATGCTTTGAAATGGAAGGGGTTGGCTGTGGAGGCAATGGAGAAAGGGGGTAGCTCTGATAAGAATATTGATGAGTTCATTTCAAAGCTTGTTTCCTCCTGA

Pn50아미노산 서열 SEQ ID NO: 4Pn50 amino acid sequence SEQ ID NO: 4

MEREMLSKTHIMFIPFPAQGHMSPMMQFVKRLAWKGVRITIVLPAEIRDSMQINNSLINTECISFDFDKDDEMPYSMRAYMGVVKLKVTNKLSDLLEKQKTNGYPVNLLVVDSLYPSRVEMCHQLGVKGAPFFTHSCAVGAIYYNARLGKLKIPPEEGLTSVSLPSIPLLGRNDLPIIRTGTFPDLFEHLGNQFSDLDKADWIFFNTFDKLENEEAKWLSSQWPITSIGPLIPSMYLDKQLPNDKDNDINFYKADVGSCIKWLDAKDPGSVVYASFGSVKHNLGDDYMDEVAWGLLHSKYHFIWVVIESERTKLSSDFLAEAEEKGLIVSWCPQLEVLSHKSIGSFMTHCGWNSTVEALSLGVPMVAVPQQFDQPVNAKYIVDVWRIGVQVPIGENGVLLRGEVANCIKDVMEGEIGDELRGNALKWKGLAVEAMEKGGSSDKNIDEFISKLVSSMEREMLSKTHIMFIPFPAQGHMSPMMQFVKRLAWKGVRITIVLPAEIRDSMQINNSLINTECISFDFDKDDEMPYSMRAYMGVVKLKVTNKLSDLLEKQKTNGYPVNLLVVDSLYPSRVEMCHQLGVKGAPFFTHSCAVGAIYYNARLGKLKIPPEEGLTSVSLPSIPLLGRNDLPIIRTGTFPDLFEHLGNQFSDLDKADWIFFNTFDKLENEEAKWLSSQWPITSIGPLIPSMYLDKQLPNDKDNDINFYKADVGSCIKWLDAKDPGSVVYASFGSVKHNLGDDYMDEVAWGLLHSKYHFIWVVIESERTKLSSDFLAEAEEKGLIVSWCPQLEVLSHKSIGSFMTHCGWNSTVEALSLGVPMVAVPQQFDQPVNAKYIVDVWRIGVQVPIGENGVLLRGEVANCIKDVMEGEIGDELRGNALKWKGLAVEAMEKGGSSDKNIDEFISKLVSS

실시예2. 대장균에서 삼칠 글리코실트랜스퍼라제 유전자 Pn50의 발현Example 2. Expression of Samchil glycosyltransferase gene Pn50 in Escherichia coli

서열 Pn50 발현 프라이머 F SEQ ID NO: 5(GGATCCATGGAGAGAGAAATGTTGAGCA) 및 Pn50 발현 프라이머 R SEQ ID NO: 6(CTCGAGTCAGGAGGAAACAAGCTTTGAA)과 같은 두 가닥의 프라이머를 합성하였다. 합성된 프라이머 F/R에 각각 BamH I와 Xho I 두 가지 효소 절단 부위를 첨가하고, 식물에서 추출된 cDNA를 주형으로 PCR을 수행하였다. DNA 중합 효소는 TaKaRa Bio Group유한회사의 충실도가 높은 KOD DNA 중합 효소를 선택하여 사용하였다. PCR 증폭 절차는 다음과 같다. 94 ℃의 온도에서 2분; 94 ℃의 온도에서 15초, 58 ℃의 온도에서 30초, 68 ℃의 온도에서 2분 동안 총 35개 순환을 수행하고; 68 ℃의 온도에서 10분 내에 10 ℃로 감소시켰다. PCR 산물은 아가로스 겔 전기영동에 의해 검출하였다. 자외선 조사 하에서, 표적 DNA 밴드를 절단하였다. 다음 Axygen Gel Extraction Kit(AEYGEN회사)를 사용하여 아가로스 겔로부터 DNA, 즉 증폭된 글리코실트랜스퍼라제 유전자의 DNA 단편을 회수하였다. 회수된 2개의 PCR산물을 BamH I 및 Xho I 효소로 절단한 후 각각 마찬가지로 BamH I 및 Xho I효소로 절단한 pET28a와 연결하고, 연결 산물로 대장균 EPI300 컴피턴트 세포를 형질 전환시키며, 형질 전환시킨 대장균 박테리아 용액을 50 ug/mL의 카나마이신이 첨가된 LB 플레이트에 코팅하고, PCR 및 제한 효소 절단 검증에 의해 재조합 클론을 검증하였다. 각각 그 중의 하나의 클론을 선택하여 재조합 플라스미드를 추출한 후 시퀀싱 검증을 수행하였으며, 시퀀싱 검증결과 정확하면 재조합 플라스미드로 형질 전환된 대장균BL21(DE3)에서 발현을 유도하고, 발현을 유도하는 방법은 하기와 같다. 플레이트로부터 단일 클론을 선택하여 50 ug/mL의 카나마이신이 함유된 LB 시험관에 접종하여 하룻밤 경과하고, 1 %를 취하여 50 ml의 삼각 플라스크에 접종하고 37 ℃의 온도 하에서 OD600이 0.6 ~ 0.7이 될 때까지 진탕 배양하며 농도가 0.1 mM인 IPTG를 넣어 유도하며,18 ℃의 온도 하여 16시간 동안 유도하였다. 12000 g, 3분 동안 수집된 균체 1 g당 습중량 균체를 10 ml의 PBS buffer에 넣어 재부유시킨 후 균체를 분해하고, 원심 분리하여 상등액을 조효소액으로 하였다.Two-stranded primers were synthesized with the sequence Pn50 expression primer F SEQ ID NO: 5 (GGATCCATGGAGAGAGAAATGTTGAGCA) and Pn50 expression primer R SEQ ID NO: 6 (CTCGAGTCAGGAGGAAACAAGCTTTGAA). Two enzyme cleavage sites were added to the synthesized primer F/R, respectively, BamHI and Xho I, and PCR was performed using the cDNA extracted from the plant as a template. As the DNA polymerase, a high-fidelity KOD DNA polymerase from TaKaRa Bio Group Co., Ltd. was selected and used. The PCR amplification procedure is as follows. 2 min at a temperature of 94 °C; A total of 35 cycles were performed for 15 seconds at a temperature of 94°C, 30 seconds at a temperature of 58°C, and 2 minutes at a temperature of 68°C; The temperature of 68 °C was reduced to 10 °C in 10 minutes. PCR products were detected by agarose gel electrophoresis. Under ultraviolet irradiation, the target DNA band was cleaved. The DNA fragment of the amplified glycosyltransferase gene was recovered from the agarose gel using the following Axygen Gel Extraction Kit (AEYGEN). After digesting the two recovered PCR products with BamHI and Xho I enzymes, they were ligated with pET28a similarly digested with BamHI and Xho I enzymes, respectively, and E. coli EPI300 competent cells were transformed with the ligation product, and the transformed E. coli The bacterial solution was coated on an LB plate to which 50 ug/mL of kanamycin was added, and recombinant clones were verified by PCR and restriction enzyme digestion verification. After selecting one clone from each and extracting the recombinant plasmid, sequencing verification was performed. If the sequencing verification result is correct, expression is induced in E. coli BL21(DE3) transformed with the recombinant plasmid, and the method of inducing expression is as follows. same. A single clone is selected from the plate and inoculated into an LB test tube containing 50 ug/mL of kanamycin, and overnight, 1% is taken and inoculated into a 50 ml Erlenmeyer flask, and when the OD600 becomes 0.6 to 0.7 under a temperature of 37 ℃ Incubated with shaking until induced by adding IPTG having a concentration of 0.1 mM, and induced at a temperature of 18 °C for 16 hours. 12000 g, the wet-weight cells per 1 g of the cells collected for 3 minutes were resuspended in 10 ml of PBS buffer, then the cells were decomposed, centrifuged, and the supernatant was used as a crude enzyme solution.

실시예3. 삼칠 글리코실트랜스퍼라제 유전자 Pn50에 의한상이한 기질 반응에 대한 촉매 작용 및 이의 산물 검출Example 3. Catalysis of different substrate reactions and detection of their products by the triglycosyltransferase gene Pn50

글리코실트랜스퍼라제 Pn50 촉매 반응 체계(100μL)는 하기와 같이 배합된다.A glycosyltransferase Pn50 catalyzed reaction scheme (100 μL) is formulated as follows.

10 %의 트윈 20:10 μL10% Tween 20:10 µl

50 mM의 UDPG: 10μL50 mM UDPG: 10 μL

1M의 Tris-Hcl PH 8.5: 5μL1M Tris-Hcl PH 8.5: 5 μL

100 mM의 기질(에탄올 용해): 0.5μL100 mM substrate (dissolved in ethanol): 0.5 μL

조효소액: 75.5μLCrude enzyme solution: 75.5 μL

37 ℃의 온도의 워터 배스(water bath) 하에서 2시간 동안 반응시켰다. 반응 종료 후, 동일한 부피의 n-부탄올을 첨가하여 추출하고, n- 부탄올 상을 취한 후, 진공 농축 후, 반응 생성물을 10 μL의 메탄올에 용해시키켜 결과를 TLC 또는 HPLC로 검출하였다. 도 2의 결과로부터 알 수 있다 싶이, 본 발명에 사용된 글리코실트랜스퍼라제 Pn50은 프로토파녹사디올 PPD에 촉매 작용하여 신규 산물(반응은 식 A를 참조)을 형성할 수 있고, TLC플레이트에서 이의 이동 부위가 Rh2의 이동 부위와 일치하며, 이러한 신규 산물이 진세노사이드 Rh2인 것을 증명하였다. 이 외에, Pn50은 화합물 K에 촉매 작용을 할 수도 있으며, 생성된 산물은 TLC플레이트에서의 이동 부위 및 Pn50의 영역 측이성에 따라 진세노사이드 F2인 것으로 추정되었다(도 2).The reaction was carried out for 2 hours under a water bath at a temperature of 37 °C. After completion of the reaction, the same volume of n-butanol was added for extraction, and the n-butanol phase was taken, concentrated in vacuo, the reaction product was dissolved in 10 μL of methanol, and the result was detected by TLC or HPLC. As can be seen from the results of Figure 2, the glycosyltransferase Pn50 used in the present invention can catalyze protopanoxadiol PPD to form a new product (refer to formula A for the reaction), Its migration site coincides with that of Rh2, and it was proved that this novel product is the ginsenoside Rh2. In addition, Pn50 may catalyze compound K, and the resulting product was estimated to be ginsenoside F2 according to the migratory site on the TLC plate and the region conformation of Pn50 (FIG. 2).

Figure 112019129682541-pct00006
Figure 112019129682541-pct00006

실시예4. 삼칠로부터 유래된 글리코실트랜스퍼라제 유전자 Pn50을 사용하여 출아형 효모에서 희귀 진세노사이드 Rh2를 합성Example 4. Synthesis of rare ginsenoside Rh2 in budding yeast using glycosyltransferase gene Pn50 derived from Samchil

(1) 삼칠로부터 유래된 글리코실트랜스퍼라제 유전자 Pn50 은 프로토파녹사디올 C3부위의 히드록실글리코실화에 촉매 작용하여 희귀 진세노사이드 Rh2를 합성할 수 있으며, 출아형 효모에서 희귀 진세노사이드 Rh2를 합성하기 위하여, 본 발명에서 먼저 프로토파녹사디올을 생산할 수 있는 출아형 효모 섀시 세포(chassis cell)를 구축하였다. 야생형 출아형 효모에 다마렌디올 합성 효소 유전자 PgDDS를 도입하고, 프로토파녹사디올로 합성된 시토크롬 P450 유전자 CYP716A47 및 이의 환원 효소 유전자 PgCPR1으, 출아형 효모 자체의 메발론산 경로에 의해 합성된 2,3-에폭시스쿠알렌으로 프로토파녹사디올을 합성할 수 있다. 합성 속조 제한 단계의 최적화, 전구체 공급의 최적화를 포함하여, 인공 구축된 프로토파녹사디올 합성 경로를 통하여 최적화하는 것으로 프로토파녹사디올을 많이 생성하는 출아형 효모 균주 ZWBY04RS를 얻었다.(1) Glycosyltransferase gene Pn50 derived from Samchil can synthesize rare ginsenoside Rh2 by catalyzing hydroxyl glycosylation at C3 site of protophanoxadiol, and rare ginsenoside Rh2 in budding yeast In order to synthesize, in the present invention, first, a budding yeast chassis cell capable of producing protopanoxadiol was constructed. Damarendiol synthase gene PgDDS was introduced into wild-type budding yeast, cytochrome P450 gene CYP716A47 synthesized from protophanoxadiol and its reductase gene PgCPR1, 2,3 synthesized by the mevalonic acid pathway of budding yeast itself -Protophanoxadiol can be synthesized with epoxysqualene. The budding yeast strain ZWBY04RS that produces a lot of protopanoxadiol was obtained by optimizing through the artificially constructed protopanoxadiol synthesis route, including the optimization of the synthesis restriction step, and the optimization of the precursor supply.

(2) 서열 SEQ ID NO: 7-18과 같은 12 가닥의 프라이머를 합성하고, PCR의 방법으로 글리코실트랜스퍼라제 발현에 의한 프로모터, 터미네이터, ORF, 선별 마커, 업 스트림 및 다운 스트림 상동성 아암(homologous arm) 단편을 얻으며, PCR 방법은 실시예1과 같다. 상기 PCR 단편 및 UGTPg45의 ORF를 각각 100 ng으로 혼합한 후, 출아형 효모 통상적인 LiAc/ssDNA 형질 전환 방법을 이용하여, 재조합 출아형 효모 균주 ZWBY04RS를 형질 전환시켜, 재조합 출아형 효모 균주 ZWBY04RS-UGTPg45를 얻었다. 유사하게 상기 PCR 단편 및 Pn50의 ORF를 각각 100 ng 혼합한 후, 출아형 효모의 통상적인 LiAc/ssDNA 형질 전환 방법을 이용하여, 재조합 출아형 효모 균주 ZWBY04RS를 형질 전환시켜, 재조합 출아형 효모 균주 ZWBY04RS-Pn50를 얻었다.(2) synthesizing a 12-stranded primer as shown in sequence SEQ ID NO: 7-18, and promoter, terminator, ORF, selectable marker, upstream and downstream homology arms by glycosyltransferase expression by the method of PCR ( homologous arm) fragment was obtained, and the PCR method was the same as in Example 1. After mixing the PCR fragment and the ORF of UGTPg45 at 100 ng each, the recombinant budding yeast strain ZWBY04RS was transformed using a conventional LiAc/ssDNA transformation method for budding yeast, and the recombinant budding yeast strain ZWBY04RS-UGTPg45 got Similarly, after mixing 100 ng of each of the PCR fragment and the ORF of Pn50, the recombinant budding yeast strain ZWBY04RS was transformed using a conventional LiAc/ssDNA transformation method of budding yeast, and the recombinant budding yeast strain ZWBY04RS -Pn50 was obtained.

프로모터 프라이머 F SEQ_ID_NO.7Promoter Primer F SEQ_ID_NO.7

TAGCTCTGATAAGAATATTGATGAGTTCATTTCAAAGCTTGTTTCCTCCTGAGATTTAGCTCTGATAAGAATATTGATGAGTTCATTTCAAAGCTTGTTTCCTCCTGAGATT

프로모터 프라이머 R SEQ_ID_NO.8promoter primer R SEQ_ID_NO.8

ACTGTCAAGGAGGGTATTCTGGGCCTCCATGTCGCTGCTATATAACAGTTGAAATTTGGATAAGAACATACTGTCAAGGAGGGTATTCTGGGCCTCCATGTCGCTGCTATATAACAGTTGAAATTTGGATAAGAACAT

ORF 프라이머 F SEQ_ID_NO.9ORF Primer F SEQ_ID_NO.9

GCTATACTGCTGTCGATTCGATACTAACGCCGCCATCCAGTGTCGAGAATTACAATAGTGCTATACTGCTGTCGATTCGATACTAACGCCGCCATCCAGTGTCGAGAATTACAATAGT

ORF 프라이머 R SEQ_ID_NO.10ORF Primer R SEQ_ID_NO.10

TCTGGTGAGGATTTACGGTATGATCATGCTGGTAAGCTTCGTTATCTGGTGAGGATTTACGGTATGATCATGCTGGTAAGCTTCGTTA

터미네이터 프라이머 F SEQ_ID_NO.11Terminator Primer F SEQ_ID_NO.11

GAAAAGAAGATAATATTTTTATATAATTATATTAATCTCAGGAGGAAACAAGCTTTGAAGAAAAGAAGATAATATTTTTATATAATTATATTAATCTCAGGAGGAAACAAGCTTTGAA

터미네이터 프라이머 R SEQ_ID_NO.12Terminator Primer R SEQ_ID_NO.12

GCATAGCAATCTAATCTAAGTTTTAATTACAAAATGGAGAGAGAAATGTTGAGCAAAACGCATAGCAATCTAATCTAAGTTTTAATTACAAAATGGAGAGAGAAATGTTGAGCAAAAC

선별 마커 프라이머 F SEQ_ID_NO.13Selectable marker primer F SEQ_ID_NO.13

CGCGTTGAGAAGATGTTCTTATCCAAATTTCAACTGTTATATAGCAGCGACGCGTTGAGAAGATGTTCTTATCCAAATTTCAACTGTTATATAGCAGGCGA

선별 마커 프라이머 R SEQ_ID_NO.14Selectable marker primer R SEQ_ID_NO.14

TTACTTCTTGCAGACATCAGACATACTATTGTAATTCTCGACACTGGATGGCGGCGTTATTACTTCTTGCAGACATCAGACATACTATTGTAATTCTCGACACTGGATGGCGGCGTTA

업 스트림 상동성 아암 프라이머 F SEQ_ID_NO.15Upstream homology arm primer F SEQ_ID_NO.15

GGCTGTCGCCATTCAAGAGCAGATAGCTTCAAAATGTTTCTACTCCTTTTTTACTCTTCGGCTGTCGCCATTCAAGAGCAGATAGCTTCAAAATGTTTCTACTCCTTTTTTACTCTTC

업 스트림 상동성 아암 프라이머 R SEQ_ID_NO.16Upstream homology arm primer R SEQ_ID_NO.16

CATAATGTGAGTTTTGCTCAACATTTCTCTCTCCATTTTGTAATTAAAACTTAGATTAGCATAATGTGAGTTTTGCTCAACATTTCTCTCTCCATTTTGTAATTAAAACTTAGATTAG

다운 스트림 상동성 아암 프라이머 F SEQ_ID_NO.17Downstream homology arm primer F SEQ_ID_NO.17

CCCAAAGCTAAGAGTCCCATTTTATTCCCCAAAGCTAAGAGTTCCATTTTATTC

다운 스트림 상동성 아암 프라이머 R SEQ_ID_NO.18Downstream homology arm primer R SEQ_ID_NO.18

GAGTAGAAACATTTTGAAGCTATCTGCTCTTGAATGGCGACAGCCTATTGCCCCAGTGTGAGTAGAAACATTTTGAAGCTATCTGCTCTTGAATGGCGACAGCCTATTGCCCCAGTGT

(3) 고체 배지 배합: 배지 배합: 1 %의 효모 추출물(Yeast Extract), 2 %의 펩톤(Peptone), 2 %의 포도당(Dextrose)(글루코스), 2 %의 한천 가루(3) Solid medium formulation: Medium formulation: 1% Yeast Extract, 2% Peptone, 2% Dextrose (glucose), 2% agar powder

액체 배지 배합: 배지 배합: 1 %의 효모 추출물, 2 %의 펩톤, 2 %의 포도당Liquid medium formulation: Medium formulation: 1% yeast extract, 2% peptone, 2% glucose

고체 배지 플레이트에 스트리킹된 재조합 출아형 효모균 ZWBY04RS-UGTPg45 및 ZWBY04RS-Pn50을 취하여, 각각 5 mL의 액체 배지를 함유한 시험관에서 하룻밤 진탕 배양하고(30 ℃, 250 rpm, 16시간); 원심 분리하여 균체를 수집하며, 10 mL의 액체 배지가 담긴 50 mL의 삼각 플라스크에 옮겨, OD600이 0.05가 될 때까지, 30 ℃, 250 rpm의 조건하에서 4일 동안 배양하여 발효 산물을 얻었다. 본 방법은 동시에 각 재조합 효모에 대하여 하나의 병렬 실험을 설정하였다.Recombinant budding yeast strains ZWBY04RS-UGTPg45 and ZWBY04RS-Pn50 streaked on a solid medium plate were taken and cultured with shaking overnight in a test tube containing 5 mL of a liquid medium, respectively (30 °C, 250 rpm, 16 hours); Cells were collected by centrifugation, transferred to a 50 mL Erlenmeyer flask containing 10 mL of liquid medium, and cultured for 4 days at 30 °C and 250 rpm until OD600 reached 0.05 to obtain a fermentation product. In this method, one parallel experiment was set up for each recombinant yeast at the same time.

프로토파녹사디올 및 희귀 진세노사이드 Rh2의 추출 및 검출: 10 mL의 발효액으로부터 100 μL의 발효액을 취하고, Fastprep 진탕으로 효모를 용해시키고, 동일한 부피의 n-부탄올을 첨가 한 다음, n-부탄올을 진공 하에서 증발 건조시켰다. 100 μL의 메탄올에 용해시킨 후 HPLC로 목적 생성물의 산량을 측정하였다. HPLC 결과는 도 3과 같다.Extraction and detection of protophanoxadiol and rare ginsenoside Rh2: Take 100 μL of fermentation broth from 10 mL of fermentation broth, lyse yeast with Fastprep shaking, add equal volume of n-butanol, then n-butanol Evaporate to dryness under vacuum. After dissolving in 100 μL of methanol, the acid amount of the target product was measured by HPLC. HPLC results are shown in FIG. 3 .

프로토파녹사디올을 생성하는 출아형 효모 균주에 인삼으로부터 유래된 글리코실트랜스퍼라제 유전자 UGTPg45를 도입하여 구축된 재조합 출아형 효모 균주 ZWBY04RS-UGTPg45는 희귀 진세노사이드 Rh2를 합성할 수 있고, 이의 산량은 35.66 mg/L이다. 프로토파녹사디올을 생성하는 출아형 효모 균주에 삼칠로부터 유래된 글리코실트랜스퍼라제 유전자 Pn50을 도입하여 구축된 재조합 출아형 효모 균주 ZWBY04RS-Pn50은 희귀 진세노사이드 Rh2를 합성할 수 있고, 이의 산량은 45.55mg/L이다.The recombinant budding yeast strain ZWBY04RS-UGTPg45 constructed by introducing the glycosyltransferase gene UGTPg45 derived from ginseng into the budding yeast strain producing protopanoxadiol can synthesize the rare ginsenoside Rh2, and its output is 35.66 mg/L. The recombinant budding yeast strain ZWBY04RS-Pn50 constructed by introducing the glycosyltransferase gene Pn50 derived from Samchil into the budding yeast strain producing protopanoxadiol can synthesize the rare ginsenoside Rh2, and its acidity is 45.55 mg/L.

실시예5. 인삼으로부터 유래된 글리코실트랜스퍼라제 UGTPg45 무작위 돌연변이 라이브러리의 구축Example 5. Construction of Ginseng-derived Glycosyltransferase UGTPg45 Random Mutation Library

플라스미드 UGTPg45-pMD18T를 주형으로, GeneMorph II Random Mutagenesis Kit(Agilent Technology), UGTPg45 무작위 돌연변이 프라이머 F SEQ ID NO: 23(Gcatagcaatctaatctaagttttaattacaaaatggagagagaaatgttgagcaaaac) 및 UGTPg45 무작위 돌연변이 프라이머 R SEQ ID NO: 24(Gaaaagaagataatatttttatataattatattaatctcaggaggaaacaagctttgaa)를 프라이머로 사용하여 실수유발 PCR을 수행하고, 절차는 하기와 같다. 95 ℃의 온도 하에서 2분 동안 전변성하고; 95 ℃의 온도 하에서 30초 동안 변성하며, 58 ℃의 온도 하에서 30초 동안 어닐링하고, 72 ℃의 온도 하에서 3분 15초 동안 연신하는 30개의 사이클의 수행하며; 최종 연신은 72 ℃의 온도 하에서 10분 동안 수행하였다. 키트 설명서에 따라 1 ug, 1.5 ug, 2 ug의 주형을 넣어 돌연변이율을 조사하였다. 태핑(tapping)함으로써 PCR 산물을 회수하고, Taq 효소 추가 A로, 전달체 pMD18T에 연결하여, 대장균 TOP10에 형질 감염시켰다. 10개의 양성 클론을 무작위로 선택하여 시퀀싱하고, 돌연변이가 1 ~ 2염기/유전자에 대응되는 주형량이 1.5 ug인 것을 확인하였다. 후속의 실험에서 상기 조건을 사용하여 실수유발 PCR을 수행하고, 즉 UGTPg45의 무작위 돌연변이 라이브러리를 잘 구축하였다.Plasmid UGTPg45-pMD18T as template, GeneMorph II Random Mutagenesis Kit (Agilent Technology), UGTPg45 random mutagenesis primer F SEQ ID NO: 23 (Gcatagcaatctaatctaagttttaattacaaaaatggagagagaaaatgttgagcaagaaatttcaa SEQ ID NO:24) and UGTPg45 random mutagenesis primer (Rattagtag45 NO. Perform error-prone PCR, and the procedure is as follows. predenatured for 2 minutes under a temperature of 95 °C; 30 cycles of denaturing at a temperature of 95° C. for 30 seconds, annealing at a temperature of 58° C. for 30 seconds, and stretching at a temperature of 72° C. for 3 minutes and 15 seconds; Final stretching was performed for 10 minutes at a temperature of 72 °C. According to the kit instructions, 1 ug, 1.5 ug, and 2 ug of the template were put in to investigate the mutation rate. The PCR product was recovered by tapping, and ligated to the transporter pMD18T with Taq enzyme addition A, and transfected into E. coli TOP10. Ten positive clones were randomly selected and sequenced, and it was confirmed that the template amount corresponding to 1 to 2 bases/gene of mutation was 1.5 ug. In subsequent experiments, error-prone PCR was performed using the above conditions, ie, a random mutant library of UGTPg45 was well constructed.

프라이머 SEQ ID NO: 25(단편 7 프라이머 F)(Acactggggcaataggctgtcgccattcaagagcagatagcttcaaaatgtttctactc) 및 SEQ ID NO: 26(단편 7 프라이머 R)(Cataatgtgagttttgctcaacatttctctctccattttgtaattaaaacttagattag)을 사용하여, 출아형 효모 게놈 DNA를 주형으로 PCR에 의해 단편 7을 얻고, 프라이머 SEQ ID NO: 27(단편 8 프라이머 F)(Ttgatgagttcatttcaaagcttgtttcctcctgagattaatataattatataaaaata) 및 SEQ ID NO: 28(단편 8 프라이머 R)(Actgtcaaggagggtattctgggcctccatgtcgctgctatataacagttgaaatttgg)을 사용하여 출아형 효모 게놈 DNA를 주형으로 PCR에 의해 단편8을 얻으며, 프라이머 SEQ ID NO: 29(단편 9 프라이머 F)(Cccaaagctaagagtcccattttattc) 및 SEQ ID NO: 30(단편 9 프라이머 R)(Gaagagtaaaaaaggagtagaaacattttgaagctatctgctcttgaatggcgacagcc), SEQ ID NO: 31(단편 10 프라이머 F)(Tgtcgattcgatactaacgccgccatccagtgtcgagaattacaatagtatgtctgatg) 및 SEQ ID NO: 32(단편 10 프라이머 R)(Tctggtgaggatttacggtatg)를 사용하여 출아형 효모 게놈 DNA를 주형으로 PCR에 의해 단편 9 및 단편 10을 얻었다. 프라이머 SEQ ID NO: 33(단편 11 프라이머 F)(Aagatgttcttatccaaatttcaactgttatatagcagcgacatggaggcccagaatac) 및 SEQ ID NO: 34(단편 11 프라이머 R)(tacttcttgcagacatcagacatactattgtaattctcgacactggatggcggcgttag)를 사용하여 플라스미드 PLKAN을 주형으로 PCR에 의해 단편 11을 얻었다. 상기 단편 7 ~ 11을 등몰비로 혼합하고, PPD 고 수율균주 ZWBY04RS를 형질 전환시키고, YPD플레이트(100 ug/ml의 G418을 넣음)에 코팅하여, 30 ℃의 온도 하에서 2일 동안 배양하며, UGTPg45 돌연변이 유전자가 발현된 효모 형질 전환체를 성장시켰다. 유사하게, 야생형 UGTPg45에 형질 전환시켜 효모 형질 전환체를 구축하여 대조로하였다.Primers SEQ ID NO: 25 (fragment 7 primer F) (Acactggggcaataggctgtcgccattcaagagcagatagcttcaaaatgttttctactc) and SEQ ID NO: 26 (fragment 7 primer R) (Cataatgtgagtttttgctcaacatttctctctccattttgtaattaaaacttagattag to obtain the genomic yeast subtype fragment by PCR and PCR as a template yeast subtype fragment) Using primers SEQ ID NO: 27 (fragment 8 primer F) (Ttgatgagttcattttcaaagcttgtttcctcctgagattaataataattataaaaaata) and SEQ ID NO: 28 (fragment 8 primer R) (Actgtcaaggagggtattctgggcctccatgtcgctgctatataacagttgaaatttgg, budding DNA as a template, using the germinating DNA as a template, using the primers SEQ ID NO: 27 (fragment 8 primer F) SEQ ID NO: 29 (Fragment 9 primer F) (Cccaaagctaagagtcccattttattc) and SEQ ID NO: 30 (Fragment 9 primer R) (Gaagagtaaaaaaggagtagaaacattttgaagctatctgctcttgaatggcgacacagcc), SEQ ID NO: 31 (Fragment 10 primer F) Fragment 9 and fragment 10 were obtained by PCR using (fragment 10 primer R) (Tctggtgaggatttacggtatg) using budding yeast genomic DNA as a template. Primers SEQ ID NO: 33 (fragment 11 primer F) (Aagatgttcttatccaaatttcaactgttatatagcagcgacatggaggcccagaatac) and SEQ ID NO: 34 (fragment 11 primer R) (tacttcttgcagacatcagacatactattgtaattctcgacactggatggcggcgttag) were obtained by PCR using plasmid fragment 11 as a template by PCR. The fragments 7 to 11 were mixed in an equimolar ratio, the PPD high-yield strain ZWBY04RS was transformed, and coated on a YPD plate (100 ug/ml of G418 was put), and cultured at 30 ° C. for 2 days, UGTPg45 Yeast transformants expressing the mutant gene were grown. Similarly, a yeast transformant was constructed by transformation into wild-type UGTPg45 as a control.

96웰 플레이트에 웰당 600 ul의 YPD 배지(100 ug/ml의 G418을 넣음)를 넣고, 효모 단일 클론을 선택하여 배지에 넣어, 30 ℃, 280 rpm의 조건 하에서 1일 동안 진탕 배양하였다. 6 ul의 배양물을 600 ul의 YPD 재지가 함유된 새로운 96웰 플레이트로 옮기고, 30 ℃, 280 rpm의 조건 하에서 3일 동안 진탕 배양하였다. 각 웰에 600 ul의 n-부탄올을 넣고, 고무 캡을 덮고 테이프로 밀봉한 후 3시간 동안 스핀 추출하였다. 4000 rpm으로 10분 동안 원심 분리하고, 150 ul의 n-부탄올 상을 취하여 새로운 96- 웰 플레이트에 피펫팅하고, HPLC로 산물을 측정하였다.In a 96-well plate, 600 ul of YPD medium per well (100 ug/ml of G418 was put) was put, and a yeast single clone was selected and put into the medium, and cultured with shaking for 1 day at 30° C. and 280 rpm. 6 ul of the culture was transferred to a new 96-well plate containing 600 ul of YPD stock, and cultured with shaking for 3 days at 30° C. and 280 rpm. 600 ul of n-butanol was added to each well, covered with a rubber cap, sealed with tape, and spin-extracted for 3 hours. After centrifugation at 4000 rpm for 10 minutes, 150 ul of the n-butanol phase was taken and pipetted into a new 96-well plate, and the product was measured by HPLC.

돌연변이 유전자 8E7을 사용하여 구축된 희귀 진세노사이드 Rh2 균주 ZWBY04RS-8E7에서 Rh2의 산량은 UGTPg45를 사용하여 구축된 균주 ZWBY04RS-UGTPg45에서 Rh2의 산량보다 70 % 향상되어, 60.48 mg/L에 도달하였다.The output of Rh2 in the rare ginsenoside Rh2 strain ZWBY04RS-8E7 constructed using the mutant gene 8E7 was 70% higher than that of Rh2 in the strain ZWBY04RS-UGTPg45 constructed using UGTPg45, reaching 60.48 mg/L.

상기 야생형 유전자 UGTPg45는 SEQ ID NO: 20의 뉴클레오티드 서열을 갖는다. SEQ ID NO: 20의 5’말단의 제1 ~ 1374 부위 뉴클레오티드는 UGTPg45의 오픈 리딩 프레임이고, SEQ ID NO: 20의 5’말단의 제1 ~ 3 부위 뉴클레오티드는 UGTPg45 유전자의 개시 코돈 ATG이며, SEQ ID NO: 20의 5’말단의 제1371 ~ 1374 부위 뉴클레오티드는 UGTPg45 유전자의 종료 코돈 TGA이다. 글리코실트랜스퍼라제 UGTPg45 유전자는 457개의 아미노산을 함유한 단백질 UGTPg45를 코딩하고, SEQ ID NO: 19를 갖는 아미노산 잔기 서열을 소프트웨어에 의해 51.1 kDa의 이론적 분자량 및 5.10의 등전점 pI를 갖는 것으로 예측되었다. SEQ ID NO: 19의 아미노산 말단의 제332 ~ 375 부위 아미노산은 글리코실트랜스퍼라제 PSPG 보존적 기능 영역이다.The wild-type gene UGTPg45 has the nucleotide sequence of SEQ ID NO: 20. The first to 1374 site nucleotides at the 5' end of SEQ ID NO: 20 are the open reading frame of UGTPg45, and the first to 3 site nucleotides at the 5' end of SEQ ID NO: 20 are the start codon ATG of the UGTPg45 gene, SEQ ID NO: 20 The nucleotides 1371 to 1374 at the 5' end of ID NO: 20 are the stop codon TGA of the UGTPg45 gene. The glycosyltransferase UGTPg45 gene encodes the protein UGTPg45 containing 457 amino acids, and the amino acid residue sequence with SEQ ID NO: 19 was predicted by software to have a theoretical molecular weight of 51.1 kDa and an isoelectric point pI of 5.10. The amino acid at the 332 to 375 region of the amino acid terminus of SEQ ID NO: 19 is a glycosyltransferase PSPG conserved functional region.

UGTPg45 아미노산 서열 SEQ_ID_NO.19UGTPg45 amino acid sequence SEQ_ID_NO.19

MEREMLSKTHIMFIPFPAQGHMSPMMQFAKRLAWKGLRITIVLPAQIRDFMQITNPLINTECISFDFDKDDGMPYSMQAYMGVVKLKVTNKLSDLLEKQRTNGYPVNLLVVDSLYPSRVEMCHQLGVKGAPFFTHSCAVGAIYYNARLGKLKIPPEEGLTSVSLPSIPLLGRDDLPIIRTGTFPDLFEHLGNQFSDLDKADWIFFNTFDKLENEEAKWLSSQWPITSIGPLIPSMYLDKQLPNDKDNGINFYKADVGSCIKWLDAKDPGSVVYASFGSVKHNLGDDYMDEVAWGLLHSKYHFIWVVIESERTKLSSDFLAEAEAEEKGLIVSWCPQLQVLSHKSIGSFMTHCGWNSTVEALSLGVPMVALPQQFDQPANAKYIVDVWQIGVRVPIGEEGVVLRGEVANCIKDVMEGEIGDELRGNALKWKGLAVEAMEKGGSSDKNIDEFISKLVSSMEREMLSKTHIMFIPFPAQGHMSPMMQFAKRLAWKGLRITIVLPAQIRDFMQITNPLINTECISFDFDKDDGMPYSMQAYMGVVKLKVTNKLSDLLEKQRTNGYPVNLLVVDSLYPSRVEMCHQLGVKGAPFFTHSCAVGAIYYNARLGKLKIPPEEGLTSVSLPSIPLLGRDDLPIIRTGTFPDLFEHLGNQFSDLDKADWIFFNTFDKLENEEAKWLSSQWPITSIGPLIPSMYLDKQLPNDKDNGINFYKADVGSCIKWLDAKDPGSVVYASFGSVKHNLGDDYMDEVAWGLLHSKYHFIWVVIESERTKLSSDFLAEAEAEEKGLIVSWCPQLQVLSHKSIGSFMTHCGWNSTVEALSLGVPMVALPQQFDQPANAKYIVDVWQIGVRVPIGEEGVVLRGEVANCIKDVMEGEIGDELRGNALKWKGLAVEAMEKGGSSDKNIDEFISKLVSS

UGTPg45뉴클레오티드 서열 SEQ_ID_NO.20UGTPg45 nucleotide sequence SEQ_ID_NO.20

ATGGAGAGAGAAATGTTGAGCAAAACTCACATTATGTTCATCCCATTCCCAGCTCAAGGCCACATGAGCCCAATGATGCAATTCGCCAAGCGTTTAGCCTGGAAAGGCCTGCGAATCACGATAGTTCTTCCGGCTCAAATTCGAGATTTCATGCAAATAACCAACCCATTGATCAACACTGAGTGCATCTCCTTTGATTTTGATAAAGACGATGGGATGCCATACAGCATGCAGGCTTATATGGGAGTTGTAAAACTCAAGGTCACAAATAAACTGAGTGACCTACTCGAGAAGCAAAGAACAAATGGCTACCCTGTTAATTTGCTAGTGGTTGATTCATTATATCCATCTCGGGTAGAAATGTGCCACCAACTTGGGGTAAAAGGAGCTCCATTTTTCACTCACTCTTGTGCTGTTGGTGCCATTTATTATAATGCTCGCTTAGGGAAATTGAAGATACCTCCTGAGGAAGGGTTGACTTCTGTTTCATTGCCTTCAATTCCATTGTTGGGGAGAGATGATTTGCCAATTATTAGGACTGGCACCTTTCCTGATCTCTTTGAGCATTTGGGGAATCAGTTTTCAGATCTTGATAAAGCGGATTGGATCTTTTTCAATACTTTTGATAAGCTTGAAAATGAGGAAGCAAAATGGCTATCTAGCCAATGGCCAATTACATCCATCGGACCATTAATCCCTTCAATGTACTTAGACAAACAATTACCAAATGACAAAGACAATGGCATTAATTTCTACAAGGCAGACGTCGGATCGTGCATCAAGTGGCTAGACGCCAAAGACCCTGGCTCGGTAGTCTACGCCTCATTCGGGAGCGTGAAGCACAACCTCGGCGATGACTACATGGACGAAGTAGCATGGGGCTTGTTACATAGCAAATATCACTTCATATGGGTTGTTATAGAATCCGAACGTACAAAGCTCTCTAGCGATTTCTTGGCAGAGGCAGAGGCAGAGGAAAAAGGCCTAATAGTGAGTTGGTGCCCTCAACTCCAAGTTTTGTCACATAAATCTATAGGGAGTTTTATGACTCATTGTGGTTGGAACTCGACGGTTGAGGCATTGAGTTTGGGCGTGCCAATGGTGGCACTGCCACAACAGTTTGATCAGCCTGCTAATGCCAAGTATATCGTGGATGTATGGCAAATTGGGGTTCGGGTTCCGATTGGTGAAGAGGGGGTTGTTTTGAGGGGAGAAGTTGCTAACTGTATAAAGGATGTTATGGAGGGGGAAATAGGGGATGAGCTTAGAGGGAATGCTTTGAAATGGAAGGGGTTGGCTGTGGAGGCAATGGAGAAAGGGGGTAGCTCTGATAAGAATATTGATGAGTTCATTTCAAAGCTTGTTTCCTCCTGAATGGAGAGAGAAATGTTGAGCAAAACTCACATTATGTTCATCCCATTCCCAGCTCAAGGCCACATGAGCCCAATGATGCAATTCGCCAAGCGTTTAGCCTGGAAAGGCCTGCGAATCACGATAGTTCTTCCGGCTCAAATTCGAGATTTCATGCAAATAACCAACCCATTGATCAACACTGAGTGCATCTCCTTTGATTTTGATAAAGACGATGGGATGCCATACAGCATGCAGGCTTATATGGGAGTTGTAAAACTCAAGGTCACAAATAAACTGAGTGACCTACTCGAGAAGCAAAGAACAAATGGCTACCCTGTTAATTTGCTAGTGGTTGATTCATTATATCCATCTCGGGTAGAAATGTGCCACCAACTTGGGGTAAAAGGAGCTCCATTTTTCACTCACTCTTGTGCTGTTGGTGCCATTTATTATAATGCTCGCTTAGGGAAATTGAAGATACCTCCTGAGGAAGGGTTGACTTCTGTTTCATTGCCTTCAATTCCATTGTTGGGGAGAGATGATTTGCCAATTATTAGGACTGGCACCTTTCCTGATCTCTTTGAGCATTTGGGGAATCAGTTTTCAGATCTTGATAAAGCGGATTGGATCTTTTTCAATACTTTTGATAAGCTTGAAAATGAGGAAGCAAAATGGCTATCTAGCCAATGGCCAATTACATCCATCGGACCATTAATCCCTTCAATGTACTTAGACAAACAATTACCAAATGACAAAGACAATGGCATTAATTTCTACAAGGCAGACGTCGGATCGTGCATCAAGTGGCTAGACGCCAAAGACCCTGGCTCGGTAGTCTACGCCTCATTCGGGAGCGTGAAGCACAACCTCGGCGATGACTACATGGACGAAGTAGCATGGGGCTTGTTACATAGCAAATATCACTTCATATGGGTTGTTATAGAATCCGAACGTACAAAGCTCTCTAGCGATTTCTTGGCAGAGGCAGAGGCAGAGGAAAAAGGCCTAATAGTGAGTTGGT GCCCTCAACTCCAAGTTTTGTCACATAAATCTATAGGGAGTTTTATGACTCATTGTGGTTGGAACTCGACGGTTGAGGCATTGAGTTTGGGCGTGCCAATGGTGGCACTGCCACAACAGTTTGATCAGCCTGCTAATGCCAAGTATATCGTGGATGTATGGCAAATTGGGGTTCGGGTTCCGATTGGTGAAGAGGGGGTTGTTTTGAGGGGAGAAGTTGCTAACTGTATAAAGGATGTTATGGAGGGGGAAATAGGGGATGAGCTTAGAGGGAATGCTTTGAAATGGAAGGGGTTGGCTGTGGAGGCAATGGAGAAAGGGGGTAGCTCTGATAAGAATATTGATGAGTTCATTTCAAAGCTTGTTTCCTCCTGA

상기 돌연변이체 유전자 8E7은 SEQ ID NO: 22의 뉴클레오티드 서열을 갖는다. SEQ ID NO: 22의 5’말단의 제1 ~ 1374 부위 뉴클레오티드는 8E7의 오픈 리딩 프레임이고, SEQ ID NO: 22의 5’말단의 제1 ~ 3 부위 뉴클레오티드는 8E7 유전자의 개시 코돈 ATG이며, SEQ ID NO: 22의 5’말단의 제1371 ~ 1374 부위 뉴클레오티드는 8E7 유전자의 종료 코돈 TGA이다. 글리코실트랜스퍼라제 8E7 유전자는 457개의 아미노산을 함유하는 단백질 8E7을 코딩하고, SEQ ID NO: 21의 아미노산 잔기 서열을 갖는다.The mutant gene 8E7 has the nucleotide sequence of SEQ ID NO: 22. The 1st to 1374 site nucleotides at the 5' end of SEQ ID NO: 22 are the open reading frame of 8E7, the 1st to 3 site nucleotides at the 5' end of SEQ ID NO: 22 are the initiation codon ATG of the 8E7 gene, SEQ ID NO: 22 The nucleotides 1371 to 1374 at the 5' end of ID NO: 22 are the stop codon TGA of the 8E7 gene. The glycosyltransferase 8E7 gene encodes a protein 8E7 containing 457 amino acids and has the amino acid residue sequence of SEQ ID NO: 21.

8E7아미노산 서열 SEQ_ID_NO.218E7 amino acid sequence SEQ_ID_NO.21

MEREMLSKTHIMFIPFPAQGHMSPMMQFAKRLAWKGLRITIVLPAQIRDFMQITNPLINTECISFDFDKDDGMPYSMQAYMGVVKLKVTNKLSDLLEKQRTNGYPVNLLVVDSLYPSRVEMCHQLGVKGAPFFTHSCAVGAIYYNARLGKLKIPPEEGLTSVSLPSIPLLGRDDLPIIRTGTFPDLFEHLGNQFSDLDKADWIFFNTFDKLENEEAKWLSSHWPITSIGPLIPSMYLDKQLPNDKDNGINFYKADVGSCIKWLDAKDPGSVVYASFGSVKHNLGDDYMDEVAWGLLHSKYHFIWVVIESERTKLSSDFLAEVEAEEKGLIVSWCPQLQVLSHKSIGSFMTHCGWNSTVEALSLGVPMVALPQQFDQPANAKYIVDVWQIGVRVPIGEEGVVLRGEVANCIKDVMEGEIGDELRGNALKWKGLAVEAMEKGGSSDKNIDEFISKLVSSMEREMLSKTHIMFIPFPAQGHMSPMMQFAKRLAWKGLRITIVLPAQIRDFMQITNPLINTECISFDFDKDDGMPYSMQAYMGVVKLKVTNKLSDLLEKQRTNGYPVNLLVVDSLYPSRVEMCHQLGVKGAPFFTHSCAVGAIYYNARLGKLKIPPEEGLTSVSLPSIPLLGRDDLPIIRTGTFPDLFEHLGNQFSDLDKADWIFFNTFDKLENEEAKWLSSHWPITSIGPLIPSMYLDKQLPNDKDNGINFYKADVGSCIKWLDAKDPGSVVYASFGSVKHNLGDDYMDEVAWGLLHSKYHFIWVVIESERTKLSSDFLAEVEAEEKGLIVSWCPQLQVLSHKSIGSFMTHCGWNSTVEALSLGVPMVALPQQFDQPANAKYIVDVWQIGVRVPIGEEGVVLRGEVANCIKDVMEGEIGDELRGNALKWKGLAVEAMEKGGSSDKNIDEFISKLVSS

8E7뉴클레오티드 서열 SEQ_ID_NO.228E7 nucleotide sequence SEQ_ID_NO.22

ATGGAGAGAGAAATGTTGAGCAAAACTCACATTATGTTCATCCCATTCCCAGCTCAAGGCCACATGAGCCCAATGATGCAATTCGCCAAGCGTTTAGCCTGGAAAGGCCTGCGAATCACGATAGTTCTTCCGGCTCAAATTCGAGATTTCATGCAAATAACCAACCCATTGATCAACACTGAGTGCATCTCCTTTGATTTTGATAAAGACGATGGGATGCCATACAGCATGCAGGCTTATATGGGAGTTGTAAAACTCAAGGTCACAAATAAACTGAGTGACCTACTCGAGAAGCAAAGAACAAATGGCTACCCTGTTAATTTGCTAGTGGTTGATTCATTATATCCATCTCGGGTAGAAATGTGCCACCAACTTGGGGTAAAAGGAGCTCCATTTTTCACTCACTCTTGTGCTGTTGGTGCCATTTATTATAATGCTCGCTTAGGGAAATTGAAGATACCTCCTGAGGAAGGGTTGACTTCTGTTTCATTGCCTTCAATTCCATTGTTGGGGAGAGATGATTTGCCAATTATTAGGACTGGCACCTTTCCTGATCTCTTTGAGCATTTGGGGAATCAGTTTTCAGATCTTGATAAAGCGGATTGGATCTTTTTCAATACTTTTGATAAGCTTGAAAATGAGGAAGCAAAATGGCTATCTAGCCATTGGCCAATTACATCCATCGGACCATTAATCCCTTCAATGTACTTAGACAAACAATTACCAAATGACAAAGACAATGGCATTAATTTCTACAAGGCAGACGTCGGATCGTGCATCAAGTGGCTAGACGCCAAAGACCCTGGCTCGGTAGTCTACGCCTCATTCGGGAGCGTGAAGCACAACCTCGGCGATGACTACATGGACGAAGTAGCATGGGGCTTGTTACATAGCAAATATCACTTCATATGGGTTGTTATAGAATCCGAACGTACAAAGCTCTCTAGCGATTTCTTGGCAGAGGTAGAGGCAGAGGAAAAAGGCCTAATAGTGAGTTGGTGCCCTCAACTCCAAGTTTTGTCACATAAATCTATAGGGAGTTTTATGACTCATTGTGGTTGGAACTCGACGGTTGAGGCATTGAGTTTGGGCGTGCCAATGGTGGCACTGCCACAACAGTTTGATCAGCCTGCTAATGCCAAGTATATCGTGGATGTATGGCAAATTGGGGTTCGGGTTCCGATTGGTGAAGAGGGGGTTGTTTTGAGGGGAGAAGTTGCTAACTGTATAAAGGATGTTATGGAGGGGGAAATAGGGGATGAGCTTAGAGGGAATGCTTTGAAATGGAAGGGGTTGGCTGTGGAGGCAATGGAGAAAGGGGGTAGCTCTGATAAGAATATTGATGAGTTCATTTCAAAGCTTGTTTCCTCCTGAATGGAGAGAGAAATGTTGAGCAAAACTCACATTATGTTCATCCCATTCCCAGCTCAAGGCCACATGAGCCCAATGATGCAATTCGCCAAGCGTTTAGCCTGGAAAGGCCTGCGAATCACGATAGTTCTTCCGGCTCAAATTCGAGATTTCATGCAAATAACCAACCCATTGATCAACACTGAGTGCATCTCCTTTGATTTTGATAAAGACGATGGGATGCCATACAGCATGCAGGCTTATATGGGAGTTGTAAAACTCAAGGTCACAAATAAACTGAGTGACCTACTCGAGAAGCAAAGAACAAATGGCTACCCTGTTAATTTGCTAGTGGTTGATTCATTATATCCATCTCGGGTAGAAATGTGCCACCAACTTGGGGTAAAAGGAGCTCCATTTTTCACTCACTCTTGTGCTGTTGGTGCCATTTATTATAATGCTCGCTTAGGGAAATTGAAGATACCTCCTGAGGAAGGGTTGACTTCTGTTTCATTGCCTTCAATTCCATTGTTGGGGAGAGATGATTTGCCAATTATTAGGACTGGCACCTTTCCTGATCTCTTTGAGCATTTGGGGAATCAGTTTTCAGATCTTGATAAAGCGGATTGGATCTTTTTCAATACTTTTGATAAGCTTGAAAATGAGGAAGCAAAATGGCTATCTAGCCATTGGCCAATTACATCCATCGGACCATTAATCCCTTCAATGTACTTAGACAAACAATTACCAAATGACAAAGACAATGGCATTAATTTCTACAAGGCAGACGTCGGATCGTGCATCAAGTGGCTAGACGCCAAAGACCCTGGCTCGGTAGTCTACGCCTCATTCGGGAGCGTGAAGCACAACCTCGGCGATGACTACATGGACGAAGTAGCATGGGGCTTGTTACATAGCAAATATCACTTCATATGGGTTGTTATAGAATCCGAACGTACAAAGCTCTCTAGCGATTTCTTGGCAGAGGTAGAGGCAGAGGAAAAAGGCCTAATAGTGAGTTGGT GCCCTCAACTCCAAGTTTTGTCACATAAATCTATAGGGAGTTTTATGACTCATTGTGGTTGGAACTCGACGGTTGAGGCATTGAGTTTGGGCGTGCCAATGGTGGCACTGCCACAACAGTTTGATCAGCCTGCTAATGCCAAGTATATCGTGGATGTATGGCAAATTGGGGTTCGGGTTCCGATTGGTGAAGAGGGGGTTGTTTTGAGGGGAGAAGTTGCTAACTGTATAAAGGATGTTATGGAGGGGGAAATAGGGGATGAGCTTAGAGGGAATGCTTTGAAATGGAAGGGGTTGGCTGTGGAGGCAATGGAGAAAGGGGGTAGCTCTGATAAGAATATTGATGAGTTCATTTCAAAGCTTGTTTCCTCCTGA

상기 결과에 따르면, 본 발명의 삼칠로부터 유래된 글리코실트랜스퍼라제 유전자 Pn50 또는 야생형 글리코실트랜스퍼라제 유전자 변형에 의해 얻은 돌연변이체 유전자 8E7을 사용하여 인삼으로부터 유래된 글리코실트랜스퍼라제 유전자 UGTPg45를 대체함으로써 희귀 진세노사이드 Rh2의 합성 효율을 크게 향상시킬 수 있으며, 현저한 효과를 나타냈다.According to the above results, the glycosyltransferase gene Pn50 derived from ginseng of the present invention or the mutant gene 8E7 obtained by genetic modification of wild-type glycosyltransferase of the present invention were used to replace the glycosyltransferase gene UGTPg45 derived from ginseng. The synthesis efficiency of ginsenoside Rh2 could be greatly improved, and a remarkable effect was exhibited.

실시예6. 삼칠 Pn50의 글리코실트랜스퍼라제 돌연변이체 유전자 Pn50-Q222H-VE를 이용한 출아형 효모에서의 Rh2의 합성Example 6. Synthesis of Rh2 in budding yeast using the glycosyltransferase mutant gene Pn50-Q222H-VE of Samchil Pn50

발명자는 Pn50의 222 부위의 아미노산 잔기 Q를 H로 돌연변이시키는 동시에, Pn50의 322 및 323 부위의 아미노산 잔기를 결실시켜, 발명자는 321 부위 뒤에 2개의 아미노산 VE를 삽입하여 Pn50의 돌연변이체 Pn50-Q222H-VE를 얻었다.The inventor mutated amino acid residue Q at site 222 of Pn50 to H, and at the same time deleted amino acid residues at sites 322 and 323 of Pn50, the inventor inserted two amino acids VE after site 321, mutant Pn50-Q222H- of Pn50 VE was obtained.

(1) 서열 SEQ ID NO: 7-18과 같은 12가닥의 프라이머를 합성하고, PCR의 방법으로 글리코실트랜스퍼라제에 의해 발현된 프로모터, 터미네이터, ORF, 선별 마커, 업 스트림 및 다운 스트림 상동성 아암단편을 얻으며, PCR 방법은 실시예1과 같다. 상기 PCR 단편 및 Pn50-Q222H-VE의 ORF를 각각 100 ng 혼합한 후, 출아형 효모의 통상적인 LiAc/ssDNA 형질 전환 방법을 이용하여, 재조합출아형 효모 균주 ZWBY04RS를 형질 전환시켜, 재조합 출아형 효모 균주 ZWBY04RS-QE를 얻었다.(1) Synthesis of 12-stranded primers as in sequence SEQ ID NO: 7-18, and promoter, terminator, ORF, selectable marker, upstream and downstream homology arms expressed by glycosyltransferase by the method of PCR A fragment was obtained, and the PCR method was the same as in Example 1. After mixing 100 ng of each of the PCR fragment and the ORF of Pn50-Q222H-VE, the recombinant budding yeast strain ZWBY04RS was transformed using a conventional LiAc/ssDNA transformation method of budding yeast, and the recombinant budding yeast Strain ZWBY04RS-QE was obtained.

(2) 고체 배지 플레이트에 스트리킹된 재조합 출아형 효모균 ZWBY04RS-QE을 취하여, 각각 5 mL의 액체 배지를 함유한 시험관에서 하룻밤 진탕 배양하고(30 ℃, 250 rpm, 16시간); 원심 분리하여 균체를 수집하며, 10 mL의 액체 배지가 담긴 50 mL의 삼각 플라스크에 옮겨, OD600이 0.05이 될 때까지, 30 ℃, 250 rpm의 조건하에서 4일 동안 배양하여 발효 산물을 얻었다. 본 방법은 동시에 각 재조합 효모에 대하여 하나의 병렬 실험을 설정하였다.(2) taking the recombinant budding yeast strain ZWBY04RS-QE streaked on a solid medium plate, and culturing with shaking overnight in a test tube each containing 5 mL of a liquid medium (30 °C, 250 rpm, 16 hours); Cells were collected by centrifugation, transferred to a 50 mL Erlenmeyer flask containing 10 mL of liquid medium, and cultured for 4 days at 30 °C and 250 rpm until OD 600 reached 0.05 to obtain a fermentation product. In this method, one parallel experiment was set up for each recombinant yeast at the same time.

프로토파녹사디올 및 희귀 진세노사이드 Rh2의 추출 및 검출: 10 mL의 발효액으로부터 100 μL의 발효액을 취하고, Fastprep 진탕으로 효모를 용해시키고, 동일한 부피의 n-부탄올을 첨가한 다음, n-부탄올을 진공 하에서 증발 건조시켰다. 100 μL의 메탄올에 용해시킨 후 HPLC로 목적 생성물의 산량을 측정하였다.Extraction and detection of protophanoxadiol and rare ginsenoside Rh2: Take 100 μL of fermentation broth from 10 mL of fermentation broth, lyse yeast with Fastprep shaking, add equal volume of n-butanol, then n-butanol Evaporate to dryness under vacuum. After dissolving in 100 μL of methanol, the acid amount of the target product was measured by HPLC.

프로토파녹사디올을 생성하는 출아형 효모 균주에 삼칠로부터 유래된 글리코실트랜스퍼라제 유전자 Pn50-Q222H-VE를 도입하여 구축된 재조합 출아형 효모 균주 ZWBY04RS-QE는 희귀 진세노사이드 Rh2를 합성할 수 있고, 이의 산량은 59.09 mg/L이다(도 4).The recombinant budding yeast strain ZWBY04RS-QE constructed by introducing the glycosyltransferase gene Pn50-Q222H-VE derived from Samchil into a budding yeast strain producing protopanoxadiol can synthesize the rare ginsenoside Rh2 and , its acid content is 59.09 mg/L (FIG. 4).

Pn50-Q222H-VE의 아미노산 서열, SEQ_ID_NO.41Amino acid sequence of Pn50-Q222H-VE, SEQ_ID_NO.41

MEREMLSKTHIMFIPFPAQGHMSPMMQFVKRLAWKGVRITIVLPAEIRDSMQINNSLINTECISFDFDKDDEMPYSMRAYMGVVKLKVTNKLSDLLEKQKTNGYPVNLLVVDSLYPSRVEMCHQLGVKGAPFFTHSCAVGAIYYNARLGKLKIPPEEGLTSVSLPSIPLLGRNDLPIIRTGTFPDLFEHLGNQFSDLDKADWIFFNTFDKLENEEAKWLSSHWPITSIGPLIPSMYLDKQLPNDKDNDINFYKADVGSCIKWLDAKDPGSVVYASFGSVKHNLGDDYMDEVAWGLLHSKYHFIWVVIESERTKLSSDFLAEVEAEEKGLIVSWCPQLEVLSHKSIGSFMTHCGWNSTVEALSLGVPMVAVPQQFDQPVNAKYIVDVWRIGVQVPIGENGVLLRGEVANCIKDVMEGEIGDELRGNALKWKGLAVEAMEKGGSSDKNIDEFISKLVSSMEREMLSKTHIMFIPFPAQGHMSPMMQFVKRLAWKGVRITIVLPAEIRDSMQINNSLINTECISFDFDKDDEMPYSMRAYMGVVKLKVTNKLSDLLEKQKTNGYPVNLLVVDSLYPSRVEMCHQLGVKGAPFFTHSCAVGAIYYNARLGKLKIPPEEGLTSVSLPSIPLLGRNDLPIIRTGTFPDLFEHLGNQFSDLDKADWIFFNTFDKLENEEAKWLSSHWPITSIGPLIPSMYLDKQLPNDKDNDINFYKADVGSCIKWLDAKDPGSVVYASFGSVKHNLGDDYMDEVAWGLLHSKYHFIWVVIESERTKLSSDFLAEVEAEEKGLIVSWCPQLEVLSHKSIGSFMTHCGWNSTVEALSLGVPMVAVPQQFDQPVNAKYIVDVWRIGVQVPIGENGVLLRGEVANCIKDVMEGEIGDELRGNALKWKGLAVEAMEKGGSSDKNIDEFISKLVSS

Pn50-Q222H-VE의 핵산 서열, SEQ_ID_NO.42Nucleic acid sequence of Pn50-Q222H-VE, SEQ_ID_NO.42

ATGGAGAGAGAAATGTTGAGCAAAACTCACATTATGTTCATCCCATTCCCAGCTCAAGGCCACATGAGCCCAATGATGCAATTCGTCAAGCGTTTAGCCTGGAAAGGCGTGCGAATCACGATAGTTCTTCCGGCTGAGATTCGAGATTCTATGCAAATAAACAACTCATTGATCAACACTGAGTGCATCTCCTTTGATTTTGATAAAGATGATGAGATGCCATACAGCATGCGGGCTTATATGGGAGTTGTAAAGCTCAAGGTCACAAATAAACTGAGTGACCTACTCGAGAAGCAAAAAACAAATGGCTACCCTGTTAATTTGCTAGTGGTCGATTCATTATATCCATCTCGGGTAGAAATGTGCCACCAACTTGGGGTAAAAGGAGCTCCATTTTTCACTCACTCTTGTGCTGTTGGTGCCATTTATTATAATGCTCGCTTAGGGAAATTGAAGATACCTCCTGAGGAAGGGTTGACTTCTGTTTCATTGCCTTCAATTCCATTGTTGGGGAGAAATGATTTGCCAATTATTAGGACTGGCACCTTTCCTGATCTCTTTGAGCATTTGGGGAATCAGTTTTCAGATCTTGATAAAGCGGATTGGATCTTTTTCAATACTTTTGATAAGCTTGAAAATGAGGAAGCAAAATGGCTATCTAGCCATTGGCCAATTACATCCATCGGACCATTAATCCCTTCAATGTACTTAGACAAACAATTACCAAATGACAAAGACAATGACATTAATTTCTACAAGGCAGACGTCGGATCGTGCATCAAGTGGCTAGACGCCAAAGACCCTGGCTCGGTAGTCTACGCCTCATTCGGGAGCGTGAAGCACAACCTCGGCGATGACTACATGGACGAAGTAGCATGGGGCTTGTTACACAGCAAATATCACTTCATATGGGTTGTTATAGAATCCGAACGTACAAAGCTCTCTAGCGATTTCTTGGCAGAGGTAGAGGCAGAGGAAAAAGGCCTAATAGTGAGTTGGTGCCCTCAACTCGAAGTTTTGTCACATAAATCTATAGGTAGTTTTATGACTCATTGTGGTTGGAACTCGACGGTTGAGGCATTGAGTTTGGGCGTGCCAATGGTGGCAGTGCCACAACAGTTTGATCAGCCTGTTAATGCCAAGTATATCGTGGATGTATGGCGAATTGGGGTTCAGGTTCCGATTGGTGAAAATGGGGTTCTTTTGAGGGGAGAAGTTGCTAACTGTATAAAGGATGTTATGGAGGGGGAAATAGGGGATGAGCTTAGAGGGAATGCTTTGAAATGGAAGGGGTTGGCTGTGGAGGCAATGGAGAAAGGGGGTAGCTCTGATAAGAATATTGATGAGTTCATTTCAAAGCTTGTTTCCTCCTGAATGGAGAGAGAAATGTTGAGCAAAACTCACATTATGTTCATCCCATTCCCAGCTCAAGGCCACATGAGCCCAATGATGCAATTCGTCAAGCGTTTAGCCTGGAAAGGCGTGCGAATCACGATAGTTCTTCCGGCTGAGATTCGAGATTCTATGCAAATAAACAACTCATTGATCAACACTGAGTGCATCTCCTTTGATTTTGATAAAGATGATGAGATGCCATACAGCATGCGGGCTTATATGGGAGTTGTAAAGCTCAAGGTCACAAATAAACTGAGTGACCTACTCGAGAAGCAAAAAACAAATGGCTACCCTGTTAATTTGCTAGTGGTCGATTCATTATATCCATCTCGGGTAGAAATGTGCCACCAACTTGGGGTAAAAGGAGCTCCATTTTTCACTCACTCTTGTGCTGTTGGTGCCATTTATTATAATGCTCGCTTAGGGAAATTGAAGATACCTCCTGAGGAAGGGTTGACTTCTGTTTCATTGCCTTCAATTCCATTGTTGGGGAGAAATGATTTGCCAATTATTAGGACTGGCACCTTTCCTGATCTCTTTGAGCATTTGGGGAATCAGTTTTCAGATCTTGATAAAGCGGATTGGATCTTTTTCAATACTTTTGATAAGCTTGAAAATGAGGAAGCAAAATGGCTATCTAGCCATTGGCCAATTACATCCATCGGACCATTAATCCCTTCAATGTACTTAGACAAACAATTACCAAATGACAAAGACAATGACATTAATTTCTACAAGGCAGACGTCGGATCGTGCATCAAGTGGCTAGACGCCAAAGACCCTGGCTCGGTAGTCTACGCCTCATTCGGGAGCGTGAAGCACAACCTCGGCGATGACTACATGGACGAAGTAGCATGGGGCTTGTTACACAGCAAATATCACTTCATATGGGTTGTTATAGAATCCGAACGTACAAAGCTCTCTAGCGATTTCTTGGCAGAGGTAGAGGCAGAGGAAAAAGGCCTAATAGTGAGTTGGT GCCCTCAACTCGAAGTTTTGTCACATAAATCTATAGGTAGTTTTATGACTCATTGTGGTTGGAACTCGACGGTTGAGGCATTGAGTTTGGGCGTGCCAATGGTGGCAGTGCCACAACAGTTTGATCAGCCTGTTAATGCCAAGTATATCGTGGATGTATGGCGAATTGGGGTTCAGGTTCCGATTGGTGAAAATGGGGTTCTTTTGAGGGGAGAAGTTGCTAACTGTATAAAGGATGTTATGGAGGGGGAAATAGGGGATGAGCTTAGAGGGAATGCTTTGAAATGGAAGGGGTTGGCTGTGGAGGCAATGGAGAAAGGGGGTAGCTCTGATAAGAATATTGATGAGTTCATTTCAAAGCTTGTTTCCTCCTGA

실시예7. 글리코실트랜스퍼라제 돌연변이체 유전자 UGT-MUT1, UGT-MUT2 및 UGT-MUT3을 이용한 출아형 효모에서의 Rh2의 합성Example 7. Synthesis of Rh2 in budding yeast using glycosyltransferase mutant genes UGT-MUT1, UGT-MUT2 and UGT-MUT3

발명자는 Pn50-Q222H-VE의 280 부위의 아미노산 잔기 K 및/또는 247 부위의 아미노산 잔기N을 포화 및 돌연변이시켜, 3개의 촉매 효울이 향상된 돌연변이체 UGT-MUT1, UGT-MUT2 및 UGT-MUT3을 얻었다. UGT-MUT1은 Pn50-Q222H-VE의 280 부위의 아미노산 잔기K를 아미노산 잔기I로 돌연변이시킨 것이고, UGT-MUT2는 Pn50-Q222H-VE의 247 부위의 아미노산 잔기N을 아미노산 잔기S로 돌연변이시킨 것이며, UGT-MUT3은 Pn50-Q222H-VE의 280 부위의 아미노산 잔기K를 아미노산 잔기I로 돌연변이 시킨 것이고, 247 부위에서 아미노산 잔기N을 아미노산 잔기S로 돌연변이시켰다.The inventors saturated and mutated amino acid residue K at site 280 and/or amino acid residue N at site 247 of Pn50-Q222H-VE to obtain mutants UGT-MUT1, UGT-MUT2 and UGT-MUT3 with improved three catalytic effects. . UGT-MUT1 is a mutation of amino acid residue K at site 280 of Pn50-Q222H-VE to amino acid residue I, and UGT-MUT2 is a mutation of amino acid residue N at site 247 of Pn50-Q222H-VE with amino acid residue S, UGT-MUT3 was obtained by mutating amino acid residue K at site 280 of Pn50-Q222H-VE to amino acid residue I, and mutating amino acid residue N to amino acid residue S at site 247.

(1) 서열SEQ ID NO: 7-18과 같은 12가닥의 프라이머를 합성하고, PCR의 방법으로 글리코실트랜스퍼라제에 의해 발현된 프로모터, 터미네이터, ORF, 선별 마커, 업 스트림 및 다운 스트림 상동성 아암 단편을 얻으며, PCR 방법은 실시예1과 같다. 상기 PCR단편 및 UGT-MUT1(Pn50-Q222H-VE-K280I), UGT-MUT2(Pn50-Q222H-VE-N247S) 및 UGT-MUT3(Pn50-Q222H-VE-K280I-N247S)의 ORF를 각각 100 ng 혼합한 후, 출아형 효모의 통상적인 LiAc/ssDNA 형질 전환 방법을 이용하여, 재조합 출아형 효모 균주 ZWBY04RS를 형질 전환시켜, 재조합 출아형 효모 균주 ZWBY04RS-MUT1, ZWBY04RS-MUT2 및 ZWBY04RS-MUT3을 얻었다.(1) Synthesis of 12-stranded primers as in sequence SEQ ID NO: 7-18, promoter, terminator, ORF, selectable marker, upstream and downstream homology arms expressed by glycosyltransferase by the method of PCR A fragment was obtained, and the PCR method was the same as in Example 1. The PCR fragment and the ORF of UGT-MUT1 (Pn50-Q222H-VE-K280I), UGT-MUT2 (Pn50-Q222H-VE-N247S) and UGT-MUT3 (Pn50-Q222H-VE-K280I-N247S) were each 100 ng After mixing, the recombinant budding yeast strain ZWBY04RS was transformed using a conventional LiAc/ssDNA transformation method of budding yeast to obtain recombinant budding yeast strains ZWBY04RS-MUT1, ZWBY04RS-MUT2 and ZWBY04RS-MUT3.

(2)고체 배지 플레이트에 스트리킹된 재조합 출아형 효모균 ZWBY04RS-MUT1, ZWBY04RS-MUT2 및 ZWBY04RS-MUT3을 취하여, 각각 5 mL의 액체 배지를 함유한 시험관에서 하룻밤 진탕 배양하고(30 ℃, 250 rpm, 16시간); 원심 분리하여 균체를 수집하며, 10 mL의 액체 배지가 담긴 50 mL의 삼각 플라스크에 옮겨, OD600이 0.05가 될 때까지, 30 ℃, 250 rpm의 조건하에서 4일 동안 배양하여 발효 산물을 얻었다. 본 방법은 동시에 각 재조합 효모에 대하여 하나의 병렬 실험을 설정하였다.(2) Recombinant budding yeast strains ZWBY04RS-MUT1, ZWBY04RS-MUT2 and ZWBY04RS-MUT3 streaked on a solid medium plate were taken and cultured with shaking overnight in a test tube containing 5 mL of each liquid medium (30 ° C, 250 rpm, 16 hour); Cells were collected by centrifugation, transferred to a 50 mL Erlenmeyer flask containing 10 mL of liquid medium, and cultured for 4 days at 30 ° C. and 250 rpm until OD 600 reached 0.05 to obtain a fermentation product. In this method, one parallel experiment was set up for each recombinant yeast at the same time.

프로토파녹사디올 및 희귀 진세노사이드 Rh2의 추출 및 검출: 10 mL의 발효액으로부터 100 μL의 발효액을 취하고, Fastprep 진탕으로 효모를 용해시키고, 동일한 부피의 n-부탄올을 첨가 한 다음, n-부탄올을 진공 하에서 증발 건조시켰다. 100 μL의 메탄올에 용해시킨 후 HPLC로 목적 생성물의 산량을 측정하였다. HPLC 결과 도 4와 같다.Extraction and detection of protophanoxadiol and rare ginsenoside Rh2: Take 100 μL of fermentation broth from 10 mL of fermentation broth, lyse yeast with Fastprep shaking, add equal volume of n-butanol, then n-butanol Evaporate to dryness under vacuum. After dissolving in 100 μL of methanol, the acid amount of the target product was measured by HPLC. HPLC results are shown in FIG. 4 .

프로토파녹사디올을 생성하는 출아형 효모 균주에 삼칠로부터 유래된 글리코실트랜스퍼라제 유전자 UGT-MUT1을 도입하여 구축된 재조합 출아형 효모 균주 ZWBY04RS-MUT는 희귀 진세노사이드 Rh2를 합성할 수 있고, 이의 산량은 67.96 mg/L이다. 프로토파녹사디올을 생성하는 출아형 효모 균주에 삼칠로부터 유래된 글리코실트랜스퍼라제 유전자 UGT-MUT2를 도입하여 구축된 재조합 출아형 효모 균주 ZWBY04RS-MUT2는 희귀 진세노사이드 Rh2를 합성할 수 있고, 이의 산량은 78.29 mg/L이다. 프로토파녹사디올을 생성하는 출아형 효모 균주에 삼칠로부터 유래된 글리코실트랜스퍼라제 유전자 UGT-MUT3을 도입하여 구축된 재조합 출아형 효모 균주 ZWBY04RS-MUT3은 희귀 진세노사이드 Rh2를 합성할 수 있고, 이의 산량은 83.53 mg/L이다.The recombinant budding yeast strain ZWBY04RS-MUT constructed by introducing the glycosyltransferase gene UGT-MUT1 derived from Samchil into the budding yeast strain producing protopanoxadiol can synthesize the rare ginsenoside Rh2, and its The acid amount is 67.96 mg/L. The recombinant budding yeast strain ZWBY04RS-MUT2 constructed by introducing the glycosyltransferase gene UGT-MUT2 derived from Samchil into the budding yeast strain producing protopanoxadiol can synthesize the rare ginsenoside Rh2, and its The acid amount is 78.29 mg/L. The recombinant budding yeast strain ZWBY04RS-MUT3 constructed by introducing the glycosyltransferase gene UGT-MUT3 derived from Samchil into the budding yeast strain producing protopanoxadiol can synthesize the rare ginsenoside Rh2, and its The acid amount is 83.53 mg/L.

글리코실트랜스퍼라제 돌연변이체 유전자 UGT-MUT1아미노산 서열SEQ_ID_NO.35Glycosyltransferase mutant gene UGT-MUT1 amino acid sequence SEQ_ID_NO.35

MEREMLSKTHIMFIPFPAQGHMSPMMQFVKRLAWKGVRITIVLPAEIRDSMQINNSLINTECISFDFDKDDEMPYSMRAYMGVVKLKVTNKLSDLLEKQKTNGYPVNLLVVDSLYPSRVEMCHQLGVKGAPFFTHSCAVGAIYYNARLGKLKIPPEEGLTSVSLPSIPLLGRNDLPIIRTGTFPDLFEHLGNQFSDLDKADWIFFNTFDKLENEEAKWLSSHWPITSIGPLIPSMYLDKQLPNDKDNDINFYKADVGSCIKWLDAKDPGSVVYASFGSVIHNLGDDYMDEVAWGLLHSKYHFIWVVIESERTKLSSDFLAEVEAEEKGLIVSWCPQLEVLSHKSIGSFMTHCGWNSTVEALSLGVPMVAVPQQFDQPVNAKYIVDVWRIGVQVPIGENGVLLRGEVANCIKDVMEGEIGDELRGNALKWKGLAVEAMEKGGSSDKNIDEFISKLVSS MEREMLSKTHIMFIPFPAQGHMSPMMQFVKRLAWKGVRITIVLPAEIRDSMQINNSLINTECISFDFDKDDEMPYSMRAYMGVVKLKVTNKLSDLLEKQKTNGYPVNLLVVDSLYPSRVEMCHQLGVKGAPFFTHSCAVGAIYYNARLGKLKIPPEEGLTSVSLPSIPLLGRNDLPIIRTGTFPDLFEHLGNQFSDLDKADWIFFNTFDKLENEEAKWLSSHWPITSIGPLIPSMYLDKQLPNDKDNDINFYKADVGSCIKWLDAKDPGSVVYASFGSVIHNLGDDYMDEVAWGLLHSKYHFIWVVIESERTKLSSDFLAEVEAEEKGLIVSWCPQLEVLSHKSIGSFMTHCGWNSTVEALSLGVPMVAVPQQFDQPVNAKYIVDVWRIGVQVPIGENGVLLRGEVANCIKDVMEGEIGDELRGNALKWKGLAVEAMEKGGSSDKNIDEFISKLVSS

글리코실트랜스퍼라제 돌연변이체 유전자 UGT-MUT1뉴클레오티드 서열 SEQ_ID_NO.36Glycosyltransferase mutant gene UGT-MUT1 nucleotide sequence SEQ_ID_NO.36

ATGGAGAGAGAAATGTTGAGCAAAACTCACATTATGTTCATCCCATTCCCAGCTCAAGGCCACATGAGCCCAATGATGCAATTCGTCAAGCGTTTAGCCTGGAAAGGCGTGCGAATCACGATAGTTCTTCCGGCTGAGATTCGAGATTCTATGCAAATAAACAACTCATTGATCAACACTGAGTGCATCTCCTTTGATTTTGATAAAGATGATGAGATGCCATACAGCATGCGGGCTTATATGGGAGTTGTAAAGCTCAAGGTCACAAATAAACTGAGTGACCTACTCGAGAAGCAAAAAACAAATGGCTACCCTGTTAATTTGCTAGTGGTCGATTCATTATATCCATCTCGGGTAGAAATGTGCCACCAACTTGGGGTAAAAGGAGCTCCATTTTTCACTCACTCTTGTGCTGTTGGTGCCATTTATTATAATGCTCGCTTAGGGAAATTGAAGATACCTCCTGAGGAAGGGTTGACTTCTGTTTCATTGCCTTCAATTCCATTGTTGGGGAGAAATGATTTGCCAATTATTAGGACTGGCACCTTTCCTGATCTCTTTGAGCATTTGGGGAATCAGTTTTCAGATCTTGATAAAGCGGATTGGATCTTTTTCAATACTTTTGATAAGCTTGAAAATGAGGAAGCAAAATGGCTATCTAGCCATTGGCCAATTACATCCATCGGACCATTAATCCCTTCAATGTACTTAGACAAACAATTACCAAATGACAAAGACAATGACATTAATTTCTACAAGGCAGACGTCGGATCGTGCATCAAGTGGCTAGACGCCAAAGACCCTGGCTCGGTAGTCTACGCCTCATTCGGGAGCGTGATTCACAACCTCGGCGATGACTACATGGACGAAGTAGCATGGGGCTTGTTACACAGCAAATATCACTTCATATGGGTTGTTATAGAATCCGAACGTACAAAGCTCTCTAGCGATTTCTTGGCAGAGGTAGAGGCAGAGGAAAAAGGCCTAATAGTGAGTTGGTGCCCTCAACTCGAAGTTTTGTCACATAAATCTATAGGTAGTTTTATGACTCATTGTGGTTGGAACTCGACGGTTGAGGCATTGAGTTTGGGCGTGCCAATGGTGGCAGTGCCACAACAGTTTGATCAGCCTGTTAATGCCAAGTATATCGTGGATGTATGGCGAATTGGGGTTCAGGTTCCGATTGGTGAAAATGGGGTTCTTTTGAGGGGAGAAGTTGCTAACTGTATAAAGGATGTTATGGAGGGGGAAATAGGGGATGAGCTTAGAGGGAATGCTTTGAAATGGAAGGGGTTGGCTGTGGAGGCAATGGAGAAAGGGGGTAGCTCTGATAAGAATATTGATGAGTTCATTTCAAAGCTTGTTTCCTCCTGAATGGAGAGAGAAATGTTGAGCAAAACTCACATTATGTTCATCCCATTCCCAGCTCAAGGCCACATGAGCCCAATGATGCAATTCGTCAAGCGTTTAGCCTGGAAAGGCGTGCGAATCACGATAGTTCTTCCGGCTGAGATTCGAGATTCTATGCAAATAAACAACTCATTGATCAACACTGAGTGCATCTCCTTTGATTTTGATAAAGATGATGAGATGCCATACAGCATGCGGGCTTATATGGGAGTTGTAAAGCTCAAGGTCACAAATAAACTGAGTGACCTACTCGAGAAGCAAAAAACAAATGGCTACCCTGTTAATTTGCTAGTGGTCGATTCATTATATCCATCTCGGGTAGAAATGTGCCACCAACTTGGGGTAAAAGGAGCTCCATTTTTCACTCACTCTTGTGCTGTTGGTGCCATTTATTATAATGCTCGCTTAGGGAAATTGAAGATACCTCCTGAGGAAGGGTTGACTTCTGTTTCATTGCCTTCAATTCCATTGTTGGGGAGAAATGATTTGCCAATTATTAGGACTGGCACCTTTCCTGATCTCTTTGAGCATTTGGGGAATCAGTTTTCAGATCTTGATAAAGCGGATTGGATCTTTTTCAATACTTTTGATAAGCTTGAAAATGAGGAAGCAAAATGGCTATCTAGCCATTGGCCAATTACATCCATCGGACCATTAATCCCTTCAATGTACTTAGACAAACAATTACCAAATGACAAAGACAATGACATTAATTTCTACAAGGCAGACGTCGGATCGTGCATCAAGTGGCTAGACGCCAAAGACCCTGGCTCGGTAGTCTACGCCTCATTCGGGAGCGTGATTCACAACCTCGGCGATGACTACATGGACGAAGTAGCATGGGGCTTGTTACACAGCAAATATCACTTCATATGGGTTGTTATAGAATCCGAACGTACAAAGCTCTCTAGCGATTTCTTGGCAGAGGTAGAGGCAGAGGAAAAAGGCCTAATAGTGAGTTGGT GCCCTCAACTCGAAGTTTTGTCACATAAATCTATAGGTAGTTTTATGACTCATTGTGGTTGGAACTCGACGGTTGAGGCATTGAGTTTGGGCGTGCCAATGGTGGCAGTGCCACAACAGTTTGATCAGCCTGTTAATGCCAAGTATATCGTGGATGTATGGCGAATTGGGGTTCAGGTTCCGATTGGTGAAAATGGGGTTCTTTTGAGGGGAGAAGTTGCTAACTGTATAAAGGATGTTATGGAGGGGGAAATAGGGGATGAGCTTAGAGGGAATGCTTTGAAATGGAAGGGGTTGGCTGTGGAGGCAATGGAGAAAGGGGGTAGCTCTGATAAGAATATTGATGAGTTCATTTCAAAGCTTGTTTCCTCCTGA

글리코실트랜스퍼라제 돌연변이체 유전자 UGT-MUT2아미노산 서열SEQ_ID_NO.37Glycosyltransferase mutant gene UGT-MUT2 amino acid sequence SEQ_ID_NO.37

MEREMLSKTHIMFIPFPAQGHMSPMMQFVKRLAWKGVRITIVLPAEIRDSMQINNSLINTECISFDFDKDDEMPYSMRAYMGVVKLKVTNKLSDLLEKQKTNGYPVNLLVVDSLYPSRVEMCHQLGVKGAPFFTHSCAVGAIYYNARLGKLKIPPEEGLTSVSLPSIPLLGRNDLPIIRTGTFPDLFEHLGNQFSDLDKADWIFFNTFDKLENEEAKWLSSHWPITSIGPLIPSMYLDKQLPNDKDSDINFYKADVGSCIKWLDAKDPGSVVYASFGSVKHNLGDDYMDEVAWGLLHSKYHFIWVVIESERTKLSSDFLAEVEAEEKGLIVSWCPQLEVLSHKSIGSFMTHCGWNSTVEALSLGVPMVAVPQQFDQPVNAKYIVDVWRIGVQVPIGENGVLLRGEVANCIKDVMEGEIGDELRGNALKWKGLAVEAMEKGGSSDKNIDEFISKLVSSMEREMLSKTHIMFIPFPAQGHMSPMMQFVKRLAWKGVRITIVLPAEIRDSMQINNSLINTECISFDFDKDDEMPYSMRAYMGVVKLKVTNKLSDLLEKQKTNGYPVNLLVVDSLYPSRVEMCHQLGVKGAPFFTHSCAVGAIYYNARLGKLKIPPEEGLTSVSLPSIPLLGRNDLPIIRTGTFPDLFEHLGNQFSDLDKADWIFFNTFDKLENEEAKWLSSHWPITSIGPLIPSMYLDKQLPNDKDSDINFYKADVGSCIKWLDAKDPGSVVYASFGSVKHNLGDDYMDEVAWGLLHSKYHFIWVVIESERTKLSSDFLAEVEAEEKGLIVSWCPQLEVLSHKSIGSFMTHCGWNSTVEALSLGVPMVAVPQQFDQPVNAKYIVDVWRIGVQVPIGENGVLLRGEVANCIKDVMEGEIGDELRGNALKWKGLAVEAMEKGGSSDKNIDEFISKLVSS

글리코실트랜스퍼라제 돌연변이체 유전자 UGT-MUT2뉴클레오티드 서열 SEQ_ID_NO.38Glycosyltransferase mutant gene UGT-MUT2 nucleotide sequence SEQ_ID_NO.38

ATGGAGAGAGAAATGTTGAGCAAAACTCACATTATGTTCATCCCATTCCCAGCTCAAGGCCACATGAGCCCAATGATGCAATTCGTCAAGCGTTTAGCCTGGAAAGGCGTGCGAATCACGATAGTTCTTCCGGCTGAGATTCGAGATTCTATGCAAATAAACAACTCATTGATCAACACTGAGTGCATCTCCTTTGATTTTGATAAAGATGATGAGATGCCATACAGCATGCGGGCTTATATGGGAGTTGTAAAGCTCAAGGTCACAAATAAACTGAGTGACCTACTCGAGAAGCAAAAAACAAATGGCTACCCTGTTAATTTGCTAGTGGTCGATTCATTATATCCATCTCGGGTAGAAATGTGCCACCAACTTGGGGTAAAAGGAGCTCCATTTTTCACTCACTCTTGTGCTGTTGGTGCCATTTATTATAATGCTCGCTTAGGGAAATTGAAGATACCTCCTGAGGAAGGGTTGACTTCTGTTTCATTGCCTTCAATTCCATTGTTGGGGAGAAATGATTTGCCAATTATTAGGACTGGCACCTTTCCTGATCTCTTTGAGCATTTGGGGAATCAGTTTTCAGATCTTGATAAAGCGGATTGGATCTTTTTCAATACTTTTGATAAGCTTGAAAATGAGGAAGCAAAATGGCTATCTAGCCATTGGCCAATTACATCCATCGGACCATTAATCCCTTCAATGTACTTAGACAAACAATTACCAAATGACAAAGACAGCGACATTAATTTCTACAAGGCAGACGTCGGATCGTGCATCAAGTGGCTAGACGCCAAAGACCCTGGCTCGGTAGTCTACGCCTCATTCGGGAGCGTGAAGCACAACCTCGGCGATGACTACATGGACGAAGTAGCATGGGGCTTGTTACACAGCAAATATCACTTCATATGGGTTGTTATAGAATCCGAACGTACAAAGCTCTCTAGCGATTTCTTGGCAGAGGTAGAGGCAGAGGAAAAAGGCCTAATAGTGAGTTGGTGCCCTCAACTCGAAGTTTTGTCACATAAATCTATAGGTAGTTTTATGACTCATTGTGGTTGGAACTCGACGGTTGAGGCATTGAGTTTGGGCGTGCCAATGGTGGCAGTGCCACAACAGTTTGATCAGCCTGTTAATGCCAAGTATATCGTGGATGTATGGCGAATTGGGGTTCAGGTTCCGATTGGTGAAAATGGGGTTCTTTTGAGGGGAGAAGTTGCTAACTGTATAAAGGATGTTATGGAGGGGGAAATAGGGGATGAGCTTAGAGGGAATGCTTTGAAATGGAAGGGGTTGGCTGTGGAGGCAATGGAGAAAGGGGGTAGCTCTGATAAGAATATTGATGAGTTCATTTCAAAGCTTGTTTCCTCCTGAATGGAGAGAGAAATGTTGAGCAAAACTCACATTATGTTCATCCCATTCCCAGCTCAAGGCCACATGAGCCCAATGATGCAATTCGTCAAGCGTTTAGCCTGGAAAGGCGTGCGAATCACGATAGTTCTTCCGGCTGAGATTCGAGATTCTATGCAAATAAACAACTCATTGATCAACACTGAGTGCATCTCCTTTGATTTTGATAAAGATGATGAGATGCCATACAGCATGCGGGCTTATATGGGAGTTGTAAAGCTCAAGGTCACAAATAAACTGAGTGACCTACTCGAGAAGCAAAAAACAAATGGCTACCCTGTTAATTTGCTAGTGGTCGATTCATTATATCCATCTCGGGTAGAAATGTGCCACCAACTTGGGGTAAAAGGAGCTCCATTTTTCACTCACTCTTGTGCTGTTGGTGCCATTTATTATAATGCTCGCTTAGGGAAATTGAAGATACCTCCTGAGGAAGGGTTGACTTCTGTTTCATTGCCTTCAATTCCATTGTTGGGGAGAAATGATTTGCCAATTATTAGGACTGGCACCTTTCCTGATCTCTTTGAGCATTTGGGGAATCAGTTTTCAGATCTTGATAAAGCGGATTGGATCTTTTTCAATACTTTTGATAAGCTTGAAAATGAGGAAGCAAAATGGCTATCTAGCCATTGGCCAATTACATCCATCGGACCATTAATCCCTTCAATGTACTTAGACAAACAATTACCAAATGACAAAGACAGCGACATTAATTTCTACAAGGCAGACGTCGGATCGTGCATCAAGTGGCTAGACGCCAAAGACCCTGGCTCGGTAGTCTACGCCTCATTCGGGAGCGTGAAGCACAACCTCGGCGATGACTACATGGACGAAGTAGCATGGGGCTTGTTACACAGCAAATATCACTTCATATGGGTTGTTATAGAATCCGAACGTACAAAGCTCTCTAGCGATTTCTTGGCAGAGGTAGAGGCAGAGGAAAAAGGCCTAATAGTGAGTTGGT GCCCTCAACTCGAAGTTTTGTCACATAAATCTATAGGTAGTTTTATGACTCATTGTGGTTGGAACTCGACGGTTGAGGCATTGAGTTTGGGCGTGCCAATGGTGGCAGTGCCACAACAGTTTGATCAGCCTGTTAATGCCAAGTATATCGTGGATGTATGGCGAATTGGGGTTCAGGTTCCGATTGGTGAAAATGGGGTTCTTTTGAGGGGAGAAGTTGCTAACTGTATAAAGGATGTTATGGAGGGGGAAATAGGGGATGAGCTTAGAGGGAATGCTTTGAAATGGAAGGGGTTGGCTGTGGAGGCAATGGAGAAAGGGGGTAGCTCTGATAAGAATATTGATGAGTTCATTTCAAAGCTTGTTTCCTCCTGA

글리코실트랜스퍼라제 돌연변이체 유전자 UGT-MUT3아미노산 서열SEQ_ID_NO.39Glycosyltransferase mutant gene UGT-MUT3 amino acid sequence SEQ_ID_NO.39

MEREMLSKTHIMFIPFPAQGHMSPMMQFVKRLAWKGVRITIVLPAEIRDSMQINNSLINTECISFDFDKDDEMPYSMRAYMGVVKLKVTNKLSDLLEKQKTNGYPVNLLVVDSLYPSRVEMCHQLGVKGAPFFTHSCAVGAIYYNARLGKLKIPPEEGLTSVSLPSIPLLGRNDLPIIRTGTFPDLFEHLGNQFSDLDKADWIFFNTFDKLENEEAKWLSSHWPITSIGPLIPSMYLDKQLPNDKDSDINFYKADVGSCIKWLDAKDPGSVVYASFGSVIHNLGDDYMDEVAWGLLHSKYHFIWVVIESERTKLSSDFLAEVEAEEKGLIVSWCPQLEVLSHKSIGSFMTHCGWNSTVEALSLGVPMVAVPQQFDQPVNAKYIVDVWRIGVQVPIGENGVLLRGEVANCIKDVMEGEIGDELRGNALKWKGLAVEAMEKGGSSDKNIDEFISKLVSS MEREMLSKTHIMFIPFPAQGHMSPMMQFVKRLAWKGVRITIVLPAEIRDSMQINNSLINTECISFDFDKDDEMPYSMRAYMGVVKLKVTNKLSDLLEKQKTNGYPVNLLVVDSLYPSRVEMCHQLGVKGAPFFTHSCAVGAIYYNARLGKLKIPPEEGLTSVSLPSIPLLGRNDLPIIRTGTFPDLFEHLGNQFSDLDKADWIFFNTFDKLENEEAKWLSSHWPITSIGPLIPSMYLDKQLPNDKDSDINFYKADVGSCIKWLDAKDPGSVVYASFGSVIHNLGDDYMDEVAWGLLHSKYHFIWVVIESERTKLSSDFLAEVEAEEKGLIVSWCPQLEVLSHKSIGSFMTHCGWNSTVEALSLGVPMVAVPQQFDQPVNAKYIVDVWRIGVQVPIGENGVLLRGEVANCIKDVMEGEIGDELRGNALKWKGLAVEAMEKGGSSDKNIDEFISKLVSS

글리코실트랜스퍼라제 돌연변이체 유전자 UGT-MUT3뉴클레오티드 서열 SEQ_ID_NO.40Glycosyltransferase mutant gene UGT-MUT3 nucleotide sequence SEQ_ID_NO.40

ATGGAGAGAGAAATGTTGAGCAAAACTCACATTATGTTCATCCCATTCCCAGCTCAAGGCCACATGAGCCCAATGATGCAATTCGTCAAGCGTTTAGCCTGGAAAGGCGTGCGAATCACGATAGTTCTTCCGGCTGAGATTCGAGATTCTATGCAAATAAACAACTCATTGATCAACACTGAGTGCATCTCCTTTGATTTTGATAAAGATGATGAGATGCCATACAGCATGCGGGCTTATATGGGAGTTGTAAAGCTCAAGGTCACAAATAAACTGAGTGACCTACTCGAGAAGCAAAAAACAAATGGCTACCCTGTTAATTTGCTAGTGGTCGATTCATTATATCCATCTCGGGTAGAAATGTGCCACCAACTTGGGGTAAAAGGAGCTCCATTTTTCACTCACTCTTGTGCTGTTGGTGCCATTTATTATAATGCTCGCTTAGGGAAATTGAAGATACCTCCTGAGGAAGGGTTGACTTCTGTTTCATTGCCTTCAATTCCATTGTTGGGGAGAAATGATTTGCCAATTATTAGGACTGGCACCTTTCCTGATCTCTTTGAGCATTTGGGGAATCAGTTTTCAGATCTTGATAAAGCGGATTGGATCTTTTTCAATACTTTTGATAAGCTTGAAAATGAGGAAGCAAAATGGCTATCTAGCCATTGGCCAATTACATCCATCGGACCATTAATCCCTTCAATGTACTTAGACAAACAATTACCAAATGACAAAGACAGCGACATTAATTTCTACAAGGCAGACGTCGGATCGTGCATCAAGTGGCTAGACGCCAAAGACCCTGGCTCGGTAGTCTACGCCTCATTCGGGAGCGTGATTCACAACCTCGGCGATGACTACATGGACGAAGTAGCATGGGGCTTGTTACACAGCAAATATCACTTCATATGGGTTGTTATAGAATCCGAACGTACAAAGCTCTCTAGCGATTTCTTGGCAGAGGTAGAGGCAGAGGAAAAAGGCCTAATAGTGAGTTGGTGCCCTCAACTCGAAGTTTTGTCACATAAATCTATAGGTAGTTTTATGACTCATTGTGGTTGGAACTCGACGGTTGAGGCATTGAGTTTGGGCGTGCCAATGGTGGCAGTGCCACAACAGTTTGATCAGCCTGTTAATGCCAAGTATATCGTGGATGTATGGCGAATTGGGGTTCAGGTTCCGATTGGTGAAAATGGGGTTCTTTTGAGGGGAGAAGTTGCTAACTGTATAAAGGATGTTATGGAGGGGGAAATAGGGGATGAGCTTAGAGGGAATGCTTTGAAATGGAAGGGGTTGGCTGTGGAGGCAATGGAGAAAGGGGGTAGCTCTGATAAGAATATTGATGAGTTCATTTCAAAGCTTGTTTCCTCCTAAATGGAGAGAGAAATGTTGAGCAAAACTCACATTATGTTCATCCCATTCCCAGCTCAAGGCCACATGAGCCCAATGATGCAATTCGTCAAGCGTTTAGCCTGGAAAGGCGTGCGAATCACGATAGTTCTTCCGGCTGAGATTCGAGATTCTATGCAAATAAACAACTCATTGATCAACACTGAGTGCATCTCCTTTGATTTTGATAAAGATGATGAGATGCCATACAGCATGCGGGCTTATATGGGAGTTGTAAAGCTCAAGGTCACAAATAAACTGAGTGACCTACTCGAGAAGCAAAAAACAAATGGCTACCCTGTTAATTTGCTAGTGGTCGATTCATTATATCCATCTCGGGTAGAAATGTGCCACCAACTTGGGGTAAAAGGAGCTCCATTTTTCACTCACTCTTGTGCTGTTGGTGCCATTTATTATAATGCTCGCTTAGGGAAATTGAAGATACCTCCTGAGGAAGGGTTGACTTCTGTTTCATTGCCTTCAATTCCATTGTTGGGGAGAAATGATTTGCCAATTATTAGGACTGGCACCTTTCCTGATCTCTTTGAGCATTTGGGGAATCAGTTTTCAGATCTTGATAAAGCGGATTGGATCTTTTTCAATACTTTTGATAAGCTTGAAAATGAGGAAGCAAAATGGCTATCTAGCCATTGGCCAATTACATCCATCGGACCATTAATCCCTTCAATGTACTTAGACAAACAATTACCAAATGACAAAGACAGCGACATTAATTTCTACAAGGCAGACGTCGGATCGTGCATCAAGTGGCTAGACGCCAAAGACCCTGGCTCGGTAGTCTACGCCTCATTCGGGAGCGTGATTCACAACCTCGGCGATGACTACATGGACGAAGTAGCATGGGGCTTGTTACACAGCAAATATCACTTCATATGGGTTGTTATAGAATCCGAACGTACAAAGCTCTCTAGCGATTTCTTGGCAGAGGTAGAGGCAGAGGAAAAAGGCCTAATAGTGAGTTGGT GCCCTCAACTCGAAGTTTTGTCACATAAATCTATAGGTAGTTTTATGACTCATTGTGGTTGGAACTCGACGGTTGAGGCATTGAGTTTGGGCGTGCCAATGGTGGCAGTGCCACAACAGTTTGATCAGCCTGTTAATGCCAAGTATATCGTGGATGTATGGCGAATTGGGGTTCAGGTTCCGATTGGTGAAAATGGGGTTCTTTTGAGGGGAGAAGTTGCTAACTGTATAAAGGATGTTATGGAGGGGGAAATAGGGGATGAGCTTAGAGGGAATGCTTTGAAATGGAAGGGGTTGGCTGTGGAGGCAATGGAGAAAGGGGGTAGCTCTGATAAGAATATTGATGAGTTCATTTCAAAGCTTGTTTCCTCCTAA

토론debate

현재, 연구진은 인삼, 화기삼 및 삼칠의 전사체 분석을 대량의 글리코실트랜스퍼라제 후보 유전자를 발견하였으나, 극소수의 글리코실트랜스퍼라제만이 진세노사이드의 합성에 관여하는 것으로 확인되었다. 삼칠에서 진세노사이드 합성에 관여하는 글리코실트랜스퍼라제 지금까지 보고되지 않았다. 삼칠 또한 동일한 진세노사이드를 합성하기 때문에, 삼칠로부터 유래된 글리코실트랜스퍼라제는 한편으로 이 두 가지 식물이 진세노사이드를 합성하는 합섭 경로를 더 잘 이해할 수 있도록 하고, 다른 한편으로 진세노사이드의 합성 생물학 연구에 보다 풍부한 성분을 제공할 수있어, 중요한 의미가 있다.Currently, the research team found a large number of glycosyltransferase candidate genes through transcriptomic analysis of ginseng, Hwagisam and ginseng, but only a very small number of glycosyltransferases were found to be involved in the synthesis of ginsenosides. A glycosyltransferase involved in ginsenoside synthesis in Samchil has not been reported so far. Since ginseng also synthesizes the same ginsenosides, glycosyltransferase derived from ginsenosides, on the one hand, allows these two plants to better understand the convolutional pathway for synthesizing ginsenosides, and on the other hand, the synthesis of ginsenosides It can provide a richer component to synthetic biology research, which has important implications.

본 발명에서 언급되는 모든 문헌은 본원 발명에서 각각의 문헌이 단독으로 참조로 인용되는 것처럼 참조로 인용된다. 이 외에 본 발명의 상기 내용을 열독한 후, 당업자는 본 발명에 대하여 다양한 변경 또는 수정을 할 수 있으며, 이런한 등가 형식도 본원에 첨부된 특허청구범위에 의해 한정된 범위에 속하는 것을 이해하여야 한다.All publications mentioned herein are incorporated herein by reference as if each publication was incorporated by reference in its entirety. In addition, after reading the above content of the present invention, those skilled in the art may make various changes or modifications to the present invention, and it should be understood that such equivalent forms also fall within the scope defined by the claims appended hereto.

<110> SHANGHAI INSTITUTES FOR BIOLOGICAL SCIENCES, CHINESE ACADEMY OF SCIENCES <120> glycosyltransferase, mutant, and application thereof <130> PIPB194370CN <150> CN 201710344730.7 <151> 2017-05-16 <160> 42 <170> KoPatentIn 3.0 <210> 1 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer Forward <400> 1 atggagagag aaatgttgag ca 22 <210> 2 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer reverse <400> 2 tcaggaggaa acaagctttg aa 22 <210> 3 <211> 1368 <212> DNA <213> Artificial Sequence <220> <223> Pn50 necleotide sequence <400> 3 atggagagag aaatgttgag caaaactcac attatgttca tcccattccc agctcaaggc 60 cacatgagcc caatgatgca attcgtcaag cgtttagcct ggaaaggcgt gcgaatcacg 120 atagttcttc cggctgagat tcgagattct atgcaaataa acaactcatt gatcaacact 180 gagtgcatct cctttgattt tgataaagat gatgagatgc catacagcat gcgggcttat 240 atgggagttg taaagctcaa ggtcacaaat aaactgagtg acctactcga gaagcaaaaa 300 acaaatggct accctgttaa tttgctagtg gtcgattcat tatatccatc tcgggtagaa 360 atgtgccacc aacttggggt aaaaggagct ccatttttca ctcactcttg tgctgttggt 420 gccatttatt ataatgctcg cttagggaaa ttgaagatac ctcctgagga agggttgact 480 tctgtttcat tgccttcaat tccattgttg gggagaaatg atttgccaat tattaggact 540 ggcacctttc ctgatctctt tgagcatttg gggaatcagt tttcagatct tgataaagcg 600 gattggatct ttttcaatac ttttgataag cttgaaaatg aggaagcaaa atggctatct 660 agccaatggc caattacatc catcggacca ttaatccctt caatgtactt agacaaacaa 720 ttaccaaatg acaaagacaa tgacattaat ttctacaagg cagacgtcgg atcgtgcatc 780 aagtggctag acgccaaaga ccctggctcg gtagtctacg cctcattcgg gagcgtgaag 840 cacaacctcg gcgatgacta catggacgaa gtagcatggg gcttgttaca cagcaaatat 900 cacttcatat gggttgttat agaatccgaa cgtacaaagc tctctagcga tttcttggca 960 gaggcagagg aaaaaggcct aatagtgagt tggtgccctc aactcgaagt tttgtcacat 1020 aaatctatag gtagttttat gactcattgt ggttggaact cgacggttga ggcattgagt 1080 ttgggcgtgc caatggtggc agtgccacaa cagtttgatc agcctgttaa tgccaagtat 1140 atcgtggatg tatggcgaat tggggttcag gttccgattg gtgaaaatgg ggttcttttg 1200 aggggagaag ttgctaactg tataaaggat gttatggagg gggaaatagg ggatgagctt 1260 agagggaatg ctttgaaatg gaaggggttg gctgtggagg caatggagaa agggggtagc 1320 tctgataaga atattgatga gttcatttca aagcttgttt cctcctga 1368 <210> 4 <211> 455 <212> PRT <213> Artificial Sequence <220> <223> Pn50 amino acid sequence <400> 4 Met Glu Arg Glu Met Leu Ser Lys Thr His Ile Met Phe Ile Pro Phe 1 5 10 15 Pro Ala Gln Gly His Met Ser Pro Met Met Gln Phe Val Lys Arg Leu 20 25 30 Ala Trp Lys Gly Val Arg Ile Thr Ile Val Leu Pro Ala Glu Ile Arg 35 40 45 Asp Ser Met Gln Ile Asn Asn Ser Leu Ile Asn Thr Glu Cys Ile Ser 50 55 60 Phe Asp Phe Asp Lys Asp Asp Glu Met Pro Tyr Ser Met Arg Ala Tyr 65 70 75 80 Met Gly Val Val Lys Leu Lys Val Thr Asn Lys Leu Ser Asp Leu Leu 85 90 95 Glu Lys Gln Lys Thr Asn Gly Tyr Pro Val Asn Leu Leu Val Val Asp 100 105 110 Ser Leu Tyr Pro Ser Arg Val Glu Met Cys His Gln Leu Gly Val Lys 115 120 125 Gly Ala Pro Phe Phe Thr His Ser Cys Ala Val Gly Ala Ile Tyr Tyr 130 135 140 Asn Ala Arg Leu Gly Lys Leu Lys Ile Pro Pro Glu Glu Gly Leu Thr 145 150 155 160 Ser Val Ser Leu Pro Ser Ile Pro Leu Leu Gly Arg Asn Asp Leu Pro 165 170 175 Ile Ile Arg Thr Gly Thr Phe Pro Asp Leu Phe Glu His Leu Gly Asn 180 185 190 Gln Phe Ser Asp Leu Asp Lys Ala Asp Trp Ile Phe Phe Asn Thr Phe 195 200 205 Asp Lys Leu Glu Asn Glu Glu Ala Lys Trp Leu Ser Ser Gln Trp Pro 210 215 220 Ile Thr Ser Ile Gly Pro Leu Ile Pro Ser Met Tyr Leu Asp Lys Gln 225 230 235 240 Leu Pro Asn Asp Lys Asp Asn Asp Ile Asn Phe Tyr Lys Ala Asp Val 245 250 255 Gly Ser Cys Ile Lys Trp Leu Asp Ala Lys Asp Pro Gly Ser Val Val 260 265 270 Tyr Ala Ser Phe Gly Ser Val Lys His Asn Leu Gly Asp Asp Tyr Met 275 280 285 Asp Glu Val Ala Trp Gly Leu Leu His Ser Lys Tyr His Phe Ile Trp 290 295 300 Val Val Ile Glu Ser Glu Arg Thr Lys Leu Ser Ser Asp Phe Leu Ala 305 310 315 320 Glu Ala Glu Glu Lys Gly Leu Ile Val Ser Trp Cys Pro Gln Leu Glu 325 330 335 Val Leu Ser His Lys Ser Ile Gly Ser Phe Met Thr His Cys Gly Trp 340 345 350 Asn Ser Thr Val Glu Ala Leu Ser Leu Gly Val Pro Met Val Ala Val 355 360 365 Pro Gln Gln Phe Asp Gln Pro Val Asn Ala Lys Tyr Ile Val Asp Val 370 375 380 Trp Arg Ile Gly Val Gln Val Pro Ile Gly Glu Asn Gly Val Leu Leu 385 390 395 400 Arg Gly Glu Val Ala Asn Cys Ile Lys Asp Val Met Glu Gly Glu Ile 405 410 415 Gly Asp Glu Leu Arg Gly Asn Ala Leu Lys Trp Lys Gly Leu Ala Val 420 425 430 Glu Ala Met Glu Lys Gly Gly Ser Ser Asp Lys Asn Ile Asp Glu Phe 435 440 445 Ile Ser Lys Leu Val Ser Ser 450 455 <210> 5 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Pn50 expression Primer Forward <400> 5 ggatccatgg agagagaaat gttgagca 28 <210> 6 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Pn50 expression Primer reverse <400> 6 ctcgagtcag gaggaaacaa gctttgaa 28 <210> 7 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> promoter Primer Forward <400> 7 tagctctgat aagaatattg atgagttcat ttcaaagctt gtttcctcct gagatt 56 <210> 8 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> promoter Primer reverse <400> 8 actgtcaagg agggtattct gggcctccat gtcgctgcta tataacagtt gaaatttgga 60 taagaacat 69 <210> 9 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> ORF Primer Forward <400> 9 gctatactgc tgtcgattcg atactaacgc cgccatccag tgtcgagaat tacaatagt 59 <210> 10 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> ORF Primer reverse <400> 10 tctggtgagg atttacggta tgatcatgct ggtaagcttc gtta 44 <210> 11 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> terminator Primer Forward <400> 11 gaaaagaaga taatattttt atataattat attaatctca ggaggaaaca agctttgaa 59 <210> 12 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> terminator Primer reverse <400> 12 gcatagcaat ctaatctaag ttttaattac aaaatggaga gagaaatgtt gagcaaaac 59 <210> 13 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> selection marker Primer Forward <400> 13 cgcgttgaga agatgttctt atccaaattt caactgttat atagcagcga 50 <210> 14 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> selection marker Primer reverse <400> 14 ttacttcttg cagacatcag acatactatt gtaattctcg acactggatg gcggcgtta 59 <210> 15 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Upstream homology arm primer Forward <400> 15 ggctgtcgcc attcaagagc agatagcttc aaaatgtttc tactcctttt ttactcttc 59 <210> 16 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Upstream homology arm Primer reverse <400> 16 cataatgtga gttttgctca acatttctct ctccattttg taattaaaac ttagattag 59 <210> 17 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> downstream homology arm Primer Forward <400> 17 cccaaagcta agagtcccat tttattc 27 <210> 18 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> downstream homology arm Primer reverse <400> 18 gagtagaaac attttgaagc tatctgctct tgaatggcga cagcctattg ccccagtgt 59 <210> 19 <211> 457 <212> PRT <213> Artificial Sequence <220> <223> UGTPg45 amino acid sequence <400> 19 Met Glu Arg Glu Met Leu Ser Lys Thr His Ile Met Phe Ile Pro Phe 1 5 10 15 Pro Ala Gln Gly His Met Ser Pro Met Met Gln Phe Ala Lys Arg Leu 20 25 30 Ala Trp Lys Gly Leu Arg Ile Thr Ile Val Leu Pro Ala Gln Ile Arg 35 40 45 Asp Phe Met Gln Ile Thr Asn Pro Leu Ile Asn Thr Glu Cys Ile Ser 50 55 60 Phe Asp Phe Asp Lys Asp Asp Gly Met Pro Tyr Ser Met Gln Ala Tyr 65 70 75 80 Met Gly Val Val Lys Leu Lys Val Thr Asn Lys Leu Ser Asp Leu Leu 85 90 95 Glu Lys Gln Arg Thr Asn Gly Tyr Pro Val Asn Leu Leu Val Val Asp 100 105 110 Ser Leu Tyr Pro Ser Arg Val Glu Met Cys His Gln Leu Gly Val Lys 115 120 125 Gly Ala Pro Phe Phe Thr His Ser Cys Ala Val Gly Ala Ile Tyr Tyr 130 135 140 Asn Ala Arg Leu Gly Lys Leu Lys Ile Pro Pro Glu Glu Gly Leu Thr 145 150 155 160 Ser Val Ser Leu Pro Ser Ile Pro Leu Leu Gly Arg Asp Asp Leu Pro 165 170 175 Ile Ile Arg Thr Gly Thr Phe Pro Asp Leu Phe Glu His Leu Gly Asn 180 185 190 Gln Phe Ser Asp Leu Asp Lys Ala Asp Trp Ile Phe Phe Asn Thr Phe 195 200 205 Asp Lys Leu Glu Asn Glu Glu Ala Lys Trp Leu Ser Ser Gln Trp Pro 210 215 220 Ile Thr Ser Ile Gly Pro Leu Ile Pro Ser Met Tyr Leu Asp Lys Gln 225 230 235 240 Leu Pro Asn Asp Lys Asp Asn Gly Ile Asn Phe Tyr Lys Ala Asp Val 245 250 255 Gly Ser Cys Ile Lys Trp Leu Asp Ala Lys Asp Pro Gly Ser Val Val 260 265 270 Tyr Ala Ser Phe Gly Ser Val Lys His Asn Leu Gly Asp Asp Tyr Met 275 280 285 Asp Glu Val Ala Trp Gly Leu Leu His Ser Lys Tyr His Phe Ile Trp 290 295 300 Val Val Ile Glu Ser Glu Arg Thr Lys Leu Ser Ser Asp Phe Leu Ala 305 310 315 320 Glu Ala Glu Ala Glu Glu Lys Gly Leu Ile Val Ser Trp Cys Pro Gln 325 330 335 Leu Gln Val Leu Ser His Lys Ser Ile Gly Ser Phe Met Thr His Cys 340 345 350 Gly Trp Asn Ser Thr Val Glu Ala Leu Ser Leu Gly Val Pro Met Val 355 360 365 Ala Leu Pro Gln Gln Phe Asp Gln Pro Ala Asn Ala Lys Tyr Ile Val 370 375 380 Asp Val Trp Gln Ile Gly Val Arg Val Pro Ile Gly Glu Glu Gly Val 385 390 395 400 Val Leu Arg Gly Glu Val Ala Asn Cys Ile Lys Asp Val Met Glu Gly 405 410 415 Glu Ile Gly Asp Glu Leu Arg Gly Asn Ala Leu Lys Trp Lys Gly Leu 420 425 430 Ala Val Glu Ala Met Glu Lys Gly Gly Ser Ser Asp Lys Asn Ile Asp 435 440 445 Glu Phe Ile Ser Lys Leu Val Ser Ser 450 455 <210> 20 <211> 1374 <212> DNA <213> Artificial Sequence <220> <223> UGTPg45 nucleotide sequence <400> 20 atggagagag aaatgttgag caaaactcac attatgttca tcccattccc agctcaaggc 60 cacatgagcc caatgatgca attcgccaag cgtttagcct ggaaaggcct gcgaatcacg 120 atagttcttc cggctcaaat tcgagatttc atgcaaataa ccaacccatt gatcaacact 180 gagtgcatct cctttgattt tgataaagac gatgggatgc catacagcat gcaggcttat 240 atgggagttg taaaactcaa ggtcacaaat aaactgagtg acctactcga gaagcaaaga 300 acaaatggct accctgttaa tttgctagtg gttgattcat tatatccatc tcgggtagaa 360 atgtgccacc aacttggggt aaaaggagct ccatttttca ctcactcttg tgctgttggt 420 gccatttatt ataatgctcg cttagggaaa ttgaagatac ctcctgagga agggttgact 480 tctgtttcat tgccttcaat tccattgttg gggagagatg atttgccaat tattaggact 540 ggcacctttc ctgatctctt tgagcatttg gggaatcagt tttcagatct tgataaagcg 600 gattggatct ttttcaatac ttttgataag cttgaaaatg aggaagcaaa atggctatct 660 agccaatggc caattacatc catcggacca ttaatccctt caatgtactt agacaaacaa 720 ttaccaaatg acaaagacaa tggcattaat ttctacaagg cagacgtcgg atcgtgcatc 780 aagtggctag acgccaaaga ccctggctcg gtagtctacg cctcattcgg gagcgtgaag 840 cacaacctcg gcgatgacta catggacgaa gtagcatggg gcttgttaca tagcaaatat 900 cacttcatat gggttgttat agaatccgaa cgtacaaagc tctctagcga tttcttggca 960 gaggcagagg cagaggaaaa aggcctaata gtgagttggt gccctcaact ccaagttttg 1020 tcacataaat ctatagggag ttttatgact cattgtggtt ggaactcgac ggttgaggca 1080 ttgagtttgg gcgtgccaat ggtggcactg ccacaacagt ttgatcagcc tgctaatgcc 1140 aagtatatcg tggatgtatg gcaaattggg gttcgggttc cgattggtga agagggggtt 1200 gttttgaggg gagaagttgc taactgtata aaggatgtta tggaggggga aataggggat 1260 gagcttagag ggaatgcttt gaaatggaag gggttggctg tggaggcaat ggagaaaggg 1320 ggtagctctg ataagaatat tgatgagttc atttcaaagc ttgtttcctc ctga 1374 <210> 21 <211> 457 <212> PRT <213> Artificial Sequence <220> <223> 8E7 amino acid sequence <400> 21 Met Glu Arg Glu Met Leu Ser Lys Thr His Ile Met Phe Ile Pro Phe 1 5 10 15 Pro Ala Gln Gly His Met Ser Pro Met Met Gln Phe Ala Lys Arg Leu 20 25 30 Ala Trp Lys Gly Leu Arg Ile Thr Ile Val Leu Pro Ala Gln Ile Arg 35 40 45 Asp Phe Met Gln Ile Thr Asn Pro Leu Ile Asn Thr Glu Cys Ile Ser 50 55 60 Phe Asp Phe Asp Lys Asp Asp Gly Met Pro Tyr Ser Met Gln Ala Tyr 65 70 75 80 Met Gly Val Val Lys Leu Lys Val Thr Asn Lys Leu Ser Asp Leu Leu 85 90 95 Glu Lys Gln Arg Thr Asn Gly Tyr Pro Val Asn Leu Leu Val Val Asp 100 105 110 Ser Leu Tyr Pro Ser Arg Val Glu Met Cys His Gln Leu Gly Val Lys 115 120 125 Gly Ala Pro Phe Phe Thr His Ser Cys Ala Val Gly Ala Ile Tyr Tyr 130 135 140 Asn Ala Arg Leu Gly Lys Leu Lys Ile Pro Pro Glu Glu Gly Leu Thr 145 150 155 160 Ser Val Ser Leu Pro Ser Ile Pro Leu Leu Gly Arg Asp Asp Leu Pro 165 170 175 Ile Ile Arg Thr Gly Thr Phe Pro Asp Leu Phe Glu His Leu Gly Asn 180 185 190 Gln Phe Ser Asp Leu Asp Lys Ala Asp Trp Ile Phe Phe Asn Thr Phe 195 200 205 Asp Lys Leu Glu Asn Glu Glu Ala Lys Trp Leu Ser Ser His Trp Pro 210 215 220 Ile Thr Ser Ile Gly Pro Leu Ile Pro Ser Met Tyr Leu Asp Lys Gln 225 230 235 240 Leu Pro Asn Asp Lys Asp Asn Gly Ile Asn Phe Tyr Lys Ala Asp Val 245 250 255 Gly Ser Cys Ile Lys Trp Leu Asp Ala Lys Asp Pro Gly Ser Val Val 260 265 270 Tyr Ala Ser Phe Gly Ser Val Lys His Asn Leu Gly Asp Asp Tyr Met 275 280 285 Asp Glu Val Ala Trp Gly Leu Leu His Ser Lys Tyr His Phe Ile Trp 290 295 300 Val Val Ile Glu Ser Glu Arg Thr Lys Leu Ser Ser Asp Phe Leu Ala 305 310 315 320 Glu Val Glu Ala Glu Glu Lys Gly Leu Ile Val Ser Trp Cys Pro Gln 325 330 335 Leu Gln Val Leu Ser His Lys Ser Ile Gly Ser Phe Met Thr His Cys 340 345 350 Gly Trp Asn Ser Thr Val Glu Ala Leu Ser Leu Gly Val Pro Met Val 355 360 365 Ala Leu Pro Gln Gln Phe Asp Gln Pro Ala Asn Ala Lys Tyr Ile Val 370 375 380 Asp Val Trp Gln Ile Gly Val Arg Val Pro Ile Gly Glu Glu Gly Val 385 390 395 400 Val Leu Arg Gly Glu Val Ala Asn Cys Ile Lys Asp Val Met Glu Gly 405 410 415 Glu Ile Gly Asp Glu Leu Arg Gly Asn Ala Leu Lys Trp Lys Gly Leu 420 425 430 Ala Val Glu Ala Met Glu Lys Gly Gly Ser Ser Asp Lys Asn Ile Asp 435 440 445 Glu Phe Ile Ser Lys Leu Val Ser Ser 450 455 <210> 22 <211> 1374 <212> DNA <213> Artificial Sequence <220> <223> 8E7 nucleotide sequence <400> 22 atggagagag aaatgttgag caaaactcac attatgttca tcccattccc agctcaaggc 60 cacatgagcc caatgatgca attcgccaag cgtttagcct ggaaaggcct gcgaatcacg 120 atagttcttc cggctcaaat tcgagatttc atgcaaataa ccaacccatt gatcaacact 180 gagtgcatct cctttgattt tgataaagac gatgggatgc catacagcat gcaggcttat 240 atgggagttg taaaactcaa ggtcacaaat aaactgagtg acctactcga gaagcaaaga 300 acaaatggct accctgttaa tttgctagtg gttgattcat tatatccatc tcgggtagaa 360 atgtgccacc aacttggggt aaaaggagct ccatttttca ctcactcttg tgctgttggt 420 gccatttatt ataatgctcg cttagggaaa ttgaagatac ctcctgagga agggttgact 480 tctgtttcat tgccttcaat tccattgttg gggagagatg atttgccaat tattaggact 540 ggcacctttc ctgatctctt tgagcatttg gggaatcagt tttcagatct tgataaagcg 600 gattggatct ttttcaatac ttttgataag cttgaaaatg aggaagcaaa atggctatct 660 agccattggc caattacatc catcggacca ttaatccctt caatgtactt agacaaacaa 720 ttaccaaatg acaaagacaa tggcattaat ttctacaagg cagacgtcgg atcgtgcatc 780 aagtggctag acgccaaaga ccctggctcg gtagtctacg cctcattcgg gagcgtgaag 840 cacaacctcg gcgatgacta catggacgaa gtagcatggg gcttgttaca tagcaaatat 900 cacttcatat gggttgttat agaatccgaa cgtacaaagc tctctagcga tttcttggca 960 gaggtagagg cagaggaaaa aggcctaata gtgagttggt gccctcaact ccaagttttg 1020 tcacataaat ctatagggag ttttatgact cattgtggtt ggaactcgac ggttgaggca 1080 ttgagtttgg gcgtgccaat ggtggcactg ccacaacagt ttgatcagcc tgctaatgcc 1140 aagtatatcg tggatgtatg gcaaattggg gttcgggttc cgattggtga agagggggtt 1200 gttttgaggg gagaagttgc taactgtata aaggatgtta tggaggggga aataggggat 1260 gagcttagag ggaatgcttt gaaatggaag gggttggctg tggaggcaat ggagaaaggg 1320 ggtagctctg ataagaatat tgatgagttc atttcaaagc ttgtttcctc ctga 1374 <210> 23 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> UGTPg45 random mutation Primer Forward <400> 23 gcatagcaat ctaatctaag ttttaattac aaaatggaga gagaaatgtt gagcaaaac 59 <210> 24 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> UGTPg45 random mutation Primer reverse <400> 24 gaaaagaaga taatattttt atataattat attaatctca ggaggaaaca agctttgaa 59 <210> 25 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> fragment 7 Primer Forward <400> 25 acactggggc aataggctgt cgccattcaa gagcagatag cttcaaaatg tttctactc 59 <210> 26 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> fragment 7 Primer reverse <400> 26 cataatgtga gttttgctca acatttctct ctccattttg taattaaaac ttagattag 59 <210> 27 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> fragment 8 Primer Forward <400> 27 ttgatgagtt catttcaaag cttgtttcct cctgagatta atataattat ataaaaata 59 <210> 28 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> fragment 8 Primer reverse <400> 28 actgtcaagg agggtattct gggcctccat gtcgctgcta tataacagtt gaaatttgg 59 <210> 29 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> fragment 9 Primer Forward <400> 29 cccaaagcta agagtcccat tttattc 27 <210> 30 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> fragment 9 Primer reverse <400> 30 gaagagtaaa aaaggagtag aaacattttg aagctatctg ctcttgaatg gcgacagcc 59 <210> 31 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> fragment 10 Primer Forward <400> 31 tgtcgattcg atactaacgc cgccatccag tgtcgagaat tacaatagta tgtctgatg 59 <210> 32 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> fragment 10 Primer reverse <400> 32 tctggtgagg atttacggta tg 22 <210> 33 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> fragment 11 Primer Forward <400> 33 aagatgttct tatccaaatt tcaactgtta tatagcagcg acatggaggc ccagaatac 59 <210> 34 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> fragment 11 Primer reverse <400> 34 tacttcttgc agacatcaga catactattg taattctcga cactggatgg cggcgttag 59 <210> 35 <211> 457 <212> PRT <213> Artificial Sequence <220> <223> UGT-MUT1 amino acid sequence <400> 35 Met Glu Arg Glu Met Leu Ser Lys Thr His Ile Met Phe Ile Pro Phe 1 5 10 15 Pro Ala Gln Gly His Met Ser Pro Met Met Gln Phe Val Lys Arg Leu 20 25 30 Ala Trp Lys Gly Val Arg Ile Thr Ile Val Leu Pro Ala Glu Ile Arg 35 40 45 Asp Ser Met Gln Ile Asn Asn Ser Leu Ile Asn Thr Glu Cys Ile Ser 50 55 60 Phe Asp Phe Asp Lys Asp Asp Glu Met Pro Tyr Ser Met Arg Ala Tyr 65 70 75 80 Met Gly Val Val Lys Leu Lys Val Thr Asn Lys Leu Ser Asp Leu Leu 85 90 95 Glu Lys Gln Lys Thr Asn Gly Tyr Pro Val Asn Leu Leu Val Val Asp 100 105 110 Ser Leu Tyr Pro Ser Arg Val Glu Met Cys His Gln Leu Gly Val Lys 115 120 125 Gly Ala Pro Phe Phe Thr His Ser Cys Ala Val Gly Ala Ile Tyr Tyr 130 135 140 Asn Ala Arg Leu Gly Lys Leu Lys Ile Pro Pro Glu Glu Gly Leu Thr 145 150 155 160 Ser Val Ser Leu Pro Ser Ile Pro Leu Leu Gly Arg Asn Asp Leu Pro 165 170 175 Ile Ile Arg Thr Gly Thr Phe Pro Asp Leu Phe Glu His Leu Gly Asn 180 185 190 Gln Phe Ser Asp Leu Asp Lys Ala Asp Trp Ile Phe Phe Asn Thr Phe 195 200 205 Asp Lys Leu Glu Asn Glu Glu Ala Lys Trp Leu Ser Ser His Trp Pro 210 215 220 Ile Thr Ser Ile Gly Pro Leu Ile Pro Ser Met Tyr Leu Asp Lys Gln 225 230 235 240 Leu Pro Asn Asp Lys Asp Asn Asp Ile Asn Phe Tyr Lys Ala Asp Val 245 250 255 Gly Ser Cys Ile Lys Trp Leu Asp Ala Lys Asp Pro Gly Ser Val Val 260 265 270 Tyr Ala Ser Phe Gly Ser Val Ile His Asn Leu Gly Asp Asp Tyr Met 275 280 285 Asp Glu Val Ala Trp Gly Leu Leu His Ser Lys Tyr His Phe Ile Trp 290 295 300 Val Val Ile Glu Ser Glu Arg Thr Lys Leu Ser Ser Asp Phe Leu Ala 305 310 315 320 Glu Val Glu Ala Glu Glu Lys Gly Leu Ile Val Ser Trp Cys Pro Gln 325 330 335 Leu Glu Val Leu Ser His Lys Ser Ile Gly Ser Phe Met Thr His Cys 340 345 350 Gly Trp Asn Ser Thr Val Glu Ala Leu Ser Leu Gly Val Pro Met Val 355 360 365 Ala Val Pro Gln Gln Phe Asp Gln Pro Val Asn Ala Lys Tyr Ile Val 370 375 380 Asp Val Trp Arg Ile Gly Val Gln Val Pro Ile Gly Glu Asn Gly Val 385 390 395 400 Leu Leu Arg Gly Glu Val Ala Asn Cys Ile Lys Asp Val Met Glu Gly 405 410 415 Glu Ile Gly Asp Glu Leu Arg Gly Asn Ala Leu Lys Trp Lys Gly Leu 420 425 430 Ala Val Glu Ala Met Glu Lys Gly Gly Ser Ser Asp Lys Asn Ile Asp 435 440 445 Glu Phe Ile Ser Lys Leu Val Ser Ser 450 455 <210> 36 <211> 1374 <212> DNA <213> Artificial Sequence <220> <223> UGT-MUT1 nucleotide sequence <400> 36 atggagagag aaatgttgag caaaactcac attatgttca tcccattccc agctcaaggc 60 cacatgagcc caatgatgca attcgtcaag cgtttagcct ggaaaggcgt gcgaatcacg 120 atagttcttc cggctgagat tcgagattct atgcaaataa acaactcatt gatcaacact 180 gagtgcatct cctttgattt tgataaagat gatgagatgc catacagcat gcgggcttat 240 atgggagttg taaagctcaa ggtcacaaat aaactgagtg acctactcga gaagcaaaaa 300 acaaatggct accctgttaa tttgctagtg gtcgattcat tatatccatc tcgggtagaa 360 atgtgccacc aacttggggt aaaaggagct ccatttttca ctcactcttg tgctgttggt 420 gccatttatt ataatgctcg cttagggaaa ttgaagatac ctcctgagga agggttgact 480 tctgtttcat tgccttcaat tccattgttg gggagaaatg atttgccaat tattaggact 540 ggcacctttc ctgatctctt tgagcatttg gggaatcagt tttcagatct tgataaagcg 600 gattggatct ttttcaatac ttttgataag cttgaaaatg aggaagcaaa atggctatct 660 agccattggc caattacatc catcggacca ttaatccctt caatgtactt agacaaacaa 720 ttaccaaatg acaaagacaa tgacattaat ttctacaagg cagacgtcgg atcgtgcatc 780 aagtggctag acgccaaaga ccctggctcg gtagtctacg cctcattcgg gagcgtgatt 840 cacaacctcg gcgatgacta catggacgaa gtagcatggg gcttgttaca cagcaaatat 900 cacttcatat gggttgttat agaatccgaa cgtacaaagc tctctagcga tttcttggca 960 gaggtagagg cagaggaaaa aggcctaata gtgagttggt gccctcaact cgaagttttg 1020 tcacataaat ctataggtag ttttatgact cattgtggtt ggaactcgac ggttgaggca 1080 ttgagtttgg gcgtgccaat ggtggcagtg ccacaacagt ttgatcagcc tgttaatgcc 1140 aagtatatcg tggatgtatg gcgaattggg gttcaggttc cgattggtga aaatggggtt 1200 cttttgaggg gagaagttgc taactgtata aaggatgtta tggaggggga aataggggat 1260 gagcttagag ggaatgcttt gaaatggaag gggttggctg tggaggcaat ggagaaaggg 1320 ggtagctctg ataagaatat tgatgagttc atttcaaagc ttgtttcctc ctga 1374 <210> 37 <211> 457 <212> PRT <213> Artificial Sequence <220> <223> UGT-MUT2 amino acid sequence <400> 37 Met Glu Arg Glu Met Leu Ser Lys Thr His Ile Met Phe Ile Pro Phe 1 5 10 15 Pro Ala Gln Gly His Met Ser Pro Met Met Gln Phe Val Lys Arg Leu 20 25 30 Ala Trp Lys Gly Val Arg Ile Thr Ile Val Leu Pro Ala Glu Ile Arg 35 40 45 Asp Ser Met Gln Ile Asn Asn Ser Leu Ile Asn Thr Glu Cys Ile Ser 50 55 60 Phe Asp Phe Asp Lys Asp Asp Glu Met Pro Tyr Ser Met Arg Ala Tyr 65 70 75 80 Met Gly Val Val Lys Leu Lys Val Thr Asn Lys Leu Ser Asp Leu Leu 85 90 95 Glu Lys Gln Lys Thr Asn Gly Tyr Pro Val Asn Leu Leu Val Val Asp 100 105 110 Ser Leu Tyr Pro Ser Arg Val Glu Met Cys His Gln Leu Gly Val Lys 115 120 125 Gly Ala Pro Phe Phe Thr His Ser Cys Ala Val Gly Ala Ile Tyr Tyr 130 135 140 Asn Ala Arg Leu Gly Lys Leu Lys Ile Pro Pro Glu Glu Gly Leu Thr 145 150 155 160 Ser Val Ser Leu Pro Ser Ile Pro Leu Leu Gly Arg Asn Asp Leu Pro 165 170 175 Ile Ile Arg Thr Gly Thr Phe Pro Asp Leu Phe Glu His Leu Gly Asn 180 185 190 Gln Phe Ser Asp Leu Asp Lys Ala Asp Trp Ile Phe Phe Asn Thr Phe 195 200 205 Asp Lys Leu Glu Asn Glu Glu Ala Lys Trp Leu Ser Ser His Trp Pro 210 215 220 Ile Thr Ser Ile Gly Pro Leu Ile Pro Ser Met Tyr Leu Asp Lys Gln 225 230 235 240 Leu Pro Asn Asp Lys Asp Ser Asp Ile Asn Phe Tyr Lys Ala Asp Val 245 250 255 Gly Ser Cys Ile Lys Trp Leu Asp Ala Lys Asp Pro Gly Ser Val Val 260 265 270 Tyr Ala Ser Phe Gly Ser Val Lys His Asn Leu Gly Asp Asp Tyr Met 275 280 285 Asp Glu Val Ala Trp Gly Leu Leu His Ser Lys Tyr His Phe Ile Trp 290 295 300 Val Val Ile Glu Ser Glu Arg Thr Lys Leu Ser Ser Asp Phe Leu Ala 305 310 315 320 Glu Val Glu Ala Glu Glu Lys Gly Leu Ile Val Ser Trp Cys Pro Gln 325 330 335 Leu Glu Val Leu Ser His Lys Ser Ile Gly Ser Phe Met Thr His Cys 340 345 350 Gly Trp Asn Ser Thr Val Glu Ala Leu Ser Leu Gly Val Pro Met Val 355 360 365 Ala Val Pro Gln Gln Phe Asp Gln Pro Val Asn Ala Lys Tyr Ile Val 370 375 380 Asp Val Trp Arg Ile Gly Val Gln Val Pro Ile Gly Glu Asn Gly Val 385 390 395 400 Leu Leu Arg Gly Glu Val Ala Asn Cys Ile Lys Asp Val Met Glu Gly 405 410 415 Glu Ile Gly Asp Glu Leu Arg Gly Asn Ala Leu Lys Trp Lys Gly Leu 420 425 430 Ala Val Glu Ala Met Glu Lys Gly Gly Ser Ser Asp Lys Asn Ile Asp 435 440 445 Glu Phe Ile Ser Lys Leu Val Ser Ser 450 455 <210> 38 <211> 1374 <212> DNA <213> Artificial Sequence <220> <223> UGT-MUT2 nucleotide sequence <400> 38 atggagagag aaatgttgag caaaactcac attatgttca tcccattccc agctcaaggc 60 cacatgagcc caatgatgca attcgtcaag cgtttagcct ggaaaggcgt gcgaatcacg 120 atagttcttc cggctgagat tcgagattct atgcaaataa acaactcatt gatcaacact 180 gagtgcatct cctttgattt tgataaagat gatgagatgc catacagcat gcgggcttat 240 atgggagttg taaagctcaa ggtcacaaat aaactgagtg acctactcga gaagcaaaaa 300 acaaatggct accctgttaa tttgctagtg gtcgattcat tatatccatc tcgggtagaa 360 atgtgccacc aacttggggt aaaaggagct ccatttttca ctcactcttg tgctgttggt 420 gccatttatt ataatgctcg cttagggaaa ttgaagatac ctcctgagga agggttgact 480 tctgtttcat tgccttcaat tccattgttg gggagaaatg atttgccaat tattaggact 540 ggcacctttc ctgatctctt tgagcatttg gggaatcagt tttcagatct tgataaagcg 600 gattggatct ttttcaatac ttttgataag cttgaaaatg aggaagcaaa atggctatct 660 agccattggc caattacatc catcggacca ttaatccctt caatgtactt agacaaacaa 720 ttaccaaatg acaaagacag cgacattaat ttctacaagg cagacgtcgg atcgtgcatc 780 aagtggctag acgccaaaga ccctggctcg gtagtctacg cctcattcgg gagcgtgaag 840 cacaacctcg gcgatgacta catggacgaa gtagcatggg gcttgttaca cagcaaatat 900 cacttcatat gggttgttat agaatccgaa cgtacaaagc tctctagcga tttcttggca 960 gaggtagagg cagaggaaaa aggcctaata gtgagttggt gccctcaact cgaagttttg 1020 tcacataaat ctataggtag ttttatgact cattgtggtt ggaactcgac ggttgaggca 1080 ttgagtttgg gcgtgccaat ggtggcagtg ccacaacagt ttgatcagcc tgttaatgcc 1140 aagtatatcg tggatgtatg gcgaattggg gttcaggttc cgattggtga aaatggggtt 1200 cttttgaggg gagaagttgc taactgtata aaggatgtta tggaggggga aataggggat 1260 gagcttagag ggaatgcttt gaaatggaag gggttggctg tggaggcaat ggagaaaggg 1320 ggtagctctg ataagaatat tgatgagttc atttcaaagc ttgtttcctc ctga 1374 <210> 39 <211> 457 <212> PRT <213> Artificial Sequence <220> <223> UGT-MUT3 amino acid sequence <400> 39 Met Glu Arg Glu Met Leu Ser Lys Thr His Ile Met Phe Ile Pro Phe 1 5 10 15 Pro Ala Gln Gly His Met Ser Pro Met Met Gln Phe Val Lys Arg Leu 20 25 30 Ala Trp Lys Gly Val Arg Ile Thr Ile Val Leu Pro Ala Glu Ile Arg 35 40 45 Asp Ser Met Gln Ile Asn Asn Ser Leu Ile Asn Thr Glu Cys Ile Ser 50 55 60 Phe Asp Phe Asp Lys Asp Asp Glu Met Pro Tyr Ser Met Arg Ala Tyr 65 70 75 80 Met Gly Val Val Lys Leu Lys Val Thr Asn Lys Leu Ser Asp Leu Leu 85 90 95 Glu Lys Gln Lys Thr Asn Gly Tyr Pro Val Asn Leu Leu Val Val Asp 100 105 110 Ser Leu Tyr Pro Ser Arg Val Glu Met Cys His Gln Leu Gly Val Lys 115 120 125 Gly Ala Pro Phe Phe Thr His Ser Cys Ala Val Gly Ala Ile Tyr Tyr 130 135 140 Asn Ala Arg Leu Gly Lys Leu Lys Ile Pro Pro Glu Glu Gly Leu Thr 145 150 155 160 Ser Val Ser Leu Pro Ser Ile Pro Leu Leu Gly Arg Asn Asp Leu Pro 165 170 175 Ile Ile Arg Thr Gly Thr Phe Pro Asp Leu Phe Glu His Leu Gly Asn 180 185 190 Gln Phe Ser Asp Leu Asp Lys Ala Asp Trp Ile Phe Phe Asn Thr Phe 195 200 205 Asp Lys Leu Glu Asn Glu Glu Ala Lys Trp Leu Ser Ser His Trp Pro 210 215 220 Ile Thr Ser Ile Gly Pro Leu Ile Pro Ser Met Tyr Leu Asp Lys Gln 225 230 235 240 Leu Pro Asn Asp Lys Asp Ser Asp Ile Asn Phe Tyr Lys Ala Asp Val 245 250 255 Gly Ser Cys Ile Lys Trp Leu Asp Ala Lys Asp Pro Gly Ser Val Val 260 265 270 Tyr Ala Ser Phe Gly Ser Val Ile His Asn Leu Gly Asp Asp Tyr Met 275 280 285 Asp Glu Val Ala Trp Gly Leu Leu His Ser Lys Tyr His Phe Ile Trp 290 295 300 Val Val Ile Glu Ser Glu Arg Thr Lys Leu Ser Ser Asp Phe Leu Ala 305 310 315 320 Glu Val Glu Ala Glu Glu Lys Gly Leu Ile Val Ser Trp Cys Pro Gln 325 330 335 Leu Glu Val Leu Ser His Lys Ser Ile Gly Ser Phe Met Thr His Cys 340 345 350 Gly Trp Asn Ser Thr Val Glu Ala Leu Ser Leu Gly Val Pro Met Val 355 360 365 Ala Val Pro Gln Gln Phe Asp Gln Pro Val Asn Ala Lys Tyr Ile Val 370 375 380 Asp Val Trp Arg Ile Gly Val Gln Val Pro Ile Gly Glu Asn Gly Val 385 390 395 400 Leu Leu Arg Gly Glu Val Ala Asn Cys Ile Lys Asp Val Met Glu Gly 405 410 415 Glu Ile Gly Asp Glu Leu Arg Gly Asn Ala Leu Lys Trp Lys Gly Leu 420 425 430 Ala Val Glu Ala Met Glu Lys Gly Gly Ser Ser Asp Lys Asn Ile Asp 435 440 445 Glu Phe Ile Ser Lys Leu Val Ser Ser 450 455 <210> 40 <211> 1374 <212> DNA <213> Artificial Sequence <220> <223> UGT-MUT3 nucleotide sequence <400> 40 atggagagag aaatgttgag caaaactcac attatgttca tcccattccc agctcaaggc 60 cacatgagcc caatgatgca attcgtcaag cgtttagcct ggaaaggcgt gcgaatcacg 120 atagttcttc cggctgagat tcgagattct atgcaaataa acaactcatt gatcaacact 180 gagtgcatct cctttgattt tgataaagat gatgagatgc catacagcat gcgggcttat 240 atgggagttg taaagctcaa ggtcacaaat aaactgagtg acctactcga gaagcaaaaa 300 acaaatggct accctgttaa tttgctagtg gtcgattcat tatatccatc tcgggtagaa 360 atgtgccacc aacttggggt aaaaggagct ccatttttca ctcactcttg tgctgttggt 420 gccatttatt ataatgctcg cttagggaaa ttgaagatac ctcctgagga agggttgact 480 tctgtttcat tgccttcaat tccattgttg gggagaaatg atttgccaat tattaggact 540 ggcacctttc ctgatctctt tgagcatttg gggaatcagt tttcagatct tgataaagcg 600 gattggatct ttttcaatac ttttgataag cttgaaaatg aggaagcaaa atggctatct 660 agccattggc caattacatc catcggacca ttaatccctt caatgtactt agacaaacaa 720 ttaccaaatg acaaagacag cgacattaat ttctacaagg cagacgtcgg atcgtgcatc 780 aagtggctag acgccaaaga ccctggctcg gtagtctacg cctcattcgg gagcgtgatt 840 cacaacctcg gcgatgacta catggacgaa gtagcatggg gcttgttaca cagcaaatat 900 cacttcatat gggttgttat agaatccgaa cgtacaaagc tctctagcga tttcttggca 960 gaggtagagg cagaggaaaa aggcctaata gtgagttggt gccctcaact cgaagttttg 1020 tcacataaat ctataggtag ttttatgact cattgtggtt ggaactcgac ggttgaggca 1080 ttgagtttgg gcgtgccaat ggtggcagtg ccacaacagt ttgatcagcc tgttaatgcc 1140 aagtatatcg tggatgtatg gcgaattggg gttcaggttc cgattggtga aaatggggtt 1200 cttttgaggg gagaagttgc taactgtata aaggatgtta tggaggggga aataggggat 1260 gagcttagag ggaatgcttt gaaatggaag gggttggctg tggaggcaat ggagaaaggg 1320 ggtagctctg ataagaatat tgatgagttc atttcaaagc ttgtttcctc ctaa 1374 <210> 41 <211> 457 <212> PRT <213> Artificial Sequence <220> <223> Pn50-Q222H-VE amino acid sequence <400> 41 Met Glu Arg Glu Met Leu Ser Lys Thr His Ile Met Phe Ile Pro Phe 1 5 10 15 Pro Ala Gln Gly His Met Ser Pro Met Met Gln Phe Val Lys Arg Leu 20 25 30 Ala Trp Lys Gly Val Arg Ile Thr Ile Val Leu Pro Ala Glu Ile Arg 35 40 45 Asp Ser Met Gln Ile Asn Asn Ser Leu Ile Asn Thr Glu Cys Ile Ser 50 55 60 Phe Asp Phe Asp Lys Asp Asp Glu Met Pro Tyr Ser Met Arg Ala Tyr 65 70 75 80 Met Gly Val Val Lys Leu Lys Val Thr Asn Lys Leu Ser Asp Leu Leu 85 90 95 Glu Lys Gln Lys Thr Asn Gly Tyr Pro Val Asn Leu Leu Val Val Asp 100 105 110 Ser Leu Tyr Pro Ser Arg Val Glu Met Cys His Gln Leu Gly Val Lys 115 120 125 Gly Ala Pro Phe Phe Thr His Ser Cys Ala Val Gly Ala Ile Tyr Tyr 130 135 140 Asn Ala Arg Leu Gly Lys Leu Lys Ile Pro Pro Glu Glu Gly Leu Thr 145 150 155 160 Ser Val Ser Leu Pro Ser Ile Pro Leu Leu Gly Arg Asn Asp Leu Pro 165 170 175 Ile Ile Arg Thr Gly Thr Phe Pro Asp Leu Phe Glu His Leu Gly Asn 180 185 190 Gln Phe Ser Asp Leu Asp Lys Ala Asp Trp Ile Phe Phe Asn Thr Phe 195 200 205 Asp Lys Leu Glu Asn Glu Glu Ala Lys Trp Leu Ser Ser His Trp Pro 210 215 220 Ile Thr Ser Ile Gly Pro Leu Ile Pro Ser Met Tyr Leu Asp Lys Gln 225 230 235 240 Leu Pro Asn Asp Lys Asp Asn Asp Ile Asn Phe Tyr Lys Ala Asp Val 245 250 255 Gly Ser Cys Ile Lys Trp Leu Asp Ala Lys Asp Pro Gly Ser Val Val 260 265 270 Tyr Ala Ser Phe Gly Ser Val Lys His Asn Leu Gly Asp Asp Tyr Met 275 280 285 Asp Glu Val Ala Trp Gly Leu Leu His Ser Lys Tyr His Phe Ile Trp 290 295 300 Val Val Ile Glu Ser Glu Arg Thr Lys Leu Ser Ser Asp Phe Leu Ala 305 310 315 320 Glu Val Glu Ala Glu Glu Lys Gly Leu Ile Val Ser Trp Cys Pro Gln 325 330 335 Leu Glu Val Leu Ser His Lys Ser Ile Gly Ser Phe Met Thr His Cys 340 345 350 Gly Trp Asn Ser Thr Val Glu Ala Leu Ser Leu Gly Val Pro Met Val 355 360 365 Ala Val Pro Gln Gln Phe Asp Gln Pro Val Asn Ala Lys Tyr Ile Val 370 375 380 Asp Val Trp Arg Ile Gly Val Gln Val Pro Ile Gly Glu Asn Gly Val 385 390 395 400 Leu Leu Arg Gly Glu Val Ala Asn Cys Ile Lys Asp Val Met Glu Gly 405 410 415 Glu Ile Gly Asp Glu Leu Arg Gly Asn Ala Leu Lys Trp Lys Gly Leu 420 425 430 Ala Val Glu Ala Met Glu Lys Gly Gly Ser Ser Asp Lys Asn Ile Asp 435 440 445 Glu Phe Ile Ser Lys Leu Val Ser Ser 450 455 <210> 42 <211> 1374 <212> DNA <213> Artificial Sequence <220> <223> Pn50-Q222H-VE nucleotide sequence <400> 42 atggagagag aaatgttgag caaaactcac attatgttca tcccattccc agctcaaggc 60 cacatgagcc caatgatgca attcgtcaag cgtttagcct ggaaaggcgt gcgaatcacg 120 atagttcttc cggctgagat tcgagattct atgcaaataa acaactcatt gatcaacact 180 gagtgcatct cctttgattt tgataaagat gatgagatgc catacagcat gcgggcttat 240 atgggagttg taaagctcaa ggtcacaaat aaactgagtg acctactcga gaagcaaaaa 300 acaaatggct accctgttaa tttgctagtg gtcgattcat tatatccatc tcgggtagaa 360 atgtgccacc aacttggggt aaaaggagct ccatttttca ctcactcttg tgctgttggt 420 gccatttatt ataatgctcg cttagggaaa ttgaagatac ctcctgagga agggttgact 480 tctgtttcat tgccttcaat tccattgttg gggagaaatg atttgccaat tattaggact 540 ggcacctttc ctgatctctt tgagcatttg gggaatcagt tttcagatct tgataaagcg 600 gattggatct ttttcaatac ttttgataag cttgaaaatg aggaagcaaa atggctatct 660 agccattggc caattacatc catcggacca ttaatccctt caatgtactt agacaaacaa 720 ttaccaaatg acaaagacaa tgacattaat ttctacaagg cagacgtcgg atcgtgcatc 780 aagtggctag acgccaaaga ccctggctcg gtagtctacg cctcattcgg gagcgtgaag 840 cacaacctcg gcgatgacta catggacgaa gtagcatggg gcttgttaca cagcaaatat 900 cacttcatat gggttgttat agaatccgaa cgtacaaagc tctctagcga tttcttggca 960 gaggtagagg cagaggaaaa aggcctaata gtgagttggt gccctcaact cgaagttttg 1020 tcacataaat ctataggtag ttttatgact cattgtggtt ggaactcgac ggttgaggca 1080 ttgagtttgg gcgtgccaat ggtggcagtg ccacaacagt ttgatcagcc tgttaatgcc 1140 aagtatatcg tggatgtatg gcgaattggg gttcaggttc cgattggtga aaatggggtt 1200 cttttgaggg gagaagttgc taactgtata aaggatgtta tggaggggga aataggggat 1260 gagcttagag ggaatgcttt gaaatggaag gggttggctg tggaggcaat ggagaaaggg 1320 ggtagctctg ataagaatat tgatgagttc atttcaaagc ttgtttcctc ctga 1374 <110> SHANGHAI INSTITUTES FOR BIOLOGICAL SCIENCES, CHINESE ACADEMY OF SCIENCES <120> glycosyltransferase, mutant, and application thereof <130> PIPB194370CN <150> CN 201710344730.7 <151> 2017-05-16 <160> 42 <170> KoPatentIn 3.0 < 210> 1 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer Forward <400> 1 atggagagag aaatgttgag ca 22 <210> 2 <211> 22 <212> DNA <213> Artificial Sequence < 220> <223> Primer reverse <400> 2 tcaggaggaa acaagctttg aa 22 <210> 3 <211> 1368 <212> DNA <213> Artificial Sequence <220> <223> Pn50 necleotide sequence <400> 3 atggagagag aaatgttgag caaaactcac attatgttca tcccattccc agctcaaggc 60 cacatgagcc caatgatgca attcgtcaag cgtttagcct ggaaaggcgt gcgaatcacg 120 atagttcttc cggctgagat tcgagattct atgcaaataa acaactcatt gatcaacact 180 gagtgcatct cctttgattt tgataaagat gatgagatgc catacagcat gcgggcttat 240 atgggagttg taaagctcaa ggtcacaaat aaactgagtg acctactcga gaagcaaaaa 300 acaaatggct accctgttaa tttgctagtg gtcgattcat tatatccatc tcgggtagaa 360 atgtgccacc aacttggggt aaaaggagct ccatttttca ctcactcttg tgctgttggt 420 gccatttatt ataatgctcg cttagggaaa ttgaagatac ctcctgagga agggttgact 480 tctgtttcat tgccttcaat tccattgttg gggagaaatg atttgccaat tattaggact 540 ggcacctttc ctgatctctt tgagcatttg gggaatcagt tttcagatct tgataaagcg 600 gattggatct ttttcaatac ttttgataag cttgaaaatg aggaagcaaa atggctatct 660 agccaatggc caattacatc catcggacca ttaatccctt caatgtactt agacaaacaa 720 ttaccaaatg acaaagacaa tgacattaat ttctacaagg cagacgtcgg atcgtgcatc 780 aagtggctag acgccaaaga ccctggctcg gtagtctacg cctcattcgg gagcgtgaag 840 cacaacctcg gcgatgacta catggacgaa gtagcatggg gcttgttaca cagcaaatat 900 cacttcatat gggttgttat agaatccgaa cgtacaaagc tctctagcga tttcttggca 960 gaggcagagg aaaaaggcct aatagtgagt tggtgccctc aactcgaagt tttgtcacat 1020 aaatctatag gtagttttat gactcattgt ggttggaact cgacggttga ggcattgagt 1080 ttgggcgtgc caatggtggc agtgccacaa cagtttgatc agcctgttaa tgccaagtat 1140 atcgtggatg tatggcgaat tggggttcag gttccgattg gtgaaaatgg ggttcttttg 1200 aggggagaag ttgctaactg tataaaggat gtta tggagg gggaaatagg ggatgagctt 1260 agagggaatg ctttgaaatg gaaggggttg gctgtggagg caatggagaa agggggtagc 1320 tctgataaga atattgatga gttcattttca aagctt213ttt Glue sequence amino acid sequence aagctt213gtt ctt cctcct 213 < 4212 Artificial cctcct < 211 400 <21050 Arg Glu Met Leu Ser Lys Thr His Ile Met Phe Ile Pro Phe 1 5 10 15 Pro Ala Gln Gly His Met Ser Pro Met Met Gln Phe Val Lys Arg Leu 20 25 30 Ala Trp Lys Gly Val Arg Ile Thr Ile Val Leu Pro Ala Glu Ile Arg 35 40 45 Asp Ser Met Gln Ile Asn Asn Ser Leu Ile Asn Thr Glu Cys Ile Ser 50 55 60 Phe Asp Phe Asp Lys Asp Asp Glu Met Pro Tyr Ser Met Arg Ala Tyr 65 70 75 80 Met Gly Val Val Lys Leu Lys Val Thr Asn Lys Leu Ser Asp Leu Leu 85 90 95 Glu Lys Gln Lys Thr Asn Gly Tyr Pro Val Asn Leu Leu Val Val Asp 100 105 110 Ser Leu Tyr Pro Ser Arg Val Glu Met Cys His Gln Leu Gly Val Lys 115 120 125 Gly Ala Pro Phe Phe Thr His Ser Cys Ala Val Gly Ala Ile Tyr Tyr 13 0 135 140 Asn Ala Arg Leu Gly Lys Leu Lys Ile Pro Pro Glu Glu Gly Leu Thr 145 150 155 160 Ser Val Ser Leu Pro Ser Ile Pro Leu Leu Gly Arg Asn Asp Leu Pro 165 170 175 Ile Ile Arg Thr Gly Thr Phe Pro Asp Leu Phe Glu His Leu Gly Asn 180 185 190 Gln Phe Ser Asp Leu Asp Lys Ala Asp Trp Ile Phe Phe Asn Thr Phe 195 200 205 Asp Lys Leu Glu Asn Glu Glu Ala Lys Trp Leu Ser Ser Gln Trp Pro 210 215 220 Ile Thr Ser Ile Gly Pro Leu Ile Pro Ser Met Tyr Leu Asp Lys Gln 225 230 235 240 Leu Pro Asn Asp Lys Asp Asn Asp Ile Asn Phe Tyr Lys Ala Asp Val 245 250 255 Gly Ser Cys Ile Lys Trp Leu Asp Ala Lys Asp Pro Gly Ser Val Val 260 265 270 Tyr Ala Ser Phe Gly Ser Val Lys His Asn Leu Gly Asp As p Tyr Met 275 280 285 Asp Glu Val Ala Trp Gly Leu Leu His Ser Lys Tyr His Phe Ile Trp 290 295 300 Val Val Ile Glu Ser Glu Arg Thr Lys Leu Ser Ser Asp Phe Leu Ala 305 310 315 320 Glu Ala Glu Glu Lys Gly Leu Ile Val Ser Trp Cys Pro Gln Leu Glu 325 330 335 Val Leu Ser His Lys Ser Ile Gly Ser Phe Met Thr His Cys Gly Trp 340 345 350 Asn Ser Thr Val Glu Ala Leu Ser Leu Gly Val Pro Met Val Ala Val 355 360 365 Pro Gln Gln Phe Asp Gln Pro Val Asn Ala Lys Tyr Ile Val Asp Val 370 375 380 Trp Arg Ile Gly Val Gln Val Pro Ile Gly Glu Asn Gly Val Leu Leu 385 390 395 400 Arg Gly Glu Val Ala Asn Cys Ile Lys Asp Val Met Glu Gly Glu Ile 405 410 415 Gly Asp Glu Leu Arg Gly Asn Ala Leu Lys Tr p Lys Gly Leu Ala Val 420 425 430 Glu Ala Met Glu Lys Gly Gly Ser Ser Asp Lys Asn Ile Asp Glu Phe 435 440 445 Ile Ser Lys Leu Val Ser 450 455 <210> 5 <211> 28 <212> DNA < 213> Artificial Sequence <220> <223> Pn50 expression Primer Forward <400> 5 ggatccatgg agagagaaat gttgagca 28 <210> 6 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Pn50 expression Primer reverse < 400> 6 ctcgagtcag gaggaaacaa gctttgaa 28 <210> 7 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> promoter Primer Forward <400> 7 tagctctgat aagaatattg atgagttcat ttcaaagctt gtttcctcct gagatt 56 <210> 8 <211 > 69 <212> DNA <213> Artificial Sequence <220> <223> promoter Primer reverse <400> 8 actgtcaagg agggtattct gggcctccat gtcgctgcta tataacagtt gaaatttgga 60 taagaacat 69 <210> 9 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> ORF Primer Forward <400> 9 gctatactgc tgtcgattcg atactaacgc cgccatccag tgtcgagaat tacaatagt 59 <210> 10 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> ORF Primer reverse <400> 10 tctggtgagg atttacggta tgatcatgct <ggtaagcttc <ggtaagcttc> 59 <212> DNA <213> Artificial Sequence <220> <223> terminator Primer Forward <400> 11 gaaaagaaga taatattttt atataattat attaatctca ggaggaaaca agctttgaa 59 <210> 12 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> terminator Primer reverse <400> 12 gcatagcaat ctaatctaag ttttaattac aaaatggaga gagaaatgtt gagcaaaac 59 <210> 13 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> selection marker Primer Forward <400> 13 cgcgttgaga agatgttctt atccaaattt caactgttat atagcagcga 50 <210> 14 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> selection marker Primer reverse <400> 14 ttacttcttg cagacatcag acatactatt gtaattctcg acactggatg gcggcgtta 59 <210> 15 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Upstream homology arm primer Forward <400> 15 ggctgtcgcc attcaagagc agatagcttc aaaatgtttc tactcctttt ttactcttc 59 <210> 16 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Upstream homology arm Primer reverse <400> 16 taatgtga gtttttgctca < acattttt 59 ctatattttt 17 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> downstream homology arm Primer Forward <400> 17 cccaaagcta agagtcccat tttattc 27 <210> 18 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> downstream homology arm Primer reverse <400> 18 gagtagaaac attttgaagc tatctgctct tgaatggcga cagcctattg ccccagtgt 59 <210> 19 <211> 457 <212> PRT <213> Artificial Sequence <220> <223> UGTPg45 amino acid sequence < 400> 19 Met Glu Arg Glu Met Leu Ser Lys Thr His Ile Met Phe Ile Pro Phe 1 5 10 15 Pro Ala Gln Gly His Met Ser Pro Met Met Gln Phe Ala Lys Arg Leu 20 25 30 Ala Trp Lys Gly Leu Arg Ile Thr Ile Val Leu Pro Ala Gln Ile Arg 35 40 45 Asp Phe Met Gln Ile Thr Asn Pro Leu Ile Asn Thr Glu Cys Ile Ser 50 55 60 Phe Asp Phe Asp Lys Asp Asp Gly Met Pro Tyr Ser Met Gln Ala Tyr 65 70 75 80 Met Gly Val Val Lys Leu Lys Val Thr Asn Lys Leu Ser Asp Leu Leu 85 90 95 Glu Lys Gln Arg Thr Asn Gly Tyr Pro Val Asn Leu Leu Val Val Asp 100 105 110 Ser Leu Tyr Pro Ser Arg Val Glu Met Cys His Gln Leu Gly Val Lys 115 120 125 Gly Ala Pro Phe Phe Thr His Ser Cys Ala Val Gly Ala Ile Tyr Tyr 130 135 140 Asn Ala Arg Leu Gly Lys Leu Lys Ile Pro Pro Glu Glu Gly Leu Thr 145 150 155 160 Ser Val Ser Leu Pro Ser Ile Pro Leu Leu Gly Arg Asp Asp Leu Pro 165 170 175 Ile Ile Arg Thr Gly Thr Phe Pro Asp Leu Phe Glu His Leu Gly Asn 180 185 190 Gln Phe Ser Asp Leu Asp Lys Ala Asp Trp Ile Phe Phe Asn Thr Phe 195 200 205 Asp Lys Leu Glu Asn Glu Glu Ala Lys Trp Leu Ser Ser Gln Trp Pro 210 215 220 Ile Thr Ser Ile Gly Pro Leu Ile Pro Ser Met Tyr Leu Asp Lys Gln 225 230 235 240 Leu Pro Asn Asp Lys Asp Asn Gly Ile Asn Phe Tyr Lys Ala Asp Val 245 250 255 Gly Ser Cys Ile Lys Trp Leu Asp Ala Lys Asp Pro Gly Ser Val Val 260 265 270 Tyr Ala Ser Phe Gly Ser Val Lys His Asn Leu Gly Asp Asp Tyr Met 275 280 285 Asp Glu Val Ala Trp Gly Leu Leu His Ser Lys Tyr His Phe Ile Trp 290 295 300 Val Val Ile Glu Ser Glu Arg Thr Lys Leu Ser Ser Asp Phe Leu Ala 305 310 315 320 Glu Ala Glu Ala Glu Glu Lys Gly Leu Ile Val Ser Trp Cys Pro Gln 325 330 335 Leu Gln Val Leu Ser His Lys Ser Ile Gly Ser Phe Met Thr His Cys 340 345 350 Gly Trp Asn Ser Thr Val Glu Ala Leu Ser Leu Gly Val Pro Met Val 355 360 365 Ala Leu Pro Gln Gln Phe Asp Gln Pro Ala Asn Ala Lys Tyr Ile Val 370 375 380 Asp Val Trp Gln Ile Gly Val Arg Val Pro Ile Gly Glu Glu Gly Val 385 390 395 400 Val Leu Arg Gly Glu Val Ala Asn Cys Ile Lys Asp Val Met Glu Gly 405 410 415 Glu Ile Gly Asp Glu Leu Arg Gly Asn Ala Leu Lys Trp Lys Gly Leu 420 425 430 Ala Val Glu Ala Met Glu Lys Gly Gly Ser Ser Asp Lys Asn Ile Asp 435 440 445 Glu Phe Ile Ser Lys Leu Val Ser 450 455 <210> 20 <211> 1374 <212> DNA <213> Artificial Sequence <220> <223> UGTPg45 nucleotide sequence <400> 20 atggagagag aaatgttgag caaaactcac attatgttca tcccattccc agctcaaggc 60 caatgatgca attcgcc agctcaaggc tag cagtgagcc ggaaaggcct gcgaatcacg 120 atagttcttc cggctcaaat tcgagatttc atgcaaataa ccaacccatt gatcaacact 180 gagtgcatct cctttgattt tgataaa gac gatgggatgc catacagcat gcaggcttat 240 atgggagttg taaaactcaa ggtcacaaat aaactgagtg acctactcga gaagcaaaga 300 acaaatggct accctgttaa tttgctagtg gttgattcat tatatccatc tcgggtagaa 360 atgtgccacc aacttggggt aaaaggagct ccatttttca ctcactcttg tgctgttggt 420 gccatttatt ataatgctcg cttagggaaa ttgaagatac ctcctgagga agggttgact 480 tctgtttcat tgccttcaat tccattgttg gggagagatg atttgccaat tattaggact 540 ggcacctttc ctgatctctt tgagcatttg gggaatcagt tttcagatct tgataaagcg 600 gattggatct ttttcaatac ttttgataag cttgaaaatg aggaagcaaa atggctatct 660 agccaatggc caattacatc catcggacca ttaatccctt caatgtactt agacaaacaa 720 ttaccaaatg acaaagacaa tggcattaat ttctacaagg cagacgtcgg atcgtgcatc 780 aagtggctag acgccaaaga ccctggctcg gtagtctacg cctcattcgg gagcgtgaag 840 cacaacctcg gcgatgacta catggacgaa gtagcatggg gcttgttaca tagcaaatat 900 cacttcatat gggttgttat agaatccgaa cgtacaaagc tctctagcga tttcttggca 960 gaggcagagg cagaggaaaa aggcctaata gtgagttggt gccctcaact ccaagttttg 1020 tcacataaat ctatagggag ttttatgact cattgtggtt ggaa ctcgac ggttgaggca 1080 ttgagtttgg gcgtgccaat ggtggcactg ccacaacagt ttgatcagcc tgctaatgcc 1140 aagtatatcg tggatgtatg gcaaattggg gttcgggttc cgattggtga agagggggtt 1200 gttttgaggg gagaagttgc taactgtata aaggatgtta tggaggggga aataggggat 1260 gagcttagag ggaatgcttt gaaatggaag gggttggctg tggaggcaat ggagaaaggg 1320 ggtagctctg ataagaatat tgatgagttc atttcaaagc ttgtttcctc ctga 1374 <210> 21 <211> 457 <212> PRT <213> Artificial Sequence <220> <223> 8E7 amino acid sequence <400> 21 Met Glu Arg Glu Met Leu Ser Lys Thr His Ile Met Phe Ile Pro Phe 1 5 10 15 Pro Ala Gln Gly His Met Ser Pro Met Met Gln Phe Ala Lys Arg Leu 20 25 30 Ala Trp Lys Gly Leu Arg Ile Thr Ile Val Leu Pro Ala Gln Ile Arg 35 40 45 Asp Phe Met Gln Ile Thr Asn Pro Leu Ile Asn Thr Glu Cys Ile Ser 50 55 60 Phe Asp Phe Asp Lys Asp Asp Gly Met Pro Tyr Ser Met Gln Ala Tyr 65 70 75 80 Met Gly Val Val Lys Leu Lys Val Thr Asn Lys Leu Ser Asp Leu Leu 85 90 95 Glu Lys Gln Arg Thr Asn Gly Tyr Pro Val Asn Leu Leu Val Val Asp 100 105 110 Ser Leu Tyr Pro Ser Arg Val Glu Met Cys His Gln Leu Gly Val Lys 115 120 125 Gly Ala Pro Phe Phe Thr His Ser Cys Ala Val Gly Ala Ile Tyr Tyr 130 135 140 Asn Ala Arg Leu Gly Lys Leu Lys Ile Pro Pro Glu Glu Gly Leu Thr 145 150 155 160 Ser Val Ser Leu Pro Ser Ile Pro Leu Leu Gly Arg Asp Asp Leu Pro 165 170 175 Ile Ile Arg Thr Gly Thr Phe Pro Asp Leu Phe Glu His Leu Gly Asn 180 185 190 Gln Phe Ser Asp Leu Asp Lys Ala Asp Trp Ile Phe Phe Asn Thr Phe 195 200 205 Asp Lys Leu Glu Asn Glu Glu Ala Lys Trp Leu Ser Ser His Trp Pro 210 215 220 Ile Thr Ser Ile Gly Pro Leu Ile Pro Ser Met Tyr Leu Asp Lys Gln 225 230 235 240 Leu Pro Asn Asp Lys Asp Asn Gly Ile Asn Phe Tyr Lys Ala Asp Val 245 250 255 Gly Ser Cys Ile Lys Trp Leu Asp Ala Lys Asp Pro Gly Ser Val Val 260 265 270 Tyr Ala Ser Phe Gly Ser Val Lys His Asn Leu Gly Asp Asp Tyr Met 275 280 285 Asp Glu Val Ala Trp Gly Leu Leu His Ser Lys Tyr His Phe Ile Trp 290 295 300 Val Val Ile Glu Ser Glu Arg Thr Lys Leu Ser Ser Asp Phe Leu Ala 305 310 315 320 Glu Val Glu Ala Glu Glu Lys Gly Leu Ile Val Ser Trp Cys Pro Gln 325 330 335 Leu Gln Val Leu Ser His Lys Ser Ile Gly Ser Phe Met Thr His Cys 340 345 350 Gly Trp Asn Ser Thr Val Glu Ala Leu Ser Leu Gly Val Pro Met Val 355 360 365 Ala Leu Pro Gln Gln Phe Asp Gln Pro Ala Asn Ala Lys Tyr Ile Val 370 375 380 Asp Val Trp Gln Ile Gly Val Arg Val Pro Ile Gly Glu Glu Gly Val 385 390 395 400 Val Leu Arg Gly Glu Val Ala Asn Cys Ile Lys Asp Val Met Glu Gly 405 410 415 Glu Ile Gly Asp Glu Leu Arg Gly Asn Ala Leu Lys Trp Lys Gly Leu 420 425 430 Ala Val Glu Ala Met Glu Lys Gly Gly Ser Ser Asp Lys Asn Ile Asp 435 440 445 Glu Phe Ile Ser Lys Leu Val Ser Ser 450 455 <210> 22 <211> 1374 <212> DNA <213> Artificial Sequence <220> <223> 8E7 nucleotide sequence <400> 22 atggagagag aaatgttgag caaaactcac attatgttca tcccattccc agctcaaggc 60 cacatgagcc caatgatgca attcgccaag cgtttagcct ggaaaggcct gcgaatcacg 120 atagttcttc cggctcaaat tcgagatttc atgcaaataa ccaacccatt gatcaacact 180 gagtgcatct cctttgattt tgataaagac gatgggatgc catacagcat gcaggcttat 240 atgggagttg taaaactcaa ggtcacaaat aaactgagtg acctactcga gaagcaaaga 300 acaaatggct accctgttaa tttgctagtg gttgattcat tatatccatc tcgggtagaa 360 atgtgccacc aacttggggt aaaaggagct cca tttttca ctcactcttg tgctgttggt 420 gccatttatt ataatgctcg cttagggaaa ttgaagatac ctcctgagga agggttgact 480 tctgtttcat tgccttcaat tccattgttg gggagagatg atttgccaat tattaggact 540 ggcacctttc ctgatctctt tgagcatttg gggaatcagt tttcagatct tgataaagcg 600 gattggatct ttttcaatac ttttgataag cttgaaaatg aggaagcaaa atggctatct 660 agccattggc caattacatc catcggacca ttaatccctt caatgtactt agacaaacaa 720 ttaccaaatg acaaagacaa tggcattaat ttctacaagg cagacgtcgg atcgtgcatc 780 aagtggctag acgccaaaga ccctggctcg gtagtctacg cctcattcgg gagcgtgaag 840 cacaacctcg gcgatgacta catggacgaa gtagcatggg gcttgttaca tagcaaatat 900 cacttcatat gggttgttat agaatccgaa cgtacaaagc tctctagcga tttcttggca 960 gaggtagagg cagaggaaaa aggcctaata gtgagttggt gccctcaact ccaagttttg 1020 tcacataaat ctatagggag ttttatgact cattgtggtt ggaactcgac ggttgaggca 1080 ttgagtttgg gcgtgccaat ggtggcactg ccacaacagt ttgatcagcc tgctaatgcc 1140 aagtatatcg tggatgtatg gcaaattggg gttcgggttc cgattggtga agagggggtt 1200 gttttgaggg gagaagttgc taactgtata aaggatgtta tggaggggga aataggggat 1260 gagcttagag ggaatgcttt gaaatggaag gggttggctg tggaggcaat ggagaaaggg 1320 ggtagctctg ataagaatat tgatgagttc atttcaaagc ttgtttcctc ctga 1374 <210> 23 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> UGTPg45 random mutation Primer Forward <400> 23 gcatagcaat ctaatctaag ttttaattac aaaatggaga g agaaatgtt gagcaaaac 59 <210> 24 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> UGTPg45 random mutation Primer reverse <400> 24 gaaaagaaga taatattttt atataattat attaatctca ggaggaaaca agctttgaa 59 <210> 25 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> fragment 7 Primer Forward <400> 25 acactggggc aataggctgt cgccattcaa gagcagatag cttcaaaatg tttctactc 59 <210> 26 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> fragment 7 Primer reverse <400> 26 cataatgtga gttttgctca acatttctct ctccattttg taattaaaac ttagattag 59 <210> 27 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> fragment 8 Primer Forward <400> 27 ttgatgagtt catttcaaag cttgtttcct cctgagatta atataattat ataaaaata 59 <210> 28 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> fragment 8 Primer reverse <400> 28 actgtcaagg agggtattct ggg210cctccat gtcgctgcta tataacagtt <gaaattgg> 29 > 27 <212> DNA <213> Artificial Sequence <220> <223> fragment 9 Primer Forward <400> 29 cccaaagcta agagtcc cat tttattc 27 <210> 30 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> fragment 9 Primer reverse <400> 30 gaagagtaaa aaaggagtag aaacattttg aagctatctg ctcttgaatg gcgacagcc 59 <210> 31 <211> 59 < 212> DNA <213> Artificial Sequence <220> <223> fragment 10 Primer Forward <400> 31 tgtcgattcg atactaacgc cgccatccag tgtcgagaat tacaatagta tgtctgatg 59 <210> 32 <211> 22 <212> DNA <213> Artificial Sequence <220> < 223> fragment 10 Primer reverse <400> 32 tctggtgagg atttacggta tg 22 <210> 33 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> fragment 11 Primer Forward <400> 33 aagatgttct tatccaaatt tcaactgtta tatagcagcg acatggaggc ccagaatac 59 <210> 34 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> fragment 11 Primer reverse <400> 34 tacttcttgc agacatcaga catactattg taattctcga cactggatgg cggcgttag 59 <210> 35 <211> 457 <212 > PRT <213> Artificial Sequence <220> <223> UGT-MUT1 amino acid sequence <400> 35 Met Glu Arg Glu Met Leu Ser Lys Thr His Ile Met Phe Ile Pro Phe 1 5 10 15 Pro Ala Gln Gly His Met Ser Pro Met Met Gln Phe Val Lys Arg Leu 20 25 30 Ala Trp Lys Gly Val Arg Ile Thr Ile Val Leu Pro Ala Glu Ile Arg 35 40 45 Asp Ser Met Gln Ile Asn Asn Ser Leu Ile Asn Thr Glu Cys Ile Ser 50 55 60 Phe Asp Phe Asp Lys Asp Asp Glu Met Pro Tyr Ser Met Arg Ala Tyr 65 70 75 80 Met Gly Val Val Lys Leu Lys Val Thr Asn Lys Leu Ser Asp Leu Leu 85 90 95 Glu Lys Gln Lys Thr Asn Gly Tyr Pro Val Asn Leu Leu Val Val Asp 100 105 110 Ser Leu Tyr Pro Ser Arg Val Glu Met Cys His Gln Leu Gly Val Lys 115 120 125 Gly Ala Pro Phe Phe Thr His Ser Cys Ala Val Gly Ala Ile Tyr Tyr 130 135 140 Asn Ala Arg Leu Gly Lys Leu Lys Ile Pro Pro Glu Glu Gly Leu Thr 145 150 155 160 Ser Val Ser Leu Pro Ser Ile Pro Leu Leu Gly Arg Asn Asp Leu Pro 165 170 175 Ile Ile Arg Thr Gly Thr Phe Pro Asp Leu Phe Glu His Leu Gly Asn 180 185 190 Gln Phe Ser Asp Leu Asp Lys Ala Asp Trp Ile Phe Phe Asn Thr Phe 195 200 205 Asp Lys Leu Glu Asn Glu Glu Ala Lys Trp Leu Ser Ser His Trp Pro 210 215 220 Ile Thr Ser Ile Gly Pro Leu Ile Pro Ser Met Tyr Leu Asp Lys Gln 225 230 235 240 Leu Pro Asn Asp Lys Asp Asn Asp Ile Asn Phe Tyr Lys Ala Asp Val 245 250 255 Gly Ser Cys Ile Lys Trp Leu Asp Ala Lys Asp Pro Gly Ser Val Val 260 265 270 Tyr Ala Ser Phe Gly Ser Val Ile His Asn Leu Gly Asp Asp Tyr Met 275 280 285 Asp Glu Val Ala Trp Gly Leu Leu His Ser Lys Tyr His Phe Ile Trp 290 295 300 Val Val Ile Glu Ser Glu Arg Thr Lys Leu Ser Ser Asp Phe Leu Ala 305 310 315 320 Glu Val Glu Ala Glu Glu Lys Gly Leu Ile Val Ser Trp Cys Pro Gln 325 330 335 Leu Glu Val Leu Ser His Lys Ser Ile Gly Ser Phe Met Thr His Cys 340 345 350 Gly Trp Asn Ser Thr Val Glu Ala Leu Ser Leu Gly Val Pro Met Val 355 360 365 Ala Val Pro Gln Gln Phe Asp Gln Pro Val Asn Ala Lys Tyr Ile Val 370 375 380 Asp Val Trp Arg Ile Gly Val Gln Val Pro Ile Gly Glu Asn Gly Val 385 390 395 400 Leu Leu Arg Gly Glu Val Ala Asn Cys Ile Lys Asp Val Met Glu Gly 405 410 415 Glu Ile Gly Asp Glu Leu Arg Gly Asn Ala Leu Lys Trp Lys Gly Leu 420 425 430 Ala Val Glu Ala Met Glu Lys Gly Gly Ser Ser Asp Lys Asn Ile Asp 435 440 445 Glu Phe Ile Ser Lys Leu Val Ser Ser 450 455 <210> 36 <211> 1374 <212> DNA <213> Artificial Sequence <220> <223> UGT-MUT1 nucleotide sequence <4 00> 36 atggagagag aaatgttgag caaaactcac attatgttca tcccattccc agctcaaggc 60 cacatgagcc caatgatgca attcgtcaag cgtttagcct ggaaaggcgt gcgaatcacg 120 atagttcttc cggctgagat tcgagattct atgcaaataa acaactcatt gatcaacact 180 gagtgcatct cctttgattt tgataaagat gatgagatgc catacagcat gcgggcttat 240 atgggagttg taaagctcaa ggtcacaaat aaactgagtg acctactcga gaagcaaaaa 300 acaaatggct accctgttaa tttgctagtg gtcgattcat tatatccatc tcgggtagaa 360 atgtgccacc aacttggggt aaaaggagct ccatttttca ctcactcttg tgctgttggt 420 gccatttatt ataatgctcg cttagggaaa ttgaagatac ctcctgagga agggttgact 480 tctgtttcat tgccttcaat tccattgttg gggagaaatg atttgccaat tattaggact 540 ggcacctttc ctgatctctt tgagcatttg gggaatcagt tttcagatct tgataaagcg 600 gattggatct ttttcaatac ttttgataag cttgaaaatg aggaagcaaa atggctatct 660 agccattggc caattacatc catcggacca ttaatccctt caatgtactt agacaaacaa 720 ttaccaaatg acaaagacaa tgacattaat ttctacaagg cagacgtcgg atcgtgcatc 780 aagtggctag acgccaaaga ccctggctcg gtagtctacg cctcattcgg gagcgtgatt 840 cacaacctcg gcg atgacta catggacgaa gtagcatggg gcttgttaca cagcaaatat 900 cacttcatat gggttgttat agaatccgaa cgtacaaagc tctctagcga tttcttggca 960 gaggtagagg cagaggaaaa aggcctaata gtgagttggt gccctcaact cgaagttttg 1020 tcacataaat ctataggtag ttttatgact cattgtggtt ggaactcgac ggttgaggca 1080 ttgagtttgg gcgtgccaat ggtggcagtg ccacaacagt ttgatcagcc tgttaatgcc 1140 aagtatatcg tggatgtatg gcgaattggg gttcaggttc cgattggtga aaatggggtt 1200 cttttgaggg gagaagttgc taactgtata aaggatgtta tggaggggga aataggggat 1260 gagcttagag ggaatgcttt gaaatggaag gggttggctg tggaggcaat ggagaaaggg 1320 ggtagctctg ataagaatat tgatgagttc atttcaaagc ttgtttcctc ctga 1374 <210> 37 <211> 457 <212> PRT <213> Glu400 37 Met Glu Arg Glu400 Met <223> UGT Leu Ser Lys Thr His Ile Met Phe Ile Pro Phe 1 5 10 15 Pro Ala Gln Gly His Met Ser Pro Met Met Gln Phe Val Lys Arg Leu 20 25 30 Ala Trp Lys Gly Val Arg Ile Thr Ile Val Leu Pro Ala Glu Ile Arg 35 40 45 Asp Ser Met Gln Ile Asn Asn Ser Leu Ile Asn Thr Glu Cys Ile Ser 50 55 60 Phe Asp Phe Asp Lys Asp Asp Glu Met Pro Tyr Ser Met Arg Ala Tyr 65 70 75 80 Met Gly Val Val Lys Leu Lys Val Thr Asn Lys Leu Ser Asp Leu Leu 85 90 95 Glu Lys Gln Lys Thr Asn Gly Tyr Pro Val Asn Leu Leu Val Val Asp 100 105 110 Ser Leu Tyr Pro Ser Arg Val Glu Met Cys His Gln Leu Gly Val Lys 115 120 125 Gly Ala Pro Phe Phe Thr His Ser Cys Ala Val Gly Ala Ile Tyr Tyr 130 135 140 Asn Ala Arg Leu Gly Lys Leu Lys Ile Pro Pro Glu Glu Gly Leu Thr 145 150 155 160 Ser Val Ser Leu Pro Ser Ile Pro Leu Leu Gly Arg Asn Asp Leu Pro 165 170 175 Ile Ile Arg Thr Gly Thr Phe Pro Asp Leu Phe Glu His Leu Gly Asn 180 185 190 Gln Phe Ser Asp Leu Asp Lys Ala Asp Trp Ile Phe Phe Asn Thr Phe 195 200 205 Asp Lys Leu Glu Asn Glu Glu Ala Lys Trp Leu Se r Ser His Trp Pro 210 215 220 Ile Thr Ser Ile Gly Pro Leu Ile Pro Ser Met Tyr Leu Asp Lys Gln 225 230 235 240 Leu Pro Asn Asp Lys Asp Ser Asp Ile Asn Phe Tyr Lys Ala Asp Val 245 250 255 Gly Ser Cys Ile Lys Trp Leu Asp Ala Lys Asp Pro Gly Ser Val Val 260 265 270 Tyr Ala Ser Phe Gly Ser Val Lys His Asn Leu Gly Asp Asp Tyr Met 275 280 285 Asp Glu Val Ala Trp Gly Leu Leu His Ser Lys Tyr His Phe Ile Trp 290 295 300 Val Val Ile Glu Ser Glu Arg Thr Lys Leu Ser Ser Asp Phe Leu Ala 305 310 315 320 Glu Val Glu Ala Glu Glu Lys Gly Leu Ile Val Ser Trp Cys Pro Gln 325 330 335 Leu Glu Val Leu Ser His Lys Ser Ile Gly Ser Phe Met Thr His Cys 340 345 350 Gly Trp Asn Ser Thr Val Glu Ala Le u Ser Leu Gly Val Pro Met Val 355 360 365 Ala Val Pro Gln Gln Phe Asp Gln Pro Val Asn Ala Lys Tyr Ile Val 370 375 380 Asp Val Trp Arg Ile Gly Val Gln Val Pro Ile Gly Glu Asn Gly Val 385 390 395 400 Leu Leu Arg Gly Glu Val Ala Asn Cys Ile Lys Asp Val Met Glu Gly 405 410 415 Glu Ile Gly Asp Glu Leu Arg Gly Asn Ala Leu Lys Trp Lys Gly Leu 420 425 430 Ala Val Glu Ala Met Glu Lys Gly Gly Ser Ser Asp Lys Asn Ile Asp 435 440 445 Glu Phe Ile Ser Lys Leu Val Ser Ser 450 455 <210> 38 <211> 1374 <212> DNA <213> Artificial Sequence <220> <223> UGT-MUT2 nucleotide sequence <400> 38 atggagagag aaatgttgag caaaactcac attatgttca tcccattccc agctcaaggc 60 cacatgagcc caatgatgca attcgtcaag cgtttagcct ggaaaggcgt gcgaatcacg 120 atagttcttc cacaagactcatagat tccaa cact 180 gagtgcatct cctttgattt tgataaagat gatgagatgc catacagcat gcgggcttat 240 atgggagttg taaagctcaa ggtcacaaat aaactgagtg acctactcga gaagcaaaaa 300 acaaatggct accctgttaa tttgctagtg gtcgattcat tatatccatc tcgggtagaa 360 atgtgccacc aacttggggt aaaaggagct ccatttttca ctcactcttg tgctgttggt 420 gccatttatt ataatgctcg cttagggaaa ttgaagatac ctcctgagga agggttgact 480 tctgtttcat tgccttcaat tccattgttg gggagaaatg atttgccaat tattaggact 540 ggcacctttc ctgatctctt tgagcatttg gggaatcagt tttcagatct tgataaagcg 600 gattggatct ttttcaatac ttttgataag cttgaaaatg aggaagcaaa atggctatct 660 agccattggc caattacatc catcggacca ttaatccctt caatgtactt agacaaacaa 720 ttaccaaatg acaaagacag cgacattaat ttctacaagg cagacgtcgg atcgtgcatc 780 aagtggctag acgccaaaga ccctggctcg gtagtctacg cctcattcgg gagcgtgaag 840 cacaacctcg gcgatgacta catggacgaa gtagcatggg gcttgttaca cagcaaatat 900 cacttcatat gggttgttat agaatccgaa cgtacaaagc tctctagcga tttcttggca 960 gaggtagagg cagaggaaaa aggcctaata gtgagttggt gccctcaact cgaagttttg 1020 tcacataaat ctataggtag ttttatgact cattgtggtt ggaactcgac ggttgaggca 1080 ttgagtttgg gcgtgccaat ggtggcagtg ccacaacagt ttgatcagcc tgttaatgcc 1140 aagtatatcg tggatgtatg gcgaattggg gttcaggttc cgattggtga aaatggggtt 1200 cttttgaggg gagaagttgc taactgtata aaggatgtta tggaggggga aataggggat 1260 gagcttagag ggaatgcttt gaaatggaag gggttggctg tggaggcaat ggagaaaggg 1320 ggtagctctg ataagaatat tgatgagttc atttcaaagc ttgtttcctc ctga 1374 <210> 39 <211> 457 < 212> PRT <213> Artificial Sequence <220> <223> UGT-MUT3 amino acid sequence <400> 39 Met Glu Arg Glu Met Leu Ser Lys Thr His Ile Met Phe Ile Pro Phe 1 5 10 15 Pro Ala Gln Gly His Met Ser Pro Met Met Gln Phe Val Lys Arg Leu 20 25 30 Ala Trp Lys Gly Val Arg Ile Thr Ile Val Leu Pro Ala Glu Ile Arg 35 40 45 Asp Ser Met Gln Ile Asn Asn Ser Leu Ile Asn Thr Glu Cys Ile Ser 50 55 60 Phe Asp Phe Asp Lys Asp Asp Glu Met Pro Tyr Ser Met Arg Ala Tyr 65 70 75 80 Met Gly Val Val Lys Leu Lys Val Thr Asn Lys Leu Ser Asp Leu Leu 85 90 95 Glu Lys Gln Lys Thr Asn Gly T yr Pro Val Asn Leu Leu Val Val Asp 100 105 110 Ser Leu Tyr Pro Ser Arg Val Glu Met Cys His Gln Leu Gly Val Lys 115 120 125 Gly Ala Pro Phe Phe Thr His Ser Cys Ala Val Gly Ala Ile Tyr Tyr 130 135 140 Asn Ala Arg Leu Gly Lys Leu Lys Ile Pro Glu Glu Gly Leu Thr 145 150 155 160 Ser Val Ser Leu Pro Ser Ile Pro Leu Leu Gly Arg Asn Asp Leu Pro 165 170 175 Ile Ile Arg Thr Gly Thr Phe Pro Asp Leu Phe Glu His Leu Gly Asn 180 185 190 Gln Phe Ser Asp Leu Asp Lys Ala Asp Trp Ile Phe Phe Asn Thr Phe 195 200 205 Asp Lys Leu Glu Asn Glu Glu Ala Lys Trp Leu Ser Ser His Trp Pro 210 215 220 Ile Thr Ser Ile Gly Pro Leu Ile Pro Ser Met Tyr Leu Asp Lys Gln 225 230 235 240 Leu Pro Asn Asp L ys Asp Ser Asp Ile Asn Phe Tyr Lys Ala Asp Val 245 250 255 Gly Ser Cys Ile Lys Trp Leu Asp Ala Lys Asp Pro Gly Ser Val Val 260 265 270 Tyr Ala Ser Phe Gly Ser Val Ile His Asn Leu Gly Asp Asp Tyr Met 275 280 285 Asp Glu Val Ala Trp Gly Leu Leu His Ser Lys Tyr His Phe Ile Trp 290 295 300 Val Val Ile Glu Ser Glu Arg Thr Lys Leu Ser Ser Asp Phe Leu Ala 305 310 315 320 Glu Val Glu Ala Glu Glu Lys Gly Leu Ile Val Ser Trp Cys Pro Gln 325 330 335 Leu Glu Val Leu Ser His Lys Ser Ile Gly Ser Phe Met Thr His Cys 340 345 350 Gly Trp Asn Ser Thr Val Glu Ala Leu Ser Leu Gly Val Pro Met Val 355 360 365 Ala Val Pro Gln Gln Phe Asp Gln Pro Val Asn Ala Lys Tyr Ile Val 370 375 380 Asp Val Trp Arg Ile Gly V al Gln Val Pro Ile Gly Glu Asn Gly Val 385 390 395 400 Leu Leu Arg Gly Glu Val Ala Asn Cys Ile Lys Asp Val Met Glu Gly 405 410 415 Glu Ile Gly Asp Glu Leu Arg Gly Asn Ala Leu Lys Trp Lys Gly Leu 420 425 430 Ala Val Glu Ala Met Glu Lys Gly Gly Ser Ser Asp Lys Asn Ile Asp 435 440 445 Glu Phe Ile Ser Lys Leu Val Ser 450 455 <210> 40 <211> 1374 <212> DNA <213> Artificial Sequence < 220> <223> UGT-MUT3 nucleotide sequence <400> 40 atggagagag aaatgttgag caaaactcac attatgttca tcccattccc agctcaaggc 60 cacatgagcc caatgatgca attcgtcaag cgtttagcct ggaaaggcgt gcgaatcacg 120 atagttcttc cggctgagat tcgagattct atgcaaataa acaactcatt gatcaacact 180 gagtgcatct cctttgattt tgataaagat gatgagatgc catacagcat gcgggcttat 240 atgggagttg taaagctcaa ggtcacaaat aaactgagtg acctactcga gaagcaaaaa 300 acaaatggct accctgttaa tttgctagtg gtcgattcat tatatccatc tcg ggtagaa 360 atgtgccacc aacttggggt aaaaggagct ccatttttca ctcactcttg tgctgttggt 420 gccatttatt ataatgctcg cttagggaaa ttgaagatac ctcctgagga agggttgact 480 tctgtttcat tgccttcaat tccattgttg gggagaaatg atttgccaat tattaggact 540 ggcacctttc ctgatctctt tgagcatttg gggaatcagt tttcagatct tgataaagcg 600 gattggatct ttttcaatac ttttgataag cttgaaaatg aggaagcaaa atggctatct 660 agccattggc caattacatc catcggacca ttaatccctt caatgtactt agacaaacaa 720 ttaccaaatg acaaagacag cgacattaat ttctacaagg cagacgtcgg atcgtgcatc 780 aagtggctag acgccaaaga ccctggctcg gtagtctacg cctcattcgg gagcgtgatt 840 cacaacctcg gcgatgacta catggacgaa gtagcatggg gcttgttaca cagcaaatat 900 cacttcatat gggttgttat agaatccgaa cgtacaaagc tctctagcga tttcttggca 960 gaggtagagg cagaggaaaa aggcctaata gtgagttggt gccctcaact cgaagttttg 1020 tcacataaat ctataggtag ttttatgact cattgtggtt ggaactcgac ggttgaggca 1080 ttgagtttgg gcgtgccaat ggtggcagtg ccacaacagt ttgatcagcc tgttaatgcc 1140 aagtatatcg tggatgtatg gcgaattggg gttcaggttc cgattggtga aaatggggtt 1200 cttttgaggg gagaagttgc taactgtata aaggatgtta tggaggggga aataggggat 1260 gagcttagag ggaatgcttt gaaatggaag gggttggctg tggaggcaat ggagaaaggg 1320 ggtagctctg ataagaatat tgatgagttc atttcaaagc ttgtttcctc ctaa 1374 <210> 41 <211> 457 < 212> PRT <213> Artificial Sequence <220> <223> Pn50-Q222H-VE amino ac id sequence <400> 41 Met Glu Arg Glu Met Leu Ser Lys Thr His Ile Met Phe Ile Pro Phe 1 5 10 15 Pro Ala Gln Gly His Met Ser Pro Met Met Gln Phe Val Lys Arg Leu 20 25 30 Ala Trp Lys Gly Val Arg Ile Thr Ile Val Leu Pro Ala Glu Ile Arg 35 40 45 Asp Ser Met Gln Ile Asn Asn Ser Leu Ile Asn Thr Glu Cys Ile Ser 50 55 60 Phe Asp Phe Asp Lys Asp Asp Glu Met Pro Tyr Ser Met Arg Ala Tyr 65 70 75 80 Met Gly Val Val Lys Leu Lys Val Thr Asn Lys Leu Ser Asp Leu Leu 85 90 95 Glu Lys Gln Lys Thr Asn Gly Tyr Pro Val Asn Leu Leu Val Val Asp 100 105 110 Ser Leu Tyr Pro Ser Arg Val Glu Met Cys His Gln Leu Gly Val Lys 115 120 125 Gly Ala Pro Phe Phe Thr His Ser Cys Ala Val Gly Ala Ile Tyr Tyr 130 135 140 Asn Ala Arg Leu Gly Lys Leu Lys Ile Pro Glu Glu Gly Leu Thr 145 150 155 160 Ser Val Ser Leu Pro Ser Ile Pro Leu Leu Gly Arg Asn Asp Leu Pro 165 170 175 Ile Ile Arg Thr Gly Thr Phe Pro Asp Leu Phe Glu His Leu Gly Asn 180 185 190 Gln Phe Ser Asp Leu Asp Lys Ala Asp Trp Ile Phe Phe Asn Thr Phe 195 200 205 Asp Lys Leu Glu Asn Glu Glu Ala Lys Trp Leu Ser Ser His Trp Pro 210 215 220 Ile Thr Ser Ile Gly Pro Leu Ile Pro Ser Met Tyr Leu Asp Lys Gln 225 230 235 240 Leu Pro Asn Asp Lys Asp Asn Asp Ile Asn Phe Tyr Lys Ala Asp Val 245 250 255 Gly Ser Cys Ile Lys Trp Leu Asp Ala Lys Asp Pro Gly Ser Val Val 260 265 270 Tyr Ala Ser Phe Gly Ser Val Lys His Asn Leu Gly Asp Asp Tyr Met 275 280 285 Asp Glu Val Ala Trp Gly Leu Leu His Ser Lys Tyr His Phe Ile Trp 290 295 300 Val Val Ile Glu Ser Glu Arg Thr Lys Leu Ser Ser Asp Phe Leu Ala 305 310 315 320 Glu Val Glu Ala Glu Glu Lys Gly Leu Ile Val Ser Trp Cys Pro Gln 325 330 335 Leu Glu Val Leu Ser His Lys Ser Ile Gly Ser Phe Met Thr His Cys 340 345 350 Gly Trp Asn Ser Thr Val Glu Ala Leu Ser Leu Gly Val Pro Met Val 355 360 365 Ala Val Pro Gln Gln Phe Asp Gln Pro Val Asn Ala Lys Tyr Ile Val 370 375 380 Asp Val Trp Arg Ile Gly Val Gln Val Pro Ile Gly Glu Asn Gly Val 385 390 395 400 Leu Leu Arg Gly Glu Val Ala Asn Cys Ile Lys Asp Val Met Glu Gly 405 410 415 Glu Ile Gly Asp Glu Leu Arg Gly Asn Ala Leu Lys Trp Lys Gly Leu 420 425 430 Ala Val Glu Ala Met Glu Lys Gly Gly Ser Ser Asp Lys Asn Ile Asp 435 440 445 Glu Phe Ile Ser Lys Leu Val Ser Ser 450 455 <210> 4 2 <211> 1374 <212> DNA <213> Artificial Sequence <220> <223> Pn50-Q222H-VE nucleotide sequence <400> 42 atggagagag aaatgttgag caaaactcac attatgttca tcccattccc agctcaagtct acatgagcta cacatgagct 60 cacatgagcc caatgatcagacagtgt caatgatg cacgtttcgtcaag gatcaacact 180 gagtgcatct cctttgattt tgataaagat gatgagatgc catacagcat gcgggcttat 240 atgggagttg taaagctcaa ggtcacaaat aaactgagtg acctactcga gaagcaaaaa 300 acaaatggct accctgttaa tttgctagtg gtcgattcat tatatccatc tcgggtagaa 360 atgtgccacc aacttggggt aaaaggagct ccatttttca ctcactcttg tgctgttggt 420 gccatttatt ataatgctcg cttagggaaa ttgaagatac ctcctgagga agggttgact 480 tctgtttcat tgccttcaat tccattgttg gggagaaatg atttgccaat tattaggact 540 ggcacctttc ctgatctctt tgagcatttg gggaatcagt tttcagatct tgataaagcg 600 gattggatct ttttcaatac ttttgataag cttgaaaatg aggaagcaaa atggctatct 660 agccattggc caattacatc catcggacca ttaatccctt caatgtactt agacaaacaa 720 ttaccaacaatg cacaaagaca ttgacattaat cgtgcatc 780 aagtggctag acgccaaaga ccctggctcg gtagtctacg cctcattcgg gagcgtgaag 840 cacaacctcg gcgatgacta catggacgaa gtagcatggg gcttgttaca cagcaaatat 900 cacttcatat gggttgttat agaatccgaa cgtacaaagc tctctagcga tttcttggca 960 gaggtagagg cagaggaaaa aggcctaata gtgagttggt gccctcaact cgaagttttg 1020 tcacataaat ctataggtag ttttatgact cattgtggtt ggaactcgac ggttgaggca 1080 ttgagtttgg gcgtgccaat ggtggcagtg ccacaacagt ttgatcagcc tgttaatgcc 1140 aagtatatcg tggatgtatg gcgaattggg gttcaggttc cgattggtga aaatggggtt 1200 cttttgaggg gagaagttgc taactgtata aaggatgtta tggaggggga aataggggat 1260 gagcttagag ggaatgcttt gaaatggaag gggttggctg tggaggcaat ggagaaaggg 1320ggtagctctagc ata tagattt t 374 t

Claims (16)

아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제222 부위에서의 아미노산 잔기는 Gln이 아니고, SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제322 부위에서의 아미노산 잔기는 Ala가 아니며,
아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제222 부위에서의 아미노산 잔기는 His이고,
아미노산 서열이 SEQ ID NO: 19로 표시되는 아미노산 서열에 대응되는 제322 부위에서의 아미노산 잔기는 Val, Ile 및 Leu 중 어느 하나이고,
아미노산 서열이 SEQ ID NO: 41로 표시되는 아미노산 서열에 대응되는 제247 부위에서의 아미노산 잔기는 Ser, Asn 및 Thr 중 어느 하나이고,
아미노산 서열이 SEQ ID NO: 41로 표시되는 아미노산 서열에 대응되는 제280 부위에서의 아미노산 잔기는 Ile, Lys 및 Ala 중 어느 하나인 분리된 폴리펩티드.
The amino acid residue at the 222 site whose amino acid sequence corresponds to the amino acid sequence shown in SEQ ID NO: 19 is not Gin, and the amino acid residue at the 322 site corresponding to the amino acid sequence shown in SEQ ID NO: 19 is Ala is not,
The amino acid residue at site 222 corresponding to the amino acid sequence of which the amino acid sequence is represented by SEQ ID NO: 19 is His,
The amino acid residue at site 322, whose amino acid sequence corresponds to the amino acid sequence shown in SEQ ID NO: 19, is any one of Val, Ile, and Leu,
The amino acid residue at site 247, whose amino acid sequence corresponds to the amino acid sequence shown in SEQ ID NO: 41, is any one of Ser, Asn, and Thr;
The isolated polypeptide, wherein the amino acid residue at site 280, the amino acid sequence of which corresponds to the amino acid sequence shown in SEQ ID NO: 41, is any one of Ile, Lys and Ala.
(a) SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 또는 SEQ ID NO.: 41로 표시되는 아미노산 서열을 갖는 분리된 폴리펩티드.(a) an isolated polypeptide having an amino acid sequence represented by SEQ ID NO.: 21, SEQ ID NO.: 35, SEQ ID NO.: 37, SEQ ID NO.: 39 or SEQ ID NO.: 41. (A) 제1항 또는 제2항에 따른 폴리펩티드를 코딩하는 뉴클레오티드 서열;
(B) SEQ ID NO.: 22, SEQ ID NO.: 36, SEQ ID NO.: 38, SEQ ID NO.: 40 또는 SEQ ID NO.: 42로 표시되는 뉴클레오티드 서열; 및
(C) (A) 및 (B) 중 어느 하나에 따른 뉴클레오티드 서열에 상보적인 뉴클레오티드 서열로 구성된 군으로부터 선택되는 분리된 폴리 뉴클레오티드.
(A) a nucleotide sequence encoding a polypeptide according to claim 1 or 2;
(B) a nucleotide sequence represented by SEQ ID NO.: 22, SEQ ID NO.: 36, SEQ ID NO.: 38, SEQ ID NO.: 40 or SEQ ID NO.: 42; and
(C) an isolated polynucleotide selected from the group consisting of a nucleotide sequence complementary to the nucleotide sequence according to any one of (A) and (B).
제3항에 따른 폴리 뉴클레오티드를 포함하는 것을 특징으로 하는 전달체.A delivery system comprising the polynucleotide according to claim 3 . 삭제delete 삭제delete 글리코실트랜스퍼라제 존재 하에서, 글리코실기 공여체의 글리코실기를 테트라시클릭트리터페노이드계 화합물의 C-3 부위의 히드록실기에 전이시켜 글리코실화된 테트라시클릭트리터페노이드계 화합물를 형성하는 단계를 포함하고,
상기 글리코실트랜스퍼라제는 제1항 또는 제2항에 따른 폴리펩티드 또는 이의 유도 폴리펩티드인 것을 특징으로 하는 체외 글리코실화 방법.
In the presence of a glycosyltransferase, a glycosyl group of a glycosyl group donor is transferred to a hydroxyl group at the C-3 site of a tetracyclic triterpenoid compound to form a glycosylated tetracyclic triterpenoid compound do,
The glycosyltransferase is an in vitro glycosylation method, characterized in that the polypeptide according to claim 1 or 2 or a derivative thereof.
제1항 또는 제2항에 따른 분리된 폴리펩티드 존재하에,
글리코실기 촉매 반응을 하는 단계를 포함하는 글리코실기 촉매 반응을 수행하는 방법.
In the presence of the isolated polypeptide according to claim 1 or 2,
A method of performing a glycosyl group catalyzed reaction comprising the step of performing a glycosyl group catalyzed reaction.
제8항에 있어서,
상기 분리된 폴리펩티드는 하기 반응에 촉매 작용을 하거나 하기 반응에 촉매 작용을 하는 촉매의 제조에 사용되고,
Figure 112021129609048-pct00007

식 (I) 화합물 식(Ⅱ) 화합물;
상기 식 (I) 화합물 및 식 (Ⅱ) 화합물에서, R1은 H 또는 OH이며; R2는 H 또는 OH이고; R3은 H 또는 글리코실기이며; R4는 글리코실기인 방법.
9. The method of claim 8,
The isolated polypeptide is used to catalyze the following reaction or to prepare a catalyst that catalyzes the following reaction,
Figure 112021129609048-pct00007

Formula (I) compound Formula (II) compound;
In the compound of formula (I) and the compound of formula (II), R 1 is H or OH; R2 is H or OH; R3 is H or a glycosyl group; R4 is a glycosyl group.
유전자 조작된 숙주 세포에 있어서,
상기 유전자 조작된 숙주 세포는 제3항에 따른 전달체를 함유하는 유전자 조작된 숙주 세포.
In a genetically engineered host cell,
The genetically engineered host cell contains the carrier according to claim 3 .
제10항에 따른 숙주 세포를 사용하는 방법에 있어서,
효소 촉매 시약을 제조하거나, 글리코실트랜스퍼라제를 생성하거나, 촉매 세포로 사용되거나, 글리코실화된 테트라시클릭트리터페노이드계 화합물을 생성하기 위한 것을 특징으로 하는 숙주 세포를 사용하는 방법.
11. A method of using a host cell according to claim 10, comprising:
A method of using a host cell for preparing an enzyme catalyzed reagent, for producing a glycosyltransferase, for use as a catalytic cell, or for producing a glycosylated tetracyclic triterpenoid compound.
제10항에 따른 유전자 조작된 숙주 세포를 식물로 재생시키는 단계를 포함하고, 상기 유전자 조작된 숙주 세포는 식물 세포인 것을 특징으로 하는 유전자 변형 식물을 생성하는 방법.A method for producing a genetically modified plant comprising the step of regenerating the genetically engineered host cell according to claim 10 into a plant, wherein the genetically engineered host cell is a plant cell. 삭제delete 삭제delete 삭제delete 삭제delete
KR1020197037134A 2017-05-16 2018-05-14 Glycosyltransferases, mutants and applications thereof KR102418138B1 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201710344730.7A CN108866020A (en) 2017-05-16 2017-05-16 Glycosyl transferase, mutant and its application
CN201710344730.7 2017-05-16
PCT/CN2018/086738 WO2018210208A1 (en) 2017-05-16 2018-05-14 Glycosyltransferase, mutant, and application thereof

Publications (2)

Publication Number Publication Date
KR20200016268A KR20200016268A (en) 2020-02-14
KR102418138B1 true KR102418138B1 (en) 2022-07-07

Family

ID=64273390

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020197037134A KR102418138B1 (en) 2017-05-16 2018-05-14 Glycosyltransferases, mutants and applications thereof

Country Status (4)

Country Link
JP (1) JP7086107B2 (en)
KR (1) KR102418138B1 (en)
CN (2) CN108866020A (en)
WO (1) WO2018210208A1 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107475214B (en) * 2017-08-14 2019-10-08 中国科学院华南植物园 A kind of 7-O- glycosyl transferase and its encoding gene and application
CN109295027B (en) * 2018-11-06 2020-12-29 浙江华睿生物技术有限公司 Glycosyltransferase mutant
CN115838754A (en) * 2018-12-27 2023-03-24 中国医学科学院药物研究所 Recombinant bacterium for producing dammarenediol-II glucoside and application thereof
CN113444703B (en) * 2020-03-26 2023-09-01 生合万物(苏州)生物科技有限公司 Glycosyltransferase mutant for catalyzing sugar chain extension and application thereof
CN117737024B (en) * 2023-12-20 2024-06-21 皖西学院 Glycosyltransferase mutant and method for preparing acute ischemic cerebral apoplexy candidate drug SHPL-49 by using same

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104232723A (en) 2013-06-07 2014-12-24 中国科学院上海生命科学研究院 Glycosyl transferases and applications of glycosyl transferases
CN105087739A (en) 2014-05-12 2015-11-25 中国科学院上海生命科学研究院 Novel catalytic system for preparing rare ginsenosides and application thereof
CN105177100A (en) 2014-06-09 2015-12-23 中国科学院上海生命科学研究院 A group of glycosyl transferase, and applications thereof
CN105985938A (en) 2015-01-30 2016-10-05 中国科学院上海生命科学研究院 Glycosyl transferase mutant protein and applications thereof

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5952203A (en) * 1997-04-11 1999-09-14 The University Of British Columbia Oligosaccharide synthesis using activated glycoside derivative, glycosyl transferase and catalytic amount of nucleotide phosphate
CN1324940A (en) * 2000-05-19 2001-12-05 上海博德基因开发有限公司 New polypeptide UDP glycosyltransferase (UGT) and cobalamin binding protein 11 and polynucleotides for encoding same
KR101479615B1 (en) * 2012-09-27 2015-01-06 한국과학기술원 Novel UDP-glycosyltransferase derived from ginseng and use thereof
KR20180005716A (en) * 2012-12-06 2018-01-16 상하이 인스티튜츠 포 바이올로지컬 사이언시스, 차이니즈 아카데미 오브 사이언시스 Group of glycosyltransferases and use thereof
CN106459987B (en) * 2014-04-30 2019-12-03 韩国科学技术院 Make the new method of ginseng saponin glycosyl using the glycosyl transferase for being derived from ginseng
CN104357418B (en) * 2014-10-11 2017-11-10 上海交通大学 The application of a kind of glycosyl transferase and its mutant in ginseng saponin Rh 2 is synthesized

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104232723A (en) 2013-06-07 2014-12-24 中国科学院上海生命科学研究院 Glycosyl transferases and applications of glycosyl transferases
CN105087739A (en) 2014-05-12 2015-11-25 中国科学院上海生命科学研究院 Novel catalytic system for preparing rare ginsenosides and application thereof
CN105177100A (en) 2014-06-09 2015-12-23 中国科学院上海生命科学研究院 A group of glycosyl transferase, and applications thereof
CN105985938A (en) 2015-01-30 2016-10-05 中国科学院上海生命科学研究院 Glycosyl transferase mutant protein and applications thereof

Also Published As

Publication number Publication date
CN108866020A (en) 2018-11-23
WO2018210208A1 (en) 2018-11-22
CN110462033A (en) 2019-11-15
JP2020520244A (en) 2020-07-09
KR20200016268A (en) 2020-02-14
JP7086107B2 (en) 2022-06-17

Similar Documents

Publication Publication Date Title
KR102418138B1 (en) Glycosyltransferases, mutants and applications thereof
JP6479084B2 (en) A series of glycosyltransferases and their applications
KR102338008B1 (en) A group of UDP-glycosyltransferases and their applications to catalyze sugar chain extension
CN105087739B (en) A kind of new catalyst system and its application for preparing rare ginsenoside
WO2015188742A2 (en) Group of glycosyltransferases and use thereof
CN105985938A (en) Glycosyl transferase mutant protein and applications thereof
WO2023006109A1 (en) Highly specific glycosyltransferase for rhamnose, and use thereof
CN112831481B (en) Glycosyltransferase and method for catalyzing sugar chain extension
CN113444703B (en) Glycosyltransferase mutant for catalyzing sugar chain extension and application thereof

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant