CN1637143A - 生成合成胆固醇合成抑制剂莫那可林k的相关基因 - Google Patents

生成合成胆固醇合成抑制剂莫那可林k的相关基因 Download PDF

Info

Publication number
CN1637143A
CN1637143A CNA2004101025835A CN200410102583A CN1637143A CN 1637143 A CN1637143 A CN 1637143A CN A2004101025835 A CNA2004101025835 A CN A2004101025835A CN 200410102583 A CN200410102583 A CN 200410102583A CN 1637143 A CN1637143 A CN 1637143A
Authority
CN
China
Prior art keywords
polypeptide
polynucleotide
sequence number
nucleotide sequence
recognition sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2004101025835A
Other languages
English (en)
Inventor
陈煜沛
廖丽玲
王俊霖
李钟财
黄英娥
曾庆平
袁国芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FOODSTUFF INDUSTRIAL AND DEVELOPMENT INST
Original Assignee
FOODSTUFF INDUSTRIAL AND DEVELOPMENT INST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FOODSTUFF INDUSTRIAL AND DEVELOPMENT INST filed Critical FOODSTUFF INDUSTRIAL AND DEVELOPMENT INST
Publication of CN1637143A publication Critical patent/CN1637143A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/62Carboxylic acid esters
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/39Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • C12P17/06Oxygen as only ring hetero atoms containing a six-membered hetero ring, e.g. fluorescein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01088Hydroxymethylglutaryl-CoA reductase (1.1.1.88)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Mycology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及生成合成胆固醇合成抑制剂莫那可林K的相关基因,红曲菌生成的胆固醇合成抑制剂莫那可林k为聚缩酮的二次代谢产物。本发明提供一种专一于莫那可林K生合成基因群的探针,由BAC基因库筛选出具有推定莫那可林K基因群的BAC转殖株,并经定序与批注,得到相关于莫那可林K生合成的2个聚缩酮合成酶基因,以及7个调控基因。经RT-PCR得到上述基因的全长cDNA,并转化到表达载体上以表达上述基因。本发明还提供了增加莫那可林k生成的方法,提高了生产效率。

Description

生成合成胆固醇合成抑制剂莫那可林K的相关基因
技术领域
本发明是关于分子生物与微生物学领域,更特别地,本发明是关于胆固醇合成抑制剂莫那可林K(monacolin K)生合成相关基因。
背景技术
在中国,红曲霉菌(Monascus)在食品的应用上已有千年的历史,更因其能产生多项生理活性物质而日渐被重视。这些生理活性物质主要为红曲霉的二次代谢产物,包括降血压物质、抗腐败菌物质(例如:monascidin)、防癌物质、降血糖物质、麦角固醇(ergosterol)、抗氧化物质、长链脂肪酸及胆固醇合成抑制剂(例如:monacolin)。因此,红曲霉成为近年来相当被重视的机能性健康保健食品。
红曲霉菌所产生的胆固醇抑制剂最早是由日本三共制药公司自红曲霉菌(Monascus rubber)的培养液中找到monacolin k。之后美国莫克(Merck)药厂也从土曲霉菌(Aspergillus terreus)的培养液中发现同一种化合物,命名为洛伐他汀(音译lovastatin),此胆固醇合成抑制剂是作为一HMG-CoA还原酶抑制剂(HMG-CoAReductase Inhibitors)。Monacolin K属于一聚缩酮类(polyketide)产物,其在结构上与HMG-CoA具有相似性,所以在胆固醇合成的过程中,monacolin k会与HMG-CoA进行竞争性抑制,使HMG-CoA还原酶无法进一步催化HMG-CoA形成mevolonate,降低胆固醇的合成。
真菌所产生的聚缩酮类(polyketide)二次代谢产物会表现出结构多样性,及其它各种在细菌中所没有的特征(O’Hagan,1995),这些特征也表现在形成聚缩酮类(polyketide)物质的酶多样性上。红曲霉所产生的monacolin k亦为聚缩酮类的一种,根据其它对于真菌聚缩酮类的研究发现,聚缩酮类的组成是由多功能的聚缩酮类生合成酶(polyketide synthase,PKS)催化乙酰辅酶A(acetyl CoA)进行缩合反应(condensation)而形成各种不同的产物(Kennedy et al.,1999 and Abe et al.,2002)。经由真菌聚缩酮类生合成酶(polyketide synthase,PKS)的研究,并通过配合组合生合成(combinatorial biosynthesis)方法,未来对于开创新颖的聚缩酮类物质(novel polyketide)将具有相当大的潜力(McDaniel et al.,1999),其所产生的新颖的聚缩酮类则可做为将来筛选有效药物的另一种新途径。
发明内容
因此,本发明的一实施型态为提供一种分离的DNA分子,包括序列识别号:1的核苷酸序列,或于严苛条件下可与其杂交的核苷酸序列。该严苛条件可以参见说明书所附的文献。
本发明的另一实施形态提供一种分离的DNA分子,其包括择自以下一个或多个所列物组成的族群的聚核苷酸:a)一mkA聚核苷酸,包括序列识别号:2的核苷酸序列,b)一mkB聚核苷酸,包括序列识别号:3的核苷酸序列,c)一mkC聚核苷酸,包括序列识别号:4的核苷酸序列,d)一mkD聚核苷酸,包括序列识别号:5的核苷酸序列,e)一mkE聚核苷酸,包括序列识别号:6的核苷酸序列,f)一mkF聚核苷酸,包括序列识别号:7的核苷酸序列,g)一mkG聚核苷酸,包括序列识别号:8的核苷酸序列,h)一mkH聚核苷酸,包括序列识别号:9的核苷酸序列,i)一mkI聚核苷酸,包括序列识别号:10的核苷酸序列,以及j)一在严苛条件下可与a)、b)、c)、d)、e)、f)、g)、h)、或i)杂交的聚核苷酸。
本发明的又一实施形态是提供一种穿梭载体(shuttlevector),其包括上述定义的分离的DNA分子。
上述定义的分离的DNA分子,其是a)。
上述定义的分离的DNA分子,其是b)。
上述定义的分离的DNA分子,其是c)。
上述定义的分离的DNA分子,其是d)。
上述定义的分离的DNA分子,其是e)。
上述定义的分离的DNA分子,其是f)。
上述定义的分离的DNA分子,其是g)。
上述定义的分离的DNA分子,其是h)。
上述定义的分离的DNA分子,其是i)。
上述定义的分离的DNA分子,其中该聚核苷酸编码一多肽,该多肽具有择自以下一个或多个所列物所组成族群的活性:β-酮酰基合成酶(β-ketoacyl synthase),乙酰转移酶(acetyltransferase),脱水酶(dehydratase),甲基转移酶(methyltransferase),酮还原酶(ketoreductase),及酰基携带蛋白(acyl carrier protein)。
上述的DNA分子,其中该聚核苷酸编码一多肽,该多肽具有九缩酮合成酶的活性。
上述的DNA分子,其中该聚核苷酸编码一多肽,该多肽具有择自以下一个或多个所列物所组成族群的活性:β-酮酰基合成酶(β-ketoacyl synthase),乙酰转移酶(acetyl transferase),脱水酶(dehydratase),甲基转移酶(methyltransferase),酮还原酶(ketoreductase),酰基携带蛋白(acyl carrier protein),以及酰脂基还原酶(enoyl reductase)。
上述的DNA分子,其中该聚核苷酸编码一多肽,该多肽具有二缩酮合成酶的活性。
上述的DNA分子,其中该聚核苷酸编码一多肽,该多肽具有单加氧酶(monooxygenase)活性。
上述的DNA分子,其中该聚核苷酸编码一多肽,该多肽具有氧化还原酶(oxidoreductase)活性。
上述的DNA分子,其中该聚核苷酸编码一多肽,该多肽具有去氢酶(dehydrogenase)活性。
上述的DNA分子,其中该聚核苷酸编码一多肽,该多肽具有转酯酶(transesterase)活性。
上述的DNA分子,其中该聚核苷酸编码一多肽,该多肽具有HMG-CoA还原酶活性。
上述的DNA分子,其中该聚核苷酸编码一多肽,该多肽具有转录因子活性。
本发明的再一实施形态是提供一种分离的DNA分子,其包括一择自以下组成的族群的聚核苷酸:a)一mkA聚核苷酸,包括序列识别号:19的核苷酸序列,b)一mkB聚核苷酸,包括序列识别号:20的核苷酸序列,c)一mkC聚核苷酸,包括序列识别号:21的核苷酸序列,d)一mkD聚核苷酸,包括序列识别号:22的核苷酸序列,e)一mkE聚核苷酸,包括序列识别号:23的核苷酸序列,f)一mkF聚核苷酸,包括序列识别号:24的核苷酸序列,g)一mkG聚核苷酸,包括序列识别号:27的核苷酸序列,h)一mkH聚核苷酸,包括序列识别号:25的核苷酸序列,i)一mkI聚核苷酸,包括序列识别号:26的核苷酸序列,以及j)一在严苛条件下可与a)、b)、c)、d)、e)、f)、g)、h)、或i)杂交的聚核苷酸。
本发明的又一实施形态是提供一种表达载体,其包括上述定义的分离的DNA分子。
上述定义的分离的DNA分子,其是a),且编码一多肽,该多肽具有择自以下一个或多个所列物所组成族群的活性:β-酮酰基合成酶(β-ketoacyl synthase),乙酰转移酶(acetyltransferase),脱水酶(dehydratase),甲基转移酶(methyltransferase),酮还原酶(ketoreductase),及酰基携带蛋白(acyl carrier protein)。
上述的DNA分子,其中该多肽具有九缩酮合成酶的活性。
上述定义的分离的DNA分子,其是b),且编码一多肽,该多肽具有择自以下一个或多个所列物所组成族群的活性:β-酮酰基合成酶(β-ketoacyl synthase),乙酰转移酶(acetyltransferase),脱水酶(dehydratase),甲基转移酶(methyltransferase),酮还原酶(ketoreductase),酰基携带蛋白(acyl carrier protein),以及酰脂基还原酶(enoyl reductase)。
上述的DNA分子,其中该多肽具有二缩酮合成酶的活性。
上述定义的分离的DNA分子,其是c),且编码一多肽,该多肽具有单加氧酶(monooxygenase)活性。
上述定义的分离的DNA分子,其是d),且编码一多肽,该多肽具有氧化还原酶(oxidoreductase)活性。
上述定义的分离的DNA分子,其是e),且编码一多肽,该多肽具有去氢酶(dehydrogenase)活性。
上述定义的分离的DNA分子,其是f),且编码一多肽,该多肽具有转酯酶(transesterase)活性。
上述定义的分离的DNA分子,其是g),且编码一多肽,该多肽具有HMG-CoA还原酶活性。
上述定义的分离的DNA分子,其是h),且编码一多肽,该多肽具有转录因子活性。
上述定义的分离的DNA分子,其是i),且编码一多肽,该多肽具有外排泵(efflux pump)活性。
此外,本发明的一实施形态提供一细胞,其转化有一择自以下组成的族群的聚核苷酸:a)一mkA聚核苷酸,包括序列识别号:2或19的核苷酸序列,b)一mkB聚核苷酸,包括序列识别号:3或20的核苷酸序列,c)一mkC聚核苷酸,包括序列识别号:4或21的核苷酸序列,d)一mkD聚核苷酸,包括序列识别号:5或22的核苷酸序列,e)一mkE聚核苷酸,包括序列识别号:6或23的核苷酸序列,f)一mkF聚核苷酸,包括序列识别号:7或24的核苷酸序列,g)一mkG聚核苷酸,包括序列识别号:8或27的核苷酸序列,h)一mkH聚核苷酸,包括序列识别号:9或25的核苷酸序列,i)一mkI聚核苷酸,包括序列识别号:10或26的核苷酸序列,以及j)上述聚核苷酸的组合。
上述的细胞为细菌,酵母菌,动物细胞,昆虫细胞,植物细胞,或丝状真菌。
上述的细胞为红曲霉菌属。
上述的细胞是择自以下一个或多个所列物所组成的族群:红曲霉pilosus,红曲霉ruber,以及红曲霉purpureus。
上述的细胞为红曲霉菌BCRC 38072。
尚且,本发明的一实施形态是提供一种增加HMG-CoA还原酶抑制剂生成的方法。上述细胞转化有一择自以下组成的族群的聚核苷酸:a)一mkA聚核苷酸,包括序列识别号:2或19的核苷酸序列,b)一mkB聚核苷酸,包括序列识别号:3或20的核苷酸序列,c)一mkC聚核苷酸,包括序列识别号:4或21的核苷酸序列,d)一mkD聚核苷酸,包括序列识别号:5或22的核苷酸序列,e)一mkE聚核苷酸,包括序列识别号:6或23的核苷酸序列,f)一mkF聚核苷酸,包括序列识别号:7或24的核苷酸序列,g)一mkH聚核苷酸,包括序列识别号:9或25的核苷酸序列,以及h)上述聚核苷酸的组合,以及由上述细胞收集HMG-CoA还原酶抑制剂。
上述的增加莫那可林K生成的方法,其中该细胞是真菌细胞。
上述的增加莫那可林K生成的方法,其中该细胞是红曲霉菌属。
上述的增加莫那可林K生成的方法,其中该细胞是择自以下一个或多个所列物所组成的族群:红曲霉pilosus,红曲霉ruber,以及红曲霉purpureus。
上述的增加莫那可林K生成的方法,其中该细胞是红曲霉菌BCRC 38072。
上述的增加莫那可林K生成的方法,其中该聚核苷酸为g)。
再者,本发明的一实施形态是提供一种增加monacolin K生成的方法。上述方法包括培养一可增加monacolin K生成的细胞。该细胞是转化有一择自上述组成的族群的聚核苷酸,以及由上述细胞收集monacolin K。
另外,本发明的一实施形态是提供一种生成HMG-CoA还原酶抑制剂的方法。上述方法包括培养一可生成HMG-CoA还原酶抑制剂的细胞,上述细胞转化有一聚核苷酸,以及由上述细胞收集HMG-CoA还原酶抑制剂。上述聚核苷酸包括:a)一mkA聚核苷酸,包括序列识别号:2或19的核苷酸序列,b)一mkB聚核苷酸,包括序列识别号:3或20的核苷酸序列,c)一mkE聚核苷酸,包括序列识别号:6或23的核苷酸序列,以及d)一mkF聚核苷酸,包括序列识别号:7或24的核苷酸序列。于另一实施形态中,上述HMG-CoA还原酶抑制剂为monacolin K。
上述的方法中该HMG-CoA还原酶抑制剂为莫那可林K。
上述的方法中该细胞为细菌,酵母菌,动物细胞,昆虫细胞,植物细胞,或丝状真菌。
上述的方法中该细胞为红曲霉菌属。
上述的方法中该细胞是择自以下一个或多个所列物所组成的族群:红曲霉pilosus,红曲霉ruber,以及红曲霉purpureus。
上述的方法中该细胞为红曲霉菌BCRC 38072。
上述的方法中该细胞更转化有一择自所组成的聚核苷酸:
a)mkC的聚核苷酸,其包括序列识别号:4或21的核苷酸序列;
b)mkD的聚核苷酸,其包括序列识别号:5或22的核苷酸序列;
c)mkH的聚核苷酸,其包括序列识别号:9或25的核苷酸序列;以及
d)以上的组合。
而且,本发明的一实施形态又是提供一种分离的DNA分子,其包括一编码择自以下组成的族群的多肽的聚核苷酸:a)一包括序列识别号:11的氨基酸序列的多肽,b)一包括序列识别号:12的氨基酸序列的多肽,c)一包括序列识别号:13的氨基酸序列的多肽,d)一包括序列识别号:14的氨基酸序列的多肽,e)一包括序列识别号:15的氨基酸序列的多肽,f)一包括序列识别号:16的氨基酸序列的多肽,g)一包括序列识别号:28的氨基酸序列的多肽,h)一包括序列识别号:17的氨基酸序列的多肽,i)一包括序列识别号:18的氨基酸序列的多肽,以及j)一在严苛条件下可与编码a)、b)、c)、d)、e)、f)、g)、h)、或i)的聚核苷酸杂交的聚核苷酸。
上述的DNA分子中该多肽为a),且具有择自以下一个或多个所列物所组成族群的活性:β-酮酰基合成酶(β-ketoacylsynthase),乙酰转移酶(acetyl transferase),脱水酶(dehydratase),甲基转移酶(methyltransferase),酮还原酶(ketoreductase),及酰基携带蛋白(acyl carrier protein)。
上述的DNA分子中该多肽具有九缩酮合成酶的活性。
上述的DNA分子中该多肽为b),且具有择自以下一个或多个所列物所组成族群的活性:β-酮酰基合成酶(β-ketoacylsynthase),乙酰转移酶(acetyl transferase),脱水酶(dehydratase),甲基转移酶(methyltransferase),酮还原酶(ketoreductase),酰基携带蛋白(acyl carrier protein),以及酰脂基还原酶(enoyl reductase)。
上述的DNA分子中该多肽为c),且具有二缩酮合成酶的活性。
上述的DNA分子中该多肽为c),且具有单加氧酶(monooxygenase)活性。
上述的DNA分子中该多肽为d),且具有氧化还原酶(oxidoreductase)活性。
上述的DNA分子中该多肽为e),且具有去氢酶(dehydrogenase)活性。
上述的DNA分子中该多肽为f),且具有转酯酶(transesterase)活性。
上述的DNA分子中该多肽为g),且具有HMG-CoA还原酶活性。
上述的DNA分子中该多肽为h),且具有转录因子活性。
上述的DNA分子中该多肽为i),且具有外排泵(efflux pump)活性。
一种表达载体,其包括如上述的分离的DNA分子。
本发明于红曲霉中寻找到产生monacolin k的相关基因,并提供了增加monacolin k生成的方法,提高了生产效率。
附图说明
图1A至1G显示红曲霉菌与其它霉菌的聚缩酮合成酶,及大鼠脂肪酸功能部位的序列比对。图1A显示酮酰基合成酶的比对,图1B显示酰基转移酶的比对,图1C显示脱水酶的比对,图1D显示甲基转移酶的比对,图1E显示酰脂基还原酶的比对,图1F显示酮酰基还原酶的比对,图1G显示酰基携带蛋白的比对。
图2显示红曲霉菌mk基因群在第3天的表达情形。
图3A与3B分别显示pPICZamkA与pPICZamkB的图谱。
图4显示以VectorNTI分析MKH氨基酸序列与推定的Zn(II)Cys6二核功能区域。方框中的氨基酸序列代表Zn(II)Cys6二合功能区域,6个半胱胺酸标示为灰色。
图5显示构筑含有聚缩酮合成酶mkA基因的大肠杆菌表达载体的构筑流程。设计一组寡核苷酸引物(p3与p4),以RT-PCR方式增幅mkA基因的部分cDNA(6.5kb)。另设计p1与p2引物,以RT-PCR方式增幅mkA基因的部分cDNA(3.0kb)。
图6显示构筑含有枯草杆菌的4’-磷酸泛酰巯乙胺转移酶sfp基因的大肠杆菌表达载体的流程。
图7显示于大肠杆菌表达mkA与sfp基因的SDS-PAGE结果照片。第1栏代表含有对照组质粒pCDF-1b与pET30的大肠杆菌的总蛋白质,第2栏代表将表达载体pCDFsfp(含sfp基因)与pETmkA(含mkA基因)与加样缓冲液(loading buffer)在滚水中煮过的混合物。蛋白质是以胶体考马斯蓝染色。箭头代表Sfp与MKA的位置。溶解的蛋白质是以ProBondTM纯化系统(Invitrogen)纯化。第3栏代表将溶胞产物于3000×g离心60分钟的沉淀物,以及第4栏代表以Ni-管柱纯化的蛋白质。
菌种保藏情况:大肠杆菌EP1300:pMPF 001、大肠杆菌EP1300:pMPF 002、大肠杆菌DH5α:pMS-acuF、大肠杆菌DH5α:pMS-Hsp已于公元2003年12月5日被寄存于美国典型培养物保藏中心(ATCC,P.O.Box 1549,Manassas,VA 20110-2209,USA),寄存编号分别为PTA-5685、PTA-5686、PTA-5687、PTA-5688。
具体实施方式
根据Nicholson(2001)等人针对土曲霉菌(Aspergillusterreus)的洛伐他汀(lovastatin)生合成基因所设计的简并引物(degenerate primers),进一步设计出针对红曲霉的专一性探针,利用菌落杂交(colony hybridization)方式,自红曲霉BAC基因库中筛选并定序及批注分析出包括有monacolin k生合成基因。利用RT-PCR得到两个完整的PKS全长cDNA,并将此cDNA选殖至表达质粒中,以做为PKS的表达。
自从1980年代红曲霉菌被发现可产生胆固醇抑制剂后,红曲霉菌在降血压、血糖与胆固醇的功效上即备受瞩目。红曲霉菌除了可产生monacolin k之外,亦能从中分离出与monacolin k具有相同基本结构的降胆固醇物质,例如:monacolin J,L,M,及X等(Endo et al.,1979,1985,1986 and Komagata et al.,1989),monacolin J与L为形成monacolin k的前驱物。Monacolin k之所以可以抑制胆固醇的合成在于其结构与HMG-CoA具有的相似性,因此monacolin k会与HMG-CoA还原酶进行键结,使得HMG-CoA无法通过HMG-CoA还原酶的催化形成Mevolonate,降低胆固醇的合成。所以目前在市面上除了monacolin k之外,也有其它经由生物转换或化学修饰等方法而产生的胆固醇抑制剂,其在结构上都具有HMG-CoA的相似性,例如普伐他汀(音译Pravastatin),辛伐他汀(音译Simvastatin),氟伐他汀(音译Fluvastatin)与阿托伐他汀(音译Atorvastatin)等。
本发明的目的是于红曲霉中寻找产生monacolin k的相关基因。本发明所分析的标的为红曲霉菌Monascus sp.BCRC 38072,将之依照Hawksworth & Pitt(1983)的分类系统进行观察及鉴定,其型态特征如下:
宏观特征:
CYA,25℃,7天。菌落直径25-26mm,菌丝体开始为白色,渐渐变成淡红橘色,复转为深红橘色。
MEA,25℃,7天。菌落直径48mm,亮红橘色,复转为鲜红橘色。
G25N,25℃,7天。菌落直径28-29mm,深红橘色,中央为深黄橘色。
微观特征:
分生粉孢子(aleuriocondia)通常为单生或成短链,为倒梨状(obpyriform)至球状(globose),大小为10-13×8-10μm。其有性世代闭囊壳(Cleistothecia)为球状(globose),直径37-72μm。子囊孢子(ascospore)为透明,椭圆形,大小为4.6-6.3(-6.6)×3.3-4.2μm。
根据以上观察,BCRC 38072的特征分析如下:
形态特征:BCRC 38072介于M.pilosus与M.ruber之间。
1.依据菌落颜色与生长速度以及分生粉孢子的着生方式,BCRC 38072与M.pilosus较接近。
2.依据子囊孢子形态大小,BCRC 38072与M.ruber较接近。
序列分析:BCRC 38072、M.pilosus与M.ruber的rDNAITS片段及β-微管蛋白(β-tubulin)基因部分序列100%相同。
综合形态特征与序列分析:BCRC 38072的学名暂定为Monascus pilosus K.Sato ex D Hawksw. & Pitt。
从Monascus sp.BCRC 38072分析得知酮合成酶(ketosynthase)保留区域的DNA序列,再设计长度约226bp(序列识别号:1)专一性高的探针,做为以后菌落印迹杂交、DNA印迹杂交与PCR反应等,此探针也可做为其它红曲霉的筛选。利用BLAST与VectorNTI进行BAC DNA的完整序列的批注及预测。在此BAC序列中获得9个与已知土曲霉菌(Aspergillus terreus)所产生洛伐他汀(lovastatin)的基因群具有很高相似度的基因,其相似度分别约达54%以上。此外亦发现monacolin k基因群与橘青霉菌(Penicillium citrinum)合成compactin(后也称美伐他汀,mevastatin)的基因群也具有很高的相似度,达49%以上。相似度比较如下表1。
表1:红曲霉菌的mk基因群,土曲霉菌的lov基因群,以及橘青霉菌的mlc基因群的相似度比较表
mk基因 氨基酸 分子量(kDa) 推测功能 同构型的lov基因 蛋白质相似度(%) 同构型的mlc基因 蛋白质相似度(%)
mkA 3075 338 聚缩酮类合成酶(polyketide syntase) lovB 76 mlcA 66
mkB 2547 276 聚缩酮类合成酶(polyketide synthase) lovF 73 mlcB 61
mkC 524 60.6 P450单加氧酶(monooxygenase) lovA 85 mlcC 67
mkD 263 28.9 氧化还原酶(oxidoreductase) lovG 67 mlcF 53
mkE 360 38.9 去氢酶(dehydrogenase) lovC 81 mlcG 70
mkF 413 46.8 转酯酶(transesterase) lovD 74 mlcH 63
mkG 1052 113 HMG-CoA还原酶(HMG-CoAreductase) lvrA 69 mlcD 39
mkH 455 49.4 转录因子(transcription factor) lovE 54 mlcR 49
mkI 543 57.5 外排泵(Efflux pump) lovI 81 mlcE 68
这9个基因包括两个聚缩酮合成酶(polyketide synthase)基因,其中的一为合成九缩酮(nonaketide)的基因,另一个为合成二缩酮(diketide)的基因,此外包括有一个单加氧酶(monooxygenase)基因、一个氧化还原酶(oxidoreductase)基因、一个去氢酶(dehydrogenase)基因、一个转酯酶(transesterase)基因、一个HMG-CoA还原酶基因、一个转录因子基因与一个外排泵(efflux pump)基因。本发明亦构筑红曲霉的fosmid基因库,并从fosmid end序列比对分析,筛选出2个转化株分别为pMPF001(包括mkB,mkD,mkE,mkF,mkG,mkH及mkI)与pMPF002(包括mkA,mkC,mkD,mkE,mkF,mkG,mkH及mkI),寄存于财团法人食品工业发展研究所生物资源保存及研究中心,编号前者为BCRC 940470,后者为BCRC 940471。其中进一步针对九缩酮(nonaketide)聚缩酮合成酶基因、二缩酮(diketide)聚缩酮合成酶与转录因子基因,分别就其功能性区域与各种已知曲菌(Aspergillus),青霉菌(Penicillium),叶斑菌(Cochliobolus),赤霉菌(Gibberella)微生物的聚缩酮类生合成基因与大鼠的脂肪生合成基因(FAS)作比对,结果显示上述三个基因的各功能性区域的氨基酸序列,与土曲霉菌(Aspergillusterreus)中合成洛伐他汀(lovastatin)以及橘青霉菌(Penicilliumcitrinum)中合成compactin(后也称美伐他汀,mevastatin)的各功能性区域的氨基酸序列具很高的相似性,请参见图1。本发明并萃取红曲霉总RNA进行RNA印迹杂交(Northern blot)的分析,各基因在转录程度的表达情形可参见图2。
本发明获得的两个聚缩酮类合成酶基因为多功能的酶:mkA基因具有β-酮酰基合成酶(β-ketoacyl synthase),乙酰转移酶(acetyl transferase),脱水酶(dehydratase),甲基转移酶(methyltransferase),酮还原酶(ketoreductase)及酰基携带蛋白(acyl carrier protein)等功能;mkB基因除了以上6个功能外,尚有酰脂基还原酶(enoyl reductase)的酶功能,参见图1。本发明利用RT-PCR的方式获得此两个基因的全长cDNA,并将此全长cDNA选殖入巴斯德毕赤氏酵母(Pichia pastoris)的表达系统,以表达出聚缩酮类的产物。由于聚缩酮合成酶基因属于多功能的酶,而本发明又获得完整的全长cDNA,因此可通过改组(shuffling)等技术进行DNA的重组,进而产生多样性的聚缩酮类产物,此技术是做为筛选新药物的另一新途径。目前也有相关的专利发展出这样的技术,例如美国专利第6221641号、第6391594号,但此都局限于细菌的表达,相较之下,真菌所产生的聚缩酮类二次代谢产物表现出结构的多样性及复杂性,因此利用本发明所得到的pPICZamkA(图3A)与pPICZamkB(图3B)可进一步的进行改组(shuffling)技术,以做为表达聚缩酮类多样性的表达质粒。
由此,本发明提供以下DNA分子、载体以及方法。
(I)用来筛选monacolin K生合成相关基因的探针
本发明是有关一种可用来筛选monacolin K生合成相关基因的探针,其包括序列识别号:1的核苷酸序列。该探针是根据Nicoholson(2001)等人针对土曲霉菌(Aspergillus terreus)的洛伐他汀(lovastatin)生合成基因所设计的简并引物(degenerateprimers),进一步针对红曲霉菌BCRC 38072设计出来的专一性探针。熟悉此项技术人士应可轻易地利用本发明的探针,经由已知的技术,例如杂交反应等,于其它有机体中分离和纯化与monacolin K相似的基因序列。
(II)九缩酮(Nonaketide)聚缩酮合成酶(mkA基因体DNA)
本发明有关一种分离的DNA分子,其包括序列识别号:2(mkA基因体DNA)的核苷酸序列,或与序列识别号:2的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号2:杂交,且编码具有九缩酮(nonaketide)聚缩酮合成酶活性的核苷酸序列。该DNA分子是由红曲霉菌BCRC 38072分离而来。此外熟悉此项技艺人士亦可依据本发明所揭示的DNA分子,经由已知的PCR、杂交等技术获得本发明所请求的序列。高度严苛杂交条件请参考EP 1325959 A1 P7[0036]节。九缩酮合成酶主要是催化1个乙酸(acetate)及8个丙二酸(malonate)形成九缩酮(nonaketide),此基因具有多功能区域,包括β-酮酰基合成酶(β-ketoacyl synthase),乙酰转移酶(acetyl transferase),脱水酶(dehydratase),甲基转移酶(methyltransferase),酮还原酶(ketoreductase)及酰基携带蛋白(acyl carrier protein)。在与其它物种进行功能性区域的比对结果亦发现红曲霉菌BCRC38072中mkA各功能区域的氨基酸序列与土曲霉菌(Aspergillusterreus)的lovB基因及橘青霉菌(Penicillium citrinum)的mlcA基因具有较高的相似度。
本发明亦有关一种载体,其包括序列识别号:2(mkA基因体DNA)的核苷酸序列,或与序列识别号:2的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:2杂交,且编码具有九缩酮合成酶活性的核苷酸序列。用于建构本发明载体的工具是指在适当的宿主细胞中可自行复制或可整合入宿主细胞的染色体的分子序列,其等诸如质粒、噬菌体与病毒等。较佳地,本发明使用的载体工具是为一表达载体。本发明的载体可进一步经由改组(shuffling)技术,产生多样性的聚缩酮类产物。有关改组技术可参考美国专利第6,221,641号及第6,391,594号。
本发明亦有关一种经转化的细胞,其包括一载体,上述载体包括序列识别号:2的核苷酸序列,或与序列识别号:2的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:2杂交,且编码具有九缩酮合成酶活性的核苷酸序列。上述转化细胞可为原核细胞与真核细胞,包括,但不限于,细菌、酵母菌、动物细胞、昆虫细胞、植物细胞以及丝状真菌,其特别是红曲霉菌属(Monascus sp.),特别是红曲霉菌属Monascuspilosus,Monascus ruber,或Monascus purpureus,更特别是BCRC 38072。转化的方法可以采用已知的宿主-载体系统,对属于曲菌属(Aspergillus)的丝状真菌进行转化,例如欧洲专利第1325959 A1 P5号[0022]节所述。
本发明亦有关一种增加monacolin K生成的方法,其包括(a)将序列识别号:2(mkA基因体DNA)的核苷酸序列,或与序列识别号:2的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:2杂交,且编码具有九缩酮合成酶活性的核苷酸序列,转化入一细胞中;(b)于允许该核苷酸序列表达的条件下,培养该转化细胞。较佳地,上述细胞是指原本就可产生monacolin K的细胞。
本发明亦有关一种增加HMG-CoA还原酶抑制剂生成的方法,其包括(a)将序列识别号:2(mkA基因体DNA)的核苷酸序列,或与序列识别号:2的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:2杂交,且编码具有九缩酮合成酶活性的核苷酸序列,转化入一细胞中;(b)于允许该核苷酸序列表达的条件下,培养该转化细胞;以及(c)回收HMG-CoA还原酶抑制剂。上述细胞可为原本就可产生monacolin K的细胞。其特别是真菌细胞,特别是红曲霉菌属(Monascus sp.),特别是红曲霉菌属Monascus pilosus,Monascus ruber,或Monascuspurpureus,更特别是BCRC 38072。
(III)二缩酮合成酶(mkB基因体DNA)
本发明有关一种分离的DNA分子,其包括序列识别号:3(mkB基因体DNA)的核苷酸序列,或与序列识别号:3的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:3杂交,且编码具有二缩酮合成酶活性的核苷酸序列。该DNA分子是由红曲霉菌BCRC 38072分离而来。此外熟悉此项技艺人士亦可依据本发明所揭示的DNA分子,经由已知的PCR、杂交等获得本发明所请求的序列。高度严苛杂交条件请参考EP 1325959 A1 P7[0036]节。二缩酮合成酶主要是生合成monacolin k的二缩酮支链,即2-丁酸甲酯(2-methylbyutyrate)。此基因具有多功能区域,包括β-酮酰基合成酶(β-ketoacylsynthase),乙酰转移酶(acetyl transferase),脱水酶(dehydratase),甲基转移酶(methyltransferase),酮还原酶(ketoreductase),酰基携带蛋白(acyl carrier protein),与酰脂基还原酶(enoyl reductase)。在与其它物种进行功能性区域的比对亦发现红曲霉菌BCRC 38072中mkB各功能区域与土曲霉菌(Aspergillus terreus)的lovF基因及橘青霉菌(Penicilliumcitrinum)的mlcB基因具有较高的相似度。
本发明亦有关一种载体,其包括序列识别号:3的核苷酸序列,或与序列识别号:3的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:3杂交,且编码具有二缩酮合成酶活性的核苷酸序列。用于建构本发明载体的工具是指在适当的宿主细胞中可自行复制或可整合入宿主细胞的染色体的分子序列,其等诸如质粒、噬菌体与病毒等。本发明的载体可进一步利用改组(shuffling)技术,产生多样性的聚缩酮。有关的改组技术可参考美国专利第6,221,641号及第6,391,594号。
本发明亦有关一种经转化的细胞,其包括一载体,上述载体包括序列识别号3:的核苷酸序列,或与序列识别号:3的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:3杂交,且编码具有二缩酮合成酶活性的核苷酸序列。上述转化细胞可为原核细胞或真核细胞,包括,但不限于,细菌、酵母菌、动物细胞、昆虫细胞、植物细胞以及丝状真菌,其特别是红曲霉菌,特别是Monascus pilosus,Monascus ruber,或Monascus purpureus,更特别是BCRC 38072。转化的方法可以采用已知的宿主-载体系统,对属于曲菌属(Aspergillus)的丝状真菌进行转化,例如欧洲专利第1325959 A1 P5号[0022]节所述。
本发明亦有关一种增加monacolin K生成的方法,其包括(a)将序列识别号:3(mkB基因体DNA)的核苷酸序列,或与序列识别号:3的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:3杂交,且编码具有二缩酮合成酶活性的核苷酸序列,转化入一细胞中;(b)于允许该核苷酸序列表达的条件下,培养该转化细胞。较佳地,上述细胞是指原本就可产生monacolin K的细胞。
本发明亦有关一种增加HMG-CoA还原酶抑制剂生成的方法,其包括(a)将序列识别号:3(mkB基因体DNA)的核苷酸序列,或与序列识别号:3的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:3杂交,且编码具有二缩酮合成酶活性的核苷酸序列,转化入一细胞中;(b)于允许该核苷酸序列表达的条件下,培养该转化细胞;以及(c)回收HMG-CoA还原酶抑制剂。上述细胞可为原本就可产生monacolin K的细胞。其特别是真菌细胞,特别是红曲霉菌属(Monascus sp.),特别是红曲霉菌属Monascus pilosus,Monascus ruber,或Monascuspurpureus,更特别是BCRC 38072。
(IV)转录因子(mkH基因体DNA)
本发明有关一种分离的DNA分子,其包括序列识别号:9(mkH基因体DNA)的核苷酸序列,或与序列识别号:9的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:9杂交,且编码具有转录因子活性的核苷酸序列。该DNA分子是由红曲霉菌BCRC 38072分离而来。此外熟悉此项技艺人士亦可依据本发明所揭示的DNA分子,经由已知的PCR、杂交等获得本发明所请求的序列。高度严苛杂交条件请参考EP1325959 A1 P7[0036]节。mkH基因经由Vector NTI比对发现此基因为二价锌6半胱胺酸二核功能部位(Zn(II)Cys6 binuclearmotif),其保守序列为Cys-X2-Cys-X6-Cys-X11-Cys-X2-Cys-X6-Cys(请参考图4)。
本发明亦有关一种载体,其包括序列识别号:9的核苷酸序列,或与序列识别号:9的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:9杂交,且编码具有转录因子活性的核苷酸序列。用于建构本发明载体的工具是指在适当的宿主细胞中可自行复制或可整合入宿主细胞的染色体的分子序列,其等诸如质粒、噬菌体与病毒等。较佳地,本发明使用的载体工具是为一表达载体。
本发明亦有关一种经转化的细胞,其包括一载体,上述载体包括一序列识别号:9的核苷酸序列,或与序列识别号:9的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:9杂交,且编码具有转录因子活性的核苷酸序列。上述转化细胞可为原核细胞或真核细胞,包括,但不限于,细菌、酵母菌、动物细胞、昆虫细胞、植物细胞以及丝状真菌,其特别是红曲霉菌(Monascus sp.),特别是Monascus pilosus,Monascusruber,或Monascus purpureus,更特别是BCRC 38072。转化的方法可以采用已知的宿主-载体系统,对属于曲菌属(Aspergillus)的丝状真菌进行转化,例如欧洲专利第1325959 A1P5号[0022]节所述。
本发明亦有关一种表达系统,其包括一载体,上述载体包括一序列识别号:9的核苷酸序列,或与序列识别号:9的序列分享95%相似性的核苷酸序列,或严苛杂交条件下可与序列识别号:9杂交,且编码具有转录因子活性的核苷酸序列,以及一可表达上述核苷酸序列的宿主细胞,其中上述载体是经由一转化方法被转化进入上述宿主细胞中。适合的宿主细胞包括细菌、酵母菌、动物细胞、昆虫细胞、植物细胞以及丝状真菌,其特别是红曲霉菌(Monascus sp.),特别是Monascus pilosus,Monascus ruber,或Monascus purpureus,更特别是BCRC 38072。转化的方法可以采用已知的宿主-载体系统,对属于曲菌属(Aspergillus)的丝状真菌进行转化,例如欧洲专利第1325959 A1 P5号[0022]节所述。
本发明亦有关一种增加monacolin K生成的方法,其包括(a)将序列识别号:9的核苷酸序列,或与序列识别号:9的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:9杂交,且编码具有转录因子活性的核苷酸序列,转化入一细胞中;(b)于允许该核苷酸序列表达的条件下,培养该转化细胞。较佳地,上述细胞是指原本就可产生monacolin K的细胞。
本发明亦有关一种增加HMG-CoA还原酶抑制剂生成的方法,其包括(a)将序列识别号:9(mkH基因体DNA)的核苷酸序列,或与序列识别号:9的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:9杂交,且编码具有转录因子活性的核苷酸序列,转化入一细胞中;(b)于允许该核苷酸序列表达的条件下,培养该转化细胞;以及(c)回收HMG-CoA还原酶抑制剂。上述细胞可为原本就可产生monacolin K的细胞。其特别是真菌细胞,特别是红曲霉菌属(Monascus sp.),特别是红曲霉菌属Monascus pilosus,Monascus ruber,或Monascuspurpureus,更特别是BCRC 38072。
(V)HMG-CoA还原酶抑制剂及Monacolin K的生产
本发明亦有关一种生成HMG-CoA还原酶抑制剂的方法,其包括(a)将序列识别号:2(mkA基因体DNA)、序列识别号:3(mkB基因体DNA)、序列识别号:6(mkE基因体DNA)及序列识别号:7(mkF基因体DNA)的核苷酸序列,或者是在高度严苛杂交条件下可与上述序列分别杂交,且分别编码具有九缩酮合成酶、二缩酮合成酶、去氢酶与转酯酶活性的核苷酸序列,转化入一细胞中;(b)于允许该核苷酸序列表达的条件下,培养该转化细胞;以及(c)回收monacolin K。上述细胞可为原本就可产生monacolin K的细胞。其特别是真菌细胞,特别是红曲霉菌(Monascus sp.),特别是Monascus pilosus,Monascus ruber,或Monascuspurpureus,更特别是BCRC 38072。根据Hutchinson(2000)及其团队针对洛伐他汀(lovastatin)生合成基因的研究推论,欲将洛伐他汀生合成基因于异源表达(heterologous expression)可能只需要九缩酮合成酶、二缩酮合成、去氢酶与转酯酶四种基因。其中九缩酮合成酶与去氢酶共同表达产生洛伐他汀的前驱物,二缩酮合成酶则形成2-丁酸甲酯,转酯酶则再进一步的将2-丁酸甲酯键结于九缩酮形成完整的洛伐他汀。再者,上述HMG-CoA还原酶抑制剂为monacolin K。
于上述方法中,可更进一步包括序列识别号:4(mkC基因体DNA)、序列识别号:5(mkD基因体DNA)、序列识别号:8(mkG基因体DNA)、序列识别号:9(mkH基因体DNA)及序列识别号:10(mkI基因体DNA)的核苷酸序列,或者是在高度严苛杂交条件下可与上述序列分别杂交,且分别编码具有细胞色素P450单加氧酶、氧化还原酶、HMG-CoA还原酶、转录因子与外排泵活性的核苷酸序列。
(VI)九缩酮(Nonaketide)聚缩酮合成酶(mkA cDNA)
本发明有关一种分离的DNA分子,其包括序列识别号:19(mkA cDNA)的核苷酸序列,或与序列识别号:19的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:19杂交,且编码具有九缩酮(nonaketide)聚缩酮合成酶活性的核苷酸序列。上述DNA分子是由红曲霉菌BCRC 38072分离而来。此外熟悉此项技艺人士亦可依据本发明所揭示的DNA分子,经由已知的PCR、杂交等技术获得本发明所请求的序列。高度严苛杂交条件请参考EP 1325959 A1 P7[0036]节。
本发明亦有关一种载体,其包括序列识别号:19(mkA cDNA)的核苷酸序列,或与序列识别号:19的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:19杂交,且编码具有九缩酮合成酶活性的核苷酸序列。用于建构本发明载体的工具是指在适当的宿主细胞中可自行复制或可整合入宿主细胞的染色体的分子序列,其等诸如质粒、噬菌体与病毒等。较佳地,本发明使用的载体工具是为一表达载体,更佳地,本发明使用的载体工具是pPICZαA(Invitrogen)。本发明建构完成的载体是pPICZamkA,其包括本发明的序列识别号:19。pPICZamkA是依据Molecular Cloning中的分子操作方法,将完整mkA基因的全长cDNA转化至pPICZαA上而得。本发明的载体可进一步经由改组(shuffling)技术,产生多样性的聚缩酮类产物。有关改组技术可参考美国专利第6,221,641号及第6,391,594号。
本发明亦有关一种经转化的细胞,其包括一载体,上述载体包括序列识别号:19,或与序列识别号:19的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:19杂交,且编码具有九缩酮合成酶活性的核苷酸序列。上述转化细胞可为原核细胞与真核细胞,包括,但不限于,细菌、酵母菌、动物细胞、昆虫细胞、植物细胞以及丝状真菌,其特别是红曲霉菌属(Monascus sp.),特别是红曲霉菌属Monascus pilosus,Monascus ruber,或Monascus purpureus,更特别是BCRC38072。转化的方法可以采用已知的宿主-载体系统,对属于曲菌属(Aspergillus)的丝状真菌进行转化,例如欧洲专利第1325959A1 P5号[0022]节所述。
本发明亦有关一种增加monacolin K生成的方法,其包括(a)将序列识别号19(mkA cDNA)的核苷酸序列,或与序列识别号:19的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:19杂交,且编码具有九缩酮合成酶活性的核苷酸序列,转化入一细胞中;(b)于允许该核苷酸序列表达的条件下,培养该转化细胞。较佳地,上述细胞是指原本就可产生monacolin K的细胞。
本发明亦有关一种增加HMG-CoA还原酶抑制剂生成的方法,其包括(a)将序列识别号:19(mkA cDNA)的核苷酸序列,或与序列识别号:19的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:19杂交,且编码具有九缩酮合成酶活性的核苷酸序列,转化入一细胞中;(b)于允许该核苷酸序列表达的条件下,培养该转化细胞;以及(c)回收HMG-CoA还原酶抑制剂。上述细胞可为原本就可产生monacolin K的细胞。其特别是真菌细胞,特别是红曲霉菌属(Monascus sp.),特别是红曲霉菌属Monascus pilosus,Monascus ruber,或Monascuspurpureus,更特别是BCRC 38072。
(VII)二缩酮合成酶(mkB cDNA)
本发明有关一种分离的DNA分子,其包括序列识别号:20(mkB cDNA)的核苷酸序列,或与序列识别号:20的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:20杂交且编码具有二缩酮合成酶活性的核苷酸序列。上述DNA分子是由BCRC 38072分离而来。此外熟悉此项技艺人士亦可依据本发明所揭示的DNA分子,经由已知的PCR、杂交等获得本发明所请求的序列。
本发明亦有关一种载体,其包括序列识别号:20的核苷酸序列,或与序列识别号:20的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:20杂交,且编码具有二缩酮合成酶活性的核苷酸序列。用于建构本发明载体的工具是指在适当的宿主细胞中可自行复制或可整合入宿主细胞的染色体的分子序列,其等诸如质粒、噬菌体与病毒等。较佳地,本发明使用的载体工具是为一表达载体。更佳地,本发明使用的载体工具是pPICZαC。本发明建构完成的载体是pPICZamkB,其包括本发明的序列识别号20。pPICZamkB是根据Molecular Cloning中分子操作方法将完整mkB基因的全长cDNA转化至pPICZαC上而得。本发明的载体可进一步利用改组技术,产生多样性的聚缩酮。有关改组技术可参考美国专利第6,221,641号及第6,391,594号。
本发明亦有关一种经转化的细胞,其包括一载体,上述载体包括一序列识别号:20的核苷酸序列,或与序列识别号:20的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:20杂交,且编码具有二缩酮合成酶活性的核苷酸序列。上述转化细胞可为原核细胞或真核细胞,包括,但不限于,细菌、酵母菌、动物细胞、昆虫细胞、植物细胞以及丝状真菌,其特别是红曲霉菌(Monascus sp.),特别是红曲霉菌属Monascuspilosus,Monascus ruber,或Monascus purpureus,更特别是BCRC 38072。转化的方法可以采用已知的宿主-载体系统,对属于曲菌属(Aspergillus)的丝状真菌进行转化,例如欧洲专利第1325959 A1 P5号[0022]节所述。
本发明亦有关一种增加monacolin K生成的方法,其包括(a)将序列识别号:20(mkB cDNA)的核苷酸序列,或与序列识别号:20的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:20杂交,且编码具有二缩酮合成酶活性的核苷酸序列,转化入一细胞中;(b)于允许该核苷酸序列表达的条件下,培养该转化细胞。较佳地,上述细胞是指原本就可产生monacolin K的细胞。
本发明亦有关一种增加HMG-CoA还原酶抑制剂生成的方法,其包括(a)将序列识别号:20(mkB cDNA)的核苷酸序列,或与序列识别号:20的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:20杂交,且编码具有二缩酮合成酶活性的核苷酸序列,转化入一细胞中;(b)于允许该核苷酸序列表达的条件下,培养该转化细胞;以及(c)回收HMG-CoA还原酶抑制剂。上述细胞可为原本就可产生monacolin K的细胞。其特别是真菌细胞,特别是红曲霉菌属(Monascus sp.),特别是红曲霉菌属Monascus pilosus,Monascus ruber,或Monascuspurpureus,更特别是BCRC 38072。
(VIII)转录因子(mkH cDNA)
本发明有关一种分离的DNA分子,其包括序列识别号:25(mkH cDNA)的核苷酸序列,或与序列识别号:25的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:25杂交,且编码具有转录因子活性的核苷酸序列。该DNA分子是由红曲霉菌BCRC 38072分离而来。此外熟悉此项技艺人士亦可依据本发明所揭示的DNA分子,经由已知的PCR、杂交等获得本发明所请求的序列。高度严苛杂交条件请参考EP1325959 A1 P7[0036]节。
本发明亦有关一种载体,其包括序列识别号:25的核苷酸序列,或与序列识别号:25的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:25杂交,且编码具有转录因子活性的核苷酸序列。用于建构本发明载体的工具是指在适当的宿主细胞中可自行复制或可整合入宿主细胞的染色体的分子序列,其等诸如质粒、噬菌体与病毒等。较佳地,本发明使用的载体工具是为一表达载体。更佳地,本发明使用的载体工具是pMS。本发明建构完成的载体是pMSmkH,其包括本发明的序列识别号25。pMSmkH是根据Molecular Cloning中分子操作方法将mkH基因转化至pMS上而得。
本发明亦有关一种经转化的细胞,其包括一载体,上述载体包括一序列识别号:25的核苷酸序列,或与序列识别号:25的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:25杂交,且编码具有转录因子活性的核苷酸序列。上述转化细胞可为原核细胞或真核细胞,包括,但不限于,细菌、酵母菌、动物细胞、昆虫细胞、植物细胞以及丝状真菌,其特别是红曲霉菌(Monascus sp.),特别是Monascus pilosus,Monascus ruber,或Monascus purpureus,更特别是BCRC38072。转化的方法可以采用已知的宿主-载体系统,对属于曲菌属(Aspergillus)的丝状真菌进行转化,例如欧洲专利第1325959A1 P5号[0022]节所述。
本发明亦有关一种表达系统,其包括一载体,上述载体包括一序列识别号:25的核苷酸序列,或与序列识别号:25的序列分享95%相似性的核苷酸序列,或严苛杂交条件下可与序列识别号:25杂交,且编码具有转录因子活性的核苷酸序列,以及一可表达上述核苷酸序列的宿主细胞,其中上述载体是经由一转化方法被转化进入上述宿主细胞中。适合的宿主细胞包括细菌、酵母菌、动物细胞、昆虫细胞、植物细胞以及丝状真菌,其特别是红曲霉菌(Monascus sp.),特别是Monascus pilosus,Monascus ruber,或Monascus purpureus,更特别是BCRC 38072。转化的方法可以采用已知的宿主-载体系统,对属于曲菌属(Aspergillus)的丝状真菌进行转化,例如欧洲专利第1325959 A1 P5号[0022]节所述。
本发明亦有关一种增加monacolin K生成的方法,其包括(a)将序列识别号:25的核苷酸序列,或与序列识别号:25的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:25杂交,且编码具有转录因子活性的核苷酸序列,转化入一细胞中;(b)于允许该核苷酸序列表达的条件下,培养该转化细胞。较佳地,上述细胞是指原本就可产生monacolin K的细胞。
本发明亦有关一种增加HMG-CoA还原酶抑制剂生成的方法,其包括(a)将序列识别号:25(mkH cDNA)的核苷酸序列,或与序列识别号:25的序列分享95%相似性的核苷酸序列,或在高度严苛杂交条件下可与序列识别号:25杂交,且编码具有转录因子活性的核苷酸序列,转化入一细胞中;(b)于允许该核苷酸序列表达的条件下,培养该转化细胞;以及(c)回收HMG-CoA还原酶抑制剂。上述细胞可为原本就可产生monacolin K的细胞。其特别是真菌细胞,特别是红曲霉菌属(Monascus sp.),特别是红曲霉菌属Monascus pilosus,Monascus ruber,或Monascuspurpureus,更特别是BCRC 38072。
(IX)HMG-CoA还原酶抑制剂及Monacolin K的生产
本发明亦有关一种生成HMG-CoA还原酶抑制剂的方法,其包括(a)将序列识别号:19(mkA cDNA)、序列识别号:20(mkBcDNA)、序列识别号:23(mkE cDNA)及序列识别号:24(mkFcDNA)的核苷酸序列,或者是在高度严苛杂交条件下可与上述序列分别杂交,且分别编码具有九缩酮合成酶、二缩酮合成酶、去氢酶与转酯酶活性的核苷酸序列,转化入一细胞中;(b)于允许该核苷酸序列表达的条件下,培养该转化细胞;以及(c)回收monacolin K。上述细胞可为原核细胞或真核细胞,包括,但不限于,细菌、酵母菌、动物细胞、昆虫细胞、植物细胞以及丝状真菌,其特别是红曲霉菌(Monascus sp.),特别是Monascuspilosus,Monascus ruber,或Monascus purpureus,更特别是BCRC 38072。根据Hutchinson(2000)及其团队针对洛伐他汀(lovastatin)生合成基因的研究推论,欲将洛伐他汀生合成基因于异源表达(heterologous expression)可能只需要九缩酮合成酶、二缩酮合成酶、去氢酶与转酯酶四种基因。其中九缩酮合成酶与去氢酶共同表达产生洛伐他汀的前驱物,二缩酮合成酶则形成2-丁酸甲酯,转酯酶则再进一步的将2-丁酸甲酯键结于九缩酮形成完整的洛伐他汀。再者,上述HMG-CoA还原酶抑制剂为monacolinK。
于上述方法中,可更进一步包括序列识别号:21(mkCcDNA)、序列识别号:22(mkD cDNA)、序列识别号:25(mkHcDNA)及序列识别号:26(mkI cDNA)的核苷酸序列,或者是在高度严苛杂交条件下可与上述序列分别杂交,且分别编码具有细胞色素P450单加氧酶、氧化还原酶、转录因子与外排泵活性的核苷酸序列。
以下将以具体实施例说明本发明。
实施例
实施例1:红曲霉的培养
将红曲霉真菌接种于PDA(Potato Dextrose Agar)试管斜面,放置于30℃中培养。之后刮取菌丝及孢子,将其接种于50mL培养基(7% glycerol,3% glucose,3% MSG,1.2% polypetone,0.2% NaNO3,0.1% MgSO4·7H2O)中,以200rpm的转速于25℃中培养。
实施例2:红曲霉BAC文库的建构
A.红曲霉细胞核的制备
收集红曲霉菌体,以灭过菌的去离子水冲洗,利用抽气过滤抽干菌体。加入已预冷10倍菌体重的清洗缓冲液(wash buffer:HB buffer+1.5% β-mercaptoethanol),放置搅拌器中将菌体打碎。利用Miracloth滤膜过滤可得红曲霉细胞核的部分。
B.DNA填充物(DNA plugs)与染色体DNA片段的制备
以HB缓冲液配制1.8%低熔解温度的琼脂糖(low meltingtemperature agarose)并置于50℃水浴中,以等体积的琼脂糖溶液与细胞核溶液均匀混合后,快速加入填充模型(plug mold,Bio-Rad)中,以蛋白酶K(1mg/mL)去除杂质。最后将填充物取出切成小碎片进行Hind III的部份酶切割作用(partialdigestion),将反应完毕的填充物置于1%琼脂糖凝胶中,进行脉冲式电泳分析。切取约200kb的DNA片段,利用电洗脱(electroelution)的方法进行DNA回收。
C.红曲霉基因库的构筑
使用pIndigoBAC-5 HindIII Ready(Epicentre),使载体与回收的DNA进行接合反应,之后再利用电转化方式,将DNA转化入感受态细胞中(Epicentre,TransforMaxTM EC 100TMelectrocompetent E.coli),待菌落长出后,点选菌落于384微孔盘中做为保存。
实施例3:核酸探针引物的设计及核酸探针制备
利用下示的简并引物(degenerate primer)进行PCR及定序反应后,将所得DNA序列使用VectorNTI设计约226bp长的引物(序列识别号:1),以做为核酸探针制备。
Mplov1 5’TCCACTGCCGTTTATGTTG 3’(序列识别号:29)
Mplov2 5’TCGTCATCTTCACCCCATC 3’(序列识别号30)
之后利用PCR反应来扩增一段序列上含有DIG-11-dUTP(Roche,PCR DIG Probe Synthesis Kit)的DNA,用此段DNA来做为核酸探针。
实施例4:菌落杂交的分析与BAC DNA的抽取
剪裁尼龙膜(nylon membrane,Roche)一角以标示其方向,小心将尼龙膜置于含有菌落的平板上,以沾粘上的菌落朝上,将尼龙膜分别依顺序置于裂解液(lysis solution:2N NaOH,0.1%SDS)5分钟,0.5M NaOH/1.5M NaCl溶液5分钟,1.5MNaCI/0.5M Tris-HCl(pH7.4)5分钟及2X SSC 5分钟,之后使用紫外光固定DNA于尼龙膜上。所得的尼龙膜再进行杂交反应与免疫侦测(Roche)。将反应所得的菌落利用Qiagen的Large-Construct Kit抽取大量的BAC DNA。
实施例5:基因枪(Shotgun)方式的序列分析
A.基因枪(Shotgun)基因库的制备
取3~5μg的BAC DNA,调整适当的超音波震碎条件,将BAC DNA震碎至1~2kb,并以电泳分析确定。使用Bal31核(nuclease)及T4 DNA聚合酶进行DNA钝端(blunt end)的修复,所得的DNA以电泳分析,并回收1~2kb的DNA片段,并进行接合反应(使用载体为pUC18/SmaI/CIAP(50ng/μL)(Pharmacia))并电转至E.coli DH5α中。
B.DNA定序及分析
利用96微孔盘进行高速质粒DNA(high throughput)的抽取,所得质粒DNA以ABI Bigdye v3.0套组进行定序反应,并以ABI 3700定序仪进行10倍覆盖率的序列分析。
实施例6:DNA序列的组装(Assembly)与批注(annotation)
根据Phil Green实验室发展的Phred-Phrap-Consed系统进行DNA序列的组装,所得的BAC完整序列进一步利用VectorNTI与BLAST进行序列的批注分析。
实施例7:红曲霉总RNA的萃取与RT-PCR反应
收集约0.2g红曲霉真菌的菌丝置于研钵中,利用液态氮迅速冷冻菌丝并将其磨成粉末状。之后利用trizol试剂(Invitrogen)与氯仿进行萃取。所得RNA溶于DEPC-H2O中。利用RNA进行反转录反应(Promega,ImProm-IITM Reverse TranscriptionSystem),得到的全长cDNA再接合于TA载体(promega,pGEM-T vector system)保存。
实施例8:RNA电泳分析与RNA印迹杂交(Northern blot)分析
A.RNA电泳分析
配置含有甲醛凝胶工作缓冲液(formaldehyde gel runningbuffer)与甲醛(formaldehyde)的1.2%琼脂糖凝胶(agarose gel)。取出RNA与甲醛凝胶运作缓冲液,甲醛(37%),及甲酰胺均匀混合后,进行RNA电泳并以EtBr染色。
B.RNA印迹
切割与凝胶大小适当的尼龙膜,并以剪刀剪下一角,以做为记号,进行RNA印迹。之后使用紫外光固定RNA于尼龙膜上,所得的尼龙膜再进行杂交反应与免疫侦测(Roche)。
实施例9:核酸探针引物的设计及核酸探针制备
根据BAC DNA序列设计引物,以做为制备RNA印迹杂交分析用的探针。以下所列引物是设计用于制备红曲霉基因群分析所使用的探针:
mkA基因
正向引物5’ATA GCT CCG AGA ATG GTC CC 3’(序列识别号:31)
反向引物5’CCA TCA AGG ATG CTC TGT CG 3’(序列识别号:32)
探针片段长度为229bp
mkB基因
正向引物5’CTA GAC TTT GCT TCC CAC GCC A 3’(序列识别号:33)
反向引物5’CAT TGT CGA GCG TTG GAG TC 3’(序列识别号:34)
探针片段长度为167bp
mkC基因
正向引物5’GGC CTG AGC CGA AGA AGT AC 3’(序列识别号:35)
反向引物5’TCA GAG ATC TTC GTC CCG AC 3’(序列识别号:36)
探针片段长度为304bp
mkD基因
正向引物5’TGA TGA CTT TGC CCT GGC GG 3’(序列识别号:37)
反向引物5’TCA CCC AAT GAC TCT AGC CC 3’(序列识别号:38)
探针片段长度为175bp
mkE基因
正向引物5’TTC TCT CCC GAC AAC TGC CC 3’(序列识别号:39)
反向引物5’AAT GGT CAC CGC CGA CTG GA 3’(序列识别号:40)
探针片段长度为246bp
mkF基因
正向引物5’GCC CCG AAT CCT ACA TGA AG 3’(序列识别号:41)
反向引物5’GGC CCA CCG TAG TTG ATG TG 3’(序列识别号:42)
探针片段长度为166bp
mkG基因
正向引物5’CCT CGC TCT GAA TAT GAC CC 3’(序列识别号:43)
反向引物5’TCG GAT CGG CTT CTC AAA CC 3’(序列识别号:44)
探针片段长度为217bp
mkH基因
正向引物5’ACC TCA TCG CTC CAG ACC AT 3’(序列识别号:45)
反向引物5’CTG CGA GAG AAT GAG AGT GC 3’(序列识别号:46)
探针片段长度为179bp
mkI基因
正向引物5’CTA GAC TCG TTC ATC GCG GC 3’(序列识别号:47)
反向引物5’CCA TAC ATT CTA CCT TGC GG 3’(序列识别号:48)
探针片段长度为127bp
实施例10:巴斯德毕赤氏酵母(Pichia pastoris)的转化
将PKS的全长cDNA(mkA与mkB)接合于pPICZαA与C(Invitrogen),并使用Pichia EasyComp.套组(Invitrogen)进行转化反应。
实施例11:DNA印迹杂交(Souhern blot)分析
将凝胶浸泡在0.25M HCl中,放在平板震荡器上轻轻摇晃10分钟,以进行酸脱嘌呤作用(acid depurination),再以二次水轻轻地洗净。之后转至NaCl/NaOH溶液(1.5M NaCl,0.5NNaOH)中,放在平板震荡器上轻轻摇晃15分钟两次,以进行变性作用,再以二次水轻轻地洗净。最后将凝胶浸泡在NaCl/Tris-HCl溶液(1.5M NaCl,1M Tris-HCl,pH7.4)中,放在平板震荡器上轻轻摇晃15分钟两次,以进行中和反应。切割与凝胶大小适当的尼龙膜,并以剪刀剪下一角以做为记号,进行DNA印迹。之后使用紫外光固定DNA于尼龙膜上,所得的尼龙膜再进行杂交反应与免疫侦测(Roche)。
以下所列引物是设计用于制备DNA印迹杂交分析所使用的探针:
mkA基因
正向引物2 5’TGA ACA GCA CAG CAT AGG GG 3’(序列识别号:49)
反向引物2 5’GCA GCC ATT GAA GAC GGC AT 3’(序列识别号:50)
探针片段长度为293bp
mkB基因
正向引物5’CTA GAC TTT GCT TCC CAC GCC A 3’(序列识别号:33)
反向引物5’CAT TGT CGA GCG TTG GAG TC 3’(序列识别号:34)
探针片段长度为167bp
实施例12:聚缩酮的生成
Bedford(1995),Gokhale(1999),以及Pfeifer(2001)已研究过应用大肠杆菌与链霉菌作为宿主细胞,进行异源性聚缩酮合成酶的表达。而且,细菌性聚缩酮合成酶也已成功地表达于大肠杆菌与链霉菌中,并侦测到少量聚缩酮的生成。一般来说,大肠杆菌缺乏转译后修饰作用,因此应会限制功能性聚缩酮合成酶的异源表达。因此,可同时表达聚缩酮合成酶(简称PKS)与4’-磷酸泛酰巯基乙胺转移酶(4’-phosphopantetheine transferase,简称PPTase),以产生聚缩酮合成酶的完整酰基携带蛋白(简称holo-ACP)功能区域,而能进行聚缩酮生成(Mootz等人,2001)。为更进一步研究本发明的表达载体的表达效能,将枯草杆菌(Bacillus subtilis)的sfp基因(编码PPTase)成功转化到表达载体pCDF-1b中(如图6所示),并与如图5所示的带有PKS(即mkA基因)的载体同时表达于大肠杆菌中。SDS-PAGE的结果,如图7所显示,发现会产生少量的PKS可溶蛋白(342kDa)。而大部分Sfp蛋白亦可溶而造成29kDa蛋白的表达。实验过程如下述。
1.表达载体的构筑
将mkA基因的部份cDNA片段(6.5kb cDNA)以正向引物p3:5’-CCATCAAGGATGCTCTGTCG-3’(序列识别号:32)以及反向引物p4:5’-TCAAGCCAACTTCAACGCGG-3’(序列识别号:51),并以Monascus的第一股cDNA为模板进行RT-PCR增幅。将所得到的6.5kb cDNA片段导入载体pGEM-T,以获得具有EcoRI-NotI切割位的片段。之后将上述片段接合至pET30,得到pETmkA1。再设计一组寡核苷酸引物,正向引物p1:5’-GGAATTCATGTACGTAGGACGCATTGGTGC-3’(序列识别号:52),其含有23个碱基互补于5’端的mkA基因,且导入EcoRI切割位,以及反向引物p2:5’-TCGCGAGGACGGACAAAGTT-3’(序列识别号:53),以由RT-PCR增幅部分3.0kb的cDNA。将上述具有EcoRI-EcoRI切割位的3.0kb Cdna片段接到pETmkA1,以得到pETmkA,如图6所示。
另设计一组寡核苷酸引物,正向引物5’-CGGGATCCCATGAAGATTTACGGAATTTA-3’(序列识别号:54),其含有20个碱基互补于5’端的sfp基因,并导入BamHI切割位,以及反向引物5’-ATAGTTTAGCGGCCGCTTATAAAAGCTCTTCGTACG-3’(序列识别号:55),含有20个碱基互补于5’端sfp基因,并导入NotI切割位,以由枯草杆菌168的基因体DNA增幅出sfp基因。将具有BamHI-NotI切割位的sfp基因接合到pCDF-1b,已得到pCDFsfp,如图7所示。
2.于大肠杆菌同时表达mkA与sfp
将pETmkA与pCDFsfp同时转化到大肠杆菌BL21(DE3),并于LB培养基中隔夜培养得到单独菌落。接着,将LB培养基转移到ATCC 765号的培养基,其中含有10%甘油,培养到OD600nm达到0.6~0.8。加入异丙醇-β-D-硫代半乳糖(isopropyl β-D-thiogalactoside,简称IPTG)至1.0mM的最终浓度,以诱导基因表达,并于20℃培养48小时。收集细胞沉淀物并以液态氮冷冻,再于42℃解冻,以进行溶胞作用。为增进溶胞作用,可加入溶菌酶(lysozyme)至细胞沉淀物中。以全细胞蛋白质以及可溶蛋白质的SDS-PAGE(7.5%的凝胶),以及胶体考马斯蓝染色侦测蛋白质表达。
参考文献
1.Abe Y,Suzuki T,Ono C,Iwamoto K,Hosobuchi M,Yoshikawa H.Molecular cloning and characterization of anML-236B (compactin) biosynthetic gene cluster inPenicillium citrinum.2002.Mol.Genet.Genomics.267:636-646.
2.Bedford,D.J.,Schweizer,E.,Hopwood,D.A.,Khosla,C.Expression of a functional fungal polyketide synthase in thebacterium Streptomyces coelicolor A3(2).1995.J.Bacteriol.177.4544-4548.
3.Endo A.Monacolin K,a new hypocholesterolemicagent produced by a Monascus species.J Antibiot(Tokyo)1979,Aug;32(8):852-4.
4.Endo A,Komagata D,Shimada H.Monacolin M,a newinhibitor of cholesterol biosynthesis.J Antibiot(Tokyo)1986,Dec;39(12):1670-3.
5.Endo A,Hasumi K,Negishi S.Monacolins J and L,new inhibitors of cholesterol biosynthesis produced byMonascus ruber.J Antibiot(Tokyo)1985,Mar;38(3):420-2.
6.Endo A,Hasumi K,Nakamura T,Kunishima M,Masuda M.Dihydromonacolin L and monacolin X,newmetabolites which inhibit cholesterol biosynthesis.J Antibiot(Tokyo)1985,Mar;38(3):321-7.
7.Gokhale,R.S.,Tsuji,S.Y.,Cane,D.E.,Khosla,C.Dissecting and exploiting intermodular communication inpolyketide synthases.1999.Science.284,482-485.
8.Hendrickson L,Davis CR,Roach C,Nguyen DK,Aldrich T,McAda PC & Reeves CD.Lovastatin biosynthesisin Aspergillus terreus:characterization of blocked mutants,enzyme activities and a multifunctional polyketide synthasegene.1999,Chem.Biol.6:429-439.
9.Hutchinson C.R.,Kennedy J.,Park C.,Kendrew S.,Auclair K.and Vederas J.Aspects of the biosynthesis ofnon-aromatic fungal by iterative polyketide synthases.Antonie van Leeuwenhoek 2000,78:287-295.
10.Kennedy J,Auclair K,Kendrew SG,Park C,VederasJC,Hutchinson CR.Modulation of polyketide synthaseactivity by accessory proteins during lovastatin biosynthesis.Science 1999,May 21;284(5418):1368-72.
11.Komagata D,Shimada H,Murakawa S,Endo A.Biosynthesis of monacolins:conversion of monacolin L tomonacolin J by a monooxygenase of Monascus ruber.J.Antibiot(Tokyo)1989,Mar;42(3):407-12.
12.McDaniel R,Thamchaipenet A,Gustafsson C,Fu H,Betlach M,Ashley G:Multiple genetic modifications of theerythromycin polyketide synthase to produce a library ofnovel‘unnatural,natural products.Proc Natl Acad Sci USA1999,96:1846-1851.
13.Mootz,H.D.,Finking,R.,Marahiel,M.A.4’-Phosphopantetheine transfer in primary and secondarymetabolism of Bacillius subtilis.2001.J.Biol.Chem.40,37289-37298.
14.Nicholson TP,Rudd BA,Dawson M,Lazarus CM,Simpson TJ,Cox RJ.Design and utility of oligonucleotidegene probes for fungal polyketide synthases.Chem Biol 2001,Feb;8(2):157-78.
15.O′Hagan D.Biosynthesis of fatty acid and polyketideme-tabolites.Nat Prod Rep.2001,12:1-32.
16.Pfeifer,B.A.,Admiraal,S.J.,Gramajo,H.,Cane,D.E.,Khosla,C.Biosynthesis of complex polyketides in ametabolically engineered strain of E.coli.2001.Science.291,1790-1792.
序列表
<110>财团法人食品工业发展研究所
<120>胆固醇合成抑制剂Monacolin K生合成基因
<140>
<141>
<160>55
<210>1
<211>226
<212>DNA
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>monacolin K探针
<400>1
tccactgccg tttatgttgg catgatgaca cacgactacg agacggtgtc   50
gacgcgcgac ttggagagca ttcccactta ctcggccacg ggagtcgctg   100
ttagtgtcgc gtcgaaccgc atctcatact tctttgactg gcatggcccg   150
agtgtaagtt gctctcatgc cccatattgg taatcttgaa gagttcctaa   200
cggacttgat ggggtgaaga tgacga                             226
<210>2
<211>9818
<212>DNA
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkA基因组DNA
<400>2
atgtacgtag gacgcattgg tgcgaccaca tacatctctc gtcccgcaga 50
ctctcgagct acgccaaaag tgatcaaaac tcaagggtcg atcaccacgt 100
ctaatctaac atcactaaca accatggctc agtcaacata ccccaatgag 150
cctattgtcg tggtaggaag cggctgccgc tttcccgggg gcgccaacac 200
gccctccaag ctgtgggagc tccttcggga gcctcgcgac gtccgtagca 250
aaatcccgaa agagagattt gacgtcgacg cattctatca tccagacgga 300
aaacaccatg gacgaacaaa cgcaccctat gcctatatgc tacaagaaga 350
cctgcgcgcc ttcgacggcc ctttcttcaa tatccaggcc ggagaggccg 400
agagtatgga tccacaacag cggctcttgc tggagaccgt gtacgaggca 450
gtctcagatg ccggtatgcg gatccaagac ctgcaggggt cttccactgc 500
cgtttatgtt ggcatgatga cacacgacta cgagacggtg tcgacgcgcg 550
acttggagag cattcccact tactcggcca cgggagtcgc tgttagtgtc 600
gcgtcgaacc gcatctcata cttctttgac tggcatggcc cgagtgtaag 650
ttgctctcat gccccatatt ggtaatcttg aagagttcct aacggacttg 700
atggggtgaa gatgacgatc gataccgcat gcagctcgtc tttggttgcc 750
gttcacctgg ctgtacaaca gctacgcagt gggcaaagct ccatggctat 800
cgccgcgggc gccaacatga tcctcgggcc catgaccttc gttctagaaa 850
gcaagttgaa catgttatcc ccctcgggcc ggtcccgcat gtgggacgct 900
ggggccgatg gctatgctag aggcgtgagt gcctcctagt ttgcagacaa 950
cgcgcaagtt cgctaacggt atgccttgtg catcgatatc tctttaggaa 1000
gctgtttgtt cggtagtgct taaaacattg agccaagcct tgcgcgatgg 1050
cgacagcatt gaatgcgtta tccgagaaac cggtgtgaac caagatggtc 1100
gaacgacagg catcacgatg cccaaccaca gcgctcagga ggcacttatc 1150
agggctacct actccaaagc cggcctcgac atcacgaacc ccgaggatcg 1200
atgccagttc ttcgaggctc atggtcagta agcttcctag tatgttctgt 1250
ctgctcgtgc actgattact ttggactcat ccgcatcata ggaactggta 1300
caccagcagg agatccacag gaggccgagg ccatcgcaac cgcctttttc 1350
ggacacaaaa aggaggcctc cgatgctgag aacgcagaga ctcccctctt 1400
cgtgggcagt gtgaagaccg ttgtcggtca tactgagggc actgccggcc 1450
tggctggtct catgaaggcg tccttcgccg tccagcacgg agtgatcccg 1500
cccaacctgc tgtttgagaa tatcagcccc cgcgtggccc cattctactc 1550
caatttgaag attgcaacag agacaacacc atggcccacc atcaaacctg 1600
gacagcctcg ccgtgtcagt gtcaactctt ttggtaagca ggccttaacc 1650
cggatgggaa tgactgtaag gagtccactg ctaatctcta tggcccatga 1700
aaaggtttcg gtggcacgaa tgcacatgca attattgagg aatacataaa 1750
gtctgaccaa aaggtgccag cgagccgaca gccggtggag tactcagaca 1800
gtcccagtac attgaatctg cccttggttc tctcggccaa gtctcagcgc 1850
tccatgaaga caacgttgga gagcatggta cagttccttc agtccaaccc 1900
tgaagttaac ttgcgggatc tttcatggac tctactgcgg aagcggtcga 1950
ttctaccctt ccgtcgggct attgtcggcc atagccacga agcaatccgt 2000
gccgctctcg aggcagccat tgaagacggc atcgttgtga gcgacttcag 2050
cgcggatgtc aaaggcaagc cgtctgtgct gggagtcttc accggacagg 2100
gtgcccaatg gcctgggatg ttgaaggaac tgattgtggg atcatcctat 2150
gtgcggtcga tagcggagga gctggatcac tcactgcaga ctttgccgga 2200
gaagtaccgc ccctcctgga ccattctcga gcagctaatg ctagaagatg 2250
aggcttccaa cgtccgacac gccagcttct cccagcccct atgctgtgct 2300
gttcagattg ttctggtgcg tctcctgaaa gcagcaggaa tccagtttgc 2350
tgctgtggtc ggacacagtt ccggagagat cgcctgtgca tttgccaccg 2400
gtcttatcag tgcatccttg gcaattcgta ttgcccacct gcgtggagtc 2450
gtttcggcgg agcacgctgc ctccgcgagc ggaggacgcg gatctatgtt 2500
ggcagcaggt atgtcctatg aggaagcgaa agagctctgt gagttggatg 2550
cctttgaaag ccgcatctgt gttgctgcta gcaattcccc agacagcgtt 2600
accttctcgg gagatgcgga tgcaattgag cacttgcagg gcgttctgga 2650
ggacgaggct acgttcgcca gactgctcag ggtggataca gcataccact 2700
ctcaccatat gcttccttgt gcagcgccgt atatgcaagc tttggaggaa 2750
tgcggctgtg ctgttgctga tggagacggt caggtggaag agggatcatg 2800
gtattcctct gtcaaggaca gcaacgaacc aatgggcctt gccgacgtga 2850
ctgctgagta ctggaaagat aacctggtat ccccggtgct tttctctcag 2900
gccgtccagc gggcagccat catgcaccgg cccctggatg tcgggattga 2950
agtcggttgc caccctgctc tcaagggccc gtgtctggct accatcaagg 3000
atgctctgtc ggacgttgac ctggcataca caggatgttt ggagcgcgga 3050
aagaatgata tgaatgcatt ttcccaggcc ctggcctatc tttgggagca 3100
gttcggaatt ccaagcctgg atgctgaccg ctttataagt accattgctc 3150
ccgagcgctc ctgcgtgagc ctttcgaagc agctgccgac gtactcatgg 3200
gaccattctc ggagctattg gacggaatct cgtgccactc gtcagcacct 3250
gcgaggaccg aagccgcatc ttctgctggg taagctctct gaatatagca 3300
ctccgttgac cttccagtgg ctgaactttg tccgtcctcg cgacattgaa 3350
tggctggatg ggcatgcatt gcagggccaa gtggtcttcc ctgccgcggg 3400
ttatattgtc atggcgatgg aggcggccat ggaaattgcc aactctcatc 3450
aggtgcaagt ccagctactt gagatcctgg atatgagcat tgacaaagcg 3500
gtggttttcg atgatgaaga cagtctggta gaacttaact tgaccgcgga 3550
agtaaccagc ggcatcggta aaggtgaccg gatgatcctc agcttcataa 3600
ttgattcctg tctatccagg gaaggtgacc tctccacctc agccaagggt 3650
cagctagtcg tcacattgga tgaaggccat ctccaggtga ccccagataa 3700
cgagaagcag ctcctacccc cgccagaaga agagcatcct cacatgaacc 3750
gagtgaatat caattcattc taccacgagc tggatctgat gggctacgac 3800
tacagcaaag acttccggcg cctgcatagc atgcgacgag ccgatgcacg 3850
agccagtgga attttggaat ttattcctct gaacgacgag gtccacggcc 3900
gtcctctcct gctgcatccc gctcccttgg acattgcctt ccagacagtc 3950
atcggcgcat actcctcccc cggagatcga cgtctacgct gcctgtatgt 4000
gccgacgcac attgatcgca ttgctcttgt gccctctctc tgtcttgcga 4050
cagctgcgtc cggttgtgac aagattgcct tcaatactat caacacctat 4100
gacaagggtg atttcctcag cggtgacatc gtggcgtttg acgcggagca 4150
gaccagtctg ttccatgtcg agaatattgt ttttaagccc ttctcgcccc 4200
cgactgcgtc tactgatcat ccgatcttcg ccaaatggag ctggggtcca 4250
ctgaccccgg aaaccctgct ggacaacccc aaccattggg ccacggcgca 4300
ggataaggaa gcgatcccca tcattgaacg cattgtctac ttttacatca 4350
aattgttcct gcagcagctg acccgagaag atcgcgaaca agcggcattc 4400
cacctgcaga ggcagattgt gtggtgtgaa caagtcgtgg ccgacgctca 4450
cgaaggtcgt caccaatggt acgatgcagc ttgggagaat gataccgaag 4500
cccagataga gcagttatgt gccagaagct cctaccaccc tcacgttcgc 4550
ttggtacagc gagttggtca aaacctgctc gcaaccatcc gttcgaatgg 4600
caacccgttc gatctcatgg accatgatgg cctgttgacc gagttctata 4650
ccaacacgct cagttttggc ccagcgttgc actatgccca agaccttgtg 4700
ggtcaaattg cccatcgcta tcaatctatg gatatcctgg agatcggagc 4750
tggaaccggt ggcgccacca aatacgtgct ggcaacgcct caactcgggt 4800
tcaacagcta cacgtacacc gacatctcga ccggcttctt cgaaaaggca 4850
cgcgaacagt ttgctgcctt cgaggaccgc atggagtttg agcccctcga 4900
tatccgccgc agcccagcag agcaaggttt cacggagcac gtgtacgacc 4950
taatcatcgc gtccaacgtg ctacacgcaa cgcccgactt ggagaagacc 5000
atggcccatg cacgctccct gctgaagccc gggggccaga tggtgattct 5050
ggagatcacc caccggaacc acaccagact agggtttatc ttcggcctgt 5100
tcgccgattg gtgggcaggt atcgacgatg ggcggaccat ggagccattt 5150
gtgtcgtttg accgctggga tgagatcttg aagcacgtcg ggttttccgg 5200
catcgacagt cgcaccaagg accgcgatgc ggatctgttc cccacatcgg 5250
tcttcagcac gcatgccgtt aactcgacaa tcgactacct gcacaagcct 5300
cttgacgctc cagtgaagga ctcgtacccc ccgttggtgg tggtcggtgg 5350
ccagacgcca aagacccagc gcatcttgga tgagatcaaa gccgttatgc 5400
ctaatcgcca gatccagtta caccagcgtc tcgttgattt gttggatgca 5450
gaggacatgc aggccaagtt cacctttgtt gtcctcacgg agctggacga 5500
ggagctattc gctggtctca ccgaagacag ctttgaagca gtcaagctac 5550
tgctcatgta cgccgggaac atgctgtggc tgaccgagaa tgcctgggtc 5600
aagcgccctc atcaggcgag taccatcgga atgctgcgct ccatcagacg 5650
cgagcacccc gacattggtg tccatattat ggatgtcgac tctgccgaga 5700
acctggacgc acacttcctg gtcgaacagg tccttcggct ggaggaggat 5750
atcgacgaat tggcagccac gacaacgtgg actcaggagc cagaagtctt 5800
ctggtgcaat ggccgcgcct ggattcctcg tctgaagcat gataaatcga 5850
ggaataaccg tatgaactcc tcacgtcgtc agatctttga gaccctcaat 5900
ccatccaaga tccccgttgc attgaagaag gcggcagcct cctcttctta 5950
ctacctggag tcagctgaga cctggcccgt gccaggtgcc gttactgcag 6000
gggataggaa aacggtccat gttcggctca gccatcccca cgcccttcgg 6050
gttggacatc ttgggttttt ctacctcgtt cagggccacg tcctgaaggg 6100
tgatcaagca cttcctgtgg tggctttggc tgagcgcaac gcatcgattg 6150
tccacgttcg ttcagactat gtccatgttc tagaagatac cgcggtgtct 6200
gcgaacaatg gaagtttcat cttggccgct gcagcggccg tgttggccga 6250
gacggtgatt cacagtgcca agagcctggg agctgatgcc tcggtcctgg 6300
tcttgaatgc cccgggcttc tgtgcccaga cattgctccg cgctgcaaga 6350
gattctggac ttcgggtcca tctggccacc acatcgtcca gtaccgaccc 6400
gtctcctggg gccgaccgtt gcgtccgact gcatccccgc gacacggata 6450
ggcgcctcaa acagcttctg ccccgtggca ctcaggcatt cttcgatctg 6500
tccaccgatc cgagcagtga aggtctcaca cagcgattgc caaacgtcct 6550
tatacccagc tgtgttcggc acagtactga atacttgctc agagataccg 6600
cttccgctgg tgggaaagct acgctgcccg cggcatactg ggagcgtgta 6650
gcctccttgg ctaatcacag cctcagtact cactttaagg agaatgataa 6700
tgccagcaat ggatgccagg tcttgtcttg cacagacatt gtcgcgcgta 6750
ataacaagag ccgtctgaac gcatcgactg tcatctcctg gccagatgac 6800
gcggccctcc cggccagaat ccgtcccatc gataccgaga ccctgtttgc 6850
agcggaaaag acgtacctct tagtcggact cactggagat ctcggccggt 6900
ccttgggccg ctggatggtc ttacacggtg cccgccgcat cgtcctcacc 6950
agccgcaacc cgcaagtgag cccgaattgg gtggcgcatg ttgaagagtt 7000
gggcggccag gttaccgttc tgtccatgta agattatctc caatctcctt 7050
ccttcgcttt gtgactcact aacacacaat gcagggatgt gacgagcgaa 7100
gactcggtgg attctggctt ggccaaactc caggatttga agttgccccc 7150
tatcggcggc attgcctttg gccctttggt gctgcaggat gtaatgctga 7200
agaacatgga cctgcaaatg atggagatgg tgctgaaacc caaggtcgag 7250
ggagcccgca tcctgcacga gaagttctcc gaccctgcca gcagcaaccc 7300
actcgacttc ttcgtcatgt tctcctcgat tgtagcggta atgggtaacc 7350
cgggccaggc caactacagc gcggcaaact gctacctgca ggctttggcg 7400
cagcggcgat gcgcctctgg attggcggta agcttttttt ccccccaacc 7450
atcccttccc ttctgcatgt gtctgtgcta aagataaacg caacgcaggc 7500
ttcgactatc gacatcggtg cagtctatgg tgtcgggttc gtgacccggg 7550
cggaactgga ggaggatttc aatgctattc ggttcatgtt tgactcggtc 7600
gaagaacatg agctgcactc tctgtttgcc gaggcggtgg tgtccggtcg 7650
acgggccatg caccagcagc agcagttcaa gacggtgctc gacatggccg 7700
atatcgaatt gacgaccggt atacccccgc tggatccgac tctcaaggat 7750
cgcattacgt tcttcgacga cgctcgggtc ggtaacttca agattcccga 7800
acggcgcggc aaggcgggcg ataacgcagc aggatccaag ggctctgtca 7850
aggaacagct cttgcaagct acaagcttgg accaggtccg tcaaatagtc 7900
attggtaagt cttggcaaca tatcctttct ttcacgcgct agtcagcaat 7950
gcgattaaca ttttctgggg cagatggtct atccgaaaag cttcgggtga 8000
cccttcagat tcccgatggg gagagcgtgc accccactat cccgctcatc 8050
gaccagggag tagactccct gggcgcggtt accgtgggta cctggttctc 8100
gaagcagctg tacctagacc tgccgcttct cagagtgctt ggaggcgcct 8150
ccgtggccga tctggcggac gacgctgctg cccggctgcc gcccagctcc 8200
attccactcg tggcagcaag cgaagggggc gcggagacct cggacaatga 8250
cacttcaggg cctgagggga ctgatctcag cgcctcgacc acaatcaccg 8300
agccctcatc tgcagacgaa gaggacgaaa agcaggagga cgacaacgac 8350
aactccgtcc tcgcccttca tccactctcc ctcggccagg agtacgcttg 8400
gagactgcaa aaggccgccg atgattcgac catcttcaac aacacgatcg 8450
gcatgttcat gacgggctcc atcgacgcca aacggctgtc caaggctctc 8500
cgagcggtct tgcgccggca cgaaatcttc cgcaccggct ttgcggctgt 8550
cggtaacaat gcagatgcca cgagtctagc gcaaattgtc tttggtcgaa 8600
ccaagaacaa ggtccaagtc atccaggtgg ctgaccgggc cggcgcggaa 8650
gaaggctacc ggcagctggt gcagacacag tacgacatca ccgctggaga 8700
cactctgaga ctggtcgact tcttctgggg caaggacgag catctgttcg 8750
ttgtggccta ccatcgattt gtcggcgatg gttccaccac ggagaatatc 8800
tttgtcgaag cgagccagtt atacggcggc gtgaccctcg acaagcacgt 8850
ccctcaattt gcagacctcg cgacgcggca gcgagaagcg ctcgagtccg 8900
gccagatgga tgcggacctc gcgtactggg aatcgatgca ccaccagccc 8950
acgggcgtgg tgtccccggt cctcccgcgg atgcttctgg gcgaagatgg 9000
ccttaatagc ccgaaccacg cccgccagcc caactcgtgg aagcaacacg 9050
aagcgatcgc gcgtctcgac cccatggtcg ctttccgcat ccgcgagcgc 9100
agtcgcaagc acaaagccac gcccatgcaa ttctacctgg ctgcgtacca 9150
cgtgctcctg gcacgattga cgggcagcag cgacttcagc ataggcctgg 9200
ccgacaccaa tcgcacgaac gtggatgaac tggcgggcat gggctttttc 9250
gccaacctgc tcccgctgcg cttccgcaac ttcgtcccgc acatcacctt 9300
tggcgagcac ctggtcgcca ccaaggacaa ggtgcgcgag gccatgcagc 9350
acgcccgcgt gccctacggg gtgctgctcg agcgcctcgg attcgaggtc 9400
ccgggggcca ccgccgaaac agcggaaccg gcccccttgt tccaagcggt 9450
cttcgattac aagcagggcc aggcggagag tggttcgatt ggcagcgcca 9500
agatgaccga ggtcatcgcg actcgcgaac gcacccccta cgatgtcgtg 9550
ctggagatgt cggatgatcc caccaaggat ccgctgctca ccgtcaagtt 9600
gcagagctcg gtgtacgagg tgcatcatcc cagggcgttc ttggagagtt 9650
atatctccat attgtcgatg ttttcgatga atcccgcgtt gaagttggct 9700
tgatatattg cggtagaggt ggtctagatt gttaaactta catgtactac 9750
gataattata cggaatagaa caagagtgat tatctgtgat gcctagaact 9800
acgaacggat gaaggtga                                    9818
<210>3
<211>8081
<212>DNA
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkB基因组DNA
<400>3
atgaaagcga cggcagcctc gggcacacct actcccatag ctgtagtggg 50
catgggatgc agatttgccg ggggagcaac agatccacag gcactgtgga 100
aattgctgga gcaaggaggg agcacttggt ccaagactcc atcctcgaga 150
ttcaacgtca gcggagtcta ccaccctaac ggccaacgag taggatcggt 200
aagtcagggg atgattctga ggctcggttc tatgtgctca agtataggca 250
ttgactgctg gcagatgcac gttcggggtg gtcattttct agaccaagac 300
ccggctcttt tcgatgcctc atttttcaat atgaccagtg aagttgccag 350
tgtatgtgca atgctcgttc ccggttttct cgaccgatga gtgaatgatg 400
ttgagatcgc agcacagtgt atggaccccc aacagagact catactcgaa 450
gtcgtctatg aagcgctaga ggccggtatg tgtttcagaa gaggaagcct 500
tcactagtcc ttctttagcc tacaaaatcg tttctgacac ttgaaatcgc 550
agcgggaatt ccccttgaaa gtgtggccgg ctcgaatacc gcggtcttta 600
gcggagcaat gtatcacgac taccaggatt cgctccatcg caacccggaa 650
actctgccgc gatacttcat cacgggtaat gctggcacga tgatgtcgag 700
tcgcgtctcc cacttctatg acctccgcgg tcccagcgtc acagttgaca 750
ctgcatgttc caccaccttg actgccttgc acctcgcaat ccaaagcata 800
cgagcgggag aggctgacat ggccattgtg gccgggtcga atctgctctt 850
gaactcggat gtttttgtca ccatgtccaa tttagggtga gtgtgctttc 900
ccgactctat gcattgcatg actagcatgc cagtgtcaaa aaaaaaagtt 950
tccgatgttg attgttccgt gcccgaggcc agctttctct ccccggatgg 1000
gatttcctac tcatttgatc cgagagctaa tgggtatgga cgtggagaag 1050
gggtagccgc catcatcttg aaggctctcc cccgcgcgct gcgagacggg 1100
gacccaattc gccttgttgt ccgcgagacg gcgctcaacc aagacggtcg 1150
gacccccgcc atcaccgggc cgagccccga agcgcaggcg tgcctgatcc 1200
gggaatgcta tcagaaggcc ggtctggacc cgaggcagac atcgtacgtg 1250
gaagcacatg gaacaggaac tccgacaggt gatccgctgg agctggcggc 1300
catctcagct gcattccaag gccagcctct gcagatcggc tccgtaaaag 1350
ccaacctcgg gcacaccgaa gctgccagcg ggctggcaag cgtaatgaag 1400
gtggctctgg cactggaaaa agggattgtg ccacctagtg caagattcct 1450
gcagccgagc aagaagttgc tggaagagag aaaattccag gtgacgttgc 1500
ctctctctat ctcccgtctg gatttggaca cccaactaac ccatcaccac 1550
acatgtagat tcccctatct agccaattgt ggcttccgat tgacggaatt 1600
tgtcgcgcat cgatcaacaa cttcggcttc ggaggcgcga atgctcatgc 1650
aatcgtggag cggtatgacc ccgctgcgag aatatcgacg agcaagccaa 1700
acggtcatat ccggcctcac gacagccatg tggaagcaga tcgagggaaa 1750
atctatgttt tgagtgccaa ggacgagcac agttgccagg aaatgatttc 1800
aaggttgcgc gactacctca accgcgctaa tccgactgat gaacggcaat 1850
tcctcgctaa catggcgtac actttagctt ctcgtcgctc gaatctccga 1900
tggaaggcag cctgcagggc acatagcctg gcgagccttc tctctgttct 1950
cgtaagcgat gggacgcgac ctcggagatc ggccgagaaa gcgaggctgg 2000
gatgggtctt cactggccaa ggagcacaat ggtttgcaat gggccgcgag 2050
ttaatcgagg cgtatcccgt tttcaaggag gcactcatcg agtgcgatgg 2100
ctatatcaag ggcatgggag cgaactggtc cattataggt aaatcccgaa 2150
agaacaccga tcagagctac gatagcgtga cactgactac tcatcgttcc 2200
agatgaactt cgtcgcggtg aagcagaaag tcgcgtgaac gaggcagaat 2250
ttagcctacc gttgtcaacg gctatccagg ttgcactcgt tcgtctactc 2300
tggtcgtggg ggatccgacc agcggcaatt accagccact ctagcggaga 2350
ggtagctgca gcttacgctg tcggggcatt ttcagcccga tcagccattg 2400
gaatcagcta tatacgtggt gccttgatag caaaaaccca gccggcaccg 2450
acaacgaagg ggggcatgct agctgtggga ttgagtcgca gtgaggttgg 2500
tgaatacata acacgagtac aacaacaagg cgaggaatac ttggttgtag 2550
gatgcataaa cagcccctcc aacgtgacgg tatcaggaga tttgtctgcg 2600
gttgtcagat tggaggagtt gttgcatgct gaccaaatat ttgcgagacg 2650
actcaaggtc acccaggcgt ttcactccca ccacatgcaa cctttgtcag 2700
gtgaatttcg ggaggctctg gtagaggtct tcaatgcaga catcactgac 2750
accactaatg cctgccagga tgtggtttac gcatccccca aaaccgggaa 2800
acgcctagac gattgtaacc acctgcgcga tcccatgcac tgggtggaaa 2850
gtatgctttt cccggtcgaa ttcgaatctt cattccgtga aatgtgcttc 2900
gacaggaaag atcaagcaca agaggttgat aagatcatcg agattgggcc 2950
acatggggtc ctgagcggcg caatcaagca aatcctacag ctgccggagc 3000
tcgctgcatt tgatatatcc tacctatcct gtctgtctcg agggaaaagc 3050
gcggtggaca ccattcagct tctcgccatg gaccttctcc aagggggtta 3100
tcccgtagac ttaaacgcag tcaacttccc atacgggtgc gaagcagccg 3150
aagtccaggt gctgtccgat ttgccgacct atccctggaa tcacaagacg 3200
agatactgga aggagccacg catcagtcga gctgcacggc aacgaaagat 3250
ccccgtgcat gatctgatcg gagttcaaga gcctttgtgc cctccgcttt 3300
tgcacttgtg gcaaaatgtg cttcggatct cggatgtgcc gtggatacgc 3350
gatcacgtcg tgggctcacg aatccttttc cccggtgctg ggttcatcag 3400
catggttatt gatgggctct ctcagatctg taatcacgat cccgaaactt 3450
gcggtttaag ctacatctta cgcgacgtgg acctggcgca ggcgctgatc 3500
ctgcccacgg acggagacga aggggtggat ttgcgcctaa caattcgcgc 3550
cgctgatcag aagagtctcg gaatgcggga ctggcagaga ttctccgtct 3600
attccatcgc cggtgataag gacgactgga cggagcattg tacagggctg 3650
attcgcgcgc aggtcgatca tcctgtctcc agctcgtcga tccaacaaaa 3700
gaccaatcca ccgcaatgga gccggaagat ggcaccacag gacctgtggg 3750
cttcgctgca tgcgacggga atctgtcacg ggcccttatt ccagaatatt 3800
gagcgcattg aaagcgatgg ccaggcctcg tggtgcactc tgaccgttgc 3850
cgacacagtg gcgactatgc cgcacgccta cgagagccag cacattgtgc 3900
atccaaccac attagactcg gctatccagg cggcctatac agtgcttcca 3950
tttatgggaa cactgatgaa gacagcgatg gtccccagtc gaatcggcgg 4000
catgaagata cccgccagct tcgcgagctt ggaaccgggt gatatgctgt 4050
gcgcacaagc aaaaataaag aaccaaggcc tctctgcctt tacaaccgat 4100
gtagctgtgt tcaacgagtc agatatggat gaagaggcag gtatcgagct 4150
cgaagggctt accttccagt cgcttggtgc tgttattagc gactctaggc 4200
gagatttgac cgagaacgag agcacctaca gttcctggca ttgggctccc 4250
gacatcactc tgaccaattc cacatggctt gagaggatac taagcactgg 4300
gacccagtct caggagatcg gggtgatgtt ggagcttcga cggtgtactg 4350
tccactttat ccaggaagca atagaaaacc taacaacgga agatgttgag 4400
aggctgagtg gtcatctcgt caaattttat tgctggatgc aggctcaact 4450
ggcctgcgct accaatggcg agctggggca agacagcgcc gactggttgc 4500
gagacagtga gcaggagaga caaagcttgc ggtccagagt agtcgctgcc 4550
accaacaatg gcgagatgat ctgtcgtctg ggccccaagc tatccgctat 4600
cttgcgtggc gagctcgacc ctcttgagct gatgatggac ggccaactgt 4650
tgtctcgata ctacatcagg gcaatcaaat ggagccggtc caatacgcag 4700
gcaagcgaac tcgtgcgcct ctgctgccac aagaatccac gtgcccgcat 4750
ccttgagatt ggcggtggaa ctggggggtg cacacagctc atcgtaaacg 4800
ctttggggcc cacgaagccg gtaggccgct acgacttcac cgacgtgtct 4850
gctggcttct tcgaagcggc tcgaaagcgg ttttcggggt ggcaggatgt 4900
gatggacttc cgcaagttgg atatcgaggg cgatcccgaa gtgcaggggt 4950
ttgactgcgg atcctacgac gtggtgttgg cctgtcaagt tcttcatgct 5000
acaagcaaca tgcagcggac attaaacaat gtgcgcaagc tgttgaagcc 5050
gggaggtaaa ctcattcttg ttgaaaccac gagggaccag ctcgatttgt 5100
ttttcacatt cgggctcctg cccggctggt ggctcagtga agagccggaa 5150
cggcagctta ccccatcact gtctcctgag ttatggcgca gtgtactgag 5200
cgctactggt ttcagtggcg tggacctaga ggtccgcgac tgcgacagtg 5250
atgagtttta catgatcagc accatgatgt ccacagctac acctgggact 5300
cctgcaacta ccttgaatgg accagccgag gtgctcctgg tccatgccgg 5350
ctcgcctccg cccatggatt ggctgcagaa tctgcaggta gccctcggcg 5400
ggaaaaacag ttctataact tcactcaagg cgctccaggg cgtttctgat 5450
ctcaagggga agatgtgtgt attcctgggg gagatggacc gcaccctact 5500
tgaaagcgtg gtcagtgatg acttcacatc cttaacctct atgctacagt 5550
atagccaagg tactctttgg gttactcgag gagcggcgat ggcgtcggat 5600
gacccaagaa aggccctgca cctaggattg ctacgcacgc tccgcaatga 5650
gaatcacggc cgtcgatttg tttcattgga cctcgacccc ttgcgtgatc 5700
catggacggc ccagtcctgt gacgccattg tcaatgtact gaatgcagtc 5750
ggtgcgtctc atgagaagga gtttgagtat gcagaacgcg atggcactat 5800
tcatgtgcca cgaacgttca gcgactcaag ctccagcgag aaggaagact 5850
tggttgtctt ggagccattc cagaatgaaa cgcgcttggt gcgactagac 5900
gtacagactc cagggcttct ggattctttg cactttaagc tgtgttctgc 5950
ggacgaagct tggagtagtg agctgccaga ggactgggtg gagattgagc 6000
cgagggcgtt cggtctaaac tttcgcgata tcatggttgc catgggccag 6050
ttggagtcaa atcgagtcat gggctttgag tgcgctggtg tggtaactag 6100
gttgagcaaa gcagcaacaa caggcgcagg agggcttgca atcggagacc 6150
gtgtatgtgc actcatgaaa gggcattggg catcgagggt gcggacagcc 6200
cgcaccaatg tcatctgcat cccagggacc ctgagtttcg aacaagcggc 6250
ttccatccca ctggccttca cgacagctta cacctccctc tacactgttg 6300
ctcgccttca acggggtgaa aaagtgctaa tccatggcgg cgctggagga 6350
gtcggacagg cggccatcat ccttgctcaa ctggtcggag cggaggtctt 6400
taccactgct ggaactcact ctaagcgcaa cttcttgatc gataagttca 6450
agctggcccc cgaccatgtc ttctcgagca gagactccgg ttttatcgag 6500
ggtatcaggg cttgtaccaa tggcaagggg gttgatgtgg tgctcaattc 6550
tcttgctggg cctttgcttc aatatagctt cgactgtctg gtcaattttg 6600
gtcgcttcgt ggaaataggc aaaaaggatc tcgagcaaaa tagccgactc 6650
aacatggcga cttttgcgcg gaacgtctcc ttttcctcga ttgatatcct 6700
gtactgggaa gaagccaagt ccgccgaaat cttccgagca ttgacggaga 6750
ttatgcggct cttggaacaa aagacaatcg atttgattgg gccgatatca 6800
gagtatccca tgtcggctat tgagaaggca ttccgtacga tgcagagcgg 6850
ccagcacgtc ggtaagcttg tggtggctac ggctgagacg gacatgatcc 6900
ccgttcgccg gggaaccatg ccagtcgcgt tgaagcttga cgcgtcttac 6950
ctgattgtcg gtggactggg gggtattggc agacgcattt gcgagtggat 7000
ggtggaccat ggggcacgac atctgctcat cctgtcccga agcggtcgta 7050
cggatccctt tgtgactggc ctccagaagc ggggctgtgt cgtacgtata 7100
cattcatgtg atgtggcaga tgagagtcaa cttcatgcag ttcttcaaca 7150
gtgccatgag gataacatgc ccccgatccg gggtatcatt caagcggcca 7200
tggtcctcaa ggacgctctt gtctcgcaaa tgacggcgga cgacttccat 7250
gttgctcttc gtccaaaggt ccagggcagt tggaatcttc acaagatcgc 7300
atctgaggtg gactttttca tcatgctctc atctctggtg ggtgtcatgg 7350
gtggcgcggg tcaagccaac tatgcggctg caggcgcgtt ccaggacgcg 7400
ctcgcacagc accgggtcgc tcaagggaag cccgctgtca ccatcgacct 7450
gggcatggtc aagtcaatcg gctatgtggc agagactgac cccgcagttg 7500
cggagcgatt ggcccggatt ggctatcaac cgatgcacga ggaagaggtc 7550
ctcgccgtgc tcgagcgagc catgtcgccc tcctcttctt cggcaccacc 7600
gtcctctaac cctactatac ccgcctcgcc cgctgtcatc gttaccggca 7650
tcaacacagg ccctggccct cacttcacaa acgccgactg gatgcaggag 7700
gcacgtttcg cgggaatcaa gtatcgtgat cccctgaagg atgaccgtgg 7750
tggggccttg tcctcttcac agcccgctga cgaggatagt gtacgcgctc 7800
ggctaagtcg ggcatctacc gaggaggagg ccactgccct agtggtgcag 7850
gtgatgggtc acagactggt gacgatgttt ggtctcactg aaagtgagat 7900
gtcggccaca cagacattgt cgagcgttgg agtcgactcg ctcgtcgcca 7950
tcgagctgcg taactggatt accgcccaac ttaatgtgga tatctcggtc 8000
tttgagttga tggagggtcg gaccattgct gaggtggcgg aggtggtagt 8050
gaagaagtat ggcgtgggaa gcaaagtcta g                     8081
<210>4
<211>1717
<212>DNA
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkC基因组DNA
<400>4
atgacagttc cgacagatac ggtctcgcgt cgcctccagt ctctcgcttg 50
gagcgacata aagcagcatg ccccatggct gccgtcttct cgcactcttg 100
tctcgggatt tctctgtttg atccttcttc agattctgta ctctcgtgga 150
cgcaaatccg acctgcgggt gtataacccg aagaaatggt gggaactcac 200
caccatgagg gccaagcggg agttcgatgc gaatgcgccc gcatggattg 250
aggcctggtt ctccaagaac gaccaaccgc tccgtttcat tgtcgactct 300
ggctattgta ccattttgcc ctcatcgatg gccgacgaat tccggaagat 350
gaaggagctt tgcatgtaca agtttttggg cacggtcagt ttatctctga 400
gttctttcca tcttcccgct attttcgtgt ctgggttact gatgatcatc 450
ttgactgtca ggacttccac tctcatcttc ccggattcga cggcttcaaa 500
gaagtcacca gagacgcaca tctcatcacc aaggtggtca tgaatcagtt 550
ccaaacccaa gctgcgaaat acaccaagcc tcttgccgat gaggccagcg 600
cgacaattgc agatatcttt ggggacaaca agggcaagtc aagcatccta 650
gtcaacccgt tggtcgttat gttaacgggg tctctctatc ttttccagaa 700
tggcacacgg ctcctgtcta taacgagtgt ttagatttgg tgacacgcac 750
tgtcactttc atcatggtcg gggataaact ggcgcacaac gaggaatggt 800
tggatatcgc caagcaccac gcggtgacta tggcgattca ggctcgccaa 850
ctccgcctct ggcccgtcat tctgcgccct atagtccact ggctcgagcc 900
ccagggagcc aaactgcggg cgcaagtccg acgagcccgg cagcttctcg 950
agcccatcat ccaggagcga cgcgccgaga aggccaaatg cctcgcccaa 1000
gggatcgagc cgccgcgcta cgtcgattcc attcagtggt ttgaagacac 1050
cgccaagggc caatggtacg atgcggcggg ggcgcagttg gccatggact 1100
ttgccggcat ctacggcacc tctgacctga tgatcggcgg gctggtcgac 1150
atcgtccgcc acccgcatct catcgagccc cttcgcaacg agatccggac 1200
cgtcatcggc gaggaaggct ggacgccggc ctcgttgtac aaactcaagc 1250
ttctggacag ctgtctcaag gaatcgcagc gcgtcaagcc cgtagaatgc 1300
gccacgatgc gcagctacgc gctccagaac gtgaccttct ccaatggaac 1350
ctttgtcccg aaaggcgagc tggtagctgt ggcggccgac cgcatgagca 1400
accctgaagt ctggcctgag ccgaagaagt acgacccgta ccgatacatg 1450
cgcctgcgag aggatcccga caaggcgttc agtgcccagc tggagaacac 1500
caacggtaac catatcggct ttgggtggca tcctcgggcg tgtcccggac 1550
ggttcttcgc ctccaaggag atcaagatca tgttggcgtt tctgctgatt 1600
cggtacgact ggaagctggt gccaaacgag ccgttgcagt attaccgtca 1650
ttccttcagc gtgcgcatcc atcctgccac caagcttatg atgcgccgtc 1700
gggacgaaga tctctga                                     1717
<210>5
<211>792
<212>DNA
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkD基因组DNA
<400>5
atgcgtatcc aacgcacccc cgcgcccccc aaagcgcccc gggccctcct 50
ctgcgtgcac ggcgccggct gctcccccgc catcttccgc gtgcagctct 100
ccaaactccg cgccgcttta cgggaagact ttgaattcgt ctacgcaacg 150
gcacccttcc cttccgcccc tggacccggg atcctgccca cgttcgaagg 200
cctcgggccc tattacacct ggttcgaggg ttctccgtct ggtgctgctg 250
ccaaagggga taacagcaac agcaacgaca gcaactcttc tcccaccgta 300
cacgaccgcc tcgccgccgt ccacgaaccc gtccgccgcg ccatcgccga 350
atggcagacc cagaacccca gcatccccat cgtgggaacc gtcagtttct 400
ccgagggcgc tcttgtgacc gccctgctgc tctggcagca gcagatgggt 450
aggataccct ggctcccggt catgcaggtt gcgatgttca tctgctgctg 500
gtatcagcat gaggcgactc agtatatgcg ggaggaggta ggctgcggcg 550
gtgatggtgg cattgacggt gagaagttgg tgatccgggg ggtgctgtcg 600
ctgcacctgc agggtcgtga tgactttgcc ctggcgggtt cgaagatggt 650
ggtggcgcag cattttgtgc ccggggaggc gcaggtgttg gagtttgcgg 700
gccggcatca tttcccgaat cggccgcgcg atgtgttgga gacggttaag 750
cggtttaggc agctgtgtgt gagggctaga gtcattgggt ga         792
<210>6
<211>1228
<212>DNA
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkE基因组DNA
<400>6
atgaccatca ccttcaccct accacctcac cagactgcgc tgacagtgga 50
cgagcatgac aaagtcacca tctgggacgt cgccccctgt ccaagcctcc 100
cccccgatca ggtctgcgtg cgcgtcgagg ccgtagccct caaccccagc 150
gacacgaaga tgcgcggcca attcgccacc ccctacgcct tcctgggcac 200
cgactacgcc ggcaccgtcg tcgccgtggg atcgcaggtc acgcacatcc 250
aagtcgggga ccgggtctac ggcgcccaga acgagatgtg tccgcgcacc 300
ccccgaccag ggcccttctc gcagtacacg gtcacccgcg gccgcatctg 350
ggccacggtc cctgagggct ggtccttcga gcaggccgcg tcgttgcccg 400
cgggcatcag cacggccggc ctggcgatga agctgctcgg gctgccttta 450
ccggatccca atgctacgac ggcaccggcc cttccgaagc ccgtgtatgt 500
tttggtgtat gggggtagca ccgctactgc gacgattgtg atgcagatgc 550
tacgcttgta ctgttgcctt cctctgcctg ccagcccaag cttgatatat 600
gtcgtgctaa ccggcgggat tggatcaatc tcgtgtaggt ccggatacat 650
ccccatagcc acatgctccc cgcacaattt cgacctcgcc aaaaagcacg 700
gcgcagaaga tgtctttgac tatcgtgatg ccggtctcgc gcagacgatt 750
gtgagttcat cccctctccc caccaagtta agccacgcgg ttgacgattg 800
ctaacctgct tcagcgcaca tacaccaaaa acaacctccg ctacgccctc 850
gattgcatca ccaacgtcga gtccaccacc ctctgcttcg ccgccatcgg 900
ccgcgccggc ggccgctatg tctccctgaa cccgttcccg gaacacgcgg 950
cgacccggaa aatggtcacc gccgactgga ccctggggcc gaccattttc 1000
ggggaagggt cgacttggcc ggcgccgtat gggcggccgg ggagcgagaa 1050
ggaccgcgca ttcggcgagg agttgtggcg cgttgcggca aggctcgtgg 1100
aggatgggaa gatcgtgcac catcctctgc gggtgattcc tggcgggttc 1150
gaggccatta agcaggggat ggagttggtt aggactgggc agttgtcggg 1200
agagaaggtt gtggtgaagt tggggtaa                         1228
<210>7
<211>1425
<212>DNA
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkF基因组DNA
<400>7
atgcgtcaat ttctctcctc tgatcgcatc aactctgaaa tcccccagga 50
gaaaagcgaa atggtaggat tcagtgatat cgacaatagc agccgccaga 100
tcaaagaaat ggaagccgct ttccgatcgg ccgtgaaaac agggcagatc 150
ccgggggcag tcatcatggc tcgagatcat agtggtaagc aaacccgcat 200
tattctgtct tcttctcttt ctatctcgac gtgtaataac cgggggagtg 250
ggccgaaggc cgactgaact atacgcgctg cttcggggcg cggacggtgg 300
tgcgcgatga gtgtaaccga ctccctccga tgcaggtcga caccccctgc 350
cggctggcga gtgccaccaa gctgcttacg acgatcatgg cgctgcaatg 400
cgtggagcgg gggctcgtga ggttggatga gacggtggat cgactgctgc 450
cggatttgag tgcgatgaag gtgctggagg ggtttgatgc cgcgggggag 500
ccgaagatga gagagcggaa ggggaagatt actttgaagt aagtgaatct 550
agctcgttgc attctatttg atacacttgt gtatgtagag aaaaggagaa 600
aaagagaaaa agagagagag actaattcac gtgctgttca cgcccagaca 650
tctcctaaca cacacctccg gcctgtccta cgtcttcctc caccccctcc 700
tccgagaata catggccaaa ggccacctcc agacggctga gaaattcggg 750
atccagagtc ggctggcgcc cccggccgtc aacgacccgg gcgccgagtg 800
gatctacggc gccaacctcg actggacggg gaagctggtc gagcgcgcca 850
cgggcctgga cctggagcag tacctccaag agaacatctg cgcgccgctg 900
aacatcaccg acatgacctt caagctgcag cagcgacccg atctgctggc 950
gcggcgcgcc gaccagacgc accgcaacaa ggcggacggc cgcctgcgct 1000
acgacgactc ggtgtacttc cggtccgacg gcgacgagtg ctttgggggc 1050
cagggggtct tctcgggccc cgaatcctac atgaaggtcg tgcactccct 1100
gctgcagcgc gacgggcgcc tgctgcggcc cgagaccgtg gacttgatgt 1150
tccagcccgc gctcgatgcg caaacggaga agcagatgaa ccagcatatg 1200
gacgcgagcc cgcacatcaa ctacggtggg ccgatgccca tggtgttgcg 1250
gcggagtttt gggcttggtg ggatgattgc cttggaggat ctggatgggc 1300
agaagtggcg ccgaaagggc tgtttaacct ttggcggcgg gccgaatatt 1350
gtatgggtaa tgttactctc agccctacgc ttcgttttct tcttcttctt 1400
cttcttcttc ttctgctcta gctga                            1425
<210>8
<211>3356
<212>DNA
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkG基因组DNA
<400>8
atggcatcgg cagccgtgac gccaaagctt ggctgggtgc agcaccaggt 50
aaccaacgga ttacatgccg tggtcggcca agtgtgtcga catcccatcc 100
acacgttgct ggtgactgct ctgatcgccg caacgactta tctccatgtt 150
ttggaaggca cctttcgcgc agccaaccta ggtcccggtt ccaagactga 200
cgcagccccc ttcgacgtcc agtcgttcct ctggggcagc cgaagtcttc 250
gcctgggcga gacaagctcg tggagatggc aggtgggcga cttgtctgag 300
gcgactggcg atggccaagt atgataaacc cttttttttt tttttttttt 350
tctgttttgc ttctgtcgat cccaaaactt gcgcgctgac tgcgaccgca 400
ttgttattgc tttctctcta atcaggtcaa tcaccactgg gctcttgtca 450
ctctcagctt ccccggcgcc tcggtcgatg atcgcagccc tgcctttctg 500
tggaacgcac tgcccgactc tgtgggcgca gagccgatca cgccaacctc 550
caacttcttc acctcgatct ccaatgaatt ctcgctggcc tttcgagtcc 600
catacaccca attgagcgat tttctggagg cggtggagtt tgttgcctcg 650
gataaggagg atcgtagctg ggccatcagg tttcctcacg gagagggcaa 700
gcccatttcg ctgggccgct ggctcgggaa ctcgtggctg tcgttccttc 750
accgggctaa acacgccgag acggtagaca tggctatcat cggtttaggc 800
tacctcgctc tgaatatgac cctggtctct ctcttccgag cgatgcgtca 850
gttgggctcg cgtttctggc tggcagcctc cgtgctgctc tctggggcgt 900
ttgcctttgt attcgggctc ggtgtcacga ctgcctgcgg cgtgccagtc 950
gacatgcttc ttctgtcgga agggattccc ttcctggttt tgaccgtggg 1000
gtttgagaag ccgatccgat ttacccgtgc tgttctctac gcatcgaatc 1050
agctccggcg cgggttgcag cagcgggacg ttgccgacaa gcatgacagc 1100
cggcagcgcc atatgatccc caacgccatg ctattcgcca tcaacagaga 1150
aggatggtcc attgtccagt cgtaccttct tgagatcggg gctctcgcat 1200
tgggtgcggt cttccggcca cgggaacgat tcggccagtt ctgcttcctg 1250
gccgcatgga tggtgctctt cgacgccatc cttcttttca ccttctacgc 1300
caccattctc tgcgtcaaac tggaggtgac ccggatgcaa aaccccggca 1350
ccctggatct ggcagacgac caacatgggc cgcgcatctt cgggtacaag 1400
gtcaatccga ccagcctggc ccggtggaag ctaatcatgg taggcgggtt 1450
cgtgctcttc aacgtcctcc aactgtcatc gttcttttat cgcatcatgg 1500
gaggcttcat gaccaatgcc gctctgaccc cgaccaccgt cagtccgttc 1550
aaagtggctg ccaacgggct gaacgatatt tatttggccg cccgtgccgg 1600
cggagttgag acgtgggtca cggtgctacc gccgattcga tatgtcatgg 1650
aagcatctgg gttggaaatg tcggccggca gacgtcctgt atttgatggc 1700
gtgctggccg gactggagag ccccctgggt cggctctgtc tcatgggcgc 1750
tttggttttc agtctttacc tcaataacca cctgatcccg gccgcccgct 1800
ggcatttttc ccccggcgca ccgaaagaat ccgctgcgcc tgcaccccct 1850
tcatcgcccg catcggtccc cagcgctgta ccggtccctg cgccctcctc 1900
tcgcagcttc gaggaaatcg aggccctatt caaagcgaac caggcggaat 1950
ctctgaccga tgacgagctg gcggagctct gtctccgtgg taagattgcc 2000
ggatacagct tagagaagac cttggaaagc attgcctccg caggttcttc 2050
aagcacagca acaactaggc tggaggcttt cacgcgcgcg gttcgcatcc 2100
gccgggccgc cgtgtcgcgg acgccttcga ctcgggacct cagcggcggc 2150
atccaggagt cgctgctccc ctaccgcaac tacaactacg agctggtgca 2200
cggcgcctgc tgcgagaatg tgatcggata cctgcccctg cccctgggtc 2250
tcgcaggacc catggtgatc gacggccagg cgtatttcat cccgatggcc 2300
accaccgagg gtgtcctagt cgccagcgcc agccggggct gcaaggcgat 2350
caacaccggg ggcggcgccg taacgatgct caagggcgac ggcatgacgc 2400
ggggcccctg tctgggattc ccttcggcga aacgcgccgc cgaagcccaa 2450
cgctgggttg agtcccccgt cggccatcaa gtcctcaccg acgccttcaa 2500
cgccaccagc cgctttgccc gtctgcagac cctgactgtg gcccaggccg 2550
gcacctacct ctacatccgg ttccgcacca cgaccggcga cgcaatgggc 2600
atgaacatga tctccaaggg ggtcgagaag gccctacagg cgatgaccgc 2650
ccacgggttc cccgatatga acaccatcac cctgtcgggc aatttctgcg 2700
ccgataagaa atccgccgct atcaactgga tcggtggccg cggcaagtcg 2750
gtcatcgcgg aggccaccat ccccgccgat accgtccgga aggtcctgaa 2800
gactgacatc gatgcactgg tcgagctcaa cacggctaag aacctggtgg 2850
gtagcgccat ggctggtagt atgggggggt tcaacgccca tgcgtccaat 2900
ctggttcagg cggtgttcct ggccactggg caggatcccg ctcagaatgt 2950
ggagagtagt agctgtatca caacgatgaa gaagtatgtg tttttttttt 3000
ttttttccct ttatagtttc cccagattcc ctccccctta atctcaactt 3050
gtactaacag cgaaacaccc caggatcgac ggaaacctgc acattgccgt 3100
ctccatgccc tcgatggagg tcggcaccat cggtgggggc accatcctcg 3150
aagcccaggg agccatgttg gacttgctcg gggtccgggg cgcccatccc 3200
accgatcctg gtgcgaacgc tcgacgcttg gcccggatcg tcgccgcggc 3250
cgtgctggcg ggtgaactga gtacctgctc tgccctagcg gccggtcatt 3300
tggtaaatgc ccatatgcgg cacaatcgca gtgcggcgtc gtcggaaaag 3350
aaataa                                                 3356
<210>9
<211>1464
<212>DNA
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkH基因组DNA
<400>9
atggccctat cgccagtcca ggatccccct tcacacaccg acaaaactat 50
gccccgccgt gcatttcgcc gatcttgtga ccgatgccat gcacagaaga 100
ttaagtgtat aggcagcgag ggagctgttg cccgtgcttc atgtcaacgt 150
tgccagcaag ctggactgcg gtgcgtttac agcgagcgat gccctaagcg 200
caagctaccc aaacccaacc cagcggaatc ttcccctgca agcagcacgg 250
ccggcctgca cacctcttct tcagattctt cgccccctgt tccctccgat 300
ggcttgccgc tagacctgcc agggccggat tcctcaggcg tctccctcca 350
attcctcgac ccgtctgccg actgcgactg gccttggtcc tcgatcggtg 400
tggacgaaac cgttgtcaac aattgcttgg acttatctca tggccatggc 450
catggagacc tcagttgcca gctcgagctg cctatgccag atcttccctc 500
ccccttcgaa ttctcggccg aaaaatctcc ctcaccgtcg gtgtctggca 550
gcattgccgg agctgtcagt gcacaacgag aactcttcga tggcttgtcg 600
acggtgtccc aggaattgga agccatcctt ctggctgtgg cggtggagtg 650
gccaaaacag gaaatctgga cttgtgcgta actccgtttc ccttaacctc 700
actccccccc ccctcctaaa gaagaagaag aacatctgga aaagctaatc 750
tgctttatgc tattgctaga ccccattggg acgttcttca acgcatcacg 800
aagacttctt gtatatctcc aacaacaatc caacacccgc agcgaccaag 850
gcatgctgaa tgaatgtcta cgaaccaaga acctcttcat ggcagtgcat 900
tgttatatgc tgatcgtgaa gattttcacc tctctctcgg aattgctgct 950
atcccagatc cggcattccc aggctggcca gctgacaccc ttggaagggc 1000
atcagttcga gccaccaccg agcagcagca gggaccgtag cagcgtcgat 1050
accatgccca tcttcaaccc gaatctccac atcggcgggt tgttttctta 1100
tctcaacccc ttcatgcacg ccctatcctc ggcttgcacc accttgcgcg 1150
tcggcgtaca gttgctgcga gagaatgaga gtgctcttgg gatccccccg 1200
gcgcaggggg tggcggcctc tgtgagtatg ggcaaggagg agtgggcaga 1250
cggcgaggat gtagccagtg cagtgacgac ggcggacgag gatctccgcc 1300
agccggcctc gcggatctta tccatggtct ggagcgatga ggtgggcgac 1350
cagaaggcca agtctgctga tgctgctggt ccgcgaagcc gaaccctggc 1400
ggtgctacgg cggtgtaatc gagagatctt ttccctggcc cgccaacaca 1450
acctggcctc ctaa                                        1464
<210>10
<211>2148
<212>DNA
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkI基因组DNA
<400>10
atggcttccc accagtctga gaaagagaag ccacagagct gcaccactga 50
agtccaggtc agccatgtca ccggcctaaa gctaggactg gtagtaacct 100
cggtgaccct ggtggtgttt ttgatgttgt tggacatgtc tatcattgtg 150
acagtaagca tggctccagc tcgctaggtc cggacgcagc tgatcgcgat 200
tgcaggctat cccccatatc actgctcagt ttcattccct tggggatgtt 250
ggatggtatg gaagtgcgta tcttttgtcg aggtgataat ccaaaccccc 300
tctcttattt tcgtggcaag tgggcgttcc gtttacgctg tagtgtgctc 350
tagctgtgct ctacagccct tggcagggaa gctctacact ctcttgacat 400
tgaagtatac cttcctagca ttcctcgggg tgtttgaagt cggatcagct 450
ctctgtggcg ccgcgcgttg ttcaactatg ttgatcgtgg ggcgcgcagt 500
ggctggcatg ggaggatcgg ggctcaccaa tggagccatc accatcctcg 550
cctctgcagc tccaaaacaa cagcaaccac gtaagtgctg gtcacgggtc 600
gaccgatcgg acttcggtga tggcatactg acaaagctac atagtgttaa 650
tcgggatcat gatgggtcgt aagcttcctt atgcactaac tcccaaaggc 700
caaacacgag gtctgatttg aatctagtga gccaaattgc cattgtctgt 750
ggaccattgc tgggaggtgc ttttacccaa cacgcaagtt ggcggtggtg 800
tatgtcccaa cgttgttttg tatgttgcca gtcgacgttc ttgctgaaat 850
ggaaacccac gatcgttctt ccacccaggc ttctatatca atcttcctgt 900
cggagcgctg gccgccatcc tccttctcgc catccacatt cctaagagtg 950
tgccaacatc ggattgcaca atgcctgctc ccagagctgt tggggtccgg 1000
gtcatcctga gtcagctcga tctcctgggg tttgtgctct tcgccgcctt 1050
tgccgtgatg atctcacttg cgttagaatg gggcgggtcc gattatatgt 1100
gggatagctc cgtaatcatc ggcttgttct gtggtgccgg catctcgctg 1150
gtggtgtttg ggttctggga acgctacgta ggcaactcga tggcgatgat 1200
tcctttctcg gtggccagtc gtcgacaagt ctggtgctcg tgtcttttct 1250
tgggcttttt ctccggggcc ttgctcacct tctcttacta ccttcctatc 1300
tacttccagg ccgtgaagga cgtctctccc accatgagtg gggtgtatat 1350
gcttccaggc atagggggac aaattgtgat ggcgatcgtc tccggcgcaa 1400
tcagtgagtt cagaatatca ctttgataat ttctgttttg tggggaaacc 1450
atgcacgact gaccaatcta tataagtcgg caaaacgggg tattacattc 1500
cctgggcgct tgccagtggg atcatcgtat ctatctccgc aggcctggta 1550
tcgaccttcc agccgcatac ctcaatcgca gcgtgggtga tgtatcaatt 1600
catggggggc tttggtcgag gatgtggaat gcagaccgta cgttacccca 1650
accaacatac gaggtgtttt tgtttctgtt ctgtttctgg tttgttccag 1700
gttcttttct atttctgtac tcactctagc tcactcgctc tctatctcct 1750
tctagcccat cattgccatt caacatgccc tgccaccaca aatgagtgcg 1800
ctcggtatct cgctggccat gttcggccag accttcggcg gctccctctt 1850
cctcaccttg gccaagctcg tcttcagcgc cggccttgac gccggcttac 1900
gcgagtatgc gcccgccgtc agcgcagagg cggtgacggc cgcgggcgcc 1950
acgggcttcc gcgatgtcgt ccccgcaaat ctcctttctc aggttctcct 2000
ggcatactgt aaagggatag accatacatt ctaccttgcg gtcggggcat 2050
cgggagccac ttttttgttt gcgtggggaa tgggtcaggt cggtttgatt 2100
tggtgggggg aggaaaggac ggggttcggc cgcgatgaac gagtctag   2148
<210>11
<211>3075
<212>PRT
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkA氨基酸序列
<400>11
MYVGRIGATT YISRPADSRA TPKVIKTQGS ITTSNLTSLT TMAQSTYPNE 50
PIVVVGSGCR FPGGANTPSK LWELLREPRD VRSKIPKERF DVDAFYHPDG 100
KHHGRTNAPY AYMLQEDLRA FDGPFFNIQA GEAESMDPQQ RLLLETVYEA 150
VSDAGMRIQD LQGSSTAVYV GMMTHDYETV STRDLESIPT YSATGVAVSV 200
ASNRISYFFD WHGPSMTIDT ACSSSLVAVH LAVQQLRSGQ SSMAIAAGAN 250
MILGPMTFVL ESKLNMLSPS GRSRMWDAGA DGYARGEAVC SVVLKTLSQA 300
LRDGDSIECV IRETGVNQDG RTTGITMPNH SAQEALIRAT YSKAGLDITN 350
PEDRCQFFEA HGTGTPAGDP QEAEAIATAF FGHKKEASDA ENAETPLFVG 400
SVKTVVGHTE GTAGLAGLMK ASFAVQHGVI PPNLLFENIS PRVAPFYSNL 450
KIATETTPWP TIKPGQPRRV SVNSFGFGGT NAHAIIEEYI KSDQKVPASR 500
QPVEYSDSPS TLNLPLVLSA KSQRSMKTTL ESMVQFLQSN PEVNLRDLSW 550
TLLRKRSILP FRRAIVGHSH EAIRAALEAA IEDGIVVSDF SADVKGKPSV 600
LGVFTGQGAQ WPGMLKELIV GSSYVRSIAE ELDHSLQTLP EKYRPSWTIL 650
EQLMLEDEAS NVRHASFSQP LCCAVQIVLV RLLKAAGIQF AAVVGHSSGE 700
IACAFATGLI SASLAIRIAH LRGVVSAEHA ASASGGRGSM LAAGMSYEEA 750
KELCELDAFE SRICVAASNS PDSVTFSGDA DAIEHLQGVL EDEATFARLL 800
RVDTAYHSHH MLPCAAPYMQ ALEECGCAVA DGDGQVEEGS WYSSVKDSNE 850
PMGLADVTAE YWKDNLVSPV LFSQAVQRAA IMHRPLDVGI EVGCHPALKG 900
PCLATIKDAL SDVDLAYTGC LERGKNDMNA FSQALAYLWE QFGIPSLDAD 950
RFISTIAPER SCVSLSKQLP TYSWDHSRSY WTESRATRQH LRGPKPHLLL 1000
GKLSEYSTPL TFQWLNFVRP RDIEWLDGHA LQGQVVFPAA GYIVMAMEAA 1050
MEIANSHQVQ VQLLEILDMS IDKAVVFDDE DSLVELNLTA EVTSGIGKGD 1100
RMILSFIIDS CLSREGDLST SAKGQLVVTL DEGHLQVTPD NEKQLLPPPE 1150
EEHPHMNRVN INSFYHELDL MGYDYSKDFR RLHSMRRADA RASGILEFIP 1200
LNDEVHGRPL LLHPAPLDIA FQTVIGAYSS PGDRRLRCLY VPTHIDRIAL 1250
VPSLCLATAA SGCDKIAFNT INTYDKGDFL SGDIVAFDAE QTSLFHVENI 1300
VFKPFSPPTA STDHPIFAKW SWGPLTPETL LDNPNHWATA QDKEAIPIIE 1350
RIVYFYIKLF LQQLTREDRE QAAFHLQRQI VWCEQVVADA HEGRHQWYDA 1400
AWENDTEAQI EQLCARSSYH PHVRLVQRVG QNLLATIRSN GNPFDLMDHD 1450
GLLTEFYTNT LSFGPALHYA QDLVGQIAHR YQSMDILEIG AGTGGATKYV  1500
LATPQLGFNS YTYTDISTGF FEKAREQFAA FEDRMEFEPL DIRRSPAEQG  1550
FTEHVYDLII ASNVLHATPD LEKTMAHARS LLKPGGQMVI LEITHRNHTR  1600
LGFIFGLFAD WWAGIDDGRT MEPFVSFDRW DEILKHVGFS GIDSRTKDRD  1650
ADLFPTSVFS THAVNSTIDY LHKPLDAPVK DSYPPLVVVG GQTPKTQRIL  1700
DEIKAVMPNR QIQLHQRLVD LLDAEDMQAK FTFVVLTELD EELFAGLTED  1750
SFEAVKLLLM YAGNMLWLTE NAWVKRPHQA STIGMLRSIR REHPDIGVHI  1800
MDVDSAENLD AHFLVEQVLR LEEDIDELAA TTTWTQEPEV FWCNGRAWIP  1850
RLKHDKSRNN RMNSSRRQIF ETLNPSKIPV ALKKAAASSS YYLESAETWP  1900
VPGAVTAGDR KTVHVRLSHP HALRVGHLGF FYLVQGHVLK GDQALPVVAL  1950
AERNASIVHV RSDYVHVLED TAVSANNGSF ILAAAAAVLA ETVIHSAKSL  2000
GADASVLVLN APGFCAQTLL RAARDSGLRV HLATTSSSTD PSPGADRCVR  2050
LHPRDTDRRL KQLLPRGTQA FFDLSTDPSS EGLTQRLPNV LIPSCVRHST  2100
EYLLRDTASA GGKATLPAAY WERVASLANH SLSTHFKEND NASNGCQVLS  2150
CTDIVARNNK SRLNASTVIS WPDDAALPAR IRPIDTETLF AAEKTYLLVG  2200
LTGDLGRSLG RWMVLHGARR IVLTSRNPQV SPNWVAHVEE LGGQVTVLSM  2250
DVTSEDSVDS GLAKLQDLKL PPIGGIAFGP LVLQDVMLKN MDLQMMEMVL  2300
KPKVEGARIL HEKFSDPASS NPLDFFVMFS SIVAVMGNPG QANYSAANCY  2350
LQALAQRRCA SGLAASTIDI GAVYGVGFVT RAELEEDFNA IRFMFDSVEE  2400
HELHSLFAEA VVSGRRAMHQ QQQFKTVLDM ADIELTTGIP PLDPTLKDRI  2450
TFFDDARVGN FKIPERRGKA GDNAAGSKGS VKEQLLQATS LDQVRQIVID 2500
GLSEKLRVTL QIPDGESVHP TIPLIDQGVD SLGAVTVGTW FSKQLYLDLP 2550
LLRVLGGASV ADLADDAAAR LPPSSIPLVA ASEGGAETSD NDTSGPEGTD 2600
LSASTTITEP SSADEEDEKQ EDDNDNSVLA LHPLSLGQEY AWRLQKAADD 2650
STIFNNTIGM FMTGSIDAKR LSKALRAVLR RHEIFRTGFA AVGNNADATS 2700
LAQIVFGRTK NKVQVIQVAD RAGAEEGYRQ LVQTQYDITA GDTLRLVDFF 2750
WGKDEHLFVV AYHRFVGDGS TTENIFVEAS QLYGGVTLDK HVPQFADLAT 2800
RQREALESGQ MDADLAYWES MHHQPTGVVS PVLPRMLLGE DGLNSPNHAR 2850
QPNSWKQHEA IARLDPMVAF RIRERSRKHK ATPMQFYLAA YHVLLARLTG 2900
SSDFSIGLAD TNRTNVDELA GMGFFANLLP LRFRNFVPHI TFGEHLVATK 2950
DKVREAMQHA RVPYGVLLER LGFEVPGATA ETAEPAPLFQ AVFDYKQGQA 3000
ESGSIGSAKM TEVIATRERT PYDVVLEMSD DPTKDPLLTV KLQSSVYEVH 3050
HPRAFLESYI SILSMFSMNP ALKLA                            3075
<210>12
<211>2547
<212>PRT
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkB基因 氨基酸序列
<400>12
MKATAASGTP TPIAVVGMGC RFAGGATDPQ ALWKLLEQGG STWSKTPSSR 50
FNVSGVYHPN GQRVGSMHVR GGHFLDQDPA LFDASFFNMT SEVASCMDPQ 100
QRLILEVVYE ALEAAGIPLE SVAGSNTAVF SGAMYHDYQD SLHRNPETLP 150
RYFITGNAGT MMSSRVSHFY DLRGPSVTVD TACSTTLTAL HLAIQSIRAG 200
EADMAIVAGS NLLLNSDVFV TMSNLGFLSP DGISYSFDPR ANGYGRGEGV 250
AAIILKALPR ALRDGDPIRL VVRETALNQD GRTPAITGPS PEAQACLIRE 300
CYQKAGLDPR QTSYVEAHGT GTPTGDPLEL AAISAAFQGQ PLQIGSVKAN 350
LGHTEAASGL ASVMKVALAL EKGIVPPSAR FLQPSKKLLE ERKFQIPLSS 400
QLWLPIDGIC RASINNFGFG GANAHAIVER YDPAARISTS KPNGHIRPHD 450
SHVEADRGKI YVLSAKDEHS CQEMISRLRD YLNRANPTDE RQFLANMAYT 500
LASRRSNLRW KAACRAHSLA SLLSVLVSDG TRPRRSAEKA RLGWVFTGQG 550
AQWFAMGREL IEAYPVFKEA LIECDGYIKG MGANWSIIDE LRRGEAESRV 600
NEAEFSLPLS TAIQVALVRL LWSWGIRPAA ITSHSSGEVA AAYAVGAFSA 650
RSAIGISYIR GALIAKTQPA PTTKGGMLAV GLSRSEVGEY ITRVQQQGEE 700
YLVVGCINSP SNVTVSGDLS AVVRLEELLH ADQIFARRLK VTQAFHSHHM 750
QPLSGEFREA LVEVFNADIT DTTNACQDVV YASPKTGKRL DDCNHLRDPM 800
HWVESMLFPV EFESSFREMC FDRKDQAQEV DKIIEIGPHG VLSGAIKQIL 850
QLPELAAFDI SYLSCLSRGK SAVDTIQLLA MDLLQGGYPV DLNAVNFPYG 900
CEAAEVQVLS DLPTYPWNHK TRYWKEPRIS RAARQRKIPV HDLIGVQEPL  950
CPPLLHLWQN VLRISDVPWI RDHVVGSRIL FPGAGFISMV IDGLSQICNH  1000
DPETCGLSYI LRDVDLAQAL ILPTDGDEGV DLRLTIRAAD QKSLGMRDWQ  1050
RFSVYSIAGD KDDWTEHCTG LIRAQVDHPV SSSSIQQKTN PPQWSRKMAP  1100
QDLWASLHAT GICHGPLFQN IERIESDGQA SWCTLTVADT VATMPHAYES  1150
QHIVHPTTLD SAIQAAYTVL PFMGTLMKTA MVPSRIGGMK IPASFASLEP  1200
GDMLCAQAKI KNQGLSAFTT DVAVFNESDM DEEAGIELEG LTFQSLGAVI  1250
SDSRRDLTEN ESTYSSWHWA PDITLTNSTW LERILSTGTQ SQEIGVMLEL  1300
RRCTVHFIQE AIENLTTEDV ERLSGHLVKF YCWMQAQLAC ATNGELGQDS  1350
ADWLRDSEQE RQSLRSRVVA ATNNGEMICR LGPKLSAILR GELDPLELMM  1400
DGQLLSRYYI RAIKWSRSNT QASELVRLCC HKNPRARILE IGGGTGGCTQ  1450
LIVNALGPTK PVGRYDFTDV SAGFFEAARK RFSGWQDVMD FRKLDIEGDP  1500
EVQGFDCGSY DVVLACQVLH ATSNMQRTLN NVRKLLKPGG KLILVETTRD  1550
QLDLFFTFGL LPGWWLSEEP ERQLTPSLSP ELWRSVLSAT GFSGVDLEVR  1600
DCDSDEFYMI STMMSTATPG TPATTLNGPA EVLLVHAGSP PPMDWLQNLQ  1650
VALGGKNSSI TSLKALQGVS DLKGKMCVFL GEMDRTLLES VVSDDFTSLT  1700
SMLQYSQGTL WVTRGAAMAS DDPRKALHLG LLRTLRNENH GRRFVSLDLD  1750
PLRDPWTAQS CDAIVNVLNA VGASHEKEFE YAERDGTIHV PRTFSDSSSS  1800
EKEDLVVLEP FQNETRLVRL DVQTPGLLDS LHFKLCSADE AWSSELPEDW  1850
VEIEPRAFGL NFRDIMVAMG QLESNRVMGF ECAGVVTRLS KAATTGAGGL  1900
AIGDRVCALM KGHWASRVRT ARTNVICIPG TLSFEQAASI PLAFTTAYTS 1950
LYTVARLQRG EKVLIHGGAG GVGQAAIILA QLVGAEVFTT AGTHSKRNFL 2000
IDKFKLAPDH VFSSRDSGFI EGIRACTNGK GVDVVLNSLA GPLLQYSFDC 2050
LVNFGRFVEI GKKDLEQNSR LNMATFARNV SFSSIDILYW EEAKSAEIFR 2100
ALTEIMRLLE QKTIDLIGPI SEYPMSAIEK AFRTMQSGQH VGKLVVATAE 2150
TDMIPVRRGT MPVALKLDAS YLIVGGLGGI GRRICEWMVD HGARHLLILS 2200
RSGRTDPFVT GLQKRGCVVR IHSCDVADES QLHAVLQQCH EDNMPPIRGI 2250
IQAAMVLKDA LVSQMTADDF HVALRPKVQG SWNLHKIASE VDFFIMLSSL 2300
VGVMGGAGQA NYAAAGAFQD ALAQHRVAQG KPAVTIDLGM VKSIGYVAET 2350
DPAVAERLAR IGYQPMHEEE VLAVLERAMS PSSSSAPPSS NPTIPASPAV 2400
IVTGINTGPG PHFTNADWMQ EARFAGIKYR DPLKDDRGGA LSSSQPADED 2450
SVRARLSRAS TEEEATALVV QVMGHRLVTM FGLTESEMSA TQTLSSVGVD 2500
SLVAIELRNW ITAQLNVDIS VFELMEGRTI AEVAEVVVKK YGVGSKV    2547
<210>13
<211>524
<212>PRT
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkC基因 氨基酸序列
<400>13
MTVPTDTVSR RLQSLAWSDI KQHAPWLPSS RTLVSGFLCL ILLQILYSRG 50
RKSDLRVYNP KKWWELTTMR AKREFDANAP AWIEAWFSKN DQPLRFIVDS 100
GYCTILPSSM ADEFRKMKEL CMYKFLGTDF HSHLPGFDGF KEVTRDAHLI 150
TKVVMNQFQT QAAKYTKPLA DEASATIADI FGDNKEWHTA PVYNECLDLV 200
TRTVTFIMVG DKLAHNEEWL DIAKHHAVTM AIQARQLRLW PVILRPIVHW 250
LEPQGAKLRA QVRRARQLLE PIIQERRAEK AKCLAQGIEP PRYVDSIQWF 300
EDTAKGQWYD AAGAQLAMDF AGIYGTSDLM IGGLVDIVRH PHLIEPLRNE 350
IRTVIGEEGW TPASLYKLKL LDSCLKESQR VKPVECATMR SYALQNVTFS 400
NGTFVPKGEL VAVAADRMSN PEVWPEPKKY DPYRYMRLRE DPDKAFSAQL 450
ENTNGNHIGF GWHPRACPGR FFASKEIKIM LAFLLIRYDW KLVPNEPLQY 500
YRHSFSVRIH PATKLMMRRR DEDL                             524
<210>14
<211>263
<212>PRT
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkD基因 氨基酸序列
<400>14
MRIQRTPAPP KAPRALLCVH GAGCSPAIFR VQLSKLRAAL REDFEFVYAT 50
APFPSAPGPG ILPTFEGLGP YYTWFEGSPS GAAAKGDNSN SNDSNSSPTV 100
HDRLAAVHEP VRRAIAEWQT QNPSIPIVGT VSFSEGALVT ALLLWQQQMG 150
RIPWLPVMQV AMFICCWYQH EATQYMREEV GCGGDGGIDG EKLVIRGVLS 200
LHLQGRDDFA LAGSKMVVAQ HFVPGEAQVL EFAGRHHFPN RPRDVLETVK 250
RFRQLCVRAR VIG                                         263
<210>15
<211>360
<212>PRT
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkE基因 氨基酸序列
<400>15
MTITFTLPPH QTALTVDEHD KVTIWDVAPC PSLPPDQVCV RVEAVALNPS 50
DTKMRGQFAT PYAFLGTDYA GTVVAVGSQV THIQVGDRVY GAQNEMCPRT 100
PRPGPFSQYT VTRGRIWATV PEGWSFEQAA SLPAGISTAG LAMKLLGLPL 150
PDPNATTAPA LPKPVYVLVY GGSTATATIV MQMLRLSGYI PIATCSPHNF 200
DLAKKHGAED VFDYRDAGLA QTIRTYTKNN LRYALDCITN VESTTLCFAA 250
IGRAGGRYVS LNPFPEHAAT RKMVTADWTL GPTIFGEGST WPAPYGRPGS 300
EKDRAFGEEL WRVAARLVED GKIVHHPLRV IPGGFEAIKQ GMELVRTGQL 350
SGEKVVVKLG                                             360
<210>16
<211>413
<212>PRT
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkF基因 氨基酸序列
<400>16
MRQFLSSDRI NSEIPQEKSE MVGFSDIDNS SRQIKEMEAA FRSAVKTGQI 50
PGAVIMARDH SGRLNYTRCF GARTVVRDEC NRLPPMQVDT PCRLASATKL 100
LTTIMALQCV ERGLVRLDET VDRLLPDLSA MKVLEGFDAA GEPKMRERKG 150
KITLKHLLTH TSGLSYVFLH PLLREYMAKG HLQTAEKFGI QSRLAPPAVN 200
DPGAEWIYGA NLDWTGKLVE RATGLDLEQY LQENICAPLN ITDMTFKLQQ 250
RPDLLARRAD QTHRNKADGR LRYDDSVYFR SDGDECFGGQ GVFSGPESYM 300
KVVHSLLQRD GRLLRPETVD LMFQPALDAQ TEKQMNQHMD ASPHINYGGP 350
MPMVLRRSFG LGGMIALEDL DGQKWRRKGC LTFGGGPNIV WVMLLSALRF 400
VFFFFFFFFF CSS                                         413
<210>17
<211>455
<212>PRT
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkH基因 氨基酸序列
<400>17
MALSPVQDPP SHTDKTMPRR AFRRSCDRCH AQKIKCIGSE GAVARASCQR 50
CQQAGLRCVY SERCPKRKLP KPNPAESSPA SSTAGLHTSS SDSSPPVPSD 100
GLPLDLPGPD SSGVSLQFLD PSADCDWPWS SIGVDETVVN NCLDLSHGHG 150
HGDLSCQLEL PMPDLPSPFE FSAEKSPSPS VSGSIAGAVS AQRELFDGLS 200
TVSQELEAIL LAVAVEWPKQ EIWTYPIGTF FNASRRLLVY LQQQSNTRSD 250
QGMLNECLRT KNLFMAVHCY MLIVKIFTSL SELLLSQIRH SQAGQLTPLE 300
GHQFEPPPSS SRDRSSVDTM PIFNPNLHIG GLFSYLNPFM HALSSACTTL 350
RVGVQLLREN ESALGIPPAQ GVAASVSMGK EEWADGEDVA SAVTTADEDL 400
RQPASRILSM VWSDEVGDQK AKSADAAGPR SRTLAVLRRC NREIFSLARQ 450
HNLAS                                                  455
<210>18
<211>543
<212>PRT
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkI基因 氨基酸序列
<400>18
MASHQSEKEK PQSCTTEVQV SHVTGLKLGL VVTSVTLVVF LMLLDMSIIV 50
TAIPHITAQF HSLGDVGWYG SAYLLSSCAL QPLAGKLYTL LTLKYTFLAF 100
LGVFEVGSAL CGAARCSTML IVGRAVAGMG GSGLTNGAIT ILASAAPKQQ 150
QPLLIGIMMG LSQIAIVCGP LLGGAFTQHA SWRWCFYINL PVGALAAILL 200
LAIHIPKSVP TSDCTMPAPR AVGVRVILSQ LDLLGFVLFA AFAVMISLAL 250
EWGGSDYMWD SSVIIGLFCG AGISLVVFGF WERYVGNSMA MIPFSVASRR 300
QVWCSCLFLG FFSGALLTFS YYLPIYFQAV KDVSPTMSGV YMLPGIGGQI 350
VMAIVSGAII GKTGYYIPWA LASGIIVSIS AGLVSTFQPH TSIAAWVMYQ 400
FMGGFGRGCG MQTPIIAIQH ALPPQMSALG ISLAMFGQTF GGSLFLTLAK 450
LVFSAGLDAG LREYAPAVSA EAVTAAGATG FRDVVPANLL SQVLLAYCKG 500
IDHTFYLAVG ASGATFLFAW GMGQVGLIWW GEERTGFGRD ERV        543
<210>19
<211>9228
<212>DNA
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkA cDNA
<400>19
atgtacgtag gacgcattgg tgcgaccaca tacatctctc gtcccgcaga 50
ctctcgagct acgccaaaag tgatcaaaac tcaagggtcg atcaccacgt 100
ctaatctaac atcactaaca accatggctc agtcaacata ccccaatgag 150
cctattgtcg tggtaggaag cggctgccgc tttcccgggg gcgccaacac 200
gccctccaag ctgtgggagc tccttcggga gcctcgcgac gtccgtagca 250
aaatcccgaa agagagattt gacgtcgacg cattctatca tccagacgga 300
aaacaccatg gacgaacaaa cgcaccctat gcctatatgc tacaagaaga 350
cctgcgcgcc ttcgacggcc ctttcttcaa tatccaggcc ggagaggccg 400
agagtatgga tccacaacag cggctcttgc tggagaccgt gtacgaggca 450
gtctcagatg ccggtatgcg gatccaagac ctgcaggggt cttccactgc 500
cgtttatgtt ggcatgatga cacacgacta cgagacggtg tcgacgcgcg 550
acttggagag cattcccact tactcggcca cgggagtcgc tgttagtgtc 600
gcgtcgaacc gcatctcata cttctttgac tggcatggcc cgagtatgac 650
gatcgatacc gcatgcagct cgtctttggt tgccgttcac ctggctgtac 700
aacagctacg cagtgggcaa agctccatgg ctatcgccgc gggcgccaac 750
atgatcctcg ggcccatgac cttcgttcta gaaagcaagt tgaacatgtt 800
atccccctcg ggccggtccc gcatgtggga cgctggggcc gatggctatg 850
ctagaggcga agctgtttgt tcggtagtgc ttaaaacatt gagccaagcc 900
ttgcgcgatg gcgacagcat tgaatgcgtt atccgagaaa ccggtgtgaa 950
ccaagatggt cgaacgacag gcatcacgat gcccaaccac agcgctcagg 1000
aggcacttat cagggctacc tactccaaag ccggcctcga catcacgaac 1050
cccgaggatc gatgccagtt cttcgaggct catggaactg gtacaccagc 1100
aggagatcca caggaggccg aggccatcgc aaccgccttt ttcggacaca 1150
aaaaggaggc ctccgatgct gagaacgcag agactcccct cttcgtgggc 1200
agtgtgaaga ccgttgtcgg tcatactgag ggcactgccg gcctggctgg 1250
tctcatgaag gcgtccttcg ccgtccagca cggagtgatc ccgcccaacc 1300
tgctgtttga gaatatcagc ccccgcgtgg ccccattcta ctccaatttg 1350
aagattgcaa cagagacaac accatggccc accatcaaac ctggacagcc 1400
tcgccgtgtc agtgtcaact cttttggttt cggtggcacg aatgcacatg 1450
caattattga ggaatacata aagtctgacc aaaaggtgcc agcgagccga 1500
cagccggtgg agtactcaga cagtcccagt acattgaatc tgcccttggt 1550
tctctcggcc aagtctcagc gctccatgaa gacaacgttg gagagcatgg 1600
tacagttcct tcagtccaac cctgaagtta acttgcggga tctttcatgg 1650
actctactgc ggaagcggtc gattctaccc ttccgtcggg ctattgtcgg 1700
ccatagccac gaagcaatcc gtgccgctct cgaggcagcc attgaagacg 1750
gcatcgttgt gagcgacttc agcgcggatg tcaaaggcaa gccgtctgtg 1800
ctgggagtct tcaccggaca gggtgcccaa tggcctggga tgttgaagga 1850
actgattgtg ggatcatcct atgtgcggtc gatagcggag gagctggatc 1900
actcactgca gactttgccg gagaagtacc gcccctcctg gaccattctc 1950
gagcagctaa tgctagaaga tgaggcttcc aacgtccgac acgccagctt 2000
ctcccagccc ctatgctgtg ctgttcagat tgttctggtg cgtctcctga 2050
aagcagcagg aatccagttt gctgctgtgg tcggacacag ttccggagag 2100
atcgcctgtg catttgccac cggtcttatc agtgcatcct tggcaattcg 2150
tattgcccac ctgcgtggag tcgtttcggc ggagcacgct gcctccgcga 2200
gcggaggacg cggatctatg ttggcagcag gtatgtccta tgaggaagcg 2250
aaagagctct gtgagttgga tgcctttgaa agccgcatct gtgttgctgc 2300
tagcaattcc ccagacagcg ttaccttctc gggagatgcg gatgcaattg 2350
agcacttgca gggcgttctg gaggacgagg ctacgttcgc cagactgctc 2400
agggtggata cagcatacca ctctcaccat atgcttcctt gtgcagcgcc 2450
gtatatgcaa gctttggagg aatgcggctg tgctgttgct gatggagacg 2500
gtcaggtgga agagggatca tggtattcct ctgtcaagga cagcaacgaa 2550
ccaatgggcc ttgccgacgt gactgctgag tactggaaag ataacctggt 2600
atccccggtg cttttctctc aggccgtcca gcgggcagcc atcatgcacc 2650
ggcccctgga tgtcgggatt gaagtcggtt gccaccctgc tctcaagggc 2700
ccgtgtctgg ctaccatcaa ggatgctctg tcggacgttg acctggcata 2750
cacaggatgt ttggagcgcg gaaagaatga tatgaatgca ttttcccagg 2800
ccctggccta tctttgggag cagttcggaa ttccaagcct ggatgctgac 2850
cgctttataa gtaccattgc tcccgagcgc tcctgcgtga gcctttcgaa 2900
gcagctgccg acgtactcat gggaccattc tcggagctat tggacggaat 2950
ctcgtgccac tcgtcagcac ctgcgaggac cgaagccgca tcttctgctg 3000
ggtaagctct ctgaatatag cactccgttg accttccagt ggctgaactt 3050
tgtccgtcct cgcgacattg aatggctgga tgggcatgca ttgcagggcc 3100
aagtggtctt ccctgccgcg ggttatattg tcatggcgat ggaggcggcc 3150
atggaaattg ccaactctca tcaggtgcaa gtccagctac ttgagatcct 3200
ggatatgagc attgacaaag cggtggtttt cgatgatgaa gacagtctgg 3250
tagaacttaa cttgaccgcg gaagtaacca gcggcatcgg taaaggtgac 3300
cggatgatcc tcagcttcat aattgattcc tgtctatcca gggaaggtga 3350
cctctccacc tcagccaagg gtcagctagt cgtcacattg gatgaaggcc 3400
atctccaggt gaccccagat aacgagaagc agctcctacc cccgccagaa 3450
gaagagcatc ctcacatgaa ccgagtgaat atcaattcat tctaccacga 3500
gctggatctg atgggctacg actacagcaa agacttccgg cgcctgcata 3550
gcatgcgacg agccgatgca cgagccagtg gaattttgga atttattcct 3600
ctgaacgacg aggtccacgg ccgtcctctc ctgctgcatc ccgctccctt 3650
ggacattgcc ttccagacag tcatcggcgc atactcctcc cccggagatc 3700
gacgtctacg ctgcctgtat gtgccgacgc acattgatcg cattgctctt 3750
gtgccctctc tctgtcttgc gacagctgcg tccggttgtg acaagattgc 3800
cttcaatact atcaacacct atgacaaggg tgatttcctc agcggtgaca 3850
tcgtggcgtt tgacgcggag cagaccagtc tgttccatgt cgagaatatt 3900
gtttttaagc ccttctcgcc cccgactgcg tctactgatc atccgatctt 3950
cgccaaatgg agctggggtc cactgacccc ggaaaccctg ctggacaacc 4000
ccaaccattg ggccacggcg caggataagg aagcgatccc catcattgaa 4050
cgcattgtct acttttacat caaattgttc ctgcagcagc tgacccgaga 4100
agatcgcgaa caagcggcat tccacctgca gaggcagatt gtgtggtgtg 4150
aacaagtcgt ggccgacgct cacgaaggtc gtcaccaatg gtacgatgca 4200
gcttgggaga atgataccga agcccagata gagcagttat gtgccagaag 4250
ctcctaccac cctcacgttc gcttggtaca gcgagttggt caaaacctgc 4300
tcgcaaccat ccgttcgaat ggcaacccgt tcgatctcat ggaccatgat 4350
ggcctgttga ccgagttcta taccaacacg ctcagttttg gcccagcgtt 4400
gcactatgcc caagaccttg tgggtcaaat tgcccatcgc tatcaatcta 4450
tggatatcct ggagatcgga gctggaaccg gtggcgccac caaatacgtg 4500
ctggcaacgc ctcaactcgg gttcaacagc tacacgtaca ccgacatctc 4550
gaccggcttc ttcgaaaagg cacgcgaaca gtttgctgcc ttcgaggacc 4600
gcatggagtt tgagcccctc gatatccgcc gcagcccagc agagcaaggt 4650
ttcacggagc acgtgtacga cctaatcatc gcgtccaacg tgctacacgc 4700
aacgcccgac ttggagaaga ccatggccca tgcacgctcc ctgctgaagc 4750
ccgggggcca gatggtgatt ctggagatca cccaccggaa ccacaccaga 4800
ctagggttta tcttcggcct gttcgccgat tggtgggcag gtatcgacga 4850
tgggcggacc atggagccat ttgtgtcgtt tgaccgctgg gatgagatct 4900
tgaagcacgt cgggttttcc ggcatcgaca gtcgcaccaa ggaccgcgat 4950
gcggatctgt tccccacatc ggtcttcagc acgcatgccg ttaactcgac 5000
aatcgactac ctgcacaagc ctcttgacgc tccagtgaag gactcgtacc 5050
ccccgttggt ggtggtcggt ggccagacgc caaagaccca gcgcatcttg 5100
gatgagatca aagccgttat gcctaatcgc cagatccagt tacaccagcg 5150
tctcgttgat ttgttggatg cagaggacat gcaggccaag ttcacctttg 5200
ttgtcctcac ggagctggac gaggagctat tcgctggtct caccgaagac 5250
agctttgaag cagtcaagct actgctcatg tacgccggga acatgctgtg 5300
gctgaccgag aatgcctggg tcaagcgccc tcatcaggcg agtaccatcg 5350
gaatgctgcg ctccatcaga cgcgagcacc ccgacattgg tgtccatatt 5400
atggatgtcg actctgccga gaacctggac gcacacttcc tggtcgaaca 5450
ggtccttcgg ctggaggagg atatcgacga attggcagcc acgacaacgt 5500
ggactcagga gccagaagtc ttctggtgca atggccgcgc ctggattcct 5550
cgtctgaagc atgataaatc gaggaataac cgtatgaact cctcacgtcg 5600
tcagatcttt gagaccctca atccatccaa gatccccgtt gcattgaaga 5650
aggcggcagc ctcctcttct tactacctgg agtcagctga gacctggccc 5700
gtgccaggtg ccgttactgc aggggatagg aaaacggtcc atgttcggct 5750
cagccatccc cacgcccttc gggttggaca tcttgggttt ttctacctcg 5800
ttcagggcca cgtcctgaag ggtgatcaag cacttcctgt ggtggctttg 5850
gctgagcgca acgcatcgat tgtccacgtt cgttcagact atgtccatgt 5900
tctagaagat accgcggtgt ctgcgaacaa tggaagtttc atcttggccg 5950
ctgcagcggc cgtgttggcc gagacggtga ttcacagtgc caagagcctg 6000
ggagctgatg cctcggtcct ggtcttgaat gccccgggct tctgtgccca 6050
gacattgctc cgcgctgcaa gagattctgg acttcgggtc catctggcca 6100
ccacatcgtc cagtaccgac ccgtctcctg gggccgaccg ttgcgtccga 6150
ctgcatcccc gcgacacgga taggcgcctc aaacagcttc tgccccgtgg 6200
cactcaggca ttcttcgatc tgtccaccga tccgagcagt gaaggtctca 6250
cacagcgatt gccaaacgtc cttataccca gctgtgttcg gcacagtact 6300
gaatacttgc tcagagatac cgcttccgct ggtgggaaag ctacgctgcc 6350
cgcggcatac tgggagcgtg tagcctcctt ggctaatcac agcctcagta 6400
ctcactttaa ggagaatgat aatgccagca atggatgcca ggtcttgtct 6450
tgcacagaca ttgtcgcgcg taataacaag agccgtctga acgcatcgac 6500
tgtcatctcc tggccagatg acgcggccct cccggccaga atccgtccca 6550
tcgataccga gaccctgttt gcagcggaaa agacgtacct cttagtcgga 6600
ctcactggag atctcggccg gtccttgggc cgctggatgg tcttacacgg 6650
tgcccgccgc atcgtcctca ccagccgcaa cccgcaagtg agcccgaatt 6700
gggtggcgca tgttgaagag ttgggcggcc aggttaccgt tctgtccatg 6750
gatgtgacga gcgaagactc ggtggattct ggcttggcca aactccagga 6800
tttgaagttg ccccctatcg gcggcattgc ctttggccct ttggtgctgc 6850
aggatgtaat gctgaagaac atggacctgc aaatgatgga gatggtgctg 6900
aaacccaagg tcgagggagc ccgcatcctg cacgagaagt tctccgaccc 6950
tgccagcagc aacccactcg acttcttcgt catgttctcc tcgattgtag 7000
cggtaatggg taacccgggc caggccaact acagcgcggc aaactgctac 7050
ctgcaggctt tggcgcagcg gcgatgcgcc tctggattgg cggcttcgac 7100
tatcgacatc ggtgcagtct atggtgtcgg gttcgtgacc cgggcggaac 7150
tggaggagga tttcaatgct attcggttca tgtttgactc ggtcgaagaa 7200
catgagctgc actctctgtt tgccgaggcg gtggtgtccg gtcgacgggc 7250
catgcaccag cagcagcagt tcaagacggt gctcgacatg gccgatatcg 7300
aattgacgac cggtataccc ccgctggatc cgactctcaa ggatcgcatt 7350
acgttcttcg acgacgctcg ggtcggtaac ttcaagattc ccgaacggcg 7400
cggcaaggcg ggcgataacg cagcaggatc caagggctct gtcaaggaac 7450
agctcttgca agctacaagc ttggaccagg tccgtcaaat agtcattgat 7500
ggtctatccg aaaagcttcg ggtgaccctt cagattcccg atggggagag 7550
cgtgcacccc actatcccgc tcatcgacca gggagtagac tccctgggcg 7600
cggttaccgt gggtacctgg ttctcgaagc agctgtacct agacctgccg 7650
cttctcagag tgcttggagg cgcctccgtg gccgatctgg cggacgacgc 7700
tgctgcccgg ctgccgccca gctccattcc actcgtggca gcaagcgaag 7750
ggggcgcgga gacctcggac aatgacactt cagggcctga ggggactgat 7800
ctcagcgcct cgaccacaat caccgagccc tcatctgcag acgaagagga 7850
cgaaaagcag gaggacgaca acgacaactc cgtcctcgcc cttcatccac 7900
tctccctcgg ccaggagtac gcttggagac tgcaaaaggc cgccgatgat 7950
tcgaccatct tcaacaacac gatcggcatg ttcatgacgg gctccatcga 8000
cgccaaacgg ctgtccaagg ctctccgagc ggtcttgcgc cggcacgaaa 8050
tcttccgcac cggctttgcg gctgtcggta acaatgcaga tgccacgagt 8100
ctagcgcaaa ttgtctttgg tcgaaccaag aacaaggtcc aagtcatcca 8150
ggtggctgac cgggccggcg cggaagaagg ctaccggcag ctggtgcaga 8200
cacagtacga catcaccgct ggagacactc tgagactggt cgacttcttc 8250
tggggcaagg acgagcatct gttcgttgtg gcctaccatc gatttgtcgg 8300
cgatggttcc accacggaga atatctttgt cgaagcgagc cagttatacg 8350
gcggcgtgac cctcgacaag cacgtccctc aatttgcaga cctcgcgacg 8400
cggcagcgag aagcgctcga gtccggccag atggatgcgg acctcgcgta 8450
ctgggaatcg atgcaccacc agcccacggg cgtggtgtcc ccggtcctcc 8500
cgcggatgct tctgggcgaa gatggcctta atagcccgaa ccacgcccgc 8550
cagcccaact cgtggaagca acacgaagcg atcgcgcgtc tcgaccccat 8600
ggtcgctttc cgcatccgcg agcgcagtcg caagcacaaa gccacgccca 8650
tgcaattcta cctggctgcg taccacgtgc tcctggcacg attgacgggc 8700
agcagcgact tcagcatagg cctggccgac accaatcgca cgaacgtgga 8750
tgaactggcg ggcatgggct ttttcgccaa cctgctcccg ctgcgcttcc 8800
gcaacttcgt cccgcacatc acctttggcg agcacctggt cgccaccaag 8850
gacaaggtgc gcgaggccat gcagcacgcc cgcgtgccct acggggtgct 8900
gctcgagcgc ctcggattcg aggtcccggg ggccaccgcc gaaacagcgg 8950
aaccggcccc cttgttccaa gcggtcttcg attacaagca gggccaggcg 9000
gagagtggtt cgattggcag cgccaagatg accgaggtca tcgcgactcg 9050
cgaacgcacc ccctacgatg tcgtgctgga gatgtcggat gatcccacca 9100
aggatccgct gctcaccgtc aagttgcaga gctcggtgta cgaggtgcat 9150
catcccaggg cgttcttgga gagttatatc tccatattgt cgatgttttc 9200
gatgaatccc gcgttgaagt tggcttga                         9228
<210>20
<211>7644
<212>DNA
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkB cDNA
<400>20
atgaaagcga cggcagcctc gggcacacct actcccatag ctgtagtggg 50
catgggatgc agatttgccg ggggagcaac agatccacag gcactgtgga 100
aattgctgga gcaaggaggg agcacttggt ccaagactcc atcctcgaga 150
ttcaacgtca gcggagtcta ccaccctaac ggccaacgag taggatcgat 200
gcacgttcgg ggtggtcatt ttctagacca agacccggct cttttcgatg 250
cctcattttt caatatgacc agtgaagttg ccagttgtat ggacccccaa 300
cagagactca tactcgaagt cgtctatgaa gcgctagagg ccgcgggaat 350
tccccttgaa agtgtggccg gctcgaatac cgcggtcttt agcggagcaa 400
tgtatcacga ctaccaggat tcgctccatc gcaacccgga aactctgccg 450
cgatacttca tcacgggtaa tgctggcacg atgatgtcga gtcgcgtctc 500
ccacttctat gacctccgcg gtcccagcgt cacagttgac actgcatgtt 550
ccaccacctt gactgccttg cacctcgcaa tccaaagcat acgagcggga 600
gaggctgaca tggccattgt ggccgggtcg aatctgctct tgaactcgga 650
tgtttttgtc accatgtcca atttaggctt tctctccccg gatgggattt 700
cctactcatt tgatccgaga gctaatgggt atggacgtgg agaaggggta 750
gccgccatca tcttgaaggc tctcccccgc gcgctgcgag acggggaccc 800
aattcgcctt gttgtccgcg agacggcgct caaccaagac ggtcggaccc 850
ccgccatcac cgggccgagc cccgaagcgc aggcgtgcct gatccgggaa 900
tgctatcaga aggccggtct ggacccgagg cagacatcgt acgtggaagc 950
acatggaaca ggaactccga caggtgatcc gctggagctg gcggccatct 1000
cagctgcatt ccaaggccag cctctgcaga tcggctccgt aaaagccaac 1050
ctcgggcaca ccgaagctgc cagcgggctg gcaagcgtaa tgaaggtggc 1100
tctggcactg gaaaaaggga ttgtgccacc tagtgcaaga ttcctgcagc 1150
cgagcaagaa gttgctggaa gagagaaaat tccagattcc cctatctagc 1200
caattgtggc ttccgattga cggaatttgt cgcgcatcga tcaacaactt 1250
cggcttcgga ggcgcgaatg ctcatgcaat cgtggagcgg tatgaccccg 1300
ctgcgagaat atcgacgagc aagccaaacg gtcatatccg gcctcacgac 1350
agccatgtgg aagcagatcg agggaaaatc tatgttttga gtgccaagga 1400
cgagcacagt tgccaggaaa tgatttcaag gttgcgcgac tacctcaacc 1450
gcgctaatcc gactgatgaa cggcaattcc tcgctaacat ggcgtacact 1500
ttagcttctc gtcgctcgaa tctccgatgg aaggcagcct gcagggcaca 1550
tagcctggcg agccttctct ctgttctcgt aagcgatggg acgcgacctc 1600
ggagatcggc cgagaaagcg aggctgggat gggtcttcac tggccaagga 1650
gcacaatggt ttgcaatggg ccgcgagtta atcgaggcgt atcccgtttt 1700
caaggaggca ctcatcgagt gcgatggcta tatcaagggc atgggagcga 1750
actggtccat tatagatgaa cttcgtcgcg gtgaagcaga aagtcgcgtg 1800
aacgaggcag aatttagcct accgttgtca acggctatcc aggttgcact 1850
cgttcgtcta ctctggtcgt gggggatccg accagcggca attaccagcc 1900
actctagcgg agaggtagct gcagcttacg ctgtcggggc attttcagcc 1950
cgatcagcca ttggaatcag ctatatacgt ggtgccttga tagcaaaaac 2000
ccagccggca ccgacaacga aggggggcat gctagctgtg ggattgagtc 2050
gcagtgaggt tggtgaatac ataacacgag tacaacaaca aggcgaggaa 2100
tacttggttg taggatgcat aaacagcccc tccaacgtga cggtatcagg 2150
agatttgtct gcggttgtca gattggagga gttgttgcat gctgaccaaa 2200
tatttgcgag acgactcaag gtcacccagg cgtttcactc ccaccacatg 2250
caacctttgt caggtgaatt tcgggaggct ctggtagagg tcttcaatgc 2300
agacatcact gacaccacta atgcctgcca ggatgtggtt tacgcatccc 2350
ccaaaaccgg gaaacgccta gacgattgta accacctgcg cgatcccatg 2400
cactgggtgg aaagtatgct tttcccggtc gaattcgaat cttcattccg 2450
tgaaatgtgc ttcgacagga aagatcaagc acaagaggtt gataagatca 2500
tcgagattgg gccacatggg gtcctgagcg gcgcaatcaa gcaaatccta 2550
cagctgccgg agctcgctgc atttgatata tcctacctat cctgtctgtc 2600
tcgagggaaa agcgcggtgg acaccattca gcttctcgcc atggaccttc 2650
tccaaggggg ttatcccgta gacttaaacg cagtcaactt cccatacggg 2700
tgcgaagcag ccgaagtcca ggtgctgtcc gatttgccga cctatccctg 2750
gaatcacaag acgagatact ggaaggagcc acgcatcagt cgagctgcac 2800
ggcaacgaaa gatccccgtg catgatctga tcggagttca agagcctttg 2850
tgccctccgc ttttgcactt gtggcaaaat gtgcttcgga tctcggatgt 2900
gccgtggata cgcgatcacg tcgtgggctc acgaatcctt ttccccggtg 2950
ctgggttcat cagcatggtt attgatgggc tctctcagat ctgtaatcac 3000
gatcccgaaa cttgcggttt aagctacatc ttacgcgacg tggacctggc 3050
gcaggcgctg atcctgccca cggacggaga cgaaggggtg gatttgcgcc 3100
taacaattcg cgccgctgat cagaagagtc tcggaatgcg ggactggcag 3150
agattctccg tctattccat cgccggtgat aaggacgact ggacggagca 3200
ttgtacaggg ctgattcgcg cgcaggtcga tcatcctgtc tccagctcgt 3250
cgatccaaca aaagaccaat ccaccgcaat ggagccggaa gatggcacca 3300
caggacctgt gggcttcgct gcatgcgacg ggaatctgtc acgggccctt 3350
attccagaat attgagcgca ttgaaagcga tggccaggcc tcgtggtgca 3400
ctctgaccgt tgccgacaca gtggcgacta tgccgcacgc ctacgagagc 3450
cagcacattg tgcatccaac cacattagac tcggctatcc aggcggccta 3500
tacagtgctt ccatttatgg gaacactgat gaagacagcg atggtcccca 3550
gtcgaatcgg cggcatgaag atacccgcca gcttcgcgag cttggaaccg 3600
ggtgatatgc tgtgcgcaca agcaaaaata aagaaccaag gcctctctgc 3650
ctttacaacc gatgtagctg tgttcaacga gtcagatatg gatgaagagg 3700
caggtatcga gctcgaaggg cttaccttcc agtcgcttgg tgctgttatt 3750
agcgactcta ggcgagattt gaccgagaac gagagcacct acagttcctg 3800
gcattgggct cccgacatca ctctgaccaa ttccacatgg cttgagagga 3850
tactaagcac tgggacccag tctcaggaga tcggggtgat gttggagctt 3900
cgacggtgta ctgtccactt tatccaggaa gcaatagaaa acctaacaac 3950
ggaagatgtt gagaggctga gtggtcatct cgtcaaattt tattgctgga 4000
tgcaggctca actggcctgc gctaccaatg gcgagctggg gcaagacagc 4050
gccgactggt tgcgagacag tgagcaggag agacaaagct tgcggtccag 4100
agtagtcgct gccaccaaca atggcgagat gatctgtcgt ctgggcccca 4150
agctatccgc tatcttgcgt ggcgagctcg accctcttga gctgatgatg 4200
gacggccaac tgttgtctcg atactacatc agggcaatca aatggagccg 4250
gtccaatacg caggcaagcg aactcgtgcg cctctgctgc cacaagaatc 4300
cacgtgcccg catccttgag attggcggtg gaactggggg gtgcacacag 4350
ctcatcgtaa acgctttggg gcccacgaag ccggtaggcc gctacgactt 4400
caccgacgtg tctgctggct tcttcgaagc ggctcgaaag cggttttcgg 4450
ggtggcagga tgtgatggac ttccgcaagt tggatatcga gggcgatccc 4500
gaagtgcagg ggtttgactg cggatcctac gacgtggtgt tggcctgtca 4550
agttcttcat gctacaagca acatgcagcg gacattaaac aatgtgcgca 4600
agctgttgaa gccgggaggt aaactcattc ttgttgaaac cacgagggac 4650
cagctcgatt tgtttttcac attcgggctc ctgcccggct ggtggctcag 4700
tgaagagccg gaacggcagc ttaccccatc actgtctcct gagttatggc 4750
gcagtgtact gagcgctact ggtttcagtg gcgtggacct agaggtccgc 4800
gactgcgaca gtgatgagtt ttacatgatc agcaccatga tgtccacagc 4850
tacacctggg actcctgcaa ctaccttgaa tggaccagcc gaggtgctcc 4900
tggtccatgc cggctcgcct ccgcccatgg attggctgca gaatctgcag 4950
gtagccctcg gcgggaaaaa cagttctata acttcactca aggcgctcca 5000
gggcgtttct gatctcaagg ggaagatgtg tgtattcctg ggggagatgg 5050
accgcaccct acttgaaagc gtggtcagtg atgacttcac atccttaacc 5100
tctatgctac agtatagcca aggtactctt tgggttactc gaggagcggc 5150
gatggcgtcg gatgacccaa gaaaggccct gcacctagga ttgctacgca 5200
cgctccgcaa tgagaatcac ggccgtcgat ttgtttcatt ggacctcgac 5250
cccttgcgtg atccatggac ggcccagtcc tgtgacgcca ttgtcaatgt 5300
actgaatgca gtcggtgcgt ctcatgagaa ggagtttgag tatgcagaac 5350
gcgatggcac tattcatgtg ccacgaacgt tcagcgactc aagctccagc 5400
gagaaggaag acttggttgt cttggagcca ttccagaatg aaacgcgctt 5450
ggtgcgacta gacgtacaga ctccagggct tctggattct ttgcacttta 5500
agctgtgttc tgcggacgaa gcttggagta gtgagctgcc agaggactgg 5550
gtggagattg agccgagggc gttcggtcta aactttcgcg atatcatggt 5600
tgccatgggc cagttggagt caaatcgagt catgggcttt gagtgcgctg 5650
gtgtggtaac taggttgagc aaagcagcaa caacaggcgc aggagggctt 5700
gcaatcggag accgtgtatg tgcactcatg aaagggcatt gggcatcgag 5750
ggtgcggaca gcccgcacca atgtcatctg catcccaggg accctgagtt 5800
tcgaacaagc ggcttccatc ccactggcct tcacgacagc ttacacctcc 5850
ctctacactg ttgctcgcct tcaacggggt gaaaaagtgc taatccatgg 5900
cggcgctgga ggagtcggac aggcggccat catccttgct caactggtcg 5950
gagcggaggt ctttaccact gctggaactc actctaagcg caacttcttg 6000
atcgataagt tcaagctggc ccccgaccat gtcttctcga gcagagactc 6050
cggttttatc gagggtatca gggcttgtac caatggcaag ggggttgatg 6100
tggtgctcaa ttctcttgct gggcctttgc ttcaatatag cttcgactgt 6150
ctggtcaatt ttggtcgctt cgtggaaata ggcaaaaagg atctcgagca 6200
aaatagccga ctcaacatgg cgacttttgc gcggaacgtc tccttttcct 6250
cgattgatat cctgtactgg gaagaagcca agtccgccga aatcttccga 6300
gcattgacgg agattatgcg gctcttggaa caaaagacaa tcgatttgat 6350
tgggccgata tcagagtatc ccatgtcggc tattgagaag gcattccgta 6400
cgatgcagag cggccagcac gtcggtaagc ttgtggtggc tacggctgag 6450
acggacatga tccccgttcg ccggggaacc atgccagtcg cgttgaagct 6500
tgacgcgtct tacctgattg tcggtggact ggggggtatt ggcagacgca 6550
tttgcgagtg gatggtggac catggggcac gacatctgct catcctgtcc 6600
cgaagcggtc gtacggatcc ctttgtgact ggcctccaga agcggggctg 6650
tgtcgtacgt atacattcat gtgatgtggc agatgagagt caacttcatg 6700
cagttcttca acagtgccat gaggataaca tgcccccgat ccggggtatc 6750
attcaagcgg ccatggtcct caaggacgct cttgtctcgc aaatgacggc 6800
ggacgacttc catgttgctc ttcgtccaaa ggtccagggc agttggaatc 6850
ttcacaagat cgcatctgag gtggactttt tcatcatgct ctcatctctg 6900
gtgggtgtca tgggtggcgc gggtcaagcc aactatgcgg ctgcaggcgc 6950
gttccaggac gcgctcgcac agcaccgggt cgctcaaggg aagcccgctg 7000
tcaccatcga cctgggcatg gtcaagtcaa tcggctatgt ggcagagact 7050
gaccccgcag ttgcggagcg attggcccgg attggctatc aaccgatgca 7100
cgaggaagag gtcctcgccg tgctcgagcg agccatgtcg ccctcctctt 7150
cttcggcacc accgtcctct aaccctacta tacccgcctc gcccgctgtc 7200
atcgttaccg gcatcaacac aggccctggc cctcacttca caaacgccga 7250
ctggatgcag gaggcacgtt tcgcgggaat caagtatcgt gatcccctga 7300
aggatgaccg tggtggggcc ttgtcctctt cacagcccgc tgacgaggat 7350
agtgtacgcg ctcggctaag tcgggcatct accgaggagg aggccactgc 7400
cctagtggtg caggtgatgg gtcacagact ggtgacgatg tttggtctca 7450
ctgaaagtga gatgtcggcc acacagacat tgtcgagcgt tggagtcgac 7500
tcgctcgtcg ccatcgagct gcgtaactgg attaccgccc aacttaatgt 7550
ggatatctcg gtctttgagt tgatggaggg tcggaccatt gctgaggtgg 7600
cggaggtggt agtgaagaag tatggcgtgg gaagcaaagt ctag       7644
<210>21
<211>1575
<212>DNA
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkC cDNA
<400>21
atgacagttc cgacagatac ggtctcgcgt cgcctccagt ctctcgcttg 50
gagcgacata aagcagcatg ccccatggct gccgtcttct cgcactcttg 100
tctcgggatt tctctgtttg atccttcttc agattctgta ctctcgtgga 150
cgcaaatccg acctgcgggt gtataacccg aagaaatggt gggaactcac 200
caccatgagg gccaagcggg agttcgatgc gaatgcgccc gcatggattg 250
aggcctggtt ctccaagaac gaccaaccgc tccgtttcat tgtcgactct 300
ggctattgta ccattttgcc ctcatcgatg gccgacgaat tccggaagat 350
gaaggagctt tgcatgtaca agtttttggg cacggacttc cactctcatc 400
ttcccggatt cgacggcttc aaagaagtca ccagagacgc acatctcatc 450
accaaggtgg tcatgaatca gttccaaacc caagctgcga aatacaccaa 500
gcctcttgcc gatgaggcca gcgcgacaat tgcagatatc tttggggaca 550
acaaggaatg gcacacggct cctgtctata acgagtgttt agatttggtg 600
acacgcactg tcactttcat catggtcggg gataaactgg cgcacaacga 650
ggaatggttg gatatcgcca agcaccacgc ggtgactatg gcgattcagg 700
ctcgccaact ccgcctctgg cccgtcattc tgcgccctat agtccactgg 750
ctcgagcccc agggagccaa actgcgggcg caagtccgac gagcccggca 800
gcttctcgag cccatcatcc aggagcgacg cgccgagaag gccaaatgcc 850
tcgcccaagg gatcgagccg ccgcgctacg tcgattccat tcagtggttt 900
gaagacaccg ccaagggcca atggtacgat gcggcggggg cgcagttggc 950
catggacttt gccggcatct acggcacctc tgacctgatg atcggcgggc 1000
tggtcgacat cgtccgccac ccgcatctca tcgagcccct tcgcaacgag 1050
atccggaccg tcatcggcga ggaaggctgg acgccggcct cgttgtacaa 1100
actcaagctt ctggacagct gtctcaagga atcgcagcgc gtcaagcccg 1150
tagaatgcgc cacgatgcgc agctacgcgc tccagaacgt gaccttctcc 1200
aatggaacct ttgtcccgaa aggcgagctg gtagctgtgg cggccgaccg 1250
catgagcaac cctgaagtct ggcctgagcc gaagaagtac gacccgtacc 1300
gatacatgcg cctgcgagag gatcccgaca aggcgttcag tgcccagctg 1350
gagaacacca acggtaacca tatcggcttt gggtggcatc ctcgggcgtg 1400
tcccggacgg ttcttcgcct ccaaggagat caagatcatg ttggcgtttc 1450
tgctgattcg gtacgactgg aagctggtgc caaacgagcc gttgcagtat 1500
taccgtcatt ccttcagcgt gcgcatccat cctgccacca agcttatgat 1550
gcgccgtcgg gacgaagatc tctga                            1575
<210>22
<211>792
<212>DNA
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkD cDNA
<400>22
atgcgtatcc aacgcacccc cgcgcccccc aaagcgcccc gggccctcct 50
ctgcgtgcac ggcgccggct gctcccccgc catcttccgc gtgcagctct 100
ccaaactccg cgccgcttta cgggaagact ttgaattcgt ctacgcaacg 150
gcacccttcc cttccgcccc tggacccggg atcctgccca cgttcgaagg 200
cctcgggccc tattacacct ggttcgaggg ttctccgtct ggtgctgctg 250
ccaaagggga taacagcaac agcaacgaca gcaactcttc tcccaccgta 300
cacgaccgcc tcgccgccgt ccacgaaccc gtccgccgcg ccatcgccga 350
atggcagacc cagaacccca gcatccccat cgtgggaacc gtcagtttct 400
ccgagggcgc tcttgtgacc gccctgctgc tctggcagca gcagatgggt 450
aggataccct ggctcccggt catgcaggtt gcgatgttca tctgctgctg 500
gtatcagcat gaggcgactc agtatatgcg ggaggaggta ggctgcggcg 550
gtgatggtgg cattgacggt gagaagttgg tgatccgggg ggtgctgtcg 600
ctgcacctgc agggtcgtga tgactttgcc ctggcgggtt cgaagatggt 650
ggtggcgcag cattttgtgc ccggggaggc gcaggtgttg gagtttgcgg 700
gccggcatca tttcccgaat cggccgcgcg atgtgttgga gacggttaag 750
cggtttaggc agctgtgtgt gagggctaga gtcattgggt ga         792
<210>23
<211>1083
<212>DNA
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkE cDNA
<400>23
atgaccatca ccttcaccct accacctcac cagactgcgc tgacagtgga 50
cgagcatgac aaagtcacca tctgggacgt cgccccctgt ccaagcctcc 100
cccccgatca ggtctgcgtg cgcgtcgagg ccgtagccct caaccccagc 150
gacacgaaga tgcgcggcca attcgccacc ccctacgcct tcctgggcac 200
cgactacgcc ggcaccgtcg tcgccgtggg atcgcaggtc acgcacatcc 250
aagtcgggga ccgggtctac ggcgcccaga acgagatgtg tccgcgcacc 300
ccccaccagg gcgccttctc gcagtacacg gtcacccgcg gccgcatctg 350
ggccacggtc cctgagggct ggtccttcga gcaggccgcg tcgttgcccg 400
cgggcatcag cacggccggc ctggcgatga agctgctcgg gctgccttta 450
ccggatccca atgctacgac ggcaccggcc cttccgaagc ccgtgtatgt 500
tttggtgtat gggggtagca ccgctactgc gacgattgtg atgcagatgc 550
tacgcttgtc cggatacatc cccatagcca catgctcccc gcacaatttc 600
gacctcgcca aaaagcacgg cgcagaagat gtctttgact atcgtgatgc 650
cggtctcgcg cagacgattc gcacatacac caaaaacaac ctccgctacg 700
ccctcgattg catcaccaac gtcgagtcca ccaccctctg cttcgccgcc 750
atcggccgcg ccggcggccg ctatgtctcc ctgaacccgt tcccggaaca 800
cgcggcgacc cggaaaatgg tcaccgccga ctggaccctg gggccgacca 850
ttttcgggga agggtcgact tggccggcgc cgtatgggcg gccggggagc 900
gagaaggacc gcgcattcgg cgaggagttg tggcgcgttg cggcaaggct 950
cgtggaggat gggaagatcg tgcaccatcc tctgcgggtg attcctggcg 1000
ggttcgaggc cattaagcag gggatggagt tggttaggac tgggcagttg 1050
tcgggagaga aggttgtggt gaagttgggg taa                   1083
<210>24
<211>1242
<212>DNA
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkF cDNA
<400>24
atgcgtcaat ttctctcctc tgatcgcatc aactctgaaa tcccccagga 50
gaaaagcgaa atggtaggat tcagtgatat cgacaatagc agccgccaga 100
tcaaagaaat ggaagccgct ttccgatcgg ccgtgaaaac agggcagatc 150
ccgggggcag tcatcatggc tcgagatcat agtggccgac tgaactatac 200
gcgctgcttc ggggcgcgga cggtggtgcg cgatgagtgt aaccgactcc 250
ctccgatgca ggtcgacacc ccctgccggc tggcgagtgc caccaagctg 300
cttacgacga tcatggcgct gcaatgcgtg gagcgggggc tcgtgaggtt 350
ggatgagacg gtggatcgac tgctgccgga tttgagtgcg atgaaggtgc 400
tggaggggtt tgatgccgcg ggggagccga agatgagaga gcggaagggg 450
aagattactt tgaaacatct cctaacacac acctccggcc tgtcctacgt 500
cttcctccac cccctcctcc gagaatacat ggccaaaggc cacctccaga 550
cggctgagaa attcgggatc cagagtcggc tggcgccccc ggccgtcaac 600
gacccgggcg ccgagtggat ctacggcgcc aacctcgact ggacggggaa 650
gctggtcgag cgcgccacgg gcctggacct ggagcagtac ctccaagaga 700
acatctgcgc gccgctgaac atcaccgaca tgaccttcaa gctgcagcag 750
cgacccgatc tgctggcgcg gcgcgccgac cagacgcacc gcaacaaggc 800
ggacggccgc ctgcgctacg acgactcggt gtacttccgg tccgacggcg 850
acgagtgctt tgggggccag ggggtcttct cgggccccga atcctacatg 900
aaggtcgtgc actccctgct gcagcgcgac gggcgcctgc tgcggcccga 950
gaccgtggac ttgatgttcc agcccgcgct cgatgcgcaa acggagaagc 1000
agatgaacca gcatatggac gcgagcccgc acatcaacta cggtgggccg 1050
atgcccatgg tgttgcggcg gagttttggg cttggtggga tgattgcctt 1100
ggaggatctg gatgggcaga agtggcgccg aaagggctgt ttaacctttg 1150
gcggcgggcc gaatattgta tgggtaatgt tactctcagc cctacgcttc 1200
gttttcttct tcttcttctt cttcttcttc tgctctagct ga         1242
<210>25
<211>1368
<212>DNA
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkH cDNA
<400>25
atggccctat cgccagtcca ggatccccct tcacacaccg acaaaactat 50
gccccgccgt gcatttcgcc gatcttgtga ccgatgccat gcacagaaga 100
ttaagtgtat aggcagcgag ggagctgttg cccgtgcttc atgtcaacgt 150
tgccagcaag ctggactgcg gtgcgtttac agcgagcgat gccctaagcg 200
caagctaccc aaacccaacc cagcggaatc ttcccctgca agcagcacgg 250
ccggcctgca cacctcttct tcagattctt cgccccctgt tccctccgat 300
ggcttgccgc tagacctgcc agggccggat tcctcaggcg tctccctcca 350
attcctcgac ccgtctgccg actgcgactg gccttggtcc tcgatcggtg 400
tggacgaaac cgttgtcaac aattgcttgg acttatctca tggccatggc 450
catggagacc tcagttgcca gctcgagctg cctatgccag atcttccctc 500
ccccttcgaa ttctcggccg aaaaatctcc ctcaccgtcg gtgtctggca 550
gcattgccgg agctgtcagt gcacaacgag aactcttcga tggcttgtcg 600
acggtgtccc aggaattgga agccatcctt ctggctgtgg cggtggagtg 650
gccaaaacag gaaatctgga cttaccccat tgggacgttc ttcaacgcat 700
cacgaagact tcttgtatat ctccaacaac aatccaacac ccgcagcgac 750
caaggcatgc tgaatgaatg tctacgaacc aagaacctct tcatggcagt 800
gcattgttat atgctgatcg tgaagatttt cacctctctc tcggaattgc 850
tgctatccca gatccggcat tcccaggctg gccagctgac acccttggaa 900
gggcatcagt tcgagccacc accgagcagc agcagggacc gtagcagcgt 950
cgataccatg cccatcttca acccgaatct ccacatcggc gggttgtttt 1000
cttatctcaa ccccttcatg cacgccctat cctcggcttg caccaccttg 1050
cgcgtcggcg tacagttgct gcgagagaat gagagtgctc ttgggatccc 1100
cccggcgcag ggggtggcgg cctctgtgag tatgggcaag gaggagtggg 1150
cagacggcga ggatgtagcc agtgcagtga cgacggcgga cgaggatctc 1200
cgccagccgg cctcgcggat cttatccatg gtctggagcg atgaggtggg 1250
cgaccagaag gccaagtctg ctgatgctgc tggtccgcga agccgaaccc 1300
tggcggtgct acggcggtgt aatcgagaga tcttttccct ggcccgccaa 1350
cacaacctgg cctcctaa                                    1368
<210>26
<211>1632
<212>DNA
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkI cDNA
<400>26
atggcttccc accagtctga gaaagagaag ccacagagct gcaccactga 50
agtccaggtc agccatgtca ccggcctaaa gctaggactg gtagtaacct 100
cggtgaccct ggtggtgttt ttgatgttgt tggacatgtc tatcattgtg 150
acagctatcc cccatatcac tgctcagttt cattcccttg gggatgttgg 200
atggtatgga agtgcgtatc ttttgtcgag ctgtgctcta cagcccttgg 250
cagggaagct ctacactctc ttgacattga agtatacctt cctagcattc 300
ctcggggtgt ttgaagtcgg atcagctctc tgtggcgccg cgcgttgttc 350
aactatgttg atcgtggggc gcgcagtggc tggcatggga ggatcggggc 400
tcaccaatgg agccatcacc atcctcgcct ctgcagctcc aaaacaacag 450
caaccactgt taatcgggat catgatgggt ctgagccaaa ttgccattgt 500
ctgtggacca ttgctgggag gtgcttttac ccaacacgca agttggcggt 550
ggtgcttcta tatcaatctt cctgtcggag cgctggccgc catcctcctt 600
ctcgccatcc acattcctaa gagtgtgcca acatcggatt gcacaatgcc 650
tgctcccaga gctgttgggg tccgggtcat cctgagtcag ctcgatctcc 700
tggggtttgt gctcttcgcc gcctttgccg tgatgatctc acttgcgtta 750
gaatggggcg ggtccgatta tatgtgggat agctccgtaa tcatcggctt 800
gttctgtggt gccggcatct cgctggtggt gtttgggttc tgggaacgct 850
acgtaggcaa ctcgatggcg atgattcctt tctcggtggc cagtcgtcga 900
caagtctggt gctcgtgtct tttcttgggc tttttctccg gggccttgct 950
caccttctct tactaccttc ctatctactt ccaggccgtg aaggacgtct 1000
ctcccaccat gagtggggtg tatatgcttc caggcatagg gggacaaatt 1050
gtgatggcga tcgtctccgg cgcaatcatc ggcaaaacgg ggtattacat 1100
tccctgggcg cttgccagtg ggatcatcgt atctatctcc gcaggcctgg 1150
tatcgacctt ccagccgcat acctcaatcg cagcgtgggt gatgtatcaa 1200
ttcatggggg gctttggtcg aggatgtgga atgcagaccc ccatcattgc 1250
cattcaacat gccctgccac cacaaatgag tgcgctcggt atctcgctgg 1300
ccatgttcgg ccagaccttc ggcggctccc tcttcctcac cttggccaag 1350
ctcgtcttca gcgccggcct tgacgccggc ttacgcgagt atgcgcccgc 1400
cgtcagcgca gaggcggtga cggccgcggg cgccacgggc ttccgcgatg 1450
tcgtccccgc aaatctcctt tctcaggttc tcctggcata ctgtaaaggg 1500
atagaccata cattctacct tgcggtcggg gcatcgggag ccactttttt 1550
gtttgcgtgg ggaatgggtc aggtcggttt gatttggtgg ggggaggaaa 1600
ggacggggtt cggccgcgat gaacgagtct ag                    1632
<210>27
<211>2046
<212>DNA
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkG cDNA
<400>27
atggcatcgg cagccgtgac gccaaagctt ggctgggtgc agcaccaggt 50
aaccaacgga ttacatgccg tggtcggcca agtgtgtcga catcccatcc 100
acacgttgct ggtgactgct ctgatcgccg caacgactta tctccatgtt 150
ttggaaggca cctttcgcgc agccaaccta ggtcccggtt ccaagactga 200
cgcagccccc ttcgacgtcc agtcgttcct ctggggcagc cgaagtcttc 250
gcctgggcga gacaagctcg tggagatggc aggtgggcga cttgtctgag 300
gcgactggcg atggccaagt caatcaccac tgggctcttg tcactctcag 350
cttccccggc gcctcggtcg atgatcgcag ccctgccttt ctgtggaacg 400
cactgcccga ctctgtgggc gcagagccga tcacgccaac ctccaacttc 450
ttcacctcga tctccaatga attctcgctg gcctttcgag tcccatacac 500
ccaattgagc gattttctgg aggcggtgga gtttgttgcc tcggataagg 550
aggatcgtag ctgggccatc aggtttcctc acggagaggg caagcccatt 600
tcgctgggcc gctggctcgg gaactcgtgg ctgtcgttcc ttcaccgggc 650
taaacacgcc gagacggtag acatggctat catcggttta ggctacctcg 700
ctctgaatat gaccctggtc tctctcttcc gagcgatgcg tcagttgggc 750
tcgcgtttct ggctggcagc ctccgtgctg ctctctgggg cgtttgcctt 800
tgtattcggg ctcggtgtca cgactgcctg cggcgtgcca gtcgacatgc 850
ttcttctgtc ggaagggatt cccttcctgg ttttgaccgt ggggtttgag 900
aagccgatcc gatttacccg tgctgttctc tacgcatcga atcagctccg 950
gcgcgggttg cagcagcggg acgttgccga caagcatgac agccggcagc 1000
gccatatgat ccccaacgcc atgctattcg ccatcaacag agaaggatgg 1050
tccattgtcc agtcgtacct tcttgagatc ggggctctcg cattgggtgc 1100
ggtcttccgg ccacgggaac gattcggcca gttctgcttc ctggccgcat 1150
ggatggtgct cttcgacgcc atccttcttt tcaccttcta cgccaccatt 1200
ctctgcgtca aactggaggt gacccggatg caaaaccccg gcaccctgga 1250
tctggcagac gaccaacatg ggccgcgcat cttcgggtac aaggtcaatc 1300
cgaccagcct ggcccggtgg aagctaatca tggtaggcgg gttcgtgctc 1350
ttcaacgtcc tccaactgtc atcgttcttt tatcgcatca tgggaggctt 1400
catgaccaat gccgctctga ccccgaccac cgtcagtccg ttcaaagtgg 1450
ctgccaacgg gctgaacgat atttatttgg ccgcccgtgc cggcggagtt 1500
gagacgtggg tcacggtgct accgccgatt cgatatgtca tggaagcatc 1550
tgggttggaa atgtcggccg gcagacgtcc tgtatttgat ggcgtgctgg 1600
ccggactgga gagccccctg ggtcggctct gtctcatggg cgctttggtt 1650
ttcagtcttt acctcaataa ccacctgatc ccggccgccc gctggcattt 1700
ttcccccggc gcaccgaaag aatccgctgc gcctgcaccc ccttcatcgc 1750
ccgcatcggt ccccagcgct gtaccggtcc ctgcgccctc ctctcgcagc 1800
ttcgaggaaa tcgaggccct attcaaagcg aaccaggcgg aatctctgac 1850
cgatgacgag ctggcggagc tctgtctccg tggtaagatt gccggataca 1900
gcttagagaa gaccttggaa agcattgcct ccgcaggttc ttcaagcaca 1950
gcaacaacta ggctggaggc tttcacgcgc gcggttcgca tccgccgggc 2000
cgccgtgtcg cggacgcctt cgactcggga cctcagcggc ggcatc     2046
<210>28
<211>1052
<212>PRT
<213>Monascus BCRC 38072
<220>
<221>
<222>
<223>mkG氨基酸序列
<400>28
MASAAVTPKL GWVQHQVTNG LHAVVGQVCR HPIHTLLVTA LIAATTYLHV  50
LEGTFRAANL GPGSKTDAAP FDVQSFLWGS RSLRLGETSS WRWQVGDLSE  100
ATGDGQVNHH WALVTLSFPG ASVDDRSPAF LWNALPDSVG AEPITPTSNF  150
FTSISNEFSL AFRVPYTQLS DFLEAVEFVA SDKEDRSWAI RFPHGEGKPI  200
SLGRWLGNSW LSFLHRAKHA ETVDMAIIGL GYLALNMTLV SLFRAMRQLG  250
SRFWLAASVL LSGAFAFVFG LGVTTACGVP VDMLLLSEGI PFLVLTVGFE  300
KPIRFTRAVL YASNQLRRGL QQRDVADKHD SRQRHMIPNA MLFAINREGW  350
SIVQSYLLEI GALALGAVFR PRERFGQFCF LAAWMVLFDA ILLFTFYATI  400
LCVKLEVTRM QNPGTLDLAD DQHGPRIFGY KVNPTSLARW KLIMVGGFVL  450
FNVLQLSSFF YRIMGGFMTN AALTPTTVSP FKVAANGLND IYLAARAGGV  500
ETWVTVLPPI RYVMEASGLE MSAGRRPVFD GVLAGLESPL GRLCLMGALV  550
FSLYLNNHLI PAARWHFSPG APKESAAPAP PSSPASVPSA VPVPAPSSRS  600
FEEIEALFKA NQAESLTDDE LAELCLRGKI AGYSLEKTLE SIASAGSSST  650
ATTRLEAFTR AVRIRRAAVS RTPSTRDLSG GIQESLLPYR NYNYELVHGA  700
CCENVIGYLP LPLGLAGPMV IDGQAYFIPM ATTEGVLVAS ASRGCKAINT  750
GGGAVTMLKG DGMTRGPCLG FPSAKRAAEA QRWVESPVGH QVLTDAFNAT  800
SRFARLQTLT VAQAGTYLYI RFRTTTGDAM GMNMISKGVE KALQAMTAHG  850
FPDMNTITLS GNFCADKKSA AINWIGGRGK SVIAEATIPA DTVRKVLKTD  900
IDALVELNTA KNLVGSAMAG SMGGFNAHAS NLVQAVFLAT GQDPAQNVES  950
SSCITTMKKI DGNLHIAVSM PSMEVGTIGG GTILEAQGAM LDLLGVRGAH  1000
PTDPGANARR LARIVAAAVL AGELSTCSAL AAGHLVNAHM RHNRSAASSE  1050
KK                                                      1052
<210>29
<211>19
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>Monascus monacolin K探针Mplov1正向引物
<400>29
tccactgccg tttatgttg                                    19
<210>30
<211>19
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>Monascus monacolin K探针Mplov2反向引物
<400>30
tcgtcatctt caccccatc                                    19
<210>31
<211>20
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>mkA基因的正向引物
<400>31
atagctccga gaatggtccc                                   20
<210>32
<211>20
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>mkA基因(p3)反向引物
<400>32
ccatcaagga tgctctgtcg                                   20
<210>33
<211>22
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>mkB基因 正向引物
<400>33
ctagactttg cttcccacgc ca                                22
<210>34
<211>20
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>mkB基因 反向引物
<400>34
cattgtcgag cgttggagtc                            20
<210>35
<211>20
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>mkC基因 正向引物
<400>35
ggcctgagcc gaagaagtac                            20
<210>36
<211>20
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>mkC基因 反向引物
<400>36
tcagagatct tcgtcccgac                        20
<210>37
<211>20
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>mkD基因 正向引物
<400>37
tgatgacttt gccctggcgg                        20
<210>38
<211>20
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>mkD基因 反向引物
<400>38
tcacccaatg actctagccc                           20
<210>39
<211>20
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>mkE基因 正向引物
<400>39
ttctctcccg acaactgccc                           20
<210>40
<211>20
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>mkE基因 反向引物
<400>40
aatggtcacc gccgactgga                          20
<210>41
<211>20
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>mkF基因的正向引物
<400>41
gccccgaatc ctacatgaag                          20
<210>42
<211>20
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>mkF基因 反向引物
<400>42
ggcccaccgt agttgatgtg                      20
<210>43
<211>20
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>mkG基因的正向引物
<400>43
cctcgctctg aatatgaccc                      20
<210>44
<211>20
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>mkG基因反向引物
<400>44
tcggatcggc ttctcaaacc                      20
<210>45
<211>20
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>mkH基因的正向引物
<400>45
acctcatcgc tccagaccat                         20
<210>46
<211>20
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>mkH基因 反向引物
<400>46
ctgcgagaga atgagagtgc                         20
<210>47
<211>20
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>mkI基因的正向引物
<400>47
ctagactcgt tcatcgcggc                      20
<210>48
<211>20
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>mkI基因反向引物
<400>48
ccatacattc taccttgcgg                      20
<210>49
<211>20
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>mkA基因(2)的正向引物
<400>49
tgaacagcac agcatagggg                      20
<210>50
<211>20
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>mkA基因(2)反向引物
<400>50
gcagccattg aagacggcat                      20
<210>51
<211>20
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>反向引物p4
<400>51
tcaagccaac ttcaacgcgg                                  20
<210>52
<211>30
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>正向引物p1
<400>52
ggaattcatg tacgtaggac gcattggtgc                       30
<210>53
<211>20
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>反向引物p2
<400>53
tcgcgaggac ggacaaagtt                                  20
<210>54
<211>29
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>sfp基因的正向引物BamHI位点
<400>54
cgggatccca tgaagattta cggaattta                        29
<210>55
<211>36
<212>DNA
<213>人工序列
<220>
<221>引物-结合
<222>
<223>sfp基因 反向引物NotI位点
<400>55
atagtttagc ggccgcttat aaaagctctt cgtacg                   36

Claims (67)

1、一种分离的DNA分子,其特征在于包括一序列识别号:1的核苷酸序列,或于严苛条件下可与序列识别号:1杂交的的核苷酸序列。
2、一种分离的DNA分子,包括择自以下一个或多个所列物所组成的族群的聚核苷酸:
a)mkA的聚核苷酸,其包括序列识别号:2的核苷酸序列;
b)mkB的聚核苷酸,其包括序列识别号:3的核苷酸序列;
c)mkC的聚核苷酸,其包括序列识别号:4的核苷酸序列;
d)mkD的聚核苷酸,其包括序列识别号:5的核苷酸序列;
e)mkE的聚核苷酸,其包括序列识别号:6的核苷酸序列;
f)mkF的聚核苷酸,其包括序列识别号:7的核苷酸序列;
g)mkG的聚核苷酸,其包括序列识别号:8的核苷酸序列;
h)mkH的聚核苷酸,其包括序列识别号:9的核苷酸序列;
i)mkI的聚核苷酸,其包括序列识别号:10的核苷酸序列;以及
j)于严苛条件下可与a),b),c),d),e),f),g),h),或i)杂交的核苷酸序列。
3、根据权利要求2所述的分离的DNA分子,其是a)。
4、根据权利要求2所述的分离的DNA分子,其是b)。
5、根据权利要求2所述的分离的DNA分子,其是c)。
6、根据权利要求2所述的分离的DNA分子,其是d)。
7、根据权利要求2所述的分离的DNA分子,其是e)。
8、根据权利要求2所述的分离的DNA分子,其是f)。
9、根据权利要求2所述的分离的DNA分子,其是g)。
10、根据权利要求2所述的分离的DNA分子,其是h)。
11、根据权利要求2所述的分离的DNA分子,其是i)。
12、根据权利要求3所述的分离的DNA分子,其中该聚核苷酸编码一多肽,该多肽具有择自以下一个或多个所列物所组成族群的活性:β-酮酰基合成酶,乙酰转移酶,脱水酶,甲基转移酶,酮还原酶,及酰基携带蛋白。
13、根据权利要求12所述的分离的DNA分子,其中该聚核苷酸编码一多肽,该多肽具有九缩酮合成酶的活性。
14、根据权利要求4所述的分离的DNA分子,其中该聚核苷酸编码一多肽,该多肽具有择自以下一个或多个所列物所组成族群的活性:β-酮酰基合成酶,乙酰转移酶,脱水酶,甲基转移酶,酮还原酶,酰基携带蛋白,以及酰脂基还原酶。
15、根据权利要求14所述的分离的DNA分子,其中该聚核苷酸编码一多肽,该多肽具有二缩酮合成酶的活性。
16、根据权利要求5所述的分离的DNA分子,其中该聚核苷酸编码一多肽,该多肽具有单加氧酶活性。
17、根据权利要求6所述的分离的DNA分子,其中该聚核苷酸编码一多肽,该多肽具有氧化还原酶活性。
18、根据权利要求7所述的分离的DNA分子,其中该聚核苷酸编码一多肽,该多肽具有去氢酶活性。
19、根据权利要求8所述的分离的DNA分子,其中该聚核苷酸编码一多肽,该多肽具有转酯酶活性。
20、根据权利要求9所述的分离的DNA分子,其中该聚核苷酸编码一多肽,该多肽具有HMG-CoA还原酶活性。
21、根据权利要求10所述的分离的DNA分子,其中该聚核苷酸编码一多肽,该多肽具有转录因子活性。
22、根据权利要求11所述的分离的DNA分子,其中该聚核苷酸编码一多肽,该多肽具有外排泵活性。
23、一种穿梭载体,其包括如权利要求2所述的分离的DNA分子。
24、一种分离的DNA分子,包括择自以下一个或多个所列物所组成的族群的聚核苷酸:
a)mkA的聚核苷酸,其包括序列识别号:19的核苷酸序列;
b)mkB的聚核苷酸,其包括序列识别号:20的核苷酸序列;
c)mkC的聚核苷酸,其包括序列识别号:21的核苷酸序列;
d)mkD的聚核苷酸,其包括序列识别号:22的核苷酸序列;
e)mkE的聚核苷酸,其包括序列识别号:23的核苷酸序列;
f)mkF的聚核苷酸,其包括序列识别号:24的核苷酸序列;
g)mkG的聚核苷酸,其包括序列识别号:27的核苷酸序列;
h)mkH的聚核苷酸,其包括序列识别号:25的核苷酸序列;
i)mkI的聚核苷酸,其包括序列识别号:26的核苷酸序列;以及
j)于严苛条件下可与a),b),c),d),e),f),g),h),或i)杂交的核苷酸序列。
25、根据权利要求24所述的分离的D NA分子,其是a),且编码一多肽,该多肽具有择自以下一个或多个所列物所组成族群的活性:β-酮酰基合成酶,乙酰转移酶,脱水酶,甲基转移酶,酮还原酶,及酰基携带蛋白。
26、根据权利要求25所述的分离的DNA分子,其中该多肽具有九缩酮合成酶的活性。
27、根据权利要求24所述的分离的DNA分子,其是b),且编码一多肽,该多肽具有择自以下一个或多个所列物所组成族群的活性:β-酮酰基合成酶,乙酰转移酶,脱水酶,甲基转移酶,酮还原酶,酰基携带蛋白,以及酰脂基还原酶。
28、根据权利要求27所述的分离的DNA分子,其中该多肽具有二缩酮合成酶的活性。
29、根据权利要求24所述的分离的DNA分子,其是c),且编码一多肽,该多肽具有单加氧酶活性。
30、根据权利要求24所述的分离的DNA分子,其是d),且编码一多肽,该多肽具有氧化还原酶活性。
31、根据权利要求24所述的分离的DNA分子,其是e),且编码一多肽,该多肽具有去氢酶活性。
32、根据权利要求24所述的分离的DNA分子,其是f),且编码一多肽,该多肽具有转酯酶活性。
33、根据权利要求24所述的分离的DNA分子,其是g),且编码一多肽,该多肽具有HMG-CoA还原酶活性。
34、根据权利要求24所述的分离的DNA分子,其是h),且编码一多肽,该多肽具有转录因子活性。
35、根据权利要求24所述的分离的DNA分子,其是i),且编码一多肽,该多肽具有外排泵活性。
36、一种表达载体,其包括如权利要求24所述的分离的DNA分子。
37、一种细胞,其转化有一聚核苷酸,该聚核苷酸是择自以下一个或多个所列物所组成的族群:
a)mkA的聚核苷酸,其包括序列识别号:2或19的核苷酸序列;
b)mkB的聚核苷酸,其包括序列识别号:3或20的核苷酸序列;
c)mkC的聚核苷酸,其包括序列识别号:4或21的核苷酸序列;
d)mkD的聚核苷酸,其包括序列识别号:5或22的核苷酸序列;
e)mkE的聚核苷酸,其包括序列识别号:6或23的核苷酸序列;
f)mkF的聚核苷酸,其包括序列识别号:7或24的核苷酸序列;
g)mkG的聚核苷酸,其包括序列识别号:8或27的核苷酸序列;
h)mkH的聚核苷酸,其包括序列识别号:9或25的核苷酸序列;
i)mkI的聚核苷酸,其包括序列识别号:10或26的核苷酸序列;以及
j)上述的组合。
38、根据权利要求37所述的细胞,其中该细胞为细菌,酵母菌,动物细胞,昆虫细胞,植物细胞,或丝状真菌。
39、根据权利要求37所述的细胞,其中该细胞为红曲霉菌属。
40、根据权利要求37所述的细胞,其中该细胞是择自以下一个或多个所列物所组成的族群:红曲霉pilosus,红曲霉ruber,以及红曲霉purpureus。
41、根据权利要求37所述的细胞,其中该细胞为红曲霉菌BCRC 38072。
42、一种增加莫那可林K生成的方法,其包括:
I)培养一可生产莫那可林K的细胞,该细胞转化有一择自以下所组成的族群的聚核苷酸:
a)mkA的聚核苷酸,其包括序列识别号:2或19的核苷酸序列;
b)mkB的聚核苷酸,其包括序列识别号:3或20的核苷酸序列;
c)mkC的聚核苷酸,其包括序列识别号:4或21的核苷酸序列;
d)mkD的聚核苷酸,其包括序列识别号:5或22的核苷酸序列;
e)mkE的聚核苷酸,其包括序列识别号:6或23的核苷酸序列;
f)mkF的聚核苷酸,其包括序列识别号:7或24的核苷酸序列;
g)mkH的聚核苷酸,其包括序列识别号:9或25的核苷酸序列;以及
j)上述的组合;以及
II)由该细胞收集莫那可林K。
43、根据权利要求42所述的增加莫那可林K生成的方法,其中该细胞是真菌细胞。
44、根据权利要求42所述的增加莫那可林K生成的方法,其中该细胞是红曲霉菌属。
45、根据权利要求42所述的增加莫那可林K生成的方法,其中该细胞是择自以下一个或多个所列物所组成的族群:红曲霉pilosus,红曲霉ruber,以及红曲霉purpureus。
46、根据权利要求42所述的增加莫那可林K生成的方法,其中该细胞是红曲霉菌BCRC 38072。
47、根据权利要求42所述的增加莫那可林K生成的方法,其中该聚核苷酸为g)。
48、一种生成HMG-CoA还原酶抑制剂的方法,包括:
I)培养一可生成HMG-CoA还原酶抑制剂的细胞,该细胞转化有一聚核苷酸,包括:
a)mkA的聚核苷酸,其包括序列识别号:2或19的核苷酸序列;
b)mkB的聚核苷酸,其包括序列识别号:3或20的核苷酸序列;
c)mkE的聚核苷酸,其包括序列识别号:6或23的核苷酸序列;
d)mkF的聚核苷酸,其包括序列识别号:7或24的核苷酸序列;以及
II)由该细胞收集HMG-CoA还原酶抑制剂。
49、根据权利要求48所述的生成HMG-CoA还原酶抑制剂的方法,其中该HMG-CoA还原酶抑制剂为莫那可林K。
50、根据权利要求48所述的生成HMG-CoA还原酶抑制剂的方法,其中该细胞为细菌,酵母菌,动物细胞,昆虫细胞,植物细胞,或丝状真菌。
51、根据权利要求48所述的生成HMG-CoA还原酶抑制剂的方法,其中该细胞为红曲霉菌属。
52、根据权利要求48所述的生成HMG-CoA还原酶抑制剂的方法,其中该细胞是择自以下一个或多个所列物所组成的族群:红曲霉pilosus,红曲霉ruber,以及红曲霉purpureus。
53、根据权利要求48所述的生成HMG-CoA还原酶抑制剂的方法,其中该细胞为红曲霉菌BCRC 38072。
54、根据权利要求48所述的生成HMG-CoA还原酶抑制剂的方法,其中该细胞更转化有一择自所组成的聚核苷酸:
a)mkC的聚核苷酸,其包括序列识别号:4或21的核苷酸序列;
b)mkD的聚核苷酸,其包括序列识别号:5或22的核苷酸序列;
c)mkH的聚核苷酸,其包括序列识别号:9或25的核苷酸序列;以及
d)以上的组合。
55、一种分离的DNA分子,包括一聚核苷酸,其编码择自以下一个或多个所列物所组成的族群的多肽:
a)一包括序列识别号:11的氨基酸序列的多肽;
b)一包括序列识别号:12的氨基酸序列的多肽;
c)一包括序列识别号:13的氨基酸序列的多肽;
d)一包括序列识别号:14的氨基酸序列的多肽;
e)一包括序列识别号:15的氨基酸序列的多肽;
f)一包括序列识别号:16的氨基酸序列的多肽;
g)一包括序列识别号:28的氨基酸序列的多肽;
h)一包括序列识别号:17的氨基酸序列的多肽;
i)一包括序列识别号:18的氨基酸序列的多肽;;以及
j)于严苛条件下可与编码a),b),c),d),e),f),g),h),或i)的聚核苷酸杂交的核苷酸序列。
56、根据权利要求55所述的分离的DNA分子,其中该多肽为a),且具有择自以下一个或多个所列物所组成族群的活性:β-酮酰基合成酶,乙酰转移酶,脱水酶,甲基转移酶,酮还原酶,及酰基携带蛋白。
57、根据权利要求56所述的分离的DNA分子,其中该多肽具有九缩酮合成酶的活性。
58、根据权利要求55所述的分离的DNA分子,其中该多肽为b),且具有择自以下一个或多个所列物所组成族群的活性:β-酮酰基合成酶,乙酰转移酶,脱水酶,甲基转移酶,酮还原酶,酰基携带蛋白,以及酰脂基还原酶。
59、根据权利要求58所述的分离的DNA分子,其中该多肽为c),且具有二缩酮合成酶的活性。
60、根据权利要求55所述的分离的DNA分子,其中该多肽为c),且具有单加氧酶活性。
61、根据权利要求55所述的分离的DNA分子,其中该多肽为d),且具有氧化还原酶活性。
62、根据权利要求55所述的分离的DNA分子,其中该多肽为e),且具有去氢酶活性。
63、根据权利要求55所述的分离的DNA分子,其中该多肽为f),且具有转酯酶活性。
64、根据权利要求55所述的分离的DNA分子,其中该多肽为g),且具有HMG-CoA还原酶活性。
65、根据权利要求55项所述的分离的DNA分子,其中该多肽为h),且具有转录因子活性。
66、根据权利要求55所述的分离的D NA分子,其中该多肽为i),且具有外排泵活性。
67、一种表达载体,其包括如权利要求55所述的分离的DNA分子。
CNA2004101025835A 2003-12-24 2004-12-24 生成合成胆固醇合成抑制剂莫那可林k的相关基因 Pending CN1637143A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US53264303P 2003-12-24 2003-12-24
US60/532,643 2003-12-24

Publications (1)

Publication Number Publication Date
CN1637143A true CN1637143A (zh) 2005-07-13

Family

ID=34860180

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2004101025835A Pending CN1637143A (zh) 2003-12-24 2004-12-24 生成合成胆固醇合成抑制剂莫那可林k的相关基因

Country Status (7)

Country Link
US (1) US7482157B2 (zh)
JP (1) JP2005185283A (zh)
KR (1) KR100662700B1 (zh)
CN (1) CN1637143A (zh)
DE (1) DE102004062386B4 (zh)
FR (2) FR2864548B1 (zh)
TW (1) TWI297358B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104140933A (zh) * 2014-08-06 2014-11-12 浙江省农业科学院 土曲霉zrv2011f5及其应用
CN106987529A (zh) * 2017-04-13 2017-07-28 北京工商大学 高产MonacolinK的红曲霉基因工程菌的构建方法及其应用

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015161856A1 (en) * 2014-04-23 2015-10-29 Danmarks Tekniske Universitet Statin resistance and export
CN113373165B (zh) * 2021-07-05 2024-04-23 北京工商大学 紫色红曲菌comp52338_c2基因过表达菌株的构建方法及其应用
CN114231554B (zh) * 2021-12-27 2023-07-28 安徽工程大学 一种维生素k2系列产物的生物合成方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55150898A (en) * 1979-05-11 1980-11-25 Sankyo Co Ltd Preparation of a new physiologically active substance mb-530b
US5712146A (en) 1993-09-20 1998-01-27 The Leland Stanford Junior University Recombinant combinatorial genetic library for the production of novel polyketides
WO1995012661A1 (en) * 1993-11-02 1995-05-11 Merck & Co., Inc. Dna encoding triol polyketide synthase
WO2000001838A2 (en) 1998-07-02 2000-01-13 The Board Of Regents Of The Leland Stanford Junior University Methods for making polyketides
US6391583B1 (en) * 1998-12-18 2002-05-21 Wisconsin Alumni Research Foundation Method of producing antihypercholesterolemic agents
EP1325929B1 (en) 2002-01-07 2009-03-25 Cyplasin Biomedical Ltd. Cytotoxic cyplasin of the sea hare, Aplysia punctata, cDNA cloning and expression of bioreactive recombinants

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104140933A (zh) * 2014-08-06 2014-11-12 浙江省农业科学院 土曲霉zrv2011f5及其应用
CN104140933B (zh) * 2014-08-06 2016-06-08 浙江省农业科学院 土曲霉zrv2011f5及其应用
CN106987529A (zh) * 2017-04-13 2017-07-28 北京工商大学 高产MonacolinK的红曲霉基因工程菌的构建方法及其应用

Also Published As

Publication number Publication date
FR2864548B1 (fr) 2009-04-17
KR100662700B1 (ko) 2007-01-02
DE102004062386B4 (de) 2010-06-24
FR2883297B1 (fr) 2014-07-25
TWI297358B (en) 2008-06-01
TW200521230A (en) 2005-07-01
FR2864548A1 (fr) 2005-07-01
JP2005185283A (ja) 2005-07-14
US7482157B2 (en) 2009-01-27
KR20050065437A (ko) 2005-06-29
FR2883297A1 (fr) 2006-09-22
DE102004062386A1 (de) 2005-09-29
US20050227262A1 (en) 2005-10-13

Similar Documents

Publication Publication Date Title
CN101044243A (zh) 类异戊二烯的生产方法
CN1871351A (zh) 一种新的真菌蛋白及其编码核酸
CN1416467A (zh) 锌指结构域及其鉴定方法
CN1774512A (zh) 酿酒酵母基因的筛选方法
CN1617927A (zh) 焦谷氨酰肽酶及其基因
CN1267556C (zh) 提高丝状真菌中血红素蛋白产量的方法
CN1542142A (zh) 用于检测和鉴定分枝杆菌的寡聚核苷酸
CN1849391A (zh) 腈水解酶、编码腈水解酶的核酸,以及制备和使用它们的方法
CN1592793A (zh) 肝细胞癌-相关基因和多肽,以及检测肝细胞癌的方法
CN1263855C (zh) 来自淡青链霉菌的假寡糖生物合成基因的分离及其应用
CN1840665A (zh) 毒力基因、蛋白及其用途
CN1637143A (zh) 生成合成胆固醇合成抑制剂莫那可林k的相关基因
CN1882683A (zh) 生产二肽的微生物和使用该微生物制造二肽的方法
CN1458976A (zh) 2,5-dkg通透酶
CN1488001A (zh) 试验肿瘤细胞对于抗癌药剂敏感性的方法
CN1564868A (zh) 参与聚酯合成的酶基因和使用该基因的聚酯制造方法
CN1795205A (zh) Spex组合物和使用方法
CN1950505A (zh) 生产多肽的方法
CN1117865C (zh) α-1,4-葡聚糖裂解酶和其纯化方法
CN1816623A (zh) 新型微生物、麦芽糖磷酸化酶和海藻糖磷酸化酶及其制造方法
CN1653173A (zh) 蜡状芽孢杆菌产生的呕吐毒素的合成酶、编码该酶的基因以及呕吐毒素的检测方法
CN1545552A (zh) 基因和蛋白质及它们的用途
CN1894408A (zh) 除草剂代谢蛋白质,其基因及其应用
CN1252270C (zh) 红豆杉3-羟基-3-甲基戊二酰辅酶a合成酶蛋白编码序列
CN1906298A (zh) 来源于草本植物发草属、黑麦草属和羊茅属物种的冰再结晶抑制蛋白或抗冻蛋白

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1075277

Country of ref document: HK

C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1075277

Country of ref document: HK