CN112522170A - 烷醇酰胺及酰胺胺的微生物生产及其用途 - Google Patents

烷醇酰胺及酰胺胺的微生物生产及其用途 Download PDF

Info

Publication number
CN112522170A
CN112522170A CN202011494386.8A CN202011494386A CN112522170A CN 112522170 A CN112522170 A CN 112522170A CN 202011494386 A CN202011494386 A CN 202011494386A CN 112522170 A CN112522170 A CN 112522170A
Authority
CN
China
Prior art keywords
fatty
polypeptide
microorganism
recombinant microorganism
acyl
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011494386.8A
Other languages
English (en)
Inventor
贾森·J·鲁特斯
斯蒂芬·德尔卡戴雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Genomatica Inc
Original Assignee
Genomatica Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genomatica Inc filed Critical Genomatica Inc
Publication of CN112522170A publication Critical patent/CN112522170A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/02Amides, e.g. chloramphenicol or polyamides; Imides or polyimides; Urethanes, i.e. compounds comprising N-C=O structural element or polyurethanes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/18Carboxylic ester hydrolases (3.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/01Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • C12Y203/01086Fatty-acyl-CoA synthase (2.3.1.86)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/01Carboxylic ester hydrolases (3.1.1)
    • C12Y301/01005Lysophospholipase (3.1.1.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/02Thioester hydrolases (3.1.2)
    • C12Y301/02014Oleoyl-[acyl-carrier-protein] hydrolase (3.1.2.14), i.e. ACP-thioesterase
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/52Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明公开涉及重组微生物体,其经基因工程化以表达催化伯胺和酰基硫酯转化为脂肪酰胺的酶。本发明公开进一步包括通过将重组微生物体在碳源存在下进行培养而产生脂肪酰胺的方法。

Description

烷醇酰胺及酰胺胺的微生物生产及其用途
本申请是申请日为2013年3月12日、发明名称为“烷醇酰胺及酰胺胺的微生物生产及其用途”的中国发明专利申请No.201380026545.3的分案申请。
相关申请的交叉引用
本申请要求美国临时申请号61/623,711(提交于2012年4月13日)的权益,其全部公开内容通过引用并入本文。
序列表
本申请包含序列表,其已经通过EFS-Web以ASCII形式提交并且通过引用将其全部并入本文。所述ASCII拷贝在2013年3月11日生成,名称为LS00041PCT_SL.txt并且大小为69,769字节。
发明领域
本发明公开涉及微生物体,所述微生物体经基因工程化而表达酶,从而当在碳源存在下进行培养时产生脂肪酰胺。
发明背景
脂肪酰胺是动植物脂质中的内源组分,其具有广泛的生物化学及生理学功能(Bachur等人(1965)J.Biol.Chem.240:1019-1024)。内源脂肪酰胺如N-棕榈酸乙醇胺(PEA)、N-花生四烯乙醇胺(anandamide)、N-油酰乙醇胺(OEA)以及N-花生四烯多巴胺(NADA)在中枢及周围神经系统中起信号传导分子的作用(见例如Tan等人(2006)AAPS J.8(3):E461-E465;和Lo Verme等人(2004)Mol.Pharmacol.67(1):15-19)。有研究表明PEA发挥抗炎及抗伤害感受的活性,用来治疗疼痛的PEA药物制剂可在欧洲购得,商标名为NORMAST(Petrosino等人(2010)Biochimie 92(6):724-7;及Bacci等人(2011)ISRNSurgery,2011期,文章ID 917350,6页;doi:10.5402/2011/917350)。
脂肪酰胺如脂肪烷醇酰胺和脂肪氨基酰胺也有广泛的非药用商业用途。脂肪烷醇酰胺和脂肪氨基酰胺在个人护理产品(例如香波、沐浴露和洁面乳)、化妆品制剂(例如腮红、睫毛膏和唇膏)以及家用清洁产品(例如洗衣剂、餐具洗洁精和表面清洁组合物)的生产中用作起泡剂、表面活性剂或其中间产物。脂肪烷醇酰胺和脂肪氨基酰胺也可用作燃料添加剂。据估计,每年全球市场要消耗100,000吨的烷醇酰胺(Adlercreutz等人(2010)Industrial Biotechnology 6(4):204-211)。
用于商业用途的脂肪烷醇酰胺的经典生产方法是通过来源于原料如天然油类或脂肪及原油的脂肪酸或脂肪酸甲酯与链烷醇胺进行有机合成反应进行的,该过程成本消耗大(Adlercreutz等人,同上,以及Frost&Sullivan,“Nonionic Surfactants in theIndustrial Triad”(2002))。例如,可通过来源于椰子油的棕榈酰脂肪酸与单乙醇胺发生Schotten-Baumann反应生产PEA,如下所示:
Figure BDA0002841645040000021
脂肪链烷醇胺也已经可以通过生物合成而生产。例如,OEA可由磷脂酰乙醇胺(PE)和sn-1-油酰-磷脂酰胆碱(PC)前体经由两种酶过程生产,其中将PE和sn-1-油酰-PC在N-乙酰基转移酶的存在下反应形成N-乙酰磷脂酰乙醇胺(NAPE),然后将后者与溶-PC组合并与NAPE特异性的磷酸酯酶D反应形成OEA和磷脂酸(见Astarita等人(2006)Am.J.Physiol.Regul.Integr.Comp.Physiol 290:R1407-R1412)。
这些方法以及本领域其他已知的用于脂肪酰胺合成的方法常常包括效率低下的反应步骤,因此在经济和环境两个角度来看都是很昂贵的。因此,需要改进的方法和反应剂用于生产脂肪酰胺,其中脂肪链的长度和饱和度以及酰胺头部基团的类型可得到有效的控制。
发明概述
本发明公开的一方面提供了重组微生物体,其包括编码催化伯胺和酰基硫酯转化为脂肪酰胺的多肽的核酸序列,其中所述微生物体在碳源的存在下培养。在本文中,所述微生物体经基因工程化以表达编码如下多肽的核酸序列,当所述微生物体在碳源存在下进行培养时,所述多肽催化伯胺和酰基硫酯转化为脂肪酰胺。在一个实施方式中,碳源是碳水化合物。在另一种实施方式中,所述多肽为棕榈酰腐胺合酶(PPS)多肽。在另一个实施方式中,所述多肽为N-(4-氨基-2-羟丁基)十四酰胺合酶(AhtS)多肽。
本发明公开的另一方面提供了棕榈酰腐胺合酶(PPS)多肽,其具有SEQ ID NO:1的氨基酸序列。在一个实施方式中,PPS多肽包括与SEQ ID NO:1的氨基酸序列具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性的氨基酸序列。在另一个实施方式中,PPS多肽由包含SEQ ID NO:2的核酸序列的核酸所编码。
本发明公开的另一方面提供了N-(4-氨基-2-羟丁基)十四酰胺合酶(AhtS)多肽,其具有SEQ ID NO:3的氨基酸序列。在一个实施方式中,AhtS多肽包括与SEQ ID NO:3的氨基酸序列具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性的氨基酸序列。在另一个实施方式中,AhtS多肽由包含SEQID NO:22的核酸序列的核酸所编码。
另外,本发明公开的另一方面提供了重组微生物体,其中伯胺包括但不限于3-二甲氨基-1-丙胺、(±)-1-氨基-2-丙醇、2-甲氧基乙胺、3-氨基-1-丙醇、2-氨基-1,3-丙二醇、3-甲氧基丙胺、N-(2-羟乙基)乙二胺、和丁胺、1,4-二氨基丁烷或、其组合。
此外,本发明公开的另一方面提供了重组微生物体,其中的酰基硫酯是脂肪酰基-ACP或脂肪酰基-CoA。所述脂肪酰基-ACP或脂肪酰基-CoA由所述微生物产生。
本发明公开进一步包括重组微生物,其包括编码脂肪酸生物合成多肽、硫酯酶多肽(EC 3.1.2.14或EC 3.1.1.5)和酰基-CoA合酶多肽(EC2.3.1.86)中的一种或多种的核酸序列。在一个实施方式中,编码硫酯多肽的核酸序列为tesA。在另一个实施方式中,编码酰基-CoA合酶多肽的核酸序列为fadD。在另一个实施方式中,所述微生物体包括编码脂肪酸合成多肽的核酸序列,所述多肽包括但不限于accABCD、FabD、FabH、FabG、FabB、FabA、FabZ、FabF、FabI和/或FadR。
本发明公开进一步包括微生物体,其包括但不限于细菌、蓝细菌、藻类和真菌。在一个实施方式中,所述细菌为大肠杆菌(E.Coli)。在另一个实施方式中,所述真菌为酵母或丝状真菌。在另一个实施方式中,微生物体包括但不限于酿酒酵母(Saccharomycescerevisiae)、解脂假丝酵母(Candida lipolytica)、大肠埃希氏菌(Escherichia coli)、节杆菌(Arthrobacter)、红酵母(Rhodotorula glutinins)、不动杆菌(Acinetobacter)、解脂假丝酵母(Candida lipolytica)、布朗葡萄藻(Botryococcus braunii)、弗尼斯弧菌(Vibrio furnissii)、藤黄微球菌(Micrococcus leuteus)、嗜麦芽寡养单胞菌(Stenotrophomonas maltophilia)、枯草芽孢杆菌(Bacillus subtilis),地衣芽孢杆菌(Bacillus lichenoformis)、恶臭假单胞菌(Psuedomonus putida)、荧光假单胞菌(Psuedomonas florescens)、天蓝色链霉菌(Streptomyces coelicolor)、聚球藻属物种PCC7002(Synechococcus sp)、细长嗜热蓝细菌BP-1(Thermosynechococcus elongatus)、桑椹型无绿藻(Prototheca moriformis)、克鲁格尼原藻(Prototheca krugani)、大型无绿藻(Prototheca stagnora)、中型无绿藻(Prototheca zopfii)或原壳小球藻(Chorellaprotothecoide)细胞。在另一个实施方式中,所述微生物体包括但不限于节杆菌AK 19(Arthrobacter AK 19)、不动杆菌属物种M-1株、大肠杆菌B、大肠杆菌C、大肠杆菌K或大肠杆菌W细胞。
本发明公开的另一方面提供了重组微生物体,其包括编码催化伯胺和酰基硫酯转化为脂肪酰胺的多肽的核酸序列,其中催化伯胺和酰基硫酯转化为脂肪酰胺的多肽对微生物体是内源的。
本发明公开的另一方面提供了重组微生物体,其包括编码催化伯胺和酰基硫酯转化为脂肪酰胺的多肽的核酸序列,其中催化伯胺和酰基硫酯转化为脂肪酰胺的多肽对微生物体是外源的。
另外,本发明的另一方面提供了重组微生物体,其包括编码催化伯胺和酰基硫酯转化为脂肪酰胺的酶的核酸序列。在一个实施方式中,所述脂肪酰胺为脂肪烷醇酰胺和/或脂肪酰胺胺。在另一个实施方式中,所述脂肪酰胺为C14、C16和/或C18脂肪烷醇酰胺和/或C14、C16或C18脂肪酰胺胺。在另一个实施方式中,所述脂肪酰胺为C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19或C20脂肪烷醇酰胺和/或C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19或C20脂肪酰胺胺。
另外,本发明公开的另一方面提供了重组微生物体,其包括编码催化伯胺和酰基硫酯转化为脂肪酰胺的多肽的核酸序列,其中所述微生物体表达了一种丝氨酸脱羧酶多肽。
本发明公开进一步包含生产脂肪酰胺的方法,其包括:(a)提供重组微生物体,其包括编码催化伯胺和酰基硫酯转化为脂肪酰胺的多肽的核酸序列;以及(b)将所述重组微生物体在适合于编码催化伯胺和酰基硫酯转化为脂肪酰胺的多肽的核酸序列表达的条件下在存在至少一种多肽底物的培养基中培养。该方法进一步包括从培养基中分离脂肪酰胺。该方法可用于生产脂肪酰胺。在一个实施方式中,所述脂肪酰胺为脂肪烷醇酰胺和/或脂肪酰胺胺。在另一个实施方式中,所述脂肪酰胺为C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19或C20脂肪烷醇酰胺和/或C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19或C20脂肪酰胺胺。
附图简述
结合阐述了优选实施方式的附图阅读时,能最好地理解本发明。然而要理解的是,本发明公开不限于图中公开的特定实施方式。
图1是以编码棕榈酰腐胺合酶(PPS)的表达载体转化的大肠杆菌MG1655菌株DG5在乙醇胺存在下进行培养时产生的脂肪品种的代表性气象色谱-质谱(GC-MS)色谱图。上图描述了具有GC保留时间为13.1min的峰,其在下图描述的MS分析中被鉴定为N-棕榈酰乙醇胺。
图2A-2D是用N,O-双(三甲基硅烷基)-三氟乙酰胺(BSTFA)衍生化后得到的N-棕榈酰乙醇胺产物的GC-MS色谱图。图2A描述了有GC保留时间为13.3min的峰,其在图2E中描述的MS分析中被鉴定为三级甲硅基(TMS)-保护的N-棕榈酰乙醇胺。图2B-2D分别为单独BSTFA、未进行BSTFA衍生化的N-棕榈酰乙醇胺及空白反应的对照色谱图。
图3是以编码PPS的表达载体转化的大肠杆菌MG1655菌株DG5在3-二甲氨基-1-丙胺存在下进行培养时产生的脂肪N-(3-二甲氨基-1-丙胺)胺的GC-MS色谱图。
图4描述了在所示伯胺原料存在下获自以编码PPS的表达载体转化的大肠杆菌MG1655细胞的脂肪酰胺产物。
图5是以编码N-(4-氨基-2-羟丁基)十四酰胺合酶(AhtS)的表达载体转化的大肠杆菌MG1655菌株在3-二甲氨基-1-丙胺存在下进行培养时产生的脂肪品种的代表性GC-MS色谱图。上图描述了具有GC保留时间为11.4min的峰,其在下图描述的MS分析中被鉴定为C14:0脂肪N-(3-二甲氨基-1-丙胺)。
图6为可根据本发明公开的方法进行遗传修饰的生物代谢途径的示意图。
发明详述
天然抗生素棕榈酰腐胺可由表达棕榈酰腐胺合酶(PPS)(GenBank登录号AAV33349.1(下文称为“AAV33349”))(SEQ ID NO:1)的细菌产生,PPS由GenBank登录号AY632377.1(后改为“AY632377”)(SEQ ID NO:2)(Brady等人(2004)J.Nat.Prod.67:1283-1286)的核酸序列所编码。证明AY632377编码的PPS在大肠杆菌中过表达时只产生一种主要的丁二胺的N-酰基衍生物(1,4-二氨基丁烷),即棕榈酰腐胺(Brady等人,同上)。编码N-(4-氨基-2-羟丁基)十四酰胺合酶(AhtS)(GeneBank登录号ACX33975.1)(SEQ ID NO:3)的同源物与PPS的氨基酸序列具有38%的同一性的氨基酸序列。来自未经培养的细菌RM44的N-(4-氨基-2-羟丁基)十四酰胺合酶(AhtS)基因(GenBank GQ869386)显示于(SEQ ID NO:22)。
本发明公开至少部分基于这样的发现,即表达PPS或AhtS的微生物体(例如细菌)可在碳源存在下进行培养时由酰基硫酯前体产生脂肪酰胺。不希望受到理论的限制,认为PPS直接催化酰基硫酯和伯胺之间的酰胺化。这是微生物体第一次经特异性基因工程化而表达酶如PPS或AhtS以产生脂肪酰胺。这一点是有优势的,因为由此得到的微生物体起到便捷的生物工厂的作用,生成所需链长度的脂肪酰胺,包括分支或不分支的形式。此外,出于灵活性的目的,可交换使用多种不同原料(例如,玉米、甘蔗、甘油、柳枝稷)为微生物体提供必需的碳源。这样,可将微生物体用于按需求生产脂肪酰胺,可通过发酵进行收获,由此超越了仍然依赖于昂贵的天然油类和复杂合成化学的繁琐高成本的现有技术系统。在大量产品的生产中需要脂肪酰胺,这些产品包括但不限于起泡剂、阳离子表面活性剂、用作香波和沐浴产品的中间产物、化妆品和药品中的乳化试剂、燃料添加剂,等等。
本发明公开提供了一种重组微生物体,其经基因工程化以表达编码催化伯胺和酰基硫酯转化为脂肪酰胺的多肽的核酸序列,其中所述微生物体在碳源存在下进行培养。在一个实施方式中,碳源是碳水化合物。更具体地,微生物体经基因工程化以表达如PPS或AhtS的酶,从而催化任何伯胺(例如乙醇胺、酰胺3-二甲氨基-1-丙胺)与酰基硫酯(例如酰基-CoA或酰基-ACP)之间的酰胺化以生产脂肪酰胺如烷醇酰胺和酰胺胺。这是一个全新的过程,因为迄今为止脂肪烷醇酰胺(例如用于合成椰油酰胺丙基甜菜碱的中间产物)以及酰胺胺都是从原料如天然油类(或脂肪)以及原油通过合成而生产的,这是个效率低下的过程,因为其依赖于原始材料的提纯直至达到期望的材料。相比而言,本发明公开提供了一种生产方法,其中微生物体经基因工程化以表达酶,使得例如烷醇酰胺和脂肪N-(3-二甲氨基-1-丙胺)通过生物化学方法合成,这对于生产脂肪酰胺是非常有效的过程。可将氨基酸或碳水化合物加至微生物体的发酵基质中以提供必需的碳源(见实施例3-7)。备选地,微生物体可经基因工程化而在体内生成其自身的伯胺。例如,可通过遗传地增加丝氨酸的生物合成及丝氨酸的去羧化途径而实现乙醇胺的生物合成(见实施例8)。在酶的催化能力上,AhtS与PPS生成相同的酰胺化合物,但更优选地产生C14:0脂肪硫酯底物。两种酶都属于EC家族2.3.1.X.X。
本发明公开进一步提供了方法在重组微生物体中生产脂肪酰胺。通过此方法生成的脂肪酰胺包括但不限于脂肪烷醇酰胺和脂肪酰胺胺。在一个实施方式中,脂肪酰胺为C14、C16和/或C18脂肪烷醇酰胺。在另一个实施方式中,所述脂肪酰胺为C14、C16和/或C18脂肪酰胺胺。本方法包括步骤(a)提供重组微生物体,其经基因工程化以表达编码多肽如PPS或AhtS的核酸序列,所述多肽催化伯胺和酰基硫酯转化为脂肪酰胺的多肽;以及(b)将所述重组微生物体在适合于多肽表达并存在至少一种多肽底物的条件下培养,由此产生脂肪酰胺。微生物体在碳源存在下进行培养。所述碳源可选自广泛的不同来源,包括但不限于氨基酸、碳水化合物和脂类。在一个实施方式中,碳源为碳水化合物。由微生物体产生的脂肪酰胺可分离自培养液(例如发酵液)。在一个实施方式中,脂肪酰胺可从微生物体的外部环境中分离。在另一个实施方式中,脂肪酰胺可全部或部分地由微生物体自发分泌。在另一个实施方式中,脂肪酰胺可被运输到细胞外环境,可选地其中有一种或多种合适运输蛋白的协助。在另一个实施方式中,脂肪酰胺被动运输进入细胞外环境。
术语“脂肪酰胺”和“烷基酰胺”指的是具有式R1CONHR2的化合物,其中R1代表来源于脂肪酸的脂肪烃基团,R2代表来自伯胺的置换的或未置换的烷基、置换的或未置换的杂环烷基、置换的或未置换的烯基、或者置换的或未置换的杂环烯基基团。
“酰基硫酯”指的是脂肪酸,其通过生产型宿主微生物体的脂肪酸生物合成途径而被“激活”。酰基硫酯可由微生物体内源的脂肪酸生成,或酰基硫酯可通过外源提供给微生物体的脂肪酸生成。酰基硫酯的非限制性实例是酰基-辅酶A(CoA)和酰基-酰基载体蛋白质(ACP)。
术语“酰基-CoA”指的是烷基链的羧基碳和CoA的4'-磷酸泛酰巯基乙胺部分的氢硫基基团之间形成酰基硫酯,其具有式R1-C(O)S-CoA,其中R1是脂肪烃基团。术语“酰基-ACP”指的是烷基链的羧基碳和与ACP相连的4'-磷酸泛酰巯基乙胺部分的氢硫基基团之间形成酰基硫酯,其具有式R1-C(O)S-ACP,其中R1是脂肪烃基团。
术语“脂肪酸”指的是具有式R1COOH的羧酸。R1代表脂肪烃基团,优选地为烷基基团。R1可包含4-26个原子。在特定实施方式中,R1的长度为至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、或至少21个碳。备选地或此外地,R1基团的长度为22或更少、21或更少、20或更少、19或更少、18或更少、17或更少、16或更少、15或更少、14或更少、13或更少、12或更少、11或更少、10或更少、9或更少、8或更少、7或更少或6或更少的碳。因此,R1基团包含碳数量介于以上任意两个值为端点的区间之内。例如,R1基团长度可以为6-16个碳、10-14个碳或12-18个碳。在一些实施方式中,脂肪酸为C6、C7、C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19、C20、C21、C22、C23、C24、C25或C26脂肪酸。在特定实施方式中,脂肪酸为C6、C8、C10、C12、C13、C14、C15、C16、C17或C18脂肪酸。在一个优选的实施方式中,脂肪酰胺为C14、C16或C18脂肪烷醇酰胺。在另一个优选的实施方式中,脂肪酰胺为C14、C16或C18脂肪酰胺胺。在另一个优选的实施方式中,脂肪酰胺为C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19或C20烷醇酰胺。在另一个优选的实施方式中,脂肪酰胺为C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19或C20酰胺胺。
脂肪酸的R1基团可以为直链或支链形式。支链可以具有多于一个的分支点,且可包括环状支链。在一些实施方式中,支链脂肪酸为C6、C7、C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19、C20、C21、C22、C23、C24、C25或C26支链脂肪酸。在具体实施方式中,支链脂肪酸为C6、C8、C10、C12、C13、C14、C15、C16、C17或C18支链脂肪酸。在特定实施方式中,支链脂肪酸的羟基基团位于一级(C1)位置。
在特定实施方式中,支链脂肪酸为异脂肪酸或反异脂肪酸。在示例性实施方式中,支链脂肪酸选自异-C7:0、异-C8:0、异-C9:0、异-C10:0、异-C11:0、异-C12:0、异-C13:0、异-C14:0、异-C15:0、异-C16:0、异-C17:0、异-C18:0、异-C19:0、反异-C7:0、反异-C8:0、反异-C9:0、反异-C10:0、反异-C11:0、反异-C12:0、反异-C13:0、反异-C14:0、反异-C15:0、反异-C16:0、反异-C17:0、反异-C18:0和反异-C19:0支链脂肪酸。
支链或非支链脂肪酸的R1基团可以为饱和或不饱和的。如果是不饱和的,则R1基团可具有多于一个或多于一个不饱和位点。在一些实施方式中,所述不饱和脂肪酸为单不饱和脂肪酸。在特定实施方式中,所述不饱和脂肪酸为C6:1、C7:1、C8:1、C9:1、C10:1、C11:1、C12:1、C13:1、C14:1、C15:1、C16:1、C17:1、C18:1、C19:1、C20:1、C21:1、C22:1、C23:1、C24:1、C25:1或C26:1不饱和脂肪酸。在其他实施方式中,所述不饱和脂肪酸为C10:1、C12:1、C14:1、C16:1或C18:1不饱和脂肪酸。在其他实施方式中,所述不饱和脂肪酸在Ω-7位置不饱和。在特定实施方式中,不饱和脂肪酸包含顺式双键。
所述伯胺可以为任何能够作为PPS底物的伯胺,具有式R2NH2,其中R2代表来自伯胺的置换或未置换的烷基、置换的或未置换的杂环烷基、置换的或未置换的烯基、或者置换的或未置换的杂环烯基基团。在特定实施方式中,R2被羟基基团置换,并且脂肪酰胺可被称为“烷醇酰胺”或“脂肪烷醇酰胺”。在其他实施方式中,R2含有氨基基团,并且脂肪酰胺可被称为“酰胺胺”或“脂肪酰胺胺”。
R2可包含1-12个碳原子。在特定实施方式中,R2包含至少2、至少3、至少4、至少5、至少6、或至少7个碳。备选地或此外,R2包含12或更少、11或更少、10或更少、9或更少、8或更少、7或更少、6或更少、5或更少或4或更少的碳。因此,R2基团包含介于以上任意两个值之内的碳。例如,所述R2基团可包含2-8个碳、4-10个碳或3-6个碳。在一些实施方式中,R2基团含有3、4、5或6个碳原子。
伯胺的R2基团可为直链或支链形式。支链可具有多于一个分支点,且可包括环状支链。
除非另有陈述,术语“烷基”自身或作为其他替代物的一部分是直链或支链,或环烃根,或其组合。该定义在“烷基”作为基团的一部分存在时也适用,例如在羟烷基、卤代烷基、氨基烷基、烷基胺、二烷基胺等等中。
除非另有陈述,术语“烷基”自身或作为其他替代物的一部分是直链或支链,或环烃根,或其组合,其包含例如约2-约12个碳原子并含有至少一个碳碳双键。
除非另有陈述,术语“杂环烷基”或“杂环烯基”指的是直链或支链或环烃根,或其组合,由所述数量的碳原子及至少一个选自O、N、Si和S的杂原子构成,其中的氮和硫原子可选地为氧化的,氮杂原子可选地是季铵化的。杂原子O、N、Si和S可处于杂环烷基或杂环烯基基团内部任何位置。R2基团的示例性的杂环烷基基团包括但不限于-CH2-CH2-OH、-CH2-CH2-O-CH3、-CH2-CHOH-CH3、-CH2-CH2-CH2-O-CH3、-CH2-CH2-CH2-N(CH3)2、CH2-CH2-CH2-NH-CH2-CH3、-CH2-CH2-CH2-NH-CH2-CH2-OH、-CH-(CH2-OH)2和-Si(CH3)3。可以连续地有多至两个杂原子,例如–CH2-CH2-O-Si(CH3)3
术语烷基、杂环烷基、烯基和杂环烯基旨在包括指定的根的置换和未置换形式。R2基团的烷基、杂环烷基、烯基和杂环烯基根的示例性取代基可以为选自以下多种基团中的一种或多种,但不限于此:-OR’、=O、=NR’、=N-OR’、-NR’R”、-SR’、-卤素原子、-SiR’R”R”’、-OC(O)R’、-C(O)R’、-CO2R’、-CN和–NO2,这些基团的数目在零到(2m’+1)的范围内,其中m’是所述根中碳原子的总数。R’、R”和R”’每种都独立代表氢、未置换或置换的烷基、未置换或置换的杂环烷基、未置换或置换的烯基、未置换或置换的杂环烯基、烷氧基或硫代烷氧基基团或芳烷基基团。
在一些实施方式中,R2基团的取代物为–OH。在特定实施方式中,R2基团为多羟烷基或多羟杂环烷基部分,含有2、3或4个羟基基团。
R2基团的烷基、杂环烷基、烯基或杂环烯基链中可由聚氧化乙烯部分隔开。在特定实施方式中,R2基团含有聚氧化乙烯部分,其包含2个或更多、3个或更多、4个或更多、5个或更多、或者6个或更多、或者7个或更多个氧化乙烯部分。在其他实施方式中,R2基团含有聚氧化乙烯部分,其包含12个或更少、11个或更少、10个或更少、9个或更少、8个或更少、7个或更少、6个或更少、或者5个或更少的氧化乙烯部分。因此,R2基团可含有聚氧化乙烯部分,其具有介于以上任意两个端点之间数量的氧化乙烯部分。例如,R2基团可含有具有2-10个、4-8个或3-5个氧化乙烯部分的聚氧化乙烯部分。
伯胺可在微生物体中由可发酵碳源产生。例如,单乙醇胺可在体内通过丝氨酸脱羧酶(SDC)由丝氨酸而生成(Rontein等人(2001)J.Biol.Chem.276(38):35523-35529)。在一些实施方式中,微生物体表达内源SDC多肽。在其他实施方式中,微生物体经基因工程化以过表达SDC多肽。
腐胺(1,4-丁二胺)可在体内通过精氨酸脱羧酶(ADC)和精胺脲水解酶(AUH)的作用,由精氨酸而生成,二者分别将精氨酸转化为精胺和将精胺转化为腐胺(Moore等人(1990)J.Bacteriol 172(8):4631-4640)。在一些实施方式中,微生物体表达内源ADC和AUH多肽。在其他实施方式中,微生物体经基因工程化以过表达ADC多肽、AUH多肽或ADC和AUH多肽。在特定实施方式,ADC由来自大肠杆菌MG1655的speA基因表达(GenBank登记号NC_000913)。
伯胺还可外源地提供给微生物体。
适合用于本发明公开的示例性伯胺包括但不限于乙醇胺(单乙醇胺)、3-二甲基氨基-1-丙胺、(±)-1-氨基-2-丙醇、2-甲氧基乙胺、3-氨基-1-丙醇、2-氨基1-3丙二醇、3-甲氧基丙胺、N-(2-羟乙基)乙二胺、丁胺、1,4-二氨基丁烷及其组合。在特定实施方式中,伯胺为3-二甲基氨基-1-丙胺。
适合用于本发明公开的重组微生物体和方法的核酸可以为具有编码如下多肽的序列的任何核酸,在所述核酸得到表达且微生物体在碳源存在下进行培养时,所述多肽能够将伯胺和酰基硫酯转化为脂肪酰胺。
在一个实施方式中,所述多肽为PPS多肽。在特定实施方式中,PPS多肽包含SEQ IDNO:1的氨基酸序列、基本上由SEQ ID NO:1的氨基酸序列组成或由SEQ ID NO:1的氨基酸序列组成,所述SEQ ID NO:1的氨基酸序列即AAV33349的氨基酸序列。在一些实施方式中,PPS多肽是由包含SEQ ID NO:2的核酸序列的核酸序列所编码。在其他实施方式中,PPS多肽为具有SEQ ID NO:1的氨基酸多肽的PPS多肽的同源物。PPS多肽优选地包含如下氨基酸序列、基本上由如下氨基酸序列组成或由如下氨基酸序列组成,所述氨基酸序列与SEQ ID NO:1的氨基酸多肽由至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的同一性。
在其他实施方式中,所述多肽为N-(4-氨基-2-羟丁基)十四酰胺合酶(AhtS)多肽。在特定实施方式中,AhtS多肽包含SEQ ID NO:3的氨基酸序列、基本上由SEQ ID NO:3的氨基酸序列组成或由SEQ ID NO:3的氨基酸序列组成,所述SEQ ID NO:3的氨基酸序列即GenBank登录号ACX33975的氨基酸序列。在一些实施方式中,AhtS多肽是由包含SEQ ID NO:22的核酸序列的核酸序列所编码。在其他实施方式中,AhtS多肽为具有SEQ ID NO:3的氨基酸序列的AhtS多肽的同源物。AhtS多肽优选地包含如下氨基酸序列、基本上由如下氨基酸序列组成或由如下氨基酸组成,所述氨基酸序列与SEQ ID NO:3的氨基酸序列有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的同一性。
在特定实施方式中,催化伯胺和酰基硫酯转化为脂肪酰胺的多肽对于微生物体是内源的。在这些实施方式中,重组微生物体经基因工程化以过表达催化伯胺和酰基硫酯转化为脂肪酰胺的内源多肽。
在其他实施方式中,催化伯胺和酰基硫酯转化为脂肪酰胺的多肽对微生物体是外源的。在这些实施方式中,重组微生物体经基因工程化以表达催化伯胺和酰基硫酯转化为脂肪酰胺的外源多肽。例如,可将编码外源多肽的外源核酸通过标准分子生物学步骤整合入微生物体。为微生物体提供碳源可使微生物体增加脂肪酰胺的产量。
如本文所使用的,术语“同源物”、“同源”和“同源的”指的是与相应的多核苷酸或多肽具有至少约70%的同源性的多核苷酸或多肽。本领域一般技术人员熟知确定两个或更多个序列之间同源性的方法。例如,序列的比较及两条序列之间同源百分比的确定可通过使用数学算法而完成,例如通过基本局部比对搜索工具(Basic Local Alignment SearchTool,BLAST)(Altschul等人(1990)J.Mol.Biol.215(3):403-410)。
术语“多核苷酸”指的是DNA或RNA的多聚物,其可以为单链或双链的,且其能够含有非天然或经改变的核苷酸。术语“多核苷酸”、“核酸”和“核酸分子”在本文中交换使用,指的是任何长度的核苷酸的多聚物形式,可以是核糖核苷酸(RNA)或脱氧核糖核苷酸(DNA)。
术语“多肽”和“蛋白质”指氨基酸残基的多聚物。术语“重组多肽”指的是通过重组DNA技术产生的多肽,其中编码表达的蛋白质或RNA的DNA通常被插入合适的表达载体,后者进而用于转化宿主细胞以产生所述多肽或RNA。
在本发明公开的组合物和方法中,可通过改变重组微生物体中一种或多种参与脂肪酸产生、降解和/或分泌的基因表达来增强所期望的脂肪酸或其酰基硫酯衍生物的生产。
在一些实施方式中,所述重组微生物体包含编码脂肪酸生物合成多肽的核酸序列。如本文所使用的,术语“脂肪酸生物合成多肽”指的是任何参与脂肪酸生物合成的多肽。宿主细胞中的脂肪酸生物合成途径使用前体乙酰-CoA和丙二酰-CoA。该途径中的步骤是通过脂肪酸生物合成(fab)及乙酰-CoA羧化酶(acc)基因家族的酶催化完成的(见例如,Heath等人(2001)Prog.Lipid Res.40(6):467-497)。乙酰-CoA被乙酰-CoA羧化酶(EC 6.4.1.2)羧化形成丙二酰-CoA。乙酰-CoA羧化酶(EC6.4.1.2)在大多数真核细胞中是一种多亚基酶,由四个独立的基因编码(accA、accB、accC和accD)。在一些细菌如谷氨酸棒杆菌(Corynebacterium glutamicus)中,乙酰-CoA羧化酶包括两个亚基:AccDA[YP_225123.1]和AccBC[YP_224991],其分别由accDA和accBC编码。根据所期望的脂肪酸或脂肪酸衍生产物,可在基因工程化宿主细胞中对特定的fab和/或acc基因(或其组合)进行过表达、修饰、弱化或删除。
在一些实施方式中,编码脂肪酸生物合成多肽的核酸序列编码accABCD。在其他实施方式中,编码脂肪酸生物合成多肽的核酸序列编码FabD、FabH、FabG、FabB、FabA、FabZ、FabF、FabI或来自另一种生物体的Fab的功能性同源物,如FabV。适合用于本发明公开组合物和方法的脂肪酸生物合成多肽的示例性GenBank登录号包括FabD(AAC74176)、FabH(AAC74175)、FabG(AAC74177)、FabB(P0A953)、FabA(ACY27485.1)、FabZ(ACY27493.1)、FabF(AAC74179)和FabI(NP_415804)。
在一些实施方式中,重组微生物体包含编码两种或更多(例如3种或更多、4种或更多)生物合成多肽(例如accABCD和FabD;FabD、FabH和FabG;或FabI、FabG,H,D、FabA,B和FabZ)的核酸序列。
FadR是参与脂肪酸降解和脂肪酸生物合成途径的转录因子(Cronan等人(1998)Mol.Microbiol.29(4):937-943)。已知FadR调制多种基因的表达和/或活性,所述基因包括fabA、fabB、iclR、fadA、fadB、fadD、fadE、fadI、fadJ、fadL、fadM、uspA、aceA、aceB以及aceK。FadR靶标基因编码的多肽的示例性GenBank登录号包括fabA(NP_415474)、fabB(BAA16180)、(NP_418442)、fadA(YP_026272.1)、fadB(NP_418288.1)、fadD(AP_002424)、fadE(NP_414756.2)、fadI(NP_416844.1)、fadJ(NP_416843.1)、fadL(AAC75404)、fadM(NP_414977.1)、uspA(AAC76520)、aceA(AAC76985.1)、aceB(AAC76984.1)和aceK(AAC76986.1)。
在一些实施方式中,重组微生物体包括编码脂肪酸生物合成多肽的核酸序列,并且所述核酸序列编码FadR。在特定实施方式中,该核酸序列编码来自大肠杆菌MG1655的FadR(NP_415705)。
硫酯酶(EC 3.1.2.14或EC 3.1.1.5)水解酰基-ACP硫酯得到脂肪酸。可通过修饰所选择的硫酯酶的表达而选择硫酯底物的链长度。在特定实施方式中,宿主细胞经基因工程化以表达、过表达、减弱表达或不表达一种或多种所选的硫酯酶以增加优选脂肪酸衍生物底物的产量。例如,可通过表达具有生产C10脂肪酸的偏好的硫酯酶并减弱具有生产C10脂肪酸之外的脂肪酸(例如偏好产生C14脂肪酸的硫酯酶)的偏好的硫酯酶的表达以生产C10脂肪酸。这会得到包含10个碳的相对均一的脂肪酸群体。在其他例子中,可通过减弱生产非-C14脂肪酸的内源硫酯酶并表达具有对C14-ACP偏好的硫酯酶来生产C14脂肪酸。在一些情况下,可通过表达具有对C12-ACP偏好的硫酯酶并减弱偏好表达非C12脂肪酸的硫酯酶来生产C12脂肪酸。可使用本领域已知方法验证乙酰-CoA、丙二酰-CoA及脂肪酸的过生产,例如通过使用放射性前体、HPLC或GC-MS的方法。
其表达可在本发明公开的组合物和方法中改变的硫酯酶基因(及相应GenBank登录号)的非限制性实例包括来自大肠杆菌的无前导序列的tesA(‘tesA)(AAC73596)、来自大肠杆菌的tesB(AAC73555)、来自加州月桂(Umbellularia california)的fatB(Q41635、AAA34215)、来自萼距花(Cuphea hookeriana)的fatB2(AAC49269)、来自萼距花的fatB3(Q39513;AAC72881)、来自香樟(Cinnamonum camphorum)的fatB(Q39473、AAC49151)、来自拟南芥(Arabidopsis thaliana)的fatB[M141T](CAA85388)(Mayer等人(2007)BMC PlantBiology 7:1-11)、来自拟南芥的fatA(NP 189147;NP 193041)、来自大豆根瘤菌(Bradyrhiizobium japonicum)的fatA(CAC39106)、来自萼距花的fatAAAC72883)以及来自向日葵(Helianthus annus)的fatA1(AAL79361)。
在特定实施方式中,重组微生物体包括编码硫酯酶的核酸序列,并且所述核酸序列为来自大肠杆菌MG1655的‘tesA’(AAC73596)。
酰基-CoA合酶(EC 2.3.1.86)通过催化酰基-CoA硫酯的形成而激活脂肪酸。其表达可在本发明公开的组合物和方法中改变的酰基-CoA合酶基因的非限制性实例包括fadD、fadK、BH3103、yhfL、Pfl-4354、EAV15023、fadD1、fadD2、RPC_4074、fadDD35、fadDD22、faa3p或编码蛋白质ZP_01644857的基因。酰基-CoA合酶基因的具体实例包括来自结核分枝杆菌(M.tuberculosis)H37Rv的fadDD35[NP_217021]、来自结核分枝杆菌H37Rv的fadDD22[NP_217464]、来自大肠杆菌的fadD[NP_416319]、来自大肠杆菌的fadK[YP_416216]、来自不动杆菌属物种ADP1的fadD[YP_045024]、来自流感嗜血杆菌(Haemophilus influenza)RdkW20的fadD[NP_438551]、来自沼泽红假单胞菌(Rhodopseudomonas palustris)Bis B18的fadD[YP_533919]、来自嗜碱芽孢杆菌(Bacillus halodurans)C-125的BH3101[NP_243969]、来自荧光假单胞菌Pfo-1的Pfl-4354[YP_350082]、来自睾丸酮丛毛单胞菌(Comamonastestosterone)KF-1的EAV15023[ZP_01520072]、来自枯草芽孢杆菌的yhfL[NP_388908]、来自铜绿假单胞菌(P.aeruginosa)PAO1的fadD1[NP_251989]、来自青枯雷尔氏菌(Ralstoniasolanacearum)GM1 1000的fadD1[NP_520978]、来自铜绿假单胞菌PAO1的fadD2[NP_251990]、编码来自嗜麦芽寡养单胞菌R551-3的蛋白质ZP_01644857的基因、来自酿酒酵母的faa3p[NP_012257]、来自酿酒酵母的faa1p[NP_014962]、来自枯草芽孢杆菌的lcfA[CAA99571]以及在如下文献中描述的基因:Shockey等人(2002)Plant.Physiol.129:1710-1722);Caviglia等人(2004)J.Biol.Chem.279:1163-1169);Knoll等人(1994)J.Biol.Chem.269(23):16348-56);Johnson等人(1994)J.Biol.Chem.269:18037-18046);以及Black等人(1992)J.Biol.Chem.267:25513-25520)。
在一些实施方式中,重组微生物体包含编码酰基-CoA合酶多肽的核酸序列,并且所述酰基-CoA合酶多肽为来自大肠杆菌MG1655的FadD[NP_416319]。
所述重组微生物体可包含编码脂肪酸生物合成多肽、硫酯酶多肽及酰基-CoA合酶多肽的任意组合的核酸。在特定实施方式中,微生物体包含编码硫酯酶多肽的核酸序列以及编码酰基-CoA合酶多肽的核酸序列。
本领域一般技术人员会理解,根据不同目的(例如所期望的脂肪酸或其酰基硫酯衍生物),可在经基因工程化而含有编码能够转化伯胺和酰基硫酯转化为脂肪酰胺的多肽的核酸序列的重组微生物体中过表达、修饰、弱化或删除参与脂肪酸代谢的特定基因(或基因组合)。适合用于本发明公开的参与脂肪酸代谢的其他基因的实例在例如美国专利申请出版2011/0162259中有所描述,其全文通过引用并入本文。
在一些实施方式中,所述多肽为本文描述的任意多肽的片段。术语“片段”指的是全长多肽或蛋白质中较短部分,大小范围为四个氨基酸残基到整个氨基酸序列减去一个氨基酸残基。在本发明的特定实施方式中,片段指的是多肽或蛋白质的整条氨基酸序列(例如,底物结合结构域或催化结构域)。
在一些实施方式中,多肽为本文描述的任意多肽的突变体或变体。如本文所使用的,术语“突变体”和“变体”指的是多肽具有的氨基酸序列与野生型多肽至少相差一个氨基酸。例如,突变体可包含以下保守氨基酸置换中的一种或多种:脂肪族氨基酸如丙氨酸、缬氨酸、亮氨酸和异亮氨酸被另一种脂肪族氨基酸取代;丝氨酸被苏氨酸取代;苏氨酸被丝氨酸取代;酸性残基如天冬氨酸和谷氨酸被另一种酸性残基取代;具有酰胺基团的残基如天冬酰胺和谷氨酰胺被另一种具有酰胺基团的残基取代;碱性残基如精氨酸被另一种碱性残基交换;以及芳香族残基如苯丙氨酸和色氨酸被另一种芳香族残基取代。在一些实施方式中,突变体多肽具有约1、2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、100或更多的氨基酸置换、添加、插入或删除。
优选的多肽的片段或突变体保留相应野生型多肽的一些或全部的生物学功能(例如酶活性)。在一些实施方式中,片段或突变体保留相应野生型多肽的至少约75%、至少约80%、至少约90%、至少约95%或至少约98%或更多的生物学功能。在其他实施方式中,片段或突变体保留相应野生型多肽的约100%的生物学功能。确定何种氨基酸可以被置换、插入或删除而不影响生物学活性的指南可使用本领域熟知的计算机程序找到,例如LASERGENETM软件(DNASTAR,Inc.,Madison,WI)。
在其他实施方式中,片段或突变体具有“增加的活性水平”。通过“增加的活性水平”指的是相同条件下,与相应野生型宿主细胞中的生物化学或生物学功能的水平相比,多肽在基因工程化的细胞中具有更高水平的生物化学或生物学功能(例如DNA结合或酶活性)。活性增强程度可以为约10%或更高、约20%或更高、约50%或更高、约75%或更高、约100%或更高、约200%或更高、约500%或更高、约1000%或更高,或为本文的任何范围。
在一些实施方式中,具有改变或修饰的表达水平的多肽或多核苷酸是“过表达的”或具有“增加的表达水平”。如本文所使用的,“过表达”或具有“增加的表达水平”指的是在相同条件下,以比相应野生型细胞中正常表达更高的浓度在基因工程化的细胞中表达或引起表达多核苷酸或多肽。例如,在相同条件下,当多肽在基因工程化的细胞中存在浓度比相同物种非工程改造宿主细胞中的浓度更高时,该多肽可在基因工程化细胞中“过表达”。
在其他实施方式中,具有改变的表达水平的多肽或多核苷酸是“弱化的”或具有“降低的表达水平”。如本文所使用的,“弱化”或“降低的表达水平”指的是在相同条件下,比相应野生型细胞中正常表达更低的浓度在基因工程化的细胞中表达或引起表达多核苷酸或多肽。
过表达或弱化的程度可为1.5-倍或更高、例如2-倍或更高、3-倍或更高、5-倍或更高、10-倍或更高、或者15-倍或更高。备选地或此外地,过表达或弱化的程度可为500-倍或更低、例如,100-倍或更低、50-倍或更低、25-倍或更低、或者20-倍或更低。因此,过表达或弱化的程度介于以上任意两个端点之内。例如,过表达或弱化的程度可以为1.5-500倍、2-50倍、10-25倍或15-20倍。
多核苷酸或多肽可使用本领域已知的方法进行弱化。在一些实施方式中,基因或由基因编码的多肽的表达通过突变控制基因表达的调节性多核苷酸序列而得到弱化。在其他实施方式中,基因或由基因编码的多肽的表达通过过表达抑制子蛋白质或通过提供激活抑制子蛋白质的外源调节元件而弱化。在其他实施方式中,基于DNA或RNA的基因沉默方法被用于弱化基因或多核苷酸的表达。在一些实施方式中,基因或多肽的表达受到完全的弱化,例如通过删除基因多核苷酸序列的全部或一部分。
多核苷酸或多肽可使用本领域已知方法进行过表达。在一些实施方式中,多肽的过表达是通过使用外源调节元件实现的。术语“外源调节元件”通常指的是源自宿主细胞以外的调节元件。然而,在特定实施方式中,术语“外源调节元件”可以指代来源于宿主细胞的调节元件,其功能可得到复制或改变以用于控制内源多肽表达的目的。例如,如果重组微生物体为大肠杆菌细胞,其包含编码脂肪酸生物合成多肽的核酸序列,且所述脂肪酸生物合成多肽是由内源fadR基因编码的FadR,则内源fadR的表达可由来源于另一种大肠杆菌基因的启动子控制。
在一些实施方式中,外源调节元件是化学化合物如小分子。如本文所使用的,术语“小分子”指的是分子量小于约1,000g/mol的物质或化合物。
在一些实施方式中,控制核酸序列表达的外源调节元件是表达控制序列,其可操作地连接于所述核酸序列。表达控制序列在本领域中已知,并且包括例如启动子、增强子、多聚腺苷酸化信号、转录终止子、内部核糖体进入位点(IRES)、核糖体结合位点(RBS)等等,其在宿主细胞中提供了核酸序列的表达。表达控制序列与参与转录的细胞蛋白质特异性地相互作用(Maniatis等人(1987)Science 236:1237-1245)。示例性表达控制序列描述于例如Goeddel,Gene Expression Technology:Methods in Enzymology,Vol.185,AcademicPress,San Diego,Calif.(1990)中。
通过“可操作地连接”指的是核酸序列和表达控制序列以这样的方式相连,使得恰当的分子(例如转录激活子蛋白质)结合于表达控制序列时则允许基因表达进行。可操作地连接的启动子相对于转录和翻译的方向位于所选核酸序列上游。可操作地连接的增强子可位于所选核酸序列的上游、内部或下游。
在一些实施方式中,通过重组载体向宿主细胞提供所述核酸序列,所诉重组载体包含可操作地连接于多核苷酸序列的启动子。在特定实施方式中,启动子为可诱导的、组成型的或细胞器特异性的启动子。在特定实施方式中,使用本领域已知方法将表达控制序列用同源重组方式整合入宿主细胞基因组,而将所述表达控制序列可操作地连接于内源核酸序列(例如,Datsenko等人(2000)Proc.Natl.Acad.Sci.U.S.A.97(12):6640-6645)。
如本文所使用的,术语“载体”指的是能够转运与之相连的其他核酸序列的核酸分子。一种有用的载体类型为附加体(即,能够进行染色体外复制的核酸)。可用的载体为能够使得其连接的核酸进行自主复制和/或表达的载体。能够指导与其可操作地连接的基因表达的载体在本文称为“表达载体”。通常,在重组DNA技术中有用的表达载体常常为“质粒”形式,其通常指环状双链DNA环,其为载体形式是不结合于染色体。然而,还包括其他形式的表达载体,其起到等价的功能并随后在本领域为人所知。
在一些实施方式中,重组载体包含至少一条选自以下的序列:(a)可操作地偶联于核酸序列的表达控制序列;(b)可操作地偶联于核酸序列的选择标记物;以及(c)可操作地偶联于核酸序列的靶向序列。
本领域技术人员清楚的是,表达载体的设计可取决于这些因素,如代转化宿主细胞的选择、期望的多肽表达水平等等。本文描述的表达载体可被引入宿主细胞以产生由本文描述的多核苷酸序列编码的多肽,包括融合多肽。
用于原核和真核细胞的合适的表达系统在本领域熟知;见例如Sambrook等人,“Molecular Cloning:A Laboratory Manual,”第二版,Cold Spring Harbor Laboratory(1989)。可诱导的非融合大肠杆菌载体的实例包括pTrc(Amann等人(1988)Gene 69:301-315)和PET11d(Studier等人,Gene Expression Technology:Methods in Enzymology185,Academic Press,San Diego,CA,pp.60-89(1990))。在特定实施方式中,本发明公开的多核苷酸序列可操作地连接于来源于细菌噬菌体T5的启动子。用于在酵母中进行表达的载体的实例包括pYepSec1(Baldari等人(1987)EMBO J.6:229-234)、pMFa(Kurjan等人(1982)Cell 30:933-943)、pJRY88(Schultz等人(1987)Gene 54:113-123)、pYES2(InvitrogenCorp.,San Diego,CA)和picZ(Invitrogen Corp.,San Diego,CA)。
可经由常规转化或转染技术将载体引入原核或真核细胞中。如本文所使用的,术语“转化”和“转染”指代用于将外部核酸(例如DNA)引入宿主细胞的广泛的本领域认可的技术,包括磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导的转染、脂质体转染或电穿孔。用于转化或转染宿主细胞的合适方法以及筛选摄取载体的细胞的方法可见于例如Sambrook等人(同上)。
“重组微生物体”是用于生产本文描述的产物(例如脂肪酰胺)的宿主细胞。重组微生物体在本文也称为“重组宿主细胞”、“基因工程化的生物体”或“基因工程化的宿主细胞”,是这样的宿主细胞,其中在相同条件下,一种或多种核酸或多肽的表达相比于其在对应的野生型宿主细胞中的表达得到改变或修饰。在本文描述的公开的任意方面,所述宿主细胞可包括但不限于细菌细胞、蓝细菌细胞、藻类细胞和真菌细胞(包括丝状真菌细胞或酵母细胞)。
在一些实施方式中,宿主细胞为革兰氏阳性细菌细胞。在其他实施方式中,宿主细胞为革兰氏阴性细菌细胞。
在一些实施方式中、宿主细胞选自以下属:埃希氏菌属(Escherichia)、芽孢杆菌属(Bacillus)、乳酸杆菌属(Lactobacillus)、红球菌属(Rhodococcus)、假单胞菌属(Pseudomonas)、曲霉属(Aspergillus)、木霉属(Trichoderma)、脉抱菌属(Neurospora)、镰刀菌属(Fusarium)、腐质霉属(Humicola)、根毛霉属(Rhizomucor)、克鲁维酵母菌属(Kluyveromyces)、毕赤酵母属(Pichia)、毛霉属(Mucor)、蚀丝霉属(Myceliophtora)、青霉属(Penicillium)、平革菌属(Phanerochaete)、侧耳属(Pleurotus)、栓菌属(Trametes)、金黄孢子菌属(Chrysosporium)、酵母属(Saccharomyces)、寡养单胞菌属(Stenotrophamonas)、裂殖酵母属(Schizosaccharomyces)、聚球藻属(Synechococcus)、耶氏酵母属(Yarrowia)或链霉菌属(Streptomyces)。
在特定实施方式中,宿主细胞为酿酒酵母、解脂假丝酵母、大肠埃希氏菌、节杆菌、红酵母、不动杆菌、解脂假丝酵母、布朗葡萄藻、弗尼斯弧菌、藤黄微球菌、嗜麦芽寡养单胞菌、枯草芽孢杆菌,地衣芽孢杆菌、恶臭假单胞菌、荧光假单胞菌、天蓝色链霉菌、桑椹型无绿藻、克鲁格尼原藻、大型无绿藻、中型无绿藻或原壳小球藻细胞。
在一些实施方式中,宿主细胞为节杆菌AK 19、不动杆菌属物种M-1株、大肠杆菌B、大肠杆菌C、大肠杆菌K或大肠杆菌W细胞。
在其他实施方式中,宿主细胞为迟缓芽孢杆菌(Bacillus lentus)细胞、短芽孢杆菌(Bacillus brevis)细胞、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)细胞、地衣芽孢杆菌(Bacillus lichen formis)细胞、嗜碱芽孢杆菌(Bacillus alkalophilus)细胞、凝结芽孢杆菌(Bacillus coagulans)细胞、环状芽孢杆菌(Bacillus circulans)细胞、短小芽孢杆菌(Bacillus pumilis)细胞、苏云金芽孢杆菌(Bacillus thuringiensis)细胞、克劳氏芽孢杆菌(Bacillus clausii)细胞、巨大芽孢杆菌(Bacillus megaterium)细胞或解淀粉芽孢杆菌(Bacillus amyloliquefaciens)细胞。
在其他实施方式中,宿主细胞为康氏木霉(Trichoderma koningii)细胞、绿色木霉(Trichoderma viride)细胞、里氏木霉(Trichoderma reesei)细胞、长枝木霉(Trichoderma longibrachiatum)细胞、泡盛曲霉(Aspergillus awamori)细胞、烟曲霉(Aspergillus fumigates)细胞、臭曲霉(Aspergillus foetidus)细胞、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)细胞、米曲霉(Aspergillusoryzae)细胞、特异腐质霉(Humicola insolens)细胞、棉毛状腐质霉(Humicolalanuginose)细胞、混浊红球菌(Rhodococcus opacus)细胞、米黑根毛霉(Rhizomucormiehei)细胞或米黑毛霉(Mucor michei)细胞。
在其他实施方式中,宿主细胞为浅青紫链霉菌(Streptomyces lividans)细胞或鼠灰链霉菌(Streptomyces murinus)细胞。
在其他实施方式中,所述宿主细胞是放线菌属(Actinomycetes)细胞。
在其他实施方式中,宿主细胞来自真核植物、藻类、蓝细菌、绿色硫细菌、绿色非硫细菌、紫色硫细菌、紫非硫细菌、嗜极生物、酵母、真菌、以上的基因工程化的生物或合成生物体的细胞。在一些实施方式中,所述宿主细胞是光依赖性的或固定碳。在一些实施方式中,所述宿主细胞具有自养活性。在一些实施方式中,所述宿主细胞具有光合自养活性,例如在存在光的情况下。在一些实施方式中,所述宿主细胞在不存在光的情况下是异养或兼养的。在特定实施方式中,所述宿主细胞是来自拟南芥(Avabidopsis thaliana)、柳枝稷(Panicum virgatum)、巨芒(Miscanthus giganteus)、玉米(Zea mays)、莱茵衣藻(Chlamydomonas reinhardtii)、杜氏盐藻(Dunaliela salina)、聚球蓝细菌属物种(Synechococcus Sp.)PCC 7002、聚球蓝细菌属物种PCC7942、集胞藻属物种(Synechocystis Sp.)PCC 6803、长嗜热聚球蓝细菌(Thermosynechococcus elongates)BP-1、绿硫细菌(Chlorobium tapidum)、橙色绿屈挠菌(Chlorojlexus auranticus)、酒色着色菌(Chromatiumm vinosum)、深红红螺菌(Rhodospirillum rubrum)、荚膜红细菌(Rhodobacter capsulatus)、沼泽红假单胞菌(Rhodopseudomonas palusris)、杨氏梭菌(Clostridium ljungdahlii)、热纤梭菌(Clostridiuthermocellum)、产黄青霉(Penicillium chrysogenum)、巴斯德毕赤酵母(Pichia pastoris)、粟酒裂殖酵母(Schizosaccharomyces pombe)、萤光假单孢菌(Pseudomonas fluorescens)或运动发酵单胞菌(Zymomonas mobilis)的细胞。
如本文所使用的,术语“允许生产的条件”指的是任何允许宿主细胞生产所期望产物的条件,如脂肪酰胺。类似地,术语“适合表达的条件”指的是任何允许宿主细胞合成多肽的条件。合适的条件包括例如发酵条件。发酵条件可包含很多参数,如温度范围、通风水平及基质组成。这些条件中的每项都分别或组合起来允许宿主细胞生长。示例性培养基包括培养液或凝胶。通常,基质包括能够直接被宿主细胞代谢的碳源。此外,可在基质中使用酶以促进碳源的动员(例如淀粉或纤维素解聚成可发酵糖类)及随后的代谢。
如本文所使用的,词语“碳源”指的是适合用作原核或简单真核细胞生长的碳来源的底物或化合物。碳源可以是不同形式的,包括但不限于聚合物、碳水化合物、酸、醇、醛、酮、氨基酸、肽和气体(例如CO和CO2)。示例性的碳源包括但不限于单糖,例如葡萄糖、果糖、甘露糖、半乳糖、木糖和阿拉伯糖;寡糖,例如低聚果糖和低聚半乳糖;多糖,例如淀粉、果胶和木聚糖;二糖,例如蔗糖、麦芽糖和松二糖;纤维素材料及其变体,例如甲基纤维素和羧甲基纤维素钠;饱和或不饱和脂肪酸酯,琥珀酸酯、乳酸酯和醋酸酯;醇,例如乙醇、甲醇、甘油或其混合物。碳源还可以是光合作用的产物,例如葡萄糖。在特定优选的实施方式中,碳源是生物质。在其他优选的实施方式中,碳源为葡萄糖。
术语“生物质”是指碳源所来源于的任何生物材料。在一些实施方式中,生物质被加工成适合于生物转化的碳源。在其它的情况下,所述生物质可以不需要被进一步加工成碳源。碳源可以被转化为生物燃料。生物质的一个示例性来源是植物物质或蔬菜,例如,玉米、甘蔗或柳枝稷可以用作生物质。生物质的另一示例性实例是代谢废物,例如动物物质(例如牛粪)。其他示例性生物质来源包括藻类或其它海洋植物。生物质还包括来自工业、农业、林业和家庭的废品,包括但不限于发酵废渣、青贮饲料、秸秆、无用杂物、污水、垃圾、含纤维素的城市废物和剩余食物和甘油。生物质还包括例如碳水化合物(例如单糖、二糖或多糖)的碳源。术语“生物质”还可指代碳的来源如碳水化合物(例如单糖、二糖或多糖)。
为确定条件是否足以允许产物的生产或多肽的表达,可将宿主细胞培养约4、8、12、24、36、48、72或更多小时。在培养中和/或培养后,可获得样品并进行分析以确定这些条件是否允许生产或表达。例如,可测试样品或宿主细胞生长的基质中的宿主细胞中是否存在期望的产物。当测试脂肪酰胺的存在情况时,可使用测定法例如但不限于,MS、薄层层析色谱(TLC)、高效液相色谱(HPLC)、液相色谱(LC)、偶联有火焰离子化检测器(FID)的GC、GC-MS及LC-MS。当测试多肽的表达情况时,可使用技术例如但不限于,Western印迹和点杂交法。
在本发明的方法中,可通过优化发酵条件增强脂肪酰胺的生产和分离。在一些实施方式中,优化发酵条件以增加被转化为烃类产物的碳源百分比。在正常的细胞生命周期中,碳被用于细胞功能如生产脂质、糖类、蛋白质、有机酸和核酸。减少生长相关的活动所需要的碳的量可以增加碳源转化为产物的效率。这一点可以通过例如先将宿主细胞培养到期望的密度(例如生长对数期峰值达到的密度)而实现。在这一点上,可以使用复制检查点基因阻止细胞生长。具体而言,群体感应机制(quorum sensing mechanisms)可以用于激活例如p53、p21的检查点基因或其他检查点基因(总数与Camilli等人(2006)Science 311:1113;Venturi(2006)FEMS Microbiol.Rev.30:274-291;及Reading等人(2006)FEMSMicrobiol.Lett.254:1-11)。
可以被激活以阻止大肠杆菌中细胞复制和生长的基因包括umuDC基因。umuDC基因的过表达阻止从静止期到指数性生长的进展(Murli等人(2000)J.Bacteriol.182:1127-1135)。UmuC是可以对非编码损伤进行跨损伤合成(translesion synthesis)的DNA聚合酶,所述非编码损伤通常是由于紫外线(UV)和化学诱变造成的。umuDC基因产物参与跨损伤合成的过程并且还作为DNA序列损伤检查点。umuDC基因产物包括UmuC、UmuD、umuD’、UmuD’2C、UmuD’2和UmuD2。同时,可以激活产物生产基因,从而在产生脂肪酰胺或其中间产物时对待使用的复制及维持途径的需要最小化。通过umuC和umuD与合适的终产物生产基因的从头合成,可以对宿主细胞进行基因工程化,使其在大肠杆菌中由prpBCDE启动子系统下的pBAD24表达umuC和umuD。
可以将宿主细胞另外地进行基因工程化以表达重组纤维小体,这些纤维小体可以允许宿主细胞使用纤维素原料作为碳源。用于本发明公开方法的示例性纤维小体包括例如在国际专利申请出版号WO2008/100251中描述的纤维小体。还可根据美国专利号5,000,000、5,028,539、5,424,202、5,482,846和5,602,030中描述方法的对宿主细胞进行基因工程化,以有效地同化碳并使用纤维素材料作为碳源。此外,宿主细胞可经基因工程化以表达转化酶,使得使用蔗糖作为碳源。
在本发明公开发酵方法的一些实施方式中,发酵室可以将正在进行连续还原的发酵封闭,由此创造稳定的还原环境。通过(气体形式的)二氧化碳的释放可以保持电子平衡。提高NAD/H和NADP/H平衡的努力也可以有利于稳定电子平衡。通过将宿主细胞进行基因工程化以表达NADH:NADPH转氢酶,也可以增强细胞内NADPH的可用性。一种或多种NADH:NADPH转氢酶的表达将糖酵解中产生的NADH转变为NADPH,后者可以增强脂肪酰胺及其中间产物的产生。
对于小规模生产,可以使基因工程化的宿主细胞以例如约100mL、500mL、1L、2L、5L或10L的规模进行批量生长;进行发酵;并诱导其表达期望的核酸序列,如编码PPS的核酸序列。对于大规模生产,可以使基因工程化的宿主细胞以约10L、100L、1000L、10,000L、100,000L、1,000,000L或更大的规模进行批量生长;进行发酵;并诱导其表达期望的核酸序列。
由本发明公开方法产生的脂肪酰胺通常被从宿主细胞中分离。如本文所使用的,术语“分离的”对于产物如脂肪酰胺而言,指的是与细胞组分、细胞培养基或化学或合成前体中分开的产物。由本文描述的方法产生的脂肪酰胺可能在发酵液和细胞质中相对不互溶。因此,可在细胞内或细胞外地在有机相中收集脂肪酰胺及其衍生物。在有机相中收集产物可减少脂肪酰胺对细胞功能的影响,因此可允许宿主细胞生产更多的产物。
在一些实施方式中,对由本发明公开的方法生产的脂肪酰胺进行纯化。如本文所使用的,术语“纯化”、“纯化的”或“进行纯化”指的是通过例如分离或分开从分子的环境中移出或分离所述分子。“基本上纯化的”分子为至少约60%(例如至少约70%、至少约75%、至少约85%、至少约90%、至少约95%、至少约97%、至少约99%)不含与其相关的其他组分。如本文所使用的,这些术语还指从样品中去除污染物。例如,污染物的去除可以导致样品中脂肪醇的百分比增加。例如,当在宿主细胞中产生脂肪酰胺时,可以通过去除宿主细胞蛋白纯化脂肪酰胺。纯化后,样品中脂肪酰胺的百分比增加。
如本文所使用的,术语“纯化”、“纯化的”或“进行纯化”不需要绝对纯。因此,例如当在宿主细胞中产生脂肪酰胺时,纯化的脂肪酰胺是基本与其他细胞组分(例如核酸、多肽、脂质、碳水化合物或其他烃类)分离的脂肪酰胺。
此外,纯化的脂肪酰胺制备物是其中脂肪酰胺基本不含污染物(例如发酵后可能存在的那些污染物)的脂肪酰胺制备物。在一些实施方式中,当样品重量的至少约50%是由脂肪酰胺组成时,所述脂肪酰胺是纯化的。在其他实施方式中,当样品重量的至少约60%,例如至少约70%、至少约80%、至少约85%、至少约90%、至少约92%是由脂肪酰胺组成时,所述脂肪酰胺是纯化的。备选地或此外地,当样品重量中低于约100%,例如低于约99%、低于约98%、低于约95%、低于约90%、低于约80%是由脂肪酰胺组成时,所述脂肪酰胺是纯化的。因此,纯化的脂肪酰胺的纯化水平介于以上任意两个端点之内。例如,当样品的至少约80%-95%、至少约85%-99%、或至少约90%-98%由脂肪酰胺组成时,所述脂肪酰胺是纯化的。
脂肪酰胺可存在于细胞外环境中,或可分离自宿主细胞的细胞外环境。在特定实施方式中,脂肪酰胺是从所述宿主细胞分泌的。在其他实施方式中,脂肪酰胺被转运入细胞外环境中。在其它的实施方式中,脂肪酰胺是被动转运入细胞外环境中。可使用本领域已知的方法从宿主细胞中分离脂肪酰胺,如在国际专利申请公开WO 2010/042664和WO2010/062480中公开的那些方法。
本文描述的方法可产生均一的化合物,其中至少约60%、至少约70%、至少约80%、至少约90%、或至少约95%的所产生的脂肪酰胺具有的脂肪链差异低于6个碳、低于5个碳、低于4个碳、低于3个碳或低于2个碳。备选地或此外地,本文描述的方法产生均一的化合物,其中低于约98%、低于约95%、低于约90%、低于约80%或低于约70%的所产生的脂肪酰胺具有的脂肪链差异低于6个碳、低于5个碳、低于4个碳、低于3个碳或低于2个碳。因此,脂肪酰胺具有均一度介于以上任意两个端点之内。例如,脂肪酰胺具有这样的均一度,其中约70%-95%、约80%-98%或约90%-95%的所产生的脂肪酰胺具有的脂肪链的差异低于6个碳、低于5个碳、低于4个碳、低于3个碳或低于2个碳。这些化合物还可在产生时具有相对统一的饱和度。
作为本发明方法的结果,基因工程化以包含编码催化伯胺和酰基硫酯转化为脂肪酰胺的多肽的核酸序列的重组微生物体产生的脂肪酰胺的效价、产率或生产率中的一项或多项相对于对应地野生型微生物体有所提高。
术语“效价”指的是每单位体积的宿主细胞培养物产生的脂肪酰胺的量。在本文描述的组合物和方法的任何方面,脂肪酰胺以25mg/L或更多、50mg/L或更多、75mg/L或更多、100mg/L或更多、125mg/L或更多、150mg/L或更多、175mg/L或更多、200mg/L或更多、250mg/L或更多、300mg/L或更多、350mg/L或更多、400mg/L或更多、450mg/L或更多、500mg/L或更多、600mg/L或更多、700mg/L或更多、800mg/L或更多、900mg/L或更多或1000mg/L或更多的效价生产。备选地或此外地,脂肪酰胺以2000mg/L或更少、1900mg/L或更少、1800mg/L或更少、1700mg/L或更少、1600mg/L或更少、1500mg/L或更少、1400mg/L或更少、1300mg/L或更少、1200mg/L或更少、1100mg/L或更少、1000mg/L或更少、900mg/L或更少、800mg/L或更少、700mg/L或更少、600mg/L或更少、500mg/L或更少、400mg/L或更少、300mg/L或更少或200mg/L或更少的效价生产。因此,脂肪酰胺以介于以上任意两个端点之内的效价生产。例如,脂肪酰胺以150-1000mg/L、200-500mg/L、500-1500mg/L或300-1300mg/L的效价生产。在其他实施方式中,脂肪酰胺以高于2000mg/L、高于5000mg/L、高于10,000mg/L或更高,例如50g/L、70g/L、100g/L、120g/L、150g/L或200g/L的效价生产。
术语“产率”指的是宿主细胞中输入碳源转化为产品(即脂肪酰胺)的效率。对于含氧碳源(例如葡萄糖和其他碳水化合物基来源),氧必须以二氧化碳形式释放。因此,对于每两个释放的氧原子,也有一个碳原子被释放,导致最大理论代谢效率为大约34%(w/w)(对于脂肪酸衍生物产物)。然而这一数值在对于其他有机化合物和碳源会变化。文献报道的典型的产率大约低于5%。根据本发明公开的方法基因工程化以生产脂肪酰胺的宿主细胞具有的产率为约3%或更多、约5%或更多、约10%或更多、约15%或更多、约18%或更多、或约20%或更多。备选地或此外地,产率为约30%或更少、约27%或更少、约25%或更少、约22%或更少、约20%或更少、约17%或更少、约13%或更少、或者约10%或更少。因此,产率介于以上任意两个端点之内。例如,由本发明公开的重组微生物体生产的脂肪酰胺的产率可以为约5%至约25%、约10%至约25%、约10%至约22%、约15%至约27%,或约18%至约22%。在其他实施方式中,产率高于30%。
术语“生产率”指的是每单位体积的宿主细胞培养物每单位密度宿主细胞培养物生产的脂肪酰胺的量。在本文描述的组合物和方法的任何方面,由重组微生物体生产的脂肪酰胺的生产率为约3mg/L/OD600或更多、约6mg/L/OD600或更多、约9mg/L/OD600或更多、约12mg/L/OD600或更多、约15mg/L/OD600或更多、约18mg/L/OD600或更多、或者约20mg/L/OD600或更多。备选地或此外地,所述生产率为约50mg/L/OD600或更少、约40mg/L/OD600或更少、约30mg/L/OD600或更少、约25mg/L/OD600或更少、约20mg/L/OD600或更少、约17mg/L/OD600或更少、或者约10mg/L/OD600或更少。因此,生产率介于以上任意两个端点之内。例如,所述生产率可以为约3至约30mg/L/OD600、约6至约20mg/L/OD600或约15至约30mg/L/OD600
本发明公开还提供了通过本文描述的重组微生物体和方法生产的脂肪酰胺。可基于双重碳同位素指纹法或14C定年法,将本文描述的重组微生物体和方法生产的生物产品(例如脂肪酰胺)与衍生自石油化学碳的有机化合物区分开来。此外,可通过双重碳同位素指纹法确定生物来源的碳的特定来源(例如葡萄糖对甘油)(见例如,美国专利7,169,588)。
在商业中,区别生物产品与基于石油的有机化合物的能力在追踪这些材料方面是有益的。例如,包含生物学基的和石油基的碳同位素谱二者的有机化合物或化学品可以区别于仅由石油基材料制成的有机化合物和化学品。因此,在商业中,可以基于根据本发明的方法制备的脂肪酰胺的独特的碳同位素谱来追踪它们。
可通过比较每种燃料中稳定的碳同位素比(13C/12C)将生物产品与石油基的有机化合物区分开。给定的生物产物中的13C/12C比是大气中二氧化碳中二氧化碳被固定时的13C/12C比的结果。其还反映了准确的代谢途径。区域性差异也会发生。石油、C3植物(阔叶植物)、C4植物(草本植物)和海洋碳酸盐类在13C/12C和相应的δ13C值中都显示了显著的差异。进一步地,由于代谢途径的原因,C3和C4植物的脂物质的分析情况与衍生自相同植物的碳水化合物组分的材料不同。
13C测量尺度最初由Pee Dee Belemnite(PDB)石灰石的零集所定义,其中给出的值是与该材料的偏差的千分比。“δ13C”值被表达为千分比(每密耳),缩写为‰,并且按下式计算:
δ13C(‰)=[(13C/12C)样品-(13C/12C)标准品]/(13C/12C)标准品x 1000
在一些实施方式中,根据本发明公开的方法产生的脂肪酰胺的δ13C值为-30或更高、约-28或更高、约-27或更高、约-20或更高、约-18或更高、约-15或更高、约-13或更高、约-10或更高。备选地或此外地,脂肪酰胺具有的δ13C值为-4或更低、约-5或更低、约-8或更低、约-10或更低、约-13或更低、约-15或更低、约-18或更低、或约-20或更低。因此,脂肪酰胺具有的δ13C值介于以上任意两个端点之内。例如,所述脂肪酰胺具有的δ13C值为约-30至约-15、约-27至约-19、约-25至约-21、约-15至约-5、约-13至约-7、或者约-13至约-10。在一些实施方式中,所述脂肪酰胺可具有δ13C为约-10、-11、-12或-12.3。在其他实施方式中,所述脂肪酰胺具有δ13C为约-15.4或更高。在其他实施方式中,所述脂肪酰胺具有δ13C为约-15.4至约-10.9,或者δ13C值为约-13.92至约-13.84。
也可以通过比较每种化合物中14C的量,将生物产品区别于石油基有机化合物。因为14C具有5730年的核半衰期,所以可以将包含“较老的”碳的石油基的燃料与包含“较新的”碳的生物产品区分开来(见例如,Currie,“Source Apportionment of AtmosphericParticles”,Characterization of Environmental Particles,J.Buffle and H.P.vanLeeuwen,Eds.,Vol.I of the IUPAC Environmental Analytical Chemistry Series,Lewis Publishers,Inc.,pp.3-74(1992))。
可以通过加速器质谱(AMS)测量14C,给出的结果以“现代碳比例”(fM)为单位。fM是由国家标准与技术协会(NIST)标准参照物质(SRM)4990B和4990C所定义的。本文使用的“现代碳级分”或fM具有按照国家标准与技术协会(NIST)标准参照物质(SRM)4990B和4990C定义的相同意义,分别被称为草酸标准品HOxI和HOxII。基本的定义涉及0.95乘以14C/12C同位素比HOxI(参考AD 1950)。这粗略地等于衰变校正的工业革命前树木(decay-correctedpre-Industrial Revolution wood)。对于目前的生活生物圈(植物材料)而言,fM大约为1.1。
在一些实施方式中,根据本发明公开产生的脂肪酰胺具有的fM 14C为至少约1,例如为至少约1.003、至少约1.01、至少约1.04、至少约1.111、至少约1.18或至少约1.124。备选地或此外地,脂肪酰胺具有的fM 14C为约1.130或更低,例如约1.124或更低、约1.18或更低、约1.111或更低、或者约1.04或更低。因此,所述脂肪酰胺具有的fM 14C介于以上任意两个端点之内。例如,所述脂肪酰胺具有的fM 14C为约1.003至约1.124,具有的fM 14C为约1.04至约1.18或者具有的fM 14C为约1.111至约1.124。
已知14C的另一种量度为现代碳的百分率,即pMC。对于使用14C年代的考古学家或地质学家,AD 1950等于“旧的零年”。这还代表100pMC。在1963年热核武器的顶峰,大气中的“炸弹碳”达到正常水平的几乎两倍。“炸弹碳”在大气中的分布自其出现以来是近似的,对于自从AD 1950生活的植物和动物表现出大于100pMC的值。随着时间的流失,该值逐渐降低,当今的值是接近107.5pMC。这意味着诸如玉米的新生物质材料将给出接近107.5pMC的14C特征值。石油基的化合物将具有零的pMC值。化石碳与现代碳的组合导致现代pMC含量的稀释。通过假定107.5pMC代表现代生物质材料的14C含量并且0pMC代表石油基的产品的14C含量,该材料所测量的pMC值将反映两种类型的成分的比例。例如,100%来源于现代大豆的材料应当给出接近107.5pMC的放射性碳标记。若用石油基产品将该材料稀释50%,它应当给出约54pMC的放射性碳特征值。
通过将107.5pMC指定为“100%"并且将0pMC指定为“0%”而衍生得到生物学基的碳含量。例如,测量为99pMC的样品会给出93%的等同的生物学基的碳含量。该值被称为基于生物学的平均碳结果并且假定在所分析的材料之内全部组分起源于现代的生物材料或石油基材料。
在一些实施方式中,根据本发明公开的方法产生的脂肪酰胺具有的pMC为至少约50、至少约60、至少约70、至少约75、至少约80、至少约85、至少约90、至少约95、至少约96、至少约97或至少约98。备选地或此外地,所述脂肪酰胺具有的pMC为约108或更低、约105或更低、约102或更低、约99或更低、约96或更低、约93或更低、约90或更低、约85或更低、或者约80或更低。因此,所述脂肪酰胺具有的pMC介于以上任意两个端点之内。例如,所述脂肪酰胺具有的pMC可以为约50至约100;约60至约105;约70至约100;约80至约105;约85至约100;约87至约98;或者约90至约95。在其他实施方式中,本文描述的脂肪酰胺具有的pMC为约90、约91、约92、约93、约94或约94.2。
通过本文描述的任何重组微生物体和方法产生的脂肪酰胺本身可直接用作表面活性剂或去污剂,或者所述脂肪酰胺可配制成个人、宠物或居家清洁组合物。表面活性剂、去污剂和清洁组合物及其生产方法为本领域技术人员熟知,在美国专利申请公开2011/0206630中有更详细的描述,其以全文通过引用并入本文。
因此,本发明公开提供了包含本文描述的任何方法产生的表面活性剂、去污剂和清洁组合物。本领域一般技术人员会清楚的是,取决于所述表面活性剂、去污剂和清洁组合物的预期目的,可生产并使用不同的脂肪酰胺。例如,当本文描述的脂肪酰胺被用作表面活性剂或去污剂生产的原料时,本领域一般技术人员会清楚所述脂肪酰胺原料的特性会影响所生产的表面活性剂或去污剂组合物的特性。由此,可通过生产特定的脂肪酰胺用作原料而选择所述表面活性剂或去污剂组合物的特性。
可将本发明公开的脂肪酰胺基的表面活性剂或去污剂与本领域熟知的其他表面活性剂和/或去污剂混合。混合物中脂肪酰胺的存在量可以为混合物总重量的10重量%(wt.%)或更多、15wt.%或更多、20wt.%或更多、30wt.%或更多、40wt.%或更多、50wt.%或更多、60wt.%或更多、或者70wt.%或更多。备选地或此外地,脂肪酰胺在混合物中存在量为混合物总重量的95wt.%或更少、90wt.%或更少、80wt.%或更少、70wt.%或更少、60wt.%或更少、50wt.%或更少、或者40wt.%或更少。因此,混合物中脂肪酰胺的存在量介于以上任意两个端点之内。例如,混合物中所述脂肪酰胺的存在量为15-40%、30-90%、50-95%或40-50%。
脂肪酰胺基的表面活性剂可被配制为清洁组合物,其赋予清洁组合物去垢性和清洁力。清洁组合物中脂肪酰胺的存在量可以为所述清洁组合物按总重量计的0.001wt.%或更多、0.1wt.%或更多、1wt.%或更多、10wt.%或更多、20wt.%或更多、或者40wt.%或更多。备选地或此外地,清洁组合物中脂肪酰胺的存在量为所述清洁组合物按总重量计的60wt.%或更少、50wt.%或更少、40wt.%或更少、30wt.%或更少、15wt.%或更少、或者5wt.%或更少。因此,清洁组合物中脂肪酰胺的存在量介于以上任意两个端点之内。例如,所述脂肪酰胺以0.1-10wt.%、10-15wt.%、20-40wt.%或0.001-5wt.%的量被配制成清洁组合物。
本发明公开的清洁组合物可以为固体形式如片剂、粒剂、粉末或压块。所述清洁组合物还可以是液体形式如流体、凝胶、膏状或浓缩物。
在特定实施方式中,本发明公开的清洁组合物为液体或固体的洗衣去污剂组合物。在一些实施方式中,所述清洁组合物为硬质表面的清洁组合物,其中所述硬质表面清洁组合物优选地浸透于非织造底物中。如本文所使用的,“浸透”指的是所述硬质表面清洁组合物被置于与非织造底物接触,使得所述非织造底物中至少一部分被所述硬质表面清洁组合物渗透。例如,所述硬质表面清洁组合物优选地浸透非织造底物。在其他实施方式中,本发明公开的清洁组合物为汽车护理组合物,其用于清洁多种表面如硬木、瓷砖、陶瓷、塑料、皮革、金属和/或玻璃。在一些实施方式中,所述清洁组合物为餐具洗涤组合物,例如液体手洗餐具洗涤组合物、固体自动餐具洗涤组合物、液体自动餐具洗涤组合物及按压/单位剂量形式的自动餐具洗涤组合物。
在其他实施方式中,清洁组合物可用于工业环境中以清洁多种设备和机器,以及用于石油钻井作业。例如,本发明公开的清洁组合物尤其适用于其中涉及接触游离的硬度离子(free hardness)的环境,并且适合于要求有硬水耐受的表面活性剂系统的组合物,如当其用于帮助石油钻井时。
在一些实施方式中,可将通过本文描述的任何重组微生物体和方法产生的脂肪酰胺配制成个人或宠物护理组合物,如香波、沐浴露、洁面乳、或者液体或固体皂。
含有通过本文描述的任何重组微生物体和方法产生的脂肪酰胺的清洁组合物包含本领域技术人员熟知的其他清洁添加剂。适用于大多数清洁组合物的通用清洁添加剂包括家居清洁组合物、个人护理组合物,诸如此类,包括溶剂、助溶剂、载体、整理剂、酶、多聚物、增泡剂、抑泡剂(消泡剂)、染料、填充剂、杀菌剂、助水溶剂、抗氧化剂、香水、香水前料、酶稳定剂、色素,诸如此类。在一些实施方式中,所述清洁组合物为液体清洁组合物,其中所述组合物包含选自溶剂、螯合试剂、分散剂和水中的一种或多种。在其他实施方式中,所述清洁组合物为固体,其中组合物进一步包含例如无机盐填充剂。无机盐填充剂是固体清洁组合物的常规成分,以基本的量存在,所述量可在例如约10wt.%至约35wt.%之间变动。合适的填充剂盐包括例如硫酸和氯的碱盐或碱土金属盐。一种示例性的填充剂盐为硫酸钠。
家居清洁组合物(例如洗衣去污剂和家居表面清洁剂)可包含一种或多种其他的成分,选自漂白剂、漂白激活剂、催化材料、分散剂多聚物、银护理剂、防变色和/或抗腐蚀试剂、碱性源、加工助剂、染料转移抑制试剂、增亮剂、结构弹性化剂、布料柔软剂、抗磨蚀剂及其他布料护理试剂。清洁佐剂尤其可用于居家清洁组合物,使用的水平在例如美国专利号5,576,282、6,306,812和6,326,348中描述。合适的洗衣或其他居家清洁佐剂的列表在例如国际专利申请出版公开WO 99/05245中描述。
个人护理、宠物护理或化妆品组合物(例如香波、洁面乳、消毒洗手液、腮红、古铜粉,诸如此类)可包含一种或多种其他成分,选自护发剂(例如维生素、硅、硅乳液稳定成分)、阳离子纤维素、或多聚物(例如瓜尔胶多聚物)、去头屑剂、抗菌剂、凝胶形成剂、助悬剂、粘度调节剂、染料、非挥发溶剂或稀释剂(可水溶或不溶)、泡沫增强剂、灭虱剂、pH调节剂、香水、防腐剂、螯合剂、蛋白质、皮肤活性剂、防晒剂、UV吸收剂、矿物质、草药/水果/食品提取物、鞘脂衍生物和粘土。
本发明公开还提供了燃料添加剂,其包含通过本文描述的任何重组微生物体和方法产生的脂肪酰胺。在特定实施方式中,所述燃料添加剂选自发动机性能添加剂、去污剂、分散剂、抗磨剂、粘度指数改良剂、摩擦改良剂、抗氧化剂、防锈剂、消泡剂、密封固定剂(seal fix)、润滑添加剂、降凝剂、浊点降低试剂、防烟剂、减阻添加剂、金属钝化剂、杀菌剂和破乳剂。燃料添加剂在美国专利申请公开2010/0257777中有更详细的描述,其通过引用并入本文。
在特定实施方式中,将包含通过任何重组微生物体和方法产生的脂肪酰胺的燃料添加剂混入包含有所述脂肪酰胺及一种或多种用作所述脂肪酰胺的溶剂的原油的包装中。根据级别和/或类型,所述原油可为添加剂包装提供不同程度的性能益处,包括例如极端温度的益处、抗氧化益处或合适的凝点。
本发明公开还提供了药用组合物,其包含通过本文描述的任何重组微生物体和方法产生的脂肪酰胺以及药用可接受载体。所述药用组合物可含有其他组分例如稀释剂、佐剂、赋形剂、防腐剂、pH调节剂等等,以及其他治疗剂,例如用于处理具体适应症(例如疼痛或炎症)的治疗剂。
所述药用组合物可以为固体(例如片剂、胶囊、舌下片剂、粉末、小药囊)组合物。所述药物组合物也可以是液体(例如水性液体、凝胶、洗剂、乳剂)组合物。可将所述药用组合物配制成用于合适的途径施用,例如选自以下的施用途径:口服、局部、静脉内、肌内、腹膜内、鞘内、硬膜外、经皮、皮下、经粘膜和鼻内途径。
本发明公开还提供了在对其有需要的受试者中预防或治疗疾病或病况的方法,包括向受试者施用有效量的通过任何本文描述的任何重组微生物体和方法产生的脂肪酰胺,由此在受试者中预防或治疗所述疾病或病况。
“有效量”或“治疗有效量”指的是减轻人或动物受试者中所述疾病或病况的一种或多种症状(到一定程度,由经验丰富的医务工作者判定)的量。此外,“有效量”或“治疗有效量”表示使得与疾病或病况相关或导致疾病或病况的生理或生化参数部分地或全部地回归正常。临床领域技术人员可确定当用于治疗或预防具体疾病病况或障碍而施用时,组合物的治疗有效量。达到治疗有效所需要的组合物的精确的量取决于大量因素,例如活性物质的特定活性、所采用的传递装置、所述物质的物理特性、施用目的,以及多项根据不同病人的具体考虑。确定必须以有效量或治疗有效量施用的组合物的量在本领域是常规操作,在一般临床技术人员的技术之内。
在一些实施方式中,有效量可以为每剂量单位含1ng或更多、例如10ng或更多、100ng或更多、1μg或更多、10μg或更多、100μg或更多、1mg或更多、10mg或更多、50mg或更多、或者100mg或更多的本发明公开的脂肪酰胺。备选地或此外地,有效量可以为每剂量单位含5g或更少、1g或更少、500mg或更少、250mg或更少、100mg或更少、75mg或更少、25mg或更少、10mg或更少、或者1mg或更少的本发明公开的脂肪酰胺。因此,剂量单位中脂肪酰胺的存在量介于以上任意两个端点之内。例如,剂量单位中脂肪酰胺的存在量可以为100ng-10mg、50mg-250mg、1μg-1mg或100mg-500mg。含有有效量的本发明公开的脂肪酰胺的剂量单位以单每日剂量施用,或总日剂量能根据需要被分成每日两次、三次、四次或更多次剂量进行施用。
所述疾病或病况可以为如下任何疾病或病况,其具有对以本发明的脂肪酰胺的疗法有应答的一种或多种症状和/或生理或生化参数。在一些实施方式中,所述疾病为炎性疾病,本发明公开的脂肪酰胺以足以减少炎症的量进行施用。在特定实施方式中,所述炎性障碍是自身免疫疾病、类风湿性关节炎、多发性硬化症或克罗恩病。
在特定实施方式中,所述病况为疼痛,本发明公开的脂肪酰胺以足以提供镇痛的量进行施用。
在其他实施方式中,所述病况为高血压,本发明公开的脂肪酰胺以足以引起血压下降的量进行施用。
花生四烯乙醇胺是大麻素(CB)1受体的内源性激动剂,并在较低程度上也是CB2受体与香草素受体1的内源性激动剂(Tan等人,同上)。已经证明对人类和动物对象的施用花生四烯乙醇胺有十分众多的生理作用,包括调节食物摄取和体重,降低血压,降低心脏速率,防止心肌再灌注损伤,减少通过化学、机械、或热刺激引起的急性疼痛,降低神经性或炎性起源的慢性疼痛,减少炎症、在急性神经元损伤中(例如,在创伤性脑损伤、中风和癫痫中)和在慢性神经退行性障碍(例如,多发性硬化症、帕金森氏病、亨廷顿氏病、肌萎缩性侧索硬化和阿尔茨海默氏病)提供神经保护,促进支气管舒张,降低眼内压(例如,在青光眼患者中)和促进肿瘤细胞凋亡(参见,例如Pacher等人(2006)Pharmacol.Rev.58(3):389-462)。
在一些实施方式中,所述脂肪酰胺是通过本文描述的重组微生物体和方法产生的花生四烯乙醇胺,所述疾病或病况是前述疾病或病况的一种,其能够通过施用有效量的花生四烯乙醇胺得到治疗或预防。
PEA和OEA是过氧化物酶体的增殖物激活受体α(PPAR-α)的内源性激动剂(Fu等人(2003)Nature 425(6953):90-93;及Lo Verme等人,同上)。已经证明PEA或OEA对人类和动物对象的施用引起许多由花生四烯乙醇胺引发的相同反应,包括调节食物摄取和体重、减轻疼痛和炎症、提供神经保护及降低眼内压(见例如,Fu等人,同上,Tan等人,同上,LoVerme等人,同上,以及美国专利号6,348,498和6,656,972)。
在一些实施方式中,所述脂肪酰胺是通过本文描述的重组微生物体和方法产生的PEA,所述疾病或病况是前述疾病或病况的一种,其能够通过施用有效量的PEA得到治疗或预防。在其他实施方式中,所述脂肪酰胺是通过本文描述的重组微生物体和方法产生的OEA,所述疾病或病况是前述疾病或病况的一种,其能够通过施用有效量的OEA得到治疗或预防。
实施例
以下具体实施例旨在阐述本发明公开且不应被理解为限制权利要求的范围。
实施例1
本实施例阐述了遗传基因工程微生物体的构建,其中酰基-CoA脱氢酶、外膜蛋白质受体、丙酮酸甲酸裂解酶、乳酸脱氢酶和转录抑制子的表达受到弱化。
大肠杆菌MG1655 DV4是经遗传基因工程化的大肠杆菌K菌株,包含fadE(酰基-CoA脱氢酶)、fhuA(外膜蛋白质受体)、pflB(丙酮酸甲酸裂解酶)和ldhA(乳酸脱氢酶)基因的删除(见美国专利申请公开2011/0072714和2011/0162259,其通过引用并入本文)。大肠杆菌MG1655的fabR基因(GenBank登录号AAC76945)编码转录抑制子,通过根据Datsenko等人(2000)Proc.Natl.Acad.Sci.USA 97:6640-6645的Lambda Red系统将该基因从大肠杆菌MG1655 DV4中删除,所述系统的修饰在本文中描述。
用于产生删除菌株的两条引物为:
fabR_del_F:
5’-ATGTTTTATTGCGTTACCGTTCATTCACAATACTGGAGCAATCCAGTATGATTCCGGGGATCCGTCGACC-3’(SEQ ID NO:4);及
fabR_del_R:
5’-CGTACCTCTATCTTGATTTGCTTGTTTCATTACTCGTCCTTCACATTTCCTGTAGGCTGGAGCTGCTTCG-3’(SEQ ID NO:5)。
fabR_del_F和fabR_del_R引物用于从质粒pKD13中通过PCR方法扩增卡那霉素抗性(KmR)盒,如Datsenko等人描述的方法,见上文。然后用所得的PCR产物转化含有质粒pKD46的电感受态大肠杆菌MG1655 DV4细胞,所述细胞先用阿拉伯糖进行3-4小时的诱导,如Datsenko等人描述的方法,见上文。在SOC基质中于37℃下生长3小时后,将细胞铺于含有50μg/mL卡那霉素的Luria琼脂平板上。在37℃下孵育过夜后,鉴定并分离出对卡那霉素有抗性的菌落。使用大肠杆菌fabR基因两侧的引物确认对fabR基因的破坏。
对fabR删除情况的确认使用以下引物进行:
fabR_3:
5’-GCGACGCGCGCACCTTGCTTAACCAGGCCC-3’(SEQ ID NO:6)
fabR_4:5’-CGCATCTTCGCGCCAATCCAGAACACC-3’(SEQ ID NO:7)。
在所述删除得到确认后,根据Datsenko等人描述的方法(见上文)使用单一菌落移除KmR标记物。所得MG1655大肠杆菌菌株具有fadE、fhuA、pflB、ldhA和fabR基因删除,被命名为大肠杆菌MG1655ΔfadE_ΔfhuA_ΔpflB_ΔldhA_ΔfabR或大肠杆菌MG1655 DG5。
此实施例显示了大肠杆菌MG1655 DG5的构建,所述菌株是经遗传基因工程化的微生物体,其中酰基-CoA脱氢酶、外膜蛋白质受体、丙酮酸甲酸裂解酶、乳酸脱氢酶和转录抑制子的表达受到弱化。
实施例2
本实施例阐述了经遗传基因工程化的微生物体的构建,其中编码硫酯酶(‘tesA)和酰基-CoA合酶(fadD)的核苷酸序列被整合入所述微生物体的染色体,并受控于可诱导启动子。
‘tesA是核苷酸序列,其包含无先导序列的大肠杆菌tesA基因(GenBank索引号AAC73596,登录号U00096.2)。‘tesA编码大肠杆菌硫酯酶(EC 3.1.1.5,3.1.2.-),其中最前端的二十五个氨基酸被删除,并且位于26号位的氨基酸——丙氨酸被甲硫氨酸取代。这样,所述甲硫氨酸便成为‘tesA的第一个氨基酸(Cho等人(1995)J.Biol.Chem.270:4216-4219)。大肠杆菌fadD(GenBank索引号AAC74875;登录号U00096.2)编码酰基-CoA合酶。
含有‘tesA或‘tesA-fadD的pACYC-Ptrc质粒的构建
‘tesA基因获自pETDuet-1-‘tesA质粒,其是通过将‘tesA基因克隆进入NdeI/AvrII消化的pETDuet-1质粒(Novagen,Madison,WI)而构建的,如先前所述的(见美国专利申请出版号2010/0242345和国际专利申请公开WO 2007/136762,其以全文通过引用并入本文)。所述fadD基因获自pHZ1.61质粒(SEQ ID NO:8),其是通过将fadD基因克隆入pCDFDuet-1质粒(Novagen,Madison,WI)而构建的,如先前所述(又见美国专利申请公开2010/0257777,其以全文通过引用并入本文)。分别从pETDuet-1-‘tesA和pHZ1.61中扩增‘tesA和fadD基因,使用高保真聚合酶PHUSIONTM(New England Biolabs,Inc.,Ipswich,MA)以及下列引物:
‘tesA正向-
5’-CTCTAGAAATAATTTAACTTTAAGTAGGAGAUAGGTACCCATGGCGGACACGTTATTGAT-3’(SEQ ID NO:9)
‘tesA反向-
5’-CTTCGAATTCCATTTAAATTATTTCTAGAGTCATTATGAGTC ATGATTTACTAAAGGC-3’(SEQID NO:10)
fadD正向-
5’-CTCTAGAAATAATTTTAGTTAAGTATAAGAAGGAGATATACCATGGTGAAGAAGGTTTGGCTTAA-3’(SEQ ID NO:11)fadD反向-
5’-CTTCGAATTCCATTTAAATTATTTCTAGAGTTATCAGGCTTTA TTGTCCAC-3’(SEQ ID NO:12)。
为构建pACYC-‘tesA质粒,用NcoI和EcoRI消化‘tesA PCR产物及pACYC-Ptrc载体(SEQ ID NO:13)。在用T4 DNA连接酶(New England Biolabs,Ipswich,MA)消化过夜后,将DNA产物转化入
Figure BDA0002841645040000421
ONE
Figure BDA0002841645040000422
细胞(Invitrogen,Carlsbad,CA)。通过限制性酶消化确认tesA向pACYC-Ptrc载体中的插入情况。还在‘tesA插入片段的3’-端创造了SwaI限制性位点及重叠片段,用于IN-FUSIONTM克隆(Clontech,Mountain View,CA)。
为构建pACYC-Ptrc-‘tesA-fadD质粒,对pACYC-Ptrc-‘tesA质粒用SwaI进行过夜限制性酶消化。扩增自pHZ1.61的fadD PCR产物被克隆至‘tesA基因下游,使用IN-FUSIONTMPCR克隆系统(Clontech,Mountain View,CA)。fadD的插入以限制性酶消化得到证实。fadD的插入破坏‘tesA基因后的SwaI位点,但是在fadD的3’-端重新创造出新的SwaI位点。
Tn7tes和Tn7tesfad质粒的构建
将pACYC-Ptrc-‘tesA和pACYC-Ptrc-‘tesA-fadD质粒用作模板分别生成Ptrc-‘tesA和Ptrc-‘tesA-fadD盒。下列引物被用于获得所述盒:IFF:
5’-GGGTCAATAGCGGCCGCCAATTCGCGCGCGAAGGCG-3’(SEQ ID NO:14)
IFR:
5’-TGGCGCGCCTCCTAGGGCATTACGCTGACTTGACGGG-3’(SEQ ID NO:15)。
对质粒pGRG25(GenBank登录号DQ460223)进行纯化并通过NotI和AvrII(NewEngland Biolabs,Inc.,Ipswich,MA)对其进行限制性酶消化。使用IN-FUSIONTM PCR克隆系统(Clontech,Mountain View,CA)将Ptrc-‘tesA盒克隆入pGRG25的NotI和AvrII限制性位点,产生Tn7tes质粒(SEQ ID NO:16),其中lacIq和Ptrc-‘tesA基因的两侧为Tn7的左右末端。类似地,将Ptrc-‘tesA-fadD盒克隆入pGRG25的NotI和AvrII限制性酶切位点,由此产生Tn7tesfad质粒(SEQ ID NO:17),其中lacIq和Ptrc-‘tesA-fadD基因两侧为Tn7的左右末端。
大肠杆菌MG1655 DG5 Tn7-‘tesA和大肠杆菌MG1655 DG5Tn7-‘tesA-fadD的生成
Tn7tes和Tn7tesfad质粒各自分别通过电穿孔导入大肠杆菌菌株MG1655 DG5中(描述于实施例1中),使用的是McKenzie等人,BMC Microbiology,6:39(2006)中描述的操作流程。在电穿孔后,通过在含0.1%葡萄糖和100μg/mL羧苄青霉素的LB基质中32℃生长过夜,选择氨苄青霉素抗性细胞,随后通过在含有0.1%阿拉伯糖的LB平板中32℃生长过夜,选择包含Tn7转座子部分的细胞。将单菌落画线接种于含有或不含氨苄青霉素的LB基质平板上并于42℃下培养过夜以恢复Tn7tes或Tn7tesfad质粒。因此lacIq和Ptrc-‘tesA或lacIq和Ptrc-‘tesA-fadD基因被整合入大肠杆菌MG1655染色体上位于pstS和glmS基因之间的attTn7位点。这些基因的整合情况通过PCR和测序进行确认,使用以下引物:
attTn7.A:5’-GATGCTGGTGGCGAAGCTGT-3’(SEQ ID NO:18)
attTn7.C:5’-GTTGCGACGGTGGTACGCATAAC-3’(SEQ ID NO:19)。
相应地,对所得的菌株命名为大肠杆菌MG1655 DG5 Tn7-‘tesA和大肠杆菌MG1655DG5 Tn7-‘tesA-fadD。
此实施例的结果阐明了生成经遗传基因工程化的微生物体,其中编码硫酯酶(即大肠杆菌MG1655 DG5 Tn7-‘tesA)或硫酯酶及酰基-CoA合酶(即大肠杆菌MG1655 DG5 Tn7-‘tesA-fadD)的核苷酸序列被整合入宿主细胞的染色体,并受控于可诱导的启动子。
实施例3
此实施例阐述了通过在经遗传基因工程化的微生物体中表达编码棕榈酰腐胺合酶的基因而生产N-棕榈酰乙醇胺的方法。
通过DNA2.0(Menlo Park,CA)合成编码细菌棕榈酰腐胺合酶(PPS)的基因,该基因被确定为GenBank登录号AY632377(Brady,S.F.,等人(2004)J.Nat.Prod.,67:1283-1286)(SEQ ID NO:2)。所述DNA2.0质粒——称为pJ201:30127——被设计为在起始密码子邻侧含有NcoI位点,在终止密码子邻侧含有PmeI位点。pJ201:30127中的PPS编码基因未经过密码子优化。将所述PPS编码基因亚克隆至表达载体OP80,所述载体在先前有所描述(见美国专利申请公开2010/0154293,其以全文通过引用并入本文)。OP80载体基于pCL1920,后者是一种低拷贝质粒,在可由IPTG诱导的trc启动子的控制下表达可操作相连的基因。为构建表达PPS基因的OP80载体,对质粒OP80和pJ201:30127进行纯化并用NcoI/PmeI(New EnglandBiolabs,Inc.,Ipswich,MA)进行限制性酶消化。用T4 DNA连接酶将PPS编码基因连接入经NcoI/PmeI消化的OP80质粒。将连接反应物转化入
Figure BDA0002841645040000441
大肠杆菌细胞,并将细胞铺板于含有壮观霉素的LB琼脂平板上。选择十个菌落并通过菌落培养、质粒DNA分离并用NcoI/PmeI消化质粒DNA来测试PPS编码片段的插入情况。通过限制性酶消化鉴定出对于含PPS编码插入片段的质粒来说是阳性的菌落。通过序列分析证实该质粒含有PPS编码基因,将其命名为“OP80-PPS”。然后将OP80-PPS质粒转化入大肠杆菌MG1655菌株DG5(描述于实施例1)、DG5 Tn7-‘tesA(描述于实施例2)和DG5 Tn7-‘tesA-fadD(描述于实施例2)。作为对照,将OP80空载体转化入大肠杆菌MG1655菌株DG5、DG5 Tn7-‘tesA和DG5Tn7-‘tesA-fadD。将所有六种菌株在不含其它葡萄糖的LB培养液中培养。当每种培养物达到1.2的OD600值的时候,加入IPTG至终浓度为1mM,同时加入乙醇胺(0.1%(v/v))。24小时后,收获培养物并用乙酸乙酯进行萃取(2体积培养物比1体积乙酸乙酯),收集有机部分并用于通过GC-MS对脂肪酸种类进行分析。
用用于分离的装配了30m x 0.25mm的0.25μm的薄膜Agilent HP-5-MS柱子的GC-MS(Agilent 6850GC,具有5975B VL MSD)对所有样品进行分析,其中质谱检测器电子电离(EI)为全扫描模式(50-500m/z)。于300℃将1μL乙酸乙酯萃取物注射入Agilent不分流进样口组。柱子的温度程序设置如下:100℃5min,以20℃/min的速度增加到320℃,并在320℃下保持5min。将载气氦的流速设为1.2mL/min。用OP80-PPS转化的大肠杆菌MG1655菌株DG5的代表性色谱图及质谱解释显示于图1。在所有以OP80-PPS转化的大肠杆菌MG1655菌株DG5、DG5 Tn7-‘tesA和DG5 Tn7-‘tesA-fadD的GC-MS跟踪中都鉴定出保留时间为13.1min的峰。该峰被鉴定为N-棕榈酰乙醇胺。而被鉴定为N-棕榈酰乙醇胺的峰不存在于任何用空载体转化的对照菌株中。
据估计,用OP80-PPS转化的大肠杆菌MG1655菌株DG5中产生了近似200mg/L的N-棕榈酰乙醇胺。大肠杆菌MG1655菌株DG5经基因工程化以生产脂肪酰基-ACP,而DG5 Tn7-‘tesA经基因工程化以生产游离的脂肪酸,并且DG5 Tn7-‘tesA-fadD菌株经基因工程化以产生脂肪酰基酰基-CoA。由于这些结果表明所有三种菌株都产生N-棕榈酰乙醇胺,因此亲本DG5菌株中产生N-棕榈酰乙醇胺表示AY632377基因编码的PPS酶在初级乙醇胺的存在下使用C16:0酰基-ACP作为底物。图1中鉴定的N-棕榈酰乙醇胺进一步通过以N,O-双(三甲基硅烷基)-三氟乙酰胺(BSTFA)衍生化得到表征,其中羟基基团是三甲基硅烷基保护的。如图2A所示,GC-MS追踪中保留时间为13.3min的峰被鉴定为三甲基甲硅烷(TMS)保护产物。
本实施例的结果显示了通过在经基因工程化以产生脂肪酰基-ACP的细菌菌株中表达AY632377基因编码的PPS酶而生产N-棕榈酰乙醇胺的方法。此外,这些结果表明单一的酶(即PPS)可以在体内直接由酰基-ACP和伯胺头基进行次级酰胺化。
实施例4
本实施例显示了通过在经遗传基因工程化的微生物体中表达编码棕榈酰腐胺合酶的基因而生产N-棕榈酰乙醇胺的方法。
将OP80空载体或OP80-PPS质粒转化入大肠杆菌MG1655菌株DG5、DG5 Tn7-‘tesA和DG5 Tn7-‘tesA-fadD,如实施例3中描述的。将六种菌株各自在不含其它葡萄糖的LB培养液中培养。然后将每种过夜培养物接种到含有葡萄糖的富营养基质中。更具体地,每种过夜培养物中取1mL一式三份接种至富营养的2N-BT(2%葡萄糖、限氮培养基、0.2M Bis-Tris、pH7.0、0.1%Triton):LB培养基(1:10),其含有1mM IPTG、抗生素及1%乙醇胺,并在pH受控的孵育箱中进行培养,做三个重复试样。48小时后,记录各培养物的OD600,收获细胞并用乙酸乙酯进行萃取(2体积培养物比1体积乙酸乙酯)。收集有机部分并用于GC-MS分析,如实施例3中描述的。在对用OP80-PPS转化的大肠杆菌MG1655菌株DG5 Tn7-‘tesA-fadD进行的GC-MS追踪中发现保留时间13.1min的峰最多。在用OP80-PPS转化的菌株DG5中保留时间13.1min的峰第二多,在用OP80-PPS转化的菌株DG5 Tn7-‘tesA中为第三多。所述13.1min的峰在所有菌株中都被鉴定为N-棕榈酰乙醇胺。被鉴定为N-棕榈酰乙醇胺的峰不存在于任何用空载体转化的对照DG5菌株中。
如上文指出的,大肠杆菌MG1655菌株DG5 Tn7-‘tesA-fadD经基因工程化以产生脂肪酰基-CoA。因此,DG5 Tn7-‘tesA-fadD菌株中产生N-棕榈酰乙醇胺表明AY632377基因编码的PPS酶也可在乙醇胺的存在下使用脂肪酰基-CoA作为底物。
本实施例的结果显示了通过在经基因工程化以产生脂肪酰基-CoA的细菌菌株中表达AY632377基因编码的PPS酶而生产N-棕榈酰乙醇胺的方法。此外,这些结果表明单一的酶(即PPS)可以在体内直接由脂肪酸硫酯和伯胺头基进行次级酰胺化。
实施例5
本实施例显示了通过在经遗传基因工程化微生物体中表达编码PPS的基因而生产饱和及不饱和脂肪酰胺的方法
脂肪酸3-二甲基氨基-1-丙胺作为两性去污剂椰油酰胺丙基甜菜碱(CAPB)合成中的前体。为确定脂肪酸N-(3-二甲基氨基-1-丙胺)酰胺是否可在经遗传基因工程化以表达PPS的微生物体中产生,用OP80空载体或OP80-PPS质粒转化大肠杆菌MG1655菌株DG5细胞,并将其在不含其它葡萄糖的LB培养液中培养过夜。然后将各过夜培养物接种于含有葡萄糖的富营养基质中。更具体地,每种过夜培养物中取1mL以一式三份接种至富营养的2N-BT(2%葡萄糖、限氮培养基、0.2M Bis-Tris、pH 7.0、0.1%Triton):LB培养基(1:10),其含有1mM IPTG、抗生素及1%的伯胺3-二甲基氨基-1丙胺,并在pH受控的孵育箱中进行培养,做三个重复试样。60小时后,记录各培养物的OD600,收获细胞并用乙酸乙酯进行萃取(2体积培养物比1体积乙酸乙酯)。收集有机部分并用于GC-MS分析,如实施例3中描述的。通过提取离子流色谱对色谱的58号离子进行分析,这是脂肪酸N-(3-二甲基氨基-1-丙胺)酰胺的共有离子。在GC-MS跟踪中鉴定出含有C12:0(12.8min)、C14:0(13.2min)、C16:1(13.5min)、C16:0(13.6min)和C18:1(14.3min)脂肪链的脂肪N-(3-二甲基氨基-1-丙胺)酰胺(图3)。在GC-MS追踪中含有C16:0脂肪链的脂肪酰胺被鉴定为最丰富的种类(图3)。
本实施例的结果显示了通过在含有3-二甲基氨基-1-丙胺的基质中培养经基因工程化以产生酰基-ACP并进一步表达由基因AY632377编码的PPS酶而生产具有多种脂肪链长度的脂肪酰胺,其可具有零个或一个不饱和键。
实施例6
本实施例阐述了通过为经遗传基因工程化的微生物体提供多种伯胺而生产多种脂肪酰胺的方法。
将OP80空载体或OP80-PPS质粒转化入大肠杆菌MG1655菌株DG5、DG5 Tn7-‘tesA和DG5 Tn7-‘tesA-fadD,如实施例3中描述的。将六种菌株各自在不含其它葡萄糖的LB培养液中培养。然后,将每种过夜培养物接种到含有葡萄糖的富营养基质中。更具体地,每种过夜培养物中取1mL接种至富营养的2N-BT(2%葡萄糖、限氮培养基、0.2M Bis-Tris、pH 7.0、0.1%Triton):LB培养基(1:10),其含有1mM IPTG、抗生素及1%的以下伯胺之一:(±)-1-氨基-2-丙醇、2-甲氧基乙胺、3-氨基-1-丙醇、2-氨基1-3丙二醇、3-甲氧基丙胺、N-(2-羟乙基)乙二胺或丁胺。将培养物在pH受控的环境中孵育60小时。记录各培养物的OD600,收获细胞并用乙酸乙酯进行萃取(2体积培养物比1体积乙酸乙酯)。收集有机部分并用于GC-MS分析,如实施例3中描述的。从以伯胺饲养的每种表达PPS的大肠杆菌菌株中获得脂肪酰胺。由每种饲养底物获得的脂肪酰胺产物在图4中说明。在以空载体转化的大肠杆菌菌株中未检测到脂肪酰胺产物。
本实施例的结果证明了通过改变伯胺原料的类型而在经遗传基因工程化以产生脂肪硫酯并进一步表达由基因AY632377编码的PPS酶的大肠杆菌菌株内产生不同种类脂肪酰胺的方法。
实施例7
本实施例显示在经遗传基因工程化的微生物体中PPS同源物的表达与PPS表达时产生相同脂肪酰胺化合物。
使用BLAST分析确定AY632377(SEQ ID NO:2)编码的PPS不与任何已知序列有超过20%的序列同一性(见Brady等人(2004)J.Nat.Prod.,67:1283-1286)。在美国国家生物技术信息中心(NCBI)数据库中对AY632377基因编码的PPS酶的氨基酸序列(即,GenBank登录号AAV33349)(SEQ ID NO:1)进行BLAST搜索。鉴定出编码酶N-(4-氨基-2-羟丁基)十四酰胺合酶(AhtS)(GenBank登录号ACX33975.1)(SEQ ID NO:3)的同源物具有的氨基酸序列与AY632377基因编码的PPS的氨基酸序列有38%的同一性。通过GENEARTTM(LifeTechnologies,Grand Island,NY)合成编码AhtS的基因,并按如下方法将其克隆入载体OP80。纯化OP80质粒并将其用NcoI/PmeI(New England Biolabs,Inc.,Ipswich,MA)进行限制性酶消化。使用IN-FUSIONTM PCR克隆系统(Clontech,Mountain View,CA)将AhtS基因克隆入OP80,使用下列引物:
3.10.10-2_InfusF:5’-GAGGAATAAACCATGCCCATTCTTGAAAGCGTGGG-3’(SEQ ID NO:20)和
3.10.10-2_InfusR:5’-AGCTGGAGACCGTTTAAACTTATAAACCGCTGTTTGTCGCAACCG-3’(SEQ ID NO:21)。
通过限制性酶消化发现有两个克隆是阳性的,具有含AhtS编码片段的质粒。通过序列分析确认该质粒含有AhtS编码基因,将其命名为“OP80-AhtS”。将OP80-AhtS质粒转化入大肠杆菌MG1655菌株DG5、DG5 Tn7-‘tesA和DG5 Tn7-‘tesA-fadD。如实施例4中所描述的方法,培养这三种菌株并进行诱导,对每种培养物以3-二甲基氨基-1-丙胺、(±)-1-氨基-2-丙醇或乙醇胺进行饲养,使其达到终浓度1%。将培养物在pH受控的环境中孵育60小时后,收获培养物并用乙酸乙酯进行萃取(2体积培养物比1体积乙酸乙酯)。收集有机部分并用于GC-MS分析,如实施例3中描述的。
从用每种伯胺饲养的每种表达AhtS的大肠杆菌菌株中获得脂肪酰胺。用OP80-AhtS转化并用3-二甲基氨基-1-丙胺饲养的大肠杆菌MG1655 DG5 Tn7-‘tesA-fadD所产生的产物的代表性GC-MS追踪在图5中提供。GC保留时间为11.4min的峰经MS分析被确认为C14:0脂肪N-(3-二甲基氨基-1-丙胺)(图5)。在用空载体转化的大肠杆菌菌株中未检测到脂肪酰胺产物。大肠杆菌MG1655菌株DG5 Tn7-‘tesA-fadD中产生的酰胺量最高,而大肠杆菌MG1655菌株DG5 Tn7-‘tesA中产生的酰胺量最低。DG5 Tn7-‘tesA-fadD菌株中酰胺的生产增加提示AhtS酶对C14:0脂肪硫酯底物有偏好。这些数据还提示AhtS和PPS二者都能在大肠杆菌中使用这两种脂肪硫酯底物(即,脂肪-ACP和脂肪-CoA)之一制造出脂肪酰胺。
本实施例的结果证明AhtS酶能与PPS酶一样催化伯胺和脂肪硫酯底之间发生相同类型的反应。此外,本实施例中显示的数据表明Ahts酶对C14:0脂肪硫酯底物有偏好。
实施例8
本实施例提供了用于体内生成伯胺的方法,所述伯胺可在根据本发明公开生成脂肪酰胺的过程中用作起始材料。
体内乙醇胺的产生可通过遗传地增加丝氨酸生物合成及丝氨酸脱羧途径而实现。为此,通过基因工程化大肠杆菌菌株MG1655以过表达磷酸甘油酸突变酶(gpm AB)以增加糖酵解中间产物3-磷酸甘油酸。通过过表达磷酸甘油酸脱氢酶(serA)、3-磷酸丝氨酸氨基转移酶(serC)和3-磷酸丝氨酸磷酸(serB)对丝氨酸产生途径进行基因工程化。在宿主中表达将丝氨酸脱羧为乙醇胺的异源丝氨酸脱羧酶(SDC)。为了防止该菌株对乙醇胺和丝氨酸进行代谢,编码降解酶乙醇胺氨裂解酶(eutABC)和丝氨酸脱氨酶(sdaAB)的基因被删除(图6)。然后脂肪酰胺可以在通过过表达多肽如PPS或AhtS(其催化乙醇胺和酰基硫酯转化为脂肪酰胺)而产生乙醇胺的重组微生物体中产生。
本发明涉及以下实施方案:
1.重组微生物体,其包含编码催化伯胺和酰基硫酯转化为脂肪酰胺的多肽的核酸序列,其中所述微生物体在碳源存在下进行培养。
2.实施方案1的重组微生物体,其中所述多肽为棕榈酰腐胺合酶(PPS)多肽。
3.实施方案2的重组微生物体,其中所述PPS多肽包含与SEQ ID NO:1的氨基酸序列具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性的氨基酸序列。
4.实施方案2的重组微生物体,其中所述PPS多肽具有包含SEQ ID NO:1的氨基酸序列。
5.实施方案2的重组微生物体,其中所述PPS多肽由包含SEQ ID NO:2的核酸序列编码。
6.实施方案1的重组微生物体,其中所述多肽为N-(4-氨基-2-羟丁基)十四酰胺合酶(AhtS)多肽。
7.实施方案6的重组微生物体,其中所述AhtS多肽包含与SEQ ID NO:3的氨基酸序列具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性的氨基酸序列。
8.实施方案6的重组微生物体,其中所述AhtS多肽具有包含SEQ ID NO:3的氨基酸序列。
9.实施方案6的重组微生物体,其中所述AhtS多肽由包含SEQ ID NO:22的核酸序列编码。
10.实施方案1-9中任何一项的重组微生物体,其中所述碳源为碳水化合物。
11.实施方案1-10中任何一项的重组微生物体,其中所述伯胺选自:3-二甲氨基-1-丙胺、(±)-1-氨基-2-丙醇、2-甲氧基乙胺、3-氨基-1-丙醇、2-氨基-1,3-丙二醇、3-甲氧基丙胺、N-(2-羟乙基)乙二胺、丁胺、和1,4-二氨基丁烷、或其组合。
12.实施方案1-11中任何一项的重组微生物体,其中所述酰基硫酯为脂肪酰基-ACP或脂肪酰基-CoA。
13.实施方案12的重组微生物体,其中所述脂肪酰基-ACP或脂肪酰基-CoA由所述微生物体产生。
14.实施方案1-13中任何一项的重组微生物体,其中所述重组微生物体包含编码脂肪酸生物合成多肽、硫酯酶多肽(EC 3.1.2.14或EC3.1.1.5)及酰基-CoA合成多肽(EC2.3.1.86)中的一种或多种的核酸序列。
15.实施方案14的重组微生物体,其中所述微生物体包含编码硫酯酶多肽和酰基-CoA合酶多肽的核酸序列。
16.实施方案14或15的重组微生物体,其中所述编码硫酯酶多肽的核酸序列包含‘tesA的核酸序列。
17.实施方案14-16中任何一项的重组微生物体,其中所述编码酰基-CoA合酶多肽的核酸序列为fadD。
18.实施方案14-17中任何一项的重组微生物体,其中所述脂肪酸生物合成多肽选自编码accABCD、FabD、FabH、FabG、FabB、FabA、FabZ、FabF、FabI或FadR的核酸序列。
19.实施方案1-18中任何一项的重组微生物体,其中所述微生物体为细菌、蓝细菌、藻类或真菌。
20.实施方案19的重组微生物体,其中所述微生物体为真菌。
21.实施方案20的微生物体,其中所述真菌为酵母或丝状真菌。
22.实施方案1-19中任何一项的重组微生物体,其中所述微生物为酿酒酵母、解脂假丝酵母、大肠埃希氏菌、节杆菌、红酵母、不动杆菌、解脂假丝酵母、布朗葡萄藻、弗尼斯弧菌、藤黄微球菌、嗜麦芽寡养单胞菌、枯草芽孢杆菌,地衣芽孢杆菌、恶臭假单胞菌、荧光假单胞菌、天蓝色链霉菌、聚球藻属物种PCC7002、细长嗜热蓝细菌BP-1、桑椹型无绿藻、克鲁格尼原藻、大型无绿藻,中型无绿藻或原壳小球藻细胞。
23.实施方案22的重组微生物体,其中所述微生物体为节杆菌AK19、不动杆菌属物种M-1株、大肠杆菌B、大肠杆菌C、大肠杆菌K或大肠杆菌W细胞。
24.实施方案1-23中任何一项的重组微生物体,其中所述催化伯胺和酰基硫酯转化为脂肪酰胺的多肽对微生物体是内源的。
25.实施方案1-23中任何一项的重组微生物体,其中所述催化伯胺和酰基硫酯转化为脂肪酰胺的多肽对微生物体是外源的。
26.实施方案1-25中任何一项的重组微生物体,其中所述脂肪酰胺为脂肪烷醇酰胺或脂肪酰胺胺。
27.实施方案1-26中任何一项的重组微生物体,其中所述微生物体表达丝氨酸脱羧酶多肽。
28.用于产生脂肪酰胺的方法,其包括:
(a)提供根据实施方案1-27中任何一项的重组微生物体;并且
(b)将所述重组微生物体在适合于编码催化伯胺和酰基硫酯转化为脂肪酰胺的多肽的核酸序列的表达的条件下在至少一种多肽底物存在下进行培养。
29.实施方案28的方法,其进一步包括从培养基中分离脂肪酰胺。
30.实施方案28或29的方法,其中所述脂肪酰胺为C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19或C20脂肪烷醇酰胺。
31.实施方案28或29的方法,其中所述脂肪酰胺为C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19或C20脂肪酰胺胺。
本发明公开的多种修饰和变动对本领域技术人员是显而易见的,而不偏离本发明公开的范围和精神。尽管已经与特定优选的实施方式相联系而对本发明公开进行描述,应当理解的是这些权利要求不应当被不适当地限制于这些特定实施方式。事实上,旨在将对所描述的本发明公开的施行模式的多种修饰包含在权利要求的范围之内,这些变动能得到本领域技术人员的理解。
序列表
<110> LS9, INC.
<120> 烷醇酰胺及酰胺胺的微生物生产及其用途
<130> LS00041PCT
<140>
<141>
<150> 61/623,711
<151> 2012-04-13
<160> 22
<170> PatentIn version 3.5
<210> 1
<211> 207
<212> PRT
<213> 未知
<220>
<221> 来源
<223> /注="未知的描述: 未培养的细菌"
<400> 1
Met Glu Ser Leu Tyr Asn Gly Asp Gly Phe Val Ile Ala Arg Ala Thr
1 5 10 15
Ala Leu Glu Glu Ile Glu Glu Ser Val Thr Leu Phe Glu Ala Val Ser
20 25 30
Ala Glu Met Gly Trp Ser Pro Gly Asp Arg Leu Arg Ala Tyr Ala Ala
35 40 45
Asn Ala Glu Tyr Leu Met Ala Leu Val Gly Gly Ala Leu Ala Gly Ala
50 55 60
Val Gln Ile Val Leu Ser Asn Gly His Asp Pro Met Pro Ser Asp His
65 70 75 80
Val Trp Pro Glu Leu Ala Ala Gly Arg Arg Tyr Asp Leu Ala His Ala
85 90 95
Ser Val Met Ala Leu Ala Pro Arg Phe Arg Gly Ala Ala Gly Leu Phe
100 105 110
Gly Pro Leu Gly Val Glu Met Trp Arg Leu Cys Arg Asp Ala Gly Lys
115 120 125
Ser Glu Ile Trp Ile Glu Cys Val Pro Arg Asn Leu Ala Val Tyr Arg
130 135 140
Arg Cys Gly Trp Pro Leu Glu Val Ala Gly Glu Leu Arg Thr His Phe
145 150 155 160
Gly Glu Pro Cys Tyr Leu Ala Arg Met Gly Val Glu Ala Val Ala Glu
165 170 175
Ser Leu Arg Ala Arg Ala Gly Arg Cys Asp Gly Phe Ala Arg Leu Val
180 185 190
Ala Gln Ala Tyr Arg Asp Thr Gly Trp Arg Ser Met Gly Leu Ala
195 200 205
<210> 2
<211> 624
<212> DNA
<213> 未知
<220>
<221> 来源
<223> /注="未知的描述: 未培养的细菌"
<400> 2
atggaaagtt tgtacaatgg cgacggattc gtcatcgcaa gggcgacggc cctggaagag 60
atcgaggagt cggtcacact cttcgaggcg gtctccgccg aaatgggatg gagccctggg 120
gatcggcttc gggcatacgc agcgaacgcg gagtacctga tggcgctagt cggcggagcg 180
ctggctgggg cggtgcagat cgtgctctcc aacggtcacg atcctatgcc ttcggaccac 240
gtctggccgg aacttgcggc gggtcgacga tatgaccttg cgcacgcgtc agtgatggcg 300
cttgccccgc gcttccgggg agcggcagga ctattcgggc cgcttggcgt cgagatgtgg 360
aggctttgcc gggacgccgg gaaatccgag atatggatcg agtgcgtgcc gaggaacctt 420
gcggtgtacc gaagatgtgg ttggccgctg gaggtggcgg gcgagttgcg gacccatttc 480
ggcgagcctt gctacctggc gcgaatgggc gtggaggcgg tggcggaatc tctgagggcc 540
agagccggcc gctgcgatgg gttcgccaga ctggtcgcgc aggcttaccg agacaccgga 600
tggcggtcaa tggggcttgc gtaa 624
<210> 3
<211> 220
<212> PRT
<213> 未知
<220>
<221> 来源
<223> /注="未知的描述: 未培养的细菌RM44"
<400> 3
Met Pro Ile Leu Glu Ser Val Gly Phe Met Lys Thr Leu Trp Glu Ser
1 5 10 15
Gly Gly Ala Gln Val Ala Leu Met Glu Ser Arg Glu Glu Thr Ser His
20 25 30
Met Val Gly Ile Leu Glu Gly Ile Ala Ala Glu Leu Ser Trp Arg Pro
35 40 45
Gly Thr Gln Leu Arg Asp Tyr Gln Asp Arg Ala Ala His Leu Ala Val
50 55 60
Leu Val Gly Ser Glu Ile Val Gly Gly Leu Gln Ile Val Thr Ser Pro
65 70 75 80
Ser Ala Asp Cys Leu Pro Tyr Arg Leu Val Trp Pro Glu Val Cys Val
85 90 95
Pro Asp Gly Ala Ala Ile Ala Asp Ile Thr Ile Leu Ala Leu Arg Lys
100 105 110
Glu Tyr Arg Ala Arg Phe Asn Leu Phe Trp Pro Leu Cys Val Glu Leu
115 120 125
Trp Arg His Cys Val Ala Glu Gly Ala Thr Glu Met Arg Leu Glu Ala
130 135 140
Thr Pro Asp Thr Leu Arg Leu Tyr Arg Arg Ile Gly Trp Pro Leu Glu
145 150 155 160
Val Ile Gly Asp Leu Arg Leu His Trp Asn Glu Pro Cys Phe Leu Cys
165 170 175
Arg Met Gly Ile Val Asp Val Ala Gly Ala Met Val Val Arg Ala Leu
180 185 190
Gln Ser Ala Thr Tyr Gln Ala Val Leu Ala Gly Met Ser Arg Pro Val
195 200 205
Ala Ser Ala Ser Pro Val Ala Thr Asn Ser Gly Leu
210 215 220
<210> 4
<211> 70
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述: 合成的引物"
<400> 4
atgttttatt gcgttaccgt tcattcacaa tactggagca atccagtatg attccgggga 60
tccgtcgacc 70
<210> 5
<211> 70
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述: 合成的引物"
<400> 5
cgtacctcta tcttgatttg cttgtttcat tactcgtcct tcacatttcc tgtaggctgg 60
agctgcttcg 70
<210> 6
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述: 合成的引物"
<400> 6
gcgacgcgcg caccttgctt aaccaggccc 30
<210> 7
<211> 27
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述: 合成的引物"
<400> 7
cgcatcttcg cgccaatcca gaacacc 27
<210> 8
<211> 6700
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述: 合成的多核苷酸"
<400> 8
ggggaattgt gagcggataa caattcccct gtagaaataa ttttgtttaa ctttaataag 60
gagatatacc atggtgaaga aggtttggct taaccgttat cccgcggacg ttccgacgga 120
gatcaaccct gaccgttatc aatctctggt agatatgttt gagcagtcgg tcgcgcgcta 180
cgccgatcaa cctgcgtttg tgaatatggg ggaggtaatg accttccgca agctggaaga 240
acgcagtcgc gcgtttgccg cttatttgca acaagggttg gggctgaaga aaggcgatcg 300
cgttgcgttg atgatgccta atttattgca atatccggtg gcgctgtttg gcattttgcg 360
tgccgggatg atcgtcgtaa acgttaaccc gttgtatacc ccgcgtgagc ttgagcatca 420
gcttaacgat agcggcgcat cggcgattgt tatcgtgtct aactttgctc acacactgga 480
aaaagtggtt gataaaaccg ccgttcagca cgtaattctg acccgtatgg gcgatcagct 540
atctacggca aaaggcacgg tagtcaattt cgttgttaaa tacatcaagc gtttggtgcc 600
gaaataccat ctgccagatg ccatttcatt tcgtagcgca ctgcataacg gctaccggat 660
gcagtacgtc aaacccgaac tggtgccgga agatttagct tttctgcaat acaccggcgg 720
caccactggt gtggcgaaag gcgcgatgct gactcaccgc aatatgctgg cgaacctgga 780
acaggttaac gcgacctatg gtccgctgtt gcatccgggc aaagagctgg tggtgacggc 840
gctgccgctg tatcacattt ttgccctgac cattaactgc ctgctgttta tcgaactggg 900
tgggcagaac ctgcttatca ctaacccgcg cgatattcca gggttggtaa aagagttagc 960
gaaatatccg tttaccgcta tcacgggcgt taacaccttg ttcaatgcgt tgctgaacaa 1020
taaagagttc cagcagctgg atttctccag tctgcatctt tccgcaggcg gagggatgcc 1080
agtgcagcaa gtggtggcag agcgttgggt gaaactgaca ggacagtatc tgctggaagg 1140
ctatggcctt accgagtgtg cgccgctggt cagcgttaac ccatatgata ttgattatca 1200
tagtggtagc atcggtttgc cggtgccgtc gacggaagcc aaactggtgg atgatgatga 1260
taatgaagta ccaccgggtc aaccgggtga gctttgtgtc aaaggaccgc aggtgatgct 1320
gggttactgg cagcgtccgg atgctacaga tgagatcatc aaaaatggct ggttacacac 1380
cggcgacatc gcggtgatgg atgaagaagg gttcctgcgc attgtcgatc gtaaaaaaga 1440
catgattctg gtttccggtt ttaacgtcta tcccaacgag attgaagatg tcgtcatgca 1500
gcatcctggc gtacaggaag tcgcggctgt tggcgtacct tccggctcca gtggtgaagc 1560
ggtgaaaatc ttcgtagtga aaaaagatcc atcgcttacc gaagagtcac tggtgacctt 1620
ttgccgccgt cagctcacgg gctacaaagt accgaagctg gtggagtttc gtgatgagtt 1680
accgaaatct aacgtcggaa aaattttgcg acgagaatta cgtgacgaag cgcgcggcaa 1740
agtggacaat aaagcctgaa agcttgcggc cgcataatgc ttaagtcgaa cagaaagtaa 1800
tcgtattgta cacggccgca taatcgaaat taatacgact cactataggg gaattgtgag 1860
cggataacaa ttccccatct tagtatatta gttaagtata agaaggagat atacatatgc 1920
gcccattaca tccgattgat tttatattcc tgtcactaga aaaaagacaa cagcctatgc 1980
atgtaggtgg tttatttttg tttcagattc ctgataacgc cccagacacc tttattcaag 2040
atctggtgaa tgatatccgg atatcaaaat caatccctgt tccaccattc aacaataaac 2100
tgaatgggct tttttgggat gaagatgaag agtttgattt agatcatcat tttcgtcata 2160
ttgcactgcc tcatcctggt cgtattcgtg aattgcttat ttatatttca caagagcaca 2220
gtacgctgct agatcgggca aagcccttgt ggacctgcaa tattattgaa ggaattgaag 2280
gcaatcgttt tgccatgtac ttcaaaattc accatgcgat ggtcgatggc gttgctggta 2340
tgcggttaat tgaaaaatca ctctcccatg atgtaacaga aaaaagtatc gtgccacctt 2400
ggtgtgttga gggaaaacgt gcaaagcgct taagagaacc taaaacaggt aaaattaaga 2460
aaatcatgtc tggtattaag agtcagcttc aggcgacacc cacagtcatt caagagcttt 2520
ctcagacagt atttaaagat attggacgta atcctgatca tgtttcaagc tttcaggcgc 2580
cttgttctat tttgaatcag cgtgtgagct catcgcgacg ttttgcagca cagtcttttg 2640
acctagatcg ttttcgtaat attgccaaat cgttgaatgt gaccattaat gatgttgtac 2700
tagcggtatg ttctggtgca ttacgtgcgt atttgatgag tcataatagt ttgccttcaa 2760
aaccattaat tgccatggtt ccagcctcta ttcgcaatga cgattcagat gtcagcaacc 2820
gtattacgat gattctggca aatttggcaa cccacaaaga tgatccttta caacgtcttg 2880
aaattatccg ccgtagtgtt caaaactcaa agcaacgctt caaacgtatg accagcgatc 2940
agattctaaa ttatagtgct gtcgtatatg gccctgcagg actcaacata atttctggca 3000
tgatgccaaa acgccaagcc ttcaatctgg ttatttccaa tgtgcctggc ccaagagagc 3060
cactttactg gaatggtgcc aaacttgatg cactctaccc agcttcaatt gtattagacg 3120
gtcaagcatt gaatattaca atgaccagtt atttagataa acttgaagtt ggtttgattg 3180
catgccgtaa tgcattgcca agaatgcaga atttactgac acatttagaa gaagaaattc 3240
aactatttga aggcgtaatt gcaaagcagg aagatattaa aacagccaat taaaaacaat 3300
aaacttgatt ttttaattta tcagataaaa ctaaagggct aaattagccc tcctaggctg 3360
ctgccaccgc tgagcaataa ctagcataac cccttggggc ctctaaacgg gtcttgaggg 3420
gttttttgct gaaacctcag gcatttgaga agcacacggt cacactgctt ccggtagtca 3480
ataaaccggt aaaccagcaa tagacataag cggctattta acgaccctgc cctgaaccga 3540
cgaccgggtc atcgtggccg gatcttgcgg cccctcggct tgaacgaatt gttagacatt 3600
atttgccgac taccttggtg atctcgcctt tcacgtagtg gacaaattct tccaactgat 3660
ctgcgcgcga ggccaagcga tcttcttctt gtccaagata agcctgtcta gcttcaagta 3720
tgacgggctg atactgggcc ggcaggcgct ccattgccca gtcggcagcg acatccttcg 3780
gcgcgatttt gccggttact gcgctgtacc aaatgcggga caacgtaagc actacatttc 3840
gctcatcgcc agcccagtcg ggcggcgagt tccatagcgt taaggtttca tttagcgcct 3900
caaatagatc ctgttcagga accggatcaa agagttcctc cgccgctgga cctaccaagg 3960
caacgctatg ttctcttgct tttgtcagca agatagccag atcaatgtcg atcgtggctg 4020
gctcgaagat acctgcaaga atgtcattgc gctgccattc tccaaattgc agttcgcgct 4080
tagctggata acgccacgga atgatgtcgt cgtgcacaac aatggtgact tctacagcgc 4140
ggagaatctc gctctctcca ggggaagccg aagtttccaa aaggtcgttg atcaaagctc 4200
gccgcgttgt ttcatcaagc cttacggtca ccgtaaccag caaatcaata tcactgtgtg 4260
gcttcaggcc gccatccact gcggagccgt acaaatgtac ggccagcaac gtcggttcga 4320
gatggcgctc gatgacgcca actacctctg atagttgagt cgatacttcg gcgatcaccg 4380
cttccctcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 4440
tgagcggata catatttgaa tgtatttaga aaaataaaca aatagctagc tcactcggtc 4500
gctacgctcc gggcgtgaga ctgcggcggg cgctgcggac acatacaaag ttacccacag 4560
attccgtgga taagcagggg actaacatgt gaggcaaaac agcagggccg cgccggtggc 4620
gtttttccat aggctccgcc ctcctgccag agttcacata aacagacgct tttccggtgc 4680
atctgtggga gccgtgaggc tcaaccatga atctgacagt acgggcgaaa cccgacagga 4740
cttaaagatc cccaccgttt ccggcgggtc gctccctctt gcgctctcct gttccgaccc 4800
tgccgtttac cggatacctg ttccgccttt ctcccttacg ggaagtgtgg cgctttctca 4860
tagctcacac actggtatct cggctcggtg taggtcgttc gctccaagct gggctgtaag 4920
caagaactcc ccgttcagcc cgactgctgc gccttatccg gtaactgttc acttgagtcc 4980
aacccggaaa agcacggtaa aacgccactg gcagcagcca ttggtaactg ggagttcgca 5040
gaggatttgt ttagctaaac acgcggttgc tcttgaagtg tgcgccaaag tccggctaca 5100
ctggaaggac agatttggtt gctgtgctct gcgaaagcca gttaccacgg ttaagcagtt 5160
ccccaactga cttaaccttc gatcaaacca cctccccagg tggttttttc gtttacaggg 5220
caaaagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctactgaa 5280
ccgctctaga tttcagtgca atttatctct tcaaatgtag cacctgaagt cagccccata 5340
cgatataagt tgtaattctc atgttagtca tgccccgcgc ccaccggaag gagctgactg 5400
ggttgaaggc tctcaagggc atcggtcgag atcccggtgc ctaatgagtg agctaactta 5460
cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc 5520
attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc cagggtggtt 5580
tttcttttca ccagtgagac gggcaacagc tgattgccct tcaccgcctg gccctgagag 5640
agttgcagca agcggtccac gctggtttgc cccagcaggc gaaaatcctg tttgatggtg 5700
gttaacggcg ggatataaca tgagctgtct tcggtatcgt cgtatcccac taccgagatg 5760
tccgcaccaa cgcgcagccc ggactcggta atggcgcgca ttgcgcccag cgccatctga 5820
tcgttggcaa ccagcatcgc agtgggaacg atgccctcat tcagcatttg catggtttgt 5880
tgaaaaccgg acatggcact ccagtcgcct tcccgttccg ctatcggctg aatttgattg 5940
cgagtgagat atttatgcca gccagccaga cgcagacgcg ccgagacaga acttaatggg 6000
cccgctaaca gcgcgatttg ctggtgaccc aatgcgacca gatgctccac gcccagtcgc 6060
gtaccgtctt catgggagaa aataatactg ttgatgggtg tctggtcaga gacatcaaga 6120
aataacgccg gaacattagt gcaggcagct tccacagcaa tggcatcctg gtcatccagc 6180
ggatagttaa tgatcagccc actgacgcgt tgcgcgagaa gattgtgcac cgccgcttta 6240
caggcttcga cgccgcttcg ttctaccatc gacaccacca cgctggcacc cagttgatcg 6300
gcgcgagatt taatcgccgc gacaatttgc gacggcgcgt gcagggccag actggaggtg 6360
gcaacgccaa tcagcaacga ctgtttgccc gccagttgtt gtgccacgcg gttgggaatg 6420
taattcagct ccgccatcgc cgcttccact ttttcccgcg ttttcgcaga aacgtggctg 6480
gcctggttca ccacgcggga aacggtctga taagagacac cggcatactc tgcgacatcg 6540
tataacgtta ctggtttcac attcaccacc ctgaattgac tctcttccgg gcgctatcat 6600
gccataccgc gaaaggtttt gcgccattcg atggtgtccg ggatctcgac gctctccctt 6660
atgcgactcc tgcattagga aattaatacg actcactata 6700
<210> 9
<211> 60
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述: 合成的引物"
<220>
<221> 来源
<223> /注="组合的DNA/RNA分子的描述:合成的引物"
<400> 9
ctctagaaat aatttaactt taagtaggag auaggtaccc atggcggaca cgttattgat 60
<210> 10
<211> 58
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述: 合成的引物"
<400> 10
cttcgaattc catttaaatt atttctagag tcattatgag tcatgattta ctaaaggc 58
<210> 11
<211> 65
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述: 合成的引物"
<400> 11
ctctagaaat aattttagtt aagtataaga aggagatata ccatggtgaa gaaggtttgg 60
cttaa 65
<210> 12
<211> 51
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述: 合成的引物"
<400> 12
cttcgaattc catttaaatt atttctagag ttatcaggct ttattgtcca c 51
<210> 13
<211> 5733
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述: 合成的多核苷酸"
<400> 13
actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg 60
ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac 120
cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt 180
gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgcag 240
caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc 300
aacaattaat agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc 360
ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta 420
tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg 480
ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga 540
ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac 600
ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa 660
tcccttaacg tgagttttcg ttccactgag cgtcagaccc cttaataaga tgatcttctt 720
gagatcgttt tggtctgcgc gtaatctctt gctctgaaaa cgaaaaaacc gccttgcagg 780
gcggtttttc gaaggttctc tgagctacca actctttgaa ccgaggtaac tggcttggag 840
gagcgcagtc accaaaactt gtcctttcag tttagcctta accggcgcat gacttcaaga 900
ctaactcctc taaatcaatt accagtggct gctgccagtg gtgcttttgc atgtctttcc 960
gggttggact caagacgata gttaccggat aaggcgcagc ggtcggactg aacggggggt 1020
tcgtgcatac agtccagctt ggagcgaact gcctacccgg aactgagtgt caggcgtgga 1080
atgagacaaa cgcggccata acagcggaat gacaccggta aaccgaaagg caggaacagg 1140
agagcgcacg agggagccgc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt 1200
tcgccaccac tgatttgagc gtcagatttc gtgatgcttg tcaggggggc ggagcctatg 1260
gaaaaacggc tttgccgcgg ccctctcact tccctgttaa gtatcttcct ggcatcttcc 1320
aggaaatctc cgccccgttc gtaagccatt tccgctcgcc gcagtcgaac gaccgagcgt 1380
agcgagtcag tgagcgagga agcggaatat atcctgtatc acatattctg ctgacgcacc 1440
ggtgcagcct tttttctcct gccacatgaa gcacttcact gacaccctca tcagtgccaa 1500
catagtaagc cagtatacac tccgctagcg ctgaggtctg cctcgtgaag aaggtgttgc 1560
tgactcatac caggcctgaa tcgccccatc atccagccag aaagtgaggg agccacggtt 1620
gatgagagct ttgttgtagg tggaccagtt ggtgattttg aacttttgct ttgccacgga 1680
acggtctgcg ttgtcgggaa gatgcgtgat ctgatccttc aactcagcaa aagttcgatt 1740
tattcaacaa agccacgttg tgtctcaaaa tctctgatgt tacattgcac aagataaaaa 1800
tatatcatca tgaacaataa aactgtctgc ttacataaac agtaatacaa ggggtgttat 1860
gagccatatt caacgggaaa cgtcttgctc gaggccgcga ttaaattcca acatggatgc 1920
tgatttatat gggtataaat gggctcgcga taatgtcggg caatcaggtg cgacaatcta 1980
tcgattgtat gggaagcccg atgcgccaga gttgtttctg aaacatggca aaggtagcgt 2040
tgccaatgat gttacagatg agatggtcag actaaactgg ctgacggaat ttatgcctct 2100
tccgaccatc aagcatttta tccgtactcc tgatgatgca tggttactca ccactgcgat 2160
ccccgggaaa acagcattcc aggtattaga agaatatcct gattcaggtg aaaatattgt 2220
tgatgcgctg gcagtgttcc tgcgccggtt gcattcgatt cctgtttgta attgtccttt 2280
taacagcgat cgcgtatttc gtctcgctca ggcgcaatca cgaatgaata acggtttggt 2340
tgatgcgagt gattttgatg acgagcgtaa tggctggcct gttgaacaag tctggaaaga 2400
aatgcataag cttttgccat tctcaccgga ttcagtcgtc actcatggtg atttctcact 2460
tgataacctt atttttgacg aggggaaatt aataggttgt attgatgttg gacgagtcgg 2520
aatcgcagac cgataccagg atcttgccat cctatggaac tgcctcggtg agttttctcc 2580
ttcattacag aaacggcttt ttcaaaaata tggtattgat aatcctgata tgaataaatt 2640
gcagtttcat ttgatgctcg atgagttttt ctaatcagaa ttggttaatt ggttgtaaca 2700
ctggcagagc attacgctga cttgacggga cggcggcttt gttgaataaa tcgaactttt 2760
gctgagttga aggatcagat cacgcatctt cccgacaacg cagaccgttc cgtggcaaag 2820
caaaagttca aaatcaccaa ctggtccacc tacaacaaag ctctcatcaa ccgtggctcc 2880
ctcactttct ggctggatga tggggcgatt caggcctggt atgagtcagc aacaccttct 2940
tcacgaggca gacctcagcg ctcaaagatg caggggtaaa agctaaccgc atctttaccg 3000
acaaggcatc cggcagttca acagatcggg aagggctgga tttgctgagg atgaaggtgg 3060
aggaaggtga tgtcattctg gtgaagaagc tcgaccgtct tggccgcgac accgccgaca 3120
tgatccaact gataaaagag tttgatgctc agggtgtagc ggttcggttt attgacgacg 3180
ggatcagtac cgacggtgat atggggcaaa tggtggtcac catcctgtcg gctgtggcac 3240
aggctgaacg ccggaggatc ctagagcgca cgaatgaggg ccgacaggaa gcaaagctga 3300
aaggaatcaa atttggccgc aggcgtaccg tggacaggaa cgtcgtgctg acgcttcatc 3360
agaagggcac tggtgcaacg gaaattgctc atcagctcag tattgcccgc tccacggttt 3420
ataaaattct tgaagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat 3480
gataataatg gtttcttaga cgtcttaatt aatcaggaga gcgttcaccg acaaacaaca 3540
gataaaacga aaggcccagt ctttcgactg agcctttcgt tttatttgat gcctggcagt 3600
tccctactct cgcatgggga gaccccacac taccatcggc gctacggcgt ttcacttctg 3660
agttcggcat ggggtcaggt gggaccaccg cgctactgcc gccaggcaaa ttctgtttta 3720
tcagaccgct tctgcgttct gatttaatct gtatcaggct gaaaatcttc tctcatccgc 3780
caaaacagcc aagctggaga ccgtttaaac tcaatgatga tgatgatgat ggtcgacggc 3840
gctattcaga tcctcttctg agatgagttt ttgttcgggc ccaagcttcg aattcccata 3900
tggtaccagc tgcagatctc gagctcggat ccatggttta ttcctcctta tttaatcgat 3960
acattaatat atacctcttt aatttttaat aataaagtta atcgataatt ccggtcgagt 4020
gcccacacag attgtctgat aaattgttaa agagcagtgc cgcttcgctt tttctcagcg 4080
gcgctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacattat acgagccgga 4140
tgattaattg tcaacagctc atttcagaat atttgccaga accgttatga tgtcggcgca 4200
aaaaacatta tccagaacgg gagtgcgcct tgagcgacac gaattatgca gtgatttacg 4260
acctgcacag ccataccaca gcttccgatg gctgcctgac gccagaagca ttggtgcacc 4320
gtgcagtcga tgataagctg tcaaaccaga tcaattcgcg ctaactcaca ttaattgcgt 4380
tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg 4440
gccaacgcgc ggggagaggc ggtttgcgta ttgggcgcca gggtggtttt tcttttcacc 4500
agtgagacgg gcaacagctg attgcccttc accgcctggc cctgagagag ttgcagcaag 4560
cggtccacgc tggtttgccc cagcaggcga aaatcctgtt tgatggtggt tgacggcggg 4620
atataacatg agctgtcttc ggtatcgtcg tatcccacta ccgagatatc cgcaccaacg 4680
cgcagcccgg actcggtaat ggcgcgcatt gcgcccagcg ccatctgatc gttggcaacc 4740
agcatcgcag tgggaacgat gccctcattc agcatttgca tggtttgttg aaaaccggac 4800
atggcactcc agtcgccttc ccgttccgct atcggctgaa tttgattgcg agtgagatat 4860
ttatgccagc cagccagacg cagacgcgcc gagacagaac ttaatgggcc cgctaacagc 4920
gcgatttgct ggtgacccaa tgcgaccaga tgctccacgc ccagtcgcgt accgtcttca 4980
tgggagaaaa taatactgtt gatgggtgtc tggtcagaga catcaagaaa taacgccgga 5040
acattagtgc aggcagcttc cacagcaatg gcatcctggt catccagcgg atagttaatg 5100
atcagcccac tgacgcgttg cgcgagaaga ttgtgcaccg ccgctttaca ggcttcgacg 5160
ccgcttcgtt ctaccatcga caccaccacg ctggcaccca gttgatcggc gcgagattta 5220
atcgccgcga caatttgcga cggcgcgtgc agggccagac tggaggtggc aacgccaatc 5280
agcaacgact gtttgcccgc cagttgttgt gccacgcggt tgggaatgta attcagctcc 5340
gccatcgccg cttccacttt ttcccgcgtt ttcgcagaaa cgtggctggc ctggttcacc 5400
acgcgggaaa cggtctgata agagacaccg gcatactctg cgacatcgta taacgttact 5460
ggtttcacat tcaccaccct gaattgactc tcttccgggc gctatcatgc cataccgcga 5520
aaggttttgc accattcgat ggtgtcaacg taaatgcatg ccgcttcgcc ttcgcgcgcg 5580
aattgatctg ctgcctcgcg cgtttcggtg atgacggtga aaacctctga cacatgcagc 5640
tcccggagac ggtcacagct tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg 5700
gcgcgtcagc gggtgttggc ggggccggcc tcg 5733
<210> 14
<211> 36
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述: 合成的引物"
<400> 14
gggtcaatag cggccgccaa ttcgcgcgcg aaggcg 36
<210> 15
<211> 37
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述: 合成的引物"
<400> 15
tggcgcgcct cctagggcat tacgctgact tgacggg 37
<210> 16
<211> 15179
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述: 合成的多核苷酸"
<400> 16
ggccacgatg cgtccggcgt agaggatctg ctcatgtttg acagcttatc atcgatgcat 60
aatgtgcctg tcaaatggac gaagcaggga ttctgcaaac cctatgctac tccgtcaagc 120
cgtcaattgt ctgattcgtt accaattatg acaacttgac ggctacatca ttcacttttt 180
cttcacaacc ggcacggaac tcgctcgggc tggccccggt gcatttttta aatacccgcg 240
agaaatagag ttgatcgtca aaaccaacat tgcgaccgac ggtggcgata ggcatccggg 300
tggtgctcaa aagcagcttc gcctggctga tacgttggtc ctcgcgccag cttaagacgc 360
taatccctaa ctgctggcgg aaaagatgtg acagacgcga cggcgacaag caaacatgct 420
gtgcgacgct ggcgatatca aaattgctgt ctgccaggtg atcgctgatg tactgacaag 480
cctcgcgtac ccgattatcc atcggtggat ggagcgactc gttaatcgct tccatgcgcc 540
gcagtaacaa ttgctcaagc agatttatcg ccagcagctc cgaatagcgc ccttcccctt 600
gcccggcgtt aatgatttgc ccaaacaggt cgctgaaatg cggctggtgc gcttcatccg 660
ggcgaaagaa ccccgtattg gcaaatattg acggccagtt aagccattca tgccagtagg 720
cgcgcggacg aaagtaaacc cactggtgat accattcgcg agcctccgga tgacgaccgt 780
agtgatgaat ctctcctggc gggaacagca aaatatcacc cggtcggcaa acaaattctc 840
gtccctgatt tttcaccacc ccctgaccgc gaatggtgag attgagaata taacctttca 900
ttcccagcgg tcggtcgata aaaaaatcga gataaccgtt ggcctcaatc ggcgttaaac 960
ccgccaccag atgggcatta aacgagtatc ccggcagcag gggatcattt tgcgcttcag 1020
ccatactttt catactcccg ccattcagag aagaaaccaa ttgtccatat tgcatcagac 1080
attgccgtca ctgcgtcttt tactggctct tctcgctaac caaaccggta accccgctta 1140
ttaaaagcat tctgtaacaa agcgggacca aagccatgac aaaaacgcgt aacaaaagtg 1200
tctataatca cggcagaaaa gtccacattg attatttgca cggcgtcaca ctttgctatg 1260
ccatagcatt tttatccata agattagcgg atcctacctg acgcttttta tcgcaactct 1320
ctactgtttc tccatacccg tttttttggg ctagcgaatt cgagctcggt acccaagtct 1380
taaactagac agaatagttg taaactgaaa tcagtccagt tatgctgtga aaaagcatac 1440
tggacttttg ttatggctaa agcaaactct tcattttctg aagtgcaaat tgcccgtcgt 1500
attaaagagg ggcgtggcca agggcatggt aaagactata ttccatggct aacagtacaa 1560
gaagttcctt cttcaggtcg ttcccaccgt atttattctc ataagacggg acgagtccat 1620
catttgctat ctgacttaga gcttgctgtt tttctcagtc ttgagtggga gagcagcgtg 1680
ctagatatac gcgagcagtt ccccttatta cctagtgata ccaggcagat tgcaatagat 1740
agtggtatta agcatcctgt tattcgtggt gtagatcagg ttatgtctac tgatttttta 1800
gtggactgca aagatggtcc ttttgagcag tttgctattc aagtcaaacc tgcagcagcc 1860
ttacaagacg agcgtacctt agaaaaacta gaactagagc gtcgctattg gcagcaaaag 1920
caaattcctt ggttcatttt tactgataaa gaaataaatc ccgtagtaaa agaaaatatt 1980
gaatggcttt attcagtgaa aacagaagaa gtttctgcgg agcttttagc acaactatcc 2040
ccattggccc atatcctgca agaaaaagga gatgaaaaca ttatcaatgt ctgtaagcag 2100
gttgatattg cttatgattt ggagttaggc aaaacattga gtgagatacg agccttaacc 2160
gcaaatggtt ttattaagtt caatatttat aagtctttca gggcaaataa gtgtgcagat 2220
ctctgtatta gccaagtagt gaatatggag gagttgcgct atgtggcaaa ttaatgaggt 2280
tgtgctattt gataatgatc cgtatcgcat tttggctata gaggatggcc aagttgtctg 2340
gatgcaaata agcgctgata aaggagttcc acaagctagg gctgagttgt tgctaatgca 2400
gtatttagat gaaggccgct tagttagaac tgatgaccct tatgtacatc ttgatttaga 2460
agagccgtct gtagattctg tcagcttcca gaagcgcgag gaggattatc gaaaaattct 2520
tcctattatt aatagtaagg atcgtttcga ccctaaagtc agaagcgaac tcgttgagca 2580
tgtggtccaa gaacataagg ttactaaggc tacagtttat aagttgttac gccgttactg 2640
gcagcgtggt caaacgccta atgcattaat tcctgactac aaaaacagcg gtgcaccagg 2700
ggaaagacgt tcagcgacag gaacagcaaa gattggccga gccagagaat atggtaaggg 2760
tgaaggaacc aaggtaacgc ccgagattga acgccttttt aggttgacca tagaaaagca 2820
cctgttaaat caaaaaggta caaagaccac cgttgcctat agacgatttg tggacttgtt 2880
tgctcagtat tttcctcgca ttccccaaga ggattaccca acactacgtc agtttcgtta 2940
tttttatgat cgagaatacc ctaaagctca gcgcttaaag tctagagtta aagcaggggt 3000
atataaaaaa gacgtacgac ccttaagtag tacagccact tctcaggcgt taggccctgg 3060
gagtcgttat gagattgatg ccacgattgc tgatatttat ttagtggatc atcatgatcg 3120
ccaaaaaatc ataggaagac caacgcttta cattgtgatt gatgtgttta gtcggatgat 3180
cacgggcttt tatatcggct ttgaaaatcc gtcttatgtg gtggcgatgc aggcttttgt 3240
aaatgcttgc tctgacaaaa cggccatttg tgcccagcat gatattgaga ttagtagctc 3300
agactggccg tgtgtaggtt tgccagatgt gttgctagcg gaccgtggcg aattaatgag 3360
tcatcaggtc gaagccttag tttctagttt taatgtgcga gtggaaagtg ctccacctag 3420
acgtggcgat gctaaaggca tagtggaaag cacttttaga acactacaag ccgagtttaa 3480
gtcctttgca cctggcattg tagagggcag tcggatcaaa agccatggtg aaacagacta 3540
taggttagat gcatctctgt cggtatttga gttcacacaa attattttgc gtacgatctt 3600
attcagaaat aaccatctgg tgatggataa atacgatcga gatgctgatt ttcctacaga 3660
tttaccgtct attcctgtcc agctatggca atggggtatg cagcatcgta caggtagttt 3720
aagggctgtg gagcaagagc agttgcgagt agcgttactg cctcgccgaa aggtctctat 3780
ttcttcattt ggcgttaatt tgtggggttt gtattactcg gggtcagaga ttctgcgtga 3840
gggttggttg cagcggagca ctgatatagc tagacctcaa catttagaag cggcttatga 3900
cccagtgctg gttgatacga tttatttgtt tccgcaagtt ggcagccgtg tattttggcg 3960
ctgtaatctg acggaacgta gtcggcagtt taaaggtctc tcattttggg aggtttggga 4020
tatacaagca caagaaaaac acaataaagc caatgcgaag caggatgagt taactaaacg 4080
cagggagctt gaggcgttta ttcagcaaac cattcagaaa gcgaataagt taacgcccag 4140
tactactgag cccaaatcaa cacgcattaa gcagattaaa actaataaaa aagaagccgt 4200
gacctcggag cgtaaaaaac gtgcggagca tttgaagcca agctcttcag gtgatgaggc 4260
taaagttatt cctttcaacg cagtggaagc ggatgatcaa gaagattaca gcctacccac 4320
atacgtgcct gaattatttc aggatccacc agaaaaggat gagtcatgag tgctacccgg 4380
attcaagcag tttatcgtga tacgggggta gaggcttatc gtgataatcc ttttatcgag 4440
gccttaccac cattacaaga gtcagtgaat agtgctgcat cactgaaatc ctctttacag 4500
cttacttcct ctgacttgca aaagtcccgt gttatcagag ctcataccat ttgtcgtatt 4560
ccagatgact attttcagcc attaggtacg catttgctac taagtgagcg tatttcggtc 4620
atgattcgag gtggctacgt aggcagaaat cctaaaacag gagatttaca aaagcattta 4680
caaaatggtt atgagcgtgt tcaaacggga gagttggaga catttcgctt tgaggaggca 4740
cgatctacgg cacaaagctt attgttaatt ggttgttctg gtagtgggaa gacgacctct 4800
cttcatcgta ttctagccac gtatcctcag gtgatttacc atcgtgaact caatgtagag 4860
caggtggtgt atttgaaaat agactgctcg cataatggtt cgctaaaaga aatctgcttg 4920
aattttttca gagcgttgga tcgagccttg ggctcgaact atgagcgtcg ttatggctta 4980
aaacgtcatg gtatagaaac catgttggct ttgatgtcgc aaatagccaa tgcacatgct 5040
ttagggttgt tggttattga tgaaattcag catttaagcc gctctcgttc gggtggatct 5100
caagagatgc tgaacttttt tgtgacgatg gtgaatatta ttggcgtacc agtgatgttg 5160
attggtaccc ctaaagcacg agagattttt gaggctgatt tgcggtctgc acgtagaggg 5220
gcagggtttg gagctatatt ctgggatcct atacaacaaa cgcaacgtgg aaagcccaat 5280
caagagtgga tcgcttttac ggataatctt tggcaattac agcttttaca acgcaaagat 5340
gcgctgttat cggatgaggt ccgtgatgtg tggtatgagc taagccaagg agtgatggac 5400
attgtagtaa aactttttgt actcgctcag ctccgtgcgc tagctttagg caatgagcgt 5460
attaccgctg gtttattgcg gcaagtgtat caagatgagt taaagcctgt gcaccccatg 5520
ctagaggcat tacgctcggg tatcccagaa cgcattgctc gttattctga tctagtcgtt 5580
cccgagattg ataaacggtt aatccaactt cagctagata tcgcagcgat acaagaacaa 5640
acaccagaag aaaaagccct tcaagagtta gataccgaag atcagcgtca tttatatctg 5700
atgctgaaag aggattacga ttcaagcctg ttaattccca ctattaaaaa agcgtttagc 5760
cagaatccaa cgatgacaag acaaaagtta ctgcctcttg ttttgcagtg gttgatggaa 5820
ggcgaaacgg tagtgtcaga actagaaaag ccctccaaga gtaaaaaggt ttcggctata 5880
aaggtagtca agcccagcga ctgggatagc ttgcctgata cggatttacg ttatatctat 5940
tcacaacgcc aacctgaaaa aaccatgcat gaacggttaa aagggaaagg ggtaatagtg 6000
gatatggcga gcttatttaa acaagcaggt tagccatgag aaactttcct gttccgtact 6060
cgaatgagct gatttatagc actattgcac gggcaggcgt ttatcaaggg attgttagtc 6120
ctaagcagct gttggatgag gtgtatggca accgcaaggt ggtcgctacc ttaggtctgc 6180
cctcgcattt aggtgtgata gcaagacatc tacatcaaac aggacgttac gctgttcagc 6240
agcttattta tgagcatacc ttattccctt tatatgctcc gtttgtaggc aaggagcgcc 6300
gagacgaagc tattcggtta atggagtacc aagcgcaagg tgcggtgcat ttaatgctag 6360
gagtcgctgc ttctagagtt aagagcgata accgctttag atactgccct gattgcgttg 6420
ctcttcagct aaataggtat ggggaagcct tttggcaacg agattggtat ttgcccgctt 6480
tgccatattg tccaaaacac ggtgctttag tcttctttga tagagctgta gatgatcacc 6540
gacatcaatt ttgggctttg ggtcatactg agctgctttc agactacccc aaagactccc 6600
tatctcaatt aacagcacta gctgcttata tagcccctct gttagatgct ccacgagcgc 6660
aagagctttc cccaagcctt gagcagtgga cgctgtttta tcagcgctta gcgcaggatc 6720
tagggctaac caaaagcaag cacattcgtc atgacttggt ggcggagaga gtgaggcaga 6780
cttttagtga tgaggcacta gagaaactgg atttaaagtt ggcagagaac aaggacacgt 6840
gttggctgaa aagtatattc cgtaagcata gaaaagcctt tagttattta cagcatagta 6900
ttgtgtggca agccttattg ccaaaactaa cggttataga agcgctacag caggcaagtg 6960
ctcttactga gcactctata acgacaagac ctgttagcca gtctgtgcaa cctaactctg 7020
aagatttatc tgttaagcat aaagactggc agcaactagt gcataaatac caaggaatta 7080
aggcggcaag acagtcttta gagggtgggg tgctatacgc ttggctttac cgacatgaca 7140
gggattggct agttcactgg aatcaacagc atcaacaaga gcgtctggca cccgccccta 7200
gagttgattg gaaccaaaga gatcgaattg ctgtacgaca actattaaga atcataaagc 7260
gtctagatag tagccttgat cacccaagag cgacatcgag ctggctgtta aagcaaactc 7320
ctaacggaac ctctcttgca aaaaatctac agaaactgcc tttggtagcg ctttgcttaa 7380
agcgttactc agagagtgtg gaagattatc aaattagacg gattagccaa gcttttatta 7440
agcttaaaca ggaagatgtt gagcttaggc gctggcgatt attaagaagt gcaacgttat 7500
ctaaagagcg gataactgag gaagcacaaa gattcttgga aatggtttat ggggaagagt 7560
gagtggttag gctagctaca tttaatgaca atgtgcaggt tgtacatatt ggtcatttat 7620
tccgtaactc gggtcataag gagtggcgta tttttgtttg gtttaatcca atgcaagaac 7680
ggaaatggac tcgatttact catttgcctt tattaagtcg agctaaggtg gttaacagta 7740
caacaaagca aataaataag gcggatcgtg tgattgagtt tgaagcatcg gatcttcaac 7800
gagccaaaat aatcgatttt cctaatctct cgtcctttgc ttccgtacgc aacaaggatg 7860
gagcgcagag ttcatttatt tacgaagctg aaacaccata tagcaagact cgttatcaca 7920
tcccacagtt agagctagct cggtcattat ttttagggga tcctctagag tcgacctgca 7980
ggcatgcaag cttggctgtt ttggcggatg agagaagatt ttcagcctga tacagattaa 8040
atcagaacgc agaagcggtc tgataaaaca gaatttgcct ggcggcagta gcgcggtggt 8100
cccacctgac cccatgccga actcagaagt gaaacgccgt agcgccgatg gtagtgtggg 8160
gtctccccat gcgagagtag ggaactgcca ggcatcaaat aaaacgaaag gctcagtcga 8220
aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg agtaggacaa 8280
atccgccggg agcggatttg aacgttgcga agcaacggcc cggagggtgg cgggcaggac 8340
gcccgccata aactgccagg catcaaatta agcagaaggc catcctgacg gatggccttt 8400
ttgcgtttct acaaactctt ttgtttattt ttctaaatac attcaaatat gtatccgctc 8460
atgagacaat aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt 8520
caacatttcc gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct 8580
cacccagaaa cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt 8640
tacatcgaac tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt 8700
tttccaatga tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtgttgac 8760
gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac 8820
tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct 8880
gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg 8940
aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg 9000
gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgcagca 9060
atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa 9120
caattaatag actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt 9180
ccggctggct ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc 9240
attgcagcac tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg 9300
agtcaggcaa ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt 9360
aagcattggt aactgtcaga ccaagtttac tcatatatac tttagattga tttacgcgcc 9420
ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 9480
tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 9540
cgccggccag cctcgcagag caggattccc gttgagcacc gccaggtgcg aataagggac 9600
agtgaagaag gaacacccgc tcgcgggtgg gcctacttca cctatcctgc ccggcggcat 9660
caccggcgcc acaggtgcgg ttgctggcgc ctatatcgcc gacatcaccg atggggaaga 9720
tcgggctcgc cacttcgggc tcatgagcgc ttgtttcggc gtgggtatgg tggcaggccc 9780
cgtggccggg ggactgttgg gcgccatctc cttgcatgca ccattccttg cggcggcggt 9840
gctcaacggc ctcaacctac tactgggctg cttcctaatg caggagtcgc ataagggaga 9900
gcgtcgatcc ccgacagtaa gacgggtaag cctgttgatg ataccgctgc cttactgggt 9960
gcattagcca gtctgaatga cctgtcacgg gataatccga agtggtcaga ctggaaaatc 10020
agagggcagg aactgctgaa cagcaaaaag tcagatagca ccacatagca gacccgccat 10080
aaaacgccct gagaagcccg tgacgggctt ttcttgtatt atgggtagtt tccttgcatg 10140
aatccataaa aggcgcctgt agtgccattt acccccattc actgccagag ccgtgagcgc 10200
agcgaactga atgtcacgaa aaagacagcg actcaggtgc ctgatggtcg gagacaaaag 10260
gaatattcag cgatttgccc gagcttgcga gggtgctact taagccttta gggttttaag 10320
gtctgttttg tagaggagca aacagcgttt gcgacatcct tttgtaatac tgcggaactg 10380
actaaagtag tgagttatac acagggctgg gatctattct ttttatcttt ttttattctt 10440
tctttattct ataaattata accacttgaa tataaacaaa aaaaacacac aaaggtctag 10500
cggaatttac agagggtcta gcagaattta caagttttcc agcaaaggtc tagcagaatt 10560
tacagatacc cacaactcaa aggaaaagga ctagtaatta tcattgacta gcccatctca 10620
attggtatag tgattaaaat cacctagacc aattgagatg tatgtctgaa ttagttgttt 10680
tcaaagcaaa tgaactagcg attagtcgct atgacttaac ggagcatgaa accaagctaa 10740
ttttatgctg tgtggcacta ctcaacccca cgattgaaaa ccctacaagg aaagaacgga 10800
cggtatcgtt cacttataac caatacgttc agatgatgaa catcagtagg gaaaatgctt 10860
atggtgtatt agctaaagca accagagagc tgatgacgag aactgtggaa atcaggaatc 10920
ctttggttaa aggctttgag attttccagt ggacaaacta tgccaagttc tcaagcgaaa 10980
aattagaatt agtttttagt gaagagatat tgccttatct tttccagtta aaaaaattca 11040
taaaatataa tctggaacat gttaagtctt ttgaaaacaa atactctatg aggatttatg 11100
agtggttatt aaaagaacta acacaaaaga aaactcacaa ggcaaatata gagattagcc 11160
ttgatgaatt taagttcatg ttaatgcttg aaaataacta ccatgagttt aaaaggctta 11220
accaatgggt tttgaaacca ataagtaaag atttaaacac ttacagcaat atgaaattgg 11280
tggttgataa gcgaggccgc ccgactgata cgttgatttt ccaagttgaa ctagatagac 11340
aaatggatct cgtaaccgaa cttgagaaca accagataaa aatgaatggt gacaaaatac 11400
caacaaccat tacatcagat tcctacctac ataacggact aagaaaaaca ctacacgatg 11460
ctttaactgc aaaaattcag ctcaccagtt ttgaggcaaa atttttgagt gacatgcaaa 11520
gtaagtatga tctcaatggt tcgttctcat ggctcacgca aaaacaacga accacactag 11580
agaacatact ggctaaatac ggaaggatct gaggttctta tggctcttgt atctatcagt 11640
gaagcatcaa gactaacaaa caaaagtaga acaactgttc accgttacat atcaaaggga 11700
aaactgtcca tatgcacaga tgaaaacggt gtaaaaaaga tagatacatc agagctttta 11760
cgagtttttg gtgcatttaa agctgttcac catgaacaga tcgacaatgt aacagatgaa 11820
cagcatgtaa cacctaatag aacaggtgaa accagtaaaa caaagcaact agaacatgaa 11880
attgaacacc tgagacaact tgttacagct caacagtcac acatagacag cctgaaacag 11940
gcgatgctgc ttatcgaatc aaagctgccg acaacacggg agccagtgac gcctcccgtg 12000
gggaaaaaat catggcaatt ctggaagaaa tagcgctttc agcctgtggg cggacaaaat 12060
agttgggaac tgggaggggt ggaaatggag tttttaagga ttatttaggg aagagtgaca 12120
aaatagatgg gaactgggtg tagcgtcgta agctaatacg aaaattaaaa atgacaaaat 12180
agtttggaac tagatttcac ttatctggtt ggtcgacact agtattaccc tgttatccct 12240
agatttaaat gatatcggat cctagtaagc cacgttttaa ttaatcagat gggtcaatag 12300
cggccgccaa ttcgcgcgcg aaggcgaagc ggcatgcatt tacgttgaca ccatcgaatg 12360
gtgcaaaacc tttcgcggta tggcatgata gcgcccggaa gagagtcaat tcagggtggt 12420
gaatgtgaaa ccagtaacgt tatacgatgt cgcagagtat gccggtgtct cttatcagac 12480
cgtttcccgc gtggtgaacc aggccagcca cgtttctgcg aaaacgcggg aaaaagtgga 12540
agcggcgatg gcggagctga attacattcc caaccgcgtg gcacaacaac tggcgggcaa 12600
acagtcgttg ctgattggcg ttgccacctc cagtctggcc ctgcacgcgc cgtcgcaaat 12660
tgtcgcggcg attaaatctc gcgccgatca actgggtgcc agcgtggtgg tgtcgatggt 12720
agaacgaagc ggcgtcgaag cctgtaaagc ggcggtgcac aatcttctcg cgcaacgcgt 12780
cagtgggctg atcattaact atccgctgga tgaccaggat gccattgctg tggaagctgc 12840
ctgcactaat gttccggcgt tatttcttga tgtctctgac cagacaccca tcaacagtat 12900
tattttctcc catgaagacg gtacgcgact gggcgtggag catctggtcg cattgggtca 12960
ccagcaaatc gcgctgttag cgggcccatt aagttctgtc tcggcgcgtc tgcgtctggc 13020
tggctggcat aaatatctca ctcgcaatca aattcagccg atagcggaac gggaaggcga 13080
ctggagtgcc atgtccggtt ttcaacaaac catgcaaatg ctgaatgagg gcatcgttcc 13140
cactgcgatg ctggttgcca acgatcagat ggcgctgggc gcaatgcgcg ccattaccga 13200
gtccgggctg cgcgttggtg cggatatctc ggtagtggga tacgacgata ccgaagacag 13260
ctcatgttat atcccgccgt caaccaccat caaacaggat tttcgcctgc tggggcaaac 13320
cagcgtggac cgcttgctgc aactctctca gggccaggcg gtgaagggca atcagctgtt 13380
gcccgtctca ctggtgaaaa gaaaaaccac cctggcgccc aatacgcaaa ccgcctctcc 13440
ccgcgcgttg gccgattcat taatgcagct ggcacgacag gtttcccgac tggaaagcgg 13500
gcagtgagcg caacgcaatt aatgtgagtt agcgcgaatt gatctggttt gacagcttat 13560
catcgactgc acggtgcacc aatgcttctg gcgtcaggca gccatcggaa gctgtggtat 13620
ggctgtgcag gtcgtaaatc actgcataat tcgtgtcgct caaggcgcac tcccgttctg 13680
gataatgttt tttgcgccga catcataacg gttctggcaa atattctgaa atgagctgtt 13740
gacaattaat catccggctc gtataatgtg tggaattgtg agcggataac aatttcacac 13800
aggaaacagc gccgctgaga aaaagcgaag cggcactgct ctttaacaat ttatcagaca 13860
atctgtgtgg gcactcgacc ggaattatcg attaacttta ttattaaaaa ttaaagaggt 13920
atatattaat gtatcgatta aataaggagg aataaaccat ggcggacacg ttattgattc 13980
tgggtgatag cctgagcgcc gggtatcgaa tgtctgccag cgcggcctgg cctgccttgt 14040
tgaatgataa gtggcagagt aaaacgtcgg tagttaatgc cagcatcagc ggcgacacct 14100
cgcaacaagg actggcgcgc cttccggctc tgctgaaaca gcatcagccg cgttgggtgc 14160
tggttgaact gggcggcaat gacggtttgc gtggttttca gccacagcaa accgagcaaa 14220
cgctgcgcca gattttgcag gatgtcaaag ccgccaacgc tgaaccattg ttaatgcaaa 14280
tacgtctgcc tgcaaactat ggtcgccgtt ataatgaagc ctttagcgcc atttacccca 14340
aactcgccaa agagtttgat gttccgctgc tgcccttttt tatggaagag gtctacctca 14400
agccacaatg gatgcaggat gacggtattc atcccaaccg cgacgcccag ccgtttattg 14460
ccgactggat ggcgaagcag ttgcagcctt tagtaaatca tgactcataa tgactctaga 14520
aataatttaa atggaattcg aagcttgggc ccgaacaaaa actcatctca gaagaggatc 14580
tgaatagcgc cgtcgaccat catcatcatc atcattgagt ttaaacggtc tccagcttgg 14640
ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag aacgcagaag 14700
cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 14760
gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag 14820
agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 14880
gttttatctg ttgtttgtcg gtgaacgctc tcctgattaa ttaagacgtc ccgtcaagtc 14940
agcgtaatgc cctaggaggc gcgccacggc cgcgtcgacc ccacgcccct ctttaatacg 15000
acgggcaatt tgcacttcag aaaatgaaga gtttgcttta gccataacaa aagtccagta 15060
tgctttttca cagcataact ggactgattt cagtttacaa ctattctgtc tagtttaaga 15120
ctttattgtc atagtttaga tctattttgt tcagtttaag actttattgt ccgcccaca 15179
<210> 17
<211> 17683
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述: 合成的多核苷酸"
<400> 17
ggccacgatg cgtccggcgt agaggatctg ctcatgtttg acagcttatc atcgatgcat 60
aatgtgcctg tcaaatggac gaagcaggga ttctgcaaac cctatgctac tccgtcaagc 120
cgtcaattgt ctgattcgtt accaattatg acaacttgac ggctacatca ttcacttttt 180
cttcacaacc ggcacggaac tcgctcgggc tggccccggt gcatttttta aatacccgcg 240
agaaatagag ttgatcgtca aaaccaacat tgcgaccgac ggtggcgata ggcatccggg 300
tggtgctcaa aagcagcttc gcctggctga tacgttggtc ctcgcgccag cttaagacgc 360
taatccctaa ctgctggcgg aaaagatgtg acagacgcga cggcgacaag caaacatgct 420
gtgcgacgct ggcgatatca aaattgctgt ctgccaggtg atcgctgatg tactgacaag 480
cctcgcgtac ccgattatcc atcggtggat ggagcgactc gttaatcgct tccatgcgcc 540
gcagtaacaa ttgctcaagc agatttatcg ccagcagctc cgaatagcgc ccttcccctt 600
gcccggcgtt aatgatttgc ccaaacaggt cgctgaaatg cggctggtgc gcttcatccg 660
ggcgaaagaa ccccgtattg gcaaatattg acggccagtt aagccattca tgccagtagg 720
cgcgcggacg aaagtaaacc cactggtgat accattcgcg agcctccgga tgacgaccgt 780
agtgatgaat ctctcctggc gggaacagca aaatatcacc cggtcggcaa acaaattctc 840
gtccctgatt tttcaccacc ccctgaccgc gaatggtgag attgagaata taacctttca 900
ttcccagcgg tcggtcgata aaaaaatcga gataaccgtt ggcctcaatc ggcgttaaac 960
ccgccaccag atgggcatta aacgagtatc ccggcagcag gggatcattt tgcgcttcag 1020
ccatactttt catactcccg ccattcagag aagaaaccaa ttgtccatat tgcatcagac 1080
attgccgtca ctgcgtcttt tactggctct tctcgctaac caaaccggta accccgctta 1140
ttaaaagcat tctgtaacaa agcgggacca aagccatgac aaaaacgcgt aacaaaagtg 1200
tctataatca cggcagaaaa gtccacattg attatttgca cggcgtcaca ctttgctatg 1260
ccatagcatt tttatccata agattagcgg atcctacctg acgcttttta tcgcaactct 1320
ctactgtttc tccatacccg tttttttggg ctagcgaatt cgagctcggt acccaagtct 1380
taaactagac agaatagttg taaactgaaa tcagtccagt tatgctgtga aaaagcatac 1440
tggacttttg ttatggctaa agcaaactct tcattttctg aagtgcaaat tgcccgtcgt 1500
attaaagagg ggcgtggcca agggcatggt aaagactata ttccatggct aacagtacaa 1560
gaagttcctt cttcaggtcg ttcccaccgt atttattctc ataagacggg acgagtccat 1620
catttgctat ctgacttaga gcttgctgtt tttctcagtc ttgagtggga gagcagcgtg 1680
ctagatatac gcgagcagtt ccccttatta cctagtgata ccaggcagat tgcaatagat 1740
agtggtatta agcatcctgt tattcgtggt gtagatcagg ttatgtctac tgatttttta 1800
gtggactgca aagatggtcc ttttgagcag tttgctattc aagtcaaacc tgcagcagcc 1860
ttacaagacg agcgtacctt agaaaaacta gaactagagc gtcgctattg gcagcaaaag 1920
caaattcctt ggttcatttt tactgataaa gaaataaatc ccgtagtaaa agaaaatatt 1980
gaatggcttt attcagtgaa aacagaagaa gtttctgcgg agcttttagc acaactatcc 2040
ccattggccc atatcctgca agaaaaagga gatgaaaaca ttatcaatgt ctgtaagcag 2100
gttgatattg cttatgattt ggagttaggc aaaacattga gtgagatacg agccttaacc 2160
gcaaatggtt ttattaagtt caatatttat aagtctttca gggcaaataa gtgtgcagat 2220
ctctgtatta gccaagtagt gaatatggag gagttgcgct atgtggcaaa ttaatgaggt 2280
tgtgctattt gataatgatc cgtatcgcat tttggctata gaggatggcc aagttgtctg 2340
gatgcaaata agcgctgata aaggagttcc acaagctagg gctgagttgt tgctaatgca 2400
gtatttagat gaaggccgct tagttagaac tgatgaccct tatgtacatc ttgatttaga 2460
agagccgtct gtagattctg tcagcttcca gaagcgcgag gaggattatc gaaaaattct 2520
tcctattatt aatagtaagg atcgtttcga ccctaaagtc agaagcgaac tcgttgagca 2580
tgtggtccaa gaacataagg ttactaaggc tacagtttat aagttgttac gccgttactg 2640
gcagcgtggt caaacgccta atgcattaat tcctgactac aaaaacagcg gtgcaccagg 2700
ggaaagacgt tcagcgacag gaacagcaaa gattggccga gccagagaat atggtaaggg 2760
tgaaggaacc aaggtaacgc ccgagattga acgccttttt aggttgacca tagaaaagca 2820
cctgttaaat caaaaaggta caaagaccac cgttgcctat agacgatttg tggacttgtt 2880
tgctcagtat tttcctcgca ttccccaaga ggattaccca acactacgtc agtttcgtta 2940
tttttatgat cgagaatacc ctaaagctca gcgcttaaag tctagagtta aagcaggggt 3000
atataaaaaa gacgtacgac ccttaagtag tacagccact tctcaggcgt taggccctgg 3060
gagtcgttat gagattgatg ccacgattgc tgatatttat ttagtggatc atcatgatcg 3120
ccaaaaaatc ataggaagac caacgcttta cattgtgatt gatgtgttta gtcggatgat 3180
cacgggcttt tatatcggct ttgaaaatcc gtcttatgtg gtggcgatgc aggcttttgt 3240
aaatgcttgc tctgacaaaa cggccatttg tgcccagcat gatattgaga ttagtagctc 3300
agactggccg tgtgtaggtt tgccagatgt gttgctagcg gaccgtggcg aattaatgag 3360
tcatcaggtc gaagccttag tttctagttt taatgtgcga gtggaaagtg ctccacctag 3420
acgtggcgat gctaaaggca tagtggaaag cacttttaga acactacaag ccgagtttaa 3480
gtcctttgca cctggcattg tagagggcag tcggatcaaa agccatggtg aaacagacta 3540
taggttagat gcatctctgt cggtatttga gttcacacaa attattttgc gtacgatctt 3600
attcagaaat aaccatctgg tgatggataa atacgatcga gatgctgatt ttcctacaga 3660
tttaccgtct attcctgtcc agctatggca atggggtatg cagcatcgta caggtagttt 3720
aagggctgtg gagcaagagc agttgcgagt agcgttactg cctcgccgaa aggtctctat 3780
ttcttcattt ggcgttaatt tgtggggttt gtattactcg gggtcagaga ttctgcgtga 3840
gggttggttg cagcggagca ctgatatagc tagacctcaa catttagaag cggcttatga 3900
cccagtgctg gttgatacga tttatttgtt tccgcaagtt ggcagccgtg tattttggcg 3960
ctgtaatctg acggaacgta gtcggcagtt taaaggtctc tcattttggg aggtttggga 4020
tatacaagca caagaaaaac acaataaagc caatgcgaag caggatgagt taactaaacg 4080
cagggagctt gaggcgttta ttcagcaaac cattcagaaa gcgaataagt taacgcccag 4140
tactactgag cccaaatcaa cacgcattaa gcagattaaa actaataaaa aagaagccgt 4200
gacctcggag cgtaaaaaac gtgcggagca tttgaagcca agctcttcag gtgatgaggc 4260
taaagttatt cctttcaacg cagtggaagc ggatgatcaa gaagattaca gcctacccac 4320
atacgtgcct gaattatttc aggatccacc agaaaaggat gagtcatgag tgctacccgg 4380
attcaagcag tttatcgtga tacgggggta gaggcttatc gtgataatcc ttttatcgag 4440
gccttaccac cattacaaga gtcagtgaat agtgctgcat cactgaaatc ctctttacag 4500
cttacttcct ctgacttgca aaagtcccgt gttatcagag ctcataccat ttgtcgtatt 4560
ccagatgact attttcagcc attaggtacg catttgctac taagtgagcg tatttcggtc 4620
atgattcgag gtggctacgt aggcagaaat cctaaaacag gagatttaca aaagcattta 4680
caaaatggtt atgagcgtgt tcaaacggga gagttggaga catttcgctt tgaggaggca 4740
cgatctacgg cacaaagctt attgttaatt ggttgttctg gtagtgggaa gacgacctct 4800
cttcatcgta ttctagccac gtatcctcag gtgatttacc atcgtgaact caatgtagag 4860
caggtggtgt atttgaaaat agactgctcg cataatggtt cgctaaaaga aatctgcttg 4920
aattttttca gagcgttgga tcgagccttg ggctcgaact atgagcgtcg ttatggctta 4980
aaacgtcatg gtatagaaac catgttggct ttgatgtcgc aaatagccaa tgcacatgct 5040
ttagggttgt tggttattga tgaaattcag catttaagcc gctctcgttc gggtggatct 5100
caagagatgc tgaacttttt tgtgacgatg gtgaatatta ttggcgtacc agtgatgttg 5160
attggtaccc ctaaagcacg agagattttt gaggctgatt tgcggtctgc acgtagaggg 5220
gcagggtttg gagctatatt ctgggatcct atacaacaaa cgcaacgtgg aaagcccaat 5280
caagagtgga tcgcttttac ggataatctt tggcaattac agcttttaca acgcaaagat 5340
gcgctgttat cggatgaggt ccgtgatgtg tggtatgagc taagccaagg agtgatggac 5400
attgtagtaa aactttttgt actcgctcag ctccgtgcgc tagctttagg caatgagcgt 5460
attaccgctg gtttattgcg gcaagtgtat caagatgagt taaagcctgt gcaccccatg 5520
ctagaggcat tacgctcggg tatcccagaa cgcattgctc gttattctga tctagtcgtt 5580
cccgagattg ataaacggtt aatccaactt cagctagata tcgcagcgat acaagaacaa 5640
acaccagaag aaaaagccct tcaagagtta gataccgaag atcagcgtca tttatatctg 5700
atgctgaaag aggattacga ttcaagcctg ttaattccca ctattaaaaa agcgtttagc 5760
cagaatccaa cgatgacaag acaaaagtta ctgcctcttg ttttgcagtg gttgatggaa 5820
ggcgaaacgg tagtgtcaga actagaaaag ccctccaaga gtaaaaaggt ttcggctata 5880
aaggtagtca agcccagcga ctgggatagc ttgcctgata cggatttacg ttatatctat 5940
tcacaacgcc aacctgaaaa aaccatgcat gaacggttaa aagggaaagg ggtaatagtg 6000
gatatggcga gcttatttaa acaagcaggt tagccatgag aaactttcct gttccgtact 6060
cgaatgagct gatttatagc actattgcac gggcaggcgt ttatcaaggg attgttagtc 6120
ctaagcagct gttggatgag gtgtatggca accgcaaggt ggtcgctacc ttaggtctgc 6180
cctcgcattt aggtgtgata gcaagacatc tacatcaaac aggacgttac gctgttcagc 6240
agcttattta tgagcatacc ttattccctt tatatgctcc gtttgtaggc aaggagcgcc 6300
gagacgaagc tattcggtta atggagtacc aagcgcaagg tgcggtgcat ttaatgctag 6360
gagtcgctgc ttctagagtt aagagcgata accgctttag atactgccct gattgcgttg 6420
ctcttcagct aaataggtat ggggaagcct tttggcaacg agattggtat ttgcccgctt 6480
tgccatattg tccaaaacac ggtgctttag tcttctttga tagagctgta gatgatcacc 6540
gacatcaatt ttgggctttg ggtcatactg agctgctttc agactacccc aaagactccc 6600
tatctcaatt aacagcacta gctgcttata tagcccctct gttagatgct ccacgagcgc 6660
aagagctttc cccaagcctt gagcagtgga cgctgtttta tcagcgctta gcgcaggatc 6720
tagggctaac caaaagcaag cacattcgtc atgacttggt ggcggagaga gtgaggcaga 6780
cttttagtga tgaggcacta gagaaactgg atttaaagtt ggcagagaac aaggacacgt 6840
gttggctgaa aagtatattc cgtaagcata gaaaagcctt tagttattta cagcatagta 6900
ttgtgtggca agccttattg ccaaaactaa cggttataga agcgctacag caggcaagtg 6960
ctcttactga gcactctata acgacaagac ctgttagcca gtctgtgcaa cctaactctg 7020
aagatttatc tgttaagcat aaagactggc agcaactagt gcataaatac caaggaatta 7080
aggcggcaag acagtcttta gagggtgggg tgctatacgc ttggctttac cgacatgaca 7140
gggattggct agttcactgg aatcaacagc atcaacaaga gcgtctggca cccgccccta 7200
gagttgattg gaaccaaaga gatcgaattg ctgtacgaca actattaaga atcataaagc 7260
gtctagatag tagccttgat cacccaagag cgacatcgag ctggctgtta aagcaaactc 7320
ctaacggaac ctctcttgca aaaaatctac agaaactgcc tttggtagcg ctttgcttaa 7380
agcgttactc agagagtgtg gaagattatc aaattagacg gattagccaa gcttttatta 7440
agcttaaaca ggaagatgtt gagcttaggc gctggcgatt attaagaagt gcaacgttat 7500
ctaaagagcg gataactgag gaagcacaaa gattcttgga aatggtttat ggggaagagt 7560
gagtggttag gctagctaca tttaatgaca atgtgcaggt tgtacatatt ggtcatttat 7620
tccgtaactc gggtcataag gagtggcgta tttttgtttg gtttaatcca atgcaagaac 7680
ggaaatggac tcgatttact catttgcctt tattaagtcg agctaaggtg gttaacagta 7740
caacaaagca aataaataag gcggatcgtg tgattgagtt tgaagcatcg gatcttcaac 7800
gagccaaaat aatcgatttt cctaatctct cgtcctttgc ttccgtacgc aacaaggatg 7860
gagcgcagag ttcatttatt tacgaagctg aaacaccata tagcaagact cgttatcaca 7920
tcccacagtt agagctagct cggtcattat ttttagggga tcctctagag tcgacctgca 7980
ggcatgcaag cttggctgtt ttggcggatg agagaagatt ttcagcctga tacagattaa 8040
atcagaacgc agaagcggtc tgataaaaca gaatttgcct ggcggcagta gcgcggtggt 8100
cccacctgac cccatgccga actcagaagt gaaacgccgt agcgccgatg gtagtgtggg 8160
gtctccccat gcgagagtag ggaactgcca ggcatcaaat aaaacgaaag gctcagtcga 8220
aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg agtaggacaa 8280
atccgccggg agcggatttg aacgttgcga agcaacggcc cggagggtgg cgggcaggac 8340
gcccgccata aactgccagg catcaaatta agcagaaggc catcctgacg gatggccttt 8400
ttgcgtttct acaaactctt ttgtttattt ttctaaatac attcaaatat gtatccgctc 8460
atgagacaat aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt 8520
caacatttcc gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct 8580
cacccagaaa cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt 8640
tacatcgaac tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt 8700
tttccaatga tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtgttgac 8760
gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac 8820
tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct 8880
gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg 8940
aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg 9000
gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgcagca 9060
atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa 9120
caattaatag actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt 9180
ccggctggct ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc 9240
attgcagcac tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg 9300
agtcaggcaa ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt 9360
aagcattggt aactgtcaga ccaagtttac tcatatatac tttagattga tttacgcgcc 9420
ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 9480
tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 9540
cgccggccag cctcgcagag caggattccc gttgagcacc gccaggtgcg aataagggac 9600
agtgaagaag gaacacccgc tcgcgggtgg gcctacttca cctatcctgc ccggcggcat 9660
caccggcgcc acaggtgcgg ttgctggcgc ctatatcgcc gacatcaccg atggggaaga 9720
tcgggctcgc cacttcgggc tcatgagcgc ttgtttcggc gtgggtatgg tggcaggccc 9780
cgtggccggg ggactgttgg gcgccatctc cttgcatgca ccattccttg cggcggcggt 9840
gctcaacggc ctcaacctac tactgggctg cttcctaatg caggagtcgc ataagggaga 9900
gcgtcgatcc ccgacagtaa gacgggtaag cctgttgatg ataccgctgc cttactgggt 9960
gcattagcca gtctgaatga cctgtcacgg gataatccga agtggtcaga ctggaaaatc 10020
agagggcagg aactgctgaa cagcaaaaag tcagatagca ccacatagca gacccgccat 10080
aaaacgccct gagaagcccg tgacgggctt ttcttgtatt atgggtagtt tccttgcatg 10140
aatccataaa aggcgcctgt agtgccattt acccccattc actgccagag ccgtgagcgc 10200
agcgaactga atgtcacgaa aaagacagcg actcaggtgc ctgatggtcg gagacaaaag 10260
gaatattcag cgatttgccc gagcttgcga gggtgctact taagccttta gggttttaag 10320
gtctgttttg tagaggagca aacagcgttt gcgacatcct tttgtaatac tgcggaactg 10380
actaaagtag tgagttatac acagggctgg gatctattct ttttatcttt ttttattctt 10440
tctttattct ataaattata accacttgaa tataaacaaa aaaaacacac aaaggtctag 10500
cggaatttac agagggtcta gcagaattta caagttttcc agcaaaggtc tagcagaatt 10560
tacagatacc cacaactcaa aggaaaagga ctagtaatta tcattgacta gcccatctca 10620
attggtatag tgattaaaat cacctagacc aattgagatg tatgtctgaa ttagttgttt 10680
tcaaagcaaa tgaactagcg attagtcgct atgacttaac ggagcatgaa accaagctaa 10740
ttttatgctg tgtggcacta ctcaacccca cgattgaaaa ccctacaagg aaagaacgga 10800
cggtatcgtt cacttataac caatacgttc agatgatgaa catcagtagg gaaaatgctt 10860
atggtgtatt agctaaagca accagagagc tgatgacgag aactgtggaa atcaggaatc 10920
ctttggttaa aggctttgag attttccagt ggacaaacta tgccaagttc tcaagcgaaa 10980
aattagaatt agtttttagt gaagagatat tgccttatct tttccagtta aaaaaattca 11040
taaaatataa tctggaacat gttaagtctt ttgaaaacaa atactctatg aggatttatg 11100
agtggttatt aaaagaacta acacaaaaga aaactcacaa ggcaaatata gagattagcc 11160
ttgatgaatt taagttcatg ttaatgcttg aaaataacta ccatgagttt aaaaggctta 11220
accaatgggt tttgaaacca ataagtaaag atttaaacac ttacagcaat atgaaattgg 11280
tggttgataa gcgaggccgc ccgactgata cgttgatttt ccaagttgaa ctagatagac 11340
aaatggatct cgtaaccgaa cttgagaaca accagataaa aatgaatggt gacaaaatac 11400
caacaaccat tacatcagat tcctacctac ataacggact aagaaaaaca ctacacgatg 11460
ctttaactgc aaaaattcag ctcaccagtt ttgaggcaaa atttttgagt gacatgcaaa 11520
gtaagtatga tctcaatggt tcgttctcat ggctcacgca aaaacaacga accacactag 11580
agaacatact ggctaaatac ggaaggatct gaggttctta tggctcttgt atctatcagt 11640
gaagcatcaa gactaacaaa caaaagtaga acaactgttc accgttacat atcaaaggga 11700
aaactgtcca tatgcacaga tgaaaacggt gtaaaaaaga tagatacatc agagctttta 11760
cgagtttttg gtgcatttaa agctgttcac catgaacaga tcgacaatgt aacagatgaa 11820
cagcatgtaa cacctaatag aacaggtgaa accagtaaaa caaagcaact agaacatgaa 11880
attgaacacc tgagacaact tgttacagct caacagtcac acatagacag cctgaaacag 11940
gcgatgctgc ttatcgaatc aaagctgccg acaacacggg agccagtgac gcctcccgtg 12000
gggaaaaaat catggcaatt ctggaagaaa tagcgctttc agcctgtggg cggacaaaat 12060
agttgggaac tgggaggggt ggaaatggag tttttaagga ttatttaggg aagagtgaca 12120
aaatagatgg gaactgggtg tagcgtcgta agctaatacg aaaattaaaa atgacaaaat 12180
agtttggaac tagatttcac ttatctggtt ggtcgacact agtattaccc tgttatccct 12240
agatttaaat gatatcggat cctagtaagc cacgttttaa ttaatcagat gggtcaatag 12300
cggccgccaa ttcgcgcgcg aaggcgaagc ggcatgcatt tacgttgaca ccatcgaatg 12360
gtgcaaaacc tttcgcggta tggcatgata gcgcccggaa gagagtcaat tcagggtggt 12420
gaatgtgaaa ccagtaacgt tatacgatgt cgcagagtat gccggtgtct cttatcagac 12480
cgtttcccgc gtggtgaacc aggccagcca cgtttctgcg aaaacgcggg aaaaagtgga 12540
agcggcgatg gcggagctga attacattcc caaccgcgtg gcacaacaac tggcgggcaa 12600
acagtcgttg ctgattggcg ttgccacctc cagtctggcc ctgcacgcgc cgtcgcaaat 12660
tgtcgcggcg attaaatctc gcgccgatca actgggtgcc agcgtggtgg tgtcgatggt 12720
agaacgaagc ggcgtcgaag cctgtaaagc ggcggtgcac aatcttctcg cgcaacgcgt 12780
cagtgggctg atcattaact atccgctgga tgaccaggat gccattgctg tggaagctgc 12840
ctgcactaat gttccggcgt tatttcttga tgtctctgac cagacaccca tcaacagtat 12900
tattttctcc catgaagacg gtacgcgact gggcgtggag catctggtcg cattgggtca 12960
ccagcaaatc gcgctgttag cgggcccatt aagttctgtc tcggcgcgtc tgcgtctggc 13020
tggctggcat aaatatctca ctcgcaatca aattcagccg atagcggaac gggaaggcga 13080
ctggagtgcc atgtccggtt ttcaacaaac catgcaaatg ctgaatgagg gcatcgttcc 13140
cactgcgatg ctggttgcca acgatcagat ggcgctgggc gcaatgcgcg ccattaccga 13200
gtccgggctg cgcgttggtg cggatatctc ggtagtggga tacgacgata ccgaagacag 13260
ctcatgttat atcccgccgt caaccaccat caaacaggat tttcgcctgc tggggcaaac 13320
cagcgtggac cgcttgctgc aactctctca gggccaggcg gtgaagggca atcagctgtt 13380
gcccgtctca ctggtgaaaa gaaaaaccac cctggcgccc aatacgcaaa ccgcctctcc 13440
ccgcgcgttg gccgattcat taatgcagct ggcacgacag gtttcccgac tggaaagcgg 13500
gcagtgagcg caacgcaatt aatgtgagtt agcgcgaatt gatctggttt gacagcttat 13560
catcgactgc acggtgcacc aatgcttctg gcgtcaggca gccatcggaa gctgtggtat 13620
ggctgtgcag gtcgtaaatc actgcataat tcgtgtcgct caaggcgcac tcccgttctg 13680
gataatgttt tttgcgccga catcataacg gttctggcaa atattctgaa atgagctgtt 13740
gacaattaat catccggctc gtataatgtg tggaattgtg agcggataac aatttcacac 13800
aggaaacagc gccgctgaga aaaagcgaag cggcactgct ctttaacaat ttatcagaca 13860
atctgtgtgg gcactcgacc ggaattatcg attaacttta ttattaaaaa ttaaagaggt 13920
atatattaat gtatcgatta aataaggagg aataaaccat ggcggacacg ttattgattc 13980
tgggtgatag cctgagcgcc gggtatcgaa tgtctgccag cgcggcctgg cctgccttgt 14040
tgaatgataa gtggcagagt aaaacgtcgg tagttaatgc cagcatcagc ggcgacacct 14100
cgcaacaagg actggcgcgc cttccggctc tgctgaaaca gcatcagccg cgttgggtgc 14160
tggttgaact gggcggcaat gacggtttgc gtggttttca gccacagcaa accgagcaaa 14220
cgctgcgcca gattttgcag gatgtcaaag ccgccaacgc tgaaccattg ttaatgcaaa 14280
tacgtctgcc tgcaaactat ggtcgccgtt ataatgaagc ctttagcgcc atttacccca 14340
aactcgccaa agagtttgat gttccgctgc tgcccttttt tatggaagag gtctacctca 14400
agccacaatg gatgcaggat gacggtattc atcccaaccg cgacgcccag ccgtttattg 14460
ccgactggat ggcgaagcag ttgcagcctt tagtaaatca tgactcataa tgactctaga 14520
aataatttta gttaagtata agaaggagat ataccatggt gaagaaggtt tggcttaacc 14580
gttatcccgc ggacgttccg acggagatca accctgaccg ttatcaatct ctggtagata 14640
tgtttgagca gtcggtcgcg cgctacgccg atcaacctgc gtttgtgaat atgggggagg 14700
taatgacctt ccgcaagctg gaagaacgca gtcgcgcgtt tgccgcttat ttgcaacaag 14760
ggttggggct gaagaaaggc gatcgcgttg cgttgatgat gcctaattta ttgcaatatc 14820
cggtggcgct gtttggcatt ttgcgtgccg ggatgatcgt cgtaaacgtt aacccgttgt 14880
ataccccgcg tgagcttgag catcagctta acgatagcgg cgcatcggcg attgttatcg 14940
tgtctaactt tgctcacaca ctggaaaaag tggttgataa aaccgccgtt cagcacgtaa 15000
ttctgacccg tatgggcgat cagctatcta cggcaaaagg cacggtagtc aatttcgttg 15060
ttaaatacat caagcgtttg gtgccgaaat accatctgcc agatgccatt tcatttcgta 15120
gcgcactgca taacggctac cggatgcagt acgtcaaacc cgaactggtg ccggaagatt 15180
tagcttttct gcaatacacc ggcggcacca ctggtgtggc gaaaggcgcg atgctgactc 15240
accgcaatat gctggcgaac ctggaacagg ttaacgcgac ctatggtccg ctgttgcatc 15300
cgggcaaaga gctggtggtg acggcgctgc cgctgtatca catttttgcc ctgaccatta 15360
actgcctgct gtttatcgaa ctgggtgggc agaacctgct tatcactaac ccgcgcgata 15420
ttccagggtt ggtaaaagag ttagcgaaat atccgtttac cgctatcacg ggcgttaaca 15480
ccttgttcaa tgcgttgctg aacaataaag agttccagca gctggatttc tccagtctgc 15540
atctttccgc aggcggaggg atgccagtgc agcaagtggt ggcagagcgt tgggtgaaac 15600
tgacaggaca gtatctgctg gaaggctatg gccttaccga gtgtgcgccg ctggtcagcg 15660
ttaacccata tgatattgat tatcatagtg gtagcatcgg tttgccggtg ccgtcgacgg 15720
aagccaaact ggtggatgat gatgataatg aagtaccacc gggtcaaccg ggtgagcttt 15780
gtgtcaaagg accgcaggtg atgctgggtt actggcagcg tccggatgct acagatgaga 15840
tcatcaaaaa tggctggtta cacaccggcg acatcgcggt gatggatgaa gaagggttcc 15900
tgcgcattgt cgatcgtaaa aaagacatga ttctggtttc cggttttaac gtctatccca 15960
acgagattga agatgtcgtc atgcagcatc ctggcgtaca ggaagtcgcg gctgttggcg 16020
taccttccgg ctccagtggt gaagcggtga aaatcttcgt agtgaaaaaa gatccatcgc 16080
ttaccgaaga gtcactggtg accttttgcc gccgtcagct cacgggctac aaagtaccga 16140
agctggtgga gtttcgtgat gagttaccga aatctaacgt cggaaaaatt ttgcgacgag 16200
aattacgtga cgaagcgcgc ggcaaagtgg acaataaagc ctgataactc tagaaataat 16260
ttaaatggaa ttcgaagctt gggcccgaac aaaaactcat ctcagaagag gatctgaata 16320
gcgccgtcga ccatcatcat catcatcatt gagtttaaac ggtctccagc ttggctgttt 16380
tggcggatga gagaagattt tcagcctgat acagattaaa tcagaacgca gaagcggtct 16440
gataaaacag aatttgcctg gcggcagtag cgcggtggtc ccacctgacc ccatgccgaa 16500
ctcagaagtg aaacgccgta gcgccgatgg tagtgtgggg tctccccatg cgagagtagg 16560
gaactgccag gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta 16620
tctgttgttt gtcggtgaac gctctcctga ttaattaaga cgtctaagaa accattatta 16680
tcatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctt caagaatttt 16740
ataaaccgtg gagcgggcaa tactgagctg atgagcaatt tccgttgcac cagtgccctt 16800
ctgatgaagc gtcagcacga cgttcctgtc cacggtacgc ctgcggccaa atttgattcc 16860
tttcagcttt gcttcctgtc ggccctcatt cgtgcgctct aggatcctcc ggcgttcagc 16920
ctgtgccaca gccgacagga tggtgaccac catttgcccc atatcaccgt cggtactgat 16980
cccgtcgtca ataaaccgaa ccgctacacc ctgagcatca aactctttta tcagttggat 17040
catgtcggcg gtgtcgcggc caagacggtc gagcttcttc accagaatga catcaccttc 17100
ctccaccttc atcctcagca aatccagccc ttcccgatct gttgaactgc cggatgcctt 17160
gtcggtaaag atgcggttag cttttacccc tgcatctttg agcgctgagg tctgcctcgt 17220
gaagaaggtg ttgctgactc ataccaggcc tgaatcgccc catcatccag ccagaaagtg 17280
agggagccac ggttgatgag agctttgttg taggtggacc agttggtgat tttgaacttt 17340
tgctttgcca cggaacggtc tgcgttgtcg ggaagatgcg tgatctgatc cttcaactca 17400
gcaaaagttc gatttattca acaaagccgc cgtcccgtca agtcagcgta atgccctagg 17460
aggcgcgcca cggccgcgtc gaccccacgc ccctctttaa tacgacgggc aatttgcact 17520
tcagaaaatg aagagtttgc tttagccata acaaaagtcc agtatgcttt ttcacagcat 17580
aactggactg atttcagttt acaactattc tgtctagttt aagactttat tgtcatagtt 17640
tagatctatt ttgttcagtt taagacttta ttgtccgccc aca 17683
<210> 18
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述: 合成的引物"
<400> 18
gatgctggtg gcgaagctgt 20
<210> 19
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述: 合成的引物"
<400> 19
gttgcgacgg tggtacgcat aac 23
<210> 20
<211> 35
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述: 合成的引物"
<400> 20
gaggaataaa ccatgcccat tcttgaaagc gtggg 35
<210> 21
<211> 45
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述: 合成的引物"
<400> 21
agctggagac cgtttaaact tataaaccgc tgtttgtcgc aaccg 45
<210> 22
<211> 663
<212> DNA
<213> 未知
<220>
<221> 来源
<223> /注="未知的描述: 未培养的细菌RM44"
<400> 22
atgcccattc ttgaaagcgt gggtttcatg aagacgctat gggagagcgg cggcgctcag 60
gtcgccctga tggaatcgcg ggaagagacc agccacatgg tcggcatcct ggaagggatc 120
gccgccgaac tctcgtggcg tcctggtacg cagcttcgcg attatcagga tagggcggcg 180
cacctggccg ttctggtcgg gtcggagatc gtcggcggct tgcagatcgt cacgtcgccg 240
tcagcggatt gccttcccta ccggctcgtc tggccggaag tctgcgtgcc ggacggtgcc 300
gcaatcgcgg acatcacgat tctggcgcta cggaaggaat accgcgcccg cttcaacctc 360
ttctggccgc tgtgcgtcga gctctggcgg cactgtgtcg cggagggtgc cacggagatg 420
cgcctggagg caacgccgga tacgctcagg ctctaccgcc gcatcggctg gccgctggag 480
gtcatcggcg acctgcgcct ccactggaac gagccgtgct tcctgtgccg gatggggatc 540
gtagatgtcg cgggggcgat ggttgtgcgg gccttgcagt ccgccaccta tcaggcggtc 600
ctcgcgggga tgagtcggcc tgtggcgtca gcgtcgccgg ttgcgacaaa cagcggttta 660
tga 663

Claims (22)

1.经遗传修饰而过表达编码含有SEQ ID NO:1所示氨基酸序列的棕榈酰腐胺合酶(PPS)多肽或含有SEQ ID NO:3所示氨基酸序列的N-(4-氨基-2-羟丁基)十四酰胺合酶(AhtS)多肽的核酸序列的重组微生物体,其催化伯胺和酰基硫酯转化为脂肪酰胺,其中所述微生物体被进一步遗传工程化而过表达EC 3.1.2.14或E.C.3.1.1.5的硫酯酶。
2.根据权利要求1所述的重组微生物体,其中所述微生物体还表达EC 2.3.1.86的酰基-CoA合酶。
3.根据权利要求1或2所述的重组微生物体,其中所述PPS多肽:
(a)具有包含SEQ ID NO:1的氨基酸序列;或
(b)由包含SEQ ID NO:2的核酸序列编码。
4.根据权利要求1-3中任一项所述的重组微生物体,其中所述AhtS多肽:
a)具有包含SEQ ID NO:3的氨基酸序列,或
b)由包含SEQ ID NO:22的核酸序列编码。
5.根据权利要求1-4中任何一项所述的重组微生物体,其中所述伯胺选自:3-二甲氨基-1-丙胺、(±)-1-氨基-2-丙醇、2-甲氧基乙胺、3-氨基-1-丙醇、2-氨基-1,3-丙二醇、3-甲氧基丙胺、N-(2-羟乙基)乙二胺、丁胺、和1,4-二氨基丁烷、或其组合。
6.根据权利要求1-5中任何一项所述的重组微生物体,其中所述酰基硫酯为脂肪酰基-CoA。
7.根据权利要求6所述的重组微生物体,其中所述脂肪酰基-CoA是由所述酰基-CoA合酶产生的。
8.根据权利要求1-7中任一项的重组微生物体,其中所述微生物体还表达一种或多种脂肪酸生物合成多肽。
9.根据权利要求1至8中任一项所述的重组微生物体,其中所述硫酯酶多肽包含不具有所述前导序列的核酸序列。
10.根据权利要求2-9中任一项所述的重组微生物体,其中所述酰基辅酶A合酶多肽是来自大肠杆菌的fadD。
11.根据权利要求8所述的重组微生物体,其中所述脂肪酸生物合成多肽选自编码accABCD、FabD、FabH、FabG、FabB、FabA、FabZ、FabF、FabI或FadR的核酸序列。
12.根据权利要求1-11中任何一项所述的重组微生物体,其中所述微生物体为细菌、蓝细菌、藻类或真菌。
13.根据权利要求12所述的微生物体,其中所述真菌为酵母或丝状真菌。
14.根据权利要求1-12中任何一项所述的重组微生物体,其中所述微生物为酿酒酵母(Saccharomyces cerevisiae)、解脂假丝酵母(Candida lipolytica)、大肠埃希氏菌(Escherichia coli)、节杆菌(Arthrobacter)、红酵母(Rhodotorula glutinins)、不动杆菌(Acinetobacter)、解脂假丝酵母(Candida lipolytica)、布朗葡萄藻(Botryococciisbraunii)、弗尼斯弧菌(Vibrio furnissii)、藤黄微球菌(Micrococcus leuteus)、嗜麦芽寡养单胞菌(Stenotrophomonas maltophilia)、枯草芽孢杆菌(Bacillus subtilis)、地衣芽孢杆菌(Bacillus lichenoformis)、恶臭假单胞菌(Psuedomonus putida)、荧光假单胞菌(Psuedomonas florescens)、天蓝色链霉菌(Streptomyces coelicolor)、聚球藻属物种(Synechococcus sp.)PCC7002、细长嗜热蓝细菌(Thermosynechococciis elongatus)BP-1、桑椹型无绿藻(Prototheca moriformis)、克鲁格尼原藻(Prototheca krugani)、大型无绿藻(Prototheca stagnora)、中型无绿藻(Prototheca zopfli)或原壳小球藻(Chorellaprotothecoide)细胞。
15.根据权利要求14所述的重组微生物体,其中所述微生物体为节杆菌AK 19、不动杆菌属物种M-1株、大肠杆菌B、大肠杆菌C、大肠杆菌K或大肠杆菌W细胞。
16.根据权利要求1-15中任何一项所述的重组微生物体,其中所述棕榈酰腐胺合酶(PPS)多肽:
a)针对所述微生物体是内源的,或
b)针对所述微生物体是外源的。
17.根据权利要求1-16中任何一项所述的重组微生物体,其中所述脂肪酰胺为脂肪烷醇酰胺或脂肪酰胺胺。
18.根据权利要求1-17中任何一项所述的重组微生物体,其中所述微生物体表达丝氨酸脱羧酶多肽。
19.用于产生脂肪酰胺的方法,其包括:
(a)提供根据权利要求1-18中任何一项所述的重组微生物体;并且
(b)将所述重组微生物体在适合于编码PPS多肽或AhtS多肽的核酸序列过表达的条件下在所述多肽的至少一种底物存在下在培养基中进行培养。
20.根据权利要求19所述的方法,其进一步包括从培养基中分离所述脂肪酰胺。
21.根据权利要求19或20所述的方法,其中所述脂肪酰胺为:
a)C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19或C20脂肪烷醇酰胺;或
b)C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19或C20脂肪酰胺胺。
22.一种重组微生物体,其表达EC 2.3.1.86的酰基-CoA合酶。
CN202011494386.8A 2012-04-13 2013-03-12 烷醇酰胺及酰胺胺的微生物生产及其用途 Pending CN112522170A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261623711P 2012-04-13 2012-04-13
US61/623,711 2012-04-13
CN201380026545.3A CN104379735A (zh) 2012-04-13 2013-03-12 烷醇酰胺及酰胺胺的微生物生产及其用途

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201380026545.3A Division CN104379735A (zh) 2012-04-13 2013-03-12 烷醇酰胺及酰胺胺的微生物生产及其用途

Publications (1)

Publication Number Publication Date
CN112522170A true CN112522170A (zh) 2021-03-19

Family

ID=47913634

Family Applications (3)

Application Number Title Priority Date Filing Date
CN202011494386.8A Pending CN112522170A (zh) 2012-04-13 2013-03-12 烷醇酰胺及酰胺胺的微生物生产及其用途
CN201380026545.3A Pending CN104379735A (zh) 2012-04-13 2013-03-12 烷醇酰胺及酰胺胺的微生物生产及其用途
CN201810830455.4A Pending CN108949660A (zh) 2012-04-13 2013-03-12 烷醇酰胺及酰胺胺的微生物生产及其用途

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN201380026545.3A Pending CN104379735A (zh) 2012-04-13 2013-03-12 烷醇酰胺及酰胺胺的微生物生产及其用途
CN201810830455.4A Pending CN108949660A (zh) 2012-04-13 2013-03-12 烷醇酰胺及酰胺胺的微生物生产及其用途

Country Status (13)

Country Link
US (3) US9683247B2 (zh)
EP (2) EP4170026A1 (zh)
JP (1) JP6251241B2 (zh)
KR (3) KR102190262B1 (zh)
CN (3) CN112522170A (zh)
AU (1) AU2013246405B2 (zh)
BR (1) BR112014025519B1 (zh)
CA (2) CA2870257C (zh)
CO (1) CO7200250A2 (zh)
IN (1) IN2014DN09217A (zh)
MX (1) MX354883B (zh)
MY (1) MY167227A (zh)
WO (1) WO2013154721A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6251241B2 (ja) 2012-04-13 2017-12-20 アールイージー ライフ サイエンシズ リミテッド ライアビリティ カンパニー 微生物によるアルカノールアミドおよびアミドアミンの生産ならびにそれらの使用
US10900057B2 (en) 2013-12-05 2021-01-26 Genomatica, Inc. Recombinant microorganisms for the production of fatty amines
CN105884643B (zh) * 2016-05-12 2018-03-27 浙江海正药业股份有限公司 一种不饱和脂肪酸酰胺类化合物及其制备方法和用途
CN107022513A (zh) * 2017-03-17 2017-08-08 河北美邦工程科技股份有限公司 一种重组大肠杆菌菌株生产长链二元酸的方法
CN109082387B (zh) * 2018-03-14 2022-03-18 重庆理工大学 一种可低温去除高氨氮的异养硝化-好氧反硝化复合菌剂及其应用
EP3931330A4 (en) 2019-02-25 2023-03-15 Ginkgo Bioworks, Inc. BIOSYNTHESIS OF CANNABINOIDS AND CANNABINOID PRECURSORS
US11441162B2 (en) * 2019-03-08 2022-09-13 Massachusetts Institute Of Technology Human gut microbiome-derived biosynthetic enzymes for production of fatty acid amides
CN110272839B (zh) * 2019-05-08 2020-10-30 江南大学 一株不动杆菌及其在生产手性3-环己烯-1-甲酸中的应用
JP7380245B2 (ja) 2020-01-23 2023-11-15 富士電機株式会社 飲料供給装置
GB202019175D0 (en) * 2020-12-04 2021-01-20 Univ Tartu Biosynthesis method
US11286467B1 (en) 2020-12-14 2022-03-29 United Arab Emirates University System and method for production of fatty acid ethanolamides
WO2023178211A1 (en) 2022-03-16 2023-09-21 Genomatica, Inc. Microorganisms and methods for production of fatty acid derivatives with reduced levels of byproducts
WO2023178193A1 (en) 2022-03-16 2023-09-21 Genomatica, Inc. Acyl-acp thioesterase variants and uses thereof

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101490241A (zh) * 2006-05-19 2009-07-22 Ls9公司 脂肪酸及其衍生物的制备

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5028539A (en) 1988-08-31 1991-07-02 The University Of Florida Ethanol production using engineered mutant E. coli
US5482846A (en) 1988-08-31 1996-01-09 University Of Florida Ethanol production in Gram-positive microbes
US5424202A (en) 1988-08-31 1995-06-13 The University Of Florida Ethanol production by recombinant hosts
US5000000A (en) 1988-08-31 1991-03-19 University Of Florida Ethanol production by Escherichia coli strains co-expressing Zymomonas PDC and ADH genes
US5602030A (en) 1994-03-28 1997-02-11 University Of Florida Research Foundation Recombinant glucose uptake system
US6428767B1 (en) 1995-05-12 2002-08-06 E. I. Du Pont De Nemours And Company Method for identifying the source of carbon in 1,3-propanediol
US5576282A (en) 1995-09-11 1996-11-19 The Procter & Gamble Company Color-safe bleach boosters, compositions and laundry methods employing same
MA24136A1 (fr) 1996-04-16 1997-12-31 Procter & Gamble Fabrication d'agents de surface .
BR9812093B1 (pt) 1997-03-07 2009-12-01 composição detergente alvejante.
DE19731881C1 (de) 1997-07-24 1998-10-22 Henkel Kgaa Verwendung von Elektrolytgemischen als Sequestriermittel
WO1999060987A2 (en) 1998-05-29 1999-12-02 Neurosciences Research Foundation, Inc. Control of pain with endogenous cannabinoids
WO2008100251A1 (en) 2007-02-13 2008-08-21 Ls9, Inc. Modified microorganism uses therefor
KR20090029708A (ko) 2006-05-19 2009-03-23 엘에스9, 인코포레이티드 지방산 및 이의 유도체의 제조
US20100242345A1 (en) 2006-05-19 2010-09-30 LS9, Inc Production of fatty acids & derivatives thereof
EP3369807A3 (en) 2007-03-28 2018-11-21 REG Life Sciences, LLC Enhanced production of fatty acid derivatives
US8048654B2 (en) * 2010-06-09 2011-11-01 Joule Unlimited Technologies, Inc. Methods and compositions for the recombinant biosynthesis of fatty acids and esters
CA2738938C (en) 2008-10-07 2019-04-30 Ls9, Inc. Methods and compositions for producing fatty aldehydes
KR101700296B1 (ko) 2008-10-28 2017-01-26 알이지 라이프 사이언시스, 엘엘씨 지방족 알코올들을 생산하기 위한 방법들과 조성물들
AU2009329970B2 (en) 2008-12-23 2016-07-28 Genomatica, Inc. Methods and compositions related to thioesterase enzymes
CA2758301A1 (en) 2009-04-10 2010-10-14 Ls9, Inc. Production of fatty acid derivatives
MX2012003472A (es) 2009-09-25 2012-05-22 Ls9 Inc Produccion de derivados de acido graso.
WO2011100667A1 (en) 2010-02-14 2011-08-18 Ls9, Inc. Surfactant and cleaning compositions comprising microbially produced branched fatty alcohols
JP6251241B2 (ja) 2012-04-13 2017-12-20 アールイージー ライフ サイエンシズ リミテッド ライアビリティ カンパニー 微生物によるアルカノールアミドおよびアミドアミンの生産ならびにそれらの使用

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101490241A (zh) * 2006-05-19 2009-07-22 Ls9公司 脂肪酸及其衍生物的制备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JEFFREY W. CRAIG等: "Expanding Small-Molecule Functional Metagenomics through Parallel Screening of Broad Host-Range Cosmid Environmental DNA Libraries in Diverse Proteobacteria", 《APPLIED AND ENVIRONMENTAL MICROBIOLOGY》 *
SEAN F. BRADY等: ""Palmitoylputrescine, an Antibiotic Isolated from the Heterologous Expression of DNA Extracted from Bromeliad Tank Water"", 《JOURNAL OF NATURAL PRODUCTS》 *

Also Published As

Publication number Publication date
IN2014DN09217A (zh) 2015-07-10
US10975402B2 (en) 2021-04-13
US10392637B2 (en) 2019-08-27
MX354883B (es) 2018-03-23
AU2013246405B2 (en) 2018-08-02
KR102190262B1 (ko) 2020-12-14
KR20210091353A (ko) 2021-07-21
EP2836593A1 (en) 2015-02-18
CA2870257A1 (en) 2013-10-17
CA3081178A1 (en) 2013-10-17
US20170292120A1 (en) 2017-10-12
US20200232001A1 (en) 2020-07-23
JP6251241B2 (ja) 2017-12-20
AU2013246405A1 (en) 2014-10-30
CN108949660A (zh) 2018-12-07
EP4170026A1 (en) 2023-04-26
US9683247B2 (en) 2017-06-20
BR112014025519A2 (zh) 2017-08-15
BR112014025519B1 (pt) 2022-01-11
MX2014012350A (es) 2015-06-04
US20150079643A1 (en) 2015-03-19
CN104379735A (zh) 2015-02-25
CO7200250A2 (es) 2015-02-27
KR20150031230A (ko) 2015-03-23
KR20200105535A (ko) 2020-09-07
WO2013154721A1 (en) 2013-10-17
CA3081178C (en) 2023-02-21
MY167227A (en) 2018-08-14
CA2870257C (en) 2020-07-28
KR102278343B1 (ko) 2021-07-16
JP2015516808A (ja) 2015-06-18

Similar Documents

Publication Publication Date Title
AU2013246405B2 (en) Microbial production of alkanolamides and amidoamines and uses thereof
EP2756090B1 (en) Production of odd chain fatty acid derivatives in recombinant microbial cells
KR102166271B1 (ko) 지방산 유도체들의 개선된 생산
JP7030145B2 (ja) 改善されたエステルシンターゼ特性を有する酵素変種
CN105051189B (zh) 具有改善特性的酰基-acp还原酶
ES2693753T3 (es) Producción de ácidos grasos de cadena ramificada y derivados de los mismos en células microbianas recombinantes
JP6837089B2 (ja) 改善されたアセチル−CoAカルボキシラーゼ変種
CN107365733B (zh) 在重组微生物细胞中制备奇数链脂肪酸衍生物
BR122019025755B1 (pt) Escherichia coli recombinante e método para produção de uma amida graxa

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination