CN110093284A - 一种在细胞中提高蛋白合成效率的方法 - Google Patents
一种在细胞中提高蛋白合成效率的方法 Download PDFInfo
- Publication number
- CN110093284A CN110093284A CN201810093624.0A CN201810093624A CN110093284A CN 110093284 A CN110093284 A CN 110093284A CN 201810093624 A CN201810093624 A CN 201810093624A CN 110093284 A CN110093284 A CN 110093284A
- Authority
- CN
- China
- Prior art keywords
- glu
- lys
- ala
- ser
- leu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
- C12N15/815—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Mycology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明提供了一种在细胞中提高蛋白合成效率的方法,具体地,本发明提供了一种用于体外无细胞蛋白合成的基因工程菌株,所述基因工程菌株的基因组中整合有表达第一融合蛋白的第一核酸构建物的第一外源基因表达盒,并且,在所述基因工程菌株中,KlEXN53基因(核酸酶基因)的表达或活性被降低。来源于本发明的工程菌株的细胞提取物(如酵母细胞提取物)可显著提高核酸的稳定性,且无需额外手动添加T7RNP,并显著提高体外蛋白质合成体系产生蛋白质的效率。
Description
技术领域
本发明涉及生物技术领域,具体地,涉及一种在细胞中提高蛋白合成效率的方法。
背景技术
蛋白质是细胞中的重要分子,几乎参与了细胞所有功能的执行。蛋白的序列和结构不同,决定了其功能的不同。在细胞内,蛋白可以作为酶类催化各种生化反应,可以作为信号分子协调生物体的各种活动,可以支持生物形态,储存能量,运输分子,并使生物体运动。在生物医学领域,蛋白质抗体作为靶向药物,是治疗癌症等疾病的重要手段[1-2]。
在细胞中,蛋白质的制造包括基因转录和mRNA翻译两部分。
基因转录是指以DNA的一条链为模板,在DNA依赖的RNA聚合酶催化作用下,以4 种NTP( ATP、CTP、GTP和UTP)为原料,按照碱基互补配对原则,合成一条RNA的过程。对于有些RNA 病毒,RNA 也可以指导合成RNA。
翻译成蛋白质是指以mRNA为模板,tRNA为运载工具,在有关酶、辅助因子的作用下将活化的氨基酸在核糖体(亦称核蛋白体)上装配为蛋白质多肽链的过程。
蛋白质合成的调节在应对营养缺失等外界压力,细胞发育与分化等很多过程中发挥重要作用,包括转录调控和翻译调控。
转录调控是指以DNA为模板合成RNA的调控,所有的细胞都具有大量序列特异的DNA结合蛋白(反式作用因子),这些蛋白能准确地识别并结合到特异的DNA序列(顺式作用元件),在转录水平上起着开关的作用。转录水平调控是真核基因表达调控的重要环节。根据真核基因表达是否受环境影响可分为:发育调控和瞬时调控。其中发育调控是指真核生物为确保自身生长、发育、分化等对基因表达按“预定”和“有序”的程序进行的调控,是不可逆的过程;瞬时调控是指真核生物在内、外环境的刺激下所做出的适应性转录调控,是可逆过程。
翻译调控的四个过程包括翻译起始、翻译延伸、翻译终止和核糖体再循环,其中翻译起始是受调控最多的一个过程[3]。在翻译起始阶段,核糖体小亚基(40S)结合(tRNA)iMet,并在翻译起始因子的作用下识别mRNA 5’末端。小亚基向下游移动,并在起始密码子(ATG)位置与核糖体大亚基(60S)结合,形成完整核糖体,并进入翻译延伸阶段[4]。
目前常用的生物合成系统是体内生物合成系统和体外生物合成系统。体内生物合成系统是指在生物体内体系中,酶催化的各种化合物的合成过程,即生物体内进行同化反应的总称,包括光合作用,糖异生,核苷酸、核酸及蛋白质的生物合成。细胞生物合成中,蛋白质合成是数量上最重要的。蛋白质生物合成亦称为翻译,即把mRNA分子中碱基排列顺序转变为蛋白质或多肽链中的氨基酸排列顺序过程。蛋白质生物合成分为五个阶段,氨基酸的活化、多肽链合成的起始、肽链的延长、肽链的终止和释放、蛋白质合成后的加工修饰。
体外生物合成系统 (in vitro biosynthesis system)是指在细菌、真菌、植物细胞或动物细胞的裂解体系中,通过加入外源编码的核酸DNA、RNA、底物和能量源,完成特定化学分子或生物大分子(DNA, RNA, 蛋白质)的体外高效合成。常见的体外生物合成系统是体外蛋白质合成系统 (in vitro protein synthesis system),即无细胞蛋白质合成系统,是通过外源mRNA或者DNA模板、利用细胞裂解物,完成外源重组蛋白的快速高效翻译[5]。
无细胞系统可以最早追溯到 Buchner在1897年提出生物合成可以在体外进行,他通过酵母无细胞系统证明了生物乙醇的产生。然而,由于三磷酸腺苷(ATP)失衡,该系统不适用大规模应用[6]。Welch和Scopes于1985年通过多种探索解决了上述问题,获得了高产量的乙醇,但是该系统也存在两大缺陷:需要额外添加高成本的酶和无法耐受温度的变化[7]。然而,目前该技术存在一些固有的难以解决的问题:如可逆性、不稳定性、渗漏、失活、酶的循环使用,缺乏稳定的酶、酶复合物及辅助因子等。
商业上常见的体外蛋白质合成系统是体外转录-翻译偶联的体系 (in vitrotranscription-translation system,简称IVTT),通过DNA模板、经RNA聚合酶转录出mRNA中间体,再利用氨基酸和ATP等组分,完成外源蛋白的一步高效翻译。目前,常见的商业化体外蛋白表达系统包括大肠杆菌系统(Escherichia coli extract,ECE)、兔网织红细胞(Rabbit reticuLocyte lysate,RRL)、麦胚(Wheat germ extract, WGE)、昆虫(Insectcell extract, ICE)和人源系统。
使用无细胞表达系统进行体外蛋白质合成时,需要遗传内源性调节机制的高通用性。目前可用的调节机制受到细胞收获时生物量的生理背景的限制(快速生长)。例如,只有一个sigma因子存在于无细胞提取中,转录模块性仍然很差。
因此,本领域迫切需要开发一种从转录和翻译两方面进行调控,从而提高稳定性和抵抗力,降低生产成本和提高蛋白合成的产量的新型的体外翻译系统。
发明内容
本发明的目的在于提供一种从转录和翻译两方面进行调控,从而提高稳定性和抵抗力,降低生产成本和提高蛋白合成的产量的新型的体外翻译系统。
本发明的另一目的在于提供一种通过多种类型的基因组改造,一种整合内源性基因表达,蛋白质翻译,核酸稳定性控制为一体的人工改造细胞,创造一种新型的体外翻译系统,实现外源蛋白稳定高效表达的方法。
本发明第一方面提供了一种用于体外无细胞蛋白合成的基因工程菌株,所述基因工程菌株的基因组中整合有表达第一融合蛋白的第一核酸构建物的第一外源基因表达盒;所述第一融合蛋白具有式Ia或式Ib结构:
S-A-B-C (Ia)
S-C-B-A (Ib);
式中,
A为PabI元件;
B为无或连接肽;
C为eIF4G元件;
S为任选的信号肽,其中,各“-”为肽键;
并且,在所述基因工程菌株中,KlEXN53基因(核酸酶基因)的表达或活性被降低。
在另一优选例中,所述基因工程菌株的基因组中还整合有表达第二核酸构建物的第二外源基因表达盒,所述第二核酸构建物具有从5’至3’的式II结构:
Z1-Z2 (II)
式中,
Z1、Z2分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为启动子元件,所述启动子元件选自下组:RNR2、PRP38、TEF1、PGK1、AGC1、IES1、MET8、PAK1、UBA3、VPS4、CDC2、UGA2、DUG3、VPS28、APL2、RAP1、TRM2、RPB3、PGA2、BAP2、ARA1、或其组合;
Z2为RNP蛋白的编码序列。
在另一优选例中,所述“降低”指EXN53基因的表达量≤10%,较佳地,≤5%,更佳地,≤2%。
在另一优选例中,所述“降低”是指将EXN53基因的表达或活性降低满足以下条件:
A1/A0的比值≤30%,较佳地≤10%,更佳地≤5%,更佳地,≤2%,最佳地为0-2%;
其中,A1为EXN53基因的表达或活性;A0为野生型EXN53基因的表达或活性。
在另一优选例中,所述菌株中的EXN53基因(核酸酶基因)的表达或活性被降低通过选自下组的方式实现:基因突变、基因敲除、基因中断、RNA干扰技术、Crispr技术、或其组合。
在另一优选例中,所述式Ia或Ib为从N端至C端的结构。
在另一优选例中,所述元件A包括野生型和突变型的PabI序列。
在另一优选例中,所述的PabI为来自细胞(如酵母)的PabI。
在另一优选例中,元件A具有SEQ ID NO.:1所示的序列或其活性片段,或者具有与SEQ ID NO: 1所示氨基酸序列≥85%同源性(优选地,≥90%的同源性;等优选地≥95%的同源性;最优选地,≥97%的同源性,如98%以上,99%以上)且具有与SEQ ID NO.: 1序列相同活性的多肽。
在另一优选例中,所述元件C包括野生型和突变型的eIF4G序列。
在另一优选例中,所述的eIF4G为来自细胞(如酵母)的eIF4G。
在另一优选例中,元件C具有SEQ ID NO.:2所示的序列或其活性片段,或者具有与SEQ ID NO: 2所示氨基酸序列≥85%同源性(优选地,≥90%的同源性;等优选地≥95%的同源性;最优选地,≥97%的同源性,如98%以上,99%以上)且具有与SEQ ID NO.: 2序列相同活性的多肽。
在另一优选例中,所述第一融合蛋白是重组蛋白,较佳地为细胞表达的重组蛋白,所述细胞包括原核细胞和真核细胞。
在另一优选例中,所述细胞选自下组:大肠杆菌、细菌、哺乳动物细胞(如HF9、Hela、CHO、HEK293)、植物细胞、酵母细胞、昆虫细胞、或其组合。
在另一优选例中,所述细胞选自下组:Hela、CHO、HF9、EµMyc、HEK293、BY-2、酵母、或其组合。
在另一优选例中,所述第一融合蛋白为酵母表达的重组蛋白。
在另一优选例中,所述元件A衍生自细胞(如酵母)的PabI蛋白。
在另一优选例中,所述元件C衍生自细胞(如酵母)的eIF4G蛋白。
在另一优选例中,所述第一融合蛋白选自下组:
(A)具有SEQ ID NO:3所示氨基酸序列的多肽;(B)具有与SEQ ID NO: 3所示氨基酸序列≥80%同源性(优选地,≥90%的同源性;等优选地≥95%的同源性;最优选地,≥97%的同源性,如98%以上,99%以上)的多肽,且所述多肽具有提高外源蛋白表达效率的功能或活性;
(C)将SEQ ID NO:3中任一所示氨基酸序列经过1-15(较佳地,2-10,更佳地,3-8)个氨基酸残基的取代、缺失或添加而形成的,且具有提高外源蛋白表达效率的功能或活性的衍生多肽。
在另一优选例中,所述第一融合蛋白的氨基酸序列如SEQ ID NO.:3所示。
在另一优选例中,所述第一融合蛋白具有选自下组的一个或多个特性:
(a) 提高外源蛋白表达效率;
(b) 提高体外翻译效率。
在另一优选例中,所述外源蛋白选自下组:荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域、萤光素酶突变、α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素α A、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
在另一优选例中,所述Z1、Z2来源于细胞(如酵母)。
在另一优选例中,所述启动子元件选自下组:ScRNR2、ScADH1、ScGAPDH、ScTEF1、ScPGK1、ScSED1、KlRNR2、KlADH1、KlGAPDH、KlTEF1、KlPGK1、KlSED1、KlIES1、KlMET8、KlPAK1、KlSOK1、KlUBA3、KlVPS4、KlAGC1、KlCDC2、KlDUG3、KlPRP38、KlUGA2、KlVPS28、ScAPL2、ScARA1、ScBAP2、ScPGA2、ScRAP1、ScRPB3、ScTRM2、或其组合。
在另一优选例中,以所述启动子ScRNR2为基准,所述启动子元件的强度为启动子ScRNR2的±20%-±50%。
在另一优选例中,所述启动子ScRNR2的强度以转录本的数量为参照。
在另一优选例中,所述启动强度是指,启动子调控其下游编码基因转录表达水平的能力,启动强度增强则下游编码基因的转录表达水平提高,启动强度减弱则下游编码基因的转录表达水平降低。
在另一优选例中,所述RNP蛋白选自下组:T7RNAP蛋白、T3RNAP、T4RNAP、T5RNAP、SP6 RNAP、SP3、或其组合。
在另一优选例中,所述的肽接头的长度为0-50氨基酸,较佳地为10-40个氨基酸,更佳地为15-25个氨基酸。
在另一优选例中,所述酵母选自下组:酿酒酵母、克鲁维酵母属酵母、或其组合。
在另一优选例中,所述克鲁维酵母属酵母选自下组:乳酸克鲁维酵母、马克斯克鲁维酵母、多布克鲁维酵母 (Kluyveromyces dobzhanskii)、或其组合。
在另一优选例中,所述第二核酸构建物的序列如SEQ ID NO.:4所示。
在另一优选例中,所述EXN53基因来源于选自下组的一种或多种来源的酵母:毕氏酵母、克鲁维酵母,较佳地,来源于克鲁维酵母。
在另一优选例中,所述克鲁维酵母包括马克斯克鲁维酵母、和/或乳酸克鲁维酵母。
在另一优选例中,所述EXN53的核苷酸序列如SEQ ID NO.:5所示。
在另一优选例中,所述EXN53的蛋白序列如SEQ ID NO.:6所示。
在另一优选例中,所述菌株选自下组:克鲁维酵母菌株、毕赤酵母菌株、酿酒酵母菌株、裂殖酵母菌株、或其组合。
本发明第二方面提供了一种本发明第一方面所述的基因工程菌株的用途,用于提高体外蛋白合成效率。
本发明第三方面提供了一种无细胞的细胞提取物,所述细胞提取物来源于本发明第一方面所述的基因工程菌株。
在另一优选例中,所述细胞提取物为可溶性的细胞提取物。
在另一优选例中,所述细胞提取物来源选自下组的一种或多种细胞:大肠杆菌、细菌、哺乳动物细胞(如HF9、Hela、CHO、HEK293)、植物细胞、酵母细胞、昆虫细胞、或其组合。
在另一优选例中,所述细胞提取物来源选自下组的一种或多种细胞:Hela、CHO、HF9、EµMyc、HEK293、BY-2、酵母、或其组合。
在另一优选例中,所述细胞提取物包括酵母细胞提取物。
在另一优选例中,所述酵母细胞选自下组的一种或多种来源的酵母:毕氏酵母、克鲁维酵母、或其组合;较佳地,所述的酵母细胞包括:克鲁维酵母,更佳地为马克斯克鲁维酵母、和/或乳酸克鲁维酵母。
在另一优选例中,所述的酵母细胞提取物为对酵母细胞的水性提取物。
在另一优选例中,所述酵母细胞提取物不含酵母内源性的长链核酸分子。
在另一优选例中,所述的酵母细胞提取物是用包括以下步骤的方法制备:
(i)提供酵母细胞;
(ii)对酵母细胞进行洗涤处理,获得经洗涤的酵母细胞;
(iii)对经洗涤的酵母细胞进行破细胞处理,从而获得酵母粗提物;和
(iv)对所述酵母粗提物进行固液分离,获得液体部分,即为酵母细胞提取物。
在另一优选例中,所述的固液分离包括离心。
在另一优选例中,在液态下进行离心。
在另一优选例中,所述离心条件为5000-100000 g,较佳地,8000-30000 g。
在另一优选例中,所述离心时间为0.5 min–2 h,较佳地,20–50 min。
在另一优选例中,所述离心在1-10 ℃下进行,较佳地,在2-6 ℃下进行。
在另一优选例中,所述的洗涤处理采用洗涤液在pH为7-8(较佳地,7.4)下进行处理。
在另一优选例中,所述洗涤液选自下组:4-羟乙基哌嗪乙磺酸钾、醋酸钾、醋酸镁、或其组合。
在另一优选例中,所述的破细胞处理包括高压破碎、冻融(如液氮低温)破碎。
本发明第四方面提高了一种体外的无细胞的蛋白合成体系,所述无细胞的蛋白合成体系包括本发明第三方面所述的细胞提取物。
在另一优选例中,所述蛋白合成体系由或基本由本发明第三方面所述的细胞提取物构成。
在另一优选例中,所述无细胞的蛋白合成体系不额外添加RNP蛋白。
在另一优选例中,所述RNP蛋白选自下组:T7RNAP蛋白、T3RNAP、T4RNAP、T5RNAP、SP6 RNAP、SP3、或其组合。
在另一优选例中,所述无细胞的蛋白合成体系还包括选自下组的一种或多种组分:
(b) 聚乙二醇;
(c) 任选的外源蔗糖;和
(d) 任选的溶剂,所述溶剂为水或水性溶剂。
在另一优选例中,所述无细胞的蛋白合成体系还包括选自下组的一种或多种组分:
(e1) 用于合成RNA的底物;
(e2) 用于合成蛋白的底物;
(e3) 镁离子;
(e4) 钾离子;
(e5) 缓冲剂;
(e6) RNA聚合酶;
(e7) 能量再生系统。
在另一优选例中,所述无细胞的蛋白合成体系还包括选自下组的一种或多种组分:
(e8) 血红素;
(e9) 亚精胺。
在另一优选例中,所述的合成RNA的底物包括:核苷单磷酸、核苷三磷酸、或其组合。
在另一优选例中,所述的合成蛋白的底物包括:1-20种天然氨基酸、以及非天然氨基酸。
在另一优选例中,所述镁离子来源于镁离子源,所述镁离子源选自下组:醋酸镁、谷氨酸镁、或其组合。
在另一优选例中,所述钾离子来源于钾离子源,所述钾离子源选自下组:醋酸钾、谷氨酸钾、或其组合。
在另一优选例中,所述能量再生系统选自下组:磷酸肌酸/磷酸肌酸酶系统、糖酵解途径及其中间产物能量系统、或其组合。
在另一优选例中,所述无细胞的蛋白合成体系还包括(f1) 人工合成的tRNA。
在另一优选例中,所述缓冲剂选自下组:4-羟乙基哌嗪乙磺酸、三羟甲基氨基甲烷、或其组合。
在另一优选例中,所述无细胞的蛋白合成体系还包括(g1) 外源的用于指导蛋白质合成的DNA分子。
在另一优选例中,所述的DNA分子为线性的。
在另一优选例中,所述的DNA分子为环状的。
在另一优选例中,所述的DNA分子含有编码外源蛋白的序列。
在另一优选例中,所述的编码外源蛋白的序列包括基因组序列、cDNA序列。
在另一优选例中,所述的编码外源蛋白的序列还含有启动子序列、5’非翻译序列、3’非翻译序列。
在另一优选例中,所述无细胞的蛋白合成体系包括选自下组的成分:4-羟乙基哌嗪乙磺酸、醋酸钾、醋酸镁、核苷三磷酸、氨基酸、磷酸肌酸,二硫苏糖醇(DTT)、磷酸肌酸激酶、RNA聚合酶、或其组合。
在另一优选例中,所述聚乙二醇选自下组:PEG3000、PEG8000、PEG6000、PEG3350、或其组合。
在另一优选例中,所述聚乙二醇包括分子量(Da)为200-10000的聚乙二醇,较佳地,分子量为3000-10000的聚乙二醇。
在另一优选例中,所述蛋白合成体系中,组分(b)的浓度(w/v,例如g/ml)为0.1-8%,较佳地,0.5-4%,更佳地,1-2%。
在另一优选例中,所述蛋白合成体系中,组分(c)的浓度为0.03-40wt%,较佳地,0.08-10wt%,更佳地,0.1-5wt%,以所述蛋白合成体系的总重量计。
在另一优选例中,所述蛋白合成体系中,组分(c)的浓度为0.2-4%,较佳地,0.5-4%,更佳地,0.5-1%,以所述蛋白合成体系的总体积计。
在另一优选例中,所述核苷三磷酸选自下组:腺嘌呤核苷三磷酸、鸟嘌呤核苷三磷酸、胞嘧啶核苷三磷酸、尿嘧啶核苷三磷酸、或其组合。
在另一优选例中,所述蛋白合成体系中,组分(e1)的浓度为0.1-5 mM,较佳地,0.5-3 mM,更佳地,1-1.5 mM。
在另一优选例中,所述氨基酸为选自下组:甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、脯氨酸、色氨酸、丝氨酸、酪氨酸、半胱氨酸、蛋氨酸、天冬酰胺、谷氨酰胺、苏氨酸、天冬氨酸、谷氨酸、赖氨酸、精氨酸、组氨酸、或其组合。
在另一优选例中,所述氨基酸包括D型氨基酸和/或L型氨基酸。
在另一优选例中,所述蛋白合成体系中,所述组分(e2)的浓度为0.01-0.48 mM,较佳地,0.04-0.24 mM,更佳地,0.04- 0.2 mM,最佳地,0.08 mM。
在另一优选例中,所述蛋白合成体系中,所述组分(e3)的浓度为1-10 mM,较佳地,1-5 mM,更佳地,2-4 mM。
在另一优选例中,所述蛋白合成体系中,所述组分(e4)的浓度为30-210 mM,较佳地,30-150 mM,更佳地,30-60 mM。
在另一优选例中,所述蛋白合成体系中,所述组分(e6)的浓度为0. 01-0.3 mg/mL,较佳地,0.02-0.1 mg/mL,更佳地,0.027-0.054 mg/mL。
在另一优选例中,所述蛋白合成体系中,4-羟乙基哌嗪乙磺酸的浓度为5-50 mM,较佳地,10-50 mM,较佳地,15-30 mM,更佳地,20-25 mM。
在另一优选例中,所述蛋白合成体系中,所述醋酸钾的浓度为20-210 mM,较佳地,30-210 mM,较佳地,30-150 mM,更佳地,30-60 mM。
在另一优选例中,所述蛋白合成体系中,所述醋酸镁的浓度为1-10 mM,较佳地,1-5 mM,更佳地,2-4 mM。
在另一优选例中,所述蛋白合成体系中,所述磷酸肌酸的浓度为10-50 mM,较佳地,20-30 mM,更佳地,25 mM。
在另一优选例中,所述蛋白合成体系中,所述血红素的浓度为0.01-0.1 mM,较佳地,0.02-0.08 mM,更佳地,0.03-0.05 mM,最佳地,0.04 mM。
在另一优选例中,所述蛋白合成体系中,所述亚精胺的浓度为0.05-1 mM,较佳地,0.1-0.8 mM,更佳地,更佳地,0.2-0.5 mM,更佳地,0.3-0.4 mM,最佳地,0.4 mM。
在另一优选例中,所述蛋白合成体系中,所述二硫苏糖醇(DTT)的浓度为0.2-15mM,较佳地,0.2-7 mM,更佳地,1-2 mM。
在另一优选例中,所述蛋白合成体系中,所述磷酸肌酸激酶的浓度为0.1-1 mg/mL,较佳地,0.2-0.5 mg/mL,更佳地,0.27 mg/mL。
在另一优选例中,所述蛋白合成体系中,所述T7 RNA聚合酶的浓度为0. 01-0.3mg/mL,较佳地,0.02-0.1 mg/mL,更佳地,0.027-0.054 mg/mL。
在另一优选例中,所述的无细胞体外合成体系具有以下性能:
在合成体系里,蛋白合成总量达到 200 μg 蛋白/mL体系。
在另一优选例中,所述的无细胞的蛋白合成体系的组成包括:
一般范围 优选范围
4-羟乙基哌嗪乙磺酸, 5-40 mM; 10-30 mM(较佳地,20-30 mM);
醋酸镁, 1-10 mM; 2-5 mM;
醋酸钾, 20-150 mM; 30-75 mM;
DTT, 0.5-5 mM; 1-2 mM;
磷酸肌酸, 15-50 mM; 20-30 mM;
磷酸肌酸激酶, 0.1-0.5 mg/mL; 0.2-0.3 mg/mL;
4种核糖核苷酸, 各0.5-5 mM; 各1.0-2.0 mM;
DNA 模板, 2-50 ng/µL; 5-25 ng/µL;
RNA聚合酶, 0.01-0.3 mg/mL; 0.02-0.10 mg/mL;
PEG, 0.5-5wt% 1-3wt%。
在另一优选例中,所述无细胞的蛋白合成体系的组成还包括:
亚精胺, 0.2-0.4 mM 0.3-0.4 mM;
血红素, 0.01-0.04 mM 0.03-0.04 mM。
在另一优选例中,所述的PEG选自PEG3350、PEG3000、和/或PEG8000。
在另一优选例中,所述RNA聚合酶为T7 RNA聚合酶。
本发明第五方面提供了一种体外合成蛋白的方法,包括步骤:
(i) 提供本发明第四方面所述的体外的无细胞的蛋白合成体系,并加入外源的用于指导蛋白质合成的DNA分子;
(ii) 在适合的条件下,孵育步骤(i)的蛋白合成体系一段时间T1,从而合成由所述外源DNA编码的蛋白质。
在另一优选例中,所述的方法还包括:(iii) 任选地从所述蛋白合成体系中,分离或检测所述的由外源DNA编码的蛋白质。
在另一优选例中,所述外源DNA来自原核生物、真核生物。
在另一优选例中,所述外源DNA来自动物、植物、病原体。
在另一优选例中,所述外源DNA来自哺乳动物,较佳地灵长动物,啮齿动物,包括人、小鼠、大鼠。
在另一优选例中,所述的外源蛋白的编码序列编码选自下组的外源蛋白:荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域、萤光素酶突变体、α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素α A、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
在另一优选例中,所述外源蛋白选自下组:荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域、萤光素酶突变、α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素α A、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
在另一优选例中,所述的外源DNA编码选自下组的外源蛋白:荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域、萤光素酶突变体、α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素α A、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
在另一优选例中,所述外源DNA编码的蛋白质选自下组:荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域、萤光素酶突变、α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素α A、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
在另一优选例中,所述步骤(ii)中,反应温度为20-37 ℃,较佳地,20-25 ℃。
在另一优选例中,所述步骤(ii)中,反应时间为1-6 h,较佳地,2-4 h。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示了通过控制基因转录、翻译、和核酸稳定性来调节生物合成反应的示意图。
图2显示了一种整合内源性基因表达,蛋白质翻译,核酸稳定性控制为一体的人工改造细胞设计路线图。图2A为K. lactis 基因组中形成融合蛋白PabI-eIF4G的基因改造的CRISPR系统设计图,图2B为K. lactis 基因组中核酸酶KlEXN53敲除,内源性表达带有特定强度启动子pScRNR2- T7 RNA聚合酶的基因改造的CRISPR系统设计图。
图3显示了pHoCas9_SE_tRNA_ScRNR2_KlPAB1-gRNA1质粒图谱。KlPAB1的gRNA1为KlPAB1基因ORF中的1个gRNA,带有tRNA-Tyr启动子和SNR52终止子,质粒带有kana筛选标记。
图4显示了KlPAB1-30Linker-KleIF4G-DD1-pMD18质粒图谱。HR1和HR2分别为KlPAB1基因的ORF上、下游1000bp左右的基因序列,质粒带有Amp筛选标记。
图5显示了pHoCas9_SE_Kana_tRNA_ScRNR2_KlEXN53-gRNA1&3质粒图谱。KlEXN53的gRNA1和gRNA3分别为KlEXN53基因ORF的5′和3′端两个gRNA,带有tRNA-Tyr启动子和SNR52终止子,质粒带有kana筛选标记。
图6显示了KlEXN53-pScRNR2-T7 RNP-DD1-pMD18质粒图谱。HR1和HR2分别为KlEXN53基因的ORF上、下游1000bp左右的基因序列,质粒带有Amp筛选标记。
图7显示了改造菌株体外翻译活性测定数据图。利用萤火虫荧光蛋白(Fluc)的荧光强度指示体外生物合成系统的重组蛋白的合成能力。其中wt代表野生型克鲁维酵母,3in1代表Klexn53∆-pScRNR2-T7RNP & KlPAB1-KleIF4G酵母菌株,即对KlEXN53基因敲除,以带有特定强度启动子pScRNR2-T7RNP替换,同时 KlPAB1和KleIF4G形成融合蛋白的一个酵母菌株。
图8显示改造3in1菌株外加或者不加T7 RNP体外翻译活性测定数据图。利用萤火虫荧光蛋白(Fluc)的荧光强度指示体外生物合成系统的重组蛋白的合成能力。
图9 总结了通过转录、翻译调控及稳定核酸酶来调节生物体外合成,实现稳定、高效、快速的表达外源蛋白。
具体实施方式
本发明人经过广泛而深入的研究,通过大量筛选和摸索,构建一种特别适合体外蛋白合成的基因工程菌株,该菌株的基因组整合有(i)表达第一融合蛋白(如KlPAB1和KleIF4G形成的融合蛋白)的第一核酸构建物的第一外源基因表达盒;同时降低本发明的工程菌株中的核酸酶(如KlEXN53)的表达或活性。实验表明,基于该工程菌株的无细胞提取物,出乎意料地协同且显著提高体外无细胞蛋白合成体系的蛋白合成效率。优选地,本发明的工程菌株可整合表达第二核酸构建物(如启动子pScRNR2-T7RNP)的第二外源基因表达盒,来源于本发明的工程菌株的细胞提取物(如酵母细胞提取物)可显著提高核酸的稳定性,且无需额外手动添加T7RNP,并显著提高体外蛋白质合成体系产生蛋白质的效率。在此基础上,本发明人完成了本发明。
实验表明,在无需额外添加T7 RNP 时,本发明的菌株在IVTT中的荧光素酶活性是野生型的≥5倍。
术语
如本文所用,所述的“工程菌株”、“基因工程菌株”可互换使用,均指本发明的用于提高体外蛋白合成效率的工程菌株,即本发明第一方面所述的菌株。
元件
真核生物中,多种翻译起始因子参与蛋白质翻译起始过程(表1)。其中eIF4F负责“帽子结构”的识别以及下游翻译起始因子和核糖体的招募。eIF4F由三个蛋白质亚基组成:eIF4E、eIF4G和eIF4A。eIF4E特异性结合“帽子结构”,将eIF4F锚定在mRNA 5’端非翻译区;eIF4A是一种RNA解旋酶;eIF4G则几乎是整个翻译起始过程的支架蛋白,能与多种翻译起始因子相互作用,在下游因子招募过程中具有重要作用。
表1 酵母中翻译起始因子
翻译起始因子 亚基 基因 蛋白长度(AA)
eIF1 SUI1 108
eIF1A TIF11 153
eIF2 α SUI2 304
β SUI3 285
γ GCD11 527
eIF2B α GCN3 305
β GCD7 381
γ GCD1 578
δ GCD2 651
ε GCD6 712
eIF3 a RPG1/TIF32 964
b PRT1 763
c NIP1 812
g TIF35 274
i TIF34 347
j HCR1 265
eIF4A TIF1 395
TIF2 395
eIF4B TIF3/STM1 436
eIF4E CDC33 213
eIF4G TIF4631 952
TIF4632 914
eIF5 TIF5 405
eIF5B FUN12 1002
在本发明中,通过在eIF4G前插入酵母来源(如酿酒酵母、克鲁维酵母等)的组成型或诱导型启动子(如pScTEF1、pScPGK1、pKlTEF1、pKlPGK1、pScADH1、pScTPI1、pScTDH3、pKlADH1、pKlTPI1、pKlTDH3等),从而增强体外蛋白质的合成能力。
在一优选实施方式中,所述eIF4G的核苷酸序列如SEQ ID NO.:7所示;所述eIF4G的蛋白序列如SEQ ID NO.:2所示。
元件(Pab1蛋白)
Pab1是一个71kDa的RNA结合蛋白,由4个RRM(RNA recognition motif 1-4)结构域和1个MLLE结构域组成。每个RRM结构域中都包含2个保守的RNP结构(RNP1/2),负责与RNA的结合。
在一优选实施方式中,所述Pab1的核苷酸序列如SEQ ID NO.:8所示;所述Pab1的蛋白序列如SEQ ID NO.:1所示。
第一融合蛋白
如本文所用,术语“本发明融合蛋白”、“本发明PabI-eIF4G融合蛋白”、“本发明的第一融合蛋白”、“第一融合蛋白”、以及“PabI-eIF4G融合蛋白”可互换使用,指PabI元件与eIF4G元件融合形成的融合蛋白。在本发明的融合蛋白中,PabI元件与eIF4G元件之间可以含有或不含有连接肽或柔性接头。此外,所述融合蛋白可以含有或不含有起始的Met;可以含有或不含有信号肽;以及含有或不含有标签序列(如6His等)。
在一优选实施方式中,本发明所述的融合蛋白具有上述的式Ia或式Ib结构。优选地,本发明的融合蛋白的氨基酸序列如SEQ ID NO.:3所示。
在本发明中,本发明的融合蛋白可显著提高无细胞的、体外蛋白质合成体系(尤其是酵母体外蛋白质合成体系)的体外蛋白质合成能力。
外源基因表达盒
如本文所用,术语“外源基因表达盒”是指带有表达第一融合蛋白(如PabI-eIF4G融合蛋白)的第一核酸构建物的第一外源基因表达盒,以及任选地表达第二核酸构建物(如带有ScRNR2启动子的表达外源基因(T7RNAP蛋白))的第二外源基因表达盒。
本申请的工程菌株是通过将“整合第一外源基因表达盒的重组菌”和“整合第二外源基因表达盒的重组菌”进行原生质体融合得到的。该工程菌株同时整合有第一外源基因表达盒和第二外源基因表达盒。
增强生物合成的设计及分析方法
A. 体内生物合成过程中转录调控对活性的影响分析
T7 RNA 聚合酶(T7 RNAP)是来源于T7噬菌体的一种RNA 聚合酶,识别23 nt的保守启动子序列(pT7)并提供较强的转录活性。T7 RNA聚合酶依赖于pT7启动子,专门催化5’ to3’方向的RNA形成过程;具有高度特异性,且只会转录T7噬菌体中位于T7启动子下游的的DNA或DNA;并具有比多亚基的细菌RNA聚合酶产生更长的转录脚本。
体内生物合成过程中翻译调控对活性的影响分析
eIF4F元件
在生物体中,多种翻译起始因子参与蛋白质翻译起始过程,真核细胞和人细胞中翻译起始因子分别如表1,表2 所示。其中真核细胞中,eIF4F负责“帽子结构”的识别以及下游翻译起始因子和核糖体的招募。eIF4F由三个蛋白质亚基组成:eIF4E、eIF4G和eIF4A。eIF4E特异性结合“帽子结构”,将eIF4F锚定在mRNA 5’端非翻译区;eIF4A是一种RNA解旋酶;eIF4G则几乎是整个翻译起始过程的支架蛋白,能与多种翻译起始因子相互作用,在下游因子招募过程中具有重要作用。
表1 真核细胞中翻译起始因子
翻译起始因子 亚基 基因 蛋白长度(AA)
eIF1 SUI1 108
eIF1A TIF11 153
eIF2 α SUI2 304
β SUI3 285
γ GCD11 527
eIF2B α GCN3 305
β GCD7 381
γ GCD1 578
δ GCD2 651
ε GCD6 712
eIF3 a RPG1/TIF32 964
b PRT1 763
c NIP1 812
g TIF35 274
i TIF34 347
j HCR1 265
eIF4A TIF1 395
TIF2 395
eIF4B TIF3/STM1 436
eIF4E CDC33 213
eIF4G TIF4631 952
TIF4632 914
eIF5 TIF5 405
eIF5B FUN12 1002
表2 人细胞中翻译起始因子
翻译起始因子 亚基 基因 蛋白长度(AA)
eIF1 SUI1 113
eIF1A EIF1AX 144
eIF2 α EIF2S1 315
β EIF2S2 333
γ EIF2S3/EIF2S3L 472
eIF2B α EIF2B1 305
β EIF2B2 351
γ EIF2B4 523
δ EIF2B3 452
ε EIF2B5 712
eIF3 a EIF3A 1382
b EIF3B 814
c EIF3C 913
d EIF3D 548
e EIF3E 445
f EIF3F 357
g EIF3G 320
h EIF3H 352
i EIF3I 325
j EIF3J 258
k EIF3K 218
l EIF3L 564
m EIF3M 374
eIF4A EIF4A1 406
EIF4A2 407
EIF4A3 411
eIF4B EIF4B 611
eIF4E EIF4E 217
eIF4G EIF4G1 1599
EIF4G2 907
EIF4G3 1585
eIF5 EIF5 431
eIF5B EIF5B 1220
Pab1元件(Pab1蛋白)
Pab1位于染色体C上,是一个71kDa的RNA结合蛋白,由4个RRM(RNA recognition motif1-4)结构域和1个MLLE结构域组成。每个RRM结构域中都包含2个保守的RNP结构(RNP1/2),负责与RNA的结合。
的3’端,polyA序列能够被Pab1蛋白识别并结合。在结合polyA的同时,Pab1可以与eIF4G相互作用,进而把mRNA的两端连接起来[30]。这样eIF4G与Pab1共同作用可以在细胞内使大量存在于mRNA 3’端的调控元件能够调节蛋白质翻译起始,同时被猜测mRNA通过eIF4G与Pab1相互作用形成的环状结构能通过蛋白质合成因子的快速起始招募,促进翻译起始过程。
体内生物合成过程中核酸酶稳定性对活性的影响分析
核酸酶(也称为核聚合酶或多核苷酸酶)是核酸分解的第一步中能够水解核苷酸之间的磷酸二酯键的酶。根据核酸酶作用的位置不同,可将核酸酶分为核酸外切酶(exonuclease)和核酸内切酶(endonuclease)。核酸外切酶从3’端开始逐个水解核苷酸,称为3’ to 5’外切酶,核酸外切酶从5’端开始逐个水解核苷酸,称为5’ to 3’外切酶,核酸内切酶催化水解多核苷酸内部的磷酸二酯键。核酸酶又分为脱氧核糖核酸酶(DNase)和核糖核酸酶(RNase),前者对DNA起作用,后者对RNA起作用。核酸 RNA和DNA蛋白质体外合成系统中的编码底物,它们的稳定性影响着蛋白质的得率。在真核生物翻译过程中,RNA的5’端会瞬时完成帽子结构的加工,而RNA的5’帽子结构对于RNA的稳定性和翻译的效率起着举足轻重的作用。
在真核生物中,存在依赖去腺苷化和非依赖腺苷化的RNA降解机制,在依赖去腺苷化RNA降解机制中可以通过招募去帽复合物去除RNA的5’端成熟帽子结构或者非成熟的帽子结构,RNA同时也在核酸酶的作用下发生5’ to 3’的降解[32]。在非依赖腺苷化的mRNA降解机制中,在内切核酸酶的作用下,核酸分子从中间产生断链,核酸外切酶从3’ to 5’降解RNA。
在K. lactis的体外蛋白质合成体系中,采用外源线性或环状DNA作为模板,转录出带有polyA 3’端尾巴的mRNA,取决于启动子(promotor)和RNA转录酶的不同,可能带有或不带有5’端成熟帽子结构。因此,DNase酶、RNase酶、核酸外切酶、核酸内切酶均会对体外蛋白质合成体系中模板的稳定性产生影响,改造这些酶对于提高体外生物合成活性均有可能有提升作用。
其中,由于mRNA的特殊不稳定性和体内RNase酶的高活性,mRNA的寿命是制约体外蛋白质合成的主要因素之一。
对各基因分析和特异性改造如图1所示。
在一优选实施方式中,本发明的增强体外合成的设计及分析方法如下所示:
I. 通过调控翻译来增强体外合成,即设计一种人工融合蛋白,提高体外翻译效率。
结合上述真核细胞体内翻译调控对活性影响分析,本发明构建一种融合蛋白,提高体外蛋白合成效率。在本发明的融合蛋白中,PabI元件与eIF4G元件之间可以含有或不含有连接肽或柔性接头。此外,所述融合蛋白可以含有或不含有起始的Met;可以含有或不含有信号肽;以及含有或不含有标签序列(如6His等)。
通过调控转录来增强体外合成,即降低体外合成体系中的核酸酶来提高核酸稳定性,引进一种基因使其内源性表达来促进转录进行。
结合上述转录调控及核酸酶对活性的影响分析,T7 RNP能提供较强的转录活性,而核酸酶的稳定性直接影响体外蛋白的合成效率,因此,本发明改造或者敲除核酸酶来提高核酸稳定性,引进一种基因使其内源性表达来加强转录,提高体外蛋白合成活性。
利用CRISPR-Cas9基因编辑系统,对上述基因进行选定并改造,其系统改造设计如图2所示。
当然,本发明涉及的内容仍然适用于其他真核生物的设计改造以提高体外蛋白质合成活性。
本发明的方法也适用于细胞内的高表达蛋白。
体外表达系统
酵母(yeast)兼具培养简单、高效蛋白质折叠、和翻译后修饰的优势。其中酿酒酵母(Saccharomyces cerevisiae)和毕氏酵母(Pichia pastoris)是表达复杂真核蛋白质和膜蛋白的模式生物,酵母也可作为制备体外翻译系统的原料。
克鲁维酵母(Kluyveromyces)是一种子囊孢子酵母,其中的马克斯克鲁维酵母(Kluyveromyces marxianus)和乳酸克鲁维酵母(Kluyveromyces lactis)是工业上广泛使用的酵母。与其他酵母相比,乳酸克鲁维酵母具有许多优点,如超强的分泌能力,更好的大规模发酵特性、食品安全的级别、以及同时具有蛋白翻译后修饰的能力等。
在本发明中,酵母体外表达系统不受特别限制,一种优选的酵母体外表达系统为克鲁维酵母表达系统(更佳地,乳酸克鲁维酵母表达系统)。
蛋白合成体系
本发明提供了一种体外的无细胞的蛋白合成体系,所述合成体系包括:
(a) 细胞提取物(如酵母细胞提取物),来源于本发明第一方面所述的基因工程菌。
在一优选实施方式中,所述合成体系还包括:
(b) 聚乙二醇;
(c) 任选的外源蔗糖;和
(d) 任选的溶剂,所述溶剂为水或水性溶剂。
在一特别优选的实施方式中,本发明提供的体外蛋白合成体系包括:酵母细胞提取物,4-羟乙基哌嗪乙磺酸,醋酸钾,醋酸镁,腺嘌呤核苷三磷酸(ATP),鸟嘌呤核苷三磷酸(GTP),胞嘧啶核苷三磷酸(CTP),胸腺嘧啶核苷三磷酸(TTP),氨基酸混合物,磷酸肌酸,二硫苏糖醇(DTT),磷酸肌酸激酶,RNA酶抑制剂,荧光素,萤光素酶DNA,RNA聚合酶。
在本发明中,RNA聚合酶没有特别限制,可以选自一种或多种RNA聚合酶,典型的RNA聚合酶为T7 RNA聚合酶。
在本发明中,所述酵母细胞提取物在体外蛋白合成体系中的比例不受特别限制,通常所述酵母细胞提取物在体外蛋白质合成蛋白合成体系中所占体系为20-70%,较佳地,30-60%,更佳地,40-50%。
在本发明中,所述的酵母细胞提取物不含完整的细胞,典型的酵母细胞提取物包括用于蛋白翻译的核糖体、转运RNA、氨酰tRNA合成酶、蛋白质合成需要的起始因子和延伸因子以及终止释放因子。此外,酵母提取物中还含有一些源自酵母细胞的细胞质中的其他蛋白,尤其是可溶性蛋白。
在本发明中,所述的酵母细胞提取物所含蛋白含量为20-100 mg/mL, 较佳为50-100 mg/mL。所述的测定蛋白含量方法为考马斯亮蓝测定方法。
在本发明中,所述的酵母细胞提取物的制备方法不受限制,一种优选的制备方法包括以下步骤:
(i)提供酵母细胞;
(ii)对酵母细胞进行洗涤处理,获得经洗涤的酵母细胞;
(iii)对经洗涤的酵母细胞进行破细胞处理,从而获得酵母粗提物;
(iv)对所述酵母粗提物进行固液分离,获得液体部分,即为酵母细胞提取物。
在本发明中,所述的固液分离方式不受特别限制,一种优选的方式为离心。
在一优选实施方式中,所述离心在液态下进行。
在本发明中,所述离心条件不受特别限制,一种优选的离心条件为5000-100000g,较佳地,8000-30000 g。
在本发明中,所述离心时间不受特别限制,一种优选的离心时间为0.5 min-2 h,较佳地,20-50 min。
在本发明中,所述离心的温度不受特别限制,优选的,所述离心在1-10 ℃下进行,较佳地,在2-6 ℃下进行。
在本发明中,所述的洗涤处理方式不受特别限制,一种优选的洗涤处理方式为采用洗涤液在pH为7-8(较佳地,7.4)下进行处理,所述洗涤液没有特别限制,典型的所述洗涤液选自下组:4-羟乙基哌嗪乙磺酸钾、醋酸钾、醋酸镁、或其组合。
在本发明中,所述破细胞处理的方式不受特别限制,一种优选的所述的破细胞处理包括高压破碎、冻融(如液氮低温)破碎。
所述体外蛋白质合成体系中的核苷三磷酸混合物为腺嘌呤核苷三磷酸、鸟嘌呤核苷三磷酸、胞嘧啶核苷三磷酸和尿嘧啶核苷三磷酸。在本发明中,各种单核苷酸的浓度没有特别限制,通常每种单核苷酸的浓度为0.5-5 mM,较佳地为1.0-2.0 mM。
所述体外蛋白质合成体系中的氨基酸混合物可包括天然或非天然氨基酸,可包括D型或L型氨基酸。代表性的氨基酸包括(但并不限于) 20种天然氨基酸:甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、脯氨酸、色氨酸、丝氨酸、酪氨酸、半胱氨酸、蛋氨酸、天冬酰胺、谷氨酰胺、苏氨酸、天冬氨酸、谷氨酸、赖氨酸、精氨酸和组氨酸。每种氨基酸的浓度通常为0.01-0.5 mM,较佳地0.02-0.2 mM,如0.05、0.06、0.07、0.08 mM。
在优选例中,所述体外蛋白质合成体系还含有聚乙二醇或其类似物。聚乙二醇或其类似物的浓度没有特别限制,通常,聚乙二醇或其类似物的浓度 (w/v)为0.1-8%,较佳地,0.5-4%,更佳地,1-2%,以所述蛋白合成体系的总重量计。代表性的PEG例子包括(但并不限于):PEG3000,PEG8000,PEG6000和PEG3350。应理解,本发明的体系还可包括其他各种分子量的聚乙二醇(如PEG200、400、1500、2000、4000、6000、8000、10000等)。
在优选例中,所述体外蛋白质合成体系还含有蔗糖。蔗糖的浓度没有特别限制,通常,蔗糖的浓度为0.03-40wt%,较佳地,0.08-10wt%,更佳地,0.1-5wt%,以所述蛋白合成体系的总重量计。
一种特别优选的体外蛋白质合成体系,除了酵母提取物之外,还含有以下组分:22mM,pH为7.4的4-羟乙基哌嗪乙磺酸,30-150 mM醋酸钾,1.0-5.0 mM醋酸镁,1.5-4 mM核苷三磷酸混合物,0.08-0.24 mM的氨基酸混合物,25 mM磷酸肌酸,1.7 mM二硫苏糖醇,0.27mg/mL磷酸肌酸激酶, 1%-4%聚乙二醇,0.5%-2%蔗糖,8-20 ng/µL萤火虫荧光素酶的DNA,0.027-0.054 mg/mL T7 RNA聚合酶。
本发明的主要优点包括:
(i) 本发明首次构建一种新的基因工程菌,该菌株的基因组整合有(i)表达第一融合蛋白(如KlPAB1和KleIF4G形成的融合蛋白)的第一核酸构建物的第一外源基因表达盒,同时降低本发明的工程菌株中的核酸酶(如KlEXN53)的表达或活性,并且还可任选地整合表达第二核酸构建物(如启动子pScRNR2-T7RNP)的第二外源基因表达盒。
本发明首次意外的发现,来源于本发明的工程菌株的细胞提取物(如酵母细胞提取物)可显著提高核酸的稳定性,且无需额外手动添加T7RNP,并显著提高体外蛋白质合成体系产生蛋白质的效率。
本发明首次发现,在无需额外添加T7 RNP 时,本发明的菌株在IVTT中的荧光素酶活性是野生型的≥5倍。
本发明首次发现,本发明的菌株在IVTT中的荧光素酶活性显著高于本发明的第一融合蛋白在IVTT中的荧光素酶活性(其中,本发明的第一融合蛋白在IVTT中的荧光素酶活性比野生型的荧光素酶活性提高了2.6倍)。
本发明首次发现,本发明的菌株在IVTT中的荧光素酶活性显著高于降低核酸酶(如KlEXN53)的表达或活性的菌株在IVTT中的荧光素酶活性(其中,降低核酸酶(如KlEXN53)的表达或活性的菌株在IVTT中的荧光素酶活性比野生型的荧光素酶活性提高了1.46倍)。
当本发明的工程菌株同时具有以下特征:(a)整合有表达第一融合蛋白(如KlPAB1和KleIF4G形成的融合蛋白)的第一核酸构建物的第一外源基因表达盒,(b) 降低本发明的工程菌株中的核酸酶(如KlEXN53)的表达或活性时,基于所述工程菌株的无细胞体外蛋白合成体系(IVTT),可高效协同地产生外源蛋白(如荧光素酶)。
本发明首次实现了T7 RNAP在酵母细胞基因组内的稳定存在和T7RNAP蛋白质的持续表达,在无细胞合成系统中检测IVTT时,无需额外人工添加T7RNAP,节省了时间和成本。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York: Cold Spring HarborLaboratory Press, 1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数是重量百分比和重量份数。
如无特别说明,则本发明实施例中所用的材料和试剂均为市售产品。
实施例1 构建一种新型融合蛋白,大幅度的提高体外翻译效率
1.1 通过CRISPR-Cas9基因编辑技术, 对K. lactis中翻译起始因子eIF4G和Pab1进行优化,将KleIF4G与其互作蛋白融合,以提高无细胞体外翻译系统的效率。
序列检索及CRISPR gRNA序列确定
本发明通过CRISPR-Cas9基因编辑技术,将KlPab1和KleIF4G融合,促进两者的相互作用,以提高体外翻译效率。
基于Pab1序列,得到乳酸克鲁维酵母中KlPab1基因序列(位于染色体C的1553322... 1555100)。在KlPab1基因终止密码子附近搜索PAM序列(NGG),并确定gRNA序列。gRNA选择的原则为:GC含量适中,本发明的标准为GC含量为40%-60%;避免poly T结构的存在。最终,本发明确定的KlPab1 gRNA序列为TGCTTACGAAAACTTCAAGA,位于染色体C的1555058...1555077位点。
介导的将KleIF4G整合到KlPab1位点质粒构建
I. CRISPR质粒构建
使用引物PF16:TGCTTACGAAAACTTCAAGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCG(SEQ ID NO.:9),PR16:GCTCTAAAACTCTTGAAGTTTTCGTAAGCAAAAGTCCCATTCGCCACCCG(SEQID NO.:10),以pCAS质粒为模板,进行PCR扩增。将扩增产物17 µL混合,加入1 µL DpnI,2 µL 10× digestion buffer,37 oC温浴3 h。将DpnI处理后产物10 µL加入100 µL DH5α感受态细胞中,冰上放置30 min,42 oC热激45 s后,加入1 mL LB液体培养基37 oC振荡培养1h,涂布于Kan抗性LB固体培养,37 oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存,命名为pHoCas9_SE_tRNA_ScRNR2_KlPAB1-gRNA1(图3)。
供体 DNA质粒构建及扩增
为了便于线性供体DNA的保存及扩增,首先将供体DNA插入到pMD18质粒中,然后通过PCR扩增得到线性供体DNA序列。
以乳酸克鲁维酵母基因组DNA为模板,以引物PF17:GAGCTCGGTACCCGGGGATCCTCTAGAGATCCGGTAAGCCATTGTACGTTGCCAT(SEQ ID NO.:11)和PR17:GCCAAGCTTGCATGCCTGCAGGTCGACGATCAGTATACCGTCCATGTTGATGACT(SEQ ID NO.:12)进行PCR扩增;以pMD18质粒为模板,以引物pMD18-F:ATCGTCGACCTGCAGGCATG(SEQ ID NO.:13)和pMD18-R:ATCTCTAGAGGATCCCCGGG(SEQ ID NO.:14)进行PCR扩增。将两次扩增产物各8.5 µL混合,加入1 µL DpnI,2 µL 10×消化缓冲液,37 oC温浴3 h。将DpnI处理后产物10 µL加入100 µL DH5α感受态细胞中,冰上放置30 min,42 oC热激45 s后,加入1 mL LB液体培养基37 oC振荡培养1 h,涂布于Amp抗性LB固体培养,37 oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存,命名为pKM-KlPab1-DD。
以pKM-KlPab1-DD为模板,以引物PF18: GATGCATTGATGGATGCCGAAGATGATTAAACTTGATTTTTTGACCTTGATCTTCATCTTGTC(SEQ ID NO.:15)和PR18:CTTGAACTTCATCTTGAGTTGAACCTCCACCTCCAGATCCACCTCCACCAGCTTGAGCTTCTTGTTCTTTTTTAAAATTCTCGTAAGCAGCTAAGGCTTC(SEQID NO.:16)进行扩增;以乳酸克鲁维酵母DNA为模板,以引物PF19: GTGGAGGTTCAACTCAAGATGAAGTTCAAGGTCCACATGCTGGTAAGTCTACTGTTGGTGGAGGTGGATCTGGCGAACCTACATCCGATCAGC(SEQID NO.:17)和PR19: TTAATCATCTTCGGCATCCATCAATGC(SEQ ID NO.:18)进行扩增。将两次扩增产物各8.5 µL,1 µL DpnI,2 µL 10× digestion buffer混合,37 oC温浴3 h。将DpnI处理后产物10 µL加入100 µL DH5α感受态细胞中,冰上放置30 min,42 oC热激45 s后,加入1mL LB液体培养基37 oC振荡培养1 h,涂布于Amp抗性LB固体培养,37 oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存,命名为KlPAB1-30Linker-KleIF4G-DD1-pMD18(图4)。
以KlPAB1-30Linker-KleIF4G-DD1-pMD18质粒为模板,以引物M13-F:GTAAAACGACGGCCAGT(SEQ ID NO.:19)和M13-R: CAGGAAACAGCTATGAC(SEQ ID NO.:20)进行扩增,得到线性供体DNA。
乳酸克鲁维酵母转化及阳性鉴定
I.将乳酸克鲁维酵母菌液在YPD固体培养基上划线并挑取单克隆,于25 mL 2× YPD液体培养基中振荡培养过夜,取2 mL菌液于50 mL液体2× YPD培养基中继续振荡培养2-8 h。20 oC条件下3000 g离心5 min收集酵母细胞,加入500 µL无菌水重悬,同样条件下离心收集细胞。配制感受态细胞溶液(5% v/v甘油,10% v/v DMSO)并将酵母细胞溶解于500 µL该溶液中。分装50 µL至1.5 mL离心管中,-80 oC保存。
将感受态细胞置于37 oC融化15-30 s,13000 g离心2 min并去除上清。配制转化缓冲液:PEG3350 (50% (w/v)) 260 µL,LiAc (1.0 M) 36 µL,carrier DNA (5.0 m g /mL) 20 µL,Cas9 & gRNA质粒15µL,供体DNA 10µL,加入无菌水至最终体积360 µL。热激后,13000 g离心30 s去除上清。加入1 mL YPD液体培养基,培养2-3 h,吸取200 µL涂布于固体YPD(200 µg/mL G418)培养基,培养2-3天至单菌落出现。
在乳酸克鲁维酵母转化后的平板上挑取10-20个单克隆,置于1 mL YPD(200 µg/mL G418)液体培养基中振荡培养过夜,以菌液为模板,以引物KlPAB1-CICF1(KlPAB1序列内引物):TCTCCAGAAGAAGCTACCAAGGCTA(SEQ ID NO.:21)和引物KleIF4G-CICR2(KleIF4G序列内引物):TTCTCTTCGACAGCCTTCTTAGCAG(SEQ ID NO.:22)进行PCR扩增,对KlPAB1位点KleIF4G插入进行PCR检测,PCR结果阳性并经测序鉴定的菌株,确定为阳性菌株,命名为KlPAB1-KleIF4G。
实施例2通过敲除核酸酶KlEXN53,内源性表达带有特定启动强度ScRNR2的T7RNP,减少或者不必额外添加T7RNP,以提高提高体外翻译效率以提高提高体外翻译效率。
生物体内生物合成的背景及分析
体内生物合成是指在生物体内酶催化的各种化合物的合成过程,包括光合作用,糖异生,核苷酸、核酸及蛋白质的等大分子的生物合成。其中,蛋白质的合成是数量上最重要的。
生物合成的整个过程包括转录和翻译,转录是遗传信息从DNA到 RNA的转移。即以双链DNA中的一条链为模板,以腺三磷(ATP)、胞三磷(CTP)、鸟三磷(GTP)和尿三磷(UTP)4种核苷三磷酸为原料,在RNA聚合酶催化下合成RNA的过程。翻译是在多种因子辅助下,核糖体结合信使核糖核酸(mRNA)模板,通过转移核糖核酸(tRNA)识别该mRNA的三联体密码子和转移相应氨基酸,进而按照模板mRNA信息依次连续合成蛋白质肽链的过程。转录调控受转录因子、核酸酶、RNA聚合酶等影响,翻译调控受翻译起始、翻译延伸、翻译终止等因素影响。
通过K. lactis基因组KlEXN53改造以调控体外生物合成活性的的设计原理
2.2.1体外生物合成体系分析
I. 不同体外生物合成体系中的组成分析
体外生物合成系统通过对不同种类的细胞(包括微生物、动物和植物)进行破碎,提取细胞裂解物,从而用于外源蛋白的翻译。体外生物合成系统为了实现转录、翻译、蛋白折叠和能量代谢等功能,细胞裂解物中必须包含能量再生和蛋白质合成方面的元件,包括核糖体、氨酰-tRNA合成酶、翻译起始和延伸因子、核糖体释放因子、核苷酸循环酶、代谢酶、分子伴侣和折叠酶等。需要外源加入的物质包括氨基酸、核苷酸、DNA模板、能量底物、辅助因子和盐分子等。系统中不同组分的稳定性对反应延续时间及最终蛋白产量有重要影响,某些底物的消耗殆尽(例如ATP和半胱氨酸等)是反应终止的重要原因。
体外生物合成体系中的组分对合成产物的影响分析模型;
在体外翻译系统中,能量代谢底物(磷酸肌酸等)、参与mRNA合成的底物(NTP等)、参与蛋白质合成的底物(氨基酸等)以及磷酸盐浓度和pH值等组分,随着反应的进行,量值会产生变化,最终导致反应终止。通过不同技术手段,补充相应组分(NTP和氨基酸等)或稳定相应条件(pH值和磷酸盐浓度等),均能有效延长体外翻译系统的反应时间,从而提高蛋白产量。
体外蛋白质合成体系中的核酸和核酸酶对蛋白质合成的影响分析;
作为蛋白质翻译的重要底物,DNA模板及其转录生成的mRNA的稳定性,对体外翻译系统反应持续时间及产量有重要影响。细胞经过破碎,收取细胞裂解液并用于构建体外翻译体系,其中除了含有蛋白质合成所必需的各种组分外,也包含核酸酶、蛋白酶等不利于反应进行的组分。在由经过纯化的各种组分组成的系统当中,由于不含有抑制因子,蛋白质翻译的效率显著提升。
同时,通过不同的技术手段(包括核酸酶基因敲除和加入稳定因子等)能有效提高体外翻译系统中核酸的稳定性,进而提高蛋白质的翻译效率。通过降低体外生物合成体系中的核酸酶来提高核酸的稳定性,并利用对K.lactis基因组中核酸酶基因进行分析和特异性改造。
基因组中核酸酶基因分析
i. K.lactis 基因组中核酸酶基因的分类和分布;
核酸酶(也称为核聚合酶或多核苷酸酶)是核酸分解的第一步中能够水解核苷酸之间的磷酸二酯键的酶。根据核酸酶作用的位置不同,可将核酸酶分为核酸外切酶(exonuclease)和核酸内切酶(endonuclease)。核酸外切酶从3’端开始逐个水解核苷酸,称为3’ to 5’外切酶,核酸外切酶从5’端开始逐个水解核苷酸,称为5’ to 3’外切酶,核酸内切酶催化水解多核苷酸内部的磷酸二酯键。核酸酶又分为脱氧核糖核酸酶(DNase)和核糖核酸酶(RNase),前者对DNA起作用,后者对RNA起作用。根据核酸酶的作用方向又将核酸外切酶分为5’ to 3’核酸外切酶和3’ to 5’核酸外切酶。
通过数据库基因功能比对分析,K. lactis中共含有61个核酸酶,分布在K.lactis A-F六条染色体上,其中位于A染色体的核酸酶有:KlSEN54,KlDNA2,KlTRM2,KlFCF1,KlDOM34,KlRAD2,KlRNH70,KlDIS3,KlNPP1;位于B染色体的核酸酶有:KlOGG1;位于C染色体的核酸酶有:KlPOL2,KlRAD50,KlYSH1,KlRCL1,KlNGL2,KlMRE11,KlPOP3,KlMKT1,KlAPN1,KlRPP1,KlPOP2;位于D染色体的核酸酶有:KlNUC1,KlRPP6,KlDBR1,KlRPS3,KlRPM2,KlSUV3,KlRAD1,KlIRE1,KlPOP1;位于E染色体的核酸酶有:KlPOL3,KlDXO1,KlMUS81,KlPAN3,KlAPN2,KlRAI1,KlEXO1,KlREX4,KlPAN2,KlLCL3;位于F染色体的核酸酶有:KlRAD17,KlPOP4,KlPOP5,KlRAD27,KlRNH201,KlVMA1,KlRAT1,KlNGL1,KlREX2,KlTRL1,KlPOL31,KlCCR4,KlTRZ1,KlSEN2,KlREX3,KlSWT1,KLEXN53,KlRNT1,KlSEN15,KlNTG1,KlNOB1,KlDDP1。按照功能分类,可将K. lactis核酸酶分为两类,其中DNA酶共有18个,RNA酶共有41个,无功能分类的2个,如表3所示。其中在DNA酶中具有3’ to 5’功能的是KlAPN1,5’to 3’功能的是KlRAD27,KlEXO1;在RNA酶中具有3’to 5’功能的是KlRNH70,KlDIS3,KlNGL2,KlRPP6, 5’to 3’功能的是KlDXO1,KlRAT1,KLEXN53。
表3 核酸酶的分布情况
ii. K.lactis 基因组中与体外蛋白质合成相关的核酸酶基因的选取分析;
核酸 RNA和DNA蛋白质体外合成系统中的编码底物,它们的稳定性影响着蛋白质的得率。在真核生物翻译过程中,RNA的5’端会瞬时完成帽子结构的加工,而RNA的5’帽子结构对于RNA的稳定性和翻译的效率起着举足轻重的作用。
在真核生物中,存在依赖去腺苷化和非依赖腺苷化的RNA降解机制,在依赖去腺苷化RNA降解机制中可以通过招募去帽复合物去除RNA的5’端成熟帽子结构或者非成熟的帽子结构,RNA同时也在核酸酶的作用下发生5’ to 3’的降解。在非依赖腺苷化的mRNA降解机制中,在内切核酸酶的作用下,核酸分子从中间产生断链,核酸外切酶从3’ to 5’降解RNA。
在K.lactis 的体外蛋白质合成体系中,采用外源线性或环状DNA作为模板,转录出带有polyA 3’端尾巴的mRNA, 取决于启动子(promotor)和RNA转录酶的不同,可能带有或不带有5’端成熟帽子结构。因此,DNase酶、RNase酶、核酸外切酶、核酸内切酶均会对体外蛋白质合成体系中模板的稳定性产生影响,改造这些酶对于提高体外生物合成活性均有可能有提升作用。
这其中,由于mRNA的特殊不稳定性和体内RNase酶的高活性,mRNA的寿命是制约体外蛋白质合成的主要因素之一。因此,通过改造以减少体内RNase酶是首选的改造方案。因KlEXN53是端粒脱帽(促进单链DNA的产生)时检查点激活所必需的,同时作为RNA加工蛋白之一,能够调控端粒代谢,并影响真核生物的基因组稳定性,最终,敲定对KlEXN53进行敲除。当然,本专利仍然适用于其他核酸酶的设计改造以提高体外蛋白质合成活性。
细胞基因组中插入pScRNR2和T7RNAP位点的选定分析
为了克服现有体外翻译系统中需外源手动加入T7 RNA聚合酶蛋白的缺陷,本发明通过基因编辑技术CRISPR-Cas9系统将T7 RNAP蛋白整合到细胞基因组内,创造了一个能够稳定适量表达T7 RNAP蛋白的菌株,进而形成了无需额外外源手动加入T7 RNAP的简便高效的体外翻译系统。
体外翻译系统对T7 RNAP的含量有较高要求,过高或过少都会对系统效率产生影响。因此本发明在T7RNAP前插入较弱的pScRNR2启动子,并将该结构构建到游离质粒中,验证T7 RNAP表达盒在体外翻译系统中的作用。
经过游离质粒功能验证以后,本发明通过是将T7 RNAP表达盒替换细胞某个基因。本发明中,将KLEXN53基因敲除并进行T7 RNAP替换。
通过CRISPR/Cas9靶向敲除EXN53基因,替换为T7 RNAP表达盒
2.4.1 KLEXN53序列检索及CRISPR gRNA序列确定
I. 靶向敲除基因克隆载体质粒的构建:
在KEGG数据库中以EXN53基因进行BLAST比对分析,确定乳酸克鲁维酵母中EXN53基因序列(SEQ ID NO.5),KEGG数据库编码为KlLA0F22385g,该基因命名为KLEXN53(位于染色体F的2091235...2095596位)。
在KLEXN53基因起始密码子和终止密码子搜索PAM序列(NGG),并确定gRNA序列。gRNA选择的原则为:GC含量适中,本发明的标准为GC含量为40%-60%;避免poly T结构的存在。最终,本发明确定的KLEXN53 gRNA-1序列为AGAGTTCGACAATTTGTACT(SEQ ID NO.:23),KLEXN53 gRNA-3序列为CGTCGTGGCCGTAGTAATCG(SEQ ID NO.:24)。
质粒构建及转化方法如下:使用引物pCas9-KLEXN53-F1:AGAGTTCGACAATTTGTACTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTC (SEQ ID NO.:25)
和pCas9-KLEXN53-R1:GCTCTAAAACAGTACAAATTGTCGAACTCTAAAGTCCCATTCGCCACCCG(SEQID NO.:26), pCas9- KLEXN53-F2:CGTCGTGGCCGTAGTAATCGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTC(SEQ ID NO.:27)和pCas9- KLEXN53-R2:GCTCTAAAACCGATTACTACGGCCACGACGAAAGTCCCATTCGCCACCCG(SEQ ID NO.:28),均以pCAS质粒为模板,进行PCR扩增。分别将扩增产物17 µL混合,加入1 µL Dpn I,2 µL 10 × digestion buffer,37 oC温浴3 h。将DpnI处理后产物10 µL加入100 µL DH5α感受态细胞中,冰上放置30 min,42 oC热激45 s后,加入1 mL LB液体培养基37 oC振荡培养1 h,涂布于Kan抗性LB固体培养,37 oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存,分别命名为pHoCas9_SE_Kana_tRNA_ScRNR2_KLEXN53-gRNA1和pHoCas9_SE_Kana_tRNA_ScRNR2_KLEXN53-gRNA3。以pHoCas9_SE_Kana_tRNA_ScRNR2_KLEXN53-gRNA1为模板,使用引物pCas9-F1:TAGGTCTAGAGATCTGTTTAGCTTGCCTCG(SEQ ID NO.:29)和pCas9-R1:TATCCACTAGACAGAAGTTTGCGTTCC(SEQ ID NO.:30),以pHoCas9_SE_Kana_tRNA_ScRNR2_KLEXN53-gRNA3为模板,使用引物pCas9-F2:TATGGAACGCAAACTTCTGTCTAGTGGATAGTATATGTGTTATGTAGTATACTCTTTCTTCAACAATTAAATACTCTCGG(SEQ ID NO.:31)和pCas9-F2:CGAGGCAAGCTAAACAGATCTCTAGACCTATATCCACTAGACAGAAGTTTGCGTTCC(SEQ ID NO.:32)进行PCR扩增,pCas9-F1/ pCas9-R1和pCas9-F2/ pCas9-R2的PCR扩增产物按照1:5进行混合,加入1 µL Dpn I,2 µL10 × digestion buffer,37 oC温浴3 h。将Dpn I处理后产物10 µL加入100 µL DH5α感受态细胞中,冰上放置30 min,42 oC热激45 s后,加入1 mL LB液体培养基37 oC振荡培养1 h,涂布于Kan抗性LB固体培养,37 oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存,分别命名为pHoCas9_SE_Kana_tRNA_ScRNR2_KLEXN53-gRNA1&3(如图5所示)。
供体 DNA质粒构建及扩增
为了便于线性供体DNA的保存及扩增,本发明首先将供体DNA插入到pMD18质粒中,然后通过PCR扩增得到线性供体DNA序列。
以含有T7 RNAP基因的质粒为模板,以引物PF1: ATGAACACGATTAACATCGCTAAGAACG(SEQ ID NO.:33)和PR1: TTACGCGAACGCGAAGTCCG(SEQ ID NO.:34)进行PCR扩增;以乳酸克鲁维酵母游离质粒为模板,以引物PF2: ATCTTAGAGTCGGACTTCGCGTTCGCGTAAGAAGATGCTTCTGCTCATCATC(SEQ ID NO.:35)和PR2: AGTCGTTCTTAGCGATGTTAATCGTGTTCATGGTAATTGGACAAATAAATACGTGT(SEQ ID NO.:36)进行PCR扩增。将两次扩增产物各8.5 µL混合,加入1 µLDpnI,2 µL 10× digestion buffer,37 oC温浴3 h。将DpnI处理后产物10 µL加入100 µLDH5α感受态细胞中,冰上放置30 min,42 oC热激45 s后,加入1 mL LB液体培养基37 oC振荡培养1 h,涂布于Kan抗性LB固体培养,37 oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存,命名为pKM-T7RNAP1。
以乳酸克鲁维酵母基因组DNA为模板,以引物KLEXN53-F1:GTACCCGGGGATCCTCTAGAGATCCAGTTGCAGAGCCTCCGAA(SEQ ID NO.:37)和KLEXN53-R1:CATGCCTGCAGGTCGACGATGCGAAACCTTAGCTCTTTATCGAAC(SEQ ID NO.:38)进行PCR扩增;以pMD18质粒为模板,以引物pMD18-F:ATCGTCGACCTGCAGGCATG(SEQ ID NO.:13)和pMD18-R:ATCTCTAGAGGATCCCCGGG(SEQ IDNO.:14)进行PCR扩增。将两次扩增产物各8.5 µL混合,加入1 µL Dpn I,2 µL 10 ×digestion buffer,37 oC温浴3 h。将Dpn I处理后产物10 µL加入100 µL DH5α感受态细胞中,冰上放置30 min,42 oC热激45 s后,加入1 mL LB液体培养基37 oC振荡培养1 h,涂布于Amp抗性LB固体培养,37 oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存,命名为KLEXN53- pMD18。
以KLEXN53- pMD18质粒为模板,以引物KLEXN53-F3:ATGTTGGTTTGAATGGACTATTAACAGTAAATATTATATCACTTCGTGTTCAATTAATTACGGTTTGTGGCTTAACTAAAAAGTCGAACAAGAAGCAGGCAAAG(SEQ ID NO.:39)
和KLEXN53-R2:GAAGTGATATAATATTTACTGTTAATAGTCCATTCAAACCAACATTTATTTTAGTTAAGCCACAAACCGTAATTAATTGAACAC(SEQ ID NO.:40)进行PCR扩增;构建KLEXN53-DD-pMD18。具体步骤为:两种PCR产物各8.5 µL混合,加入1 µL Dpn I,2 µL 10 × digestion buffer,37oC温浴3 h。将Dpn I处理后产物10 µL加入100 µL DH5α感受态细胞中,冰上放置30 min,42oC热激45 s后,加入1 mL LB液体培养基37 oC振荡培养1 h,涂布于Amp抗性LB固体培养,37oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存。
以pKM-T7RNAP1为模板,以引物pScRNR2-F3:GTGTTCAATTAATTACGGTTTGTGGCTTAACTAAAAAGTCGAACAAGAAGCAGGCAAAG(SEQ ID NO.:41)和tCYC1-R2:GAAGTGATATAATATTTACTGTTAATAGTCCATTCAAACCAACATCTTCGAGCGTCCCAAAACCTTC(SEQ IDNO.:42)进行PCR扩增;以KLEXN53-DD-pMD18为模板,以引物KlEXN53-F4:ATGTTGGTTTGAATGGACTATTAACAGTAAATATTATATCACTTC(SEQ ID NO.:
43)和KlEXN53-R4:TTTTAGTTAAGCCACAAACCGTAATTAATTGAACAC (SEQ ID NO.:44)进行PCR扩增,构建KlEXN53-pScRNR2-T7 RNP-DD1-pMD18质粒(如图6所示)。具体步骤为:两种PCR产物各8.5 µL混合,加入1 µL Dpn I,2 µL 10 × digestion buffer,37 oC温浴3 h。将Dpn I处理后产物10 µL加入100 µL DH5α感受态细胞中,冰上放置30 min,42 oC热激45s后,加入1 mL LB液体培养基37 oC振荡培养1 h,涂布于Amp抗性LB固体培养,37 oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存。
乳酸克鲁维酵母转化及阳性鉴定
i 将实施例3中改造成功的乳酸克鲁维酵母KlPAB1-KleIF4G菌液在YPD固体培养基上划线并挑取单克隆,于25 mL 2×YPD液体培养基中振荡培养过夜,取2 mL菌液于50 mL液体2×YPD培养基中继续振荡培养2-8 h。20 oC条件下3000 g离心5 min收集酵母细胞,加入500 µL无菌水重悬,同样条件下离心收集细胞。配制感受态细胞溶液(5% v/v甘油,10% v/vDMSO)并将酵母细胞溶解于500 µL该溶液中。分装50 µL至1.5 mL离心管中,-80 oC保存。
将感受态细胞置于37 oC融化15-30 s,13000 g离心2 min并去除上清。配制转化缓冲液:PEG 3350 (50% (w/v)) 260 µL,LiAc (1.0 M) 36 µL,carrier DNA (5.0 mg /mL) 20 µL,Cas9 & gRNA质粒5µL,供体DNA 10µL,加入无菌水至最终体积360 µL。热激后,13000 g离心30 s去除上清。加入1 mL YPD液体培养基,培养2-3 h,吸取200 µL涂布于固体YPD(200 µg / mL G418)培养基,培养2-3天至单菌落出现。
在乳酸克鲁维酵母转化后的平板上挑取10-40个单克隆,置于1 mL YPD(200 µg /mL G418)液体培养基中振荡培养过夜,以菌液为模板,以CRISPR Insertion Check引物KLEXN53-CICF1:TTTGCTGGTTGCCCGTATTCCC(SEQ ID NO.:
45),KLEXN53-CICR1:TAATAGCACAGGGAATGCACCTT(SEQ ID NO.:46)
,对样品进行PCR检测。PCR结果阳性并经测序鉴定的菌株,确定为阳性菌株,命名为klxrn1∆-pScRNR2-T7 RNP & KlPAB1-KleIF4G,简称3in1。
实施例3无细胞体外蛋白质合成体系的制备和蛋白合成效率的测定
实验方法:
I.体外蛋白质合成体系的储存液配制:1M pH为7.4的4-羟乙基哌嗪乙磺酸,5 M醋酸钾,250 mM醋酸镁,25 mM 4四种核苷三磷酸的混合物,包括腺嘌呤核苷三磷酸、鸟嘌呤核苷三磷酸、胞嘧啶核苷三磷酸和尿嘧啶核苷三磷酸,1mM 2二十种氨基酸的混合物:甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、脯氨酸、色氨酸、丝氨酸、酪氨酸、半胱氨酸、蛋氨酸、天冬酰胺、谷氨酰胺、苏氨酸、天冬氨酸、谷氨酸、赖氨酸、精氨酸和组氨酸,20种氨基酸的浓度均为1.0 mM,1M磷酸肌酸,1M二硫苏糖醇,6.48 mg/mL磷酸肌酸激酶,1.7mg/mL T7RNA聚合酶20%-50% 聚乙二醇(polyethylene glycol, PEG)3350或者(polyethyleneglycol,PEG)8000, 20%-40% 蔗糖;
II.体外蛋白质合成反应体系:终浓度为22 mM pH为7.4的4-羟乙基哌嗪乙磺酸,30-150 mM醋酸钾,1.0-5.0 mM醋酸镁,1.5 mM-4 mM核苷三磷酸混合物(腺嘌呤核苷三磷酸、鸟嘌呤核苷三磷酸、胞嘧啶核苷三磷酸和尿嘧啶核苷三磷酸),0.08-0.24 mM的氨基酸混合物(甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、脯氨酸、色氨酸、丝氨酸、酪氨酸、半胱氨酸、蛋氨酸、天冬酰胺、谷氨酰胺、苏氨酸、天冬氨酸、谷氨酸、赖氨酸、精氨酸和组氨酸),25 mM磷酸肌酸,1.7 mM二硫苏糖醇,0.27 mg/mL磷酸肌酸激酶,8-20 ng/µL萤火虫荧光素酶DNA,0.027-0.054 mg/mL T7 RNA 聚合酶,1%-4%的聚乙二醇,最后加入50%体积的酵母细胞提取物;
III.体外蛋白质合成反应:将上述的反应体系放置在20-30 ℃的环境中,静置反应2-6h;
IV.萤光素酶活性测定:反应结束后,在96孔白板或384孔白板中加入等体积的底物荧光素(luciferine),立即放置于Envision 2120多功能酶标仪(Perkin Elmer), 读数,检测萤火虫荧光素酶活性,相对光单位值(RLU)作为活性单位,如图7和图8所示。
实验结果:
本发明实施例3的结果表明:在上述改造klxrn1∆-pScRNR2-T7 RNP & KlPAB1-KleIF4G(3in1)菌株能够显著增强酵母体外蛋白质合成体系产生蛋白质的效率,从图7中也可以看出野生型(WT)在IVTT中荧光素酶活性数值为:2.87×108,klxrn1∆-pScRNR2-T7RNP & KlPAB1-KleIF4G(3in1)酵母菌株在IVTT中荧光素酶活性数值为:1.539×109,其活性约是野生型的5.36倍。从图8中可以看出,如果外源手动加入T7 RNP,活性反而有所降低,其RLU值为1.148×109;当外加T7 RNAP浓度为0时表现出最高活性且处于正常范围内(≥108),表明该结构中T7 RNAP可以适量表达,能够满足体外翻译系统的要求,并且该结构的核酸构建物能够显著增强酵母体外蛋白质合成体系产生蛋白质的效率,其RLU值为1.539×109。
实施例4
重复实施例3的方法,区别在于,本发明的工程菌株仅整合PabI元件与eIF4G元件融合形成的第一融合蛋白。
结果表明,与野生型相比,仅整合PabI元件与eIF4G元件融合形成的第一融合蛋白的工程菌株将IVTT中荧光素酶的活性提高了2.6倍。
实施例5
重复实施例3的方法,区别在于,本发明的工程菌株仅敲除KEXN53核酸酶。
结果表明,与野生型相比,仅敲除KEXN53核酸酶的本发明的工程菌株将IVTT中荧光素酶的活性提高了1.46倍。
实施例6 总结体外生物合成体系的设计思路
如上所述,本发明总结了通过转录、翻译调控及稳定核酸酶来调节生物体外合成的设计思路,即一种通过整合对核酸外切酶(KlXEN53)敲除,细胞中内源性表达 RNA聚合酶(T7RNP)及新型融合蛋白(KlPAB1-KleIF4G)的制备为一体以提高体外生物合成活性的方法,从而实现体外蛋白的稳定、高效、快速的表达,如图9所示。
参考文献:
1. Ayyar, B.V., S. Arora, and R. O'Kennedy, Coming-of-Age of Antibodiesin Cancer Therapeutics. Trends Pharmacol Sci, 2016. 37(12): 1009-1028.
2. Scott, A.M., J.D. Wolchok, and L.J., Antibody therapy of cancer.Nature Reviews Cancer, 2012. 12(4): 278.
3. Sonenberg, N. and A.G. Hinnebusch, Regulation of translationinitiation in eukaryotes: mechanisms and biological targets. Cell, 2009. 136(4): 731-45.
4. M., D.J.R.G., Nucleic Acid. Encyclopedia of Cell Biology, Elsevier,2015.
5. Chong, S., Overview of Cell-Free Protein Synthesis: HistoricLandmarks, Commercial Systems, and Expanding Applications. 2014: John Wiley &Sons, Inc. 16.30.1-16.30.11.
6. Buchner E, Rapp R., Alkoholische gährung ohne hefezellen. EuropeanJournal of Inorganic Chemistry, 1897. 30(3): 2668-2678.
7. Welch P, Scopes R K, Studies on cell-free metabolism: Ethanolproduction by a yeast glycolytic system reconstituted from purified enzymes.Journal of biotechnology, 1985. 2(5): 257-273.
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 康码(上海)生物科技有限公司
<120> 一种在细胞中提高蛋白合成效率的方法
<130> P2018-0084
<141> 2018-01-31
<160> 46
<170> SIPOSequenceListing 1.0
<210> 1
<211> 592
<212> PRT
<213> 乳酸克鲁维酵母(Kluyveromyces lactis)
<400> 1
Met Ser Asp Ile Thr Glu Lys Thr Ala Glu Gln Leu Glu Asn Leu Gln
1 5 10 15
Ile Asn Asp Asp Gln Gln Pro Ala Gln Ser Ala Ser Ala Pro Ser Thr
20 25 30
Ser Ala Ser Glu Ser Glu Ala Ser Ser Val Ser Lys Val Glu Asn Asn
35 40 45
Asn Ala Ser Leu Tyr Val Gly Glu Leu Asp Pro Asn Ile Thr Glu Ala
50 55 60
Leu Leu Tyr Asp Val Phe Ser Pro Leu Gly Pro Ile Ser Ser Ile Arg
65 70 75 80
Val Cys Arg Asp Ala Val Thr Lys Ala Ser Leu Gly Tyr Ala Tyr Val
85 90 95
Asn Tyr Thr Asp Tyr Glu Ala Gly Lys Lys Ala Ile Gln Glu Leu Asn
100 105 110
Tyr Ala Glu Ile Asn Gly Arg Pro Cys Arg Ile Met Trp Ser Glu Arg
115 120 125
Asp Pro Ala Ile Arg Lys Lys Gly Ser Gly Asn Ile Phe Ile Lys Asn
130 135 140
Leu His Pro Ala Ile Asp Asn Lys Ala Leu His Glu Thr Phe Ser Thr
145 150 155 160
Phe Gly Glu Val Leu Ser Cys Lys Val Ala Leu Asp Glu Asn Gly Asn
165 170 175
Ser Arg Gly Phe Gly Phe Val His Phe Lys Glu Glu Ser Asp Ala Lys
180 185 190
Asp Ala Ile Glu Ala Val Asn Gly Met Leu Met Asn Gly Leu Glu Val
195 200 205
Tyr Val Ala Met His Val Pro Lys Lys Asp Arg Ile Ser Lys Leu Glu
210 215 220
Glu Ala Lys Ala Asn Phe Thr Asn Ile Tyr Val Lys Asn Ile Asp Val
225 230 235 240
Glu Thr Thr Asp Glu Glu Phe Glu Gln Leu Phe Ser Gln Tyr Gly Glu
245 250 255
Ile Val Ser Ala Ala Leu Glu Lys Asp Ala Glu Gly Lys Pro Lys Gly
260 265 270
Phe Gly Phe Val Asn Phe Val Asp His Asn Ala Ala Ala Lys Ala Val
275 280 285
Glu Glu Leu Asn Gly Lys Glu Phe Lys Ser Gln Ala Leu Tyr Val Gly
290 295 300
Arg Ala Gln Lys Lys Tyr Glu Arg Ala Glu Glu Leu Lys Lys Gln Tyr
305 310 315 320
Glu Gln Tyr Arg Leu Glu Lys Leu Ala Lys Phe Gln Gly Val Asn Leu
325 330 335
Phe Ile Lys Asn Leu Asp Asp Ser Ile Asp Asp Glu Lys Leu Lys Glu
340 345 350
Glu Phe Ala Pro Tyr Gly Thr Ile Thr Ser Ala Arg Val Met Arg Asp
355 360 365
Gln Glu Gly Asn Ser Lys Gly Phe Gly Phe Val Cys Phe Ser Ser Pro
370 375 380
Glu Glu Ala Thr Lys Ala Met Thr Glu Lys Asn Gln Gln Ile Val Ala
385 390 395 400
Gly Lys Pro Leu Tyr Val Ala Ile Ala Gln Arg Lys Asp Val Arg Arg
405 410 415
Ser Gln Leu Ala Gln Gln Ile Gln Ala Arg Asn Gln Ile Arg Phe Gln
420 425 430
Gln Gln Gln Gln Gln Gln Ala Ala Ala Ala Ala Ala Gly Met Pro Gly
435 440 445
Gln Tyr Met Pro Gln Met Phe Tyr Gly Val Met Ala Pro Arg Gly Phe
450 455 460
Pro Gly Pro Asn Pro Gly Met Asn Gly Pro Met Gly Ala Gly Ile Pro
465 470 475 480
Lys Asn Gly Met Val Pro Pro Pro Gln Gln Phe Ala Gly Arg Pro Asn
485 490 495
Gly Pro Met Tyr Gln Gly Met Pro Pro Gln Asn Gln Phe Pro Arg His
500 505 510
Gln Gln Gln His Tyr Ile Gln Gln Gln Lys Gln Arg Gln Ala Leu Gly
515 520 525
Glu Gln Leu Tyr Lys Lys Val Ser Ala Lys Ile Asp Asp Glu Asn Ala
530 535 540
Ala Gly Lys Ile Thr Gly Met Ile Leu Asp Leu Pro Pro Gln Gln Val
545 550 555 560
Ile Gln Leu Leu Asp Asn Asp Glu Gln Phe Glu Gln Gln Phe Gln Glu
565 570 575
Ala Leu Ala Ala Tyr Glu Asn Phe Lys Lys Glu Gln Glu Ala Gln Ala
580 585 590
<210> 2
<211> 1021
<212> PRT
<213> 乳酸克鲁维酵母(Kluyveromyces lactis)
<400> 2
Met Gly Glu Pro Thr Ser Asp Gln Gln Pro Ala Val Glu Ala Pro Val
1 5 10 15
Val Gln Glu Glu Thr Thr Ser Ser Pro Gln Lys Asn Ser Gly Tyr Val
20 25 30
Lys Asn Thr Ala Gly Ser Gly Ala Pro Arg Asn Gly Lys Tyr Asp Gly
35 40 45
Asn Arg Lys Asn Ser Arg Pro Tyr Asn Gln Arg Gly Asn Asn Asn Asn
50 55 60
Asn Asn Gly Ser Ser Ser Asn Lys His Tyr Gln Lys Tyr Asn Gln Pro
65 70 75 80
Ala Tyr Gly Val Ser Ala Gly Tyr Ile Pro Asn Tyr Gly Val Ser Ala
85 90 95
Glu Tyr Asn Pro Leu Tyr Tyr Asn Gln Tyr Gln Gln Gln Gln Gln Leu
100 105 110
Tyr Ala Ala Ala Tyr Gln Thr Pro Met Ser Gly Gln Gly Tyr Val Pro
115 120 125
Pro Val Val Ser Pro Ala Ala Val Ser Ala Lys Pro Ala Lys Val Glu
130 135 140
Ile Thr Asn Lys Ser Gly Glu His Ile Asp Ile Ala Ser Ile Ala His
145 150 155 160
Pro His Thr His Ser His Ser Gln Ser His Ser Arg Ala Val Pro Val
165 170 175
Val Ser Pro Pro Ala Asn Val Thr Val Ala Ala Ala Val Ser Ser Ser
180 185 190
Val Ser Pro Ser Ala Ser Pro Ala Val Lys Val Gln Ser Pro Ala Ala
195 200 205
Asn Gly Lys Glu Gln Ser Pro Ala Lys Pro Glu Glu Pro Lys Lys Asp
210 215 220
Thr Leu Ile Val Asn Asp Phe Leu Glu Gln Val Lys Arg Arg Lys Ala
225 230 235 240
Ala Leu Ala Ala Lys Lys Ala Val Glu Glu Lys Gly Pro Glu Glu Pro
245 250 255
Lys Glu Ser Val Val Gly Thr Asp Thr Asp Ala Ser Val Asp Thr Lys
260 265 270
Thr Gly Pro Thr Ala Thr Glu Ser Ala Lys Ser Glu Glu Ala Gln Ser
275 280 285
Glu Ser Gln Glu Lys Thr Lys Glu Glu Ala Pro Ala Glu Pro Lys Pro
290 295 300
Leu Thr Leu Ala Glu Lys Leu Arg Leu Lys Arg Met Glu Ala Ala Lys
305 310 315 320
Gln Ala Ser Ala Lys Thr Glu Glu Leu Lys Thr Glu Glu Ser Lys Pro
325 330 335
Glu Glu Thr Lys Thr Glu Glu Leu Lys Thr Glu Glu Ser Lys Pro Glu
340 345 350
Glu Thr Lys Thr Glu Glu Leu Lys Thr Glu Glu Thr Lys Ser Glu Glu
355 360 365
Leu Lys Thr Glu Glu Pro Lys Ala Glu Glu Ser Lys Ala Glu Glu Pro
370 375 380
Lys Pro Glu Glu Pro Lys Thr Glu Glu Pro Thr Thr Glu Gln Pro Lys
385 390 395 400
Ser Asp Glu Pro Lys Ser Glu Glu Ser Lys Thr Glu Glu Pro Lys Thr
405 410 415
Glu Val Leu Lys Thr Glu Glu Pro Lys Ser Glu Glu Ser Lys Pro Ala
420 425 430
Glu Pro Lys Thr Glu Glu Thr Ala Thr Glu Glu Thr Ala Thr Glu Ala
435 440 445
Asn Ala Glu Glu Gly Glu Pro Ala Pro Ala Gly Pro Val Glu Thr Pro
450 455 460
Ala Asp Val Glu Thr Lys Pro Arg Glu Glu Ala Glu Val Glu Asp Asp
465 470 475 480
Gly Lys Ile Thr Met Thr Asp Phe Leu Gln Lys Leu Lys Glu Val Ser
485 490 495
Pro Val Asp Asp Ile Tyr Ser Phe Gln Tyr Pro Ser Asp Ile Thr Pro
500 505 510
Pro Asn Asp Arg Tyr Lys Lys Thr Ser Ile Lys Tyr Ala Tyr Gly Pro
515 520 525
Asp Phe Leu Tyr Gln Phe Lys Glu Lys Val Asp Val Lys Tyr Asp Pro
530 535 540
Ala Trp Met Ala Glu Met Thr Ser Lys Ile Val Ile Pro Pro Lys Lys
545 550 555 560
Pro Gly Ser Ser Gly Arg Gly Glu Asp Arg Phe Ser Lys Gly Lys Val
565 570 575
Gly Ser Leu Arg Ser Glu Gly Arg Ser Gly Ser Arg Ser Asn Ser Lys
580 585 590
Lys Lys Ser Lys Arg Asp Asp Arg Lys Ser Asn Arg Ser Tyr Thr Ser
595 600 605
Arg Lys Asp Arg Glu Arg Phe Arg Glu Glu Glu Val Glu Glu Pro Lys
610 615 620
Val Glu Val Ala Pro Leu Val Pro Ser Ala Asn Arg Trp Val Pro Lys
625 630 635 640
Ser Lys Met Lys Lys Thr Glu Val Lys Leu Ala Pro Asp Gly Thr Glu
645 650 655
Leu Tyr Asp Ala Glu Glu Ala Ser Arg Lys Met Lys Ser Leu Leu Asn
660 665 670
Lys Leu Thr Leu Glu Met Phe Glu Pro Ile Ser Asp Asp Ile Met Lys
675 680 685
Ile Ala Asn Gln Ser Arg Trp Glu Glu Lys Gly Glu Thr Leu Lys Ile
690 695 700
Val Ile Gln Gln Ile Phe Asn Lys Ala Cys Asp Glu Pro His Trp Ser
705 710 715 720
Ser Met Tyr Ala Gln Leu Cys Gly Lys Val Val Lys Asp Leu Asp Asp
725 730 735
Ser Ile Lys Asp Ser Glu Thr Pro Asp Lys Thr Gly Ser His Leu Val
740 745 750
Leu His Tyr Leu Val Gln Arg Cys Gln Thr Glu Phe Gln Thr Gly Trp
755 760 765
Thr Asp Gln Leu Pro Thr Asn Glu Asp Gly Thr Pro Leu Gln Pro Glu
770 775 780
Met Met Ser Asp Glu Tyr Tyr Lys Met Ala Ala Ala Lys Arg Arg Gly
785 790 795 800
Leu Gly Leu Val Arg Phe Ile Gly Phe Leu Tyr Arg Ser Asn Leu Leu
805 810 815
Thr Ser Arg Met Val Phe Phe Cys Phe Lys Arg Leu Met Lys Asp Ile
820 825 830
Gln Asn Ser Pro Thr Glu Asp Thr Leu Glu Ser Val Cys Glu Leu Leu
835 840 845
Glu Thr Ile Gly Glu Gln Phe Glu Gly Ala Arg Ile Gln Val Thr Ala
850 855 860
Glu Ala Val Ile Glu Gly Ser Ser Leu Leu Asp Thr Leu Phe Asp Gln
865 870 875 880
Ile Lys Asn Val Ile Glu Asn Gly Asp Ile Ser Ser Arg Ile Lys Phe
885 890 895
Lys Leu Ile Asp Ile Val Glu Leu Arg Glu Lys Arg Asn Trp Asn Ser
900 905 910
Lys Asn Lys Asn Asp Gly Pro Lys Thr Ile Ala Gln Ile His Glu Glu
915 920 925
Glu Ala Leu Lys Arg Ala Leu Glu Glu Arg Glu Arg Glu Arg Asp Arg
930 935 940
His Gly Ser Arg Gly Gly Ser Arg Arg Met Asn Ser Glu Arg Asn Ser
945 950 955 960
Ser Arg Arg Asp Phe Ser Ser His Ser His Ser His Asn Gln Asn Arg
965 970 975
Asp Gly Phe Thr Thr Thr Arg Ser Ser Ser Val Arg Tyr Ser Glu Pro
980 985 990
Lys Lys Glu Glu Gln Ala Pro Thr Pro Thr Lys Ser Ser Gly Gly Ala
995 1000 1005
Ala Asn Met Phe Asp Ala Leu Met Asp Ala Glu Asp Asp
1010 1015 1020
<210> 3
<211> 1642
<212> PRT
<213> 人工序列(artificial sequence)
<400> 3
Met Ser Asp Ile Thr Glu Lys Thr Ala Glu Gln Leu Glu Asn Leu Gln
1 5 10 15
Ile Asn Asp Asp Gln Gln Pro Ala Gln Ser Ala Ser Ala Pro Ser Thr
20 25 30
Ser Ala Ser Glu Ser Glu Ala Ser Ser Val Ser Lys Val Glu Asn Asn
35 40 45
Asn Ala Ser Leu Tyr Val Gly Glu Leu Asp Pro Asn Ile Thr Glu Ala
50 55 60
Leu Leu Tyr Asp Val Phe Ser Pro Leu Gly Pro Ile Ser Ser Ile Arg
65 70 75 80
Val Cys Arg Asp Ala Val Thr Lys Ala Ser Leu Gly Tyr Ala Tyr Val
85 90 95
Asn Tyr Thr Asp Tyr Glu Ala Gly Lys Lys Ala Ile Gln Glu Leu Asn
100 105 110
Tyr Ala Glu Ile Asn Gly Arg Pro Cys Arg Ile Met Trp Ser Glu Arg
115 120 125
Asp Pro Ala Ile Arg Lys Lys Gly Ser Gly Asn Ile Phe Ile Lys Asn
130 135 140
Leu His Pro Ala Ile Asp Asn Lys Ala Leu His Glu Thr Phe Ser Thr
145 150 155 160
Phe Gly Glu Val Leu Ser Cys Lys Val Ala Leu Asp Glu Asn Gly Asn
165 170 175
Ser Arg Gly Phe Gly Phe Val His Phe Lys Glu Glu Ser Asp Ala Lys
180 185 190
Asp Ala Ile Glu Ala Val Asn Gly Met Leu Met Asn Gly Leu Glu Val
195 200 205
Tyr Val Ala Met His Val Pro Lys Lys Asp Arg Ile Ser Lys Leu Glu
210 215 220
Glu Ala Lys Ala Asn Phe Thr Asn Ile Tyr Val Lys Asn Ile Asp Val
225 230 235 240
Glu Thr Thr Asp Glu Glu Phe Glu Gln Leu Phe Ser Gln Tyr Gly Glu
245 250 255
Ile Val Ser Ala Ala Leu Glu Lys Asp Ala Glu Gly Lys Pro Lys Gly
260 265 270
Phe Gly Phe Val Asn Phe Val Asp His Asn Ala Ala Ala Lys Ala Val
275 280 285
Glu Glu Leu Asn Gly Lys Glu Phe Lys Ser Gln Ala Leu Tyr Val Gly
290 295 300
Arg Ala Gln Lys Lys Tyr Glu Arg Ala Glu Glu Leu Lys Lys Gln Tyr
305 310 315 320
Glu Gln Tyr Arg Leu Glu Lys Leu Ala Lys Phe Gln Gly Val Asn Leu
325 330 335
Phe Ile Lys Asn Leu Asp Asp Ser Ile Asp Asp Glu Lys Leu Lys Glu
340 345 350
Glu Phe Ala Pro Tyr Gly Thr Ile Thr Ser Ala Arg Val Met Arg Asp
355 360 365
Gln Glu Gly Asn Ser Lys Gly Phe Gly Phe Val Cys Phe Ser Ser Pro
370 375 380
Glu Glu Ala Thr Lys Ala Met Thr Glu Lys Asn Gln Gln Ile Val Ala
385 390 395 400
Gly Lys Pro Leu Tyr Val Ala Ile Ala Gln Arg Lys Asp Val Arg Arg
405 410 415
Ser Gln Leu Ala Gln Gln Ile Gln Ala Arg Asn Gln Ile Arg Phe Gln
420 425 430
Gln Gln Gln Gln Gln Gln Ala Ala Ala Ala Ala Ala Gly Met Pro Gly
435 440 445
Gln Tyr Met Pro Gln Met Phe Tyr Gly Val Met Ala Pro Arg Gly Phe
450 455 460
Pro Gly Pro Asn Pro Gly Met Asn Gly Pro Met Gly Ala Gly Ile Pro
465 470 475 480
Lys Asn Gly Met Val Pro Pro Pro Gln Gln Phe Ala Gly Arg Pro Asn
485 490 495
Gly Pro Met Tyr Gln Gly Met Pro Pro Gln Asn Gln Phe Pro Arg His
500 505 510
Gln Gln Gln His Tyr Ile Gln Gln Gln Lys Gln Arg Gln Ala Leu Gly
515 520 525
Glu Gln Leu Tyr Lys Lys Val Ser Ala Lys Ile Asp Asp Glu Asn Ala
530 535 540
Ala Gly Lys Ile Thr Gly Met Ile Leu Asp Leu Pro Pro Gln Gln Val
545 550 555 560
Ile Gln Leu Leu Asp Asn Asp Glu Gln Phe Glu Gln Gln Phe Gln Glu
565 570 575
Ala Leu Ala Ala Tyr Glu Asn Phe Lys Lys Glu Gln Glu Ala Gln Ala
580 585 590
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Thr Gln Asp Glu Val Gln
595 600 605
Gly Pro His Ala Gly Lys Ser Thr Val Gly Gly Gly Gly Ser Gly Glu
610 615 620
Pro Thr Ser Asp Gln Gln Pro Ala Val Glu Ala Pro Val Val Gln Glu
625 630 635 640
Glu Thr Thr Ser Ser Pro Gln Lys Asn Ser Gly Tyr Val Lys Asn Thr
645 650 655
Ala Gly Ser Gly Ala Pro Arg Asn Gly Lys Tyr Asp Gly Asn Arg Lys
660 665 670
Asn Ser Arg Pro Tyr Asn Gln Arg Gly Asn Asn Asn Asn Asn Asn Gly
675 680 685
Ser Ser Ser Asn Lys His Tyr Gln Lys Tyr Asn Gln Pro Ala Tyr Gly
690 695 700
Val Ser Ala Gly Tyr Ile Pro Asn Tyr Gly Val Ser Ala Glu Tyr Asn
705 710 715 720
Pro Leu Tyr Tyr Asn Gln Tyr Gln Gln Gln Gln Gln Leu Tyr Ala Ala
725 730 735
Ala Tyr Gln Thr Pro Met Ser Gly Gln Gly Tyr Val Pro Pro Val Val
740 745 750
Ser Pro Ala Ala Val Ser Ala Lys Pro Ala Lys Val Glu Ile Thr Asn
755 760 765
Lys Ser Gly Glu His Ile Asp Ile Ala Ser Ile Ala His Pro His Thr
770 775 780
His Ser His Ser Gln Ser His Ser Arg Ala Val Pro Val Val Ser Pro
785 790 795 800
Pro Ala Asn Val Thr Val Ala Ala Ala Val Ser Ser Ser Val Ser Pro
805 810 815
Ser Ala Ser Pro Ala Val Lys Val Gln Ser Pro Ala Ala Asn Gly Lys
820 825 830
Glu Gln Ser Pro Ala Lys Pro Glu Glu Pro Lys Lys Asp Thr Leu Ile
835 840 845
Val Asn Asp Phe Leu Glu Gln Val Lys Arg Arg Lys Ala Ala Leu Ala
850 855 860
Ala Lys Lys Ala Val Glu Glu Lys Gly Pro Glu Glu Pro Lys Glu Ser
865 870 875 880
Val Val Gly Thr Asp Thr Asp Ala Ser Val Asp Thr Lys Thr Gly Pro
885 890 895
Thr Ala Thr Glu Ser Ala Lys Ser Glu Glu Ala Gln Ser Glu Ser Gln
900 905 910
Glu Lys Thr Lys Glu Glu Ala Pro Ala Glu Pro Lys Pro Leu Thr Leu
915 920 925
Ala Glu Lys Leu Arg Leu Lys Arg Met Glu Ala Ala Lys Gln Ala Ser
930 935 940
Ala Lys Thr Glu Glu Leu Lys Thr Glu Glu Ser Lys Pro Glu Glu Thr
945 950 955 960
Lys Thr Glu Glu Leu Lys Thr Glu Glu Ser Lys Pro Glu Glu Thr Lys
965 970 975
Thr Glu Glu Leu Lys Thr Glu Glu Thr Lys Ser Glu Glu Leu Lys Thr
980 985 990
Glu Glu Pro Lys Ala Glu Glu Ser Lys Ala Glu Glu Pro Lys Pro Glu
995 1000 1005
Glu Pro Lys Thr Glu Glu Pro Thr Thr Glu Gln Pro Lys Ser Asp Glu
1010 1015 1020
Pro Lys Ser Glu Glu Ser Lys Thr Glu Glu Pro Lys Thr Glu Val Leu
1025 1030 1035 1040
Lys Thr Glu Glu Pro Lys Ser Glu Glu Ser Lys Pro Ala Glu Pro Lys
1045 1050 1055
Thr Glu Glu Thr Ala Thr Glu Glu Thr Ala Thr Glu Ala Asn Ala Glu
1060 1065 1070
Glu Gly Glu Pro Ala Pro Ala Gly Pro Val Glu Thr Pro Ala Asp Val
1075 1080 1085
Glu Thr Lys Pro Arg Glu Glu Ala Glu Val Glu Asp Asp Gly Lys Ile
1090 1095 1100
Thr Met Thr Asp Phe Leu Gln Lys Leu Lys Glu Val Ser Pro Val Asp
1105 1110 1115 1120
Asp Ile Tyr Ser Phe Gln Tyr Pro Ser Asp Ile Thr Pro Pro Asn Asp
1125 1130 1135
Arg Tyr Lys Lys Thr Ser Ile Lys Tyr Ala Tyr Gly Pro Asp Phe Leu
1140 1145 1150
Tyr Gln Phe Lys Glu Lys Val Asp Val Lys Tyr Asp Pro Ala Trp Met
1155 1160 1165
Ala Glu Met Thr Ser Lys Ile Val Ile Pro Pro Lys Lys Pro Gly Ser
1170 1175 1180
Ser Gly Arg Gly Glu Asp Arg Phe Ser Lys Gly Lys Val Gly Ser Leu
1185 1190 1195 1200
Arg Ser Glu Gly Arg Ser Gly Ser Arg Ser Asn Ser Lys Lys Lys Ser
1205 1210 1215
Lys Arg Asp Asp Arg Lys Ser Asn Arg Ser Tyr Thr Ser Arg Lys Asp
1220 1225 1230
Arg Glu Arg Phe Arg Glu Glu Glu Val Glu Glu Pro Lys Val Glu Val
1235 1240 1245
Ala Pro Leu Val Pro Ser Ala Asn Arg Trp Val Pro Lys Ser Lys Met
1250 1255 1260
Lys Lys Thr Glu Val Lys Leu Ala Pro Asp Gly Thr Glu Leu Tyr Asp
1265 1270 1275 1280
Ala Glu Glu Ala Ser Arg Lys Met Lys Ser Leu Leu Asn Lys Leu Thr
1285 1290 1295
Leu Glu Met Phe Glu Pro Ile Ser Asp Asp Ile Met Lys Ile Ala Asn
1300 1305 1310
Gln Ser Arg Trp Glu Glu Lys Gly Glu Thr Leu Lys Ile Val Ile Gln
1315 1320 1325
Gln Ile Phe Asn Lys Ala Cys Asp Glu Pro His Trp Ser Ser Met Tyr
1330 1335 1340
Ala Gln Leu Cys Gly Lys Val Val Lys Asp Leu Asp Asp Ser Ile Lys
1345 1350 1355 1360
Asp Ser Glu Thr Pro Asp Lys Thr Gly Ser His Leu Val Leu His Tyr
1365 1370 1375
Leu Val Gln Arg Cys Gln Thr Glu Phe Gln Thr Gly Trp Thr Asp Gln
1380 1385 1390
Leu Pro Thr Asn Glu Asp Gly Thr Pro Leu Gln Pro Glu Met Met Ser
1395 1400 1405
Asp Glu Tyr Tyr Lys Met Ala Ala Ala Lys Arg Arg Gly Leu Gly Leu
1410 1415 1420
Val Arg Phe Ile Gly Phe Leu Tyr Arg Ser Asn Leu Leu Thr Ser Arg
1425 1430 1435 1440
Met Val Phe Phe Cys Phe Lys Arg Leu Met Lys Asp Ile Gln Asn Ser
1445 1450 1455
Pro Thr Glu Asp Thr Leu Glu Ser Val Cys Glu Leu Leu Glu Thr Ile
1460 1465 1470
Gly Glu Gln Phe Glu Gly Ala Arg Ile Gln Val Thr Ala Glu Ala Val
1475 1480 1485
Ile Glu Gly Ser Ser Leu Leu Asp Thr Leu Phe Asp Gln Ile Lys Asn
1490 1495 1500
Val Ile Glu Asn Gly Asp Ile Ser Ser Arg Ile Lys Phe Lys Leu Ile
1505 1510 1515 1520
Asp Ile Val Glu Leu Arg Glu Lys Arg Asn Trp Asn Ser Lys Asn Lys
1525 1530 1535
Asn Asp Gly Pro Lys Thr Ile Ala Gln Ile His Glu Glu Glu Ala Leu
1540 1545 1550
Lys Arg Ala Leu Glu Glu Arg Glu Arg Glu Arg Asp Arg His Gly Ser
1555 1560 1565
Arg Gly Gly Ser Arg Arg Met Asn Ser Glu Arg Asn Ser Ser Arg Arg
1570 1575 1580
Asp Phe Ser Ser His Ser His Ser His Asn Gln Asn Arg Asp Gly Phe
1585 1590 1595 1600
Thr Thr Thr Arg Ser Ser Ser Val Arg Tyr Ser Glu Pro Lys Lys Glu
1605 1610 1615
Glu Gln Ala Pro Thr Pro Thr Lys Ser Ser Gly Gly Ala Ala Asn Met
1620 1625 1630
Phe Asp Ala Leu Met Asp Ala Glu Asp Asp
1635 1640
<210> 4
<211> 3542
<212> DNA
<213> 人工序列(artificial sequence)
<400> 4
agtcgaacaa gaagcaggca aagtttagag cactgcccct ccgcactcaa aaaagaaaaa 60
actaggagga aaataaaatt ctcaaccaca caaacacata aacacataca aatacaaata 120
caagcttatt tacttgacat cgcgcgatct tccactattc agcgccgtcc gccctctctc 180
gtgttttttg tttacgcgac aactatgcga aatccggagc aacgggcaac cgtttgggga 240
aagaccacac ccacgcgcga tcgccatggc aacgaggtcg cacacgcccc acacccagac 300
ctccctgcga gcgggcatgg gtacaatgtc cccgttgcca cagacaccac ttcgtagcac 360
agcgcagagc gtagcgtgtt gttgctgctg acaaaagaaa atttttctta gcaaagcaaa 420
ggaggggaag cacgggcaga tagcaccgta ccataccctt ggaaactcga aatgaacgaa 480
gcaggaaatg agagaatgag agttttgtag gtatatatag cggtagtgtt tgcgcgttac 540
catcatcttc tggatctatc tattgttctt ttcctcatca ctttcccctt tttcgctctt 600
cttcttgtct tttatttctt tctttttttt aattgttccc tcgattggct atctaccaaa 660
gaatccaaac ttaatacacg tatttatttg tccaattacc atgaacacga ttaacatcgc 720
taagaacgac ttctctgaca tcgaactggc tgctatcccg ttcaacactc tggctgacca 780
ttacggtgag cgtttagctc gcgaacagtt ggcccttgag catgagtctt acgagatggg 840
tgaagcacgc ttccgcaaga tgtttgagcg tcaacttaaa gctggtgagg ttgcggataa 900
cgctgccgcc aagcctctca tcactaccct actccctaag atgattgcac gcatcaacga 960
ctggtttgag gaagtgaaag ctaagcgcgg caagcgcccg acagccttcc agttcctgca 1020
agaaatcaag ccggaagccg tagcgtacat caccattaag accactctgg cttgcctaac 1080
cagtgctgac aatacaaccg ttcaggctgt agcaagcgca atcggtcggg ccattgagga 1140
cgaggctcgc ttcggtcgta tccgtgacct tgaagctaag cacttcaaga aaaacgttga 1200
ggaacaactc aacaagcgcg tagggcacgt ctacaagaaa gcatttatgc aagttgtcga 1260
ggctgacatg ctctctaagg gtctactcgg tggcgaggcg tggtcttcgt ggcataagga 1320
agactctatt catgtaggag tacgctgcat cgagatgctc attgagtcaa ccggaatggt 1380
tagcttacac cgccaaaatg ctggcgtagt aggtcaagac tctgagacta tcgaactcgc 1440
acctgaatac gctgaggcta tcgcaacccg tgcaggtgcg ctggctggca tctctccgat 1500
gttccaacct tgcgtagttc ctcctaagcc gtggactggc attactggtg gtggctattg 1560
ggctaacggt cgtcgtcctc tggcgctggt gcgtactcac agtaagaaag cactgatgcg 1620
ctacgaagac gtttacatgc ctgaggtgta caaagcgatt aacattgcgc aaaacaccgc 1680
atggaaaatc aacaagaaag tcctagcggt cgccaacgta atcaccaagt ggaagcattg 1740
tccggtcgag gacatccctg cgattgagcg tgaagaactc ccgatgaaac cggaagacat 1800
cgacatgaat cctgaggctc tcaccgcgtg gaaacgtgct gccgctgctg tgtaccgcaa 1860
ggacaaggct cgcaagtctc gccgtatcag ccttgagttc atgcttgagc aagccaataa 1920
gtttgctaac cataaggcca tctggttccc ttacaacatg gactggcgcg gtcgtgttta 1980
cgctgtgtca atgttcaacc cgcaaggtaa cgatatgacc aaaggactgc ttacgctggc 2040
gaaaggtaaa ccaatcggta aggaaggtta ctactggctg aaaatccacg gtgcaaactg 2100
tgcgggtgtc gataaggttc cgttccctga gcgcatcaag ttcattgagg aaaaccacga 2160
gaacatcatg gcttgcgcta agtctccact ggagaacact tggtgggctg agcaagattc 2220
tccgttctgc ttccttgcgt tctgctttga gtacgctggg gtacagcacc acggcctgag 2280
ctataactgc tcccttccgc tggcgtttga cgggtcttgc tctggcatcc agcacttctc 2340
cgcgatgctc cgagatgagg taggtggtcg cgcggttaac ttgcttccta gtgaaaccgt 2400
tcaggacatc tacgggattg ttgctaagaa agtcaacgag attctacaag cagacgcaat 2460
caatgggacc gataacgaag tagttaccgt gaccgatgag aacactggtg aaatctctga 2520
gaaagtcaag ctgggcacta aggcactggc tggtcaatgg ctggcttacg gtgttactcg 2580
cagtgtgact aagcgttcag tcatgacgct ggcttacggg tccaaagagt tcggcttccg 2640
tcaacaagtg ctggaagata ccattcagcc agctattgat tccggcaagg gtctgatgtt 2700
cactcagccg aatcaggctg ctggatacat ggctaagctg atttgggaat ctgtgagcgt 2760
gacggtggta gctgcggttg aagcaatgaa ctggcttaag tctgctgcta agctgctggc 2820
tgctgaggtc aaagataaga agactggaga gattcttcgc aagcgttgcg ctgtgcattg 2880
ggtaactcct gatggtttcc ctgtgtggca ggaatacaag aagcctattc agacgcgctt 2940
gaacctgatg ttcctcggtc agttccgctt acagcctacc attaacacca acaaagatag 3000
cgagattgat gcacacaaac aggagtctgg tatcgctcct aactttgtac acagccaaga 3060
cggtagccac cttcgtaaga ctgtagtgtg ggcacacgag aagtacggaa tcgaatcttt 3120
tgcactgatt cacgactcct tcggtaccat tccggctgac gctgcgaacc tgttcaaagc 3180
agtgcgcgaa actatggttg acacatatga gtcttgtgat gtactggctg atttctacga 3240
ccagttcgct gaccagttgc acgagtctca attggacaaa atgccagcac ttccggctaa 3300
aggtaacttg aacctccgtg acatcttaga gtcggacttc gcgttcgcgt aaatccgctc 3360
taaccgaaaa ggaaggagtt agacaacctg aagtctaggt ccctatttat ttttttatag 3420
ttatgttagt attaagaacg ttatttatat ttcaaatttt tctttttttt ctgtacagac 3480
gcgtgtacgc atgtaacatt atactgaaaa ccttgcttga gaaggttttg ggacgctcga 3540
ag 3542
<210> 5
<211> 4362
<212> DNA
<213> 乳酸克鲁维酵母(Kluyveromyces lactis)
<400> 5
atgggtattc caaaattctt tcatttcatc tctgagagat ggcctcaaat ttctcaattg 60
atcgatggat cacagattcc agagttcgac aatttgtact tggatatgaa ttctattttg 120
cataattgta cgcatggtga tggtagcgag gtgaattcaa gactatcaga ggaagaagtt 180
tattccaaaa ttttcagtta tattgatcat cttttccata ctattaaacc aaaacagaca 240
ttttatatgg caatcgatgg tgtggcccca agagcaaaga tgaaccaaca aagagctcgt 300
agattcagaa ctgccatgga tgccgaaaag gctttgcaga aggccattga aaatggtgac 360
gagttgccta agggagagcc atttgattcc aacgctatta ccccaggaac agaatttatg 420
gcaaaattaa ccgagaattt gaaatatttc atccatgaca agatcaccaa cgataccaga 480
tggcagaacg tgaaggttat tttctccggg catgaggttc ctggtgaagg tgaacataag 540
atcatggatt acatcagagc aattagagca caagaggatt acaatccaaa tacaagacat 600
tgtatctacg ggttagatgc tgatttgatc atcctaggtt tatccaccca tgatcaccac 660
ttttgtttat taagagaaga agttactttt ggtaaacgtt cgtcttctgt gaaaactcta 720
gaaacacaga acttcttctt gttgcatttg tctatcttga gagaatattt ggcattagag 780
ttcgaagaaa taacagattc tgtgcagttt gaatacgact ttgaaagagt attagatgat 840
ttcatctttg tattatttac catcggtaat gatttcttac caaatttgcc cgatttgcat 900
ttgaaaaaag gtgcattccc tgtgctatta caaactttta aagaagctct ccaacatatg 960
gatggttaca ttaatgaaca aggtaagata aatttggcaa gattttccat ttggttgaag 1020
tacttgtccg attttgaata ccttaacttt gagaagaaag atattgacgt tgaatggttc 1080
aatcaacaac ttgaaaatat ttccttggaa ggtgagcgta aacgtactag gatgggtaaa 1140
aagttgttga tgaaacaaca aaagaaattg attggcgccg taaaaccatg gttattgaaa 1200
accgttcaac ggaaggtcac ttctgaatta caggatgccg atttcgaaat tttccctctt 1260
gaggataaag aattggttcg ggccaacctg gatttcttga aggaattcgc atttgatttg 1320
ggtttaattc ttgctcattc taaatcaaaa gatttgtact acttcaagtt ggatttagac 1380
tccatcaatg tgcaagaaac agatgaagag catgaagccc gtattcacga aacaagacgt 1440
tctattaaga aatatgaaca aggtattatt attgcatctg aagaagaatt agaagaagag 1500
cgtgaaattt atagcgagag attcgttgag tggaaagatc aatactataa agataaatta 1560
gatttttcca tcaatgatac tgatagtcta aaagaaatga cagaaaacta tgtcggaggt 1620
ttacaatggg ttttatacta ctattatcgt ggatgtccat cttggtcctg gtattacaga 1680
tatcattacg ctcctcgtat atcagatgtg atcaaaggta tagatcagaa catagaattt 1740
cacaagggac agcctttcaa gcccttccaa caattgatgg ccgtcttgcc tgagagatca 1800
aagaatttga ttccagttgt gtacagacca ctcatgtatg atgaacactc tcctatcttg 1860
gacttctatc ctaacgaagt agagttggat ctaaatggca aaacagcaga ctgggaagct 1920
gtcgtcaaaa tttcattcgt ggatcaaaag cgtttagtag aagcaatggc tccttatgat 1980
gctaagcttt ctccggatga aaagaaaaga aattcgttcg gaactgatct gattttcata 2040
ttcaatcctc aggtagacac agtttacaaa acaccactag cggggttgtt taatgatatt 2100
gaacacaatc attgtatcga aagggaattc attccagaat cgatggaaaa cgttaagttc 2160
ttatttggtt tgccaaaggg cgctaaactc ggagctagct ctttggccgg tttcccatcc 2220
ctaaagacac taccactaac tgcagagctt gcttataatt cttctgttgt cttcaatttc 2280
ccttctaaac aacaatctat ggtgttgcat attcaggacc tttacaagga aaatggcatc 2340
tctctgtcag atctagcaaa aagacatatg ggtaagattg tttattcaag atggccgttt 2400
ctaagagaat ctaaactttt gtcgttgatt acagaggaaa ctgtgtatga aggagttaag 2460
tcaggcaaat taacaaaggt cattgaaaga aagcctcagg attttgaaag gaaagaattt 2520
agagagttga agatgactct caaatcgaat tatcaaagga caaaggccat tcttttggat 2580
gacatttctg ctttggctaa agtggttcca gtaaatggat tggtgagaaa ctctgatggt 2640
tcctattcta agtctttcaa tgaaactatc gaatactatc ctttacaatt aatcgtagag 2700
gacgtaaaaa ataaggacga aagatatatt gaaaaagagc cgttaccaat taataaagaa 2760
tttccaaaag gttcaaaagt tgtgttttta ggtgattatg cgtatggtgg ggaggcgacc 2820
gttgatggtt ataatagtga gactagatta aaacttacag tcaaaaaggg ttctctcaga 2880
gcagagccta acatcggaaa agttagagcg aaattggatt ctcaagcctt gagattctac 2940
ccaacacaag tgttttcaaa aatagctcgt gtccaccctc tcttcttgtc aaaaattact 3000
tcaagatatt tggtcaatga ttctaaaaag aaaagccata acgtcggttt gatgatcaaa 3060
ttcaaagcaa gaaatcaaaa agttctcggt tatgccagat gcagctcaaa caaatgggaa 3120
tactctgacg tcgctcttgg tttgttagag cagttcagat ctacattccc tgagttcttt 3180
gcgaaacttt ctaactcgaa ggaacaagca attccatcga tcactgatct cttccctaac 3240
aaatctagcg cggaagctga ttccattttg aaaacagtgg ctgattggct ctcagaagca 3300
agaaaaccat tcgtggtggt gtctttggaa agtgattcgc taaccaaggc ttcgatggca 3360
gctgttgaat ctgaaatcat aaaatacgtt tctttaccag attcaagcga gcagaagaaa 3420
ttagctaagg tcccacgtga ggcaatctta aatgcggaat cgtcatatgt tctattgcgc 3480
tcccaaaggt tccacttagg tgatagggta atgtacattc aagattcagg caaggttcca 3540
cttcacagca aaggtactgt cgttggctac acttcaattg gcaagaacgt ctcaatccaa 3600
gttctatttg acaatgaaat aattgcagga aacaactttg gtggtaggtt gcagaccaga 3660
cgtggtttgg gattggactc ttccttctta ttaaacttgt ctgatagaca attggtatat 3720
cattcaaagg catcgaagag tgctgataag aaaccaaaag cagttcctaa tgataagcaa 3780
gtcgccctcg caaaaaagaa gagagtggag gaactcaaaa aaaagcaagc ccatgagttg 3840
ttaaatcata tcaagaagga taacgcggaa tcaaataccg aatctggatc cgctccgcaa 3900
atagcagtta acactttaaa tccttcggct gctaacaacg tgttcaatgc cgtcttgaac 3960
caaatcaaac caggttctca acagcaaatt caaccacctc cagcaaattc tctgccttac 4020
aatttcactg ttcccccaca tatggttcct ggtggtattc ctcatcctct tatgatgcag 4080
ccgcctttca ttccgaataa tgagcatatt gcttatgcag ctcctcctca gtcacaacct 4140
gtacaaaatc caccattaga taaagaggca tccaggaatc ttaagaatct cctaattaga 4200
gatgagaatg gacgtacagc aaatgtggag aataaagact cagatgatac aaagagatct 4260
tctcattctc gtggcggtcg tcgtggccgt agtaatcgtg gtcgtggtgc ctccgggagg 4320
ggtggtcatt tcaaaaattc tcctaaaaaa actgaaacct ga 4362
<210> 6
<211> 513
<212> PRT
<213> 乳酸克鲁维酵母(Kluyveromyces lactis)
<400> 6
Met Gly Ile Pro Lys Phe Phe His Phe Ile Ser Glu Arg Trp Pro Gln
1 5 10 15
Ile Ser Gln Leu Ile Asp Gly Ser Gln Ile Pro Glu Phe Asp Asn Leu
20 25 30
Tyr Leu Asp Met Asn Ser Ile Leu His Asn Cys Thr His Gly Asp Gly
35 40 45
Ser Glu Val Asn Ser Arg Leu Ser Glu Glu Glu Val Tyr Ser Lys Ile
50 55 60
Phe Ser Tyr Ile Asp His Leu Phe His Thr Ile Lys Pro Lys Gln Thr
65 70 75 80
Phe Tyr Met Ala Ile Asp Gly Val Ala Pro Arg Ala Lys Met Asn Gln
85 90 95
Gln Arg Ala Arg Arg Phe Arg Thr Ala Met Asp Ala Glu Lys Ala Leu
100 105 110
Gln Lys Ala Ile Glu Asn Gly Asp Glu Leu Pro Lys Gly Glu Pro Phe
115 120 125
Asp Ser Asn Ala Ile Thr Pro Gly Thr Glu Phe Met Ala Lys Leu Thr
130 135 140
Glu Asn Leu Lys Tyr Phe Ile His Asp Lys Ile Thr Asn Asp Thr Arg
145 150 155 160
Trp Gln Asn Val Lys Val Ile Phe Ser Gly His Glu Val Pro Gly Glu
165 170 175
Gly Glu His Lys Ile Met Asp Tyr Ile Arg Ala Ile Arg Ala Gln Glu
180 185 190
Asp Tyr Asn Pro Asn Thr Arg His Cys Ile Tyr Gly Leu Asp Ala Asp
195 200 205
Leu Ile Ile Leu Gly Leu Ser Thr His Asp His His Phe Cys Leu Leu
210 215 220
Arg Glu Glu Val Thr Phe Gly Lys Arg Ser Ser Ser Val Lys Thr Leu
225 230 235 240
Glu Thr Gln Asn Phe Phe Leu Leu His Leu Ser Ile Leu Arg Glu Tyr
245 250 255
Leu Ala Leu Glu Phe Glu Glu Ile Thr Asp Ser Val Gln Phe Glu Tyr
260 265 270
Asp Phe Glu Arg Val Leu Asp Asp Phe Ile Phe Val Leu Phe Thr Ile
275 280 285
Gly Asn Asp Phe Leu Pro Asn Leu Pro Asp Leu His Leu Lys Lys Gly
290 295 300
Ala Phe Pro Val Leu Leu Gln Thr Phe Lys Glu Ala Leu Gln His Met
305 310 315 320
Asp Gly Tyr Ile Asn Glu Gln Gly Lys Ile Asn Leu Ala Arg Phe Ser
325 330 335
Ile Trp Leu Lys Tyr Leu Ser Asp Phe Glu Tyr Leu Asn Phe Glu Lys
340 345 350
Lys Asp Ile Asp Val Glu Trp Phe Asn Gln Gln Leu Glu Asn Ile Ser
355 360 365
Leu Glu Gly Glu Arg Lys Arg Thr Arg Met Gly Lys Lys Leu Leu Met
370 375 380
Lys Gln Gln Lys Lys Leu Ile Gly Ala Val Lys Pro Trp Leu Leu Lys
385 390 395 400
Thr Val Gln Arg Lys Val Thr Ser Glu Leu Gln Asp Ala Asp Phe Glu
405 410 415
Ile Phe Pro Leu Glu Asp Lys Glu Leu Val Arg Ala Asn Leu Asp Phe
420 425 430
Leu Lys Glu Phe Ala Phe Asp Leu Gly Leu Ile Leu Ala His Ser Lys
435 440 445
Ser Lys Asp Leu Tyr Tyr Phe Lys Leu Asp Leu Asp Ser Ile Asn Val
450 455 460
Gln Glu Thr Asp Glu Glu His Glu Ala Arg Ile His Glu Thr Arg Arg
465 470 475 480
Ser Ile Lys Lys Tyr Glu Gln Gly Ile Ile Ile Ala Ser Glu Glu Glu
485 490 495
Leu Glu Glu Glu Arg Glu Ile Tyr Ser Glu Arg Phe Val Glu Trp Lys
500 505 510
Asp
<210> 7
<211> 3066
<212> DNA
<213> 乳酸克鲁维酵母(Kluyveromyces lactis)
<400> 7
atgggcgaac ctacatccga tcagcaacca gctgttgaag ctccagttgt gcaggaggag 60
acaaccagtt ctccgcaaaa aaacagtgga tatgtcaaga atactgctgg aagcggtgct 120
cctagaaatg ggaaatatga tggtaacagg aagaactcta ggccttataa ccaaagaggt 180
aacaacaaca ataataatgg ttcttcctcg aataagcact atcaaaagta taaccaacca 240
gcgtacggtg tttctgcggg atacattccg aactacggcg tatcggcaga gtacaaccct 300
ctgtactata accagtacca acagcagcaa cagctgtacg ctgctgctta ccagactcca 360
atgagcggac aaggttatgt ccccccagta gtgtctccag ctgctgtttc agctaaacca 420
gcgaaggttg agattactaa caagtctggt gaacacatag atattgcttc cattgctcat 480
ccacatactc attctcattc tcaatctcat tcgcgtgcag ttccagtagt gtcgcctcca 540
gctaacgtta ccgtcgctgc tgctgtatca tcctctgtgt ctccatcagc ttctccagct 600
gtcaaagtac agagccctgc tgctaatggt aaggaacaat ctccagctaa gcctgaagaa 660
ccaaagaagg acactttaat tgtgaacgat ttcttggaac aagttaaaag acgcaaggct 720
gctttagctg ctaagaaggc tgtcgaagag aagggtcctg aggaaccgaa ggaatctgtc 780
gttggaactg acactgatgc aagcgttgat actaagacag ggcctacagc cactgaatct 840
gccaagtctg aagaagctca atcagaatca caagaaaaga ctaaggaaga ggctccagct 900
gagccaaaac cattgacttt ggccgaaaaa ttgagactta agaggatgga agctgcaaag 960
caagcttctg ctaagaccga ggaactaaag actgaagaat ctaagcctga agaaacaaag 1020
accgaggagc taaagactga agaatctaag cctgaagaaa caaagaccga ggagctaaag 1080
actgaagaaa caaagtccga ggaactaaag actgaagaac ctaaggcgga agaatcaaag 1140
gcggaagaac caaagcctga agaaccaaag accgaggaac cgacgactga acaaccaaag 1200
tcagatgaac caaagtcgga agaatcaaaa actgaagagc caaaaaccga ggtattaaag 1260
actgaagaac caaaatcgga agaatcaaag cctgcagaac caaagactga agaaacagca 1320
actgaagaaa cagcaactga agcaaacgcc gaagaaggtg aaccggctcc tgctggtccc 1380
gttgaaactc ctgctgatgt tgaaacaaaa cctcgagaag aggctgaagt tgaagacgat 1440
ggaaagatta ccatgaccga tttcctacag aagttgaaag aggtttctcc agttgatgat 1500
atttattcct tccaataccc aagtgacatt acgcctccaa atgatagata taaaaagaca 1560
agcattaaat atgcatacgg acctgatttc ttgtatcagt tcaaagaaaa ggtcgatgtt 1620
aaatacgatc cagcgtggat ggctgaaatg acgagtaaaa ttgtcatccc tcctaagaag 1680
cctggttcaa gcggaagagg cgaagataga tttagtaagg gtaaggttgg atctctaaga 1740
agtgaaggca gatcgggttc caggtccaac tcgaagaaga agtcaaagag ggatgataga 1800
aaatctaata gatcatacac ttccagaaag gaccgtgaaa gattcagaga ggaagaagtc 1860
gaagagccaa aggttgaggt tgccccattg gtcccaagtg ctaatagatg ggttcctaaa 1920
tctaagatga agaaaacaga agtcaagtta gctccagacg gaacagaact ttacgacgcg 1980
gaagaagcat caagaaagat gaagtcattg ctgaataaat tgacattaga aatgttcgaa 2040
cctatttctg atgatatcat gaagatcgct aaccaatcta gatgggaaga aaagggtgag 2100
actttgaaga ttgtcatcca acaaattttc aataaggcct gcgatgaacc tcattggtca 2160
tcaatgtacg cgcaattatg tggtaaggtc gttaaagact tagatgatag cattaaagac 2220
tcagaaaccc cagataagac tggttctcac ttggttttgc attacttagt ccaaagatgt 2280
caaactgaat tccaaacagg atggactgat caactaccta caaacgaaga cggtactcct 2340
ctacaacctg aaatgatgtc cgatgaatac tataagatgg ctgccgctaa gagaagaggt 2400
ttgggtttgg ttcgtttcat tggtttcttg taccgttcga acttattgac ttccagaatg 2460
gtcttcttct gtttcaagag actaatgaag gatattcaaa actctcctac tgaagatact 2520
ctagagtctg tatgtgaact tttggaaaca attggtgaac agttcgaagg tgctcgtatt 2580
caagttactg cagaagctgt cattgagggt tcaagcttgc tagacacact attcgaccaa 2640
ataaagaacg tgatcgaaaa tggtgacatc tccagcagaa tcaagtttaa gttgatcgac 2700
attgtcgaac taagagaaaa gaggaactgg aatagtaaaa ataagaacga tggtccaaag 2760
accattgctc aaattcacga agaagaagcc ttgaagaggg ctttggagga aagagaaaga 2820
gaaagagatc gccatgggtc cagaggtggt tccagacgta tgaatagcga gagaaactct 2880
tctagaagag atttctcctc tcattctcac agtcacaatc aaaatagaga cggtttcact 2940
actaccagat cgtcatcagt gagatattct gagccaaaga aggaagaaca agctccaact 3000
ccaactaaat cttctggtgg cgctgccaac atgtttgatg cattgatgga tgccgaagat 3060
gattaa 3066
<210> 8
<211> 1779
<212> DNA
<213> 乳酸克鲁维酵母(Kluyveromyces lactis)
<400> 8
atgtctgata ttactgaaaa aactgctgag caattggaaa acttgcagat caacgatgat 60
cagcaaccag ctcaatctgc cagtgctcca tccacttctg cttctgaaag cgaagcttct 120
tctgtttcta aggttgaaaa caacaacgct tcattgtacg ttggtgaatt ggatccaaac 180
attactgaag cattgttgta cgatgtgttt tcaccattgg gtccaatttc ctcgatccgt 240
gtttgtcgtg atgccgtcac caaggcttcg ttaggttacg cttacgttaa ctatactgat 300
tacgaagctg gtaagaaagc tattcaagaa ttgaactatg ctgaaatcaa cggtagacca 360
tgtagaatta tgtggtccga acgtgaccca gctatcagaa agaagggttc tggtaacatt 420
ttcatcaaga acttgcaccc agccattgac aacaaggctt tgcatgaaac tttctccact 480
ttcggtgaag tcttgtcttg taaagttgct ttagatgaga atggaaactc tagaggcttc 540
ggtttcgttc atttcaagga agaatccgat gctaaggatg ctattgaagc cgtcaacggt 600
atgttgatga acggtttgga agtttacgtt gccatgcacg ttccaaagaa ggaccgtatc 660
tccaagttgg aagaagccaa ggctaacttc accaacattt acgtcaagaa cattgacgtt 720
gaaaccactg acgaagagtt cgaacagttg ttctcccaat acggtgaaat tgtctctgct 780
gctttggaaa aggatgctga gggtaagcca aagggtttcg gtttcgttaa ctttgttgac 840
cacaacgccg ctgccaaggc cgttgaagag ttgaacggta aggaattcaa gtctcaagct 900
ttgtacgttg gcagagctca aaagaagtac gaacgtgctg aagaattgaa gaaacaatac 960
gaacaatacc gtttggaaaa attggctaag ttccaaggtg ttaacttgtt catcaagaac 1020
ttggacgatt ccatcgatga cgaaaaattg aaggaagaat tcgccccata cggtaccatc 1080
acctctgcta gagtcatgag agaccaagag ggtaactcta agggtttcgg tttcgtttgt 1140
ttctcttctc cagaagaagc taccaaggct atgaccgaaa agaaccaaca aattgttgcc 1200
ggtaagccat tgtacgttgc cattgctcaa agaaaggatg tcagaagatc ccaattggct 1260
caacaaattc aagccagaaa ccaaatcaga ttccaacaac agcaacaaca acaagctgct 1320
gccgctgctg ctggtatgcc aggccaatac atgccacaaa tgttctatgg tgttatggcc 1380
ccaagaggtt tcccaggtcc aaacccaggt atgaacggcc caatgggtgc cggtattcca 1440
aagaacggta tggtcccacc accacaacaa tttgctggta gaccaaacgg tccaatgtac 1500
caaggtatgc cacctcaaaa ccaattccca agacaccaac aacaacacta catccaacaa 1560
caaaagcaaa gacaagcctt gggtgaacaa ttgtacaaga aggtcagtgc caagattgac 1620
gacgaaaacg ccgctggtaa gatcaccggt atgatcttgg atctaccacc acagcaagtc 1680
atccaattgt tggacaacga cgaacaattt gaacagcaat tccaagaagc cttagctgct 1740
tacgaaaact tcaagaagga acaagaagct caagcttaa 1779
<210> 9
<211> 62
<212> DNA
<213> 人工序列(artificial sequence)
<400> 9
tgcttacgaa aacttcaaga gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cg 62
<210> 10
<211> 50
<212> DNA
<213> 人工序列(artificial sequence)
<400> 10
gctctaaaac tcttgaagtt ttcgtaagca aaagtcccat tcgccacccg 50
<210> 11
<211> 55
<212> DNA
<213> 人工序列(artificial sequence)
<400> 11
gagctcggta cccggggatc ctctagagat ccggtaagcc attgtacgtt gccat 55
<210> 12
<211> 55
<212> DNA
<213> 人工序列(artificial sequence)
<400> 12
gccaagcttg catgcctgca ggtcgacgat cagtataccg tccatgttga tgact 55
<210> 13
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 13
atcgtcgacc tgcaggcatg 20
<210> 14
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 14
atctctagag gatccccggg 20
<210> 15
<211> 63
<212> DNA
<213> 人工序列(artificial sequence)
<400> 15
gatgcattga tggatgccga agatgattaa acttgatttt ttgaccttga tcttcatctt 60
gtc 63
<210> 16
<211> 100
<212> DNA
<213> 人工序列(artificial sequence)
<400> 16
cttgaacttc atcttgagtt gaacctccac ctccagatcc acctccacca gcttgagctt 60
cttgttcttt tttaaaattc tcgtaagcag ctaaggcttc 100
<210> 17
<211> 93
<212> DNA
<213> 人工序列(artificial sequence)
<400> 17
gtggaggttc aactcaagat gaagttcaag gtccacatgc tggtaagtct actgttggtg 60
gaggtggatc tggcgaacct acatccgatc agc 93
<210> 18
<211> 27
<212> DNA
<213> 人工序列(artificial sequence)
<400> 18
ttaatcatct tcggcatcca tcaatgc 27
<210> 19
<211> 17
<212> DNA
<213> 人工序列(artificial sequence)
<400> 19
gtaaaacgac ggccagt 17
<210> 20
<211> 17
<212> DNA
<213> 人工序列(artificial sequence)
<400> 20
caggaaacag ctatgac 17
<210> 21
<211> 25
<212> DNA
<213> 人工序列(artificial sequence)
<400> 21
tctccagaag aagctaccaa ggcta 25
<210> 22
<211> 25
<212> DNA
<213> 人工序列(artificial sequence)
<400> 22
ttctcttcga cagccttctt agcag 25
<210> 23
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 23
agagttcgac aatttgtact 20
<210> 24
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 24
cgtcgtggcc gtagtaatcg 20
<210> 25
<211> 60
<212> DNA
<213> 人工序列(artificial sequence)
<400> 25
agagttcgac aatttgtact gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
<210> 26
<211> 50
<212> DNA
<213> 人工序列(artificial sequence)
<400> 26
gctctaaaac agtacaaatt gtcgaactct aaagtcccat tcgccacccg 50
<210> 27
<211> 60
<212> DNA
<213> 人工序列(artificial sequence)
<400> 27
cgtcgtggcc gtagtaatcg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
<210> 28
<211> 50
<212> DNA
<213> 人工序列(artificial sequence)
<400> 28
gctctaaaac cgattactac ggccacgacg aaagtcccat tcgccacccg 50
<210> 29
<211> 30
<212> DNA
<213> 人工序列(artificial sequence)
<400> 29
taggtctaga gatctgttta gcttgcctcg 30
<210> 30
<211> 27
<212> DNA
<213> 人工序列(artificial sequence)
<400> 30
tatccactag acagaagttt gcgttcc 27
<210> 31
<211> 80
<212> DNA
<213> 人工序列(artificial sequence)
<400> 31
tatggaacgc aaacttctgt ctagtggata gtatatgtgt tatgtagtat actctttctt 60
caacaattaa atactctcgg 80
<210> 32
<211> 57
<212> DNA
<213> 人工序列(artificial sequence)
<400> 32
cgaggcaagc taaacagatc tctagaccta tatccactag acagaagttt gcgttcc 57
<210> 33
<211> 28
<212> DNA
<213> 人工序列(artificial sequence)
<400> 33
atgaacacga ttaacatcgc taagaacg 28
<210> 34
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 34
ttacgcgaac gcgaagtccg 20
<210> 35
<211> 52
<212> DNA
<213> 人工序列(artificial sequence)
<400> 35
atcttagagt cggacttcgc gttcgcgtaa gaagatgctt ctgctcatca tc 52
<210> 36
<211> 56
<212> DNA
<213> 人工序列(artificial sequence)
<400> 36
agtcgttctt agcgatgtta atcgtgttca tggtaattgg acaaataaat acgtgt 56
<210> 37
<211> 43
<212> DNA
<213> 人工序列(artificial sequence)
<400> 37
gtacccgggg atcctctaga gatccagttg cagagcctcc gaa 43
<210> 38
<211> 45
<212> DNA
<213> 人工序列(artificial sequence)
<400> 38
catgcctgca ggtcgacgat gcgaaacctt agctctttat cgaac 45
<210> 39
<211> 104
<212> DNA
<213> 人工序列(artificial sequence)
<400> 39
atgttggttt gaatggacta ttaacagtaa atattatatc acttcgtgtt caattaatta 60
cggtttgtgg cttaactaaa aagtcgaaca agaagcaggc aaag 104
<210> 40
<211> 84
<212> DNA
<213> 人工序列(artificial sequence)
<400> 40
gaagtgatat aatatttact gttaatagtc cattcaaacc aacatttatt ttagttaagc 60
cacaaaccgt aattaattga acac 84
<210> 41
<211> 59
<212> DNA
<213> 人工序列(artificial sequence)
<400> 41
gtgttcaatt aattacggtt tgtggcttaa ctaaaaagtc gaacaagaag caggcaaag 59
<210> 42
<211> 67
<212> DNA
<213> 人工序列(artificial sequence)
<400> 42
gaagtgatat aatatttact gttaatagtc cattcaaacc aacatcttcg agcgtcccaa 60
aaccttc 67
<210> 43
<211> 45
<212> DNA
<213> 人工序列(artificial sequence)
<400> 43
atgttggttt gaatggacta ttaacagtaa atattatatc acttc 45
<210> 44
<211> 36
<212> DNA
<213> 人工序列(artificial sequence)
<400> 44
ttttagttaa gccacaaacc gtaattaatt gaacac 36
<210> 45
<211> 22
<212> DNA
<213> 人工序列(artificial sequence)
<400> 45
tttgctggtt gcccgtattc cc 22
<210> 46
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<400> 46
taatagcaca gggaatgcac ctt 23
Claims (13)
1.一种用于体外无细胞蛋白合成的基因工程菌株,其特征在于,所述基因工程菌株的基因组中整合有表达第一融合蛋白的第一核酸构建物的第一外源基因表达盒;所述第一融合蛋白具有式Ia或式Ib结构:
S-A-B-C (Ia)
S-C-B-A (Ib);
式中,
A为PabI元件;
B为无或连接肽;
C为eIF4G元件;
S为任选的信号肽,其中,各“-”为肽键;
并且,在所述基因工程菌株中,KlEXN53基因(核酸酶基因)的表达或活性被降低。
2.如权利要求1所述的基因工程菌株,其特征在于,所述基因工程菌株的基因组中还整合有表达第二核酸构建物的第二外源基因表达盒,所述第二核酸构建物具有从5’至3’的式II结构:
Z1-Z2 (II)
式中,
Z1、Z2分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为启动子元件,所述启动子元件选自下组:RNR2、PRP38、TEF1、PGK1、AGC1、IES1、MET8、PAK1、UBA3、VPS4、CDC2、UGA2、DUG3、VPS28、APL2、RAP1、TRM2、RPB3、PGA2、BAP2、ARA1、或其组合;
Z2为RNP蛋白的编码序列。
3.如权利要求1所述的基因工程菌株,其特征在于,所述“降低”是指将EXN53基因的表达或活性降低满足以下条件:
A1/A0的比值≤30%,较佳地≤10%,更佳地≤5%,更佳地,≤2%,最佳地为0-2%;
其中,A1为EXN53基因的表达或活性;A0为野生型EXN53基因的表达或活性。
4.如权利要求1所述的基因工程菌株,其特征在于,所述第一融合蛋白选自下组:
(A)具有SEQ ID NO:3所示氨基酸序列的多肽;
(B)具有与SEQ ID NO: 3所示氨基酸序列≥80%同源性(优选地,≥90%的同源性;等优选地≥95%的同源性;最优选地,≥97%的同源性,如98%以上,99%以上)的多肽,且所述多肽具有提高外源蛋白表达效率的功能或活性;
(C)将SEQ ID NO:3中任一所示氨基酸序列经过1-15(较佳地,2-10,更佳地,3-8)个氨基酸残基的取代、缺失或添加而形成的,且具有提高外源蛋白表达效率的功能或活性的衍生多肽。
5.如权利要求2所述的基因工程菌株,其特征在于,所述启动子元件选自下组:ScRNR2、ScADH1、ScGAPDH、ScTEF1、ScPGK1、ScSED1、KlRNR2、KlADH1、KlGAPDH、KlTEF1、KlPGK1、KlSED1、KlIES1、KlMET8、KlPAK1、KlSOK1、KlUBA3、KlVPS4、KlAGC1、KlCDC2、KlDUG3、KlPRP38、KlUGA2、KlVPS28、ScAPL2、ScARA1、ScBAP2、ScPGA2、ScRAP1、ScRPB3、ScTRM2、或其组合。
6.如权利要求2所述的基因工程菌株,其特征在于,所述RNP蛋白选自下组:T7RNAP蛋白、T3RNAP、T4RNAP、T5RNAP、SP6 RNAP、SP3、或其组合。
7.如权利要求2所述的基因工程菌株,其特征在于,所述第二核酸构建物的序列如SEQID NO.:4所示。
8.如权利要求1所述的基因工程菌株,其特征在于,所述EXN53基因来源于选自下组的一种或多种来源的酵母:毕氏酵母、克鲁维酵母,较佳地,来源于克鲁维酵母。
9.一种权利要求1所述的基因工程菌株的用途,其特征在于,用于提高体外蛋白合成效率。
10.一种无细胞的细胞提取物,其特征在于,所述细胞提取物来源于权利要求1所述的基因工程菌株。
11.一种体外的无细胞的蛋白合成体系,其特征在于,所述无细胞的蛋白合成体系包括权利要求10所述的细胞提取物。
12.一种体外合成蛋白的方法,其特征在于,包括步骤:
(i) 提供权利要求11所述的体外的无细胞的蛋白合成体系,并加入外源的用于指导蛋白质合成的DNA分子;
(ii) 在适合的条件下,孵育步骤(i)的蛋白合成体系一段时间T1,从而合成由所述外源DNA编码的蛋白质。
13.如权利要求12所述的方法,其特征在于,所述的方法还包括:(iii) 任选地从所述蛋白合成体系中,分离或检测所述的由外源DNA编码的蛋白质。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010673244.1A CN111778169B (zh) | 2018-01-31 | 2018-01-31 | 一种提高体外蛋白合成效率的方法 |
CN201810093624.0A CN110093284B (zh) | 2018-01-31 | 2018-01-31 | 一种在细胞中提高蛋白合成效率的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810093624.0A CN110093284B (zh) | 2018-01-31 | 2018-01-31 | 一种在细胞中提高蛋白合成效率的方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010673244.1A Division CN111778169B (zh) | 2018-01-31 | 2018-01-31 | 一种提高体外蛋白合成效率的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110093284A true CN110093284A (zh) | 2019-08-06 |
CN110093284B CN110093284B (zh) | 2020-08-18 |
Family
ID=67441924
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810093624.0A Active CN110093284B (zh) | 2018-01-31 | 2018-01-31 | 一种在细胞中提高蛋白合成效率的方法 |
CN202010673244.1A Active CN111778169B (zh) | 2018-01-31 | 2018-01-31 | 一种提高体外蛋白合成效率的方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010673244.1A Active CN111778169B (zh) | 2018-01-31 | 2018-01-31 | 一种提高体外蛋白合成效率的方法 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN110093284B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111778169A (zh) * | 2018-01-31 | 2020-10-16 | 康码(上海)生物科技有限公司 | 一种提高体外蛋白合成效率的方法 |
WO2020239111A1 (zh) | 2019-05-30 | 2020-12-03 | 康码(上海)生物科技有限公司 | 体外定量共表达多种蛋白的方法及其应用 |
WO2020253834A1 (zh) | 2019-06-21 | 2020-12-24 | 康码(上海)生物科技有限公司 | 生物磁性微球及其制备方法和使用方法 |
WO2021104435A1 (zh) | 2019-11-30 | 2021-06-03 | 康码(上海)生物科技有限公司 | 一种生物磁性微球及其制备方法和应用 |
CN115109792A (zh) * | 2022-06-22 | 2022-09-27 | 清华大学 | 一种基于大肠杆菌的无细胞反应体系及其应用 |
WO2023126009A1 (zh) | 2021-12-31 | 2023-07-06 | 康码(上海)生物科技有限公司 | 聚合分子、包括其的单一结构和多聚结构 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103060334A (zh) * | 2013-01-28 | 2013-04-24 | 西南大学 | 家蚕PABP结合蛋白互作因子基因BmPaip1及其重组表达载体和应用 |
CN106701607A (zh) * | 2017-01-11 | 2017-05-24 | 浙江科技学院 | 在酵母菌中实现高准确率定点基因敲除的方法 |
CN106978349A (zh) * | 2016-09-30 | 2017-07-25 | 康码(上海)生物科技有限公司 | 一种体外蛋白质合成的试剂盒及其制备方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU766146B2 (en) * | 1998-05-26 | 2003-10-09 | University Of Medicine And Dentistry Of New Jersey | System for reproducing and modulating stability and turnover of RNA molecules |
US20110004955A1 (en) * | 2008-01-30 | 2011-01-06 | Monsanto Technology Llc | Transgenic plants with enhanced agronomic traits |
CN102459613A (zh) * | 2009-04-29 | 2012-05-16 | 巴斯夫植物科学有限公司 | 具有增强的产量相关性状的植物及其制备方法 |
WO2012019630A1 (en) * | 2010-08-13 | 2012-02-16 | Curevac Gmbh | Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded protein |
CN108949801B (zh) * | 2017-11-24 | 2019-06-14 | 康码(上海)生物科技有限公司 | 一种通过对核酸酶系统敲除以调控体外生物合成活性的方法 |
CN110093284B (zh) * | 2018-01-31 | 2020-08-18 | 康码(上海)生物科技有限公司 | 一种在细胞中提高蛋白合成效率的方法 |
CN110845622B (zh) * | 2018-08-21 | 2021-10-26 | 康码(上海)生物科技有限公司 | 不同结构域缺失融合蛋白的制备及其在提高蛋白质合成的应用 |
-
2018
- 2018-01-31 CN CN201810093624.0A patent/CN110093284B/zh active Active
- 2018-01-31 CN CN202010673244.1A patent/CN111778169B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103060334A (zh) * | 2013-01-28 | 2013-04-24 | 西南大学 | 家蚕PABP结合蛋白互作因子基因BmPaip1及其重组表达载体和应用 |
CN106978349A (zh) * | 2016-09-30 | 2017-07-25 | 康码(上海)生物科技有限公司 | 一种体外蛋白质合成的试剂盒及其制备方法 |
CN106701607A (zh) * | 2017-01-11 | 2017-05-24 | 浙江科技学院 | 在酵母菌中实现高准确率定点基因敲除的方法 |
Non-Patent Citations (6)
Title |
---|
CRAIG AW等: "Interaction of polyadenylate-binding protein with the eIF4G homologue PAIP enhances translation", 《NATURE》 * |
DUJON,B.等: "GenBank:XP_456080.1", 《GENBANK》 * |
DUJON,B等: "GenBank:XP_451207.1", 《GENBANK》 * |
DUJON,B等: "GenBank:XP_452986.1", 《GENBANK》 * |
虞结梅等: "T7 RNA聚合酶的克隆及其介导基因转录功能的鉴定", 《安徽医科大学学报》 * |
马英伟等: "无细胞蛋白合成系统的发展及应用", 《中国卫生检验杂志》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111778169A (zh) * | 2018-01-31 | 2020-10-16 | 康码(上海)生物科技有限公司 | 一种提高体外蛋白合成效率的方法 |
WO2020239111A1 (zh) | 2019-05-30 | 2020-12-03 | 康码(上海)生物科技有限公司 | 体外定量共表达多种蛋白的方法及其应用 |
WO2020253834A1 (zh) | 2019-06-21 | 2020-12-24 | 康码(上海)生物科技有限公司 | 生物磁性微球及其制备方法和使用方法 |
WO2021104435A1 (zh) | 2019-11-30 | 2021-06-03 | 康码(上海)生物科技有限公司 | 一种生物磁性微球及其制备方法和应用 |
WO2023126009A1 (zh) | 2021-12-31 | 2023-07-06 | 康码(上海)生物科技有限公司 | 聚合分子、包括其的单一结构和多聚结构 |
CN115109792A (zh) * | 2022-06-22 | 2022-09-27 | 清华大学 | 一种基于大肠杆菌的无细胞反应体系及其应用 |
WO2023246507A1 (zh) * | 2022-06-22 | 2023-12-28 | 清华大学 | 一种基于大肠杆菌的无细胞反应体系及其应用 |
CN115109792B (zh) * | 2022-06-22 | 2024-10-29 | 清华大学 | 一种基于大肠杆菌的无细胞反应体系及其应用 |
Also Published As
Publication number | Publication date |
---|---|
CN111778169B (zh) | 2023-02-10 |
CN110093284B (zh) | 2020-08-18 |
CN111778169A (zh) | 2020-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110093284A (zh) | 一种在细胞中提高蛋白合成效率的方法 | |
KR102384271B1 (ko) | 신규 융합 단백질의 제조 및 이의 단백질 합성 향상에서의 응용 | |
JP2022025068A (ja) | メチロトローフ酵母の遺伝子操作の発現構築物および方法 | |
CN108949801B (zh) | 一种通过对核酸酶系统敲除以调控体外生物合成活性的方法 | |
CN108642076B (zh) | 一种体外DNA-to-Protein(D2P)的合成体系、制剂、试剂盒及制备方法 | |
US12116699B2 (en) | Materials and methods for protein production | |
CN110845622B (zh) | 不同结构域缺失融合蛋白的制备及其在提高蛋白质合成的应用 | |
CN110408636B (zh) | 多重标签串联的dna序列及其在蛋白质表达纯化系统的应用 | |
WO2018161374A1 (zh) | 一种用于体外蛋白质合成的蛋白合成体系、试剂盒及其制备方法 | |
CN110408635B (zh) | 一种含有链霉亲和素元件的核酸构建物在蛋白质表达、纯化中的应用 | |
WO2019041635A1 (zh) | 一种细胞中内源性表达rna聚合酶的核酸构建物 | |
CN108239648B (zh) | 高效表达米黑根毛霉脂肪酶的方法 | |
Hunt et al. | Sorting pathway and molecular targeting signals for the Arabidopsis peroxin 3 | |
CN110551745A (zh) | 一种多重组氨酸序列标签及其在蛋白质表达、纯化中的应用 | |
JP2000136199A (ja) | シゾサッカロミセス・ポンベで使用可能なシグナルペプチド、分泌型発現ベクター、およびそれらを用いたタンパク質生産方法 | |
CN112342248A (zh) | 一种基因敲除改变体外蛋白合成能力的方法及其应用 | |
CN111718419B (zh) | 含有rna结合蛋白的融合蛋白及其配合使用的表达载体 | |
JP2013158342A (ja) | 翻訳促進配列およびそれを用いた無細胞タンパク質合成方法 | |
US20060121560A1 (en) | DNA fragment to promote translation reaction and method for cell-free protein synthesis system using the same | |
WO2024051855A1 (zh) | 一种核酸构建物以及在ivtt体系中的应用 | |
EP0926246A2 (en) | Methods of screening for modulators of respiratory syncytial virus matrix protein interaction | |
AT526405A1 (de) | Synthetischer Formolaseweg | |
JP4442535B2 (ja) | 翻訳反応促進dna断片を含む発現ベクター及びそれを用いたタンパク質合成方法 | |
BABA¹ et al. | TAKUYA UEDA¹, AKIO INOUE¹, MIDORI KAIDA¹ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: Building No. 12, 118 Lane, Furong Hualu, Pudong New Area, Shanghai, 201321 Applicant after: Kang code (Shanghai) Biological Technology Co., Ltd. Address before: 3rd Floor, No. 8 Building, 500 Lane, Furong Hualu, Pudong New Area, Shanghai, 201321 Applicant before: Kang code (Shanghai) Biological Technology Co., Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |