CN110511950A - Pab蛋白在构建具有类伴侣样蛋白作用的融合蛋白表达载体中的应用 - Google Patents
Pab蛋白在构建具有类伴侣样蛋白作用的融合蛋白表达载体中的应用 Download PDFInfo
- Publication number
- CN110511950A CN110511950A CN201910698981.4A CN201910698981A CN110511950A CN 110511950 A CN110511950 A CN 110511950A CN 201910698981 A CN201910698981 A CN 201910698981A CN 110511950 A CN110511950 A CN 110511950A
- Authority
- CN
- China
- Prior art keywords
- albumen
- expression vector
- fusion protein
- pab1
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/305—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Micrococcaceae (F)
- C07K14/31—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Micrococcaceae (F) from Staphylococcus (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/35—Fusion polypeptide containing a fusion for enhanced stability/folding during expression, e.g. fusions with chaperones or thioredoxin
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明公开一种PAB蛋白在构建具有类伴侣样蛋白作用的融合蛋白表达载体中的应用,利用PAB蛋白成功构建获得具有类伴侣样蛋白作用的融合蛋白表达载体。本发明通过构建含类伴侣样蛋白的pET‑PAB1表达载体、测试目标蛋白融合蛋白表达载体以及测试含目标蛋白的pET对照载体,经过不同重组体中目标蛋白诱导表达的对比测试,发现PA的B结构域具有提高目标蛋白可溶性表达效率的伴侣样蛋白新功能,从而为蛋白质表达科学研究和工业化生产提供了一项有用的工具。
Description
技术领域
本发明涉及基因工程和蛋白质工程技术领域,特别涉及蛋白质融合表达技术领域,具体涉及一种PAB蛋白在构建具有类伴侣样蛋白作用的融合蛋白表达载体中的应用。
背景技术
蛋白质折叠问题被列为“21世纪的生物物理学”的重要课题,它是分子生物学中心法则尚未解决的一个重大生物学问题。而蛋白质表达(生产)工程中,获得天然结构蛋白,是蛋白质可溶性表达的先决条件,也是保证目标蛋白生理功能的基础,更是蛋白质工业化生产过程节省成本的环节。
天然蛋白质的功能取决于蛋白质的生理构象。分子生物化学科学认为,蛋白质分子的三维结构完全取决于蛋白质分子的氨基酸序列。但近30年来的大量研究资料表明,很多生物体蛋白质的折叠与装配有其它蛋白或酶的参与,尤其是高等生物的组成蛋白的天然结构的形成,其中蛋白质分子伴侣就是最重要的、也是研究得最多的一类蛋白。分子伴侣是一类进化上非常保守的蛋白质,能与结构、大小、定位和最终功能都不相同的蛋白的多肽链非特异性结合,催化介导蛋白质特定构象的形成,参与体内蛋白质的折叠、装配与转运。新合成的多肽链必须先经折叠和装配后形成特定的三维结构才具有活性。在多肽链折叠过程中,往往会产生折叠异常蛋白,或因未折叠或不全折叠,导致蛋白质分子中疏水区相互吸引,形成集聚体,在基因工程蛋白质表达领域,称为包涵体(Inclusion)。包涵体是不溶性的、没有功能的“死蛋白”。在具有伴侣样作用的蛋白质分子存在下,可有效地调控其它多肽链的正确折叠,从而避免包涵体的形成。
蛋白质分子伴侣的概念是由Dr.Laskey等人在1978年首先提出的。他们在研究非洲爪蟾核小体形成时,发现了一种酸性核蛋白(Nucleoplasmin)。实验表明它在DNA与组蛋白装配成核小体的过程中是必需的。在生理离子强度下,体外把DNA与组蛋白混合在一起,不能自我组装,形成沉淀。但如果把组蛋白与过量Nucleoplasmin蛋白混合,再加入DNA,则可形成核小体结构,而且最终形成的核小体中不包含Nucleoplasmin分子。现在认为Nucleoplasmin的作用可能是避免带负电的DNA与带正电的组蛋白之间强静电吸引而形成非特异结合的不溶聚合物。
1987年,Dr.Ikemura发现枯草杆菌素(Subtilisin)的折叠需要前肽(Propeptide)的帮助。这类前肽常位于信号肽与成熟多肽之间,在蛋白质合成过程中与其介导的蛋白质多肽链是一前一后合成出来的,并以共价键相连接,是成熟多肽正确折叠所必需的,成熟多肽完成折叠后即通过水解作用与前肽脱离。Shinde和Inouye将这类前肽称为分子内伴侣(Intramolecular Chaperones)。
1993年,E11is对分子伴侣做了更为确切的定义:即分子伴侣是一类相互之间有关系的蛋白,能够结合和稳定另外一种蛋白质的不稳定构象,它们的功能是帮助其他含多肽结构的物质在体内进行正确的非共价的组装,有控制的结合和释放,促进新生多肽的折叠、多聚体的装配或降解及细胞器蛋白的跨膜运输等,并且不是组装完成的蛋白质在发挥其正常的生物功能时的组成部分。
蛋白质分子伴侣的分类:目前已知帮助新生肽折叠的蛋白(也称辅助蛋白)和蛋白体组装的蛋白质分子伴侣至少有三大类:
第一类,普遍意义的分子伴侣,帮助正确折叠,阻止和修正不正确折叠。
第二类,具有酶活力的分子伴侣,又称折叠酶。至今有2个折叠酶:一是蛋白质二硫键异构酶(Proteindisulfideisomerase,PDI)。二是肽基脯氨酰顺反异构(Peptidylprodylcis rans-isomerase,PPI)。
第三类,分子内分子伴侣,一些研究表明,许多含前导肽(Pro肽)的前体形式合成的蛋白质折叠与成熟必须要有前导肽的存在才能完成,并不完全遵守Anfinsen规则。这类前导肽称为分子内分子伴侣(Intramolecular Chaperone,IMC)。
如上所述,蛋白质伴侣是一组从细菌到人广泛存在的蛋白质,非共价地与新生肽链和解折叠的蛋白质肽链结合,并帮助它们折叠和转运,通常不参与靶蛋白的生理功能和亚基构成。
总之,以上分类研究的蛋白质分子伴侣有两个共同特点:1)天然性,自己存在;2)同源性,即伴侣和被伴侣蛋白在同一生物体内编码和表达。
然而,随着基因工程与蛋白质表达组学的研究,人们似乎忽略了另一类蛋白伴侣的存在,这类蛋白伴侣或伴侣样蛋白被人工重组到基因表达载体中,形成蛋白质表达工具。对于这类尚未归类的伴侣样蛋白,此处姑且称为“类蛋白伴侣”或“蛋白伴侣样蛋白”,这类伴侣蛋白的空间位置类似“分子内伴侣”,其用在载体中的特点如下:
1)人工重组在基因表达载体中,有些已经商业化销售近40年,如Pharmacia公司的pGEX系列载体和其包含的GST蛋白,NEB公司的的pMAL系列载体和其用麦芽糖结合蛋白(Maltose Binding Protein,MBP)。实践证明,BST和MBP均有不同程度增加融合蛋白可溶性表达和表达量的作用,而研发厂家的初衷是用做便于分离纯化的“标签”蛋白。
2)天然或非天然蛋白序列,即未经突变修饰或突变修饰的氨基酸序列。严格意义上来说,均属于非天然蛋白质序列,因为或是取其部分序列,如细菌的HSP片段GroE,GST的C端添加的蛋白酶切识别位点,以及所有融合蛋白表达载体的人工添加的多克隆区(MCS)序列或“柔性接头”区(Flexible Linker),这些相当于末端插入突变。
3)同源或异源性,在类伴侣样蛋白表达载体系统中,同源性和异源性概念包含两个方面,一是表达载体携带的类伴侣样蛋白对表达宿主的同源性和异源性,如大肠杆菌来源的GST和MBP对于表达宿主大肠杆菌而言是同源性的蛋白;而大肠杆菌表达载体上的酵母或人类来源的SUMO(小泛素样修饰蛋白)或FABP6(人类游离脂肪酸结合蛋白-6)类伴侣样蛋白对于表达宿主大肠杆菌来说,就是异源性的蛋白。在融合蛋白表达载体中,融合蛋白本身上下游的两个蛋白在绝大部分情况下都是异源性的,毕竟这些载体大多数用来表达人类蛋白,因为很大一部分真核细胞蛋白在原核细胞中表达成包涵体,需要借助上游类伴侣样蛋白辅助增加可溶性表达量和辅助分自折叠。
4)融合表达或非融合表达。自然情况下存在一类分子蛋白质内部构成伴侣,在成熟肽时已经切除或保留。有些蛋白质在自体或异体表达时,呈现自折叠高可溶性,如DNA聚合酶,FABP。有些蛋白质体外变性后具有极强的自复性能力,如RNase A,Taq酶等,这些蛋白分子内部可能存在构成行蛋白伴侣。人工构建的类伴侣样蛋白融合蛋白表达载体就类似于分子内伴侣,可诱导下游蛋白提高正确折叠效率。有些商业化表达载体采用双表达框(TwoOperons),其中一个表达框表达某种非特异性蛋白伴侣,另一个表达框表达目标蛋白(如Takara-大连宝生物的伴侣蛋白系列商用载体)。
5)高度自折叠性和对宿主无毒。高度自折叠性形成高可溶性蛋白表达,对宿主无毒使得中、高或超高表达可能。
由于这类类伴侣样蛋白表达载体不仅具有重要的科研价值(方便不同蛋白测试可溶性表达和功能研究),同时具有重要的工业价值(用于蛋白质发酵生产)。但是,现有类伴侣样蛋白表达载体非常有限,而且对不同目标蛋白的辅助折叠作用存在一定的、机制不明的差异,因此有必要进一步增加类伴侣样蛋白表达载体的可选性。
发明内容
本发明的主要目的是提出一种PAB蛋白在构建具有类伴侣样蛋白作用的融合蛋白表达载体中的应用,旨在提供一种具有类伴侣蛋白作用的融合蛋白表达载体。
为实现上述目的,本发明提出如SEQ ID NO:1~5中任一所示的蛋白A的B结构域片段或合并序列在构建具有类伴侣样蛋白作用的融合蛋白表达载体中的应用。
可选地,将如SEQ ID NO:6,7所示的经优化后的所述PAB1蛋白编码序列插入融合蛋白表达载体中作为表达框上游的类伴侣样蛋白。
本发明还提出一种融合蛋白表达载体,所述融合蛋白表达载体的克隆区上游包含编码如上所述的经优化后的PAB1蛋白的核酸序列,所述融合蛋白表达载体的DNA序列如SEQID NO:26所示。
可选地,选用用于改造的商业化空载体为原始亲本载体,所述原始亲本载体包括pET系统表达载体、酵母系统表达载体、昆虫细胞系统表达载体和哺乳动物细胞系统表达载体中的任意一种。
可选地,所述PAB1蛋白的序列上游添加有如SEQ ID NO:8,9所示的转录起始适配序列;和/或,
所述经优化后的PAB1蛋白的序列上游添加有商用分离标签蛋白;和/或,
所述经优化后的PAB1蛋白的序列下游包含一段柔性接头区、蛋白酶酶切位点识别区和用于插入下游目标蛋白的多克隆区。
可选地,所述商用分离标签蛋白包括5’-HisTag和5’-Strept II-Tag中的任意一种;和/或,
所述蛋白酶酶切位点识别区包括凝血因子Xa蛋白酶酶切位点识别区、凝血酶酶切位点识别区、肠激酶酶切位点识别区、烟草蚀纹病毒蛋白酶酶切位点识别区和羟胺切割位点中的任意一种。
可选地,所述柔性接头区的序列如SEQ ID NO:10,11所示,所述蛋白酶酶切位点识别区的序列如SEQ ID NO:12,13所示,所述用于插入下游目标蛋白的多克隆区的序列如SEQID NO:14,15所示。
可选地,所述经优化后的PAB1蛋白的同源性与天然PAB1蛋白的同源性不低于85%。
本发明还提出如上所述的融合蛋白表达载体作为新的亲本表达载体在表达目标蛋白中的应用。
更进一步地,本发明还提出一种表达包含类伴侣样蛋白的融合蛋白的方法,包括以下步骤:
将目标蛋白编码序列插入如上所述的融合蛋白表达载体中PAB1下游的多克隆区,得到含目标蛋白编码序列的融合蛋白重组表达载体;
将所述融合蛋白重组表达载体转染宿主细胞,培养宿主细胞表达融合蛋白。
本发明提供的技术方案中,利用新发现的蛋白A的B结构域(Protein A B-domain1 to 5,PAB1~5)的类伴侣样蛋白作用,构建得到的融合蛋白表达载体能够促进或诱导被融合的下游目标蛋白的折叠,具有类似伴侣蛋白的特性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅为本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明提供的融合蛋白表达载体的一实施例中PABx表达框示意图;
图2为实施例1中制得的pET28-PAB1表达载体物理图;
图3为实施例2中制得的pET28-PAB1-hTFF1融合蛋白表达载体物理图;
图4为实施例2中制得的pET28-hTFF1表达载体物理图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将对本发明实施例中的技术方案进行清楚、完整地描述。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市售购买获得的常规产品。
类伴侣样蛋白表达载体不仅具有重要的科研价值(方便不同蛋白测试可溶性表达和功能研究),同时具有重要的工业价值(用于蛋白质发酵生产)。但是,现有类伴侣样蛋白表达载体十分有限,而且对不同目标蛋白的辅助折叠作用存在一定的、机制不明的差异,已因此,在实际应用时,如果类伴侣样蛋白融合表达载体库愈大,其选择性就愈大,对蛋白学科学研究和蛋白质大工艺生产的表达效率提高、促进节能和降低成本也愈显著。
为了增加类伴侣样蛋白表达载体的可选性,本发明提出一种如SEQ ID NO:1~5中任一所示的蛋白A的B结构域片段或合并序列在构建具有类伴侣样蛋白作用的融合蛋白表达载体中的应用。
蛋白A(Protein A)是从金黄色葡萄球菌(Staphylococcus aureus)细胞壁表面分离得到的细菌蛋白,分子全长419氨基酸残基,其能与很多哺乳动物的免疫球蛋白(抗体)重链的Fc段结合,甚至能与人类抗体VH3家族的Fab结合。SPA不含任何分子内二硫键或由二硫键维系的亚基,理论pI/Mw:9.05/46716.32。本发明所要保护的是在实践中新发现的金黄色葡萄球菌蛋白A的B结构域(Staphylococcus aureus Protein A B-domain 1 to 5,简称SPA-B1~B5,或PA-B1~B5,在本文以下内容中均简写为PAB1~B5)具有一种类伴侣样蛋白活性,属于蛋白A的一种新特性,此前并未有人提出蛋白A的B结构域具有此特性,本发明以此构建成包含类伴侣样蛋白的融合蛋白表达载体,具有科研和商业化载体价值,用于在原核生物(如大肠杆菌等)中表达不易折叠的高等生物蛋白质分子。为便于描述,本文中将如SEQ ID NO:1~5所示的蛋白A的B结构域片段分别对应命名为PAB1、PAB2、PAB3、PAB4和PAB5,在本发明提供的应用中,可以是将上述五个片段中的任意一段序列应用到构建具有类伴侣样蛋白作用的融合蛋白表达载体中,也可以是将上述五个片段中的其中两种或两种以上的合并序列应用到构建具有类伴侣样蛋白作用的融合蛋白表达载体中。
本发明提供的技术方案中,利用蛋白A的B结构域B1~B5的类伴侣样蛋白作用,构建得到的融合蛋白表达载体能够促进或诱导被融合的下游目标蛋白的折叠,具有类似伴侣蛋白的特性,具有科研和商业化载体价值,可应用于在原核生物(如大肠杆菌等)中表达不易折叠的高等生物蛋白质分子。
进一步地,所述蛋白A的B1~B5的任一结构域,是作为所述融合蛋白表达载体的固定元件,在其下游可插入目标蛋白作为融合表达载体的变动元件,与上游的固定元件形成同框融合,两者之间无终止密码。在本发明提供一优选应用实施例中,以选用PAB1作为所述融合蛋白表达载体的固定元件为例,对所述PAB1进行优化后插入到融合蛋白表达载体中,得到具有类似伴侣蛋白特性的融合蛋白表达载体,具体为将如SEQ ID NO:6,7所示的经优化后的PAB1蛋白编码序列插入融合蛋白表达载体中作为表达框上游的类伴侣样蛋白,其中,SEQ ID NO:6所示为优化后的PAB1的氨基酸序列,SEQ ID NO:7所示为优化后的PAB1的DNA序列。
本发明还提出一种融合蛋白表达载体,包括如上所述的经优化后的PAB1序列。在本发明提供的融合蛋白表达载体的一实施例中,将经过序列优化后的PAB1接入到大肠杆菌表达载体中,得到包含类伴侣样蛋白的大肠杆菌表达载体(作为目标蛋白表达载体的重组亲本载体),具体为所述融合蛋白表达载体的克隆区上游包含编码如上所述的经优化后的PAB1蛋白(序列如SEQ ID NO:6,7所示)的核酸序列,所述融合蛋白表达载体的DNA序列如SEQ ID NO:26所示。可以理解的是,所述经优化后的PAB1序列并不限于此序列,以与PAB1蛋白质氨基酸序列同源性等于或大于85%为限。
对于上述包含类伴侣样蛋白的大肠杆菌表达载体而言,其选用用于改造的商业化空载体为原始亲本载体,而所述原始亲本载体又可以选用pET系统表达载体、酵母系统表达载体、昆虫细胞系统表达载体和哺乳动物细胞系统表达载体中的任意一种,优选为pET系统表达载体,更优选为pET28(本文下述实施例中以所述原始亲本载体选用pET28为例进行说明),获得的融合蛋白表达载体命名为pET28-PAB1,该载体为携带有类伴侣样蛋白的“融合蛋白表达载体”,其对插入在下游的目标蛋白具有类伴侣样蛋白的作用,但也可以看做是一种“空载体(empty vector)”,其对用于目标蛋白重组表达载体而言,又被视作亲本载体,可以商业化作为表达载体出售(即为商业化“空载体”),用以构建融合蛋白。而该载体在用作载体用于表达目标蛋白时,在其下游插入目标蛋白编码序列后,即可对应获得插入有融合蛋白的融合蛋白表达载体。
较佳地,在本实施例中,所述经优化后的PAB1蛋白的序列上游添加有如SEQ IDNO:8,9所示的转录起始适配序列,其中,SEQ ID NO:8所示为所述转录起始适配序列的氨基酸序列,SEQ ID NO:9所示为所述转录起始适配序列的DNA序列。
进一步地,在本实施例中,所述经优化后的PAB1蛋白的序列上游还可以选择性的添加有商用分离标签蛋白,用于标记蛋白质。具体地,所述商用分离标签蛋白可选用例如5’-HisTag和5’-Strept II-Tag等任意一种商用分离标签蛋白。
更进一步地,在本实施例中,所述经优化后的PAB1蛋白的序列下游包含一段柔性接头区、蛋白酶酶切位点识别区和用于插入下游目标蛋白的多克隆区,所构成的PAB1表达框示意图如图1所示,在图1中:RBS表示核糖体结合位点或mRNA转录起始区;PABx表示蛋白A的B结构域(B1~B5),x表示其中任意一个B结构域或多个B结构域的组合,在本实施例中为PAB1;FL表示柔性接头(Flexible Linker,FL);PRS表示蛋白酶识别位点(ProteinaseRecognition Site,PRS);MCS表示多克隆插入位点区(Multiple Cloning Site,MCS);6xHis表示6个组氨酸并联的镍柱分离标签(6x Histidine Tag)。
所述蛋白酶酶切位点识别区包括凝血因子Xa(简称FXa)蛋白酶酶切位点识别区、凝血酶酶切位点识别区、肠激酶酶切位点识别区、烟草蚀纹病毒蛋白酶酶切位点识别区和羟胺切割位点中的任意一种,从而使得在需要对所述融合蛋白表达载体进行蛋白酶酶切去除类伴侣样蛋白时,选用凝血因子蛋白酶、凝血酶、肠激酶或烟草蚀纹病毒蛋白酶或者是羟胺切割位点中的任意一种均可。
以下以本实施例中的所述蛋白酶酶切位点识别区为凝血因子Xa为例进行说明,对应地,所述柔性接头区的序列如SEQ ID NO:10,11所示(SEQ ID NO:10所示为所述柔性接头区的氨基酸序列,SEQ ID NO:11所示为所述柔性接头区的DNA序列),所述蛋白酶酶切位点识别区的序列如SEQ ID NO:12,13所示(SEQ ID NO:12所示为所述蛋白酶酶切位点识别区的氨基酸序列,SEQ ID NO:13所示为所述蛋白酶酶切位点识别区的DNA序列),所述用于插入下游目标蛋白的多克隆区的序列为DNA限制性内切酶识别序列,如SEQ ID NO:14,15所示(SEQ ID NO:14所示为多克隆区DNA编码的氨基酸序列,SEQ ID NO:15所示为所述用于插入下游目标蛋白的多克隆区的DNA序列)。
可选地,所述经优化后的PAB1蛋白的同源性与天然PAB1蛋白的同源性不低于85%,从而有利于扩大利用PAB1构建的融合蛋白表达载体的应用范围,避免因蛋白质存在同源性差异而导致应用范围受限的问题。
本发明还提出如上所述的包含类伴侣样蛋白PAB1的融合蛋白表达载体作为新的亲本表达载体在表达目标蛋白中的应用,所述融合蛋白表达载体在用于表达目标蛋白时,具有可溶性表达效率提高的优点,为蛋白质表达科学研究和工业化生产提供了一项有用的工具。
本发明还进一步提出一种表达包含类伴侣样蛋白的融合蛋白的方法,使用如上所述的融合蛋白表达载体进行。在本发明提供的表达包含类伴侣样蛋白的融合蛋白的方法的一实施例中,所述表达包含类伴侣样蛋白的融合蛋白的方法包括以下步骤:
将目标蛋白编码序列插入如上所述的包含类伴侣样蛋白PAB1的融合蛋白表达载体中PAB1下游的多克隆区(也即所述经优化后的PAB1的下游设置的用于插入下游目标蛋白的多克隆区,其序列如SEQ ID NO:14,15所示),得到含目标蛋白编码序列的融合蛋白重组表达载体;
将所述融合蛋白重组表达载体转染宿主细胞,培养宿主细胞表达融合蛋白。
使所述融合蛋白重组表达载体转染宿主细胞以及培养宿主细胞表达融合蛋白的具体操作方法可参照现有技术进行,在此不做赘述。
以下结合具体实施例和附图对本发明的技术方案作进一步详细说明,应当理解,以下实施例仅仅用以解释本发明,并不用于限定本发明。
实施例1包含类伴侣样蛋白的大肠杆菌表达载体的构建
步骤一、PAB插入子的基因合成与载体制备:
选用如SEQ ID:1所示的PAB1为例,进行PAB1编码DNA的密码子优化、转录起始区的添加突变和DNA序列优化、柔性接头的选择和密码子优化、凝血因子Xa(FXa)识别序列氨基酸密码子优化,具体步骤如下:
(1)取PAB1氨基酸序列逆向翻译成DNA编码序列,经过密码子优先性选择本身编码序列(SEQ ID NO:6,7)。
(2)选择高表达翻译起始区肽段序列(MASTYKLILNGKTS)、优化其编码序列并插入到PAB1编码DNA的5’-端(SEQ ID NO:6~9)。
(3)选择PAB1编码区与PBS编码区之间的柔性接头(KEKTPEEPKQL),并插入到紧接PAB1编码DNA的3’-端(SEQ ID NO:6,7,10,11)。
(4)将FXa的PRS序列(IEGR)密码子优化,并顺向插入到柔性接头(FL)的下游(SEQID NO:6,7,12,13)。
(5)设定MCS所需的DNA限制性内切酶种类,并串联其识别区DNA序列(依次为5’-EcoRI-KpnI-BamHI-PstI-SpeI-XhoI-3’),插入到PRS的3’-端(SEQ ID NO:6,7,14,15)。
(6)借助MCS的XhoI连接到pET28载体上,可获得载体携带的6xHis寡聚组氨酸标签和终止密码(SEQ ID NO:6,7,16,17)。
(7)将以上拼接序列(除6xHis组氨酸标签和终止密码子TGA以外),用NCBI的DNAWorks在线软件设计基因合成引物10条(SEQ ID NO:18~27),并在起始引物5’-端添加[5’-CC-3’]与PAB1编码框5’-端的[5’-ATGG-3’]形成NcoI[CCATGG]限制性内切酶切点(SEQID NO:18);在NcoI酶切点的5’-端和末端引物的XhoI酶切位点5’-端分别添加[5’-TTTT-3’]作为酶切位点保护碱基(SEQ ID NO:18,25)。
(8)PAB1插入子(Insert)全基因合成步骤:
①将引物以去离子水配成5μM浓度,各取1μL加入200μL PCR管,用TakaraPyrobest PCR Kit,做成50μL反应体积。
②引物延伸多聚酶链式反应(Overlap PCR)条件:预变性95℃/3min;变性94℃/20sec,复性56℃/20sec,延伸72℃/30sec;16个循环,补全延伸72℃/1min,降至4℃取出。
③全长多聚酶链式反应(Full-length PCR):从第②步PCR产物中取1μL作模板,置入一个新的PCR管,取上游引物4μL,下游最末端引物4μL(SEQ ID NO:18,27),以TakaraPyrobest PCR Kit,做成50μL反应体积。PCR条件:预变性95℃/3min;变性94℃/30sec,复性58℃/30sec,延伸72℃/1min;25个循环,补全延伸72℃/2min,降至4℃待取出。
④电泳鉴定合成的DNA片段,硅胶柱纯化PCR片段,NcoI/XhoI双酶切处理PCR片段DNA过夜,同时用NcoI/XhoI双酶切处理pET28空载体过夜。琼脂糖凝胶电泳结合硅胶柱纯化线性化的pET28载体和插入片段双酶切产物。
步骤二、重组连接、转化、克隆分析:
(1)以pET28作为重组改造的亲本载体,将步骤一合成、酶切、纯化获得的PAB1插入子和酶切后纯化的pET28载体,以T4DNA连接酶连接,4℃过夜反应。
(2)转化大肠杆菌DH5α感受态细胞,含卡那霉素(Kan)抗生素的培养皿培养过夜,然后挑取单菌落,PCR法鉴定阳性重组子克隆,常规制备DNA质粒。
(3)将阳性重组子质粒送DNA序列分析,选取和保留正确序列的克隆供表达测试。
(4)正确重组子表达载体质粒命名为pET28-PAB1(序列如SEQ ID NO:26所示,物理图如图2所示)。
步骤三、含类伴侣样蛋白PAB1表达载体pET28-PAB1的表达测试:
(1)将步骤二得到的pET28-PAB1载体DNA质粒转化大肠杆菌BL21(DE3)感受态细胞,获得Kan抗性的菌落。
(2)挑取单菌落数个,LB培养基培养,0.5mM IPTG、25℃/200RPM诱导过夜,收集菌液1mL,离心收集菌体,1×PBS洗涤一次,再悬浮于0.5mL1×PBS,超声破碎菌体,离心取上清,保留沉淀物下一步处理。
(3)取20μL上清液与上样缓冲液混合,95℃加热变性10min,离心收集取上清,至于冰上,等待作为可溶性蛋白上样。将步骤(2)离心沉淀物以250μL、8M尿素溶解悬浮,取10μL与上样缓冲液混合,同法加热,离心取上清,至于冰上,等待作为包涵体蛋白上样。
(4)各取10μL上样15%聚丙烯酰胺-SDS变性胶电泳,考马斯亮蓝染色、脱色,观察蛋白质条带和PAB1蛋白的表达情况。
(5)重组PAB1,包括FL、FXa PRS、MCS、C-6xHisTag,共103aa,其理论pI/Mw:6.13/11544.69。PAB1占菌体总蛋白约15%,可溶性表达。
实施例2 pET28-PAB1融合蛋白表达载体测试系统构建
步骤一、以pET28-PAB1作为亲本载体,以hTFF1为测试目标蛋白,构建pET28-PAB1-hTFF1融合蛋白表达载体和表达菌株:
1、人工合成编码hTFF1成熟肽(SEQ ID NO:27,40)的DNA序列,DNA密码子经过DNAWorks软件优化(SEQ ID NO:28,41),全基因合成引物6条(SEQ ID NO:29~34,PCR全基因合成引物中引入了重组所需额DNA限制性内切酶位点:EcoR I(5’-端引物,SEQ ID NO:29)和Xho I(3’-端引物,SEQ ID NO:34),便于双酶切重组插入。
2、hTFF1PCR全基因合成方法同实施例1(见步骤一,第(8)节)。
3、hTFF1基因合成的PCR产物和pET28-PAB1载体分别用EcoRI/XhoI双酶切处理,0.8%琼脂糖凝胶电泳分离,切胶后硅胶柱纯化。
4、T4DNA连接酶连接pET28-PAB1线性化载体DNA与hTFF1插入片段DNA,形成重组pET28-PAB1-hTFF1融合蛋白表达载体,融合蛋白中含重组PAB1、柔性接头、FXa PRS和hTFF1C-端组氨酸标签,如SEQ ID NO:35,36所示。
4、正确克隆命名为pET28-PAB1-hTFF1(序列如SEQ ID NO:37所示,物理图如图3所示),5671bps。
5、连接产物转化感受态菌DH5α细胞,挑取克隆扩增、制备质粒、DNA测序分析,保留正确pET28-PAB1-hTFF1重组体质粒。
6、将pET28-PAB1-hTFF1质粒转化大肠杆菌BL21(DE3)感受态细胞,挑取单菌落PCR鉴定,所用PCR引物为PAB1的上游引物(SEQ ID NO:18)和hTFF1的下游引物(SEQ ID NO:34)。
7、保留阳性克隆菌落,再次送质粒DNA序列分析以确定表达菌株含目标质粒pET28-PAB1-hTFF1,保留正确的pET28-PAB1-hTFF1/BL21(DE3)克隆,供测试表达分析。
步骤二、对照克隆pET28-hTFF1表达载体的构建和表达菌株建立:
1、人工设计并商业合成hTFF1成熟肽的PCR引物(SEQ ID NO:38,39)。
2、在新合成的hTFF1成熟肽编码区中,以PCR引物引入NcoI(5’-端)和XhoI(3’-端)限制性内切酶酶切识别位点、起始密码子ATP和酶切点保护碱基;上游引物序列:5’-TTTTCCATGGAAGAATACGTTGGTCTGTCTG-3’(SEQ ID NO:38),下游引物序列:5'-TTTTCTCGAGGAAGGTGCATTCCGCTTCCTG-3’(SEQ ID NO:39)。
3、以pET28-PAB1-hTFF1质粒DNA为模板,常规PCR方法扩增hTFF1,经分子量电泳鉴定、PCR产物纯化后备用。
4、以NcoI/XhoI双酶切分别处理表达载体pET28和上一步得到的hTFF1 PCR产物,37℃,酶切过夜。然后分别胶回收纯化pET28线性化载体和hTFF1的双酶切产物(插入片段)。
5、T4DNA连接酶连接pET28DNA片段与hTFF1插入片段。
6、直接转化大肠杆菌BL21(DE3)感受态细胞,挑取单菌落PCR鉴定,所用PCR引物为pET28的通用测序引物T7-Promoter和T7-Terminator。
7、保留含有比pET28空载体PCR片段更大条带的阳性克隆,送DNA序列分析,保留正确序列的克隆和菌株pET28-hTFF1/BL21(DE3),供测试表达分析。
8、正确重组载体命名为pET28-hTFF1(序列如SEQ ID NO:44所示,物理图如图4所示),表达的目标蛋白hTFF1氨基酸和核苷酸序列分别如SEQ ID NO:40,41所示。
步骤三、测试表达对照分析
1、分别扩增pET28-PAB1-hTFF1/BL21(DE3)和pET28-hTFF1/BL21(DE3)菌株,37℃恒温摇床,200RPM震荡至OD(600nm)=0.8,然后,IPTG加至0.5mM,25℃/200RPM诱导过夜;
2、分别收集菌体1mL,1×PBS洗涤一次,再加1×PBS 500μL,超声波破碎细胞,然后分别离心保留上清,各自沉淀部分分别加8M尿素250μL悬浮溶解,再加250μL 1×PBS,分别取上清和沉淀溶解物50μL加等量2×Loading Buffer,95℃变性10分钟,上样,20%聚丙烯酰胺-SDS凝胶电泳;
3、考马斯亮蓝染色、脱色后观察电泳结果。
结果发现,pEET28-PAB1-hTFF1/BL21(DE3)融合蛋白表达菌株的上清中可溶性表达约占60%,而pET28-hTFF1/BL21(DE3)非融合蛋白表达菌株表达的hTFF1蛋白全部为包涵体状态存在,说明该包含类蛋白伴侣样蛋白的大肠杆菌表达系统的上游蛋白PAB1具有诱导促进被融合蛋白hTFF1的分子折叠作用。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本发明的专利保护范围内。
SEQUENCE LISTING
<110> 因之彩生物科技(武汉)有限公司
<120> PAB蛋白在构建具有类伴侣样蛋白作用的融合蛋白表达载体中的应用
<130> 20190614
<160> 42
<170> PatentIn version 3.5
<210> 1
<211> 56
<212> PRT
<213> 人工合成
<400> 1
Ala Gln His Asp Glu Ala Gln Gln Asn Ala Phe Tyr Gln Val Leu Asn
1 5 10 15
Met Pro Asn Leu Asn Ala Asp Gln Arg Asn Gly Phe Ile Gln Ser Leu
20 25 30
Lys Asp Asp Pro Ser Gln Ser Ala Asn Val Leu Gly Glu Ala Gln Lys
35 40 45
Leu Asn Asp Ser Gln Ala Pro Lys
50 55
<210> 2
<211> 61
<212> PRT
<213> 人工合成
<400> 2
Ala Asp Ala Gln Gln Asn Asn Phe Asn Lys Asp Gln Gln Ser Ala Phe
1 5 10 15
Tyr Glu Ile Leu Asn Met Pro Asn Leu Asn Glu Ala Gln Arg Asn Gly
20 25 30
Phe Ile Gln Ser Leu Lys Asp Asp Pro Ser Gln Ser Thr Asn Val Leu
35 40 45
Gly Glu Ala Lys Lys Leu Asn Glu Ser Gln Ala Pro Lys
50 55 60
<210> 3
<211> 58
<212> PRT
<213> 人工合成
<400> 3
Ala Asp Asn Asn Phe Asn Lys Glu Gln Gln Asn Ala Phe Tyr Glu Ile
1 5 10 15
Leu Asn Met Pro Asn Leu Asn Glu Glu Gln Arg Asn Gly Phe Ile Gln
20 25 30
Ser Leu Lys Asp Asp Pro Ser Gln Ser Ala Asn Leu Leu Ser Glu Ala
35 40 45
Lys Lys Leu Asn Glu Ser Gln Ala Pro Lys
50 55
<210> 4
<211> 58
<212> PRT
<213> 人工合成
<400> 4
Ala Asp Asn Lys Phe Asn Lys Glu Gln Gln Asn Ala Phe Tyr Glu Ile
1 5 10 15
Leu His Leu Pro Asn Leu Asn Glu Glu Gln Arg Asn Gly Phe Ile Gln
20 25 30
Ser Leu Lys Asp Asp Pro Ser Gln Ser Ala Asn Leu Leu Ala Glu Ala
35 40 45
Lys Lys Leu Asn Asp Ala Gln Ala Pro Lys
50 55
<210> 5
<211> 58
<212> PRT
<213> 人工合成
<400> 5
Ala Asp Asn Lys Phe Asn Lys Glu Gln Gln Asn Ala Phe Tyr Glu Ile
1 5 10 15
Leu His Leu Pro Asn Leu Thr Glu Glu Gln Arg Asn Gly Phe Ile Gln
20 25 30
Ser Leu Lys Asp Asp Pro Ser Val Ser Lys Glu Ile Leu Ala Glu Ala
35 40 45
Lys Lys Leu Asn Asp Ala Gln Ala Pro Lys
50 55
<210> 6
<211> 103
<212> PRT
<213> 人工合成
<400> 6
Met Ala Ser Thr Tyr Lys Leu Ile Leu Asn Gly Lys Thr Ser Ala Gln
1 5 10 15
His Asp Glu Ala Gln Gln Asn Ala Phe Tyr Gln Val Leu Asn Met Pro
20 25 30
Asn Leu Asn Ala Asp Gln Arg Asn Gly Phe Ile Gln Ser Leu Lys Asp
35 40 45
Asp Pro Ser Gln Ser Ala Asn Val Leu Gly Glu Ala Gln Lys Leu Asn
50 55 60
Asp Ser Gln Ala Pro Lys Lys Glu Lys Thr Pro Glu Glu Pro Lys Gln
65 70 75 80
Leu Ile Glu Gly Arg Glu Phe Gly Thr Gly Ser Leu Gln Thr Ser Leu
85 90 95
Glu His His His His His His
100
<210> 7
<211> 312
<212> DNA
<213> 人工合成
<400> 7
atggctagca cctacaaact gatcctgaac ggtaaaacta gcgcgcagca cgacgaagcg 60
caacagaatg cgttctacca ggtactgaac atgccgaacc tgaacgcgga ccagcgtaac 120
ggtttcatcc agtctctgaa agacgacccg tctcagtctg cgaatgttct gggtgaagca 180
cagaaactga acgactctca ggcgccgaaa aaagaaaaaa ccccggaaga accgaaacaa 240
ttgatcgaag gtcgtgaatt cggtaccgga tccctgcaga ctagtctcga gcaccaccac 300
caccaccact ga 312
<210> 8
<211> 14
<212> PRT
<213> 人工合成
<400> 8
Met Ala Ser Thr Tyr Lys Leu Ile Leu Asn Gly Lys Thr Ser
1 5 10
<210> 9
<211> 42
<212> DNA
<213> 人工合成
<400> 9
atggctagca cctacaaact gatcctgaac ggtaaaacta gc 42
<210> 10
<211> 11
<212> PRT
<213> 人工合成
<400> 10
Lys Glu Lys Thr Pro Glu Glu Pro Lys Gln Leu
1 5 10
<210> 11
<211> 33
<212> DNA
<213> 人工合成
<400> 11
aaagaaaaaa ccccggaaga accgaaacaa ttg 33
<210> 12
<211> 4
<212> PRT
<213> 人工合成
<400> 12
Ile Glu Gly Arg
1
<210> 13
<211> 12
<212> DNA
<213> 人工合成
<400> 13
atcgaaggtc gt 12
<210> 14
<211> 12
<212> PRT
<213> 人工合成
<400> 14
Glu Phe Gly Thr Gly Ser Leu Gln Thr Ser Leu Glu
1 5 10
<210> 15
<211> 36
<212> DNA
<213> 人工合成
<400> 15
gaattcggta ccggatccct gcagactagt ctcgag 36
<210> 16
<211> 6
<212> PRT
<213> 人工合成
<400> 16
His His His His His His
1 5
<210> 17
<211> 21
<212> DNA
<213> 人工合成
<400> 17
caccaccacc accaccactg a 21
<210> 18
<211> 24
<212> DNA
<213> 人工合成
<400> 18
ttttccatgg ctagcaccta caaa 24
<210> 19
<211> 60
<212> DNA
<213> 人工合成
<400> 19
cttcgtcgtg ctgcgcgcta gttttaccgt tcaggatcag tttgtaggtg ctagccatgg 60
<210> 20
<211> 60
<212> DNA
<213> 人工合成
<400> 20
gcgcagcacg acgaagcgca acagaatgcg ttctaccagg tactgaacat gccgaacctg 60
<210> 21
<211> 60
<212> DNA
<213> 人工合成
<400> 21
tctttcagag actggatgaa accgttacgc tggtccgcgt tcaggttcgg catgttcagt 60
<210> 22
<211> 60
<212> DNA
<213> 人工合成
<400> 22
ggtttcatcc agtctctgaa agacgacccg tctcagtctg cgaatgttct gggtgaagca 60
<210> 23
<211> 60
<212> DNA
<213> 人工合成
<400> 23
ttttttcttt tttcggcgcc tgagagtcgt tcagtttctg tgcttcaccc agaacattcg 60
<210> 24
<211> 60
<212> DNA
<213> 人工合成
<400> 24
aggcgccgaa aaaagaaaaa accccggaag aaccgaaaca attgatcgaa ggtcgtgaat 60
<210> 25
<211> 58
<212> DNA
<213> 人工合成
<400> 25
ttttctcgag actagtctgc agggatccgg taccgaattc acgaccttcg atcaattg 58
<210> 26
<211> 5518
<212> DNA
<213> 人工合成
<400> 26
cccccggcca cggggcctgc caccataccc acgccgaaac aagcgctcat gagcccgaag 60
tggcgagccc gatcttcccc atcggtgatg tcggcgatat aggcgccagc aaccgcacct 120
gtggcgccgg tgatgccggc cacgatgcgt ccggcgtaga ggatcgagat ctcgatcccg 180
cgaaattaat acgactcact ataggggaat tgtgagcgga taacaattcc cctctagaaa 240
taattttgtt taactttaag aaggagatat accatggcta gcacctacaa actgatcctg 300
aacggtaaaa ctagcgcgca gcacgacgaa gcgcaacaga atgcgttcta ccaggtactg 360
aacatgccga acctgaacgc ggaccagcgt aacggtttca tccagtctct gaaagacgac 420
ccgtctcagt ctgcgaatgt tctgggtgaa gcacagaaac tgaacgactc tcaggcgccg 480
aaaaaagaaa aaaccccgga agaaccgaaa caattgatcg aaggtcgtga attcggtacc 540
ggatccctgc agactagtct cgagcaccac caccaccacc actgagatcc ggctgctaac 600
aaagcccgaa aggaagctga gttggctgct gccaccgctg agcaataact agcataaccc 660
cttggggcct ctaaacgggt cttgaggggt tttttgctga aaggaggaac tatatccgga 720
ttggcgaatg ggacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc 780
gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt 840
cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag 900
ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt 960
cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt 1020
tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt 1080
cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt 1140
aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt tacaatttca ggtggcactt 1200
ttcggggaaa tgtgcgcgga acccctattt gtttattttt ctaaatacat tcaaatatgt 1260
atccgctcat gaattaattc ttagaaaaac tcatcgagca tcaaatgaaa ctgcaattta 1320
ttcatatcag gattatcaat accatatttt tgaaaaagcc gtttctgtaa tgaaggagaa 1380
aactcaccga ggcagttcca taggatggca agatcctggt atcggtctgc gattccgact 1440
cgtccaacat caatacaacc tattaatttc ccctcgtcaa aaataaggtt atcaagtgag 1500
aaatcaccat gagtgacgac tgaatccggt gagaatggca aaagtttatg catttctttc 1560
cagacttgtt caacaggcca gccattacgc tcgtcatcaa aatcactcgc atcaaccaaa 1620
ccgttattca ttcgtgattg cgcctgagcg agacgaaata cgcgatcgct gttaaaagga 1680
caattacaaa caggaatcga atgcaaccgg cgcaggaaca ctgccagcgc atcaacaata 1740
ttttcacctg aatcaggata ttcttctaat acctggaatg ctgttttccc ggggatcgca 1800
gtggtgagta accatgcatc atcaggagta cggataaaat gcttgatggt cggaagaggc 1860
ataaattccg tcagccagtt tagtctgacc atctcatctg taacatcatt ggcaacgcta 1920
cctttgccat gtttcagaaa caactctggc gcatcgggct tcccatacaa tcgatagatt 1980
gtcgcacctg attgcccgac attatcgcga gcccatttat acccatataa atcagcatcc 2040
atgttggaat ttaatcgcgg cctagagcaa gacgtttccc gttgaatatg gctcataaca 2100
ccccttgtat tactgtttat gtaagcagac agttttattg ttcatgacca aaatccctta 2160
acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg 2220
agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc 2280
ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag 2340
cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa 2400
gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc 2460
cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc 2520
gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta 2580
caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag 2640
aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct 2700
tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga 2760
gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc 2820
ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt 2880
atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg 2940
cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc gcctgatgcg 3000
gtattttctc cttacgcatc tgtgcggtat ttcacaccgc atatatggtg cactctcagt 3060
acaatctgct ctgatgccgc atagttaagc cagtatacac tccgctatcg ctacgtgact 3120
gggtcatggc tgcgccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc 3180
tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga 3240
ggttttcacc gtcatcaccg aaacgcgcga ggcagctgcg gtaaagctca tcagcgtggt 3300
cgtgaagcga ttcacagatg tctgcctgtt catccgcgtc cagctcgttg agtttctcca 3360
gaagcgttaa tgtctggctt ctgataaagc gggccatgtt aagggcggtt ttttcctgtt 3420
tggtcactga tgcctccgtg taagggggat ttctgttcat gggggtaatg ataccgatga 3480
aacgagagag gatgctcacg atacgggtta ctgatgatga acatgcccgg ttactggaac 3540
gttgtgaggg taaacaactg gcggtatgga tgcggcggga ccagagaaaa atcactcagg 3600
gtcaatgcca gcgcttcgtt aatacagatg taggtgttcc acagggtagc cagcagcatc 3660
ctgcgatgca gatccggaac ataatggtgc agggcgctga cttccgcgtt tccagacttt 3720
acgaaacacg gaaaccgaag accattcatg ttgttgctca ggtcgcagac gttttgcagc 3780
agcagtcgct tcacgttcgc tcgcgtatcg gtgattcatt ctgctaacca gtaaggcaac 3840
cccgccagcc tagccgggtc ctcaacgaca ggagcacgat catgcgcacc cgtggggccg 3900
ccatgccggc gataatggcc tgcttctcgc cgaaacgttt ggtggcggga ccagtgacga 3960
aggcttgagc gagggcgtgc aagattccga ataccgcaag cgacaggccg atcatcgtcg 4020
cgctccagcg aaagcggtcc tcgccgaaaa tgacccagag cgctgccggc acctgtccta 4080
cgagttgcat gataaagaag acagtcataa gtgcggcgac gatagtcatg ccccgcgccc 4140
accggaagga gctgactggg ttgaaggctc tcaagggcat cggtcgagat cccggtgcct 4200
aatgagtgag ctaacttaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4260
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4320
ttgggcgcca gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 4380
accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 4440
aaatcctgtt tgatggtggt taacggcggg atataacatg agctgtcttc ggtatcgtcg 4500
tatcccacta ccgagatatc cgcaccaacg cgcagcccgg actcggtaat ggcgcgcatt 4560
gcgcccagcg ccatctgatc gttggcaacc agcatcgcag tgggaacgat gccctcattc 4620
agcatttgca tggtttgttg aaaaccggac atggcactcc agtcgccttc ccgttccgct 4680
atcggctgaa tttgattgcg agtgagatat ttatgccagc cagccagacg cagacgcgcc 4740
gagacagaac ttaatgggcc cgctaacagc gcgatttgct ggtgacccaa tgcgaccaga 4800
tgctccacgc ccagtcgcgt accgtcttca tgggagaaaa taatactgtt gatgggtgtc 4860
tggtcagaga catcaagaaa taacgccgga acattagtgc aggcagcttc cacagcaatg 4920
gcatcctggt catccagcgg atagttaatg atcagcccac tgacgcgttg cgcgagaaga 4980
ttgtgcaccg ccgctttaca ggcttcgacg ccgcttcgtt ctaccatcga caccaccacg 5040
ctggcaccca gttgatcggc gcgagattta atcgccgcga caatttgcga cggcgcgtgc 5100
agggccagac tggaggtggc aacgccaatc agcaacgact gtttgcccgc cagttgttgt 5160
gccacgcggt tgggaatgta attcagctcc gccatcgccg cttccacttt ttcccgcgtt 5220
ttcgcagaaa cgtggctggc ctggttcacc acgcgggaaa cggtctgata agagacaccg 5280
gcatactctg cgacatcgta taacgttact ggtttcacat tcaccaccct gaattgactc 5340
tcttccgggc gctatcatgc cataccgcga aaggttttgc gccattcgat ggtgtccggg 5400
atctcgacgc tctcccttat gcgactcctg cattaggaag cagcccagta gtaggttgag 5460
gccgttgagc accgccgccg caaggaatgg tgcatgcaag gagatggcgc ccaacagt 5518
<210> 27
<211> 59
<212> PRT
<213> 人工合成
<400> 27
Glu Glu Tyr Val Gly Leu Ser Ala Asn Gln Cys Ala Val Pro Ala Lys
1 5 10 15
Asp Arg Val Asp Cys Gly Tyr Pro His Val Thr Pro Lys Glu Cys Asn
20 25 30
Asn Arg Gly Cys Cys Phe Asp Ser Arg Ile Pro Gly Val Pro Trp Cys
35 40 45
Phe Lys Pro Leu Gln Glu Ala Glu Cys Thr Phe
50 55
<210> 28
<211> 177
<212> DNA
<213> 人工合成
<400> 28
gaagaatacg ttggtctgtc tgcgaaccag tgcgcggttc cggcgaaaga ccgtgttgac 60
tgcggttacc cgcacgttac cccgaaagaa tgcaacaacc gtggttgctg cttcgactct 120
cgtatcccgg gtgttccgtg gtgcttcaaa ccgctccagg aagcggaatg caccttc 177
<210> 29
<211> 25
<212> DNA
<213> 人工合成
<400> 29
ttttgaattc gaagaatacg ttggt 25
<210> 30
<211> 60
<212> DNA
<213> 人工合成
<400> 30
gtctttcgcc ggaaccgcgc actggttcgc agacagacca acgtattctt cgaattcaaa 60
<210> 31
<211> 60
<212> DNA
<213> 人工合成
<400> 31
cggttccggc gaaagaccgt gttgactgcg gttacccgca cgttaccccg aaagaatgca 60
<210> 32
<211> 60
<212> DNA
<213> 人工合成
<400> 32
acacccggga tacgagagtc gaagcagcaa ccacggttgt tgcattcttt cggggtaacg 60
<210> 33
<211> 60
<212> DNA
<213> 人工合成
<400> 33
ctctcgtatc ccgggtgttc cgtggtgctt caaaccgctc caggaagcgg aatgcacctt 60
<210> 34
<211> 29
<212> DNA
<213> 人工合成
<400> 34
ttttctcgag gaaggtgcat tccgcttcc 29
<210> 35
<211> 154
<212> PRT
<213> 人工合成
<400> 35
Met Ala Ser Thr Tyr Lys Leu Ile Leu Asn Gly Lys Thr Ser Ala Gln
1 5 10 15
His Asp Glu Ala Gln Gln Asn Ala Phe Tyr Gln Val Leu Asn Met Pro
20 25 30
Asn Leu Asn Ala Asp Gln Arg Asn Gly Phe Ile Gln Ser Leu Lys Asp
35 40 45
Asp Pro Ser Gln Ser Ala Asn Val Leu Gly Glu Ala Gln Lys Leu Asn
50 55 60
Asp Ser Gln Ala Pro Lys Lys Glu Lys Thr Pro Glu Glu Pro Lys Gln
65 70 75 80
Leu Ile Glu Gly Arg Glu Phe Glu Glu Tyr Val Gly Leu Ser Ala Asn
85 90 95
Gln Cys Ala Val Pro Ala Lys Asp Arg Val Asp Cys Gly Tyr Pro His
100 105 110
Val Thr Pro Lys Glu Cys Asn Asn Arg Gly Cys Cys Phe Asp Ser Arg
115 120 125
Ile Pro Gly Val Pro Trp Cys Phe Lys Pro Leu Gln Glu Ala Glu Cys
130 135 140
Thr Phe Leu Glu His His His His His His
145 150
<210> 36
<211> 465
<212> DNA
<213> 人工合成
<400> 36
atggctagca cctacaaact gatcctgaac ggtaaaacta gcgcgcagca cgacgaagcg 60
caacagaatg cgttctacca ggtactgaac atgccgaacc tgaacgcgga ccagcgtaac 120
ggtttcatcc agtctctgaa agacgacccg tctcagtctg cgaatgttct gggtgaagca 180
cagaaactga acgactctca ggcgccgaaa aaagaaaaaa ccccggaaga accgaaacaa 240
ttgatcgaag gtcgtgaatt cgaagaatac gttggtctgt ctgcgaacca gtgcgcggtt 300
ccggcgaaag accgtgttga ctgcggttac ccgcacgtta ccccgaaaga atgcaacaac 360
cgtggttgct gcttcgactc tcgtatcccg ggtgttccgt ggtgcttcaa accgctccag 420
gaagcggaat gcaccttcct cgagcaccac caccaccacc actga 465
<210> 37
<211> 5671
<212> DNA
<213> 人工合成
<400> 37
cccccggcca cggggcctgc caccataccc acgccgaaac aagcgctcat gagcccgaag 60
tggcgagccc gatcttcccc atcggtgatg tcggcgatat aggcgccagc aaccgcacct 120
gtggcgccgg tgatgccggc cacgatgcgt ccggcgtaga ggatcgagat ctcgatcccg 180
cgaaattaat acgactcact ataggggaat tgtgagcgga taacaattcc cctctagaaa 240
taattttgtt taactttaag aaggagatat accatggcta gcacctacaa actgatcctg 300
aacggtaaaa ctagcgcgca gcacgacgaa gcgcaacaga atgcgttcta ccaggtactg 360
aacatgccga acctgaacgc ggaccagcgt aacggtttca tccagtctct gaaagacgac 420
ccgtctcagt ctgcgaatgt tctgggtgaa gcacagaaac tgaacgactc tcaggcgccg 480
aaaaaagaaa aaaccccgga agaaccgaaa caattgatcg aaggtcgtga attcgaagaa 540
tacgttggtc tgtctgcgaa ccagtgcgcg gttccggcga aagaccgtgt tgactgcggt 600
tacccgcacg ttaccccgaa agaatgcaac aaccgtggtt gctgcttcga ctctcgtatc 660
ccgggtgttc cgtggtgctt caaaccgctc caggaagcgg aatgcacctt cctcgagcac 720
caccaccacc accactgaga tccggctgct aacaaagccc gaaaggaagc tgagttggct 780
gctgccaccg ctgagcaata actagcataa ccccttgggg cctctaaacg ggtcttgagg 840
ggttttttgc tgaaaggagg aactatatcc ggattggcga atgggacgcg ccctgtagcg 900
gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg 960
ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc 1020
cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc 1080
tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga 1140
cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa 1200
ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg attttgccga 1260
tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca 1320
aaatattaac gtttacaatt tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta 1380
tttgtttatt tttctaaata cattcaaata tgtatccgct catgaattaa ttcttagaaa 1440
aactcatcga gcatcaaatg aaactgcaat ttattcatat caggattatc aataccatat 1500
ttttgaaaaa gccgtttctg taatgaagga gaaaactcac cgaggcagtt ccataggatg 1560
gcaagatcct ggtatcggtc tgcgattccg actcgtccaa catcaataca acctattaat 1620
ttcccctcgt caaaaataag gttatcaagt gagaaatcac catgagtgac gactgaatcc 1680
ggtgagaatg gcaaaagttt atgcatttct ttccagactt gttcaacagg ccagccatta 1740
cgctcgtcat caaaatcact cgcatcaacc aaaccgttat tcattcgtga ttgcgcctga 1800
gcgagacgaa atacgcgatc gctgttaaaa ggacaattac aaacaggaat cgaatgcaac 1860
cggcgcagga acactgccag cgcatcaaca atattttcac ctgaatcagg atattcttct 1920
aatacctgga atgctgtttt cccggggatc gcagtggtga gtaaccatgc atcatcagga 1980
gtacggataa aatgcttgat ggtcggaaga ggcataaatt ccgtcagcca gtttagtctg 2040
accatctcat ctgtaacatc attggcaacg ctacctttgc catgtttcag aaacaactct 2100
ggcgcatcgg gcttcccata caatcgatag attgtcgcac ctgattgccc gacattatcg 2160
cgagcccatt tatacccata taaatcagca tccatgttgg aatttaatcg cggcctagag 2220
caagacgttt cccgttgaat atggctcata acaccccttg tattactgtt tatgtaagca 2280
gacagtttta ttgttcatga ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc 2340
agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg 2400
ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct 2460
accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa atactgtcct 2520
tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct 2580
cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg 2640
gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc 2700
gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga 2760
gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg 2820
cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta 2880
tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg 2940
ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg 3000
ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg ataaccgtat 3060
taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc gcagcgagtc 3120
agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc atctgtgcgg 3180
tatttcacac cgcatatatg gtgcactctc agtacaatct gctctgatgc cgcatagtta 3240
agccagtata cactccgcta tcgctacgtg actgggtcat ggctgcgccc cgacacccgc 3300
caacacccgc tgacgcgccc tgacgggctt gtctgctccc ggcatccgct tacagacaag 3360
ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg 3420
cgaggcagct gcggtaaagc tcatcagcgt ggtcgtgaag cgattcacag atgtctgcct 3480
gttcatccgc gtccagctcg ttgagtttct ccagaagcgt taatgtctgg cttctgataa 3540
agcgggccat gttaagggcg gttttttcct gtttggtcac tgatgcctcc gtgtaagggg 3600
gatttctgtt catgggggta atgataccga tgaaacgaga gaggatgctc acgatacggg 3660
ttactgatga tgaacatgcc cggttactgg aacgttgtga gggtaaacaa ctggcggtat 3720
ggatgcggcg ggaccagaga aaaatcactc agggtcaatg ccagcgcttc gttaatacag 3780
atgtaggtgt tccacagggt agccagcagc atcctgcgat gcagatccgg aacataatgg 3840
tgcagggcgc tgacttccgc gtttccagac tttacgaaac acggaaaccg aagaccattc 3900
atgttgttgc tcaggtcgca gacgttttgc agcagcagtc gcttcacgtt cgctcgcgta 3960
tcggtgattc attctgctaa ccagtaaggc aaccccgcca gcctagccgg gtcctcaacg 4020
acaggagcac gatcatgcgc acccgtgggg ccgccatgcc ggcgataatg gcctgcttct 4080
cgccgaaacg tttggtggcg ggaccagtga cgaaggcttg agcgagggcg tgcaagattc 4140
cgaataccgc aagcgacagg ccgatcatcg tcgcgctcca gcgaaagcgg tcctcgccga 4200
aaatgaccca gagcgctgcc ggcacctgtc ctacgagttg catgataaag aagacagtca 4260
taagtgcggc gacgatagtc atgccccgcg cccaccggaa ggagctgact gggttgaagg 4320
ctctcaaggg catcggtcga gatcccggtg cctaatgagt gagctaactt acattaattg 4380
cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 4440
tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ccagggtggt ttttcttttc 4500
accagtgaga cgggcaacag ctgattgccc ttcaccgcct ggccctgaga gagttgcagc 4560
aagcggtcca cgctggtttg ccccagcagg cgaaaatcct gtttgatggt ggttaacggc 4620
gggatataac atgagctgtc ttcggtatcg tcgtatccca ctaccgagat atccgcacca 4680
acgcgcagcc cggactcggt aatggcgcgc attgcgccca gcgccatctg atcgttggca 4740
accagcatcg cagtgggaac gatgccctca ttcagcattt gcatggtttg ttgaaaaccg 4800
gacatggcac tccagtcgcc ttcccgttcc gctatcggct gaatttgatt gcgagtgaga 4860
tatttatgcc agccagccag acgcagacgc gccgagacag aacttaatgg gcccgctaac 4920
agcgcgattt gctggtgacc caatgcgacc agatgctcca cgcccagtcg cgtaccgtct 4980
tcatgggaga aaataatact gttgatgggt gtctggtcag agacatcaag aaataacgcc 5040
ggaacattag tgcaggcagc ttccacagca atggcatcct ggtcatccag cggatagtta 5100
atgatcagcc cactgacgcg ttgcgcgaga agattgtgca ccgccgcttt acaggcttcg 5160
acgccgcttc gttctaccat cgacaccacc acgctggcac ccagttgatc ggcgcgagat 5220
ttaatcgccg cgacaatttg cgacggcgcg tgcagggcca gactggaggt ggcaacgcca 5280
atcagcaacg actgtttgcc cgccagttgt tgtgccacgc ggttgggaat gtaattcagc 5340
tccgccatcg ccgcttccac tttttcccgc gttttcgcag aaacgtggct ggcctggttc 5400
accacgcggg aaacggtctg ataagagaca ccggcatact ctgcgacatc gtataacgtt 5460
actggtttca cattcaccac cctgaattga ctctcttccg ggcgctatca tgccataccg 5520
cgaaaggttt tgcgccattc gatggtgtcc gggatctcga cgctctccct tatgcgactc 5580
ctgcattagg aagcagccca gtagtaggtt gaggccgttg agcaccgccg ccgcaaggaa 5640
tggtgcatgc aaggagatgg cgcccaacag t 5671
<210> 38
<211> 31
<212> DNA
<213> 人工合成
<400> 38
ttttccatgg aagaatacgt tggtctgtct g 31
<210> 39
<211> 31
<212> DNA
<213> 人工合成
<400> 39
ttttctcgag gaaggtgcat tccgcttcct g 31
<210> 40
<211> 68
<212> PRT
<213> 人工合成
<400> 40
Met Glu Glu Tyr Val Gly Leu Ser Ala Asn Gln Cys Ala Val Pro Ala
1 5 10 15
Lys Asp Arg Val Asp Cys Gly Tyr Pro His Val Thr Pro Lys Glu Cys
20 25 30
Asn Asn Arg Gly Cys Cys Phe Asp Ser Arg Ile Pro Gly Val Pro Trp
35 40 45
Cys Phe Lys Pro Leu Gln Glu Ala Glu Cys Thr Phe Leu Glu His His
50 55 60
His His His His
65
<210> 41
<211> 207
<212> DNA
<213> 人工合成
<400> 41
atggaagaat acgttggtct gtctgcgaac cagtgcgcgg ttccggcgaa agaccgtgtt 60
gactgcggtt acccgcacgt taccccgaaa gaatgcaaca accgtggttg ctgcttcgac 120
tctcgtatcc cgggtgttcc gtggtgcttc aaaccgctcc aggaagcgga atgcaccttc 180
ctcgagcacc accaccacca ccactga 207
<210> 42
<211> 5413
<212> DNA
<213> 人工合成
<400> 42
cccccggcca cggggcctgc caccataccc acgccgaaac aagcgctcat gagcccgaag 60
tggcgagccc gatcttcccc atcggtgatg tcggcgatat aggcgccagc aaccgcacct 120
gtggcgccgg tgatgccggc cacgatgcgt ccggcgtaga ggatcgagat ctcgatcccg 180
cgaaattaat acgactcact ataggggaat tgtgagcgga taacaattcc cctctagaaa 240
taattttgtt taactttaag aaggagatat accatggaag aatacgttgg tctgtctgcg 300
aaccagtgcg cggttccggc gaaagaccgt gttgactgcg gttacccgca cgttaccccg 360
aaagaatgca acaaccgtgg ttgctgcttc gactctcgta tcccgggtgt tccgtggtgc 420
ttcaaaccgc tccaggaagc ggaatgcacc ttcctcgagc accaccacca ccaccactga 480
gatccggctg ctaacaaagc ccgaaaggaa gctgagttgg ctgctgccac cgctgagcaa 540
taactagcat aaccccttgg ggcctctaaa cgggtcttga ggggtttttt gctgaaagga 600
ggaactatat ccggattggc gaatgggacg cgccctgtag cggcgcatta agcgcggcgg 660
gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt 720
tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc 780
gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg 840
attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga 900
cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc 960
ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa 1020
aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta acgtttacaa 1080
tttcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa 1140
tacattcaaa tatgtatccg ctcatgaatt aattcttaga aaaactcatc gagcatcaaa 1200
tgaaactgca atttattcat atcaggatta tcaataccat atttttgaaa aagccgtttc 1260
tgtaatgaag gagaaaactc accgaggcag ttccatagga tggcaagatc ctggtatcgg 1320
tctgcgattc cgactcgtcc aacatcaata caacctatta atttcccctc gtcaaaaata 1380
aggttatcaa gtgagaaatc accatgagtg acgactgaat ccggtgagaa tggcaaaagt 1440
ttatgcattt ctttccagac ttgttcaaca ggccagccat tacgctcgtc atcaaaatca 1500
ctcgcatcaa ccaaaccgtt attcattcgt gattgcgcct gagcgagacg aaatacgcga 1560
tcgctgttaa aaggacaatt acaaacagga atcgaatgca accggcgcag gaacactgcc 1620
agcgcatcaa caatattttc acctgaatca ggatattctt ctaatacctg gaatgctgtt 1680
ttcccgggga tcgcagtggt gagtaaccat gcatcatcag gagtacggat aaaatgcttg 1740
atggtcggaa gaggcataaa ttccgtcagc cagtttagtc tgaccatctc atctgtaaca 1800
tcattggcaa cgctaccttt gccatgtttc agaaacaact ctggcgcatc gggcttccca 1860
tacaatcgat agattgtcgc acctgattgc ccgacattat cgcgagccca tttataccca 1920
tataaatcag catccatgtt ggaatttaat cgcggcctag agcaagacgt ttcccgttga 1980
atatggctca taacacccct tgtattactg tttatgtaag cagacagttt tattgttcat 2040
gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat 2100
caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa 2160
accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa 2220
ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt agccgtagtt 2280
aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc taatcctgtt 2340
accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata 2400
gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt 2460
ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag aaagcgccac 2520
gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga 2580
gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg 2640
ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa 2700
aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat 2760
gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 2820
tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 2880
agagcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatata 2940
tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagta tacactccgc 3000
tatcgctacg tgactgggtc atggctgcgc cccgacaccc gccaacaccc gctgacgcgc 3060
cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga 3120
gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgaggcag ctgcggtaaa 3180
gctcatcagc gtggtcgtga agcgattcac agatgtctgc ctgttcatcc gcgtccagct 3240
cgttgagttt ctccagaagc gttaatgtct ggcttctgat aaagcgggcc atgttaaggg 3300
cggttttttc ctgtttggtc actgatgcct ccgtgtaagg gggatttctg ttcatggggg 3360
taatgatacc gatgaaacga gagaggatgc tcacgatacg ggttactgat gatgaacatg 3420
cccggttact ggaacgttgt gagggtaaac aactggcggt atggatgcgg cgggaccaga 3480
gaaaaatcac tcagggtcaa tgccagcgct tcgttaatac agatgtaggt gttccacagg 3540
gtagccagca gcatcctgcg atgcagatcc ggaacataat ggtgcagggc gctgacttcc 3600
gcgtttccag actttacgaa acacggaaac cgaagaccat tcatgttgtt gctcaggtcg 3660
cagacgtttt gcagcagcag tcgcttcacg ttcgctcgcg tatcggtgat tcattctgct 3720
aaccagtaag gcaaccccgc cagcctagcc gggtcctcaa cgacaggagc acgatcatgc 3780
gcacccgtgg ggccgccatg ccggcgataa tggcctgctt ctcgccgaaa cgtttggtgg 3840
cgggaccagt gacgaaggct tgagcgaggg cgtgcaagat tccgaatacc gcaagcgaca 3900
ggccgatcat cgtcgcgctc cagcgaaagc ggtcctcgcc gaaaatgacc cagagcgctg 3960
ccggcacctg tcctacgagt tgcatgataa agaagacagt cataagtgcg gcgacgatag 4020
tcatgccccg cgcccaccgg aaggagctga ctgggttgaa ggctctcaag ggcatcggtc 4080
gagatcccgg tgcctaatga gtgagctaac ttacattaat tgcgttgcgc tcactgcccg 4140
ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 4200
gaggcggttt gcgtattggg cgccagggtg gtttttcttt tcaccagtga gacgggcaac 4260
agctgattgc ccttcaccgc ctggccctga gagagttgca gcaagcggtc cacgctggtt 4320
tgccccagca ggcgaaaatc ctgtttgatg gtggttaacg gcgggatata acatgagctg 4380
tcttcggtat cgtcgtatcc cactaccgag atatccgcac caacgcgcag cccggactcg 4440
gtaatggcgc gcattgcgcc cagcgccatc tgatcgttgg caaccagcat cgcagtggga 4500
acgatgccct cattcagcat ttgcatggtt tgttgaaaac cggacatggc actccagtcg 4560
ccttcccgtt ccgctatcgg ctgaatttga ttgcgagtga gatatttatg ccagccagcc 4620
agacgcagac gcgccgagac agaacttaat gggcccgcta acagcgcgat ttgctggtga 4680
cccaatgcga ccagatgctc cacgcccagt cgcgtaccgt cttcatggga gaaaataata 4740
ctgttgatgg gtgtctggtc agagacatca agaaataacg ccggaacatt agtgcaggca 4800
gcttccacag caatggcatc ctggtcatcc agcggatagt taatgatcag cccactgacg 4860
cgttgcgcga gaagattgtg caccgccgct ttacaggctt cgacgccgct tcgttctacc 4920
atcgacacca ccacgctggc acccagttga tcggcgcgag atttaatcgc cgcgacaatt 4980
tgcgacggcg cgtgcagggc cagactggag gtggcaacgc caatcagcaa cgactgtttg 5040
cccgccagtt gttgtgccac gcggttggga atgtaattca gctccgccat cgccgcttcc 5100
actttttccc gcgttttcgc agaaacgtgg ctggcctggt tcaccacgcg ggaaacggtc 5160
tgataagaga caccggcata ctctgcgaca tcgtataacg ttactggttt cacattcacc 5220
accctgaatt gactctcttc cgggcgctat catgccatac cgcgaaaggt tttgcgccat 5280
tcgatggtgt ccgggatctc gacgctctcc cttatgcgac tcctgcatta ggaagcagcc 5340
cagtagtagg ttgaggccgt tgagcaccgc cgccgcaagg aatggtgcat gcaaggagat 5400
ggcgcccaac agt 5413
Claims (10)
1.如SEQ ID NO:1~5中任一所示的蛋白A的B结构域片段或合并序列在构建具有类伴侣样蛋白作用的融合蛋白表达载体中的应用。
2.如权利要求1所述的应用,其特征在于,将如SEQ ID NO:6,7所示的经优化后的PAB1蛋白编码序列插入融合蛋白表达载体中作为表达框上游的类伴侣样蛋白。
3.一种融合蛋白表达载体,其特征在于,所述融合蛋白表达载体的克隆区上游包含编码如权利要求2所述的经优化后的PAB1蛋白的核酸序列,所述融合蛋白表达载体的DNA序列如SEQ ID NO:26所示。
4.如权利要求3所述的融合蛋白表达载体,其特征在于,选用用于改造的商业化空载体为原始亲本载体,所述原始亲本载体包括pET系统表达载体、酵母系统表达载体、昆虫细胞系统表达载体和哺乳动物细胞系统表达载体中的任意一种。
5.如权利要求3所述的融合蛋白表达载体,其特征在于,所述经优化后的PAB1蛋白的序列上游添加有如SEQ ID NO:8,9所示的转录起始适配序列;和/或,
所述经优化后的PAB1蛋白的序列上游添加有商用分离标签蛋白;和/或,
所述经优化后的PAB1蛋白的序列下游包含一段柔性接头区、蛋白酶酶切位点识别区和用于插入下游目标蛋白的多克隆区。
6.如权利要求5所述的融合蛋白表达载体,其特征在于,所述商用分离标签蛋白包括5’-HisTag和5’-Strept II-Tag中的任意一种;和/或,
所述蛋白酶酶切位点识别区包括凝血因子Xa蛋白酶酶切位点识别区、凝血酶酶切位点识别区、肠激酶酶切位点识别区、烟草蚀纹病毒蛋白酶酶切位点识别区和羟胺切割位点中的任意一种。
7.如权利要求6所述的融合蛋白表达载体,其特征在于,所述柔性接头区的序列如SEQID NO:10,11所示,所述蛋白酶酶切位点识别区的序列如SEQ ID NO:12,13所示,所述用于插入下游目标蛋白的多克隆区的序列如SEQ ID NO:14,15所示。
8.如权利要求3所述的融合蛋白表达载体,其特征在于,所述经优化后的PAB1蛋白的同源性与天然PAB1蛋白的同源性不低于85%。
9.如权利要求3至8任意一项所述的融合蛋白表达载体作为新的亲本表达载体在表达目标蛋白中的应用。
10.一种表达包含类伴侣样蛋白的融合蛋白的方法,其特征在于,包括以下步骤:
将目标蛋白编码序列插入如权利要求6至8任意一项所述的融合蛋白表达载体中PAB1下游的多克隆区,得到含目标蛋白编码序列的融合蛋白重组表达载体;
将所述融合蛋白重组表达载体转染宿主细胞,培养宿主细胞表达融合蛋白。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910698981.4A CN110511950B (zh) | 2019-07-29 | 2019-07-29 | Pab蛋白在构建具有类伴侣样蛋白作用的融合蛋白表达载体中的应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910698981.4A CN110511950B (zh) | 2019-07-29 | 2019-07-29 | Pab蛋白在构建具有类伴侣样蛋白作用的融合蛋白表达载体中的应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110511950A true CN110511950A (zh) | 2019-11-29 |
CN110511950B CN110511950B (zh) | 2022-03-08 |
Family
ID=68624363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910698981.4A Active CN110511950B (zh) | 2019-07-29 | 2019-07-29 | Pab蛋白在构建具有类伴侣样蛋白作用的融合蛋白表达载体中的应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110511950B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113281521A (zh) * | 2021-05-19 | 2021-08-20 | 河南大学 | 用于植物应激颗粒相关蛋白快速鉴定的Gateway双元质粒载体、其构建方法及应用 |
CN114957488A (zh) * | 2022-05-19 | 2022-08-30 | 中国科学院生物物理研究所 | 芳香烃受体蛋白稳定高效表达的方法及其应用 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201802339D0 (en) * | 2018-02-13 | 2018-03-28 | Glaxosmithkline Biologicals Sa | Immunogenic composition |
-
2019
- 2019-07-29 CN CN201910698981.4A patent/CN110511950B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201802339D0 (en) * | 2018-02-13 | 2018-03-28 | Glaxosmithkline Biologicals Sa | Immunogenic composition |
Non-Patent Citations (2)
Title |
---|
JEFFREY R. HUTH. ET AL.: "design of an expression system for detecting folded protein domains and mapping macromolecular interactions by NMR", 《ROTEIN SCIENCE》 * |
TRAVIS GALLAGHER ET AL.: "two crystal structures of the b1 immunoglobulin-binding domain of streptococcal G and comparison wtih NMR", 《BIOCHEMISTRY》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113281521A (zh) * | 2021-05-19 | 2021-08-20 | 河南大学 | 用于植物应激颗粒相关蛋白快速鉴定的Gateway双元质粒载体、其构建方法及应用 |
CN113281521B (zh) * | 2021-05-19 | 2022-07-22 | 河南大学 | 用于植物应激颗粒相关蛋白快速鉴定的Gateway双元质粒载体、其构建方法及应用 |
CN114957488A (zh) * | 2022-05-19 | 2022-08-30 | 中国科学院生物物理研究所 | 芳香烃受体蛋白稳定高效表达的方法及其应用 |
Also Published As
Publication number | Publication date |
---|---|
CN110511950B (zh) | 2022-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101802006B (zh) | 展示结合剂 | |
CN105960413B (zh) | 人工dna-结合蛋白及其用途 | |
KR20210149060A (ko) | Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합 | |
KR20140060541A (ko) | 암을 치료하기 위한 rna 조작된 t 세포 | |
US6531138B1 (en) | Recombinant polypeptides and peptides, nucleic acids coding for the same and use of these polypetides and peptides in the diagnostic of tuberculosis | |
JPH09508019A (ja) | 亜鉛フィンガータンパク質誘導体およびそのための方法 | |
US20040266993A1 (en) | Non-immunoglobulin binding polypeptides | |
CN107580503B (zh) | 用于治疗细菌感染的杀菌剂与亲溶酶体碱化剂的组合 | |
DK2768848T3 (en) | METHODS AND PROCEDURES FOR EXPRESSION AND SECRETARY OF PEPTIDES AND PROTEINS | |
CN111349596B (zh) | 产褪黑素的重组大肠杆菌及其构建方法和应用 | |
HUE031447T2 (en) | Cytotoxic immunoglobulin | |
KR20100057016A (ko) | 생활성 펩티드의 발현 및 정제를 위한 가용성 태그 | |
US11884974B2 (en) | TIM-3 nanobody, a preparation method thereof, and use thereof | |
US20200188531A1 (en) | Single-vector gene construct comprising insulin and glucokinase genes | |
KR20200146018A (ko) | 해산물 알레르기의 진단 방법 및 제품 | |
CN110511950A (zh) | Pab蛋白在构建具有类伴侣样蛋白作用的融合蛋白表达载体中的应用 | |
KR20200116084A (ko) | 발효 공정 | |
US6699692B2 (en) | Vector for expression of heterologous protein and methods for extracting recombinant protein and for purifying isolated recombinant insulin | |
CN111996235B (zh) | 一种检测探针、其制备方法及应用 | |
CN110484551A (zh) | 金属硫蛋白表达载体及其应用 | |
TW589379B (en) | Novel promoters and gene expression method by using the promoters | |
US20030059870A1 (en) | Recombinant bacterial strains for the production of natural nucleosides and modified analogues thereof | |
EP0912728A1 (en) | Novel synthetic protein structural templates for the generation, screening and evolution of functional molecular surfaces | |
CN114213509A (zh) | 基于SARS-CoV-2的S蛋白的疫苗及其用途 | |
CN116323942A (zh) | 用于基因组编辑的组合物及其使用方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220831 Address after: 6-1106, Xingguang Commercial Center, Xinwu District, Wuxi City, Jiangsu Province, 214000 Patentee after: Jiangsu Yuan Pharmaceutical Research Co.,Ltd. Address before: 430000 no.1-22, 10 / F, building A4, financial port backstage service center phase I, No.77, Guanggu Avenue, Donghu New Technology Development Zone, Wuhan City, Hubei Province Patentee before: YINZHI CAI BIOTECHNOLOGY (WUHAN) Co.,Ltd. |