CN109575116A - 一种线粒体定位导肽及其发现方法与应用 - Google Patents

一种线粒体定位导肽及其发现方法与应用 Download PDF

Info

Publication number
CN109575116A
CN109575116A CN201811330295.3A CN201811330295A CN109575116A CN 109575116 A CN109575116 A CN 109575116A CN 201811330295 A CN201811330295 A CN 201811330295A CN 109575116 A CN109575116 A CN 109575116A
Authority
CN
China
Prior art keywords
peptide
protein
amino acid
mitochondria
positioning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811330295.3A
Other languages
English (en)
Other versions
CN109575116B (zh
Inventor
夏立群
鲁义善
汪志文
陈建林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Ocean University
Shenzhen Research Institute of Guangdong Ocean University
Original Assignee
Guangdong Ocean University
Shenzhen Research Institute of Guangdong Ocean University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Ocean University, Shenzhen Research Institute of Guangdong Ocean University filed Critical Guangdong Ocean University
Priority to CN201811330295.3A priority Critical patent/CN109575116B/zh
Publication of CN109575116A publication Critical patent/CN109575116A/zh
Application granted granted Critical
Publication of CN109575116B publication Critical patent/CN109575116B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/30Macromolecular organic or inorganic compounds, e.g. inorganic polyphosphates
    • A61K47/42Proteins; Polypeptides; Degradation products thereof; Derivatives thereof, e.g. albumin, gelatin or zein
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P33/00Antiparasitic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6818Sequencing of polypeptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Hematology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Communicable Diseases (AREA)
  • Urology & Nephrology (AREA)
  • Microbiology (AREA)
  • Oncology (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Pathology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Virology (AREA)
  • Toxicology (AREA)
  • Cell Biology (AREA)

Abstract

本发明公开了一种线粒体定位导肽及其编码序列和应用。本发明提供的线粒体定位信号肽,为如下(a)或(b):(a)由序列表中序列1所示的氨基酸序列组成的多肽;(b)将序列1的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有线粒体定位导肽功能的由序列1衍生的多肽。本发明提供了一种线粒体定位导肽及其编码序列。本发明提供的线粒体定位导肽可将目标蛋白靶向定位于真核细胞线粒体上。将本发明提供的线粒体定位导肽和适宜的目标蛋白形成融合蛋白,可以得到用于治疗遗传病、恶性肿瘤、血液病,病毒、寄生虫、细菌感染等疾病的疫苗和药物,并实现高效定向给药。本发明对于生物技术领域和医药领域具有重大价值。

Description

一种线粒体定位导肽及其发现方法与应用
技术领域
本发明属于医学领域,涉及线粒体定位导肽及其发现方法与应用。
背景技术
真核生物与原核生物最大的区别是真核生物的细胞发展出了复杂的细胞器体系。细胞器是细胞中通过生物膜与细胞中其他部分分隔开来的、功能上独立的亚细胞结构。细胞器可按各自拥有膜的层数大致分为三类:双层膜内共生体细胞器主要包括线粒体、细胞核、叶绿体等;单层膜细胞器主要包括内质网、高尔基体、液泡、溶酶体及过氧化物酶体等;无膜细胞器主要包括核糖体、中心体及穹窿体等。这些细胞器组成了细胞的基本结构,使真核细胞能正常的工作、运转。
线粒体(mitochondrion)是一种存在于大多数真核细胞中的由两层膜包被的细胞器,是细胞中制造能量的细胞器,也是细胞进行有氧呼吸的主要场所,其直径在0.5到1.0微米左右。大多数真核细胞或多或少都拥有线粒体,但它们各自拥有的线粒体在大小、数量及外观等方面上都有所不同,如肝脏细胞中有1000-2000个线粒体。线粒体拥有自身的遗传物质和遗传体系,但其基因组大小有限,是一种半自主细胞器,线粒体基因组属于母系遗传。除了为细胞供能外,线粒体还参与诸如细胞分化、细胞信息传递和细胞凋亡等过程,并拥有调控细胞生长和细胞周期的能力。线粒体与许多疾病相关,比如母系遗传Leigh综合征、线粒体肌病、Leer遗传性视神经病等线粒体病,这是一大类的遗传代谢病,其致病的原因主要由核基因和线粒体基因造成,临床表现复杂[1,2]。研究还发现线粒体功能改变能促进肿瘤转移[3]。
导肽又称转运肽(transit peptide)或导向序列(targeting sequence),它是游离核糖体上合成的蛋白质的N-端信号。在蛋白质运送过程中发挥重要作用,一般引导蛋白进入线粒体或叶绿体[4]。导肽是新生蛋白N-端一段大约20~80个氨基酸的肽链,通常是疏水的,由非电负性氨基酸构成,中间夹有碱性氨基酸,而没有酸性氨基酸,羟基氨基酸含量高,易形成双亲α螺旋轮(amphiphilic helix)。不同的导肽序列缺乏同源性,这意味着和识别有关的信号不是一级结构,而是二级、三级结构,或这一区域产生的特点。有一种可能是导肽形成一种双亲α螺旋,即带电荷的基团在螺旋的一侧,不带电荷的在另一侧。进入线粒体或叶绿体的蛋白是要通过翻译后加工,初始合成的前体要比成熟的蛋白长12-20aa,而导肽负责细胞器外膜的初始识别、起始前体蛋白和细胞器膜的相互作用。导肽存在着独立折叠的结构域,能折叠成一个适当的结构供细胞器表面受体识别[5]。导肽穿越过膜后被细胞器的蛋白酶切下、转运继续进行、直至整个的蛋白都穿越过膜,或直到中部的序列导致转运的停止。导肽含有作为细胞器蛋白定位所需的所有信息。导肽的这种能力可以通过构建人工蛋白来检验。将来自细胞器的导肽和位于胞液中的蛋白连接起来。具体方法是构建融合基因,然后翻译成融合蛋白。线粒体定位导肽通过这种实验,可以表现出具有独立引导附着顺序进入线粒体靶位点的功能。
研究蛋白质的转运和亚细胞定位具有很大的应用价值,因为蛋白质的功能通常和其亚细胞定位息息相关,比如病原的分泌蛋白往往是重要的毒力因子,与其致病性紧密相关。此外,信号肽和导肽在药物靶向运送及疾病治疗中也具有广泛的应用,比如可以利用核定位信号,可以将治疗基因转移到细胞核中,从而进行疾病的细胞定向基因治疗。由于线粒体与多种疾病有关,特别是一些由于线粒体基因突变而引起的疾病,线粒体定位的导肽能够将治疗基因靶定位到线粒体上、进行线粒体定向基因治疗,为基因治疗提供一个好的前景。研究线粒体定位导肽,不仅可以揭示线粒体定位蛋白质的生物学功能和机制,同时还能为特异的线粒体靶向生物技术药物开发提供技术支持。
参考文献:
1.Tuppen H A L,Blakely E L,Turnbull D M,et al.Mitochondrial DNAmutations and human disease[J].BBA-Bioenergetics,2010,1797(2):113-128.
2.Schapira A H.Mitochondrial disease[J].Disease&Molecular Medicine,2013,1(1):629.
3.Paolo E P,Valéry L P,Jhudit P E,et al.A mitochondrial switchpromotes tumor metastasis[J].Cell Reports,2014,8(3):754-766.
4.Emanuelsson O,Nielsen H,Von H G.ChloroP,a neural network-basedmethod for predicting chloroplast transit peptides and their cleavage sites[J].Protein Science,2010,8(5):978-984.
5.Claros M G,Vincens P.Computational method to predictmitochondrially imported proteins and their targeting sequences[J].FebsJournal,2010,241(3):779-786.
6.夏洪丽,鲁义善,汤菊芬,等.鱼类致病杀鲑诺卡氏菌(Nocardia salmonicida)特异性PCR检测方法的建立[J].广东海洋大学学报,2014,34(4):56-61.
发明内容
本发明的目的是提供一种线粒体定位导肽、编码基因及其应用,该线粒体定位导肽可将内源(细胞内过表达)和外源目标蛋白靶向定位于线粒体。
本发明所采用的技术方案是:
一种线粒体定位导肽,所述的导肽为(a)或(b);
(a)由SEQ ID NO.l所示的氨基酸序列组成的多肽:
(b)将SEQ ID NO.l所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有线粒体定位导肽功能的衍生多肽。
一种编码所述的线粒体定位导肽的基因序列,所述的基因序列为(a)、(b)或(c);
(a)如SEQ ID NO.2所示的核苷酸序列:
(b)在严格条件下与SEQ ID NO.2所示的核苷酸序列杂交且编码具有线粒体定位导肽功能蛋白的核苷酸序列:
(c)与SEQID NO.2所示的核苷酸序列具有90%以上同源性且编码具有线粒体定位导肽功能蛋白的核苷酸序列。
一种含有所述的线粒体定位导肽的重组融合蛋白。
一种含有所述的基因序列的重组表达载体、重组菌或转基因细胞系。
一种所述的导肽在将目标蛋白定位于线粒体上的应用。
一种将目标蛋白定位于线粒体的方法,将所述的导肽作为线粒体定位导肽将目标蛋白定位于线粒体上。
所述的将目标蛋白定位于线粒体的,包括以下步骤:
(a)将融合基因导入靶细胞中,从而将目标蛋白定位于靶细胞的线粒体上:所述融合基因自上游至下游依次包括编码导肽的基因序列和编码目标蛋白的基因序列;或
(b)将外源融合蛋白加入靶细胞培养基中,从而使目标蛋白跨过靶细胞的细胞膜进入靶细胞中,并最终定位于靶细胞的线粒体上:所述外源融合蛋白白N端至C端依次包括线粒体定位导肽和目标蛋白的氨基酸序列。
所述的靶细胞为真核细胞。
一种所述的线粒体定位导肽在在制备治疗遗传病、恶性肿瘤、血液病,病毒、寄生虫、细菌感染等疾病的疫苗和药物中的应用。
较为具体地,本发明第一方面提供了一种线粒体定位导肽,所述的导肽选自如下序列:
(a)由SEQ ID NO.l所示的氨基酸序列组成的多肽:
(b)由SEQ ID NO.3所示的氨基酸序列前31至前185位中任意整数个数氨基酸组成的多肽:
(c)由SEQ ID NO.3所示的氨基酸序列第31至第185位发生插入、删除和/或取代突变组成的多肽:
(d)由SEQ ID NO.l所示的氨基酸序列上下游独立或共同减少1个、2个或3个氨基酸组成的多肽:
(e)将SEQ ID NO.1所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有线粒体定位导肽功能的衍生多肽;
(f)由SEQ ID NO.l所示的氨基酸序列C段融合1-50个氨基酸残基组成的多肽:
(g)由SEQ ID NO.l所示的氨基酸序列保持至少两个带正电的氨基酸不变的突变体组成的多肽:
(h)由SEQ ID NO.l所示的氨基酸序列保持至少两个带正电的氨基酸并且疏水氨基酸比例大于35.9%的突变体组成的多肽:
(i)由SEQ ID NO.l所示的氨基酸序列保持至少两个带正电的氨基酸并且α螺旋比例大于30.56%的突变体组成的多肽:
(j)由SEQ ID NO.7-SEQ ID NO.18中任一条所示的氨基酸序列组成的多肽。
本发明第二方面提供了一种融合蛋白,所述融合蛋白包括如本发明第一方面所述的线粒体定位导肽和目标蛋白,所述线粒体定位导肽位于所述目标蛋白的N端;
可选地,所述目标蛋白是荧光蛋白,优选,所述目标蛋白是绿色荧光蛋白。
本发明第三方面提供了一种基因序列,所述基因序列编码本发明第一方面所述的线粒体定位导肽的基因序列或本发明第二方面所述的融合蛋白的基因序列;
可选,所述基因序列选自SEQ ID NO.2、SEQ ID NO.4、SEQ ID NO.5和SEQ IDNO.6。
本发明第四方面提供了一种重组表达载体,所述重组表达载体含有本发明第三方面所述的基因序列。
本发明第五方面提供了一种宿主细胞,所述宿主细胞含有如本发明第四方面所述的重组表达载体。
本发明第六方面提供了一种本发明第一方面所述的线粒体定位导肽、本发明第二方面所述的融合蛋白、本发明第三方面所述的基因序列、本发明第四方面所述的重组表达载体或本发明第五方面所述的宿主细胞在将目标蛋白定位于线粒体中的应用。
本发明第期方面提供了一种将目标蛋白定位于线粒体的方法,其特征在于包括以下步骤:
(a)将本发明第三方面所述的融合蛋白的基因导入靶细胞中,从而将所述目标蛋白定位于所述靶细胞的线粒体上;所述融合基因自上游至下游依次包括编码导肽的基因序列和编码目标蛋白的基因序列;或
(b)将如本发明第二方面所述的融合蛋白加入靶细胞生长环境中,从而使目标蛋白跨过靶细胞的细胞膜进入所述靶细胞中,并最终定位于靶细胞的线粒体上;所述外源融合蛋白自N端至C端依次包括线粒体定位导肽和目标蛋白的氨基酸序列;
优选,所述的靶细胞为真核细胞。
本发明第八方面提供了一种本发明第一方面所述的线粒体定位导肽或本发明第二方面所述的融合蛋白在制备治疗遗传病、恶性肿瘤、血液病,病毒、寄生虫、细菌感染的疫苗、药物或药物组合物中的应用。
本发明第九方面提供了一种从细菌中筛选真核生物的细胞器定位导肽的方法,所述方法包括如下步骤:
(1)获取细菌全基因组序列或部分基因组序列;
(2)获取细菌所有所述基因组序列的蛋白组序列;
(3)对所述蛋白组序列进行生物信息分析,包括:
(a)预测所述蛋白组序列中每种蛋白的亚细胞定位,获得软件预测的具有亚细胞定位功能的蛋白质;和/或
(b)预测所述蛋白组序列中每种蛋白是否存在信号肽或导肽以及切割位点的位置,获得软件预测的细胞器定位导肽和/或分泌蛋白的序列;
可选地,所述方法还包括如下步骤:
(4)在所述真核细胞中对所述软件预测的具有亚细胞定位功能的蛋白质或所述软件预测的细胞器定位导肽进行功能验证;
优选地,步骤(a)是通过LocTree 3软件执行的;
优选地,步骤(b)是通过Signal 4.1软件执行的;
优选地,步骤(4)选自:
(i)对步骤(a)中所述软件预测的具有亚细胞定位功能的蛋白质进行与标签蛋白融合,用所述融合蛋白转染所述真核细胞,检测或验证所述融合蛋白的细胞器定位;
(ii)对步骤(a)中所述软件预测的具有亚细胞定位功能的蛋白质进行人工突变后进行与标签蛋白融合,用所述融合蛋白转染所述真核细胞,检测或验证所述融合蛋白的细胞器定位;
(iii)对步骤(b)中所述软件预测的细胞器定位导肽进行与标签蛋白融合,用所述融合蛋白转染所述真核细胞,检测或验证所述融合蛋白的细胞器定位;
(iv)对步骤(b)中所述软件预测的细胞器定位导肽进行人工突变后进行与标签蛋白融合,用所述融合蛋白转染所述真核细胞,检测或验证所述融合蛋白的细胞器定位;
(v)对步骤(a)中所述软件预测的具有亚细胞定位功能的蛋白质删除步骤(b)中所述软件预测的细胞器定位导肽后进行与标签蛋白融合,用所述融合蛋白转染所述真核细胞,检测或验证所述融合蛋白的细胞器定位;
(vi)用步骤(a)中所述软件预测的具有亚细胞定位功能的蛋白质转染所述真核细胞,检测或验证所述软件预测的具有亚细胞定位功能的蛋白质的细胞器定位;
优选地,所述真核生物是所述细菌的宿主;
优选地,所述细胞器为线粒体;
优选地,所述细菌是鰤鱼诺卡氏菌;
优选地,所述宿主是鰤鱼;
优选地,所述真核细胞是FHM细胞、GS细胞、石斑鱼脾细胞系或HEK293-T细胞;
优选地,所述标签蛋白为荧光蛋白,更优选地,所述标签蛋白为绿色荧光蛋白。
本发明的有益效果:
本发明提供了一种线粒体定位导肽及其编码基因。将本发明提供的线粒体定位导肽与合适的目标蛋白形成融合蛋白,通过细胞内过表达或外源加入到靶细胞生长环境中,增强了内源及外源蛋白线粒体靶向定位的有效性,可用于开发治疗遗传病、恶性肿瘤、血液病,病毒、寄生虫、细菌感染等疾病的疫苗和药物,并实现高效定向给药。
附图说明
图1为Ns3141基因PCR扩增电泳结果,泳道1为Ns3141的PCR产物电泳图,泳道2为阴性对照(阴性对照未加入DNA模板,而是双蒸水)。
图2为Ns3141-GFP融合蛋白亚细胞定位的荧光显微镜观察;绿色荧光为Ns3141蛋白的定位,蓝色荧光代表DAPI染色的细胞核,红色荧光代表MitoTracker Red CMXRo染色的线粒体,Merge是将Ns3141蛋白定位、细胞核定位和线粒体定位的三个图片叠加。
图3为Ns3141Δtp基因PCR扩增电泳结果,泳道1为Ns3141Δtp的PCR产物电泳图,泳道2为阴性对照。
图4为Ns3141Δtp-GFP融合蛋白亚细胞定位的荧光显微镜观察;绿色荧光为Ns3141Δtp蛋白的定位,蓝色荧光代表DAPI染色的细胞核,红色荧光代表MitoTracker RedCMXRo染色的线粒体,Merge是将Ns3141Δtp蛋白定位、细胞核定位和线粒体定位的三个图片叠加。
图5导肽连接在GFP蛋白N端的融合蛋白tp-GFP的亚细胞定位;绿色荧光为融合蛋白tp-GFP的定位,蓝色荧光代表DAPI染色的细胞核,红色荧光代表MitoTracker Red CMXRo染色的线粒体,Merge是将tp-GFP蛋白定位、细胞核定位和线粒体定位的三个图片叠加。
图6导肽连接在GFP蛋白C端的融合蛋白GFP-tp的亚细胞定位;绿色荧光为融合蛋白GFP-tp的定位,蓝色荧光代表DAPI染色的细胞核,红色荧光代表MitoTracker Red CMXRo染色的线粒体,Merge是将GFP-tp蛋白定位、细胞核定位和线粒体定位的三个图片叠加。
图7导肽tp的二级结构预测;h代表导肽tp的二级结构中α螺旋(Alpha helix)、c代表无规则卷曲(Random coil)、e代表扩展长链(Extended strand)、t代表β-转角(Betaturn)。
具体实施方式
为了更好的解释本发明的技术方案,下面结合附图详细介绍本发明的实施例。以下实施例用于进一步说明本发明,但不应理解为对本发明的固定或限制。若未特别指明,实施例中所用的技术特征可以替换为具有在不背离发明构思前提下等同或相似功能或效果的其他本领域已知的技术特征。
下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的试验材料,如无特殊说明,均为自常规生化试剂商店购买得到的。
FHM细胞:购自ATCC,目录号为CCL-42。
GS细胞:石斑鱼脾细胞系,由秦启伟教授研究团队建系成功。
HEK293-T细胞:购自ATCC,目录号为CRL-15730。
菌株与细胞:鰤鱼诺卡氏菌ZJ0503菌株从海水网箱养殖的患病卵形鲳鲹(Trachinotus ovatus)中分离到并由本实验室保存;质粒pEGFP-N1、pEGFP-C1、大肠杆菌受体菌DH5α由本实验室保存提供。
工具酶和主要试剂:KOD-Plus-NEO高保真聚合酶购自Toyobo公司;限制性核酸内切酶EcoRI,BamHI、XhoI,T4连接酶,DNA片段纯化试剂盒均购自TaKaRa公司;细菌基因组DNA提取试剂盒、DNA胶回收试剂盒购自Tiangen公司;PCR产物回收试剂盒购自TransGen生物技术有限公司;质粒微量提取试剂盒购自U-gene公司;无内毒素质粒提取试剂盒购自Omega公司;L-15细胞培养液、胰酶购自Gibco公司;转染试剂Lipofectamine 2000、Opti-MEM、线粒体红色荧光探针MitoTracker Red CMXRos购自Invitrogen公司;细胞核荧光染料DAPI购自Sigma公司;其它试剂均为国产分析纯。抗生素使用浓度为卡那霉素(Kan)50mg/mL。
实施例1:Ns3141蛋白线粒体定位性能的发现
根据鰤鱼诺卡氏菌(Nocardia seriolae)ZJ0503株全基因组序列(GenBank登录号NZ_JNCT01000022)进行生物信息学分析预测,主要使用的在线预测软件为LocTree 3和Singal 4.1,其中LocTree 3(https://rostlab.org/services/loctree3/)为蛋白亚细胞定位预测软件,其版权归Rostlab所有。SignalP 4.1(http://www.cbs.dtu.dk/services/SignalP/)采用几种人工神经网络相结合的方法,能够从氨基酸序列中,预测是否存在信号肽或导肽以及切割位点的位置。
针对鰤鱼诺卡氏菌ZJ0503株全基因组序列的生物信息学分析方法如下:1、使用LocTree 3软件,设置Domain选项为“Bacteria”,对鰤鱼诺卡氏菌ZJ0503株全基因组测序得到的7426个ORF进行原核生物的亚细胞定位分析,预测得到细菌的分泌蛋白;2、用Singal4.1Server,设置Organism group选项为“Gram-positive bacteria”、其他参数为默认项,分析预测所得分泌蛋白的信号肽/导肽,并找到信号肽/导肽切割位点;3、将去掉信号肽/导肽后的分泌蛋白氨基酸序列,使用LocTree 3软件,设置Domain选项为“Eukaryota”,进一步预测其在真核细胞中的亚细胞定位,得到可能靶向定位于线粒体的分泌蛋白。其中ORF3141编码一个功能未知的蛋白,我们命名其为Ns3141。LocTree3预测结果显示Ns3141蛋白很可能是一个靶向定位于宿主细胞线粒体的细菌分泌蛋白。Signal 4.1预测结果表明Ns3141的N末端有一段30个氨基酸(aa)的导肽(transit peptide,tp)。为了确定Ns3141蛋白的亚细胞定位,我们对Ns3141进行了基因克隆、表达载体构建和亚细胞定位研究。
一、全长Ns3141基因的克隆和表达载体的构建
1、鰤鱼诺卡氏菌基因组DNA的提取
参照夏洪丽等[6]方法,将鰤鱼诺卡氏菌接种于改良培养基平板上,28℃倒置培养24-36h。挑取适量的菌落于离心管中,使用细菌基因组DNA提取试剂盒(Tiangen)说明书进行细菌基因组DNA提取。-20℃保存备用。
2、Ns3141基因的PCR扩增
根据GenBank登录的鰤鱼诺卡氏菌ZJ0503全基因组(accession number:NZ_JNCT01000022)中Ns3141基因的序列(ORF3141,CDS Region in Nucleotide:NZ_JNCT01000022.112822-13379(-),Protein登录号:WP_033086993.1),采用Primer premier5.0设计引物,设计引物时考虑到真核生物与原核生物起始密码子的偏好性差异,将Ns3141基因的起始密码子由GTG突变为ATG。由生工生物工程(上海)股份有限公司合成相应的特异性引物,其上下游引物分别命名为:Ns3141F和Ns3141R。Ns3141基因的序列及蛋白序列参见SEQ ID NO.4与SEQ ID NO.3。SEQ ID NO.4在真核细胞中对应的编码序列为SEQ ID NO.6。
Ns3141F:5’-GGAATTCATGAAGCTGCTGAACCCGCG-3’
Ns3141R:5’-CGGGATCCCGCTTGCCCGGGCAGGCGTTC-3’
以鰤鱼诺卡氏菌基因组DNA为模板,使用Ns3141F和Ns3141R组成的引物对进行PCR扩增,得到PCR扩增产物。按照KOD-Plus-Neo高保真聚合酶说明书设置PCR扩增体系:10×PCR buffer 5μL,dNTPs(2mmol/L)5μL,MgSO4(25mmol/L)3μL,引物Ns3141F和Ns3141R(10μmol/L)各2μL,模板DNA 1μL,KOD-Plus-Neo高保真聚合酶(1U/μL)1μL,加ddH2O补足至50μL。
PCR扩增反应程序:98℃预变性2min;98℃变性10s、55℃退火15s、68℃延伸15s,共30个循环;68℃延伸5min。
PCR产物用1%琼脂糖凝胶电泳进行检测。
3、双酶切
用PCR回收试剂盒回收PCR扩增片段,用限制内切酶BamHI和EcoR I双酶切步骤2中的PCR回收产物(37℃酶切4小时),得到PCR酶切产物。同时,用限制内切酶BamHI和EcoR I双酶切质粒pEGFP-N1,回收4700bp左右的线性质粒DNA片段。
4、连接:
将步骤3的PCR酶切产物和pEGFP-N1线性DNA片段,用T4连接酶16℃连接过夜。
5、Ns3141重组质粒构建
将步骤4连接产物,转化DH5α感受态细胞,取100μL转化后DH5α菌液涂布于卡那抗性的LB培养平板上,37℃培养过夜。经菌落PCR鉴定,阳性克隆送生工生物工程(上海)股份有限公司测序。构建成功的重组质粒命名为pEGFP-Ns3141。
6、实验结果
用引物Ns3141F和Ns3141R进行鰤鱼诺卡氏菌Ns3141基因的高保真PCR扩增,扩增产物用1%的琼脂糖凝胶作电泳分析(图1),均得到长度大小约550bp的目标条带,与理论长度558bp结果相符合。成功构建重组质粒pEGFP-Ns3141,根据测序结果用ClustalX 2.1进行比对分析,结果显示重组质粒pEGFP-Ns3141的插入片段序列与鰤鱼诺卡氏菌Ns3141基因序列完全一致。
二、Ns3141蛋白的亚细胞定位研究
用重组质粒pEGFP-Ns3141分别转染不同细胞(FHM细胞、GS细胞或HEK293-T细胞),具体方法如下:
1、去内毒素质粒的提取
按Omega公司无内毒素质粒提取试剂盒说明书,提取无内毒素质粒pEGFP-N1、pEGFP-Ns3141。
2、转染
将FHM细胞,传代至24孔细胞培养板中,于25℃细胞培养箱中培养,待细胞约长满单层的70%开始转染。每孔转染需0.8μg质粒,2μL转染试剂(Lipofectamin 2000)。将质粒和转染试剂分别用Opti-MEM培养基稀释至50μL,两者混匀后静置25min。在静置期间,吸走培养板孔中的培养液,加入500μL无血清L-15细胞培养液。每孔加入100μL质粒和Lipofectamin 2000的混合液,轻摇培养板。25℃培养6h后,吸走混合液,加入500μL含有10%胎牛血清的L-15培养液,转染完成。
3、Ns3141的亚细胞定位
转染质粒pEGFP-Ns3141后48h,参照MitoTracker Red CMXRos说明书进行线粒体红色荧光探针染色和细胞核染色,具体步骤如下:吸出细胞培养液后,每孔加入125μL预热至28℃的MitoTracker Red CMXRos工作液(300nmol/L,使用无血清L-15细胞培养液稀释),于28℃避光孵育45min,染色结束后吸弃培养基及线粒体染色液,用PBS漂洗2-3次。用预热至室温的3.7%多聚甲醛避光固定30min,用PBS漂洗2-3次。用预冷至-20℃的冰乙醇透化细胞7min,用PBS漂洗2-3次。每孔加入200μL DAPI(1μg/mL)避光染细胞核10min,PBS漂洗3次后,在荧光显微镜(Leica)下观察拍照。实验以质粒pEGFP-N1为对照。
4、Ns3141亚细胞定位的实验结果
绿色荧光代表Ns3141-GFP融合蛋白,蓝色荧光代表DAPI染色的细胞核,红色荧光代表MitoTracker Red CMXRo染色的线粒体。荧光显微镜观察结果(图2)显示,转染pEGFP-Ns3141的细胞中,Ns3141-GFP融合蛋白绿色荧光呈团块状分布于细胞质中,与红色荧光所示的线粒体分布重合,说明Ns3141蛋白能靶向定位于线粒体。正常的线粒体的分布是围绕细胞核呈环状分布,而转染pEGFP-Ns3141会改变线粒体分布,使之呈团块状分布于细胞质。
实施例2:缺失导肽后Ns3141蛋白的亚细胞定位
生物信息学预测Ns3141的N末端有一段30个氨基酸的导肽(transit peptide,tp)。为了研究这段导肽对Ns3141蛋白亚细胞定位的影响,我们在Ns3141基因序列中缺失N末端90bp编码导肽的核苷酸序列,命名缺失导肽后的序列为Ns3141Δtp,并进行了Ns3141Δtp的基因克隆、表达载体构建和亚细胞定位研究。
一、全长Ns3141Δtp的基因克隆和表达载体的构建
1、Ns3141Δtp基因的PCR扩增
以实施例1中的鰤鱼诺卡氏菌总DNA为模板,用Ns3141ΔtpF和Ns3141ΔtpR组成的引物对进行PCR扩增,得到PCR扩增产物。
Ns3141ΔtpF:5’-GGAATTCATGGTCGAGGGTACCCCGACGGTC-3’
Ns3141ΔtpR:5’-CGGGATCCCGCTTGCCCGGGCAGGCGTTC-3’
PCR扩增体系(50μ1):10×PCR buffer 5μL,dNTPs(2mmol/L)5μL,MgSO4(25mmol/L)3μL,引物Ns3141ΔtpF和Ns3141ΔtpR(10μmol/L)各2μL,模板DNA 1μL,KOD-Plus-Neo高保真聚合酶(1U/μL)1μL,加ddH2O补足至50μL。
PCR扩增反应程序:98℃预变性2min;98℃变性10s、55℃退火15s、68℃延伸15s,共30个循环;68℃延伸5min。
高保真PCR产物用1%琼脂糖凝胶电泳进行检测。结果显示扩增产物得到一条大小约450bp的特异性条带,与理论长度468bp结果相符合(图3)。
2、重组质粒pEGFP-Ns3141Δtp的构建
双酶切、连接、重组质粒构建步骤依次同实施例1的步骤一的3至5。构建成功的重组质粒pEGFP-Ns3141Δtp,根据测序结果用ClustalX 2.1进行比对分析,结果显示重组质粒pEGFP-Ns3141的插入片段序列与鰤鱼诺卡氏菌Ns3141基因缺失90bp导肽编码序列后的序列完全一致。
二、Ns3141Δtp蛋白的亚细胞定位研究
用步骤一构建的重组质粒pEGFP-Ns3141Δtp转染FHM细胞,具体方法同实施例1的步骤二。
结果见图4,绿色荧光代表Ns3141Δtp-GFP融合蛋白,蓝色荧光代表细胞核,红色荧光代表线粒体。荧光显微镜观察结果显示,Ns3141Δtp-GFP融合蛋白绿色荧光呈全细胞分布,表明由于N端导肽的缺失,使Ns3141的亚细胞定位由团块状分布改变为全细胞分布。这说明N端导肽对Ns3141蛋白靶向定位于线粒体非常关键,很可能是一个具有线粒体定位功能的导肽。
实施例3:线粒体定位导肽的功能鉴定
将Ns3141这段N末端30个氨基酸的线粒体定位导肽命名为tp,为了研究tp是否具有将目标蛋白定位于线粒体的功能,将导肽连接在GFP蛋白的N端,融合基因tp-GFP自上游至下游依次包括编码导肽tp的核苷酸序列和编码GFP的基因序列。将含有tp-GFP融合基因的重组质粒导入靶细胞中,并进行亚细胞定位研究。
一、导肽tp的人工合成及重组质粒pEGFP-tp-GFP的构建
1、人工合成导肽tp的核苷酸序列
根据导肽tp的SEQ ID NO.5核苷酸序列和pEGFP-N1的酶切位点,人工合成105bp的导肽tp核苷酸序列。具体序列如下,其中2段加粗字体所示序列为SalI和BamHI的双酶切位点,阴影标出核苷酸为保护碱基(保护碱基的选择和数目与相应的限制性内切酶相关),下划线序列为tp的核苷酸序列。
2、重组质粒pEGFP-tp-GFP的构建
将步骤1中的人工合成导肽tp产物和质粒pEGFP-N1分别用限制性内切酶SalI和BamHI进行双酶切,其后的连接、重组质粒构建步骤依次同实施例1的步骤一的4至5。成功构建了重组质粒pEGFP-tp-GFP。根据测序结果,对重组质粒pEGFP-tp-GFP的结构特征描述为:在质粒pEGFP-N1的SalI和BamHI酶切位点之间插入SEQ ID NO.5所示的基因序列和编码绿色荧光蛋白GFP的基因序列所组成的融合片段,表达得到到tp和GFP的融合蛋白,简称tp-GFP。
二、tp-GFP蛋白的亚细胞定位研究
用步骤一构建的重组质粒pEGFP-tp-GFP转染FHM细胞,具体方法同实施例1的步骤二。
结果见图5,绿色荧光代表tp-GFP融合蛋白,蓝色荧光代表细胞核,红色荧光代表线粒体。荧光显微镜观察结果显示,tp-GFP融合蛋白绿色荧光呈团块状分布于细胞质中,且与红色荧光所示的线粒体分布重合。而在pEGFP转染细胞的对照组中,GFP呈全细胞分布,并未和线粒体分布重合。实验结果说明将导肽连接在GFP蛋白的N端,能将GFP蛋白靶向定位于线粒体。证明了序列表的SEQ ID NO.1所示多肽片段为具有线粒体定位功能的导肽,该导肽的编码序列具体如序列表的SEQ ID NO.5所示。
实施例4:线粒体定位导肽连接位置对其功能的影响
为了研究线粒体定位导肽tp的连接位置是否会影响其将目标蛋白定位于线粒体的功能,将导肽tp连接在GFP蛋白的C端,融合基因GFP-tp自上游至下游依次包括编码GFP的基因序列和编码导肽tp的核苷酸序列。将含有GFP-tp融合基因的重组质粒导入靶细胞中,并进行亚细胞定位研究。
一、导肽tp的人工合成及重组质粒pEGFP-GFP-tp的构建
1、人工合成导肽tp的核苷酸序列
根据导肽tp的SEQ ID NO.5核苷酸序列和pEGFP-C1的酶切位点,人工合成105bp的导肽tp核苷酸序列。具体序列如下,其中2段加粗字体所示序列为BglII和SalI的双酶切位点,阴影标出核苷酸为保护碱基兼终止密码子,下划线序列为tp的核苷酸序列。
2、重组质粒pEGFP-GFP-tp的构建
将步骤1中的人工合成导肽tp产物和质粒pEGFP-C1分别用限制性内切酶BglII和SalI进行双酶切,其后的连接、重组质粒构建步骤依次同实施例1的步骤一的4至5。成功构建了重组质粒pEGFP-GFP-tp。根据测序结果,对重组质粒pEGFP-GFP-tp的结构特征描述为:在质粒pEGFP-C1的BglII和SalI酶切位点之间插入SEQ ID NO.5所示的基因序列和编码绿色荧光蛋白GFP的基因序列所组成的融合片段,表达得到到GFP和tp的融合蛋白,简称GFP-tp。
二、GFP-tp蛋白的亚细胞定位研究
用步骤一构建的重组质粒pEGFP-GFP-tp转染FHM细胞,具体方法同实施例1的步骤二。
结果见图6,绿色荧光代表GFP-tp融合蛋白,蓝色荧光代表细胞核,红色荧光代表线粒体。荧光显微镜观察结果显示,线粒体分布于整个细胞质中,而GFP-tp融合蛋白呈团块状分布于细胞质中,并不与红色荧光所示的线粒体分布重合。而在pEGFP转染细胞的对照组中,GFP呈全细胞分布,线粒体主要分布于细胞质中。实验结果说明将导肽连接在GFP蛋白的C端,改变了导肽将GFP蛋白靶向定位于线粒体的功能。证明序列表SEQ ID NO.1所示具有线粒体定位功能的导肽需要链接在目标蛋白的N端,才能发挥其将目标蛋白定位于线粒体的功能。
综上所述,发明人鉴走得到了线粒体定位导肽序列,其证明了氨基酸序列如序列表的SEQ ID NO.1所示,该导肽的编码序列具体如序列表的SEQ ID NO.5所示。把该线粒体定位导肽链接到目的蛋白的N段,具有将目标蛋白定位于线粒体的功能。
实施例5:导肽突变体的功能预测
导肽的氨基酸组成具有以下特点:在长度和氨基酸序列上变化很大、具有高的等电点、其功能受到疏水性的限制,其立体结构与其功能紧密相关。通常是由疏水氨基酸、非电负性氨基酸构成,中间夹有碱性氨基酸,缺乏酸性氨基酸,羟基氨基酸含量高,至少两个带正电荷氨基酸,易形成双亲α螺旋轮(amphiphilic helix)。
以下是常见氨基酸分类:
表1常见氨基酸分类
一、导肽tp的理化性质和二级结构预测
我们根据导肽tp的氨基酸序列(SEQ ID NO.1)组成,对其理化性质和二级结构进行了预测。实验方法如下:
1、导肽理化性质预测,使用在线软件ExPASy-ProtParam(http://web.expasy.org/cgi-bin/protparam/protparam),结果见表2,表明导肽tp的疏水氨基酸含量为56.67%,疏水值为1.050,是疏水蛋白(疏水值大于0,为疏水蛋白;疏水值小于0,为亲水蛋白);含有2个带正电荷氨基酸(碱性氨基酸)R和K,等电点pI为8.94;羟基氨基酸含量为6.67%;不稳定系数为-2.30,为稳定性蛋白(不稳定系数小于40为稳定蛋白;大于40为不稳定蛋白)。值得注意的是导肽tp含有高比例(56.67%)的疏水氨基酸、为疏水蛋白,短短的30个氨基酸的导肽就出现了2个带正电荷氨基酸、等电点pI高达8.94,这些特点很可能与其功能紧密相关。
表2 SEQ ID NO.1的理化性质预测
2、由于30个氨基酸的序列太短,无法使用软件进行三级结构预测,因此主要对导肽tp的二级结构进行了预测,使用了以下在线软件NPS server(https://npsa-prabi.ibcp.fr/cgi-bin/secpred_sopma.pl)。结果显示导肽tp的二级结构中α螺旋(Alphahelix,h)占43.33%(表2)、无规则卷曲(Random coil,c)占26.67%、扩展长链(Extendedstrand,e)占20%、β-转角(Beta turn,t)占10%(图7)。鉴于其高比例(43.33%)α螺旋的结构特点,推测导肽tp的α螺旋结构区域对其功能有重要作用。
二、导肽tp突变体的分析预测
推测导肽tp的疏水氨基酸比例、α螺旋结构区域所占比例以及带正电荷氨基酸的个数对其功能有重要作用,我们对针对导肽tp的疏水氨基酸、α螺旋结构区域、带正电荷氨基酸分别进行了缺失、添加、取代等突变,并对导肽tp突变体的理化性质进行分析预测。通过将各导肽突变体的氨基酸序列输入ExPASy(http://web.expasy.org/protparam/)在线预测突变导肽的不稳定性系数(Instability index)、疏水性(Grand average ofhydropathicity,GRAVY)和等电点(pI)等理化性质。利用NPS server(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=n psa_sopma.html)预测导肽突变体的二级结构,记录α螺旋(Alpha helix)比例。具体方法如下:
1、导肽的功能受到疏水性的限制,必须为疏水蛋白。对导肽tp的疏水性氨基酸进行突变,并分析预测其理化性质,实验结果见表3。表中的序列0为导肽tp的原始序列,下划线部分为增添的氨基酸,阴影部分为替换的氨基酸。结果表明保持序列含有2个带电荷氨基酸的前提下,随着疏水氨基酸比例的降低,导肽tp突变体的疏水性呈下降的趋势、α螺旋比例也呈下降趋势。当导肽tp突变体疏水氨基酸比例下降到35.9%时(突变体7),其疏水值变为0,这意味着该突变体已经不是疏水蛋白,丧失了导肽的功能。当导肽tp突变体疏水氨基酸比例小于30%时(突变体8、9、10),其疏水值小于0,成为亲水蛋白,不具备导肽的功能。我们认为要保持导肽的线粒体定位功能,其疏水氨基酸比例应大于35%。
表3导肽tp疏水氨基酸的突变及其理化性质
注:下划线部分为增添的氨基酸;阴影部分为替换的氨基酸。
2、导肽易形成α螺旋结构,α螺旋比例与其功能及稳定性相关。对导肽tp进行氨基酸突变来改变其α螺旋比例,并分析预测突变体的稳定性,实验结果见表4。表中的序列0为导肽tp的原始序列,下划线部分为增添的氨基酸,阴影部分为替换的氨基酸。结果表明保持序列含有2个带电荷氨基酸的前提下,随着α螺旋比例的降低,导肽的不稳定系数呈上升趋势,即趋向于不稳定。当导肽tp突变体α螺旋比例下降到30.56%时(突变体7),其不稳定系数为39.98,已接近不稳定蛋白系数的临界值(40),这意味着该突变体此时很可能是不稳定的,很难执行导肽的功能。当导肽tp突变体α螺旋比例进一步降低时,其不稳定系数大于40,为不稳定蛋白。我们认为要保持导肽的稳定性并执行其线粒体定位功能,其α螺旋比例应大于30%。
表4导肽tp突变改变α螺旋比例后的不稳定性系数变化
注:下划线部分为增添的氨基酸;阴影部分为替换的氨基酸。
3、导肽至少两个带正电荷氨基酸、具有高的等电点。细胞中pH值接近于7.4,当蛋白pI>环境pH时,该蛋白质带正电荷,因此导肽在细胞环境中应是带正电荷性质的。对导肽tp进行氨基酸突变来改变其带正电荷氨基酸的数目,并分析预测突变体的等电点,实验结果见表5。表中的序列0为导肽tp的原始序列,下划线部分为增添的氨基酸。结果表明当导肽tp突变体序列中带正电荷氨基酸数目≧2个时,其等电点≧8.94,在细胞中带有正电荷;当导肽突变体中带正电荷氨基酸数目为1时,其等电点为7.83,在细胞中可能不带电荷;当导肽突变体中带正电荷氨基酸数目为0时,其等电点为5.27,在细胞中带有负电荷,很难执行导肽的线粒体定位功能。我们认为要保持导肽在细胞环境中带正电荷并执行其功能,其氨基酸序列中至少应含2个正电荷氨基酸。
表5导肽tp突变改变带电荷氨基酸数目后的等电点变化
注:下划线部分为增添的氨基酸。
以上各个实施例只是用于进一步说明本发明,并不是用来限制本发明的保护范围,凡是基于本发明的构思所作出的等同变换及对本发明的各个技术方案显而易见的改进,均落入本发明的保护范围。
序列表
<110> 广东海洋大学
广东海洋大学深圳研究院
<120> 一种线粒体定位导肽及其发现方法与应用
<141> 2018-11-09
<160> 18
<170> SIPOSequenceListing 1.0
<210> 1
<211> 30
<212> PRT
<213> 鰤鱼诺卡氏菌(Nocardia seriolae)
<400> 1
Met Lys Leu Leu Asn Pro Arg Gly Phe Gly Leu Val Cys Ala Ser Ala
1 5 10 15
Ala Val Ala Ala Gly Leu Met Leu Ala Gly Cys Ala Asn Thr
20 25 30
<210> 2
<211> 90
<212> DNA
<213> 鰤鱼诺卡氏菌(Nocardia seriolae)
<400> 2
gtgaagctgc tgaacccgcg ggggttcgga ttggtttgcg catccgcggc cgtggcggcg 60
gggttgatgc tggcgggctg cgcgaacacg 90
<210> 3
<211> 185
<212> PRT
<213> 鰤鱼诺卡氏菌(Nocardia seriolae)
<400> 3
Met Lys Leu Leu Asn Pro Arg Gly Phe Gly Leu Val Cys Ala Ser Ala
1 5 10 15
Ala Val Ala Ala Gly Leu Met Leu Ala Gly Cys Ala Asn Thr Val Glu
20 25 30
Gly Thr Pro Thr Val Asp Gln Ala Gln Val Thr Ser Tyr Arg Ala Glu
35 40 45
Val Ser Ser Ser Ala Ala Ala Ala Ser Ser Ser Lys Ala Ala Ala Gln
50 55 60
Val Ala Lys Ala Thr Ala Asp Asn Cys Asp Pro Phe Arg Lys Thr Ala
65 70 75 80
Gly Thr Ala Val Asp Arg Tyr Asn Glu Phe Val Asp Ala His Asp Ala
85 90 95
Ser Ala Ala Asp Gln Val Ala Lys Arg Asp Ala Ala Ala Gly Ala Leu
100 105 110
Glu Asp Ala Ala Lys Thr Ile Glu Thr Glu Leu Asn Ala Thr Arg Ala
115 120 125
Asp Leu Pro Ala Asp Leu Ala Gly Lys Leu Thr Asp Tyr Val Asn Ala
130 135 140
Ala Arg Ser Leu Ala Ala Glu Ile Arg Lys Met Ser Gly Gly Ser Ser
145 150 155 160
Val Ala Pro Leu Asn Asp Ala Ser Lys Lys Val Asn Asp Ala Leu Thr
165 170 175
Ala Val Arg Asn Ala Cys Pro Gly Lys
180 185
<210> 4
<211> 558
<212> DNA
<213> 鰤鱼诺卡氏菌(Nocardia seriolae)
<400> 4
gtgaagctgc tgaacccgcg ggggttcgga ttggtttgcg catccgcggc cgtggcggcg 60
gggttgatgc tggcgggctg cgcgaacacg gtcgagggta ccccgacggt cgatcaggct 120
caggtgacct cgtaccgggc cgaggtgtcc tcgtccgcgg cggccgccag ttcgtccaag 180
gccgcggcgc aggtcgccaa ggccacggcc gacaactgcg atccgttccg caagaccgcc 240
gggaccgcgg tcgaccgcta caacgagttc gtggacgcgc acgacgccag cgccgcggac 300
caagtggcga agcgggacgc ggcggccggg gcgctcgagg acgcggcgaa gacgatcgag 360
accgagttga acgcgacccg ggcggatctg cccgccgatc tcgcgggcaa gctcaccgac 420
tatgtgaacg cggcgcgctc gctggccgcg gagatccgga agatgtcggg cgggtcgtcg 480
gtggcgccgc tgaacgacgc gagcaagaag gtcaacgacg ctctaaccgc tgttcggaac 540
gcctgcccgg gcaagtga 558
<210> 5
<211> 90
<212> DNA
<213> 鰤鱼诺卡氏菌(Nocardia seriolae)
<400> 5
atgaagctgc tgaacccgcg ggggttcgga ttggtttgcg catccgcggc cgtggcggcg 60
gggttgatgc tggcgggctg cgcgaacacg 90
<210> 6
<211> 558
<212> DNA
<213> 鰤鱼诺卡氏菌(Nocardia seriolae)
<400> 6
atgaagctgc tgaacccgcg ggggttcgga ttggtttgcg catccgcggc cgtggcggcg 60
gggttgatgc tggcgggctg cgcgaacacg gtcgagggta ccccgacggt cgatcaggct 120
caggtgacct cgtaccgggc cgaggtgtcc tcgtccgcgg cggccgccag ttcgtccaag 180
gccgcggcgc aggtcgccaa ggccacggcc gacaactgcg atccgttccg caagaccgcc 240
gggaccgcgg tcgaccgcta caacgagttc gtggacgcgc acgacgccag cgccgcggac 300
caagtggcga agcgggacgc ggcggccggg gcgctcgagg acgcggcgaa gacgatcgag 360
accgagttga acgcgacccg ggcggatctg cccgccgatc tcgcgggcaa gctcaccgac 420
tatgtgaacg cggcgcgctc gctggccgcg gagatccgga agatgtcggg cgggtcgtcg 480
gtggcgccgc tgaacgacgc gagcaagaag gtcaacgacg ctctaaccgc tgttcggaac 540
gcctgcccgg gcaagtga 558
<210> 7
<211> 21
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 7
Met Lys Leu Leu Arg Phe Leu Val Ala Ser Ala Ala Val Ala Ala Leu
1 5 10 15
Met Leu Ala Ala Thr
20
<210> 8
<211> 24
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 8
Met Lys Leu Leu Asn Pro Arg Phe Leu Val Ala Ser Ala Ala Val Ala
1 5 10 15
Ala Leu Met Leu Ala Ala Asn Thr
20
<210> 9
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 9
Met Lys Leu Leu Asn Pro Arg Phe Leu Val Cys Ala Ser Ala Ala Val
1 5 10 15
Ala Ala Gly Leu Met Leu Ala Gly Cys Ala Asn Thr
20 25
<210> 10
<211> 31
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 10
Met Lys Leu Cys Leu Asn Pro Arg Gly Phe Gly Leu Val Cys Ala Ser
1 5 10 15
Ala Ala Val Ala Ala Gly Leu Met Leu Ala Gly Cys Ala Asn Thr
20 25 30
<210> 11
<211> 31
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 11
Met Lys Leu Leu Asn Pro Arg Gly Phe Gly Leu Val Cys Ala Ser Asn
1 5 10 15
Ala Ala Val Ala Ala Gly Leu Met Leu Ala Gly Cys Ala Asn Thr
20 25 30
<210> 12
<211> 37
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 12
Met Lys Leu Leu Asn Pro Arg Gly Phe Gly Leu Val Cys Ala Ser Asn
1 5 10 15
Asn Asn Asn Asn Asn Asn Ala Ala Val Ala Ala Gly Leu Met Leu Ala
20 25 30
Gly Cys Ala Asn Thr
35
<210> 13
<211> 26
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 13
Met Lys Leu Leu Asn Pro Arg Phe Leu Val Ala Ser Ala Ala Val Ala
1 5 10 15
Ala Leu Met Leu Ala Gly Cys Ala Asn Thr
20 25
<210> 14
<211> 22
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 14
Met Lys Leu Leu Asn Pro Arg Val Cys Ala Ser Val Ala Ala Gly Leu
1 5 10 15
Ala Gly Cys Ala Asn Thr
20
<210> 15
<211> 29
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 15
Met Lys Leu Leu Pro Arg Gly Phe Gly Leu Val Cys Ala Ser Ala Ala
1 5 10 15
Val Ala Ala Gly Leu Met Leu Ala Gly Cys Ala Asn Thr
20 25
<210> 16
<211> 39
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 16
Met Lys Leu Leu Asn Pro Asn Asn Arg Gly Phe Gly Leu Val Cys Asn
1 5 10 15
Glu Ala Ser Ala Ala Val Asn Glu Asn Ala Ala Gly Leu Met Leu Ala
20 25 30
Glu Glu Gly Cys Ala Asn Thr
35
<210> 17
<211> 30
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 17
Met Lys Leu Leu Asn Pro Arg Gly Phe Gly Leu Asn Glu Glu Ser Ala
1 5 10 15
Ala Val Ala Ala Gly Leu Met Leu Ala Gly Cys Ala Asn Thr
20 25 30
<210> 18
<211> 38
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 18
Met Lys Leu Leu Asn Pro Arg Glu Glu Glu Glu Gly Phe Gly Leu Val
1 5 10 15
Cys Ala Ser Asn Asn Asn Asn Ala Ala Val Ala Ala Gly Leu Met Leu
20 25 30
Ala Gly Cys Ala Asn Thr
35

Claims (9)

1.一种线粒体定位导肽,所述的导肽选自如下序列:
(a)由SEQ ID NO.l所示的氨基酸序列组成的多肽:
(b)由SEQ ID NO.3所示的氨基酸序列前31至前185位中任意整数个数氨基酸组成的多肽:
(c)由SEQ ID NO.3所示的氨基酸序列第31至第185位发生插入、删除和/或取代突变组成的多肽:
(d)由SEQ ID NO.l所示的氨基酸序列上下游独立或共同减少1个、2个或3个氨基酸组成的多肽:
(e)将SEQ ID NO.1所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有线粒体定位导肽功能的衍生多肽;
(f)由SEQ ID NO.l所示的氨基酸序列C段融合1-50个氨基酸残基组成的多肽:
(g)由SEQ ID NO.l所示的氨基酸序列保持至少两个带正电的氨基酸不变的突变体组成的多肽:
(h)由SEQ ID NO.l所示的氨基酸序列保持至少两个带正电的氨基酸并且疏水氨基酸比例大于35.9%的突变体组成的多肽:
(i)由SEQ ID NO.l所示的氨基酸序列保持至少两个带正电的氨基酸并且α螺旋比例大于30.56%的突变体组成的多肽:
(j)由SEQ ID NO.7-SEQ ID NO.18中任一条所示的氨基酸序列组成的多肽。
2.一种融合蛋白,所述融合蛋白包括如权利要求1所述的线粒体定位导肽和目标蛋白,所述线粒体定位导肽位于所述目标蛋白的N端;
可选地,所述目标蛋白是荧光蛋白,优选,所述目标蛋白是绿色荧光蛋白。
3.一种基因序列,所述基因序列编码权利要求1所述的线粒体定位导肽的基因序列或权利要求2所述的融合蛋白的基因序列;
可选,所述基因序列选自SEQ ID NO.2、SEQ ID NO.4、SEQ ID NO.5和SEQ ID NO.6。
4.一种重组表达载体,所述重组表达载体含有权利要求3所述的基因序列。
5.一种宿主细胞,所述宿主细胞含有如权利要求4所述的重组表达载体。
6.一种权利要求1所述的线粒体定位导肽、权利要求2所述的融合蛋白、权利要求3所述的基因序列、如权利要求4所述的重组表达载体或如权利要求5所述的宿主细胞在将目标蛋白定位于线粒体中的应用。
7.一种将目标蛋白定位于线粒体的方法,其特征在于包括以下步骤:
(a)将权利要求3所述的融合蛋白的基因导入靶细胞中,从而将所述目标蛋白定位于所述靶细胞的线粒体上;所述融合基因自上游至下游依次包括编码导肽的基因序列和编码目标蛋白的基因序列;或
(b)将如权利要求2所述的融合蛋白加入靶细胞生长环境中,从而使目标蛋白跨过靶细胞的细胞膜进入所述靶细胞中,并最终定位于靶细胞的线粒体上;所述外源融合蛋白自N端至C端依次包括线粒体定位导肽和目标蛋白的氨基酸序列;
优选,所述的靶细胞为真核细胞。
8.一种权利要求1所述的线粒体定位导肽或权利要求2所述的融合蛋白在制备治疗遗传病、恶性肿瘤、血液病,病毒、寄生虫、细菌感染的疫苗、药物或药物组合物中的应用。
9.一种从细菌中筛选真核生物的细胞器定位导肽的方法,所述方法包括如下步骤:
(1)获取细菌全基因组序列或部分基因组序列;
(2)获取细菌所有所述基因组序列的蛋白组序列;
(3)对所述蛋白组序列进行生物信息分析,包括:
(a)预测所述蛋白组序列中每种蛋白的亚细胞定位,获得软件预测的具有亚细胞定位功能的蛋白质;和/或
(b)预测所述蛋白组序列中每种蛋白是否存在信号肽或导肽以及切割位点的位置,获得软件预测的细胞器定位导肽和/或分泌蛋白的序列;
可选地,所述方法还包括如下步骤:
(4)在所述真核细胞中对所述软件预测的具有亚细胞定位功能的蛋白质或所述软件预测的细胞器定位导肽进行功能验证;
优选地,步骤(a)是通过LocTree 3软件执行的;
优选地,步骤(b)是通过Signal 4.1软件执行的;
优选地,步骤(4)选自:
(i)对步骤(a)中所述软件预测的具有亚细胞定位功能的蛋白质进行与标签蛋白融合,用所述融合蛋白转染所述真核细胞,检测或验证所述融合蛋白的细胞器定位;
(ii)对步骤(a)中所述软件预测的具有亚细胞定位功能的蛋白质进行人工突变后进行与标签蛋白融合,用所述融合蛋白转染所述真核细胞,检测或验证所述融合蛋白的细胞器定位;
(iii)对步骤(b)中所述软件预测的细胞器定位导肽进行与标签蛋白融合,用所述融合蛋白转染所述真核细胞,检测或验证所述融合蛋白的细胞器定位;
(iv)对步骤(b)中所述软件预测的细胞器定位导肽进行人工突变后进行与标签蛋白融合,用所述融合蛋白转染所述真核细胞,检测或验证所述融合蛋白的细胞器定位;
(v)对步骤(a)中所述软件预测的具有亚细胞定位功能的蛋白质删除步骤(b)中所述软件预测的细胞器定位导肽后进行与标签蛋白融合,用所述融合蛋白转染所述真核细胞,检测或验证所述融合蛋白的细胞器定位;
(vi)用步骤(a)中所述软件预测的具有亚细胞定位功能的蛋白质转染所述真核细胞,检测或验证所述软件预测的具有亚细胞定位功能的蛋白质的细胞器定位;
优选地,所述真核生物是所述细菌的宿主;
优选地,所述细胞器为线粒体;
优选地,所述细菌是鰤鱼诺卡氏菌;
优选地,所述宿主是鰤鱼;
优选地,所述真核细胞是FHM细胞、GS细胞、石斑鱼脾细胞系或HEK293-T细胞;
优选地,所述标签蛋白为荧光蛋白,更优选地,所述标签蛋白为绿色荧光蛋白。
CN201811330295.3A 2018-11-09 2018-11-09 一种线粒体定位导肽及其发现方法与应用 Active CN109575116B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811330295.3A CN109575116B (zh) 2018-11-09 2018-11-09 一种线粒体定位导肽及其发现方法与应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811330295.3A CN109575116B (zh) 2018-11-09 2018-11-09 一种线粒体定位导肽及其发现方法与应用

Publications (2)

Publication Number Publication Date
CN109575116A true CN109575116A (zh) 2019-04-05
CN109575116B CN109575116B (zh) 2022-04-22

Family

ID=65921853

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811330295.3A Active CN109575116B (zh) 2018-11-09 2018-11-09 一种线粒体定位导肽及其发现方法与应用

Country Status (1)

Country Link
CN (1) CN109575116B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113150072A (zh) * 2021-05-18 2021-07-23 清华大学 一种调节蛋白在细胞器中精确定位的信号肽及其编码序列和应用
CN114057893A (zh) * 2021-04-26 2022-02-18 苏州大学 一种编码线粒体定位的豆蔻酰化多肽及其制备方法与应用
CN114085280A (zh) * 2021-11-25 2022-02-25 中国人民解放军国防科技大学 一种实现外源蛋白在哺乳动物细胞内可控胞质、核质定位的方法及其应用
WO2023087823A1 (zh) * 2021-11-19 2023-05-25 上海生物芯片有限公司 一种线粒体定位多肽、定位系统及其应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003012050A2 (en) * 2001-07-31 2003-02-13 Northeastern University Mitochondrial genome replenishment
US20040072774A1 (en) * 2002-02-23 2004-04-15 Giovanni Manfredi Methods for expressing and targeting mitochondrial-DNA-encoded peptides and uses thereof
CN1788092A (zh) * 2001-11-05 2006-06-14 研究发展基金会 构建分泌细菌重组蛋白的前导肽
CN105085641A (zh) * 2015-09-18 2015-11-25 中国水产科学研究院黄海水产研究所 一种细胞膜定位信号肽及其编码序列和应用
CN107056899A (zh) * 2017-05-31 2017-08-18 郑州大学第附属医院 一种细胞膜定位信号肽及其编码基因和应用

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003012050A2 (en) * 2001-07-31 2003-02-13 Northeastern University Mitochondrial genome replenishment
CN1788092A (zh) * 2001-11-05 2006-06-14 研究发展基金会 构建分泌细菌重组蛋白的前导肽
US20040072774A1 (en) * 2002-02-23 2004-04-15 Giovanni Manfredi Methods for expressing and targeting mitochondrial-DNA-encoded peptides and uses thereof
CN105085641A (zh) * 2015-09-18 2015-11-25 中国水产科学研究院黄海水产研究所 一种细胞膜定位信号肽及其编码序列和应用
CN107056899A (zh) * 2017-05-31 2017-08-18 郑州大学第附属医院 一种细胞膜定位信号肽及其编码基因和应用

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
GENBANK: "Nocardia seriolae strain EM150506, complete genome", 《GENBANK》 *
M G CLAROS: "Computational method to predict mitochondrially imported proteins and their targeting sequences", 《EUROPEAN JOURNAL OF BIOCHEMISTRY》 *
OLOF EMANUELSSON等: "ChloroP, a neural network-based method for predicting chloroplast transit peptides and their cleavage sites", 《PROTEIN SCIENCE》 *
夏立群等: "鰤鱼诺卡氏菌DmpA基因的克隆及亚细胞定位研究", 《生物技术通报》 *
李立奇等: "蛋白质的亚细胞定位预测研究进展", 《免疫学杂志》 *
楚雍烈等: "《医用生物信息学概论》", 31 October 2005, 陕西科学技术出版社 *
潘婷等: "N-端结构域决定拟南芥KEA1和KEA2的亚细胞定位及定位与功能的关系", 《中国科技论文》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114057893A (zh) * 2021-04-26 2022-02-18 苏州大学 一种编码线粒体定位的豆蔻酰化多肽及其制备方法与应用
CN114057893B (zh) * 2021-04-26 2022-12-30 苏州大学 一种编码线粒体定位的豆蔻酰化多肽及其制备方法与应用
CN113150072A (zh) * 2021-05-18 2021-07-23 清华大学 一种调节蛋白在细胞器中精确定位的信号肽及其编码序列和应用
WO2023087823A1 (zh) * 2021-11-19 2023-05-25 上海生物芯片有限公司 一种线粒体定位多肽、定位系统及其应用
CN114085280A (zh) * 2021-11-25 2022-02-25 中国人民解放军国防科技大学 一种实现外源蛋白在哺乳动物细胞内可控胞质、核质定位的方法及其应用

Also Published As

Publication number Publication date
CN109575116B (zh) 2022-04-22

Similar Documents

Publication Publication Date Title
CN109575116A (zh) 一种线粒体定位导肽及其发现方法与应用
US5922583A (en) Methods for production of recombinant plasmids
AU2007210396B2 (en) Production of a soluble native form of recombinant protein by the signal sequence and secretional enhancer
Sykes et al. Linear expression elements: a rapid, in vivo, method to screen for gene functions
CN107124889A (zh) 人工核酸分子
CN108912221A (zh) 用于生产重组融合蛋白的辅助蛋白、编码基因、重组融合蛋白、重组表达载体及制备方法
WO2024002149A1 (zh) 一种重组iii型胶原蛋白及其制备方法
Mehrlatifan et al. The structural HCV genes delivered by MPG cell penetrating peptide are directed to enhance immune responses in mice model
CA1341015C (en) Outer membrane protein f of pseudomonas aeruginosa
Deng et al. Co-expressing GroEL–GroES, Ssa1–Sis1 and Bip–PDI chaperones for enhanced intracellular production and partial-wall breaking improved stability of porcine growth hormone
CN108314718A (zh) 一种家蝇抗菌肽maf-1a肽聚体、其编码基因及其表达和应用
Razis et al. The periplasmic expression of recombinant human epidermal growth factor (hEGF) in Escherichia coli
CN113372452B (zh) 一种细粒棘球绦虫重组蛋白CTLA4-IgV-EgG1Y162及其应用
CN102597262A (zh) 产生用于降低患布鲁氏菌病的风险的免疫应答
CN110819645B (zh) 锦鲤Gtpch2基因、编码蛋白及其应用
US11203760B2 (en) Gene therapy DNA vector GDTT1.8NAS12 and the method for obtaining thereof
CN110372780B (zh) 抗肿瘤多肽及其在抗肿瘤领域的应用
CN109535262B (zh) TrxA-Defensin融合蛋白、制备方法及其进一步制备得到的防御素蛋白和应用
CN105017399A (zh) 日本血吸虫SjPPase重组抗原蛋白及其制备方法和用途
CN106699900A (zh) CHO细胞高效表达TD‑bFGF融合蛋白的构建方法和应用
CN115867662A (zh) 形成三聚体的新型冠状病毒肺炎(covid-19)重组刺突蛋白、在植物中大量产生重组刺突蛋白的方法和基于其制备疫苗组合物的方法
US20210310021A1 (en) Gene therapy based on vector vtvaf17
CN108794645A (zh) 一种由牛白蛋白、牛干扰素γ和牛干扰素α组成的融合蛋白及其制备方法
RU2801597C1 (ru) Искусственная генетическая конструкция для гетерологической экспрессии рецептор-связывающего домена S-белка в слитной полипептидной цепи с нуклеокапсидным белком
CN108840941A (zh) 一种重组羊长效干扰素γ及制备此长效干扰素γ的融合蛋白及其制备方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant