CN116813797A - 一种融合蛋白的组合物、包含其的基于生存压力的负向筛选系统 - Google Patents

一种融合蛋白的组合物、包含其的基于生存压力的负向筛选系统 Download PDF

Info

Publication number
CN116813797A
CN116813797A CN202310745661.6A CN202310745661A CN116813797A CN 116813797 A CN116813797 A CN 116813797A CN 202310745661 A CN202310745661 A CN 202310745661A CN 116813797 A CN116813797 A CN 116813797A
Authority
CN
China
Prior art keywords
protein
domain
fusion
fusion protein
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310745661.6A
Other languages
English (en)
Inventor
刘翔宇
徐涛
何国栋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Hongling Longcheng Technology Co ltd
Tsinghua University
Original Assignee
Beijing Hongling Longcheng Technology Co ltd
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Hongling Longcheng Technology Co ltd, Tsinghua University filed Critical Beijing Hongling Longcheng Technology Co ltd
Priority to CN202310745661.6A priority Critical patent/CN116813797A/zh
Publication of CN116813797A publication Critical patent/CN116813797A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/72Receptors; Cell surface antigens; Cell surface determinants for hormones
    • C07K14/723G protein coupled receptor, e.g. TSHR-thyrotropin-receptor, LH/hCG receptor, FSH receptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/02Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
    • C12Q1/025Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/55Fusion polypeptide containing a fusion with a toxin, e.g. diphteria toxin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/85Saccharomyces
    • C12R2001/865Saccharomyces cerevisiae
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/37Assays involving biological materials from specific organisms or of a specific nature from fungi
    • G01N2333/39Assays involving biological materials from specific organisms or of a specific nature from fungi from yeasts

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Toxicology (AREA)
  • Plant Pathology (AREA)
  • Mycology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Cell Biology (AREA)
  • Endocrinology (AREA)
  • Analytical Chemistry (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本公开涉及融合蛋白的组合物、包含其的基于生存压力的负向筛选系统,具体涉及融合蛋白的组合物、融合蛋白、重组核酸分子、重组表达载体、重组酵母菌株、基于生存压力的负向筛选系统、高通量筛选装置及用途,用于构建重组酵母菌株的方法,药物筛选的方法。本公开的融合蛋白I与融合蛋白II,将报告蛋白拆分为两个结构域后分别与GPCR及G蛋白融合形成,报告蛋白为具有细胞毒性的蛋白。融合蛋白的组合物用于药物筛选可反馈激活的GPCR或激活的GPCR由于激活效果被竞争性减弱或消除产生的报告信号,以筛选GPCR药物,不需要经过酵母内转录调控和级联放大过程,信号更加真实可信,具有灵敏度高、受非正交信号干扰少、可靠性高等优势。

Description

一种融合蛋白的组合物、包含其的基于生存压力的负向筛选 系统
技术领域
本公开属于生物医药技术领域,涉及融合蛋白的组合物、包含其的基于生存压力的负向筛选系统。具体来说,本公开涉及一种融合蛋白的组合物、融合蛋白、重组核酸分子、重组表达载体、重组酵母菌株、基于生存压力的负向筛选系统、高通量筛选装置及用途,以及用于构建重组酵母菌株的方法,药物筛选的方法。
背景技术
G蛋白偶联受体(G Protein Coupled Receptor),简称GPCR,是真核生物目前已知的最大的膜蛋白受体超家族,据报道,在人体基因组中有超过800个不同亚型的GPCR2。它们广泛分布于人体多种组织器官,感知包括激素、神经递质、多肽和蛋白等多种胞外信号分子的刺激,并介导细胞内下游信号转导通路,与人体多种代谢活动密切相关。因此,GPCR也被认为是最重要的药物靶点之一,目前FDA已经批准上市的药物中已有超过1/3的靶向各类GPCR3,例如β-阻滞剂(β-blocker)作为β肾上腺素受体的拮抗剂,广泛用于心血管疾病的治疗。筛选针对特定GPCR的激动剂或拮抗剂药物具有很强的研究价值和应用前景。目前已有的GPCR药物筛选方法主要包括针对受体-配体相互作用的筛选方法(如利用表面等离子共振技术的筛选方法)4、基于受体功能的间接筛选方法(如通过检测G蛋白下游CAMP或钙离子等的筛选方法)5以及以虚拟筛选6为代表的基于结构的筛选方法。传统的GPCR药物筛选方法往往存在不同的局限性,比如基于亲和力的表面等离子共振筛选方法要求对靶点GPCR进行表达和纯化,而许多GPCR由于自身性质不稳定,很难在体外获得性质稳定且有功能的蛋白样品,并且通过此方法筛选得到的小分子的功能是未知的,需要进一步鉴定。基于受体细胞信号转导功能的筛选方法也存在以下局限性,首先哺乳动物细胞培养成本较高并且对于常用有机溶剂二甲基亚砜(DMSO)非常敏感,高浓度的溶剂会对细胞状态产生较大影响从而使得结果信噪比较差;其次,由于哺乳动物细胞具有复杂的各级信号转导通路,这些信号通路往往与GPCR下游信号通路相互关联,因此也会有较多假阳性的出现;最后,基于受体信号转导功能的筛选方法往往以荧光(Fluorescence)或者生物发光(Luminescence)作为信号,存在信号窗口时间短、信号不稳定、检测设备要求高等问题。这些问题限制了传统方法对于GPCR配体的筛选和鉴定。
为了解决传统方法检测荧光信号或生物发光信号存在的局限性,在申请人前期工作中,开发了基于酵母生长速率汇报目的GPCR激活的基于生存压力的筛选(SurvivalPressure Selection,SPS)方法(专利名称为“基于生存压力的筛选系统及高通量筛选装置”,CN115925970A)。该方法实现了通过激活目的GPCR促进酵母生长,更适合用于筛选目的GPCR的激动剂药物。
然而,仍有待开发新的GPCR药物筛选系统及方法,尤其是针对GPCR拮抗剂的药物筛选系统及方法,以提高GPCR药物筛选的灵敏度,减少药物筛选的假阳性结果。
发明内容
发明要解决的问题
针对以上这些已有方法的局限性,本公开开发出了一套以酿酒酵母为宿主细胞的基于功能的筛选系统,用于直接筛选靶点GPCR的拮抗剂药物。
用于解决问题的方案
为了开发更适合筛选目的GPCR拮抗剂药物的方法,本公开需要实现通过抑制目的GPCR促进酵母生长。因此,本公开构建了基于生存压力的负向筛选体系(negativesurvival pressure selection system,nSPS system),将GPCR蛋白的激活信号呈现为一类具有细胞毒性的蛋白的功能性重组,通过检测酵母生长速度差异表征能够通过抑制GPCR激活从而阻止该毒性蛋白功能性重组的化合物,从而寻找靶点GPCR的拮抗剂。
本公开通过以下技术方案实现上述目的:
[1].一种融合蛋白的组合物,其中,所述组合物包括各自独立地存在的如下(i)所示的融合蛋白I与如下(iv)所示的融合蛋白II;或者,所述组合物包括各自独立地存在的如下(ii)所示的融合蛋白I与如下(iii)所示的融合蛋白II:
(i)由第一蛋白与第一结构域融合形成的融合蛋白I;
(ii)由第一蛋白与第二结构域融合形成的融合蛋白I;
(iii)由第二蛋白与第一结构域融合形成的融合蛋白II;
(iv)由第二蛋白与第二结构域融合形成的融合蛋白II;
其中,所述第一蛋白选自G蛋白偶联受体或其功能变体,所述第二蛋白选自G蛋白或其功能变体;所述第一结构域选自报告蛋白的羧基端结构域,所述第二结构域选自报告蛋白的氨基端结构域;
所述报告蛋白的羧基端结构域与所述报告蛋白的氨基端结构域用于形成报告蛋白,并且,所述报告蛋白为具有细胞毒性的蛋白,释放用于检测的报告信号。
[2].根据[1]所述的融合蛋白的组合物,其中,所述报告蛋白来自白喉毒素。
[3].根据[1]或[2]所述的融合蛋白的组合物,其中,所述报告蛋白为白喉毒素A亚基(DTA),所述第一结构域为白喉毒素A亚基的羧基端结构域(DTACTD),所述第二结构域为白喉毒素A亚基的氨基端结构域(DTANTD);
可选地,所述第一结构域选自如下(a1)-(a2)中的任一项:
(a1)如SEQ ID NO:9所示氨基酸序列的多肽;
(a2)如SEQ ID NO:9所示的氨基酸序列相比,具有至少80%的序列同一性,且具有或部分具有如SEQ ID NO:9所示的序列活性的多肽;
可选地,所述第二结构域选自如下(b1)-(b2)中的任一项:
(b1)如SEQ ID NO:11所示氨基酸序列的多肽;
(b2)与SEQ ID NO:11所示的氨基酸序列相比,具有至少80%的序列同一性,且具有或部分具有如SEQ ID NO:11所示的序列活性的多肽。
[4].根据[1]-[3]任一项所述的融合蛋白的组合物,其中,所述第一蛋白选自如下任意一种:β2-肾上腺素受体(β2AR)或其功能变体,人神经介素B受体(NMBR)或其功能变体;
优选地,所述第一蛋白为β2-肾上腺素受体(β2AR)或人神经介素B受体(NMBR);
更优选地,所述第一蛋白选自如下(c1)-(c2)中的任一项:
(c1)如SEQ ID NO:1或3任一氨基酸序列所示的蛋白;
(c2)与SEQ ID NO:1或3任一氨基酸序列相比,具有至少80%的序列同一性,且具有或部分具有如SEQ ID NO:1或3任一序列所示的序列活性的蛋白。
[5].根据[1]-[4]任一项所述的融合蛋白的组合物,其中,所述第二蛋白选自miniG蛋白或其功能变体;
优选地,所述第二蛋白选自如下(d1)-(d2)中的任一项:
(d1)如SEQ ID NO:5或6任一所示氨基酸序列的蛋白;
(d2)与SEQ ID NO:5或6任一所述的氨基酸序列相比,具有至少80%的序列同一性,且具有或部分具有如SEQ ID NO:5或6所示的序列活性的蛋白。
[6].根据[1]-[5]任一项所述的融合蛋白的组合物,其中,所述融合蛋白I由所述第一结构域融合于所述第一蛋白的羧基端形成;或者,所述融合蛋白I由所述第二结构域融合于所述第一蛋白的羧基端形成;
可选地,所述融合蛋白I包括连接所述第一结构域与所述第一蛋白的连接肽;或者,所述融合蛋白I包括连接所述第二结构域与所述第一蛋白的连接肽;
优选地,沿氨基端(N)向羧基端(C)方向,所述融合蛋白I具有如下(j1)-(j4)中的任一项所示的结构:
(j1)(N)-β2AR-DTACTD-(C),
(j2)(N)-β2AR-连接肽-DTACTD-(C),
(j3)(N)-NMBR-DTACTD-(C),
(j4)(N)-NMBR-连接肽-DTACTD-(C);
优选地,所述融合蛋白I选自如下(e1)-(e2)中的任一项:
(e1)如SEQ ID NO:13或15任一项所示氨基酸序列的蛋白;
(e2)与SEQ ID NO:13或15任一项所述的氨基酸序列相比,具有至少80%的序列同一性,且具有或部分具有如SEQ ID NO:13或15任一项所示的序列活性的蛋白。
[7].根据[1]-[6]任一项所述的融合蛋白的组合物,其中,其中,所述融合蛋白II由所述第一结构域融合于所述第二蛋白的内部或氨基端形成;或者,所述融合蛋白II由所述第二结构域融合于所述第二蛋白的内部或氨基端成形成;
可选地,所述融合蛋白II包括连接所述第一结构域与所述第二蛋白的第二连接肽;或者,所述融合蛋白II包括连接所述第二结构域与所述第二蛋白的第二连接肽;
优选地,沿氨基端(N)向羧基端(C)方向,所述融合蛋白II具有如下(k1)-(k4)中的任一项所示的结构:
(k1)(N)-miniG蛋白片段I-DTANTD-miniG蛋白片段II-(C),
(k2)(N)-miniG蛋白片段I-连接肽-DTANTD-连接肽-miniG蛋白片段II-(C),
(k3)(N)-DTANTD-miniG蛋白-(C),
(k4)(N)-DTANTD-连接肽-miniG蛋白-(C),
其中,miniG蛋白由所述miniG蛋白片段I与所述miniG蛋白片段II融合形成;
优选地,所述融合蛋白II选自如下(f1)-(f2)中的任一项:
(f1)如SEQ ID NO:17、19、21或23任一项所示氨基酸序列的蛋白;
(f2)与SEQ ID NO:17、19、21或23任一项所述的氨基酸序列相比具有至少80%的序列同一性,且具有或部分具有如SEQ ID NO:17、19、21或23任一项所示的序列活性的蛋白。
[8].一种融合蛋白,其选自如下(i)-(iv)组成的组中的任意一种:
(i)由第一蛋白与第一结构域融合形成的融合蛋白I;
(ii)由第一蛋白与第二结构域融合形成的融合蛋白I;
(iii)由第二蛋白与第一结构域融合形成的融合蛋白II;
(iv)由第二蛋白与第二结构域融合形成的融合蛋白II;
其中,所述第一蛋白选自G蛋白偶联受体或其功能变体,所述第二蛋白选自G蛋白或其功能变体;所述第一结构域选自报告蛋白的羧基端结构域,所述第二结构域选自报告蛋白的氨基端结构域;
所述报告蛋白的羧基端结构域与所述报告蛋白的氨基端结构域用于形成报告蛋白,并且,所述报告蛋白为具有细胞毒性的蛋白,释放用于检测的报告信号。
[9].一种分离的多核苷酸,其中,所述多核苷酸包含如[8]所述的融合蛋白的核苷酸序列。
[10].一种重组核酸分子,其中,所述重组核酸分子包含编码如[1]-[7]任一项所述的融合蛋白的组合物的核苷酸序列。
[11].根据[10]所述的重组核酸分子,其中,所述重组核酸分子包括可操作地连接的如下所示元件:
第一编码区,所述第一编码区包含用于编码融合蛋白I的第一编码序列;以及,
第二编码区,所述第二编码区包含用于编码融合蛋白II的第二编码序列;
优选地,所述第一编码序列选自如下(g1)-(g2)中的任一项:
(g1)如SEQ ID NO:14或16任一项所示的核苷酸序列;
(g2)与SEQ ID NO:14或16任一项所示的核苷酸序列相比具有至少80%的序列同一性,且编码具有如SEQ ID NO:13或15任一项所示序列编码的蛋白活性的蛋白的核苷酸序列;
优选地,所述第二编码序列选自如下(h1)-(h2)中的任一项:
(h1)如SEQ ID NO:18、20、22或24任一项所示的核苷酸序列;
(h2)与SEQ ID NO:18、20、22或24任一项所示的核苷酸序列相比具有至少80%的序列同一性,且编码具有如SEQ ID NO:17、19、21或23任一项所示序列编码的蛋白活性的蛋白的核苷酸序列。
[12].根据[11]所述的重组核酸分子,其中,所述重组核酸分子还包括与所述第一编码区或所述第二编码区可操作地连接的一个或多个启动子;
可选地,所述启动子是连接所述第一编码区和所述第二编码区的双向启动子;
优选地,所述第一编码区位于所述双向启动子的上游,所述第二编码区位于所述双向启动子的下游;优选地,所述双向启动子为GAL1,10。
[13].一种重组表达载体,其中,所述重组表达载体包含如[10]-[12]任一项所述的重组核酸分子。
[14].根据[1]-[7]任一项所述的融合蛋白的组合物,根据[8]所述的融合蛋白,根据[9]所述的多核苷酸,根据[10]-[12]任一项所述的重组核酸分子,或根据[13]所述的重组表达载体在如下(1)-(2)至少一种中的用途:
(1)构建药物筛选系统,或制备用于构建药物筛选系统的试剂或试剂盒;
(2)构建药物筛选的细胞模型,或制备用于构建药物筛选的细胞模型的试剂或试剂盒;
优选地,所述药物为GPCR药物,更优选为GPCR拮抗剂。
[15].一种重组酵母细胞,其中,所述重组酵母细胞表达如[1]-[7]任一项所述的融合蛋白的组合物;或者,所述重组酵母细胞包含如[10]-[12]任一项所述的重组核酸分子,或如[13]所述的重组表达载体;
优选地,所述重组酵母细胞来源于酿酒酵母。
[16].一种用于构建重组酵母细胞的方法,其中,所述方法包括将如[10]-[12]任一项所述的重组核酸分子,或如[13]所述的重组表达载体转入酵母细胞内的步骤;
优选地,所述酵母细胞为酿酒酵母细胞。
[17].根据[15]所述的重组酵母细胞在如下(1)-(2)至少一种中的用途:
(1)用于药物筛选,或作为药物筛选系统或药物筛选的细胞模型;
(2)制备用于药物筛选的试剂、试剂盒或筛选系统。
[18].一种基于生存压力的负向筛选系统,其中,所述负向筛选系统包含如[1]-[7]任一项所述的融合蛋白的组合物,如[10]-[12]任一项所述的重组核酸分子,如[13]所述的重组表达载体,或如[15]所述的重组酵母细胞。
[19].一种高通量筛选装置,其中,所述高通量筛选装置包括:
药物模块,用于存储待筛选药物;
菌株接种模块,用于向所述药物模块中接种如[15]所述的重组酵母细胞,使所述重组酵母细胞与所述待筛选药物接触;
培养模块,用于培养接种于所述药物模块中的所述重组酵母细胞;
测量模块,用于获取所述培养模块中培养后的重组酵母细胞的生长速度;
判定模块,用于根据所述重组酵母细胞的生长速度,判断所述待筛选药物是否为目标筛选药物;
任选地,所述高通量筛选装置还包括:
转移模块,用于将所述待筛选药物转移至所述药物模块。
[20].根据[19]所述的高通量筛选装置,其中,
所述药物模块包括具有阵列微孔的多孔板,所述微孔相互独立地设置于所述多孔板上,所述待筛选药物储存于第一预设数量的所述微孔内;
所述菌株接种模块用于向所述第一预设数量的微孔内接种所述重组酵母细胞;
优选地,所述第一预设数量≥50,优选≥100,更优选≥300。
[21].根据[19]或[20]所述的高通量筛选装置,其中,
所述测量模块用于获取所述培养模块中培养后的所述重组酵母细胞的OD值;
所述判定模块用于根据所述重组酵母细胞的OD值,判定所述待筛选药物是否为目标筛选药物;
可选地,所述目标筛选药物选自GPCR激动剂或GPCR拮抗剂,优选GPCR拮抗剂。
[22].一种药物筛选的方法,其中,所述方法包括:
培养步骤:在筛选培养基中培养如[15]所述的重组酵母细胞;
药物处理步骤:使用待筛选药物处理所述重组酵母细胞;
比较步骤:比较所述药物处理后的重组酵母细胞,与未进行药物处理的重组酵母细胞的生长速度;
判断步骤:根据所述重组酵母细胞的生长速度,判断所述待筛选药物是否为目标筛选药物;
优选地,所述筛选培养基为用于筛选GPCR拮抗剂的培养基,所述用于筛选GPCR拮抗剂的培养基是包含GPCR激动剂的培养基。
首先酿酒酵母的GPCR-G蛋白信号通路与人源的GPCR-G蛋白信号通路几乎完全正交7且人的GPCR可以在酵母中表达并具有功能8;其次,为了特异性表征靶点GPCR的功能状态,本公开的一些实施方案中通过直接将报告蛋白连接在GPCR和小G蛋白9,10(miniG)上,避免了下游其他信号通路的干扰;此外,酿酒酵母对于DMSO和乙醇等有机溶剂的耐受性更高,并且酿酒酵母的培养更加简单快速,成本更低。
发明的效果
在一些实施方案中,本公开提供的融合蛋白,可用于在细胞内构建用于药物筛选的负向生存压力筛选系统,通过反馈激活的GPCR或者激活的GPCR由于激活效果被竞争性减弱或消除而产生的报告信号,提高GPCR药物尤其是GPCR配体(例如激动剂、拮抗剂)筛选的灵敏度及可信度。
在一些实施方案中,本公开提供的融合蛋白的组合物,包括各自独立存在的融合蛋白I与融合蛋白II。融合蛋白I与融合蛋白II是报告蛋白(例如具有细胞毒性的蛋白)拆分为两个结构域后分别与GPCR及G蛋白融合形成。当GPCR被激活后,融合蛋白I与融合蛋白II相互结合,致使报告蛋白的第一结构域和第二结构域相互靠近并结合为具有功能活性的报告蛋白,当激活的GPCR被抑制后(GPCR激活状态转变为抑制状态),致使报告蛋白的第一结构域和第二结构域相互分离,从而报告蛋白失去活性。
本公开中基于蛋白片段互补设计的融合蛋白I与融合蛋白II,可以直接反馈由GPCR与G蛋白结合/抑制二者的结合产生的生存报告信号,不需要进过一些转录调控和级联放大的过程,信号更加真实可信,具有灵敏度高、受非正交信号响应干扰少、可靠性高等优势。
在一些实施方案中,本公开提供的重组酵母细胞,通过在酵母细胞中表达融合蛋白I与融合蛋白II,建立了与人GPCR-G蛋白信号通路相正交的信号响应体系。重组酵母细胞可以将GPCR的激活过程转变为酵母的生长抑制过程,或者将激活的GPCR由于激活效果被竞争性减弱或消除的过程转变为酵母的生长过程,产生具有高灵敏度、直接可靠的生长报告信号,适合与GPCR亲和力低或激活作用较弱的药物分子的筛选,在临床药物筛选中极具应用前景。
另一方面,本公开中在酵母细胞内构建的GPCR-G蛋白信号通路和酵母自身的信号转导途径并无相互影响,可以在很大程度上避免由于信号交联响应引发的假阳性结果。重组酵母细胞最终反馈的生存报告蛋白信号仅来自于靶点GPCR的激活或抑制,而不会收到其他因素的干扰,避免了酵母自身在生长压力下有可能出现的应激反应对报告系统产生的影响,系统更加稳定可靠。
在一些具体的实施方案中,本公开提供的重组酵母细胞,基于具有细胞毒性的报告蛋白拆分后与GPCR、G蛋白融合得到的融合蛋白I、融合蛋白II构建形成。重组酵母细胞生长于含有GPCR激动剂的培养基。融合蛋白I中的GPCR与激动剂结合被激活后,与融合蛋白II中的G蛋白结合,使报告蛋白的两个结构域相互靠近,结合形成具有功能活性的具有细胞毒性的蛋白,抑制重组酵母细胞的生长。如果待测药物能够抑制GPCR的活性,或者与添加的已知激动剂分子竞争时,重组酵母细胞则能够以较快的速度生长,通过测量重组酵母细胞的浓度就可以筛选出目标GPCR的拮抗剂,实现对待筛选药物分子的高灵敏度、高特异性和大规模筛选。
在一些实施方案中,本公开提供的高通量筛选装置,能够实现对GPCR药物,特别是与GPCR亲和力相对较弱的GPCR药物的大规模、高通量筛选,在临床药物筛选中具有重要的应用价值。
在一些实施方案中,本公开提供的基于生存压力的负向筛选系统(nSPS系统),具有如下所示优点:
(1)本公开基于GPCR、G蛋白及报告蛋白的结构信息,准确、直观地设计了基于蛋白片段互补的融合蛋白I和融合蛋白II形成,创新性地将报告蛋白的合理地拆分为两个部分并且融合于靶点GPCR及G蛋白上,报告蛋白反馈的生存报告信号直接来自于受体与G蛋白的相互结合而不经过一系列转录调控和级联放大,信号更加真实可信。
(2)本公开在酵母细胞中建立的GPCR-G蛋白信号响应体系与所使用酵母自身的GPCR-G蛋白信号通路相互正交,靶点GPCR的激活/抑制和酵母自身的信号转导途径并无任何相互影响,不会受到其他因素的干扰,避免了酵母自身在生长压力下有可能出现的应激反应对报告系统产生的影响,系统更加稳定可靠。
(3)本公开建立的系统并不干扰酵母自身的遗传过程,对其正常代谢所需要的基因表达调控无影响,因此也无需对宿主酵母菌株进行复杂的改造和编辑来避免持续激活酵母的某个转录调控过程对酵母正常生命过程的严重影响,系统更加简便。
(4)不同GPCR与G蛋白形成复合物采取高度相似但有细微差别的方式,因此,基于GPCR-G蛋白相互作用设计可开发的nSPS系统方便设计者在类似的构建方式上按照实际结构和序列信息进行细微修改,从而保证报告信号展示出足够的的检测窗口和灵敏度,系统更加灵活。
附图说明
图1显示nSPS设计原理及结构示意图。其中,图1中的a为nSPS原理示意图。DTANTD被插入到miniG中间,DTACTD连在受体C端,受体被激动剂激活时会招募miniG,被分割成的DTA被拉近并形成完整的DTA,抑制延伸因子2(Elongation Factor 2,EF2)的活性从而抑制酵母生长。图1中的b为nSPS结构示意图,被分割成两半的DTA,用合适的GS序列(虚线)连接在GPCR C端和miniG上。当受体被激活时,DTA会合在一起并发挥功能。图1中的c为nSPS系统DTA序列示意图。
图2显示β2-D3.0及NMBR-D3.0生长受配体调控。其中,图2中的a和b显示将在不含半乳糖的培养基中长到合适密度的β2-D3.0酵母稀释到OD600=0.1,并加入不同的配体化合物,并在每天固定时间用酶标仪测量OD600。APO表示不含配体的空白对照,每组4个重复,数据以平均值±标准误呈现。图2中的c和d显示NMBR-D3.0系统,每组6个重复。
图3显示β2-D3.0生长的激动剂依赖性试验。图3中纵坐标为酵母的OD600读值,横坐标中APO表示不加配体,ISO表示培养基中加入了10μM Isoprenaline和1mM抗坏血酸(Vitamin C,防止Isoprenaline被氧化)。APO-APO表示将APO组中酵母稀释到不含配体的培养基中,APO-ISO表示将APO组中酵母稀释到含10μM Isoprenaline和1mM Vitamin C的培养基中。
具体实施方式
定义
当在权利要求和/或说明书中与术语“包含”联用时,词语“一(a)”或“一(an)”可以指“一个”,但也可以指“一个或多个”、“至少一个”以及“一个或多于一个”。
如在权利要求和说明书中所使用的,词语“包含”、“具有”、“包括”或“含有”是指包括在内的或开放式的,并不排除额外的、未引述的元件或方法步骤。
在整个申请文件中,术语“约”表示:一个值包括测定该值所使用的装置或方法的误差的标准偏差。
虽然所公开的内容支持术语“或”的定义仅为替代物以及“和/或”,但除非明确表示仅为替代物或替代物之间相互排斥外,权利要求中的术语“或”是指“和/或”。
如本公开所使用的,术语“多肽”、“肽”和“蛋白质”在本文中互换地使用并且为任意长度的氨基酸聚合物。该聚合物可以是线形或分支的,它可以包含修饰的氨基酸,并且它可以由非氨基酸隔断。该术语也包括已经被修饰(例如,二硫键形成、糖基化、脂质化、乙酰化、磷酸化或任何其他操作,如以标记组分缀合)的氨基酸聚合物。多肽可以从天然来源分离,可以通过重组技术从真核或原核宿主产生并且可以是合成方法的产物。
如本公开所使用的,术语“融合蛋白”是指具有自然界不相连的肽序列的多肽、蛋白。融合蛋白可以是利用基因工程技术,在原核或真核细胞中获得的由两种或两种以上的蛋白融合形成的目标蛋白;也可以是利用合成技术得到的融合有两种或以上多肽的目标蛋白。
如本公开所使用的,术语“G蛋白偶联受体(G Protein Coupled Receptor)”又称“GPCR”,是一类存在于细胞表面的膜蛋白超级家族,其数目和种类在细胞表面受体中为最多。在从低等真菌到高等哺乳动物的生物体中,广泛存在有GPCR。在一些实施方案中,本公开的GPCR为G蛋白偶联受体。示例性的,G蛋白偶联受体包括但不限于β2-肾上腺素受体(β2adrenergic receptor,β2AR)、人神经介素B受体(Neuromedin B Receptor,NMBR)、人黑色素皮质受体-4(melanocortin 4receptor,MC4R)、黑素皮质素受体1(melanocortin1receptor,MC1R)、人腺苷A2A受体、趋化因子受体CXCR4、CCR5等。
在本公开中,G蛋白偶联受体或其功能变体选自野生型GPCR、GPCR的功能变体。GPCR的功能变体包括但不限于野生型GPCR的突变体、修饰的GPCR、GPCR蛋白片段、基因工程改造的GPCR等。GPCR功能变体可以具有提高或降低的G蛋白偶联受体的蛋白活性。示例性的,GPCR功能变体具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的GPCR蛋白活性。
在本公开中,β2-肾上腺素受体或其功能变体选自野生型β2AR,β2AR的功能变体。β2AR的功能变体包括但不限于野生型β2AR的突变体、修饰的β2AR、β2AR蛋白片段、基因工程改造的β2AR等。β2AR功能变体可以具有提高或降低的β2AR的蛋白活性。示例性的,β2AR功能变体具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的β2AR蛋白活性。
在本公开中,人神经介素B受体或其功能变体选自野生型NMBR,NMBR的功能变体。NMBR的功能变体包括但不限于野生型NMBR的突变体、修饰的NMBR、NMBR蛋白片段、基因工程改造的NMBR等。NMBR功能变体可以具有提高或降低的NMBR的蛋白活性。示例性的,NMBR功能变体具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的NMBR蛋白活性。
如本公开所使用的,术语“G蛋白”是指能与鸟嘌呤核苷酸结合,具有GTP水解酶活性的一类信号转导蛋白。GPCR通过与G蛋白结合来调节胞内相关酶的活性,以此产生第二信使而将配体信号从胞外跨膜传递到胞内,使细胞的功能活性发生改变,最终对生物体的生长发育、生殖、滞育、摄食、代谢以及行为等起到调控作用。
在本公开中,G蛋白或其功能变体选自野生型G蛋白,G蛋白的功能变体。G蛋白的功能变体包括但不限于野生型G蛋白的突变体、修饰的G蛋白、G蛋白蛋白片段、基因工程改造的G蛋白等。G蛋白功能变体可以具有提高或降低的G蛋白的蛋白活性。示例性的,G蛋白功能变体具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的G蛋白蛋白活性。
如本公开所使用的,术语“野生型”指在自然界中可以找到的对象。例如,一种可以从自然界的一个来源中分离出来并且在实验室中没有被人类有意修改的多肽、多核苷酸序列或微生物是天然存在的。如本公开所用的,“天然存在”和“野生型”是同义词。
如本公开所使用的,术语“突变体”是指相对于“野生型”,或者“相比较的”多核苷酸或多肽,在一个或多个(例如,若干个)位置处包含改变(即,取代、插入和/或缺的多核苷酸),其中,取代是指用不同的核苷酸置换占用一个位置的核苷酸。缺失是指去除占据某一位置的核苷酸。插入是指在邻接并且紧随占据位置的核苷酸之后添加核苷酸。
如本公开所使用的,术语“多核苷酸”、“核酸分子”指由核苷酸组成的聚合物。多核苷酸可以是单独片段的形式,也可以是更大的核苷酸序列结构的一个组成部分,其是从至少在数量或浓度上分离一次的核苷酸序列衍生而来的,能够通过标准分子生物学方法(例如,使用克隆载体)识别、操纵以及恢复序列及其组分核苷酸序列。当一个核苷酸序列通过一个DNA序列(即A、T、G、C)表示时,这也包括一个RNA序列(即A、U、G、C),其中“U”取代“T”。换句话说,“多核苷酸”指从其他核苷酸(单独的片段或整个片段)中去除的核苷酸聚合物,或者可以是一个较大核苷酸结构的组成部分或成分,如表达载体或多顺反子序列。多核苷酸包括DNA、RNA和cDNA序列。“重组多核苷酸”、“重组核酸分子”属于“多核苷酸”中的一种。
如本公开所使用的,术语“可操作地连接”是指处于与其它核酸有功能关系的位置的核酸。示例性的,将第一编码区与第二编码区可操作地连接,使两者位于同一核苷酸链中。
本公开中的“序列同一性”和“同一性百分比”指两个或更多个多核苷酸或多肽之间相同(即同一)的核苷酸或氨基酸的百分比。两个或更多个多核苷酸或多肽之间的序列同一性可通过以下方法测定:将多核苷酸或多肽的核苷酸或氨基酸序列对准且对经对准的多核苷酸或多肽中含有相同核苷酸或氨基酸残基的位置数目进行评分,且将其与经对准的多核苷酸或多肽中含有不同核苷酸或氨基酸残基的位置数目进行比较。多核苷酸可例如通过含有不同核苷酸(即取代或突变)或缺失核苷酸(即一个或两个多核苷酸中的核苷酸插入或核苷酸缺失)而在一个位置处不同。多肽可例如通过含有不同氨基酸(即取代或突变)或缺失氨基酸(即一个或两个多肽中的氨基酸插入或氨基酸缺失)而在一个位置处不同。序列同一性可通过用含有相同核苷酸或氨基酸残基的位置数目除以多核苷酸或多肽中氨基酸残基的总数来计算。举例而言,可通过用含有相同核苷酸或氨基酸残基的位置数目除以多核苷酸或多肽中核苷酸或氨基酸残基的总数且乘以100来计算同一性百分比。
示例性的,在本公开中,当使用序列比较算法或通过目视检查测量以最大的对应性进行比较和比对时,两个或多个序列或子序列具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%核苷酸或氨基酸残基的“序列同一性”或“同一性百分比”。“序列同一性”或“同一性百分比”的判断/计算可以基于序列任何合适的区域上。例如,长度至少约50个残基的区域、至少约100个残基的区域,至少约200个残基的区域,至少约400个残基的区域,或至少约500个残基的区域。在某些实施方案中,所述序列在任一或两个相比较的生物聚合物(就是核酸或多肽)的整个长度上基本相同。
如本公开所使用的,术语“编码区”(Coding Region)是指能够转录信使RNA,并最终翻译为目标多肽、蛋白的基因序列。
如本公开所使用的,术语“上游”或“下游”是指沿编码区的蛋白翻译方向的上游及下游。
如本公开所使用的,术语“重组核酸分子”指具有在自然界中不连接在一起的序列的多核苷酸。重组多核苷酸可包括在合适的载体中,且该载体可用于转化至合适的宿主细胞。然后多核苷酸在重组宿主细胞中表达以产生例如“重组多肽”“重组蛋白”“融合蛋白”等。
如本公开所使用的,术语“载体”指的是DNA构建体,其含有与合适的控制序列可操作地连接的DNA序列,从而在合适的宿主中表达目的基因。
如本公开所使用的,术语“重组表达载体”指用于表达例如编码所需多肽的多核苷酸的DNA结构。重组表达载体可包括,例如包含i)对基因表达具有调控作用的遗传元素的集合,例如启动子和增强子;ii)转录成mRNA并翻译成蛋白质的结构或编码序列;以及iii)适当的转录和翻译起始和终止序列的转录亚单位。重组表达载体以任何合适的方式构建。载体的性质并不重要,并可以使用任何载体,包括质粒、病毒、噬菌体和转座子。用于本公开的可能载体包括但不限于染色体、非染色体和合成DNA序列,例如病毒质粒、细菌质粒、噬菌体DNA、酵母质粒以及从质粒和噬菌体DNA的组合中衍生的载体,来自如慢病毒、逆转录病毒、牛痘、腺病毒、鸡痘、杆状病毒、SV40和伪狂犬病等病毒的DNA。
如本公开所使用的,术语“宿主细胞”指已经向其中引入外源多核苷酸的细胞,包括这类细胞的子代。宿主细胞包括“转化体”和“转化的细胞”,这包括原代转化的细胞和从其衍生的子代。宿主细胞是可以用来产生本发明抗体分子的任何类型的细胞系统,包括真核细胞,例如,哺乳动物细胞、昆虫细胞、酵母细胞;和原核细胞,例如,大肠杆菌细胞。宿主细胞包括培养的细胞,也包括转基因动物、转基因植物或培养的植物组织或动物组织内部的细胞。术语“重组宿主细胞”涵盖导入重组核酸分子或重组表达载体后不同于亲本细胞的宿主细胞,重组宿主细胞具体通过转化来实现。本公开的宿主细胞可以是原核细胞或真核细胞,只要是能够导入本公开的重组核酸分子或重组表达载体的细胞即可。
在一些实施方案中,本公开中的“宿主细胞”来源于酵母细胞。酵母(saccharomyces)是一种单细胞真菌,是基因克隆实验中常用的真核生物宿主细胞。在一些更为具体的实施方案中,本公开中的酵母为酿酒酵母(Saccharomyces cerevisiae)。
如本公开所使用的,术语“重组酵母菌株”是以基因工程方法对酵母细胞进行改造后得到。实施方案包括但不限于引入重组基因,对酵母的内源基因进行敲除、敲减处理等操作。其中,术语“重组基因”是并非天然存在的基因,重组基因包括可操作地连接到表达控制序列上的蛋白质编码序列。实施方案包括但不限于引入微生物的外源基因、可操作地连接到异源启动子的内源蛋白质编码序列和具有经修改的蛋白质编码序列的基因。重组基因保存在微生物的基因组、微生物中的质粒或微生物中的噬菌体上。
如本公开所使用的,术语“负向生存压力筛选系统(negative Survival PressureSelection,nSPS)”又称为“基于生存压力的负向筛选系统”、“基于生存压力的负向筛选体系”或“nSPS系统”。本公开中的负向生存压力筛选系统涉及将GPCR药物拮抗过程转变为细胞生长过程的融合蛋白I与融合蛋白II的组合物,编码融合蛋白的组合物的重组核酸分子、重组表达载体,以及重组酵母细胞等等。
如本公开所使用的,术语“转化、转染、转导”具有本领域技术人员普遍理解的意思,即将外源性的DNA导入宿主的过程。所述转化、转染、转导的方法包括任何将核酸导入细胞的方法,这些方法包括但不限于电穿孔法、磷酸钙(CaPO4)沉淀法、氯化钙(CaCl2)沉淀法、微注射法、聚乙二醇(PEG)法、DEAE-葡聚糖法、阳离子脂质体法以及乙酸锂-DMSO法。
本文公开的方法可以在体外、离体、或体内进行,或者产品可以以体外、离体、或体内形式存在。术语“体外”是指在实验室条件或培养液中使用材料、生物物质、细胞和/或组织的实验;而术语“体内”是指使用完整多细胞有机体的实验和工序。在一些实施方式中,体内进行的方法可以在非人动物上进行。“离体”是指存在于有机体外或发生在有机体外,例如在人或动物体外的事件,例如可以在取自有机体的组织(例如整个器官)或细胞上存在或发生的事件。
除非另外定义或由背景清楚指示,否则在本公开中的全部技术与科学术语具有如本公开所属领域的普通技术人员通常理解的相同含义。
融合蛋白的组合物及融合蛋白
为解决目前GPCR药物筛选存在的局限性,本公开提供一种融合蛋白的组合物,所述组合物包括各自独立地存在的如下(i)所示的融合蛋白I与如下(iv)所示的融合蛋白II;或者,所述组合物包括各自独立地存在的如下(ii)所示的融合蛋白I与如下(iii)所示的融合蛋白II:
(i)由第一蛋白与第一结构域融合形成的融合蛋白I;
(ii)由第一蛋白与第二结构域融合形成的融合蛋白I;
(iii)由第二蛋白与第一结构域融合形成的融合蛋白II;
(iv)由第二蛋白与第二结构域融合形成的融合蛋白II;
其中,所述第一蛋白选自G蛋白偶联受体或其功能变体,所述第二蛋白选自G蛋白或其功能变体;所述第一结构域选自报告蛋白的羧基端结构域,所述第二结构域选自报告蛋白的氨基端结构域;
所述报告蛋白的羧基端结构域与所述报告蛋白的氨基端结构域用于形成报告蛋白,并且,所述报告蛋白释放用于检测的报告信号,所述报告蛋白为具有细胞毒性的蛋白。
本公开还提供一种融合蛋白,其选自如下(i)-(iv)组成的组中的任意一种:
(i)由第一蛋白与第一结构域融合形成的融合蛋白I;
(ii)由第一蛋白与第二结构域融合形成的融合蛋白I;
(iii)由第二蛋白与第一结构域融合形成的融合蛋白II;
(iv)由第二蛋白与第二结构域融合形成的融合蛋白II;
其中,所述第一蛋白选自G蛋白偶联受体或其功能变体,所述第二蛋白选自G蛋白或其功能变体;所述第一结构域选自报告蛋白的羧基端结构域,所述第二结构域选自报告蛋白的氨基端结构域;
所述报告蛋白的羧基端结构域与所述报告蛋白的氨基端结构域用于形成报告蛋白,并且,所述报告蛋白为具有细胞毒性的蛋白,释放用于检测的报告信号。
本公开中将报告蛋白拆分为第一结构域(也即,报告蛋白的羧基端结构域)和第二结构域(也即,报告蛋白的氨基端结构域)两个部分;并且将GPCR或其功能变体与第一结构域和第二结构域的一种相融合,将G蛋白或其功能变体与第二结构域与第一结构域和第二结构域中另一种相融合,得到融合蛋白I、融合蛋白II。
本公开将完整的具有活性的具有细胞毒性的蛋白分割成没有功能两部分,形成报告蛋白的氨基端结构域和羧基端结构域,分别与G蛋白和GPCR连接,并分别形成融合蛋白。这样在GPCR没有被激活时,具有细胞毒性的蛋白处于被分割的失活的状态,当培养液中的化合物激活GPCR时,GPCR会招募G蛋白,被分割的具有细胞毒性的蛋白在空间上被拉近并形成具有功能的具有细胞毒性的蛋白从而抑制宿主细胞生长。如果培养液中的化合物能够抑制GPCR的活性,或者与添加的已知激动剂分子竞争时,宿主细胞则能够以较快的速度生长,通过测量宿主细胞的浓度就可以筛选出目标GPCR的拮抗剂。
<第一蛋白>
在本公开中,第一蛋白选自GPCR或其功能变体。由于GPCR种类众多、在各物种中分布广泛,对用于形成融合蛋白I的GPCR的类型不进行限制性限定,只要其能够与激动剂结合,使GPCR被激活并进一步结合G蛋白,并且,融合蛋白I的GPCR与待筛选药物(例如GPCR拮抗剂)结合时,使GPCR由激活状态转变为抑制状态,解除GPCR与G蛋白的结合,以反馈待筛选药物的作用信息。
在一些实施方案中,GPCR为人源蛋白。示例性的,GPCR的种类包含但不限于β2AR、NMBR等等。进一步地,用于形成融合蛋白I的第一蛋白包括但不限于β2AR或其功能变体、NMBR或其功能变体等。
在一些具体的实施方案中,第一蛋白选自β2AR或其功能变体。β2AR是目前广泛使用的GPCR之一,以β2AR或其功能变体作为第一蛋白,适用于对GPCR药物的广泛性地筛选、鉴定。本公开选取了研究最为充分的β2AR作为模式受体,β2AR拥有的各种工具分子可以帮助进行后续研究。
在一些更为具体的实施方案中,第一蛋白为β2AR。示例性地,β2AR的氨基酸序列如SEQ ID NO:1所示,或与SEQ ID NO:1所示的氨基酸序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性,且具有β2AR蛋白活性的序列。
β2AR的氨基酸序列(SEQ ID NO:1):
MGQPGNGSAFLLAPNRSHAPDHDVTQQRDEVWVVGMGIVMSLIVLAIVFGNVLVITAIAKFERLQTVTNYFITSLACADLVMGLAVVPFGAAHILMKMWTFGNFWCEFWTSIDVLCVTASIETLCVIAVDRYFAITSPFKYQSLLTKNKARVIILMVWIVSGLTSFLPIQMHWYRATHQEAINCYANETCCDFFTNQAYAIASSIVSFYVPLVIMVFVYSRVFQEAKRQLQKIDKSEGRFHVQNLSQVEQDGRTGHGLRRSSKFCLKEHKALKTLGIIMGTFTLCWLPFFIVNIVHVIQDNLIRKEVYILLNWIGYVNSGFNPLIYCRSPDFRIAFQELLCL
在一些可选的实施方案中,编码β2AR的核苷酸序列如SEQ ID NO:2所示,或与SEQID NO:2所示的核苷酸序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性,且编码具有如SEQID NO:1所示蛋白活性的蛋白的核苷酸序列。
编码β2AR的核苷酸序列(SEQ ID NO:2):
ATGGGGCAACCCGGGAACGGCAGCGCCTTCTTGCTGGCACCCAATAGAAGCCATGCGCCGGACCACGACGTCACGCAGCAAAGGGACGAGGTGTGGGTGGTGGGCATGGGCATCGTCATGTCTCTCATCGTCCTGGCCATCGTGTTTGGCAATGTGCTGGTCATCACAGCCATTGCCAAGTTCGAGCGTCTGCAGACGGTCACCAACTACTTCATCACTTCACTGGCCTGTGCTGATCTGGTCATGGGCCTGGCAGTGGTGCCCTTTGGGGCCGCCCATATTCTTATGAAAATGTGGACTTTTGGCAACTTCTGGTGCGAGTTTTGGACTTCCATTGATGTGCTGTGCGTCACGGCCAGCATTGAGACCCTGTGCGTGATCGCAGTGGATCGCTACTTTGCCATTACTTCACCTTTCAAGTACCAGAGCCTGCTGACCAAGAATAAGGCCCGGGTGATCATTCTGATGGTGTGGATTGTGTCAGGCCTTACCTCCTTCTTGCCCATTCAGATGCACTGGTACCGGGCCACCCACCAGGAAGCCATCAACTGCTATGCCAATGAGACCTGCTGTGACTTCTTCACGAACCAAGCCTATGCCATTGCCTCTTCCATCGTGTCCTTCTACGTTCCCCTGGTGATCATGGTCTTCGTCTACTCCAGGGTCTTTCAGGAGGCCAAAAGGCAGCTCCAGAAGATTGACAAATCTGAGGGCCGCTTCCATGTCCAGAACCTTAGCCAGGTGGAGCAGGATGGGCGGACGGGGCATGGACTCCGCAGATCTTCCAAGTTCTGCTTGAAGGAGCACAAAGCCCTCAAGACGTTAGGCATCATCATGGGCACTTTCACCCTCTGCTGGCTGCCCTTCTTCATCGTTAACATTGTGCATGTGATCCAGGATAACCTCATCCGTAAGGAAGTTTACATCCTCCTAAATTGGATAGGCTATGTCAATTCTGGTTTCAATCCCCTTATCTACTGCCGGAGCCCAGATTTCAGGATTGCCTTCCAGGAGCTTCTGTGCCTG
在一些具体的实施方案中,第一蛋白为人神经介素B受体(Neuromedin BReceptor,NMBR)或其功能变体。NMBR属于GPCR A类受体,是蛙皮素受体的一种。蛙皮素受体广泛分布于中枢神经系统和外周组织中,研究表明,在很多癌症的肿瘤细胞中,如前列腺癌,乳腺癌和肺癌,存在蛙皮素受体过表达的现象14。因此蛙皮素受体很有可能成为一种潜在癌症治疗靶点。
示例性地,NMBR的氨基酸序列如SEQ ID NO:3所示,或与SEQ ID NO:3所示的氨基酸序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性,且具有NMBR蛋白活性的序列。
NMBR的氨基酸序列(SEQ ID NO:3):
MPSKSLSNLSVTTGANESGSVPEGWERDFLPASDGTTTELVIRCVIPSLYLLIITVGLLGNIMLVKIFITNSAMRSVPNIFISNLAAGDLLLLLTCVPVDASRYFFDEWMFGKVGCKLIPVIQLTSVGVSVFTLTALSADRYRAIVNPMDMQTSGALLRTCVKAMGIWVVSVLLAVPEAVFSEVARISSLDNSSFTACIPYPQTDELHPKIHSVLIFLVYFLIPLAIISIYYYHIAKTLIKSAHNLPGEYNEHTKKQMETRKRLAKIVLVFVGCFIFCWFPNHILYMYRSFNYNEIDPSLGHMIVTLVARVLSFGNSCVNPFALYLLSESFRRHFNSQLCCG
在一些可选的实施方案中,编码NMBR的核苷酸序列如SEQ ID NO:4所示,或与SEQID NO:4所示的核苷酸序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性,且编码具有如SEQID NO:3所示蛋白活性的蛋白的核苷酸序列。
编码NMBR的核苷酸序列(SEQ ID NO:4):
ATGCCCTCCAAGAGCCTCAGCAATCTCAGCGTGACCACTGGCGCCAACGAATCCGGTAGCGTCCCCGAAGGTTGGGAGCGTGATTTCCTGCCCGCCTCCGACGGTACTACTACTGAGCTCGTGATCCGCTGCGTGATCCCCTCCCTCTATCTCCTGATCATCACTGTCGGCCTGCTGGGTAACATCATGCTGGTCAAGATCTTCATCACTAACTCCGCCATGCGCAGCGTGCCCAACATCTTCATCAGCAACCTCGCTGCTGGCGACCTGCTGCTGCTCCTGACCTGCGTCCCCGTGGATGCTTCCCGCTACTTCTTCGACGAGTGGATGTTCGGCAAGGTCGGTTGTAAACTGATCCCCGTGATCCAGCTGACCTCCGTCGGCGTGTCCGTCTTCACCCTGACTGCTCTGAGCGCTGACCGCTACCGCGCCATCGTGAACCCCATGGACATGCAGACTTCCGGTGCCCTGCTCCGCACTTGCGTCAAGGCTATGGGTATCTGGGTGGTCAGCGTGCTCCTGGCTGTGCCTGAAGCCGTGTTTAGCGAGGTGGCTCGTATCTCCAGCCTCGACAACTCCAGCTTTACCGCCTGCATCCCCTACCCCCAAACCGACGAGCTCCACCCCAAGATCCATAGCGTGCTCATCTTCCTCGTCTATTTCCTGATCCCCCTGGCCATCATCTCCATCTATTACTATCACATTGCCAAAACTCTCATCAAGTCCGCTCATAACCTCCCCGGCGAGTACAATGAGCACACTAAGAAACAGATGGAGACTCGCAAGCGCCTCGCTAAGATCGTCCTGGTGTTCGTCGGCTGCTTCATCTTCTGCTGGTTCCCCAACCACATTCTCTACATGTACCGTAGCTTTAACTACAACGAGATCGACCCCAGCCTGGGCCACATGATCGTGACTCTCGTGGCTCGTGTGCTCTCCTTCGGCAACTCCTGCGTGAACCCCTTCGCTCTCTACCTCCTGAGCGAGAGCTTCCGCCGTCATTTCAACTCCCAGCTCTGCTGTGGC
<第二蛋白>
在本公开中,第二蛋白选自G蛋白或其功能变体。本公开对于第二蛋白的种类及序列不进行限定性限定,只要其能够与融合蛋白I中激活的第一蛋白结合,使第一结构域与第二结构域相互靠近并结合为有功能活性的报告蛋白即可。
在一些实施方案中,使用经过改造的miniG代替完整G蛋白异源三聚体,相较于完整的三聚体G蛋白,miniG蛋白分子量小,易表达,可以模拟G蛋白与受体的结合模式,并且miniG被激活后可以长时间地结合在GPCR上,从而使报告蛋白能够持续发挥功能9,10
在一些具体的实施方案中,miniG蛋白(miniGs)的氨基酸序列如SEQ ID NO:5所示,或与SEQ ID NO:5所示的氨基酸序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性,且具有miniG蛋白活性的序列。
miniG蛋白(miniGs)的氨基酸序列(SEQ ID NO:5):
MIEKQLQKDKQVYRATHRLLLLGADNSGKSTIVKQMRILHGGSGGSGGTSGIFETKFQVDKVNFHMFDVGGQRDERRKWIQCFNDVTAIIFVVDSSDYNRLQEALNDFKSIWNNRWLRTISVILFLNKQDLLAEKVLAGKSKIEDYFPEFARYTTPEDATPEPGEDPRVTRAKYFIRDEFLRISTASGDGRHYCYPHFTCAVDTENARRIFNDCRDIIQRMHLRQYELL
由于miniG与GPCR的相互作用只发生在miniG羧基端的15个氨基酸,所以将miniGs的羧基酸后15个氨基酸替换成miniGq的后15氨基酸,就得到了miniGsq10
在一些具体的实施方案中,miniG蛋白(miniGsq)的氨基酸序列如SEQ ID NO:6所示,或与SEQ ID NO:6所示的氨基酸序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性,且具有miniG蛋白活性的序列。
miniG蛋白(miniGsq)的氨基酸序列(SEQ ID NO:6):
MIEKQLQKDKQVYRATHRLLLLGADNSGKSTIVKQMRILHGGSGGSGGTSGIFETKFQVDKVNFHMFDVGGQRDERRKWIQCFNDVTAIIFVVDSSDYNRLQEALNDFKSIWNNRWLRTISVILFLNKQDLLAEKVLAGKSKIEDYFPEFARYTTPEDATPEPGEDPRVTRAKYFIRDEFLRISTASGDGRHYCYPHFTCAVDTENARRIFNDCKDIILQMNLREYNLV
<报告蛋白>
在本公开中,报告蛋白是与生存相关的蛋白。在一些实施方案中,所述报告蛋白为具有细胞毒性的蛋白。
本公开中对于具有细胞毒性的蛋白的种类不进行限制性限定,只要具有细胞毒性的蛋白能够抑制宿主细胞(例如酵母)的生长即可。在一些优选的实施方案中,具有细胞毒性的蛋白在宿主细胞的细胞质中发挥毒性功能。示例性地,具有细胞毒性的蛋白选自白喉毒素(Diphtheria Toxin,DT,PDB号:1SGK)、志贺毒素(Shiga Toxin,STX)或绿脓杆菌外毒素(Pseudomonas Exotoxin,PE)等等。
在一些可选的实施方案中,报告蛋白为白喉毒素(Diphtheria Toxin,DT,PDB号:1SGK)A亚基1。DT是由白喉杆菌分泌的蛋白质毒素,由535个氨基酸残基组成,并且从结构上可以被分为A亚基和B亚基两个亚基。A亚基和B亚基由二硫键连接,A亚基即DTA又被称为催化亚基,是白喉毒素的毒性亚基。B亚基则主要帮助DTA进入细胞。白喉毒素进入细胞后,经过一系列的生理过程使得A亚基与B亚基分离,进而发挥毒性。这种细胞毒性是通过DTA与真核细胞中蛋白质表达中必要的组件Elongation Factor 2相互作用并抑制其功能,进而抑制蛋白质合成而产生的。
在一些具体的实施方案中,DTA的氨基酸序列如SEQ ID NO:7所示,或与SEQ IDNO:7所示的氨基酸序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性,且具有DTA蛋白活性的序列。
DTA的氨基酸序列(SEQ ID NO:7):
GADDVVDSSKSFVMENFSSYHGTKPGYVDSIQKGIQKPKSGTQGNYDDDWKGFYSTDNKYDAAGYSVDNENPLSGKAGGVVKVTYPGLTKVLALKVDNAETIKKELGLSLTEPLMEQVGTEEFIKRFGDGASRVVLSLPFAEGSSSVEYINNWEQAKALSVELEINFETRGKRGQDAMYEYMAQACAGNRVRR
在一些可选的实施方案中,编码DTA的核苷酸序列如SEQ ID NO:8所示,或与SEQID NO:8所示的核苷酸序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性,且编码具有如SEQID NO:7所示蛋白活性的蛋白的核苷酸序列。
编码DTA的核苷酸序列(SEQ ID NO:8):
GGTGCTGATGATGTTGTGGATTCTTCTAAATCGTTTGTTATGGAAAATTTCAGTTCTTACCACGGT
ACAAAGCCAGGTTATGTTGATAGTATTCAAAAAGGTATTCAAAAACCAAAATCTGGTACACAGG
GTAATTATGATGATGATTGGAAGGGTTTTTATTCCACCGATAACAAGTACGACGCCGCCGGTTATA
GTGTTGATAACGAAAATCCATTGTCAGGCAAAGCTGGTGGTGTCGTTAAAGTTACGTACCCAGGT
TTAACCAAAGTGTTGGCTCTTAAAGTTGATAATGCAGAAACCATAAAAAAGGAATTGGGTTTGTC
TTTGACAGAACCATTAATGGAACAAGTTGGAACAGAAGAATTCATCAAGAGATTTGGTGATGGT
GCGAGTAGAGTTGTTTTGTCTTTACCATTTGCTGAAGGTTCATCATCTGTAGAATACATTAATAAC
TGGGAACAAGCTAAAGCCTTGTCAGTTGAACTGGAAATCAATTTCGAAACTAGAGGTAAGAGAG
GTCAAGATGCTATGTACGAATATATGGCCCAAGCTTGCGCTGGTAATAGAGTCAGAAGG
在一些具体的实施方案中,DTA被分割两个蛋白结构域:第一结构域与第二结构域。其中,第一结构域为羧基端结构域(DTACTD),第二结构域为氨基端结构域(DTANTD)。第一结构域和第二结构域中的一种与第一蛋白融合形成融合蛋白I,第一结构域和第二结构域中的另一种与第二蛋白融合形成融合蛋白II。融合蛋白I、融合蛋白II中的两个蛋白结构域不会自发聚集到一起并且组装成有功能的蛋白,只有在特定的GPCR受体被激活而结合G蛋白时,才会被招募到靠近的位置从而恢复其生物学功能,而这种功能上的差异会显著影响生物体(例如,酵母)的生长速度。
在一些示例性的方案中,将完整的具有活性的DTA分割成没有功能两部分,形成DTA氨基端结构域(DTANTD)以及DTA羧基端结构域(DTACTD)。如后文将详述的,可以将DTANTD和DTACTD分别被连接在miniG蛋白中间的柔性区域和β2AR的C端。这样在β2AR没有被激活时,DTA处于被分割的失活的状态,当培养液中的化合物激活β2AR时,后者会招募miniG蛋白,被分割的DTA在空间上被拉近并形成具有功能的DTA蛋白从而抑制酵母生长;如果培养液中的化合物能够抑制受体蛋白的活性,或者与添加的已知激动剂分子竞争时,酵母样则能够以较快的速度生长,通过测量酵母的浓度我们就可以筛选出目标受体的拮抗剂。
在本公开中,对于DTA分割形成的第一结构域和第二结构域不进行限制性限定,只要第一结构域和第二结构域相互靠近后能够形成有功能活性的DTA即可。
在一些具体的实施方案中,第一结构域的氨基酸序列如SEQ ID NO:9所示,或与SEQ ID NO:9所示的氨基酸序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性,且具有如SEQID NO:9所示蛋白活性的序列。
第一结构域的氨基酸序列(DTACTD)(SEQ ID NO:9):
GASRVVLSLPFAEGSSSVEYINNWEQAKALSVELEINFETRGKRGQDAMYEYMAQACAGNRV RR
在一些可选的实施方案中,编码DTACTD的核苷酸序列如SEQ ID NO:10所示,或与SEQ ID NO:10所示的核苷酸序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性,且编码具有如SEQ ID NO:9所示蛋白活性的蛋白的核苷酸序列。
编码DTACTD的核苷酸序列(SEQ ID NO:10):
GGTGCGAGTAGAGTTGTTTTGTCTTTACCATTTGCTGAAGGTTCATCATCTGTAGAATACATTAAT
AACTGGGAACAAGCTAAAGCCTTGTCAGTTGAACTGGAAATCAATTTCGAAACTAGAGGTAAGA
GAGGTCAAGATGCTATGTACGAATATATGGCCCAAGCTTGCGCTGGTAATAGAGTCAGAAGG
在一些具体的实施方案中,第二结构域的氨基酸序列如SEQ ID NO:11所示,或与SEQ ID NO:11所示的氨基酸序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性,且具有如SEQID NO:11所示蛋白活性的序列。
第二结构域的氨基酸序列(DTANTD)(SEQ ID NO:11):
GADDVVDSSKSFVMENFSSYHGTKPGYVDSIQKGIQKPKSGTQGNYDDDWKGFYSTDNKYDAAGYSVDNENPLSGKAGGVVKVTYPGLTKVLALKVDNAETIKKELGLSLTEPLMEQVGTEEFIKRFGD
在一些可选的实施方案中,编码DTANTD的核苷酸序列如SEQ ID NO:12所示,或与SEQ ID NO:12所示的核苷酸序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性,且编码具有如SEQ ID NO:11所示蛋白活性的蛋白的核苷酸序列。
编码DTANTD的核苷酸序列(SEQ ID NO:12):
GGTGCTGATGATGTTGTGGATTCTTCTAAATCGTTTGTTATGGAAAATTTCAGTTCTTACCACGGT
ACAAAGCCAGGTTATGTTGATAGTATTCAAAAAGGTATTCAAAAACCAAAATCTGGTACACAGG
GTAATTATGATGATGATTGGAAGGGTTTTTATTCCACCGATAACAAGTACGACGCCGCCGGTTATA
GTGTTGATAACGAAAATCCATTGTCAGGCAAAGCTGGTGGTGTCGTTAAAGTTACGTACCCAGGT
TTAACCAAAGTGTTGGCTCTTAAAGTTGATAATGCAGAAACCATAAAAAAGGAATTGGGTTTGTC
TTTGACAGAACCATTAATGGAACAAGTTGGAACAGAAGAATTCATCAAGAGATTTGGTGAT
<融合蛋白I>
在一些实施方案中,融合蛋白I由第一蛋白与第一结构域融合形成。其中第一蛋白选自GPCR或其功能变体,第一结构域选自报告蛋白的羧基端结构域。
在另外一些实施方案中,融合蛋白I由第一蛋白与第二结构域融合形成。其中第一蛋白选自GPCR或其功能变体,第二结构域选自报告蛋白的氨基端结构域。
在本公开中,第一结构域或第二结构域可以融合于第一蛋白羧基端。
在一些可选的实施方案中,融合蛋白I由第一结构域融合于第一蛋白的羧基端形成;示例性地,如图1中c所示,报告蛋白的羧基端结构域融合于GPCR或其功能变体的羧基端,形成融合蛋白I。
在另外一些可选的实施方案中,融合蛋白I由第二结构域融合于第一蛋白的羧基端形成。
在一些可选的实施方案中,融合蛋白I还包括用于连接第一蛋白与第一结构域或第二结构域的连接肽。示例性的,连接肽是由甘氨酸和丝氨酸残基伸展组成的GS连接肽。
在一些具体的实施方案中,本公开中以β2AR作为第一蛋白,以DTA的羧基端结构域(DTACTD)作为第一结构域。本公开将DTACTD融合于β2AR的羧基端,形成融合蛋白I。
示例性地,沿氨基端(N)向羧基端(C)方向,融合蛋白I的结构为(j1)(N)-β2AR-DTACTD-(C)。
在一些具体的实施方案中,融合蛋白I中还包括连接β2AR与DTACTD的连接肽。
示例性地,沿氨基端(N)向羧基端(C)方向,融合蛋白I的结构为(j2)(N)-β2AR-连接肽-DTACTD-(C)。
在一些可选的实施方案中,融合蛋白I的氨基酸序列如SEQ ID NO:13所示,或与SEQ ID NO:13所示的氨基酸序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性,且具有如SEQID NO:13所示蛋白活性的序列。
融合蛋白I的氨基酸序列(SEQ ID NO:13):
MGQPGNGSAFLLAPNRSHAPDHDVTQQRDEVWVVGMGIVMSLIVLAIVFGNVLVITAIAKFERLQT
VTNYFITSLACADLVMGLAVVPFGAAHILMKMWTFGNFWCEFWTSIDVLCVTASIETLCVIAVDRYF
AITSPFKYQSLLTKNKARVIILMVWIVSGLTSFLPIQMHWYRATHQEAINCYANETCCDFFTNQAYAI
ASSIVSFYVPLVIMVFVYSRVFQEAKRQLQKIDKSEGRFHVQNLSQVEQDGRTGHGLRRSSKFCLKE
HKALKTLGIIMGTFTLCWLPFFIVNIVHVIQDNLIRKEVYILLNWIGYVNSGFNPLIYCRSPDFRIAFQE
LLCLGGSGGGGSGGGASRVVLSLPFAEGSSSVEYINNWEQAKALSVELEINFETRGKRGQDAMYEY
MAQACAGNRVRR
在一些可选的实施方案中,编码融合蛋白I的核苷酸序列如SEQ ID NO:14所示,或与SEQ ID NO:14所示的核苷酸序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性,且编码具有如SEQ ID NO:13所示蛋白活性的蛋白的核苷酸序列。
编码融合蛋白I的核苷酸序列(SEQ ID NO:14):
ATGGGGCAACCCGGGAACGGCAGCGCCTTCTTGCTGGCACCCAATAGAAGCCATGCGCCGGACC
ACGACGTCACGCAGCAAAGGGACGAGGTGTGGGTGGTGGGCATGGGCATCGTCATGTCTCTCAT
CGTCCTGGCCATCGTGTTTGGCAATGTGCTGGTCATCACAGCCATTGCCAAGTTCGAGCGTCTGC
AGACGGTCACCAACTACTTCATCACTTCACTGGCCTGTGCTGATCTGGTCATGGGCCTGGCAGTG
GTGCCCTTTGGGGCCGCCCATATTCTTATGAAAATGTGGACTTTTGGCAACTTCTGGTGCGAGTTT
TGGACTTCCATTGATGTGCTGTGCGTCACGGCCAGCATTGAGACCCTGTGCGTGATCGCAGTGGA
TCGCTACTTTGCCATTACTTCACCTTTCAAGTACCAGAGCCTGCTGACCAAGAATAAGGCCCGGG
TGATCATTCTGATGGTGTGGATTGTGTCAGGCCTTACCTCCTTCTTGCCCATTCAGATGCACTGGT
ACCGGGCCACCCACCAGGAAGCCATCAACTGCTATGCCAATGAGACCTGCTGTGACTTCTTCAC
GAACCAAGCCTATGCCATTGCCTCTTCCATCGTGTCCTTCTACGTTCCCCTGGTGATCATGGTCTT
CGTCTACTCCAGGGTCTTTCAGGAGGCCAAAAGGCAGCTCCAGAAGATTGACAAATCTGAGGGC
CGCTTCCATGTCCAGAACCTTAGCCAGGTGGAGCAGGATGGGCGGACGGGGCATGGACTCCGCA
GATCTTCCAAGTTCTGCTTGAAGGAGCACAAAGCCCTCAAGACGTTAGGCATCATCATGGGCAC
TTTCACCCTCTGCTGGCTGCCCTTCTTCATCGTTAACATTGTGCATGTGATCCAGGATAACCTCAT
CCGTAAGGAAGTTTACATCCTCCTAAATTGGATAGGCTATGTCAATTCTGGTTTCAATCCCCTTATC
TACTGCCGGAGCCCAGATTTCAGGATTGCCTTCCAGGAGCTTCTGTGCCTGGGTGGTTCAGGTG
GAGGTGGTTCTGGCGGTGGTGCGAGTAGAGTTGTTTTGTCTTTACCATTTGCTGAAGGTTCATCA
TCTGTAGAATACATTAATAACTGGGAACAAGCTAAAGCCTTGTCAGTTGAACTGGAAATCAATTT
CGAAACTAGAGGTAAGAGAGGTCAAGATGCTATGTACGAATATATGGCCCAAGCTTGCGCTGGTA
ATAGAGTCAGAAGG
在一些具体的实施方案中,本公开选择以NMBR作为第一蛋白,以DTA的羧基端结构域(DTACTD)作为第一结构域。本公开中将DTACTD融合于NMBR的羧基端,形成融合蛋白I。
示例性地,沿氨基端(N)向羧基端(C)方向,融合蛋白I的结构为(j3)(N)-NMBR-DTACTD-(C)。
在一些具体的实施方案中,融合蛋白I中还包括连接NMBR与DTACTD的连接肽。
示例性地,沿氨基端(N)向羧基端(C)方向,融合蛋白I的结构为(j4)(N)-NMBR-连接肽-DTACTD-(C)。
在一些可选的实施方案中,融合蛋白I的氨基酸序列如SEQ ID NO:15所示,或与SEQ ID NO:15所示的氨基酸序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性,且具有如SEQID NO:15所示蛋白活性的序列。
融合蛋白I的氨基酸序列(SEQ ID NO:15):
MPSKSLSNLSVTTGANESGSVPEGWERDFLPASDGTTTELVIRCVIPSLYLLIITVGLLGNIMLVKIFIT
NSAMRSVPNIFISNLAAGDLLLLLTCVPVDASRYFFDEWMFGKVGCKLIPVIQLTSVGVSVWTLTALS
ADRYRAIVNPMDMQTSGALLRTCVKAMGIWVVSVLLAVPEAVFSEVARISSLDNSSFTACIPYPQTD
ELHPKIHSVLIFLVYFLIPLAIISIYYYHIAKTLIKSAHNLPGEYNEHTKKQMETRKRLAKIVLVFVGCF
IFCWFPNHILYMYRSFNYNEIDPSLGHMIVTLVARVLSFGNSCVNPFALYLLSESFRRHFNSQLCCGRK
SYQERGTSYLLSSSAVRMTSLKSNAKNMVTNSVLLNGHSMKQEMALGGSGGGGSGGGASRVVLSL
PFAEGSSSVEYINNWEQAKALSVELEINFETRGKRGQDAMYEYMAQACAGNRVRR
在一些可选的实施方案中,编码融合蛋白I的核苷酸序列如SEQ ID NO:16所示,或与SEQ ID NO:16所示的核苷酸序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性,且编码具有如SEQ ID NO:15所示蛋白活性的蛋白的核苷酸序列。
编码融合蛋白I的核苷酸序列(SEQ ID NO:16):
ATGCCCTCCAAGAGCCTCAGCAATCTCAGCGTGACCACTGGCGCCAACGAATCCGGTAGCGTCC
CCGAAGGTTGGGAGCGTGATTTCCTGCCCGCCTCCGACGGTACTACTACTGAGCTCGTGATCCGC
TGCGTGATCCCCTCCCTCTATCTCCTGATCATCACTGTCGGCCTGCTGGGTAACATCATGCTGGTC
AAGATCTTCATCACTAACTCCGCCATGCGCAGCGTGCCCAACATCTTCATCAGCAACCTCGCTGC
TGGCGACCTGCTGCTGCTCCTGACCTGCGTCCCCGTGGATGCTTCCCGCTACTTCTTCGACGAGT
GGATGTTCGGCAAGGTCGGTTGTAAACTGATCCCCGTGATCCAGCTGACCTCCGTCGGCGTGTCC
GTCTGGACCCTGACTGCTCTGAGCGCTGACCGCTACCGCGCCATCGTGAACCCCATGGACATGC
AGACTTCCGGTGCCCTGCTCCGCACTTGCGTCAAGGCTATGGGTATCTGGGTGGTCAGCGTGCTC
CTGGCTGTGCCTGAAGCCGTGTTTAGCGAGGTGGCTCGTATCTCCAGCCTCGACAACTCCAGCTT
TACCGCCTGCATCCCCTACCCCCAAACCGACGAGCTCCACCCCAAGATCCATAGCGTGCTCATCT
TCCTCGTCTATTTCCTGATCCCCCTGGCCATCATCTCCATCTATTACTATCACATTGCCAAAACTCT
CATCAAGTCCGCTCATAACCTCCCCGGCGAGTACAATGAGCACACTAAGAAACAGATGGAGACT
CGCAAGCGCCTCGCTAAGATCGTCCTGGTGTTCGTCGGCTGCTTCATCTTCTGCTGGTTCCCCAA
CCACATTCTCTACATGTACCGTAGCTTTAACTACAACGAGATCGACCCCAGCCTGGGCCACATGA
TCGTGACTCTCGTGGCTCGTGTGCTCTCCTTCGGCAACTCCTGCGTGAACCCCTTCGCTCTCTAC
CTCCTGAGCGAGAGCTTCCGCCGTCATTTCAACTCCCAGCTCTGCTGTGGCCGCAAGTCCTACCA
GGAGCGTGGCACCAGCTACCTGCTCAGCAGCAGCGCCGTCCGCATGACCAGCCTGAAGTCCAA
CGCCAAGAACATGGTGACCAACTCCGTCCTGCTGAATGGCCACTCCATGAAGCAGGAGATGGCC
CTCGGTGGTTCAGGTGGAGGTGGTTCTGGCGGTGGTGCGAGTAGAGTTGTTTTGTCTTTACCATT
TGCTGAAGGTTCATCATCTGTAGAATACATTAATAACTGGGAACAAGCTAAAGCCTTGTCAGTTG
AACTGGAAATCAATTTCGAAACTAGAGGTAAGAGAGGTCAAGATGCTATGTACGAATATATGGCC
CAAGCTTGCGCTGGTAATAGAGTCAGAAGG
<融合蛋白II>
在一些实施方案中,融合蛋白II由第二蛋白与第二结构域融合形成。其中第二蛋白选自G蛋白或其功能变体,第二结构域选自形成报告蛋白的氨基端结构域。
在另外一些实施方案中,融合蛋白II由第二蛋白与第一结构域融合形成。其中第二蛋白选自G蛋白或其功能变体,第一结构域选自形成报告蛋白的羧基端结构域。
在本公开中,第一结构域或第二结构域可以融合于第二蛋白内部或氨基端的任意可融合位置。
在一些可选的实施方案中,融合蛋白II由第二结构域融合于第二蛋白的氨基端形成;在另外一些可选的实施方案中,融合蛋白II由第二结构域融合于第二蛋白的内部形成;在另外一些可选的实施方案中,融合蛋白II由第一结构域融合于第二蛋白的氨基端形成;在另外一些可选的实施方案中,融合蛋白II由第一结构域融合于第二蛋白的内部形成。
在一些可选的实施方案中,融合蛋白II还包括用于连接第二蛋白与第一结构域或第二结构域的连接肽。示例性的,连接肽是由甘氨酸和丝氨酸残基伸展组成的GS连接肽。
在一些具体的实施方案中,本公开以miniG作为第二蛋白,以DTA的氨基端结构域(DTANTD)作为第二结构域。将DTANTD融合于miniG的氨基端,形成融合蛋白II。
示例性地,沿氨基端(N)向羧基端(C)方向,融合蛋白II的结构为(k3)(N)-DTANTD-miniG蛋白-(C)。
在一些具体的实施方案中,融合蛋白II中还包括连接miniG与DTANTD的连接肽。
示例性地,沿氨基端(N)向羧基端(C)方向,融合蛋白II的结构为(k4)(N)-DTANTD-连接肽-miniG蛋白-(C)。
在一些可选的实施方案中,融合蛋白II的氨基酸序列如SEQ ID NO:21所示,或与SEQ ID NO:21所示的氨基酸序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性,且具有如SEQID NO:21所示蛋白活性的序列。
在一些可选的实施方案中,编码融合蛋白II的核苷酸序列如SEQ ID NO:22所示,或与SEQ ID NO:22所示的核苷酸序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性,且编码具有如SEQ ID NO:21所示蛋白活性的蛋白的核苷酸序列。
在一些更具体的实施方案中,DTANTD插入在miniGs氨基酸序列的氨基端。
融合蛋白II的氨基酸序列(SEQ ID NO:21):
MGADDVVDSSKSFVMENFSSYHGTKPGYVDSIQKGIQKPKSGTQGNYDDDWKGFYSTDNKYDAAGYSVDNENPLSGKAGGVVKVTYPGLTKVLALKVDNAETIKKELGLSLTEPLMEQVGTEEFIKRFGDGGSGGSGGIEKQLQKDKQVYRATHRLLLLGADNSGKSTIVKQMRILHGGSGGSGGTSGIFETKFQVDKVNFHMFDVGGQRDERRKWIQCFNDVTAIIFVVDSSDYNRLQEALNDFKSIWNNRWLRTISVILFLNKQDLLAEKVLAGKSKIEDYFPEFARYTTPEDATPEPGEDPRVTRAKYFIRDEFLRISTASGDGRHYCYPHFTCAVDTENARRIFNDCRDIIQRMHLRQYELL
编码融合蛋白II的核苷酸序列(SEQ ID NO:22):
ATGGGTGCTGATGATGTTGTGGATTCTTCTAAATCGTTTGTTATGGAAAATTTCAGTTCTTACCACGGTACAAAGCCAGGTTATGTTGATAGTATTCAAAAAGGTATTCAAAAACCAAAATCTGGTACACAGGGTAATTATGATGATGATTGGAAGGGTTTTTATTCCACCGATAACAAGTACGACGCCGCCGGTTATAGTGTTGATAACGAAAATCCATTGTCAGGCAAAGCTGGTGGTGTCGTTAAAGTTACGTACCCAGGTTTAACCAAAGTGTTGGCTCTTAAAGTTGATAATGCAGAAACCATAAAAAAGGAATTGGGTTTGTCTTTGACAGAACCATTAATGGAACAAGTTGGAACAGAAGAATTCATCAAGAGATTTGGTGATGGTGGTTCAGGAGGCTCCGGAGGTATCGAGAAGCAGCTGCAGAAGGACAAGCAGGTGTACCGCGCCACACATCGTCTGCTGCTGCTGGGAGCCGATAACAGCGGCAAGAGCACCATCGTGAAGCAGATGCGCATTTTGCACGGAGGAAGCGGAGGAAGCGGAGGAACCAGCGGCATCTTCGAGACCAAGTTCCAAGTGGACAAGGTCAACTTCCACATGTTTGATGTGGGCGGACAGCGAGACGAACGCCGCAAGTGGATCCAGTGCTTCAACGACGTGACCGCCATCATCTTCGTCGTGGACAGCAGCGACTACAACCGTCTGCAGGAGGCCCTGAACGACTTCAAGAGCATTTGGAACAACCGTTGGCTGCGCACCATCAGCGTGATCCTGTTCCTGAACAAGCAGGACCTGCTGGCGGAGAAGGTCTTGGCCGGCAAGAGCAAGATCGAGGACTACTTCCCCGAGTTTGCCCGCTACACCACACCAGAGGATGCCACCCCAGAGCCAGGAGAAGATCCACGAGTGACCCGCGCCAAGTACTTCATCCGCGATGAGTTCCTGCGCATTAGCACCGCTAGCGGAGACGGACGCCACTATTGCTACCCACACTTCACTTGCGCCGTGGACACCGAGAACGCTCGCCGCATCTTCAACGATTGCCGCGATATCATCCAGCGCATGCACCTGCGCCAGTACGAGCTGTTGTAG
在另一些更具体的实施方案中,DTANTD插入在miniGq氨基酸序列的氨基端。
融合蛋白II的氨基酸序列(SEQ ID NO:23):
GADDVVDSSKSFVMENFSSYHGTKPGYVDSIQKGIQKPKSGTQGNYDDDWKGFYSTDNKYDAAG
YSVDNENPLSGKAGGVVKVTYPGLTKVLALKVDNAETIKKELGLSLTEPLMEQVGTEEFIKRFGDG
GSGGGGSGGMIEKQLQKDKQVYRATHRLLLLGADNSGKSTIVKQMRILHGGSGGSGGTSGIFETKF
QVDKVNFHMFDVGGQRDERRKWIQCFNDVTAIIFVVDSSDYNRLQEALNDFKSIWNNRWLRTISVI
LFLNKQDLLAEKVLAGKSKIEDYFPEFARYTTPEDATPEPGEDPRVTRAKYFIRDEFLRISTASGDGR
HYCYPHFTCAVDTENARRIFNDCRDIIQRMHLRQYELL
编码融合蛋白II的核苷酸序列(SEQ ID NO:24):
GGTGCTGATGATGTTGTGGATTCTTCTAAATCGTTTGTTATGGAAAATTTCAGTTCTTACCACGGT
ACAAAGCCAGGTTATGTTGATAGTATTCAAAAAGGTATTCAAAAACCAAAATCTGGTACACAGG
GTAATTATGATGATGATTGGAAGGGTTTTTATTCCACCGATAACAAGTACGACGCCGCCGGTTATA
GTGTTGATAACGAAAATCCATTGTCAGGCAAAGCTGGTGGTGTCGTTAAAGTTACGTACCCAGGT
TTAACCAAAGTGTTGGCTCTTAAAGTTGATAATGCAGAAACCATAAAAAAGGAATTGGGTTTGTC
TTTGACAGAACCATTAATGGAACAAGTTGGAACAGAAGAATTCATCAAGAGATTTGGTGATGGT
GGTTCAGGAGGCGGTGGTTCAGGAGGCATGATCGAGAAGCAGCTGCAGAAGGACAAGCAGGTG
TACCGCGCCACACATCGTCTGCTGCTGCTGGGAGCCGATAACAGCGGCAAGAGCACCATCGTGA
AGCAGATGCGCATTTTGCACGGAGGAAGCGGAGGAAGCGGAGGAACCAGCGGCATCTTCGAGA
CCAAGTTCCAAGTGGACAAGGTCAACTTCCACATGTTTGATGTGGGCGGACAGCGAGACGAAC
GCCGCAAGTGGATCCAGTGCTTCAACGACGTGACCGCCATCATCTTCGTCGTGGACAGCAGCGA
CTACAACCGTCTGCAGGAGGCCCTGAACGACTTCAAGAGCATTTGGAACAACCGTTGGCTGCGC
ACCATCAGCGTGATCCTGTTCCTGAACAAGCAGGACCTGCTGGCGGAGAAGGTCTTGGCCGGCA
AGAGCAAGATCGAGGACTACTTCCCCGAGTTTGCCCGCTACACCACACCAGAGGATGCCACCCC
AGAGCCAGGAGAAGATCCACGAGTGACCCGCGCCAAGTACTTCATCCGCGATGAGTTCCTGCGC
ATTAGCACCGCTAGCGGAGACGGACGCCACTATTGCTACCCACACTTCACTTGCGCCGTGGACA
CCGAGAACGCTCGCCGCATCTTCAACGATTGCCGCGATATCATCCAGCGCATGCACCTGCGCCAG
TACGAGCTGTTGTAG
在一些具体的实施方案中,本公开以miniG作为第二蛋白,以DTA的氨基端结构域(DTANTD)作为第二结构域。将DTANTD融合于miniG的内部,形成融合蛋白II。在DTANTD融合于miniG的内部后,沿氨基端(N)向羧基端(C)方向,miniG被划分为miniG蛋白片段I和miniG蛋白片段II。
示例性地,沿氨基端(N)向羧基端(C)方向,融合蛋白II的结构为(k1)(N)-miniG蛋白片段I-DTANTD-miniG蛋白片段II-(C)。
在一些具体的实施方案中,融合蛋白II中还包括分别连接DTANTD与miniG蛋白片段I、miniG蛋白片段II的连接肽。
示例性地,沿氨基端(N)向羧基端(C)方向,融合蛋白II的结构为(k2)(N)-miniG蛋白片段I-连接肽-DTANTD-连接肽-miniG蛋白片段II-(C)。
在一些更具体的实施方案中,DTANTD插入在miniGs氨基酸序列的第188位与第189位氨基酸之间。
融合蛋白II的氨基酸序列(SEQ ID NO:17):
MIEKQLQKDKQVYRATHRLLLLGADNSGKSTIVKQMRILHGGSGGSGGTSGIFETKFQVDKVNFHMFDVGGQRDERRKWIQCFNDVTAIIFVVDSSDYNRLQEALNDFKSIWNNRWLRTISVILFLNKQDLLAEKVLAGKSKIEDYFPEFARYTTPEDATPEPGEDPRVTRAKYFIRDEFLRISTASGGSGGSGADDVVDSSKSFVMENFSSYHGTKPGYVDSIQKGIQKPKSGTQGNYDDDWKGFYSTDNKYDAAGYSVDNENPLSGKAGGVVKVTYPGLTKVLALKVDNAETIKKELGLSLTEPLMEQVGTEEFIKRFGDGGSGGSGGDGRHYCYPHFTCAVDTENARRIFNDCRDIIQRMHLRQYELL
编码融合蛋白II的核苷酸序列(SEQ ID NO:18):
ATGATCGAGAAGCAGCTGCAGAAGGACAAGCAGGTGTACCGCGCCACACATCGTCTGCTGCTGCTGGGAGCCGATAACAGCGGCAAGAGCACCATCGTGAAGCAGATGCGCATTTTGCACGGAGGAAGCGGAGGAAGCGGAGGAACCAGCGGCATCTTCGAGACCAAGTTCCAAGTGGACAAGGTCAACTTCCACATGTTTGATGTGGGCGGACAGCGAGACGAACGCCGCAAGTGGATCCAGTGCTTCAACGACGTGACCGCCATCATCTTCGTCGTGGACAGCAGCGACTACAACCGTCTGCAGGAGGCCCTGAACGACTTCAAGAGCATTTGGAACAACCGTTGGCTGCGCACCATCAGCGTGATCCTGTTCCTGAACAAGCAGGACCTGCTGGCGGAGAAGGTCTTGGCCGGCAAGAGCAAGATCGAGGACTACTTCCCCGAGTTTGCCCGCTACACCACACCAGAGGATGCCACCCCAGAGCCAGGAGAAGATCCACGAGTGACCCGCGCCAAGTACTTCATCCGCGATGAGTTCCTGCGCATTAGCACCGCTAGCGGAGGTTCTGGTGGTTCTGGTGCTGATGATGTTGTGGATTCTTCTAAATCGTTTGTTATGGAAAATTTCAGTTCTTACCACGGTACAAAGCCAGGTTATGTTGATAGTATTCAAAAAGGTATTCAAAAACCAAAATCTGGTACACAGGGTAATTATGATGATGATTGGAAGGGTTTTTATTCCACCGATAACAAGTACGACGCCGCCGGTTATAGTGTTGATAACGAAAATCCATTGTCAGGCAAAGCTGGTGGTGTCGTTAAAGTTACGTACCCAGGTTTAACCAAAGTGTTGGCTCTTAAAGTTGATAATGCAGAAACCATAAAAAAGGAATTGGGTTTGTCTTTGACAGAACCATTAATGGAACAAGTTGGAACAGAAGAATTCATCAAGAGATTTGGTGATGGTGGTTCAGGAGGCTCCGGAGGTGACGGACGCCACTATTGCTACCCACACTTCACTTGCGCCGTGGACACCGAGAACGCTCGCCGCATCTTCAACGATTGCCGCGATATCATCCAGCGCATGCACCTGCGCCAGTACGAGCTGTTGTAG
在一些更具体的实施方案中,DTANTD插入在miniGs氨基酸序列的第116位与第117位氨基酸之间。
融合蛋白II的氨基酸序列(SEQ ID NO:19):
MIEKQLQKDKQVYRATHRLLLLGADNSGKSTIVKQMRILHGGSGGSGGTSGIFETKFQVDKVNFHM
FDVGGQRDERRKWIQCFNDVTAIIFVVDSSDYNRLQEALNDFKSIWNNRWGSGGSGADDVVDSSK
SFVMENFSSYHGTKPGYVDSIQKGIQKPKSGTQGNYDDDWKGFYSTDNKYDAAGYSVDNENPLSG
KAGGVVKVTYPGLTKVLALKVDNAETIKKELGLSLTEPLMEQVGTEEFIKRFGDGGSGGSGGLRTIS
VILFLNKQDLLAEKVLAGKSKIEDYFPEFARYTTPEDATPEPGEDPRVTRAKYFIRDEFLRISTASGDG
RHYCYPHFTCAVDTENARRIFNDCRDIIQRMHLRQYELL
编码融合蛋白II的核苷酸序列(SEQ ID NO:20):
ATGATCGAGAAGCAGCTGCAGAAGGACAAGCAGGTGTACCGCGCCACACATCGTCTGCTGCTGCTGGGAGCCGATAACAGCGGCAAGAGCACCATCGTGAAGCAGATGCGCATTTTGCACGGAGGAAGCGGAGGAAGCGGAGGAACCAGCGGCATCTTCGAGACCAAGTTCCAAGTGGACAAGGTCAACTTCCACATGTTTGATGTGGGCGGACAGCGAGACGAACGCCGCAAGTGGATCCAGTGCTTCAACGACGTGACCGCCATCATCTTCGTCGTGGACAGCAGCGACTACAACCGTCTGCAGGAGGCCCTGAACGACTTCAAGAGCATTTGGAACAACCGTTGGGGTTCTGGTGGTTCTGGTGCTGATGATGTTGTGGATTCTTCTAAATCGTTTGTTATGGAAAATTTCAGTTCTTACCACGGTACAAAGCCAGGTTATGTTGATAGTATTCAAAAAGGTATTCAAAAACCAAAATCTGGTACACAGGGTAATTATGATGATGATTGGAAGGGTTTTTATTCCACCGATAACAAGTACGACGCCGCCGGTTATAGTGTTGATAACGAAAATCCATTGTCAGGCAAAGCTGGTGGTGTCGTTAAAGTTACGTACCCAGGTTTAACCAAAGTGTTGGCTCTTAAAGTTGATAATGCAGAAACCATAAAAAAGGAATTGGGTTTGTCTTTGACAGAACCATTAATGGAACAAGTTGGAACAGAAGAATTCATCAAGAGATTTGGTGATGGTGGTTCAGGAGGCTCCGGAGGTCTGCGCACCATCAGCGTGATCCTGTTCCTGAACAAGCAGGACCTGCTGGCGGAGAAGGTCTTGGCCGGCAAGAGCAAGATCGAGGACTACTTCCCCGAGTTTGCCCGCTACACCACACCAGAGGATGCCACCCCAGAGCCAGGAGAAGATCCACGAGTGACCCGCGCCAAGTACTTCATCCGCGATGAGTTCCTGCGCATTAGCACCGCTAGCGGAGACGGACGCCACTATTGCTACCCACACTTCACTTGCGCCGTGGACACCGAGAACGCTCGCCGCATCTTCAACGATTGCCGCGATATCATCCAGCGCATGCACCTGCGCCAGTACGAGCTGTTGTAG
<nSPS系统>
本公开进一步提供了由融合蛋白I与融合蛋白II构建的负向生存压力筛选(negatie Survival Pressure Selection,nSPS)系统。其中,融合蛋白I、融合蛋白II可以分别独立地选自上述任意类型的融合蛋白。
本公开的一些实施方案中,基于GPCR在被激活时会招募G蛋白这一基本原理,利用白喉毒素A亚基1(Diphtheria Toxin A subunit,DTA)作为报告蛋白,在酿酒酵母BJ5465中建立了一种新型的nSPS系统用于筛选特定的GPCR拮抗剂。在该系统中,当GPCR被激活时,被分割的报告蛋白会在受体和G蛋白的作用下重新结合成具完整的有功能的毒蛋白,抑制酵母的生长,而某些可以抑制靶点GPCR活性的拮抗剂分子则可以通过抑制毒性蛋白形成,降低酵母生长受到的抑制作用。利用nSPS系统时,可以通过已有的激动剂,将酵母的生长速率控制在较低的水平,再利用拮抗剂带来的累积的生长优势,使一些亲和力或抑制性较低的化合物也能够被筛选出来。该方法通过生长速率指示目的GPCR拮抗剂的存在,因此可以用于GPCR拮抗剂药物的高通量筛选。
在本公开的一些实施方案中,nSPS系统的建立是基于蛋白片段互补方法(Protein-fragment Complimentary Assay,PCA)的原理。PCA是用于研究蛋白相互作用的一种常用的方法,传统方法常使用荧光蛋被白作为报告蛋白,将荧光蛋白分成互补的两部分连接到可能有相互作用的两个蛋白质上,当这两个蛋白质发生相互作用时,被分开的荧光蛋白就会被拉近并形成有功能的荧光蛋白并产生荧光作用11,12,13。而本公开通过将有满足本公开设计需求的功能的报告蛋白分成两部分,连接在已知有相互作用的GPCR和miniG蛋白上,通过小分子控制GPCR和miniG蛋白的相互作用,从而控制报告蛋白的功能,进而开发成基于功能的GPCR拮抗剂筛选的体系。
在本公开中,本公开的目标是找到一种蛋白质,只需要控制单个蛋白功能的开启,就可以实现对酵母生长的抑制。本公开以DTA为例进行说明,为了保证DTA仅可以在受体与miniG蛋白发生作用时重组成有功能的毒性蛋白,本公开基于已有的结构设计了DTA蛋白(PDB ID:1SGK)的分割方法以及与β2AR-Gs复合物(PDB ID:3SN6)的融合表达策略,最终本公开将DTA从D129附近的柔性区域进行拆分,形成由氨基端形成的DTANTD和羧基端形成的DTACTD。对于较短的DTACTD,本公开的一些具体的实施方案中,使用10个GS氨基酸将其连接在β2AR的羧基端。对于较长的DTANTD,本公开的一些具体实施方案中,提出了三种与小G蛋白相连的方式,通过在DTANTD两端各加上合适长度(如氨基端5个,羧基端8个)的GS氨基酸插入到miniG蛋白的两个柔性区或者通过合适的GS氨基酸序列连接到miniG蛋白的氨基端。本公开将转入了构建好的质粒的BJ5465酵母称为BJ5465-β2AR-nSPS菌株/酵母,这种酵母的生长速度会受到β2AR激动剂和拮抗剂的影响。
示例性的,图1中的a示出负向生存压力筛选系统的原理示意图。GPCR受体与miniG蛋白分别融合DTA的羧基端结构域(DTACTD)与氨基端结构域(DTANTD)并且表达于酿酒酵母细胞膜与细胞质中。
GPCR被激动剂激活后会与胞内的miniG蛋白结合从而促进形成有功能的DTA蛋白,使得宿主细胞(例如,酵母细胞)的生长受到抑制(例如生长减慢或终止)。或者,首先使用GPCR激动剂使GPCR被激活,使得宿主细胞(例如,酵母细胞)的生长受到抑制,将酵母的生长速率控制在较低的水平,然后在待筛选药物的处理下,如果GPCR的激活效果被竞争性减弱或消除,则酵母的生长被恢复,生长速率提高。
在一些实施方案中,所述nSPS系统中还包含GPCR激动剂。GPCR激动剂可以是任何已知的GPCR激动剂,例如异丙肾上腺素。
图1中b的示出nSPS系统中融合蛋白I、融合蛋白II的结构设计示意图。DTA蛋白在合适的位置分割开并且分别融合于miniG蛋白与GPCR上。当GPCR与miniG蛋白形成复合物时,DTA分开的两部分才可以在复合物附近合适的位置结合形成有功能的蛋白。被分割成两半的DTA,用合适的GS连接肽(虚线)连接在GPCR羧基端和miniG上。当受体被激活时,当受体被激活时,DTA会合在一起并发挥功能。
在一些可选的实施方案中,本公开基于β2AR、miniG蛋白(miniGs)、DTA蛋白构建了nSPS系统(β2-D3.0)。
在一些可选的实施方案中,本公开基于NMBR、miniG蛋白(miniGsq)、DTA蛋白构建了nSPS系统(NMBR-D3.0)。
需要说明的是,基于实际应用的需要,本公开中的nSPS系统还可以由其他种类的GPCR、G蛋白或具有细胞毒性的蛋白形成。本公开提供的nSPS系统经过简单的调整即可适用于其他类型的GPCR,具有广泛的推广应用的价值。
重组核酸分子
本公开进一步提供表达融合蛋白的重组核酸分子,其包含编码融合蛋白I、融合蛋白II的核苷酸序列,可用于在细胞内表达融合蛋白I、融合蛋白II,以构建用于GPCR药物筛选的细胞模型。
在一些实施方案中,重组核酸分子包括可操作地连接的如下所示元件:
第一编码区,所述第一编码区包含用于编码融合蛋白I的第一编码序列;以及,
第二编码区,所述第二编码区包含用于编码融合蛋白II的第二编码序列。
在一些可选的实施方案中,第一编码序列如SEQ ID NO14或16任一项所示的核苷酸序列,或是与SEQ ID NO:14或16任一项所示的核苷酸序列相比具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性,且编码具有如SEQ ID NO:13或15任一项所示序列编码的蛋白活性的蛋白的核苷酸序列。
在一些可选的实施方案中,第二编码序列如SEQ ID NO:18、20、22或24任一项所示的核苷酸序列,或是与SEQ ID NO:18、20、22或24任一项所示的核苷酸序列相比具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性,且编码具有如SEQ ID NO:17、19、21或23任一项所示序列编码的蛋白活性的蛋白的核苷酸序列。
在一些具体的实施方案中,所述重组核酸分子还包括与所述第一编码区或所述第二编码区可操作地连接的一个或多个启动子。例如,启动子是连接所述第一编码区和所述第二编码区的双向启动子。
在一些更为具体的实施方案中,所述第一编码区位于所述双向启动子的上游,所述第二编码区位于所述双向启动子的下游。在另外一些更为具体的实施方案中,所述第二编码区位于所述双向启动子的上游,所述第一编码区位于所述双向启动子的下游。其中,双向启动子可以为任意类型,本公开不进行限制性限定。作为示例,双向启动子为GAL1,10。
在另外一些具体的实施方案中,第一编码区与第二编码区彼此独立地存在。例如,第一编码区与第二编码区分别位于两个重组载体中。
重组酵母细胞
本公开提供的重组酵母细胞,表达本公开提供的任意一种的融合蛋白的组合物,或者包含本公开提供的任意一种的编码融合蛋白的组合物的重组核酸分子。
在一些实施方案中,本公开中的重组酵母细胞来源于酿酒酵母细胞。酿酒酵母(Saccharomyces cerevisiae)是目前研究较多的单细胞模式生物。相比于哺乳动物细胞或者昆虫细胞,以酿酒酵母作为宿主细胞构建药物筛选系统具有如下优势:酵母内源的GPCR/G蛋白信号通路与人源GPCR/G蛋白信号通路几乎完全正交,可以在很大程度上避免由于信号交联响应引发的假阳性结果。其次,GPCR可以在酵母里面表达并且维持其原有功能。此外,与哺乳动物培养相比,酵母的培养简单快速,并且酵母对于DMSO和乙醇等常用的有机溶剂更为耐受。
高通量筛选装置
本公开提供的高通量筛选装置,包括:
药物模块,用于存储待筛选药物;
菌株接种模块,用于向所述药物模块中接种本公开任意一种的重组酵母细胞,使所述重组酵母细胞与所述待筛选药物接触;
培养模块,用于培养接种于所述药物模块中的所述重组酵母细胞;
测量模块,用于获取所述培养模块中培养后的重组酵母细胞的生长速度;
判定模块,用于根据所述重组酵母细胞的生长速度,判断所述待筛选药物是否为目标筛选药物。
本公开提供的高通量筛选装置,能够实现对GPCR药物的高通量筛选,在较大的筛选范围中精确鉴定到靶点GPCR的激动剂或拮抗剂,并且对于筛选发现较低亲和力的新型激动剂或拮抗剂方面具有显著的效果。
在一些实施方案中,高通量筛选装置还包括用于将所述待筛选药物转移至所述药物模块的转移模块。示例性地,转移模块为声波液体转移系统Echo550。
在一些实施方案中,所述药物模块包括具有阵列微孔的多孔板,所述微孔相互独立地设置于所述多孔板上,所述待筛选药物储存于第一预设数量的所述微孔内。在另外一些实施方案中,所述药物模块还可以包括其他种类的储存机构,具体而言,只要能够实现对待筛选药物的储存即可。
在一些可选的实施方案中,为实现对待筛选药物的高通量筛选,可设置第一预设数量为至少50,优选至少100,更优选至少300。示例性地,第一预设数量为50、55、50、65、70、75、80、85、90、95、100、200、300、400、500、600、1000等等。本公开对此不进行穷举,多孔板中微孔的第一预设数量可根据所需筛选的药物分子的种类数决定。
进一步地,多孔板的微孔内还包含用于培养重组酵母细胞的培养基,利用转移模块可将待筛选药物转移至微孔中含有培养基的多孔板内。示例性地,利用Echo550可将储存于第一多孔板内的待筛选药物,转移至微孔中含有培养基的第二多孔板,其中待筛选药物转移后的第二多孔板作为药物模块。
在一些实施方案中,重组酵母细胞在菌株接种模块中被接种于转移有待筛选药物分子的药物模块中,使重组酵母细胞与待筛选药物分子接触。而重组酵母细胞中nSPS系统与待筛选药物分子作用后,若nSPS系统中GPCR被激活/抑制,可有效抑制或促进重组酵母细胞的生长,将待筛选药物的药物作用信息转化为重组酵母细胞的生长信息。
在一些实施方案中,所述测量模块用于获取所述培养模块中培养后的所述重组酵母细胞的OD值。示例性地,测量模块是能够检测多孔板中微孔内OD值变化的酶标仪。通过检测微孔内的OD值,可以反馈重组酵母细胞的生长速度,进而反馈待筛选药物对GPCR的激活作用。
在一些实施方案中,所述判定模块用于根据所述重组酵母细胞的OD值,判定所述待筛选药物是否为GPCR激动剂或拮抗剂。示例性地,在判定模块中,通过对重组酵母细胞与待筛选药物接触后OD600进行计算和统计,并将每孔重组酵母细胞生长曲线绘制在一起,其中生长速度以OD600变化倍数表现。
药物筛选的方法
本公开提供的药物筛选的方法,包括:
培养步骤:在筛选培养中培养本公开中任意一种的重组酵母细胞;
药物处理步骤:使用待筛选药物处理所述重组酵母细胞;
比较步骤:比较所述药物处理后的重组酵母细胞,与未进行药物处理的重组酵母细胞的生长速度;
判断步骤:根据所述重组酵母细胞的生长速度,判断所述待筛选药物是否为目标筛选药物。
在一些实施方案中,所述筛选培养基为用于筛选GPCR激动剂或拮抗剂的培养基。
在一些可选的实施方案中,用于筛选GPCR拮抗剂的培养基是包含GPCR激动剂的培养基,筛选培养基中培养的重组酵母细胞是基于具有细胞毒性的蛋白的报告蛋白构建形成。
进一步地,在判断步骤中,若药物处理后的重组酵母细胞的生长速度,高于未进行药物处理的重组酵母细胞的生长速度,则判断待筛选药物为GPCR拮抗剂。
在另外一些实施方案中,所述筛选培养基为用于筛选GPCR激动剂的培养基。
在一些可选的实施方案中,用于筛选GPCR激动剂的培养基可以是任何适于培养酵母细胞的培养基。
进一步地,在判断步骤中,若药物处理后的重组酵母细胞的生长速度,低于未进行药物处理的重组酵母细胞的生长速度,则判断待筛选药物为GPCR激动剂。
利用上述的药物筛选的方法,可实现对GPCR待筛选药物的特异性筛选,产生具有高灵敏度、直接可靠的生长报告信号,适合与GPCR亲和力低或激活作用较弱的药物分子的筛选,对于GPCR的新药发现具有非常重要临床价值。
实施例
本公开的其他目的、特征和优点将从以下详细描述中变得明显。但是,应当理解的是,详细描述和具体实施例(虽然表示本公开的具体实施方案)仅为解释性目的而给出,因为在阅读该详细说明后,在本公开的精神和范围内所作出的各种改变和修饰,对于本领域技术人员来说将变得显而易见。
本实施例中所用到的实验技术与实验方法,如无特殊说明均为常规技术方法,例如下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。实施例中所使用的材料、试剂等,如无特殊说明,均可通过正规商业渠道获得。
下述实施例中涉及的菌株、细胞株及试剂耗材如下表1所示:
表1
实施例1:重组质粒pYD-nSPS-b2AR及pYD-nSPS-NMBR2的构建
本公开中所使用的酿酒酵母菌株均为BJ5465。BJ5465菌株具有亮氨酸(LEU2)及色氨酸(TRP1)遗传转化筛选标记,pYD1质粒中包含用于酿酒酵母转化筛选的TRP1选择性标签。首先,以pYD1质粒为模板,使用引物1和引物2进行PCR扩增,将pYD1质粒中的TRP1选择性标签替换为LEU2选择性标签,得到重组质粒pYD-SPS。
一、重组质粒pYD-nSPS-b2AR的构建
所使用的DTA全长基因由北京祥鸿生物科技有限公司合成,所使用的载体为Top10载体。
pYD-SPS质粒中包含有一诱导型双向启动子GAL1,10,可以在半乳糖存在时诱导其两侧的两个不同类型的蛋白进行表达(以下按照“下游”和“上游”区分该启动子启动表达的两个方向)。使用引物3和引物4,以pcDNA3.1-β2AR为模板扩增β2AR-第一连接肽(第一连接肽作为柔性连接区域可融合于β2AR蛋白的羧基端)的基因片段1,使用反向扩增PCR将基因片段1插入在启动子GAL1,10的下游;使用引物5和引物6,以包含合成的DTA全长基因的质粒为模板,扩增表达DTACTD的基因片段2,使用反向扩增PCR将其插入基因片段1的下游,以使DTACTD融合在β2AR-第一连接肽的羧基端;形成位于启动子下游的第一编码区,第一编码区用于编码由DTACTD与β2AR融合形成的融合蛋白I。
基因片段1的核苷酸序列(SEQ ID NO:25):
ATGGGGCAACCCGGGAACGGCAGCGCCTTCTTGCTGGCACCCAATAGAAGCCATGCGCCGGACCACGACGTCACGCAGCAAAGGGACGAGGTGTGGGTGGTGGGCATGGGCATCGTCATGTCTCTCATCGTCCTGGCCATCGTGTTTGGCAATGTGCTGGTCATCACAGCCATTGCCAAGTTCGAGCGTCTGCAGACGGTCACCAACTACTTCATCACTTCACTGGCCTGTGCTGATCTGGTCATGGGCCTGGCAGTGGTGCCCTTTGGGGCCGCCCATATTCTTATGAAAATGTGGACTTTTGGCAACTTCTGGTGCGAGTTTTGGACTTCCATTGATGTGCTGTGCGTCACGGCCAGCATTGAGACCCTGTGCGTGATCGCAGTGGATCGCTACTTTGCCATTACTTCACCTTTCAAGTACCAGAGCCTGCTGACCAAGAATAAGGCCCGGGTGATCATTCTGATGGTGTGGATTGTGTCAGGCCTTACCTCCTTCTTGCCCATTCAGATGCACTGGTACCGGGCCACCCACCAGGAAGCCATCAACTGCTATGCCAATGAGACCTGCTGTGACTTCTTCACGAACCAAGCCTATGCCATTGCCTCTTCCATCGTGTCCTTCTACGTTCCCCTGGTGATCATGGTCTTCGTCTACTCCAGGGTCTTTCAGGAGGCCAAAAGGCAGCTCCAGAAGATTGACAAATCTGAGGGCCGCTTCCATGTCCAGAACCTTAGCCAGGTGGAGCAGGATGGGCGGACGGGGCATGGACTCCGCAGATCTTCCAAGTTCTGCTTGAAGGAGCACAAAGCCCTCAAGACGTTAGGCATCATCATGGGCACTTTCACCCTCTGCTGGCTGCCCTTCTTCATCGTTAACATTGTGCATGTGATCCAGGATAACCTCATCCGTAAGGAAGTTTACATCCTCCTAAATTGGATAGGCTATGTCAATTCTGGTTTCAATCCCCTTATCTACTGCCGGAGCCCAGATTTCAGGATTGCCTTCCAGGAGCTTCTGTGCCTG
基因片段2的核苷酸序列(SEQ ID NO:26):
GATTGCCTTCCAGGAGCTTCTGTGCCTGGGTGGTTCAGGTGGAGGTGGTTCTGGCGGTGGTGCGAGTAGAGTTGTTTTGTCTTTACCATTTGCTGAAGGTTCATCATCTGTAGAATACATTAATAACTGGGAACAAGCTAAAGCCTTGTCAGTTGAACTGGAAATCAATTTCGAAACTAGAGGTAAGAGAGGTCAAGATGCTATGTACGAATATATGGCCCAAGCTTGCGCTGGTAATAGAGTCAGAAGG
第一编码区的核苷酸序列,即编码融合蛋白I的核苷酸序列(SEQ ID NO:14):
ATGGGGCAACCCGGGAACGGCAGCGCCTTCTTGCTGGCACCCAATAGAAGCCATGCGCCGGACCACGACGTCACGCAGCAAAGGGACGAGGTGTGGGTGGTGGGCATGGGCATCGTCATGTCTCTCATCGTCCTGGCCATCGTGTTTGGCAATGTGCTGGTCATCACAGCCATTGCCAAGTTCGAGCGTCTGCAGACGGTCACCAACTACTTCATCACTTCACTGGCCTGTGCTGATCTGGTCATGGGCCTGGCAGTGGTGCCCTTTGGGGCCGCCCATATTCTTATGAAAATGTGGACTTTTGGCAACTTCTGGTGCGAGTTTTGGACTTCCATTGATGTGCTGTGCGTCACGGCCAGCATTGAGACCCTGTGCGTGATCGCAGTGGATCGCTACTTTGCCATTACTTCACCTTTCAAGTACCAGAGCCTGCTGACCAAGAATAAGGCCCGGGTGATCATTCTGATGGTGTGGATTGTGTCAGGCCTTACCTCCTTCTTGCCCATTCAGATGCACTGGTACCGGGCCACCCACCAGGAAGCCATCAACTGCTATGCCAATGAGACCTGCTGTGACTTCTTCACGAACCAAGCCTATGCCATTGCCTCTTCCATCGTGTCCTTCTACGTTCCCCTGGTGATCATGGTCTTCGTCTACTCCAGGGTCTTTCAGGAGGCCAAAAGGCAGCTCCAGAAGATTGACAAATCTGAGGGCCGCTTCCATGTCCAGAACCTTAGCCAGGTGGAGCAGGATGGGCGGACGGGGCATGGACTCCGCAGATCTTCCAAGTTCTGCTTGAAGGAGCACAAAGCCCTCAAGACGTTAGGCATCATCATGGGCACTTTCACCCTCTGCTGGCTGCCCTTCTTCATCGTTAACATTGTGCATGTGATCCAGGATAACCTCATCCGTAAGGAAGTTTACATCCTCCTAAATTGGATAGGCTATGTCAATTCTGGTTTCAATCCCCTTATCTACTGCCGGAGCCCAGATTTCAGGATTGCCTTCCAGGAGCTTCTGTGCCTGGGTGGTTCAGGTGGAGGTGGTTCTGGCGGTGGTGCGAGTAGAGTTGTTTTGTCTTTACCATTTGCTGAAGGTTCATCATCTGTAGAATACATTAATAACTGGGAACAAGCTAAAGCCTTGTCAGTTGAACTGGAAATCAATTTCGAAACTAGAGGTAAGAGAGGTCAAGATGCTATGTACGAATATATGGCCCAAGCTTGCGCTGGTAATAGAGTCAGAAGG
使用引物7和引物8,以pcDNA3.1-miniGs为模板,扩增miniGs蛋白的基因片段3,使用反向扩增PCR将其插入在启动子上游;使用引物9和引物10,以包含合成的DTA全长基因的质粒为模板,扩增DTANTD的基因片段4,将其插入基因片段3内的特定位置,以使DTANTD融合于miniGs蛋白特定位置,形成位于启动子上游的第二编码区,第二编码区用于编码由DTANTD与miniGs融合形成的融合蛋白II。
基因片段3的核苷酸序列(SEQ ID NO:27):
ATGATCGAGAAGCAGCTGCAGAAGGACAAGCAGGTGTACCGCGCCACACATCGTCTGCTGCTGCTGGGAGCCGATAACAGCGGCAAGAGCACCATCGTGAAGCAGATGCGCATTTTGCACGGAGGAAGCGGAGGAAGCGGAGGAACCAGCGGCATCTTCGAGACCAAGTTCCAAGTGGACAAGGTCAACTTCCACATGTTTGATGTGGGCGGACAGCGAGACGAACGCCGCAAGTGGATCCAGTGCTTCAACGACGTGACCGCCATCATCTTCGTCGTGGACAGCAGCGACTACAACCGTCTGCAGGAGGCCCTGAACGACTTCAAGAGCATTTGGAACAACCGTTGGCTGCGCACCATCAGCGTGATCCTGTTCCTGAACAAGCAGGACCTGCTGGCGGAGAAGGTCTTGGCCGGCAAGAGCAAGATCGAGGACTACTTCCCCGAGTTTGCCCGCTACACCACACCAGAGGATGCCACCCCAGAGCCAGGAGAAGATCCACGAGTGACCCGCGCCAAGTACTTCATCCGCGATGAGTTCCTGCGCATTAGCACCGCTAGCGGAGACGGACGCCACTATTGCTACCCACACTTCACTTGCGCCGTGGACACCGAGAACGCTCGCCGCATCTTCAACGATTGCCGCGATATCATCCAGCGCATGCACCTGCGCCAGTACGAGCTGTTGTAG
基因片段4的核苷酸序列(SEQ ID NO:28):
GGTTCTGGTGGTTCTGGTGCTGATGATGTTGTGGATTCTTCTAAATCGTTTGTTATGGAAAATTTCAGTTCTTACCACGGTACAAAGCCAGGTTATGTTGATAGTATTCAAAAAGGTATTCAAAAACCAAAATCTGGTACACAGGGTAATTATGATGATGATTGGAAGGGTTTTTATTCCACCGATAACAAGTACGACGCCGCCGGTTATAGTGTTGATAACGAAAATCCATTGTCAGGCAAAGCTGGTGGTGTCGTTAAAGTTACGTACCCAGGTTTAACCAAAGTGTTGGCTCTTAAAGTTGATAATGCAGAAACCATAAAAAAGGAATTGGGTTTGTCTTTGACAGAACCATTAATGGAACAAGTTGGAACAGAAGAATTCATCAAGAGATTTGGTGATGGTGGTTCAGGAGGCTCCGGAGGT
第二编码区的核苷酸序列,即编码融合蛋白II的核苷酸序列(SEQ ID NO:18):
ATGATCGAGAAGCAGCTGCAGAAGGACAAGCAGGTGTACCGCGCCACACATCGTCTGCTGCTGCTGGGAGCCGATAACAGCGGCAAGAGCACCATCGTGAAGCAGATGCGCATTTTGCACGGAGGAAGCGGAGGAAGCGGAGGAACCAGCGGCATCTTCGAGACCAAGTTCCAAGTGGACAAGGTCAACTTCCACATGTTTGATGTGGGCGGACAGCGAGACGAACGCCGCAAGTGGATCCAGTGCTTCAACGACGTGACCGCCATCATCTTCGTCGTGGACAGCAGCGACTACAACCGTCTGCAGGAGGCCCTGAACGACTTCAAGAGCATTTGGAACAACCGTTGGCTGCGCACCATCAGCGTGATCCTGTTCCTGAACAAGCAGGACCTGCTGGCGGAGAAGGTCTTGGCCGGCAAGAGCAAGATCGAGGACTACTTCCCCGAGTTTGCCCGCTACACCACACCAGAGGATGCCACCCCAGAGCCAGGAGAAGATCCACGAGTGACCCGCGCCAAGTACTTCATCCGCGATGAGTTCCTGCGCATTAGCACCGCTAGCGGAGGTTCTGGTGGTTCTGGTGCTGATGATGTTGTGGATTCTTCTAAATCGTTTGTTATGGAAAATTTCAGTTCTTACCACGGTACAAAGCCAGGTTATGTTGATAGTATTCAAAAAGGTATTCAAAAACCAAAATCTGGTACACAGGGTAATTATGATGATGATTGGAAGGGTTTTTATTCCACCGATAACAAGTACGACGCCGCCGGTTATAGTGTTGATAACGAAAATCCATTGTCAGGCAAAGCTGGTGGTGTCGTTAAAGTTACGTACCCAGGTTTAACCAAAGTGTTGGCTCTTAAAGTTGATAATGCAGAAACCATAAAAAAGGAATTGGGTTTGTCTTTGACAGAACCATTAATGGAACAAGTTGGAACAGAAGAATTCATCAAGAGATTTGGTGATGGTGGTTCAGGAGGCTCCGGAGGTGACGGACGCCACTATTGCTACCCACACTTCACTTGCGCCGTGGACACCGAGAACGCTCGCCGCATCTTCAACGATTGCCGCGATATCATCCAGCGCATGCACCTGCGCCAGTACGAGCTGTTGTAG
通过上述步骤,得到用于表达融合蛋白I和融合蛋白II的pYD-nSPS-b2AR(其核苷酸序列如SEQ ID NO:29所示),其中:
使用PrimeSTAR MAX DNA Polymerase(TaKaRa R045A)对构建载体所需要的DNA片段进行扩增,并通过琼脂糖凝胶电泳对DNA片段大小进行分析,正确扩增的DNA片段通过FastPure Gel DNA Extraction Mini Kit(Vazyme DC301-01)进行回收和载体构建。
使用反向扩增PCR的方法将带有和载体同源序列的目的DNA片段连接进入载体中,使用DPN1(NEB R0176L)对PCR反应产物进行酶切消化除去模板载体。消化产物通过热激法转化大肠杆菌Top10感受态并涂布于含有氨苄抗性的LB平板置于37摄氏度(℃)过夜培养。待单克隆菌落清晰可见时,挑取多个单克隆菌落对质粒进行测序鉴定,测序鉴定正确的质粒用于酿酒酵母BJ5465转化和后续功能测试。
二、重组质粒pYD-nSPS-NMBR2的构建
使用引物11和引物12扩增,以pcDNA3.1-NMBR为模板,扩增NMBR片段,并用该片段替换pYD-nSPS-b2AR中的b2AR片段,得到pYD-nSPS-NMBR1质粒,之后将pYD-nSPS-NMBR1质粒中miniGs的C端45bp替换为Gq(一种G蛋白,即miniGq)的相应序列,方法为使用含目的序列的引物扩增pYD-nSPS-NMBR1,得到pYD-nSPS-NMBR2(其核苷酸序列如SEQ ID NO:30所示),所使用的引物为引物13和引物14。
本实施例所采用的引物序列参见下表2。
表2
实施例2:重组酵母菌株的构建
实施例1中构建成功的重组质粒经过测序鉴定无误后使用HiPure Plasmid MicroKit(Magen01001-02)进行扩增用于酿酒酵母转化改造。具体过程如下:
1、制备酵母感受态细胞
(1)取保存于-80℃的酿酒酵母BJ5465菌株快速划线于YPD平板并置于30摄氏度培养48小时,至单克隆菌落清晰可见。
其中,YPD平板具体配置方法:20克蛋白胨,10克酵母提取物,15克琼脂粉,加水到900毫升,高压灭菌后加入100毫升20%葡萄糖水溶液,待温度下降到50度时倒入9厘米培养皿中,凝固后即为YPD平板。
(2)挑取单克隆菌株与5ml YPD培养液中,30℃、250rpm过夜震荡培养。第二天使用分光光度计测量酵母培养液的OD600,待其OD600值处于8-16时(饱和),使用YPD培养液将其稀释至OD600为0.2左右。并继续置于30℃、250rpm震荡培养,并监测其菌液密度,待其生长至对数生长期早期时(OD600为1.2-1.8)取出用于制备酿酒酵母感受态。
其中,YPD培养液具体配置方法:20克蛋白胨,10克酵母提取物,加水到900毫升,灭菌后加入100毫升20%葡萄糖水溶液。
(3)使用无菌的50ml离心管收集酵母菌体,离心速度为3500g,收集后的菌体使用预冷的无菌去离子水重悬并再次离心。收集离心后的菌体重悬于含有1M山梨醇,10mMTris-HCl(pH=7.5),1mM EDTA,100mM醋酸锂的缓冲液中,30℃250rpm震荡培养25-30分钟。向酵母中加入终浓度为10mM新鲜制备的DTT,继续培养15分钟。取出酵母并3500g离心5分钟收集菌体,使用预冷的无菌去离子水重悬并再次离心收集菌体。
(4)最终使用预冷的无菌去离子水重悬菌体,此时酿酒酵母处于容易接受外界DNA进入细胞内的状态,该酵母感受态可以直接用于电击转化或者通过梯度降温冻存。
2、质粒转染与单克隆菌株筛选
(1)取1μg质粒DNA(实施例1中制备的重组质粒pYD-nSPS-b2AR或pYD-nSPS-NMBR2的构建)与50μl步骤1中制备的酿酒酵母感受态于冰上混匀,并转移至提前预冷的电击杯中(Bio-Rad,1652086),使用GenePulser Xcell(Bio-Rad)对酵母进行电击转化,使用参数如下:方波,500V,15ms。向转化后的电击杯中加入1ml温度在30℃左右的YPD培养液,并将菌体转移至离心管中,置于30摄氏度静置培养1小时进行复苏。复苏后的酵母于3500g离心去除培养液,并使用亮氨酸缺陷培养液洗涤菌体,涂布于亮氨酸缺陷平板上,30℃静置48-72小时筛选转化子。
(2)待单克隆菌落清晰可见时,挑取单克隆于亮氨酸缺陷培养液中培养,待其生长至饱和时可以用于诱导表达以测试功能或者菌株冻存以备后用。若进行菌株冻存,取5ml饱和的酵母菌液于3500g离心5分钟收集菌体,使用含有10%无菌DMSO(Sigma D2650)的亮氨酸缺陷培养液重悬并速冻于-80摄氏度。
实施例3:检测BJ5465-β2AR-nSPS酵母生长速度
如实施例1和实施例2所述,将制备好的重组质粒pYD-nSPS-b2AR转入酵母感受态细胞,得到BJ5465-β2AR-nSPS菌株。将构建完成的BJ5465-β2AR-nSPS菌株在亮氨酸缺陷型不含半乳糖培养液中生长至饱和浓度并测量其OD600。将该酵母使用含有半乳糖的亮氨酸缺陷培养基稀释至OD600=0.1,并均匀分到离心管中,根据试验需求向各管中分别加入一定浓度的化合物并混匀,保留一管未加入任何配体的酵母(即APO组)作为对照。将酵母依次转移至384孔板中,每孔40μl酵母,将酵母平板置于25摄氏度恒温恒湿培养箱中。每24小时使用酶标仪(PerkinElmer,Ensight)测量每个孔的OD600。最终各个条件下酵母的OD600数据使用Graphpad Prism进行处理,观测BJ5465-β2AR-nSPS菌株在不同β2AR激动剂或拮抗剂处理时生长速度的差异。
实验结果:β2AR激动剂和拮抗剂调控BJ5465-β2AR-nSPS酵母的生长
本公开在尝试了多种不同蛋白质毒素及不同的分割方式之后,找到了对β2AR的激动响应最明显的一种,即将DTA从D129处切割成两半,将这种分割方式称为DTA-Split3.0,简称D3.0,而与β2AR及miniG蛋白结合的D3.0所构成的nSPS系统称为β2-D3.0。表达了β2-D3.0的酵母生长受到Isoprenaline(异丙肾上腺素,一种β2AR激动剂)的强烈抑制,如图2中的a所示,从第二天开始,相比于未添加激动剂的对照组,添加了10μM Isoprenaline的酵母生长明显缓慢,且即使在对照组酵母生长到达平台期时,这种差异也并不会缩小。之后,又验证了这种由激动剂介导的生长抑制效果可以被拮抗剂抵消。如图2中的b所示,当同时在培养基中加入激动剂Isoprenaline和拮抗剂Carazolol(卡拉洛尔)时,Isoprenaline引起的抑制效果会被Carazolol减弱。
实施例4:生长依耐性试验
如实施例1和实施例2所述,将制备好的pYD-nSPS-b2AR质粒转入BJ5465感受态细胞,得到BJ5465-β2AR-nSPS菌株并接种在亮氨酸缺陷型不含半乳糖培养液中生长到合适浓度并测量OD600。取合适体积的酵母,离心去掉培养液,用含半乳糖的亮氨酸缺陷型培养液稀释到OD600=0.1,并分为两管,一管中加入10μM异丙肾上腺素并加入1mM抗坏血酸防止异丙肾上腺素被氧化,另一管不加任何化合物作为对照组(APO组)。将两管酵母放入25度摇床中培养三天,并测量两管酵母的OD600。将APO组按照上述方法再稀释并分为两组,一组加入异丙肾上腺素和抗坏血酸,另一组作为对照。放入25度摇床中继续培养3天并测量OD600
实验结果:本实施例验证了实施例3中的生长抑制效果是配体依赖性的。首先将在含2%葡萄糖和缺少亮氨酸的培养基中生长到合适密度的包含β2-D3.0的酵母稀释到含2%半乳糖和缺少亮氨酸的培养基中,分成两管,保持起始OD600和体积相同,一管加入了10μMIsoprenaline以及1mM坏血酸(ISO组),另一管不额外加任何化合物作为空白对照(APO组),三天后分别检测两管酵母的OD600读值,结果如图3所示,APO组的OD600显著高于ISO组,ISO组酵母几乎不生长。将APO组酵母再次稀释并分为APO-APO组合APO-ISO组,发现这种Isoprenaline介导的生长抑制效果依旧存在。
实施例5:DTA3.0在NMBR中的应用
为了证明本公开建立的nSPS系统能够普遍应用于其他GPCR中,本公开尝试了多种除β2AR外的GPCR。本实施例以人的神经介素B受体(Neuromedin B Receptor,NMBR)为例进行介绍。如前所述,NMBR属于GPCR A类受体,是蛙皮素受体的一种。蛙皮素受体广泛分布于中枢神经系统和外周组织中,研究表明,在很多癌症的肿瘤细胞中,如前列腺癌,乳腺癌和肺癌,存在蛙皮素受体过表达的现象15,因此蛙皮素受体很有可能成为一种潜在癌症治疗靶点。
如实施例1中所述的,本公开中,将NMBR和D3.0偶联起来,由于NMBR下游偶联的G蛋白为Gq/11家族,将所使用的miniGs替换成miniGsq(由于miniG与GPCR的相互作用只发生在miniG羧基端的15个氨基酸,所以将miniGs的羧基酸后15个氨基酸替换成Gq的后15氨基酸,就得到了miniGsq10),构建出了NMBR-D3.0系统(SEQ ID NO:15所示的融合蛋白I+SEQ IDNO:23所示的融合蛋白II),用于药物筛选。如图2中的c所示,如实施例2所述构建的包含NMBR-D3.0的酵母在1μM和10μM内源性激动剂神经介素B(Neuromedin B,NMB)的作用下生长均受到了强烈的抑制,并且这种抑制效果会随着NMB浓度的降低或加入NMBR拮抗剂PD168368而减弱(图2中的d)。
根据NMBR的结果,本公开设计了基于nSPS系统的高通量筛选系统,化合物库中的小分子通过Echo550纳升级移液系统转移至无菌的384孔板中,并将NMNR-nSPS酵母使用含有一定浓度NMB的筛选培养液稀释至OD600=0.5,接种至含有不同小分子的孔板中,置于25℃,85%湿度的恒温恒湿条件下连续培养,并每天检测各孔OD600的读值,连续培养一周左右的时间。最终通过计算各孔酵母生长速度的差异,选择可以提高包含NMBR-nSPS的酵母生长速度的小分子通过其他实验进一步验证其生物学功能。
pYD-nSPS-b2AR质粒序列(SEQ ID NO:29):
CGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAAC
CCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCC
TTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAA
AAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAA
GATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTAT
GTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCT
CAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAA
GAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACG
ATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGA
TCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTA
GCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACA
ATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTG
GCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCACGCGGTATCATTGCAGCACTG
GGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGA
TGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACC
AAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAA
GATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGA
CCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCA
AACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTT
CCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTT
AGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAG
TGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGAT
AAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACC
TACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGA
AAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCC
AGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGAT
TTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACG
GTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGAT
AACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCG
AGTCAGTGAGCGAGGAAGCGGAAGAGCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGC
CGATTCATTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGC
AATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTAT
GTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGCCA
AGCTCGAAATTAACCCTCACTAAAGGGAACAAAAGCTGGTACCAATTCCTTGAATCTACAACAG
CTCGTACTGGCGCAGGTGCATGCGCTGGATGATATCGCGGCAATCGTTGAAGATGCGGCGAGCGT
TCTCGGTGTCCACGGCGCAAGTGAAGTGTGGGTAGCAATAGTGGCGTCCGTCACCTCCGGAGCC
TCCTGAACCACCATCACCAAATCTCTTGATGAATTCTTCTGTTCCAACTTGTTCCATTAATGGTTC
TGTCAAAGACAAACCCAATTCCTTTTTTATGGTTTCTGCATTATCAACTTTAAGAGCCAACACTTT
GGTTAAACCTGGGTACGTAACTTTAACGACACCACCAGCTTTGCCTGACAATGGATTTTCGTTAT
CAACACTATAACCGGCGGCGTCGTACTTGTTATCGGTGGAATAAAAACCCTTCCAATCATCATCAT
AATTACCCTGTGTACCAGATTTTGGTTTTTGAATACCTTTTTGAATACTATCAACATAACCTGGCTT
TGTACCGTGGTAAGAACTGAAATTTTCCATAACAAACGATTTAGAAGAATCCACAACATCATCAG
CACCAGAACCACCAGAACCTCCGCTAGCGGTGCTAATGCGCAGGAACTCATCGCGGATGAAGTA
CTTGGCGCGGGTCACTCGTGGATCTTCTCCTGGCTCTGGGGTGGCATCCTCTGGTGTGGTGTAGC
GGGCAAACTCGGGGAAGTAGTCCTCGATCTTGCTCTTGCCGGCCAAGACCTTCTCCGCCAGCAG
GTCCTGCTTGTTCAGGAACAGGATCACGCTGATGGTGCGCAGCCAACGGTTGTTCCAAATGCTC
TTGAAGTCGTTCAGGGCCTCCTGCAGACGGTTGTAGTCGCTGCTGTCCACGACGAAGATGATGG
CGGTCACGTCGTTGAAGCACTGGATCCACTTGCGGCGTTCGTCTCGCTGTCCGCCCACATCAAA
CATGTGGAAGTTGACCTTGTCCACTTGGAACTTGGTCTCGAAGATGCCGCTGGTTCCTCCGCTTC
CTCCGCTTCCTCCGTGCAAAATGCGCATCTGCTTCACGATGGTGCTCTTGCCGCTGTTATCGGCTC
CCAGCAGCAGCAGACGATGTGTGGCGCGGTACACCTGCTTGTCCTTCTGCAGCTGCTTCTCGATC
ATTTTCAAAAATTCTTACTTTTTTTTTGGATGGACGCAAAGAAGTTTAATAATCATATTACATGGCA
TTACCACCATATACATATCCATATACATATCCATATCTAATCTTACTTATATGTTGTGGAAATGTAAA
GAGCCCCATTATCTTAGCCTAAAAAAACCTTCTCTTTGGAACTTTCAGTAATACGCTTAACTGCTC
ATTGCTATATTGAAGTACGGATTAGAAGCCGCCGAGCGGGTGACAGCCCTCCGAAGGAAGACTC
TCCTCCGTGCGTCCTCGTCTTCACCGGTCGCGTTCCTGAAACGCAGATGTGCCTCGCGCCGCACT
GCTCCGAACAATAAAGATTCTACAATACTAGCTTTTATGGTTATGAAGAGGAAAAATTGGCAGTA
ACCTGGCCCCACAAACCTTCAAATGAACGAATCAAATTAACAACCATAGGATGATAATGCGATTA
GTTTTTTAGCCTTATTTCTGGGGTAATTAATCAGCGAAGCGATGATTTTTGATCTATTAACAGATAT
ATAAATGCAAAAACTGCATAACCACTTTAACTAATACTTTCAACATTTTCGGTTTGTATTACTTCTT
ATTCAAATGTAATAAAAGTATCAACAAAAAATTGTTAATATACCTCTATACTTTAACGTCAAGGAG
AAAAAACCCCGGATCGAATTCAACCCTCACTAAAGGGCGGCCGCCATGAGATTCCCATCTATCTT
CACCGCTGTTTTGTTCGCTGCTTCTTCTGCTTTGGCTGCTCCAGCTAACACCACCACCGAAGACG
AAACCGCTCAAATCCCAGCTGAAGCTGTTATCGACTACTCTGACTTGGAAGGTGACTTCGACGC
TGCTGCTTTGCCATTGTCTAACTCTACCAACAACGGTTTGTCTTCTACCAACACCACCATCGCTTC
TATCGCTGCTAAGGAAGAAGGTGTTCAATTGGACAAGAGAGAAGCTAGCGCAATGGGGCAACC
CGGGAACGGCAGCGCCTTCTTGCTGGCACCCAATAGAAGCCATGCGCCGGACCACGACGTCAC
GCAGCAAAGGGACGAGGTGTGGGTGGTGGGCATGGGCATCGTCATGTCTCTCATCGTCCTGGCC
ATCGTGTTTGGCAATGTGCTGGTCATCACAGCCATTGCCAAGTTCGAGCGTCTGCAGACGGTCAC
CAACTACTTCATCACTTCACTGGCCTGTGCTGATCTGGTCATGGGCCTGGCAGTGGTGCCCTTTG
GGGCCGCCCATATTCTTATGAAAATGTGGACTTTTGGCAACTTCTGGTGCGAGTTTTGGACTTCCA
TTGATGTGCTGTGCGTCACGGCCAGCATTGAGACCCTGTGCGTGATCGCAGTGGATCGCTACTTT
GCCATTACTTCACCTTTCAAGTACCAGAGCCTGCTGACCAAGAATAAGGCCCGGGTGATCATTCT
GATGGTGTGGATTGTGTCAGGCCTTACCTCCTTCTTGCCCATTCAGATGCACTGGTACCGGGCCA
CCCACCAGGAAGCCATCAACTGCTATGCCAATGAGACCTGCTGTGACTTCTTCACGAACCAAGC
CTATGCCATTGCCTCTTCCATCGTGTCCTTCTACGTTCCCCTGGTGATCATGGTCTTCGTCTACTCC
AGGGTCTTTCAGGAGGCCAAAAGGCAGCTCCAGAAGATTGACAAATCTGAGGGCCGCTTCCATG
TCCAGAACCTTAGCCAGGTGGAGCAGGATGGGCGGACGGGGCATGGACTCCGCAGATCTTCCA
AGTTCTGCTTGAAGGAGCACAAAGCCCTCAAGACGTTAGGCATCATCATGGGCACTTTCACCCT
CTGCTGGCTGCCCTTCTTCATCGTTAACATTGTGCATGTGATCCAGGATAACCTCATCCGTAAGGA
AGTTTACATCCTCCTAAATTGGATAGGCTATGTCAATTCTGGTTTCAATCCCCTTATCTACTGCCGG
AGCCCAGATTTCAGGATTGCCTTCCAGGAGCTTCTGTGCCTGGGTGGTTCAGGTGGAGGTGGTT
CTGGCGGTGGTGCGAGTAGAGTTGTTTTGTCTTTACCATTTGCTGAAGGTTCATCATCTGTAGAAT
ACATTAATAACTGGGAACAAGCTAAAGCCTTGTCAGTTGAACTGGAAATCAATTTCGAAACTAG
AGGTAAGAGAGGTCAAGATGCTATGTACGAATATATGGCCCAAGCTTGCGCTGGTAATAGAGTCA
GAAGGTAGTTAATTAACTCGAGATCTGATAACAACAGTGTAGATGTAACAAAATCGACTTTGTTC
CCACTGTACTTTTAGCTCGTACAAAATACAATATACTTTTCATTTCTCCGTAAACAACATGTTTTCC
CATGTAATATCCTTTTCTATTTTTCGTTCCGTTACCAACTTTACACATACTTTATATAGCTATTCACTT
CTATACACTAAAAAACTAAGACAATTTTAATTTTGCTGCCTGCCATATTTCAATTTGTTATAAATTC
CTATAATTTATCCTATTAGTAGCTAAAAAAAGATGAATGTGAATCGAATCCTAAGAGAATTGAGCT
CCAATTCGCCCTATAGTGAGTCGTATTACAATTCACTGGCCGTCGTTTTACAACGTCGTGACTGGG
AAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCCTTCGCCAGCTGGCGTAAT
AGCGAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGCGAATGGCGC
GACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTA
CACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCG
GCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCAC
CTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGT
TTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAA
CACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTT
AAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTC
CTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCAGGCAAGTGCACAAACA
ATACTTAAATAAATACTACTCAGTAATAACTTAAGCAAGGATTTTCTTAACTTCTTCGGCGACAGC
ATCACCGACTTCGGTGGTACTGTTGGAACCACCTAAATCACCAGTTCTGATACCTGCATCCAAAA
CCTTTTTAACTGCATCTTCAATGGCCTTACCTTCTTCAGGCAAGTTCAATGACAATTTCAACATCA
TTGCAGCAGACAAGATAGTGGCGATAGGGTTGACCTTATTCTTTGGCAAATCTGGAGCAGAACC
GTGGCATGGTTCGTACAAACCAAATGCGGTGTTCTTGTCTGGCAAAGAGGCCAAGGACGCAGAT
GGCAACAAACCCAAGGAACCTGGGATAACGGAGGCTTCATCGGAGATGATATCACCAAACATGT
TGCTGGTGATTATAATACCATTTAGGTGGGTTGGGTTCTTAACTAGGATCATGGCGGCAGAATCAA
TCAATTGATGTTGAACCTTCAATGTAGGGAATTCGTTCTTGATGGTTTCCTCCACAGTTTTTCTCC
ATAATCTTGAAGAGGCCAAAACATTAGCTTTATCCAAGGACCAAATAGGCAATGGTGGCTCATGT
TGTAGGGCCATGAAAGCGGCCATTCTTGTGATTCTTTGCACTTCTGGAACGGTGTATTGTTCACTA
TCCCAAGCGACACCATCACCATCGTCTTCCTTTCTCTTACCAAAGTAAATACCTCCCACTAATTCT
CTGACAACAACGAAGTCAGTACCTTTAGCAAATTGTGGCTTGATTGGAGATAAGTCTAAAAGAG
AGTCGGATGCAAAGTTACATGGTCTTAAGTTGGCGTACAATTGAAGTTCTTTACGGATTTTTAGTA
AACCTTGTTCAGGTCTAACACTACCGGTACCCCATTTAGGACCACCCACAGCACCTAACAAAAC
GGCATCAGCCTTCTTGGAGGCTTCCAGCGCCTCATCTGGAAGTGGAACACCTGTAGCATCGATAG
CAGCACCACCAATTAAATGATTTTCGAAATCGAACTTGACATTGGAACGAACATCAGAAATAGCT
TTAAGAACCTTAATGGCTTCGGCTGTGATTTCTTGACCAACGTGGTCACCTGGCAAAACGACGAT
CTTCTTAGGGGCAGACATTAGAATGGTATATCCTTGAAATATATATATATATATTGCTGAAATGTAAA
AGGTAAGAAAAGTTAGAAAGTAAGACGATTGCTAACCACCTATTGGAAAAAACAATAGGTCCTT
AAATAATATTGTCAACTTCAAGTATTGTGATGCAAGCATTTAGTCATGAACGCTTCTCTATTCTATA
TGAAAAGCCGGTTCCGGCGCTCTCACCTTTCCTTTTTCTCCCAATTTTTCAGTTGAAAAAGGTATA
TGCGTCAGGCGACCTCTGAAATTAACAAAAAATTTCCAGTCATCGAATTTGATTCTGTGCGATAG
CGCCCCTGTGTGTTCTCGTTATGTTGAGGAAAAAAATAATGGTTGCTAAGAGATTCGAACTCTTG
CATCTTACGATACCTGAGTATTCCCACAGTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCC
GCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGC
TCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTC
ACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATG
TCATGATAATAATGGTTTCTTAGGACGGATCGCTTGCCTGTAACTTACACGCGCCTCGTATCTTTTA
ATGATGGAATAATTTGGGAATTTACTCTGTGTTTATTTATTTTTATGTTTTGTATTTGGATTTTAGAA
AGTAAATAAAGAAGGTAGAAGAGTTACGGAATGAAGAAAAAAAAATAAACAAAGGTTTAAAAA
ATTTCAACAAAAAGCGTACTTTACATATATATTTATTAGACAAGAAAAGCAGATTAAATAGATATAC
ATTCGATTAACGATAAGTAAAATGTAAAATCACAGGATTTTCGTGTGTGGTCTTCTACACAGACA
AGATGAAACAATTCGGCATTAATACCTGAGAGCAGGAAGAGCAAGATAAAAGGTAGTATTTGTT
GGCGATCCCCCTAGAGTCTTTTACATCTTCGGAAAACAAAAACTATTTTTTCTTTAATTTCTTTTTT
TACTTTCTATTTTTAATTTATATATTTATATTAAAAAATTTAAATTATAATTATTTTTATAGCACGTGAT
GAAAAGGACCCAGGTGGCACTTTTCGGGGAAATGTG
pYD-nSPS-NMBR2质粒序列(SEQ ID NO:30)
CGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAAC
CCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCC
TTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAA
AAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAA
GATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTAT
GTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCT
CAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAA
GAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACG
ATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGA
TCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTA
GCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACA
ATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTG
GCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCACGCGGTATCATTGCAGCACTG
GGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGA
TGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACC
AAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAA
GATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGA
CCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCA
AACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTT
CCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTT
AGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAG
TGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGAT
AAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACC
TACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGA
AAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCC
AGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGAT
TTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACG
GTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGAT
AACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCG
AGTCAGTGAGCGAGGAAGCGGAAGAGCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGC
CGATTCATTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGC
AATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTAT
GTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGCCA
AGCTCGAAATTAACCCTCACTAAAGGGAACAAAAGCTGGTACCAATTCCTTGAATTTACACCAG
ATTATACTCACGGAGGTTCATCTGGAGGATGATGTCTTTGCAATCGTTGAAGATGCGGCGAGCGT
TCTCGGTGTCCACGGCGCAAGTGAAGTGTGGGTAGCAATAGTGGCGTCCGTCACCTCCGGAGCC
TCCTGAACCACCATCACCAAATCTCTTGATGAATTCTTCTGTTCCAACTTGTTCCATTAATGGTTC
TGTCAAAGACAAACCCAATTCCTTTTTTATGGTTTCTGCATTATCAACTTTAAGAGCCAACACTTT
GGTTAAACCTGGGTACGTAACTTTAACGACACCACCAGCTTTGCCTGACAATGGATTTTCGTTAT
CAACACTATAACCGGCGGCGTCGTACTTGTTATCGGTGGAATAAAAACCCTTCCAATCATCATCAT
AATTACCCTGTGTACCAGATTTTGGTTTTTGAATACCTTTTTGAATACTATCAACATAACCTGGCTT
TGTACCGTGGTAAGAACTGAAATTTTCCATAACAAACGATTTAGAAGAATCCACAACATCATCAG
CACCAGAACCACCAGAACCTCCGCTAGCGGTGCTAATGCGCAGGAACTCATCGCGGATGAAGTA
CTTGGCGCGGGTCACTCGTGGATCTTCTCCTGGCTCTGGGGTGGCATCCTCTGGTGTGGTGTAGC
GGGCAAACTCGGGGAAGTAGTCCTCGATCTTGCTCTTGCCGGCCAAGACCTTCTCCGCCAGCAG
GTCCTGCTTGTTCAGGAACAGGATCACGCTGATGGTGCGCAGCCAACGGTTGTTCCAAATGCTC
TTGAAGTCGTTCAGGGCCTCCTGCAGACGGTTGTAGTCGCTGCTGTCCACGACGAAGATGATGG
CGGTCACGTCGTTGAAGCACTGGATCCACTTGCGGCGTTCGTCTCGCTGTCCGCCCACATCAAA
CATGTGGAAGTTGACCTTGTCCACTTGGAACTTGGTCTCGAAGATGCCGCTGGTTCCTCCGCTTC
CTCCGCTTCCTCCGTGCAAAATGCGCATCTGCTTCACGATGGTGCTCTTGCCGCTGTTATCGGCTC
CCAGCAGCAGCAGACGATGTGTGGCGCGGTACACCTGCTTGTCCTTCTGCAGCTGCTTCTCGATC
ATTTTCAAAAATTCTTACTTTTTTTTTGGATGGACGCAAAGAAGTTTAATAATCATATTACATGGCA
TTACCACCATATACATATCCATATACATATCCATATCTAATCTTACTTATATGTTGTGGAAATGTAAA
GAGCCCCATTATCTTAGCCTAAAAAAACCTTCTCTTTGGAACTTTCAGTAATACGCTTAACTGCTC
ATTGCTATATTGAAGTACGGATTAGAAGCCGCCGAGCGGGTGACAGCCCTCCGAAGGAAGACTC
TCCTCCGTGCGTCCTCGTCTTCACCGGTCGCGTTCCTGAAACGCAGATGTGCCTCGCGCCGCACT
GCTCCGAACAATAAAGATTCTACAATACTAGCTTTTATGGTTATGAAGAGGAAAAATTGGCAGTA
ACCTGGCCCCACAAACCTTCAAATGAACGAATCAAATTAACAACCATAGGATGATAATGCGATTA
GTTTTTTAGCCTTATTTCTGGGGTAATTAATCAGCGAAGCGATGATTTTTGATCTATTAACAGATAT
ATAAATGCAAAAACTGCATAACCACTTTAACTAATACTTTCAACATTTTCGGTTTGTATTACTTCTT
ATTCAAATGTAATAAAAGTATCAACAAAAAATTGTTAATATACCTCTATACTTTAACGTCAAGGAG
AAAAAACCCCGGATCGAATTCAACCCTCACTAAAGGGCGGCCGCCATGAGATTCCCATCTATCTT
CACCGCTGTTTTGTTCGCTGCTTCTTCTGCTTTGGCTGCTCCAGCTAACACCACCACCGAAGACG
AAACCGCTCAAATCCCAGCTGAAGCTGTTATCGACTACTCTGACTTGGAAGGTGACTTCGACGC
TGCTGCTTTGCCATTGTCTAACTCTACCAACAACGGTTTGTCTTCTACCAACACCACCATCGCTTC
TATCGCTGCTAAGGAAGAAGGTGTTCAATTGGACAAGAGAGAAGCTAGCGCAATGCCCTCCAAG
AGCCTCAGCAATCTCAGCGTGACCACTGGCGCCAACGAATCCGGTAGCGTCCCCGAAGGTTGGG
AGCGTGATTTCCTGCCCGCCTCCGACGGTACTACTACTGAGCTCGTGATCCGCTGCGTGATCCCC
TCCCTCTATCTCCTGATCATCACTGTCGGCCTGCTGGGTAACATCATGCTGGTCAAGATCTTCATC
ACTAACTCCGCCATGCGCAGCGTGCCCAACATCTTCATCAGCAACCTCGCTGCTGGCGACCTGCT
GCTGCTCCTGACCTGCGTCCCCGTGGATGCTTCCCGCTACTTCTTCGACGAGTGGATGTTCGGCA
AGGTCGGTTGTAAACTGATCCCCGTGATCCAGCTGACCTCCGTCGGCGTGTCCGTCTTCACCCTG
ACTGCTCTGAGCGCTGACCGCTACCGCGCCATCGTGAACCCCATGGACATGCAGACTTCCGGTG
CCCTGCTCCGCACTTGCGTCAAGGCTATGGGTATCTGGGTGGTCAGCGTGCTCCTGGCTGTGCCT
GAAGCCGTGTTTAGCGAGGTGGCTCGTATCTCCAGCCTCGACAACTCCAGCTTTACCGCCTGCAT
CCCCTACCCCCAAACCGACGAGCTCCACCCCAAGATCCATAGCGTGCTCATCTTCCTCGTCTATTT
CCTGATCCCCCTGGCCATCATCTCCATCTATTACTATCACATTGCCAAAACTCTCATCAAGTCCGCT
CATAACCTCCCCGGCGAGTACAATGAGCACACTAAGAAACAGATGGAGACTCGCAAGCGCCTCG
CTAAGATCGTCCTGGTGTTCGTCGGCTGCTTCATCTTCTGCTGGTTCCCCAACCACATTCTCTACA
TGTACCGTAGCTTTAACTACAACGAGATCGACCCCAGCCTGGGCCACATGATCGTGACTCTCGTG
GCTCGTGTGCTCTCCTTCGGCAACTCCTGCGTGAACCCCTTCGCTCTCTACCTCCTGAGCGAGAG
CTTCCGCCGTCATTTCAACTCCCAGCTCTGCTGTGGCGGTGGTTCAGGTGGAGGTGGTTCTGGCG
GTGGTGCGAGTAGAGTTGTTTTGTCTTTACCATTTGCTGAAGGTTCATCATCTGTAGAATACATTA
ATAACTGGGAACAAGCTAAAGCCTTGTCAGTTGAACTGGAAATCAATTTCGAAACTAGAGGTAA
GAGAGGTCAAGATGCTATGTACGAATATATGGCCCAAGCTTGCGCTGGTAATAGAGTCAGAAGGT
AGTTAATTAACTCGAGATCTGATAACAACAGTGTAGATGTAACAAAATCGACTTTGTTCCCACTG
TACTTTTAGCTCGTACAAAATACAATATACTTTTCATTTCTCCGTAAACAACATGTTTTCCCATGTA
ATATCCTTTTCTATTTTTCGTTCCGTTACCAACTTTACACATACTTTATATAGCTATTCACTTCTATAC
ACTAAAAAACTAAGACAATTTTAATTTTGCTGCCTGCCATATTTCAATTTGTTATAAATTCCTATAA
TTTATCCTATTAGTAGCTAAAAAAAGATGAATGTGAATCGAATCCTAAGAGAATTGAGCTCCAATT
CGCCCTATAGTGAGTCGTATTACAATTCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAAC
CCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCCTTCGCCAGCTGGCGTAATAGCGA
AGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGCGAATGGCGCGACGCG
CCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTG
CCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTC
CCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGAC
CCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCG
CCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCA
ACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAA
TGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTCCTGATG
CGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCAGGCAAGTGCACAAACAATACTTA
AATAAATACTACTCAGTAATAACTTAAGCAAGGATTTTCTTAACTTCTTCGGCGACAGCATCACCG
ACTTCGGTGGTACTGTTGGAACCACCTAAATCACCAGTTCTGATACCTGCATCCAAAACCTTTTT
AACTGCATCTTCAATGGCCTTACCTTCTTCAGGCAAGTTCAATGACAATTTCAACATCATTGCAGC
AGACAAGATAGTGGCGATAGGGTTGACCTTATTCTTTGGCAAATCTGGAGCAGAACCGTGGCAT
GGTTCGTACAAACCAAATGCGGTGTTCTTGTCTGGCAAAGAGGCCAAGGACGCAGATGGCAAC
AAACCCAAGGAACCTGGGATAACGGAGGCTTCATCGGAGATGATATCACCAAACATGTTGCTGG
TGATTATAATACCATTTAGGTGGGTTGGGTTCTTAACTAGGATCATGGCGGCAGAATCAATCAATT
GATGTTGAACCTTCAATGTAGGGAATTCGTTCTTGATGGTTTCCTCCACAGTTTTTCTCCATAATC
TTGAAGAGGCCAAAACATTAGCTTTATCCAAGGACCAAATAGGCAATGGTGGCTCATGTTGTAGG
GCCATGAAAGCGGCCATTCTTGTGATTCTTTGCACTTCTGGAACGGTGTATTGTTCACTATCCCAA
GCGACACCATCACCATCGTCTTCCTTTCTCTTACCAAAGTAAATACCTCCCACTAATTCTCTGACA
ACAACGAAGTCAGTACCTTTAGCAAATTGTGGCTTGATTGGAGATAAGTCTAAAAGAGAGTCGG
ATGCAAAGTTACATGGTCTTAAGTTGGCGTACAATTGAAGTTCTTTACGGATTTTTAGTAAACCTT
GTTCAGGTCTAACACTACCGGTACCCCATTTAGGACCACCCACAGCACCTAACAAAACGGCATC
AGCCTTCTTGGAGGCTTCCAGCGCCTCATCTGGAAGTGGAACACCTGTAGCATCGATAGCAGCA
CCACCAATTAAATGATTTTCGAAATCGAACTTGACATTGGAACGAACATCAGAAATAGCTTTAAG
AACCTTAATGGCTTCGGCTGTGATTTCTTGACCAACGTGGTCACCTGGCAAAACGACGATCTTCT
TAGGGGCAGACATTAGAATGGTATATCCTTGAAATATATATATATATATTGCTGAAATGTAAAAGGT
AAGAAAAGTTAGAAAGTAAGACGATTGCTAACCACCTATTGGAAAAAACAATAGGTCCTTAAAT
AATATTGTCAACTTCAAGTATTGTGATGCAAGCATTTAGTCATGAACGCTTCTCTATTCTATATGAA
AAGCCGGTTCCGGCGCTCTCACCTTTCCTTTTTCTCCCAATTTTTCAGTTGAAAAAGGTATATGCG
TCAGGCGACCTCTGAAATTAACAAAAAATTTCCAGTCATCGAATTTGATTCTGTGCGATAGCGCC
CCTGTGTGTTCTCGTTATGTTGAGGAAAAAAATAATGGTTGCTAAGAGATTCGAACTCTTGCATC
TTACGATACCTGAGTATTCCCACAGTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCAT
AGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCC
GGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCG
TCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCAT
GATAATAATGGTTTCTTAGGACGGATCGCTTGCCTGTAACTTACACGCGCCTCGTATCTTTTAATGA
TGGAATAATTTGGGAATTTACTCTGTGTTTATTTATTTTTATGTTTTGTATTTGGATTTTAGAAAGTA
AATAAAGAAGGTAGAAGAGTTACGGAATGAAGAAAAAAAAATAAACAAAGGTTTAAAAAATTT
CAACAAAAAGCGTACTTTACATATATATTTATTAGACAAGAAAAGCAGATTAAATAGATATACATT
CGATTAACGATAAGTAAAATGTAAAATCACAGGATTTTCGTGTGTGGTCTTCTACACAGACAAGA
TGAAACAATTCGGCATTAATACCTGAGAGCAGGAAGAGCAAGATAAAAGGTAGTATTTGTTGGC
GATCCCCCTAGAGTCTTTTACATCTTCGGAAAACAAAAACTATTTTTTCTTTAATTTCTTTTTTTAC
TTTCTATTTTTAATTTATATATTTATATTAAAAAATTTAAATTATAATTATTTTTATAGCACGTGATGAA
AAGGACCCAGGTGGCACTTTTCGGGGAAATGTG
参考文献:
1.Collier,R.J.Diphtheria toxin:mode of action andstructure.Bacteriological reviews 39,54-85,doi:10.1128/br.39.1.54-85.1975(1975).
2.Fredriksson,R.,M.C.,Lundin,L.G.&/>H.B.The G-protein-coupled receptors in the human genome form five main families.Phylogeneticanalysis,paralogon groups,and fingerprints.Molecular pharmacology 63,1256-1272,doi:10.1124/mol.63.6.1256(2003).
3.Hauser,A.S.,Attwood,M.M.,Rask-Andersen,M.,H.B.&Gloriam,D.E.Trends in GPCR drug discovery:new agents,targets and indications.Naturereviews.Drug discovery 16,829-842,doi:10.1038/nrd.2017.178(2017).
4.Aristotelous,T.et al.Discovery ofβ2Adrenergic Receptor LigandsUsing Biosensor Fragment Screening of Tagged Wild-Type Receptor.ACSMed.Chem.Lett.4,1005–1010(2013).
5.Zhang,R.&Xie,X.Tools for GPCR drug discovery.Acta Pharmacol.Sin.33,372–384(2012).
6.Manglik,A.et al.Structure-based discovery of opioid analgesics withreduced side effects.Nature537,185–190(2016).
7.Dohlman,H.G.&Slessareva,J.E.Pheromone Signaling Pathways inYeast.Sci.STKE 2006,(2006).
8.Blocker,K.M.et al.Chapter Eight-Recombinant G Protein-CoupledReceptor Expression in Saccharomyces cerevisiae for ProteinCharacterization.in Methods in Enzymology(ed.Shukla,A.K.)vol.556 165–183(Academic Press,2015).
9.Carpenter,B.&Tate,C.G.Engineering a minimal G protein to facilitatecrystallisation of Gprotein-coupled receptors in their activeconformation.Protein Eng.Des.Sel.29,583–594(2016).
10.Nehmé,R.et al.Mini-G proteins:Novel tools for studying GPCRs intheir active conformation.PLOS ONE 12,e0175642(2017).
11.Wehr,M.C.et al.Monitoring regulated protein-protein interactionsusing split TEV.Nat.Methods3,985–993(2006).
12.Blakeley,B.D.,Chapman,A.M.&McNaughton,B.R.Split-superpositive GFPreassembly is afast,efficient,and robust method for detecting protein–proteininteractions in vivo.Mol.Biosyst.8,2036(2012).
13.Fujikawa,Y.et al.Split luciferase complementation assay to detectregulated protein-proteininteractions in rice protoplasts in a large-scaleformat.Rice 7,11(2014).
14.Moody,T.W.et al.Bombesin Receptor Family Activation and CNS/NeuralTumors:Review ofEvidence Supporting Possible Role for Novel TargetedTherapy.Frontiers in endocrinology 12,728088,doi:10.3389/fendo.2021.728088(2021).

Claims (22)

1.一种融合蛋白的组合物,其中,所述组合物包括各自独立地存在的如下(i)所示的融合蛋白I与如下(iv)所示的融合蛋白II;或者,所述组合物包括各自独立地存在的如下(ii)所示的融合蛋白I与如下(iii)所示的融合蛋白II:
(i)由第一蛋白与第一结构域融合形成的融合蛋白I;
(ii)由第一蛋白与第二结构域融合形成的融合蛋白I;
(iii)由第二蛋白与第一结构域融合形成的融合蛋白II;
(iv)由第二蛋白与第二结构域融合形成的融合蛋白II;
其中,所述第一蛋白选自G蛋白偶联受体或其功能变体,所述第二蛋白选自G蛋白或其功能变体;所述第一结构域选自报告蛋白的羧基端结构域,所述第二结构域选自报告蛋白的氨基端结构域;
所述报告蛋白的羧基端结构域与所述报告蛋白的氨基端结构域用于形成报告蛋白,并且,所述报告蛋白为具有细胞毒性的蛋白,释放用于检测的报告信号。
2.根据权利要求1所述的融合蛋白的组合物,其中,所述报告蛋白来自白喉毒素。
3.根据权利要求1或2所述的融合蛋白的组合物,其中,所述报告蛋白为白喉毒素A亚基(DTA),所述第一结构域为白喉毒素A亚基的羧基端结构域(DTACTD),所述第二结构域为白喉毒素A亚基的氨基端结构域(DTANTD);
可选地,所述第一结构域选自如下(a1)-(a2)中的任一项:
(a1)如SEQ ID NO:9所示氨基酸序列的多肽;
(a2)如SEQ ID NO:9所示的氨基酸序列相比,具有至少80%的序列同一性,且具有或部分具有如SEQ ID NO:9所示的序列活性的多肽;
可选地,所述第二结构域选自如下(b1)-(b2)中的任一项:
(b1)如SEQ ID NO:11所示氨基酸序列的多肽;
(b2)与SEQ ID NO:11所示的氨基酸序列相比,具有至少80%的序列同一性,且具有或部分具有如SEQ ID NO:11所示的序列活性的多肽。
4.根据权利要求1-3任一项所述的融合蛋白的组合物,其中,所述第一蛋白选自如下任意一种:β2-肾上腺素受体(β2AR)或其功能变体,人神经介素B受体(NMBR)或其功能变体;
优选地,所述第一蛋白为β2-肾上腺素受体(β2AR)或人神经介素B受体(NMBR);
更优选地,所述第一蛋白选自如下(c1)-(c2)中的任一项:
(c1)如SEQ ID NO:1或3任一氨基酸序列所示的蛋白;
(c2)与SEQ ID NO:1或3任一氨基酸序列相比,具有至少80%的序列同一性,且具有或部分具有如SEQ ID NO:1或3任一序列所示的序列活性的蛋白。
5.根据权利要求1-4任一项所述的融合蛋白的组合物,其中,所述第二蛋白选自miniG蛋白或其功能变体;
优选地,所述第二蛋白选自如下(d1)-(d2)中的任一项:
(d1)如SEQ ID NO:5或6任一所示氨基酸序列的蛋白;
(d2)与SEQ ID NO:5或6任一所述的氨基酸序列相比,具有至少80%的序列同一性,且具有或部分具有如SEQ ID NO:5或6所示的序列活性的蛋白。
6.根据权利要求1-5任一项所述的融合蛋白的组合物,其中,所述融合蛋白I由所述第一结构域融合于所述第一蛋白的羧基端形成;或者,所述融合蛋白I由所述第二结构域融合于所述第一蛋白的羧基端形成;
可选地,所述融合蛋白I包括连接所述第一结构域与所述第一蛋白的连接肽;或者,所述融合蛋白I包括连接所述第二结构域与所述第一蛋白的连接肽;
优选地,沿氨基端(N)向羧基端(C)方向,所述融合蛋白I具有如下(j1)-(j4)中的任一项所示的结构:
(j1)(N)-β2AR-DTACTD-(C),
(j2)(N)-β2AR-连接肽-DTACTD-(C),
(j3)(N)-NMBR-DTACTD-(C),
(j4)(N)-NMBR-连接肽-DTACTD-(C);
优选地,所述融合蛋白I选自如下(e1)-(e2)中的任一项:
(e1)如SEQ ID NO:13或15任一项所示氨基酸序列的蛋白;
(e2)与SEQ ID NO:13或15任一项所述的氨基酸序列相比,具有至少80%的序列同一性,且具有或部分具有如SEQ ID NO:13或15任一项所示的序列活性的蛋白。
7.根据权利要求1-6任一项所述的融合蛋白的组合物,其中,其中,所述融合蛋白II由所述第一结构域融合于所述第二蛋白的内部或氨基端形成;或者,所述融合蛋白II由所述第二结构域融合于所述第二蛋白的内部或氨基端成形成;
可选地,所述融合蛋白II包括连接所述第一结构域与所述第二蛋白的第二连接肽;或者,所述融合蛋白II包括连接所述第二结构域与所述第二蛋白的第二连接肽;
优选地,沿氨基端(N)向羧基端(C)方向,所述融合蛋白II具有如下(k1)-(k4)中的任一项所示的结构:
(k1)(N)-miniG蛋白片段I-DTANTD-miniG蛋白片段II-(C),
(k2)(N)-miniG蛋白片段I-连接肽-DTANTD-连接肽-miniG蛋白片段II-(C),
(k3)(N)-DTANTD-miniG蛋白-(C),
(k4)(N)-DTANTD-连接肽-miniG蛋白-(C),
其中,miniG蛋白由所述miniG蛋白片段I与所述miniG蛋白片段II融合形成;
优选地,所述融合蛋白II选自如下(f1)-(f2)中的任一项:
(f1)如SEQ ID NO:17、19、21或23任一项所示氨基酸序列的蛋白;
(f2)与SEQ ID NO:17、19、21或23任一项所述的氨基酸序列相比具有至少80%的序列同一性,且具有或部分具有如SEQ ID NO:17、19、21或23任一项所示的序列活性的蛋白。
8.一种融合蛋白,其选自如下(i)-(iv)组成的组中的任意一种:
(i)由第一蛋白与第一结构域融合形成的融合蛋白I;
(ii)由第一蛋白与第二结构域融合形成的融合蛋白I;
(iii)由第二蛋白与第一结构域融合形成的融合蛋白II;
(iv)由第二蛋白与第二结构域融合形成的融合蛋白II;
其中,所述第一蛋白选自G蛋白偶联受体或其功能变体,所述第二蛋白选自G蛋白或其功能变体;所述第一结构域选自报告蛋白的羧基端结构域,所述第二结构域选自报告蛋白的氨基端结构域;
所述报告蛋白的羧基端结构域与所述报告蛋白的氨基端结构域用于形成报告蛋白,并且,所述报告蛋白为具有细胞毒性的蛋白,释放用于检测的报告信号。
9.一种分离的多核苷酸,其中,所述多核苷酸包含如权利要求8所述的融合蛋白的核苷酸序列。
10.一种重组核酸分子,其中,所述重组核酸分子包含编码如权利要求1-7任一项所述的融合蛋白的组合物的核苷酸序列。
11.根据权利要求10所述的重组核酸分子,其中,所述重组核酸分子包括可操作地连接的如下所示元件:
第一编码区,所述第一编码区包含用于编码融合蛋白I的第一编码序列;以及,
第二编码区,所述第二编码区包含用于编码融合蛋白II的第二编码序列;
优选地,所述第一编码序列选自如下(g1)-(g2)中的任一项:
(g1)如SEQ ID NO:14或16任一项所示的核苷酸序列;
(g2)与SEQ ID NO:14或16任一项所示的核苷酸序列相比具有至少80%的序列同一性,且编码具有如SEQ ID NO:13或15任一项所示序列编码的蛋白活性的蛋白的核苷酸序列;
优选地,所述第二编码序列选自如下(h1)-(h2)中的任一项:
(h1)如SEQ ID NO:18、20、22或24任一项所示的核苷酸序列;
(h2)与SEQ ID NO:18、20、22或24任一项所示的核苷酸序列相比具有至少80%的序列同一性,且编码具有如SEQ ID NO:17、19、21或23任一项所示序列编码的蛋白活性的蛋白的核苷酸序列。
12.根据权利要求11所述的重组核酸分子,其中,所述重组核酸分子还包括与所述第一编码区或所述第二编码区可操作地连接的一个或多个启动子;
可选地,所述启动子是连接所述第一编码区和所述第二编码区的双向启动子;
优选地,所述第一编码区位于所述双向启动子的上游,所述第二编码区位于所述双向启动子的下游;优选地,所述双向启动子为GAL1,10。
13.一种重组表达载体,其中,所述重组表达载体包含如权利要求10-12任一项所述的重组核酸分子。
14.根据权利要求1-7任一项所述的融合蛋白的组合物,根据权利要求8所述的融合蛋白,根据权利要求9所述的多核苷酸,根据权利要求10-12任一项所述的重组核酸分子,或根据权利要求13所述的重组表达载体在如下(1)-(2)至少一种中的用途:
(1)构建药物筛选系统,或制备用于构建药物筛选系统的试剂或试剂盒;
(2)构建药物筛选的细胞模型,或制备用于构建药物筛选的细胞模型的试剂或试剂盒;
优选地,所述药物为GPCR药物,更优选为GPCR拮抗剂。
15.一种重组酵母细胞,其中,所述重组酵母细胞表达如权利要求1-7任一项所述的融合蛋白的组合物;或者,所述重组酵母细胞包含如权利要求10-12任一项所述的重组核酸分子,或如权利要求13所述的重组表达载体;
优选地,所述重组酵母细胞来源于酿酒酵母。
16.一种用于构建重组酵母细胞的方法,其中,所述方法包括将如权利要求10-12任一项所述的重组核酸分子,或如权利要求13所述的重组表达载体转入酵母细胞内的步骤;
优选地,所述酵母细胞为酿酒酵母细胞。
17.根据权利要求15所述的重组酵母细胞在如下(1)-(2)至少一种中的用途:
(1)用于药物筛选,或作为药物筛选系统或药物筛选的细胞模型;
(2)制备用于药物筛选的试剂、试剂盒或筛选系统。
18.一种基于生存压力的负向筛选系统,其中,所述负向筛选系统包含如权利要求1-7任一项所述的融合蛋白的组合物,如权利要求10-12任一项所述的重组核酸分子,如权利要求13所述的重组表达载体,或如权利要求15所述的重组酵母细胞。
19.一种高通量筛选装置,其中,所述高通量筛选装置包括:
药物模块,用于存储待筛选药物;
菌株接种模块,用于向所述药物模块中接种如权利要求15所述的重组酵母细胞,使所述重组酵母细胞与所述待筛选药物接触;
培养模块,用于培养接种于所述药物模块中的所述重组酵母细胞;
测量模块,用于获取所述培养模块中培养后的重组酵母细胞的生长速度;
判定模块,用于根据所述重组酵母细胞的生长速度,判断所述待筛选药物是否为目标筛选药物;
任选地,所述高通量筛选装置还包括:
转移模块,用于将所述待筛选药物转移至所述药物模块。
20.根据权利要求19所述的高通量筛选装置,其中,
所述药物模块包括具有阵列微孔的多孔板,所述微孔相互独立地设置于所述多孔板上,所述待筛选药物储存于第一预设数量的所述微孔内;
所述菌株接种模块用于向所述第一预设数量的微孔内接种所述重组酵母细胞;
优选地,所述第一预设数量≥50,优选≥100,更优选≥300。
21.根据权利要求19或20所述的高通量筛选装置,其中,
所述测量模块用于获取所述培养模块中培养后的所述重组酵母细胞的OD值;
所述判定模块用于根据所述重组酵母细胞的OD值,判定所述待筛选药物是否为目标筛选药物;
可选地,所述目标筛选药物选自GPCR激动剂或GPCR拮抗剂,优选GPCR拮抗剂。
22.一种药物筛选的方法,其中,所述方法包括:
培养步骤:在筛选培养基中培养如权利要求15所述的重组酵母细胞;
药物处理步骤:使用待筛选药物处理所述重组酵母细胞;
比较步骤:比较所述药物处理后的重组酵母细胞,与未进行药物处理的重组酵母细胞的生长速度;
判断步骤:根据所述重组酵母细胞的生长速度,判断所述待筛选药物是否为目标筛选药物;
优选地,所述筛选培养基为用于筛选GPCR拮抗剂的培养基,所述用于筛选GPCR拮抗剂的培养基是包含GPCR激动剂的培养基。
CN202310745661.6A 2023-06-21 2023-06-21 一种融合蛋白的组合物、包含其的基于生存压力的负向筛选系统 Pending CN116813797A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310745661.6A CN116813797A (zh) 2023-06-21 2023-06-21 一种融合蛋白的组合物、包含其的基于生存压力的负向筛选系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310745661.6A CN116813797A (zh) 2023-06-21 2023-06-21 一种融合蛋白的组合物、包含其的基于生存压力的负向筛选系统

Publications (1)

Publication Number Publication Date
CN116813797A true CN116813797A (zh) 2023-09-29

Family

ID=88128645

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310745661.6A Pending CN116813797A (zh) 2023-06-21 2023-06-21 一种融合蛋白的组合物、包含其的基于生存压力的负向筛选系统

Country Status (1)

Country Link
CN (1) CN116813797A (zh)

Similar Documents

Publication Publication Date Title
Pausch G-protein-coupled receptors in Saccharomyces cerevisiae: high-throughput screening assays for drug discovery
Xue et al. Magnificent seven: roles of G protein-coupled receptors in extracellular sensing in fungi
Lürick et al. Multivalent Rab interactions determine tether-mediated membrane fusion
DeMarini et al. A septin-based hierarchy of proteins required for localized deposition of chitin in the Saccharomyces cerevisiae cell wall
Schuler et al. H xt1, a monosaccharide transporter and sensor required for virulence of the maize pathogen U stilago maydis
Zhao et al. Molecular interaction network of the Hsp90 chaperone system
Sato et al. Yeast Derlin Dfm1 interacts with Cdc48 and functions in ER homeostasis
US20050214739A1 (en) Expression of G protein coupled receptors in yeast
Snider et al. Split-ubiquitin based membrane yeast two-hybrid (MYTH) system: a powerful tool for identifying protein-protein interactions
CA2343046A1 (en) Enhanced functional expression of g protein-coupled receptors
JP2009143932A (ja) 改変g蛋白質を発現する酵母細胞及びそれらの利用方法
US8877446B2 (en) Method for detecting protein-protein interactions in cells
Schmidt et al. Random mutagenesis of the M3 muscarinic acetylcholine receptor expressed in yeast: Identification of point mutations that “silence” a constitutively active mutant M3 receptor and greatly impair receptor/G protein coupling
Li et al. A subunit of the HOPS endocytic tethering complex, FgVps41, is important for fungal development and plant infection in Fusarium graminearum
Fukutani et al. An improved bioluminescence‐based signaling assay for odor sensing with a yeast expressing a chimeric olfactory receptor
Ladds et al. A constitutively active GPCR retains its G protein specificity and the ability to form dimers
WO1997035985A1 (en) Host cells expressing mutants of a natural g-protein coupled receptor (gpcr); saccharomyces cerevisiae ste2 gene, and their use as biosensors
CN115925970A (zh) 基于生存压力的筛选系统及高通量筛选装置
US7094593B1 (en) Method for improving the function of heterologous G protein-coupled receptors
CN116813797A (zh) 一种融合蛋白的组合物、包含其的基于生存压力的负向筛选系统
WO2024011360A1 (zh) 基于生存压力的筛选系统及高通量筛选装置
Backes et al. The mitochondrial surface receptor Tom70 protects the cytosol against mitoprotein-induced stress
Kim et al. New fast BiFC plasmid assay system for in vivo protein-protein interactions
CN116855503B (zh) 过表达mrgprx2的稳转细胞株及其构建方法和应用
CN105986001B (zh) 一种基于膜结合蛋白和荧光互补的高通量猎物拮抗剂筛选方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination