CN116769045A - 检测色氨酸的新型探针,其制备方法及应用 - Google Patents

检测色氨酸的新型探针,其制备方法及应用 Download PDF

Info

Publication number
CN116769045A
CN116769045A CN202210229003.7A CN202210229003A CN116769045A CN 116769045 A CN116769045 A CN 116769045A CN 202210229003 A CN202210229003 A CN 202210229003A CN 116769045 A CN116769045 A CN 116769045A
Authority
CN
China
Prior art keywords
tryptophan
leu
gly
protein
fluorescent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210229003.7A
Other languages
English (en)
Inventor
陶荣坤
杜久林
穆宇
王逵
陈天伦
张欣欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Center for Excellence in Brain Science and Intelligence Technology Chinese Academy of Sciences
Original Assignee
Center for Excellence in Brain Science and Intelligence Technology Chinese Academy of Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Center for Excellence in Brain Science and Intelligence Technology Chinese Academy of Sciences filed Critical Center for Excellence in Brain Science and Intelligence Technology Chinese Academy of Sciences
Priority to CN202210229003.7A priority Critical patent/CN116769045A/zh
Publication of CN116769045A publication Critical patent/CN116769045A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/5011Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing antineoplastic activity
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/5044Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics involving specific cell types
    • G01N33/5047Cells of the immune system
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/58Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
    • G01N33/582Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances with fluorescent label
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6806Determination of free amino acids
    • G01N33/6812Assays for specific amino acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/60Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2503/00Use of cells in diagnostics
    • C12N2503/02Drug screening
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/10Screening for compounds of potential therapeutic value involving cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • Genetics & Genomics (AREA)
  • Pathology (AREA)
  • Food Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Biophysics (AREA)
  • Toxicology (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明提供了一种检测色氨酸的新型探针,其制备方法及应用。本发明所述的探针,其含有对L‑色氨酸进行表现的荧光蛋白,以及对L‑色氨酸敏感的多肽。所述对L‑色氨酸敏感的多肽或其功能片段或L‑色氨酸结合结构域来源于对L‑色氨酸敏感的TrpR蛋白。本发明提供的L‑色氨酸荧光探针可以在体外、亚细胞或原位水平以及体内检测L‑色氨酸;它的特异性好,对于L‑苯丙氨酸,L‑酪氨酸等相似的氨基酸类似物没有响应,因此是一种适合于特异性的检测细胞内L‑色氨酸的方法。

Description

检测色氨酸的新型探针,其制备方法及应用
技术领域
本发明属于氨基酸检测分析领域,更具体地,本发明涉及检测色氨酸的新型探针,其制备方法及应用。
背景技术
L-色氨酸(Trp)是组成蛋白质的20种天然氨基酸之一,同时也是人体不能从头合成的八大必需氨基酸之一,因此它需从食物中汲取。L-色氨酸在人体内有非常多的重要功能,它是血清素(5-羟色胺)和褪黑素的前体,对于调节神经功能和睡眠有着重要作用;另外,它还是烟酸的生化前体,对于调节维生素代谢至关重要;最为重要的是,它的代谢产物犬尿氨酸(Kynurenine,Kyn),会参与免疫系统的调节。大量文献显示,癌症、神经退行性疾病中Trp代谢失衡引起了人们对以之为靶点进行治疗的极大关注,目前小分子IDO1抑制剂在早期癌症免疫治疗临床试验中显现出巨大前景。
色氨酸有三条去路,其一通过芳香族-L-氨基酸脱羧酶(AADC)脱羧后形成色胺;其二通过色氨酸羟化酶(TPH)形成5-羟色胺(5-HT);其三,超过95%的游离Trp通过限速酶吲哚胺-2,3-双加氧酶1(IDO1),IDO2,色氨酸-2,3-双加氧酶(TDO)三种限速酶转化为N-甲酰犬尿氨酸(NFK),NFK在犬尿氨酸甲酰胺酶作用下形成犬尿氨酸,Kyn通过犬尿氨酸酶(KYNU)转化为邻氨基苯甲酸,同时Kyn在犬尿氨酸氨基转移酶作用下生成犬尿喹啉酸(KA),这一步骤对于控制神经保护性KA的产生至关重要。特别是大脑中Kyn可通过线粒体天冬氨酸氨基转移酶转氨基作用形成KA。Kyn还通过KMO形成3-羟基犬尿氨酸(3HK)进而由KYNU催化生成3-羟基邻氨基苯甲酸(3-HAA),3-HAA通过3-羟基邻氨基苯甲酸-3,4-双加氧酶(HAAO)向神经毒性喹啉酸(QA)转化,QA可能被某些细胞转化为能量代谢中的关键辅酶NAD+。
色氨酸在人体不同器官的代谢差异较大。在肠道中,肠上皮细胞转运Trp穿过顶膜进入间质和肠系膜循环,此外,肠道微生物群合成和代谢Trp形成吲哚并将其释放进入体循环,Trp代谢物可作为宿主代谢能力的功能补充和调节宿主免疫应答的信号分子。进入肝脏内的大部分Trp被氧化成乙酰乙酰-CoA用于合成NAD+,肝外Trp则经KP通路代谢,如肾脏、脾脏和免疫细胞,对Kyn和KP代谢物体循环水平的贡献最大。在促炎刺激后,由骨髓细胞释放的KP代谢物会抑制T细胞应答。大脑中,Trp穿过血脑屏障后转化成5-HT,Kyn,3HK通过血脑屏障转运并被星形胶质细胞、小神经胶质细胞和神经元吸收,星形胶质细胞主要产生具有神经保护性的KA,而小胶质细胞产生具有神经毒性的QA。
科研工作者开发了大量的方法研究Trp的水平,其中最常见的就是高效液相色谱法(HPLC)。但是这些方法要求耗时耗力的样品破碎提取,过程中Trp容易降解,因此测量结果很不准确,还不能提供实时的结果。而目前实验室常用荧光试剂盒检测样本中的色氨酸含量,原理是利用色氨酸本身作为结构单元的非酶促反应产生荧光团,其激发光和发射光分别在370nm和440nm,这个反应是特异性的,不受到其它氨基酸的干扰,而且可以检测到生物样品中至少2.5μM的Trp。
基因编码的荧光蛋白探针存在光毒性小、可以基因编码,并能够通过基因操作的方法在细胞、组织乃至整个器官中进行表达,因此荧光探针是优异的单细胞代谢小分子的实时指示器。最早发现的荧光蛋白是从维多利亚发光水母(Aequorea victoria)中提取出来的绿色荧光蛋白GFP,它是由11条β-折叠链形成了独特的桶状结构,其内包裹着生色三肽(Ser65-Tyr66-Gly67)。GFP产生荧光不需要除了氧气之外的辅因子,它在成熟过程中会自发形成对-羟基苯亚甲基咪唑啉酮的生色团结构而产生荧光,而且荧光非常稳定,因此它是一种良好的成像工具。野生型的GFP有两个激发峰,395nm的主峰和475nm的肩峰,它们的发射光都在500nm左右(Heim,R.等,Proc Natl Acad Sci U S A.1994,V.91(26),pp.12501-12504)。经过数十年科研工作者的努力,产生很多不同颜色的绿色荧光蛋白突变体例如荧光增强型绿色荧光蛋白(EGFP)、超级折叠绿色荧光蛋白(SFGFP)、蓝色荧光蛋白(BFP)、青色荧光蛋白(CFP)、长斯托克斯位移的绿色荧光蛋白(TFP)、黄色荧光蛋白(YFP)等。
基因编码的荧光探针的主要构建方式有荧光共振能量转移(FRET)和基于天然荧光蛋白质的环状重排的单生色团的荧光蛋白。环状重排就是将荧光蛋白的天然的氨基端和羧基端通过一段柔性的短肽链连接,在野生型荧光蛋白近生色团的位置断裂,制造新的末端,这样就形成了一个对空间构象变化异常敏感的环状排列荧光蛋白(circularlypermuted fluorescent protein)。目前已经开发了多种不同颜色的环状重排的荧光蛋白(cpFP),如环状重排蓝色荧光蛋白(cpBFP),环状重排绿色荧光蛋白(cpEGFP),环状重排绿色荧光蛋白(cpTFP),环状重排黄色荧光蛋白(cpSFYFP SEQ ID NO:3),环状重排橙色荧光蛋白(cpmOrange),环状重排苹果红荧光蛋白(cpmApple)等。
目前可以用于检测细胞内Trp的工具主要有基于FRET的FLIPW探针。Kaper等人通过融合来自于大肠杆菌的TrpR,青色荧光蛋白(CFP)和黄色荧光蛋白(Citrine)而构建的FLIPW-CTYT探针,对Trp具有高度的选择性、大约0.35倍的荧光变化,以及约100μM的亲和力,可以实时监测COS-7细胞中色氨酸的吸收和交换,并证明了多种L-氨基酸和色氨酸的代谢产物Kyn等可以通过L-氨基酸转运体蛋白1(LAT-1)介导色氨酸的转运(Kaper T.等,Plosbiology,2007,V5(10),pp.e257)。但是,这个探针的分子量较大,可能很难定位到线粒体或者膜表面等部位,而且两个色氨酸蛋白质可能会对探针的成熟产生影响,最为重要的是其检测速度存在明显的延迟,不利于实时检测色氨酸代谢。另外,FRET探针需要使用多通道,并不是所有显微镜都适用,成像的时间较长,信号变化相对较小,难以在活体上使用。
鉴于上述本领域现状,还有必要开发新型的用于检测细胞内Trp的工具。
发明内容
本发明的目的在于提供L-色氨酸基因编码荧光探针、其制备方法及应用。一方面本发明涉及L-色氨酸的检测探针,具体涉及L-色氨酸的重组荧光融合蛋白检测探针。另一方面,本发明也涉及上述检测探针的制备方法及其在检测L-色氨酸中的应用。
在本发明的第一方面,提供一种L-色氨酸(L-Trp)荧光探针,包括:多肽B,其为对Trp敏感的多肽或其变体;以及多肽A,其为对Trp进行表现的荧光蛋白或其变体,其与多肽B操作性连接;所述多肽B探测Trp,与Trp相互作用,使得多肽A的荧光强度发生变化,从而确定Trp的存在情况或存在量。
在一种或多种实施方式中,所述对Trp进行表现的荧光蛋白A或其变体插入到所述对Trp敏感的多肽B或其变体的氨基酸序列中,将多肽B分为第一部分B1和第二部分B2,形成式(I)结构:
B1-(L1-)A-(L2-)B2 (I);
其中,L1为接头肽或为无;L2位接头肽或为无。
在一种或多种实施方式中,所述多肽B为TrpR多肽、或其L-色氨酸结合结构域,或其变体;较佳地,所述TrpR多肽的氨基酸如SEQ ID NO 2所示;较佳地,所述TrpR多肽由SEQID NO:1或与SEQ ID NO:1简并的核苷酸序列所编码。
在一种或多种实施方式中,所述TrpR来源于大肠杆菌。
在一种或多种实施方式中,相应于SEQ ID NO:2所示的多肽B的序列,多肽A插入到多肽B的第64-68位氨基酸中(任意两个氨基酸之间,或替换第65-67位中的1、2或3个氨基酸);
在一种或多种实施方式中,多肽A插入到多肽B的选自以下的氨基酸位置:第64位之后、第66位之前,替换其中第65位氨基酸;第64位之后、第67位之前,替换其中第65-66位氨基酸;或第65位之后、第68为之前,替换其中第66-67位氨基酸。
在一种或多种实施方式中,所述多肽B变体包括以下突变:相应于SEQ ID NO:2所示氨基酸序列,第69位突变,较佳地为R69E(对应GRIT探针的R316E)。
在一种或多种实施方式中,所述多肽A的荧光蛋白包括(但不限于):黄色荧光蛋白(Yellow Fluorescent Protein),绿色荧光蛋白(Green Fluorescent Protein,GFP),红色荧光蛋白(Red Fluorescent Protein,RFP),远红光荧光蛋白(Far-red FluorescentProtein),蓝色荧光蛋白(Blue Fluorescent Protein,BFP),青色荧光蛋白(CyanFluorescent Protein,CFP),近红外荧光蛋白(Near Infra-red Fluorescent Protein)。
在一种或多种实施方式中,所述多肽A的荧光蛋白为环状排列荧光蛋白(circularly permuted fluorescent protein);更佳地选自(但不限于):环状重排黄色荧光蛋白,环状重排蓝色荧光蛋白(cpBFP),环状重排绿色荧光蛋白(cpEGFP),环状重排绿色荧光蛋白(cpTFP),环状重排橙色荧光蛋白(cpmOrange),环状重排苹果红荧光蛋白(cpmApple)。
在一种或多种实施方式中,所述多肽A为环状重排黄色荧光蛋白,较佳地为维多利亚水母的环状变换的绿色荧光蛋白的突变体黄色荧光蛋白cpSFYFP(SEQ ID NO:3)。
在一种或多种实施方式中,所述多肽A的变体包括选自下组的突变:相应于SEQ IDNO:3所示氨基酸序列,第160位突变,较佳地为P160T。
在一种或多种实施方式中,相应于SEQ ID NO:3所示氨基酸序列,第62位突变,较佳地为V62M(对应GRIT探针的V126M和P224T)。
在一种或多种实施方式中,所述L1选自:无(相应于实施例中N3),SAG;较佳地为无。
在一种或多种实施方式中,所述L2选自:QA,CT,QC,EC,ST,YC,AS,AC,DG,GGT;较佳地为QA。
在一种或多种实施方式中,所述的荧光探针选自:SEQ ID NO:9,SEQ ID NO:8,SEQID NO:7,SEQ ID NO:6,SEQ ID NO:5或SEQ ID NO:4所示氨基酸序列的多肽。
在本发明的另一方面,提供一种L-色氨酸荧光探针的对照探针,其基于前面任一所述的L-色氨酸荧光探针,但发生点突变、插入突变或缺失突变,从而对L-色氨酸的亲和力非常弱、不显著或无;较佳地,所述多肽B为TrpR多肽、或其L-色氨酸结合结构域,或其变体,该对照探针中该TrpR多肽或其变体的第54位发生突变,较佳地该突变为R54G;更佳地,所述对照探针的氨基酸序列如SEQ ID NO:10所示。
在本发明的另一方面,提供一种融合蛋白,包括前面任一所述的L-色氨酸荧光探针或所述的对照探针;以及,与之融合的异源功能结构域。
在一种或多种实施方式中,所述异源功能结构域包括(但不限于):胞内定位信号,报告蛋白(如但不限于mCherry,GFP、HcRed、DsRed、CFP、YFP、BFP)、检测标记或标签蛋白(如但不限于GST、His、sumo、myc、Flag)、蛋白质靶向部分、具有延长体内半衰期作用的分子。
在一种或多种实施方式中,所述胞内定位信号为定位到不同亚细胞器的信号肽;较佳地,所述胞内定位信号包括(但不限于):胞质定位信号,线粒体定位信号,膜定位信号,核定位信号,胞质定位信号;较佳地,所述信号肽为氨基酸序列如SEQ ID NO:12-15任一所述的信号肽。
在一种或多种实施方式中,融合蛋白中,所述的L-色氨酸荧光探针或对照探针与所述的异源功能结构域之间,含有或不含有连接肽。
在一种或多种实施方式中,融合蛋白中,L-色氨酸荧光探针或对照探针与所述的异源功能结构域之间设有连接肽;所述连接肽例如为由丙氨酸和/或丝氨酸和/或甘氨酸组成的柔性多肽链,连接肽的长度优选为3~30个氨基酸。
在本发明的另一方面,提供一种多核苷酸,其编码:前面任一所述的L-色氨酸荧光探针;前面所述的L-色氨酸荧光探针的对照探针;或前面任一所述的融合蛋白。
在本发明的另一方面,提供一种表达构建体(如表达载体),其含有所述的分离的多核苷酸。
在本发明的另一方面,提供一种表达系统,所述表达系统含有所述的构建体或基因组中整合有所述的多核苷酸;较佳地所述表达系统为细胞表达系统(如宿主细胞)。
在本发明的另一方面,提供一种制备前面任一所述的L-色氨酸荧光探针、前面所述的L-色氨酸荧光探针的对照探针或前面任一所述的融合蛋白的方法,所述方法包括以下步骤:1)将所述的表达构建体转移到宿主细胞中,形成所述的表达系统;2)在所述的表达系统表达所述荧光探针或对照探针。
在一种或多种实施方式中,所述方法还包括纯化分离出所述的荧光探针、对照探针或融合蛋白的步骤。
在本发明的另一方面,提供前面任一所述的L-色氨酸荧光探针、所述的L-色氨酸荧光探针的对照探针或所述的融合蛋白的用途,
用于检测L-色氨酸,或用于制备检测L-色氨酸的试剂或试剂盒;或
用于筛选调节L-色氨酸表达水平或活性水平的候选药物,或用于制备筛选调节L-色氨酸表达水平或活性水平的候选药物的试剂或试剂盒。
在本发明的另一方面,提供一种筛选调节L-色氨酸表达水平或活性水平的候选药物的方法,所述方法包括:(1)提供一表达体系,该体系存在L-色氨酸生成途径(较佳地,该途径中包括但不限于膜运载蛋白LAT1和分解代谢的关键酶IDO/TDO);和(2)在(1)的体系中添加候选物质,在添加候选物质之前或之后,在(1)的体系中引入所述的L-色氨酸荧光探针,检测所述体系中L-色氨酸的水平;若L-色氨酸的水平发生上调,则该候选物质为L-色氨酸上调分子,若L-色氨酸的水平发生下调,则该候选物质为L-色氨酸下调分子。
在一种或多种实施方式中,根据候选物质对于L-色氨酸的上调或下调情况,进一步判断候选物质对于缓解、治疗L-色氨酸异常相关疾病的有效性。
在一种或多种实施方式中,所述的存在L-色氨酸生成途径的体系选自:细胞(培养物)体系、亚细胞(培养物)体系、组织(培养物)体系、器官(培养物)体系或动物体系。
在一种或多种实施方式中,所述的上调、提高或促进为统计学上的上调、提高或促进,如与对照或基底相比,上调、提高或促进10%或20%以上,较佳地上调、提高或促进30%或50%以上,更佳地上调、提高或促进80%或90%以上。
在一种或多种实施方式中,所述的下调、降低或抑制为统计学上的下调、降低或抑制,如与对照或基底相比,下调、降低或抑制10%或20%以上,较佳地下调、降低或抑制30%或50%以上,更佳地下调、降低或抑制80%或90%以上。
在一种或多种实施方式中,所述的候选物质包括(但不限于):针对L-色氨酸生成途径或其上游或下游蛋白或基因设计的调控分子(如但不限于上调剂、激动剂、干扰分子、核酸抑制物、结合分子(如抗体或配体)),CRISPR构建物,小分子化合物,来自化合物库的化合物。
在本发明的另一方面,提供一种用于检测L-色氨酸的组合物(试剂),所述组合物包括所述的L-色氨酸荧光探针、所述的L-色氨酸荧光探针的对照探针或所述的融合蛋白;以及,生理学上或药学上可接受的载体(如缓冲液)。
在本发明的另一方面,提供一种用于检测L-色氨酸的试剂盒或药盒,包括所述的L-色氨酸荧光探针、所述的L-色氨酸荧光探针的对照探针,或所述的融合蛋白。
在一种或多种实施方式中,所述试剂盒中还包括(但不限于)下组的试剂:制备感受态细胞的试剂,细胞转染试剂,荧光检测试剂,细胞裂解试剂,荧光探针的表达、纯化或检测试剂,和/或说明检测方法的使用说明书。
本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。
附图说明
图1、遗传编码的L-色氨酸荧光探针的原理。
图2、A-E显示遗传编码的L-色氨酸荧光探针的基本构造和开发过程。
图3、A-C显示遗传编码的L-色氨酸荧光探针的光谱性质。
图4、A-B显示细菌表达的GRIT探针对L-色氨酸的检测。
图5、A-E显示在HELA细胞中GRIT探针的亚细胞器定位表达。
图6、A-D显示HELA细胞中胞浆和线粒体中GRIT探针对外加色氨酸的响应。
图7、基于Trp荧光探针的高通量药物筛选。
具体实施方式
本发明提供了一种L-色氨酸(L-Trp)荧光探针,其含有对L-色氨酸进行表现的荧光蛋白,以及对L-色氨酸敏感的多肽。所述对L-色氨酸敏感的多肽或其功能片段或L-色氨酸结合结构域来源于对L-色氨酸敏感的TrpR蛋白。本发明提供的L-色氨酸荧光探针可以在体外、亚细胞或原位水平以及体内检测L-色氨酸;它的特异性好,对于L-苯丙氨酸,L-酪氨酸等相似的氨基酸类似物没有响应,因此是一种适合于特异性的检测细胞内L-色氨酸的方法。
在给出数值或范围时,本文所用术语“约”指该数值或范围在给定数值或范围的20%以内、10%以内和5%以内。
如本文所用,术语“含有”或“包括”包括了“包含”、“基本上由……构成”、和“由……构成”。术语“基本上由……构成”指在组合物中,除了含有必要成分或必要组份之外,还可含有少量的且不影响有效成分的次要成分和/或杂质。
在本发明中,术语“TrpR”或“TrpR蛋白”指的是一种广泛存在于大肠杆菌中并对细胞内L-色氨酸高度敏感的蛋白,它可以使得细菌中色氨酸浓度而调节基因表达。作为本发明的优选方式,所述“TrpR蛋白”是一条108个氨基酸的蛋白质,它是由6个α-螺旋(A-F)组成转录调节因子,其中α-螺旋D和E组成了DNA结合域,而α-螺旋A、B、C、F组成了Trp结合域和调节蛋白质二聚化的关键结构。当细胞内的色氨酸与Trp结合域结合后,TrpR就会形成二聚体,并调节基因转录活性,因此这是一种非常适合于构建L-色氨酸荧光探针的目标蛋白。
本发明中所涉及的“TrpR蛋白”可以包含核苷酸序列SEQ ID NO:1所编码的氨基酸序列。本发明中所涉及的“柔性区域”是指蛋白质高级结构中存在的一些特定的如环状结构域等结构,这些结构域相比于蛋白质的其他高级结构具有更高的移动性和柔性,并且该区域可以在该蛋白质和配体结合后,空间结构构象发生动态变化。本发明所涉及的柔性区域主要指TrpR蛋白中的插入位点所在区域,如64-68区域。
本文所用术语“关键氨基酸突变”或“TrpR蛋白突变体”是指在TrpR上产生的R54G突变体,这个突变位于TrpR的Trp结合域附近,它可以消除荧光探针对Trp的亲和力。
本文所用术语“融合蛋白”与“荧光融合蛋白”和“重组荧光融合蛋白”可互换使用,指包含第一种多肽或蛋白质或者其片段、类似物或衍生物的氨基酸序列,以及异源多肽或蛋白质(即,不同于第一种多肽或蛋白质或者其片段、类似物或衍生物的第二种多肽或蛋白质或者其片段、类似物或衍生物)的氨基酸序列的多肽或蛋白质。在一个实施方式中,融合蛋白包含与异源蛋白质、多肽或肽融合的荧光蛋白。按照这个实施方式,异源蛋白质、多肽或肽可能是或不是不同类型荧光蛋白。在一个实施方式中,与融合于异源蛋白质、多肽或肽之前的原始多肽或蛋白质的活性相比,融合蛋白保持或提高了活性。在一个具体实施方式中,融合蛋白包含与异源蛋白质、多肽或肽融合的荧光探针,所述异源蛋白质、多肽或肽可以是特异性亚细胞定位信号。而本文所用术语中的“L-色氨酸荧光探针”或“L-色氨酸荧光探针蛋白”特指与荧光蛋白融合的对环境中L-色氨酸敏感的多肽,所述对环境内L-色氨酸敏感的多肽具体可以是来源于大肠杆菌的TrpR或含有TrpR结合域融合的多肽,其利用专一性的L-色氨酸结构域与L-色氨酸结合后产生的构象变化引起的荧光蛋白的构象变化,进而导致荧光蛋白的荧光发生改变,并借助不同L-色氨酸浓度下测定的荧光蛋白的荧光绘制标准曲线,进而检测并分析L-色氨酸的存在和/或水平。
本文中所用术语“支架蛋白”是指具有配体亲和能力的蛋白,该蛋白可以和荧光蛋白融合形成该配体特异性的荧光探针。支架蛋白和配体结合后,通常有较大的构象变化,通过将荧光蛋白插入到构象变化较大的区域后,这种动态变化就可能传递到与之临近的荧光蛋白上,并导致荧光性质的变化。例如本发明中的“TrpR蛋白”就是一种支架蛋白,它可以和L-色氨酸结合,并产生较大的构象变化。
本文所用术语“生色团”,“荧光团”与“荧光蛋白”可互换使用,指在激发光照射下发出荧光的蛋白质。荧光蛋白作为生物科学领域的基础检测手段,例如生物技术领域常用的绿色荧光蛋白GFP及由该蛋白突变衍生出的环状重排的黄色荧光蛋白(cpSFYFP)等。
本文所用术语“GFP”指绿色荧光蛋白,最初是从维多利亚发光水母(Aequoreavictoria)中提取出来的,由238个氨基酸构成,分子量约为26kDa。GFP是由12条β-折叠链形成了独特的桶状结构,其内包裹着生色三肽(Ser 65-Tyr 66-Gly 67)。当在氧气存在下,它会自发形成对-羟基苯亚甲基咪唑啉酮的生色团结构而产生荧光。GFP产生荧光不需要辅因子,而且荧光非常稳定,是一种良好的成像工具。GFP有两个激发峰,395nm的主峰可产生508nm的发射光,而肩峰475nm的激发光照射则会产生的503nm的发射光。
本文所用术语“RFP”指红色荧光蛋白,最初是从海洋中的珊瑚中提取的,野生的RFP是寡聚体蛋白不利于生物体的融合表达,随后在RFP的基础上进一步衍生出了不同颜色波段的红色荧光蛋白,其中最常用的是mCherry和mKate等。
本文所用术语“cpFP”指环状重排的荧光蛋白,该蛋白最早衍生自绿色荧光蛋白GFP,其氨基酸序列与GFP同源性高达90%以上。它是将GFP的原始N端和C端通过一段柔性的短肽链连接,而在野生型GFP近生色团位置(如Y144和N145位氨基酸)制造一个新的N端和C端,将原第145-238位氨基酸部分作为新蛋白的N端,原第1-144位氨基酸作为新蛋白的C端,两片段间通过5~9个具有柔性的短肽链,如VDGGSGGTG或GGSGG等连接,形成一个对空间变化敏感的环状排列黄色荧光蛋白cpGFP。目前已经创造了多种环状重排的荧光蛋白(cpFP)用于荧光探针的构建,其中应用广泛一种环状重排的荧光蛋白是cpSFYFP,其氨基酸序列为SEQ ID NO:3。
“接头”或“连接区”指在本发明多肽、蛋白质或核酸中连接两个部分的氨基酸或核苷酸序列。在本发明L-色氨酸荧光探针内部的多肽或蛋白质中进行连接时,接头区的氨基酸性质直接决定了探针的性质。而当重组荧光蛋白探针作为基本单元和功能蛋白连接时,可以融合在重组荧光蛋白探针的氨基酸或羧基端,优选为重组荧光蛋白探针的氨基端;接头序列为柔性氨基酸组成的短肽链的重复单元,如GGGGS,其数目不超过30个,优选为10-20个。
本文所用术语“截短”或“截短突变”指的是采用分子克隆的方法将编码荧光探针蛋白的部分氨基酸序列的核苷酸序列进行缩短或者删除的操作。截短可以直接将蛋白的一个结构域(例如TrpR蛋白的DNA结构域)缩短或者删除,也可以是对蛋白内部的一些连接区域(例如TrpR蛋白和cpSFGFP连接部分的氨基酸寡肽)的氨基酸进行缩短或者删除。截短主要通过反向PCR的分子操作方法来实现,即通过一对特异性的引物与截短区域外的蛋白序列两端匹配,这样通过反向PCR扩增就可以产生删除某段核苷酸的线性化质粒,之后形成的重组质粒编码产生的蛋白就不再含有特定的氨基酸。这种截短方法在荧光蛋白探针的构建中很常用,适用于探针的性质优化和改造。
本文所用术语“荧光动态变化”或“荧光变化”或“荧光变化倍数”指的是荧光蛋白探针在结合配体后的荧光强度的变化,这种荧光变化可以根据荧光蛋白探针的光谱性质分为单通道变化或者双通道变化。单通道荧光变化的探针如基于cpBFP,cpGFP,cpTFP,cpRFP的探针,当这些探针和配体结合,它们的发射光荧光强度会增加或者降低,而这种增加或者降低的倍数就可以称为“荧光变化”。荧光变化越大,说明这个探针的性质越优良,更有可能用于细胞内检测。
本文所用术语“可逆性”或“可逆性检测”质的是荧光蛋白探针和配体结合时非共价的(例如本文中的TrpR和L-色氨酸的结合方式),因此当配体(L-色氨酸)浓度反复出现降低或者升高时,荧光探针的信号也会出现反复的上升或者降低。而不可逆的探针一般和配体都是共价结合的,它只能检测环境中的单次配体浓度变化,因此不利于探针在细胞内的应用,而拥有“可逆性检测”的探针则可以很好的用于长时间的活细胞观察。
本文所用术语“实时检测”或“时空特异性的检测”指的是荧光蛋白探针可以对细胞内特定空间进行实时追踪。当含有特定定位信号的荧光蛋白探针的质粒导入到细胞中后,就可以在细胞的特定区域中表达并驻留。在荧光显微镜等观察手段下对细胞进行连续成像,将获得的图片转化为细胞内的配体信号,就可以对细胞内的检测物进行时空特异性的检测。
提到某多肽或蛋白时,本发明所用术语“变异体”,“突变体”或“衍生突变体”包括具有所述多肽或蛋白相同功能、但序列不同的变异体。这些变异体包括(但并不限于):在所述多肽或蛋白的序列中缺失、插入和/或取代一个或多个(通常为1-30个,较佳地1-20个,更佳地1-10个,最佳地1-5个)氨基酸,以及在其羧基末端和/或氨基末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸获得的序列。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变多肽或蛋白的功能。在本领域中,性能相似的氨基酸往往指具有相似侧链的氨基酸家族,在本领域已有明确定义。这些家族包括具有碱性侧链的氨基酸(例如赖氨酸、精氨酸、组氨酸)、具有酸性侧链的氨基酸(例如天冬氨酸、谷氨酸)、具有不带电荷的极性侧链的氨基酸(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、具有非极性侧链的氨基酸(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸脯氨酸、苯丙氨酸、甲硫氨酸、L-色氨酸)、具有β-分支侧链的氨基酸(例如苏氨酸、缬氨酸、异亮氨酸)和具有芳香侧链的氨基酸(例如酪氨酸、苯丙氨酸、L-色氨酸、组氨酸)。又比如,在氨基末端和/或羧基末端添加一个或数个氨基酸通常也不会改变多肽或蛋白的功能。本领域技术人员公知,在基因克隆操作中,常常需要设计合适的酶切位点,这势必在所表达的多肽或蛋白末端引入了一个或多个不相干的残基,而这并不影响目的多肽或蛋白的活性。又如为了构建融合蛋白、促进重组蛋白的表达、获得自动分泌到宿主细胞外的重组蛋白、或利于重组蛋白的纯化,常常需要将一些氨基酸添加至重组蛋白的N-末端、C-末端或该蛋白内的其它合适区域内,例如,包括但不限于,适合的接头肽、信号肽、前导肽、末端延伸、谷胱甘肽S-转移酶(GST)、麦芽糖E结合蛋白、蛋白A、如6His或Flag的标签,或Xa因子或凝血酶或肠激酶的蛋白水解酶位点。多肽或蛋白的变异体可包括:同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严谨条件下能与所述多肽或蛋白的DNA杂交的DNA所编码的多肽或蛋白、以及利用抗所述多肽或蛋白的抗血清获得的多肽或蛋白。这些变异体还可包含与所述多肽或蛋白的序列相同性为至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约98%、至少约99%或100%的多肽或蛋白。
在两种或多种多肽或核酸分子序列中,术语“相同性”或“相同性百分数”指在比较窗口或指定区域上,采用本领域已知方法如序列比较算法,通过手工比对和目测检查来比较和比对最大对应性时,两个或多个序列或子序列相同或其中在指定区域有一定百分数的氨基酸残基或核苷酸相同(例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同)。例如,适合测定序列相同性百分数和序列相似性百分数的优选算法是BLAST和BLAST 2.0算法,分别可参见Altschul等(1977)Nucleic Acids Res.25:3389和Altschul等(1990)J.Mol.Biol.215:403。
本文所用术语“功能片段”、“衍生物”、“突变体”和“类似物”是指基本上保持与本发明的“TrpR蛋白”相同的生物学功能或活性的蛋白。本发明的“TrpR蛋白”的功能片段、衍生物、突变体或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的蛋白,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的蛋白,或(iii)成熟蛋白与另一个化合物(比如延长蛋白半衰期的化合物,例如聚乙二醇)融合所形成的蛋白,或(iv)附加的氨基酸序列融合到此蛋白序列而形成的蛋白(如前导序列或分泌序列或用来纯化此蛋白的序列或蛋白原序列,或与抗原IgG片段的形成的融合蛋白)。根据本文的教导,这些功能片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
所述类似物与“TrpR蛋白”的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些蛋白包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术得到。
所述类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的TrpR蛋白并不限于上述列举的代表性蛋白、片段、衍生物和类似物。修饰(通常不改变一级结构)形式包括:体内或体外的蛋白的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在蛋白的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的蛋白。这种修饰可以通过将蛋白暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的蛋白。
本发明所用术语“核酸”可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。例如,编码成熟蛋白的编码区序列可以与SEQ ID NO:9所示的编码区序列相同或者是其简并变体。如本文所用,“简并变体”在本发明中是指编码本发明荧光融合蛋白,但与本发明所列出的编码区序列有差别的核酸序列。
提到核酸时,本文所用术语“变异体”或“变体”可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括简并变异体、取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个核酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的蛋白的功能。本发明核酸可包含与所述核酸序列的序列相同性为至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约98%、至少约99%或100%的核苷酸序列。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)。
本发明荧光探针或融合蛋白的全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
本发明中的蛋白质和核酸序列优选以分离形式提供,更优选地被纯化至均质。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离和纯化得到有关多肽或蛋白。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来得到编码本发明蛋白(或其片段、衍生物、类似物或变异体)的DNA序列。然后可将该DNA序列引入本领域中已知的各种现有的DNA分子(如载体)和细胞中。可通过突变PCR或化学合成等方法将突变引入本发明蛋白序列中。
本文所用的术语“质粒”,“重组质粒”,“载体”和“重组载体”等可互换使用,指本领域熟知的原核或真核载体,例如细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体,这些载体能够在宿主体内复制和稳定,这些重组载体的一个重要特征是通常含有表达控制序列。本文所用术语“表达控制序列”指调控目的基因的转录、翻译和表达的可以与目的基因操作性连接的元件,可以是复制起点、启动子、标记基因或翻译控制元件,包括增强子、操纵子、终止子、核糖体结合位点等,表达控制序列的选择取决于所用的宿主细胞。在本发明中适用的重组载体包括但不限于细菌质粒。在重组表达载体中,“操作性连接”是指目的核苷酸序列与调节序列以允许核苷酸序列表达的方式连接。本领域的技术人员熟知能用于构建含本发明融合蛋白编码序列和合适的转录/翻译控制信号的表达载体的方法。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTR和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
本领域普通技术人员将理解重组表达载体的设计可取决于如欲转化的宿主细胞的选择、所需的蛋白质表达水平等因素。此外,重组表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如用于真核细胞的二氢叶酸还原酶、新霉素抗性,或用于大肠杆菌的四环素或氨苄青霉素抗性。
在一种实施方式中,将本发明荧光探针或融合蛋白的编码序列后与pRSETb载体连接,得到大肠杆菌重组表达载体。可以将本发明的表达载体转移到宿主细胞中,以产生包括融合蛋白的蛋白或肽。此种转移过程可用转化或转染等本领域技术人员熟知的常规技术进行。
本文在所用术语“宿主细胞”又称为受体细胞,是指能够接收和容纳重组DNA分子的细胞,是重组基因扩增的场所,理想的受体细胞应该满足易于获取和增殖两个条件。本发明的“宿主细胞”可包括原核细胞和真核细胞,具体包括细菌细胞、酵母细胞、昆虫细胞和哺乳动物细胞。
本发明的表达载体可用于在原核或真核细胞中表达本发明荧光探针或融合蛋白。从而,本发明涉及已导入本发明表达载体的宿主细胞、优选大肠杆菌。宿主细胞可为任何原核或真核细胞,代表性例子有:大肠杆菌,链霉菌属,鼠伤寒沙门氏菌的细菌细胞,真菌细胞如酵母,植物细胞,果蝇S2或Sf9的昆虫细胞,CHO、COS、HEK293细胞、或Bowes黑素瘤细胞的动物细胞等,其中包括但不限于上述的那些宿主细胞。所述宿主细胞优选各种利于基因产物表达或发酵生产的细胞,此类细胞已为本领域熟知并常用,例如各种大肠杆菌细胞和酵母细胞。在本发明的一个实施方式中,选用大肠杆菌Mach1构建表达本发明融合蛋白的宿主细胞。本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
本文所用术语“转化”和“转染”、“接合”和“转导”意指本领域内公知的各种将外源核酸(例如,线性DNA或RNA(例如,线性化载体或无载体的单独的基因构建体))或载体形式的核酸(例如,质粒、粘粒、噬菌体、噬粒、噬菌粒、转座子或其它DNA)导入宿主细胞的技术,包括磷酸钙或氯化钙共沉淀、DEAE-甘露聚糖-介导的转染、脂转染、天然感受态、化学介导的转移或电穿孔。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。另一种方法是使用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主细胞是真核细胞时,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
可以用适合所述宿主细胞表达的常规方法培养获得的转化细胞,表达本发明融合蛋白。根据所用的宿主细胞,培养中所用的培养基可以是各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组蛋白可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离或纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
在一个实施方式中,通过包含本发明融合蛋白编码序列的大肠杆菌发酵生产本发明荧光探针或融合蛋白,并通过超声破碎,亲和层析和凝胶层析纯化得到了纯形式的本发明荧光探针或融合蛋白。
本发明L-色氨酸荧光探针或融合蛋白的用途包括但不限于:检测L-色氨酸、在生理状态下检测L-色氨酸、在亚细胞水平检测L-色氨酸、原位检测L-色氨酸、诊断与L-色氨酸水平有关的疾病等。
在本文中,浓度、含量、百分数和其它数值均可用范围的形式表示。也应理解,使用这种范围形式只是为了方便和简洁,应该被弹性地借读为包括范围上下限所明确提及的数值,还应包括该范围内包括的所有单个数值或子范围,就好像明确提及各个数值和子范围那样。
本发明的荧光探针是由环状变换的黄色荧光蛋白(cpSFYFP)插入到“TrpR”蛋白单体中构建而成的,而克服现有技术中(1)关于L-色氨酸探针FLIPW,它基于FRET原理,蛋白质分子量较大,难以准确定位到亚细胞器,占用两个通道,成像时间较长,不适宜于多色成像和活体成像;探针检测速度存在明显的延迟,不利于实时检测色氨酸代谢等。但是,本发明提供的技术克服了现有技术L-色氨酸探针的缺陷,因为本系列的探针具有可调节的亲和力,红色和绿色,可以特异性定位到多种亚细胞器,检测到活体水平的生理条件下Trp的变化,这有利于检测Trp对肿瘤发生,免疫功能维持,神经活性等作用的研究。
作为本发明的优选方式,采用大肠杆菌TrpR蛋白作为对Trp敏感的多肽,它是大肠杆菌中色氨酸操纵子的一个阻遏蛋白。当TrpR与色氨酸结合后,它就会结合在操作子(operon)上,阻碍下游基因的表达,限制色氨酸代谢的相关酶系的表达。TrpR是一个108个氨基酸的蛋白质,由6个α-螺旋(A-F)组成转录调节因子,其中α-螺旋D和E组成了DNA结合域,而α-螺旋A、B、C、F组成了Trp结合域和调节蛋白质二聚化的关键结构。当细胞内的色氨酸与Trp结合域结合后,TrpR就会形成二聚体,并调节基因转录活性,因此这是一种非常适合于构建L-色氨酸荧光探针的目标蛋白(Shakked,Z.等,Nature,1994,V368(6470),pp.469-473))。本发明人通过反复分析研究,包括对apo-TrpR以及TrpR-DNA的晶体结构进行分析后,确定了G64-Q68是潜在的能发生空间构象变化的区域,而在这个部位融合荧光蛋白,将有可能产生一个对L-trp响应的探针。在此基础上,优化获得了本发明的L-色氨酸荧光探针。
本发明的设计原理是将来源于大肠杆菌的L-色氨酸敏感性多肽TrpR和用于表征荧光变化的cpFP融合,通过分子生物学的操作筛选出合适的插入位点,并对连接区的氨基酸进行饱和突变,希望可以得到一个对L-色氨酸敏感性的荧光探针。当环境中的L-色氨酸浓度发生变化时,TrpR会感受到这个信号,产生剧烈的构象变化,并将之传导到构象敏感的环状重排荧光蛋白cpFP上,这样通过实时检测cpFP的荧光变化就可以对环境中的L-色氨酸进行精确的测量。
本发明所用的用于对L-色氨酸进行表现的荧光蛋白序列可以来自于维多利亚多管发光水母(Aequorea victoria)的荧光蛋白及其衍生物,包括但不局限于环状重排黄色荧光蛋白(cpSFYFP)等。
本发明技术中用于对L-色氨酸敏感的多肽来源于大肠杆菌的L-色氨酸敏感性多肽TrpR。大肠杆菌TrpR蛋白,它是大肠杆菌中色氨酸操纵子的一个阻遏蛋白。当TrpR与色氨酸结合后,它就会结合在操作子(operon)上,阻碍下游基因的表达,限制色氨酸代谢的相关酶系的表达。TrpR是一个108个氨基酸的蛋白质,它是由6个α-螺旋(A-F)组成转录调节因子,其中α-螺旋D和E组成了DNA结合域,而α-螺旋A,B,C,F组成了Trp结合域和调节蛋白质二聚化的关键结构。当细胞内的色氨酸与Trp结合域结合后,TrpR就会形成二聚体,并调节基因转录活性,因此这是一种非常适合于构建L-色氨酸荧光探针的目标蛋白。
本发明中构建的L-色氨酸荧光探针是基于单生色团荧光蛋白的原理,由环状重排的荧光蛋白(cpFP)和对配体敏感的蛋白融合产生。这种构建方式是将荧光蛋白插入到后者的柔性松散区域,这个柔性松散的圈区(loop)可以根据蛋白的晶体结构推测,通常是两个结构域之间的一段环状结构,这个结构特别适合构象变化后力的传递。荧光蛋白有两百多个氨基酸,它的插入可能会导致蛋白质的折叠能力变差、荧光探针失去荧光等,因此荧光蛋白的插入位点的选择很重要。另外,荧光蛋白和对配体特异性结合的支架蛋白融合的连接区氨基酸数目和性质也非常关键,它们直接决定支架蛋白结合配体后构象变化产生的力传递到荧光蛋白的效率,因此探针构建必须对连接区氨基酸进行筛选。
本发明中将来源于大肠杆菌的对L-色氨酸特异性结合的TrpR蛋白和环状重排的荧光蛋白(cpFP)进行融合并改造,希望可以筛选获得新型的基因编码的L-色氨酸荧光探针。理论上,对L-色氨酸特异性结合的TrpR蛋白可以感受环境内L-色氨酸的浓度变化,并将这一构象变化传递至临近的环状重排的荧光蛋白,通过对荧光变化的测量,就可以对环境中L-色氨酸的浓度改变进行实时且直观地描述。
由于基于cpFP的荧光探针普遍存在pH敏感性的弱点,因此需要构建一个pH敏感的但是对L-色氨酸不响应的荧光探针用于对照探针的pH,对TrpR结合口袋附近的氨基酸突变就可以形成对照探针。除此之外,部分cpFP的探针(如cpSFYFP)的荧光变化是双通道的,所以可以用于制备比例型变化的荧光探针,可以更加精确的荧光检测和定量。
本发明提供的基因编码的L-色氨酸荧光探针,其内含有对环境内L-色氨酸敏感的多肽,和通过光谱性质的改变对环境内L-色氨酸进行表现的部分。在一个实施方式中,所述通过光谱性质的改变对环境内L-色氨酸进行表现的部分是荧光蛋白或其衍生物。
作为本发明的优选方式,本发明提供一种荧光探针,其包含荧光团以及大肠杆菌来源的TrpR。本发明还提供一种荧光探针,其包含荧光团以及大肠杆菌来源的TrpR蛋白的可溶性片段。
作为本发明的优选方式,本发明中用于建立所述荧光探针的蛋白,除了实施例中所具体列举的蛋白或特定位点突变的蛋白,还包括它们的变体或衍生物,例如具有99%、95%、90%、80%、70%或50%相同性的同源或非同源序列,较佳地,这些变体或衍生物中、本发明实施例中所特别指定的突变位点是保守的。
以所述的L-色氨酸探针作为基本单位,在其N端和/或C端融合其他多肽的融合蛋白,该融合蛋白不影响所述的L-色氨酸荧光探针的性质,用于扩大所述的L-色氨酸荧光探针的应用,所述在L-色氨酸荧光探针的N端和/或C端融合的多肽包括定位到不同亚细胞器的信号肽、用于纯化或者免疫印迹的标签、荧光蛋白。
所述在L-色氨酸荧光探针的N端和/或C端融合的多肽包括定位到不同亚细胞器的信号肽,所述亚细胞器为核排阻、细胞核、线粒体基质、细胞内膜、细胞外膜、内质网、高尔基体、线粒体膜间质等。
还可以将L-色氨酸荧光探针和其他蛋白多肽在氨基酸或羧基端融合,这种融合一般不会改变荧光探针的性质,同时可以扩大探针的应用。例如将L-色氨酸荧光探针和信号肽相连,可以将荧光探针定位到特定的亚细胞器中进行表达,检测该亚细胞器内的L-色氨酸浓度;将L-色氨酸荧光探针和多种融合标签相连,可以使该探针在多种宿主细胞内表达纯化或者免疫印迹进行相关的生化研究;将L-色氨酸荧光探针和没有光谱交叉的荧光蛋白融合,可以将该探针改造为比例型的荧光探针;
所述在L-色氨酸荧光探针的N端和/或C端融合的多肽包括用于纯化或者免疫印迹的标签,所述标签为6个组氨酸(6*His)、谷胱甘肽硫转移酶(GST)、sumo、myc、Flag等。
所述在L-色氨酸荧光探针的N端和/或C端融合的多肽包括荧光蛋白,所述荧光蛋白来自突变体BFP等、或者来源于珊瑚的红色荧光蛋白mCherry及其突变体。
本发明所述融合蛋白,其包含所述基因编码的L-色氨酸荧光探针荧光探针;优选的是,所述融合蛋白是由所述荧光探针与特异性亚细胞定位信号融合形成的,所述定位信号可将目标蛋白定位于指定的亚细胞器内。
本发明还提供所述荧光探针或融合蛋白在检测L-色氨酸中的应用。在一个实施方式中,本发明提供所述荧光探针或融合蛋白在体外或体内检测L-色氨酸中的应用。在一个实施方式中,本发明提供所述荧光探针或融合蛋白在亚细胞水平检测L-色氨酸中的应用。在一个实施方式中,本发明提供所述荧光探针或融合蛋白在原位检测L-色氨酸中的应用。在另一个实施方式中,本发明提供所述荧光探针或融合蛋白在诊断疾病中的应用,所述疾病与L-色氨酸水平有关。
本发明还提供了一种检测L-色氨酸的试剂盒,其中包含本发明荧光探针或融合蛋白。所述检测可以在体内、体外、亚细胞或原位水平进行。本发明还提供了一种用于检测与L-色氨酸水平有关的疾病的试剂盒,所述试剂盒包含有效量的本发明融合蛋白。在使用时,本领域技术人员能够根据所述融合蛋白的活性方便地确定所述的有效量。
本发明的有益技术效果在于:
利用来源于大肠杆菌的TrpR重组荧光蛋白构建的L-色氨酸荧光探针,不仅能够满足在细胞水平上实时可逆检测L-色氨酸的迫切需要,而且技术效果优异。
本发明提供的基因编码的L-色氨酸荧光探针及其制备方法和应用,该L-色氨酸荧光探针可以在体内、体外、亚细胞或原位水平检测L-色氨酸;探针特异性非常好,对于苯丙氨酸,酪氨酸等类似物没有响应,也没有竞争性干扰。探针蛋白相对较小且易于成熟,其荧光动态变化大,是一种适合于活细胞水平和亚细胞特异性的实时检测L-色氨酸的技术。
以下用实施例对本发明作进一步阐述。这些实施例仅仅用于举例说明,而不对本发明的范围构成任何限制。实施例中主要采用常规的基因工程分子生物学克隆方法和细胞培养以及成像方法等,这些方法是本领域普通技术人员所熟知的,例如:简·罗斯凯姆斯等的《分子生物学实验参考手册》,J.萨姆布鲁克,D.W.拉塞尔著,黄培堂等译:《分子克隆实验指南》(第三版,2002年8月,科学出版社出版,北京);费雷谢尼等的《动物细胞培养:基本技术指南》(第五版),章静波,徐存拴等译;J.S.博尼费斯农,M.达索等的《精编细胞生物学实验指南》,章静波等译。本领域普通技术人员按照以下实施例,不难根据具体情况略作修改和变换而成功实施本发明,这些修改和变换均落在本申请权利要求的范围内。
I.实验材料和试剂
基于pcDNA3.1的不同定位信号的质粒为基于商购引入信号肽编码序列后获得。
pRSETb,pBad-myc-HisB,pDisplay,pcDNA3.1-flag质粒载体购自Invitrogen公司。
pE-sumo质粒购自Lifesensor公司。
pGEX-4T-1质粒来源于Amersham Bioscience公司。
所有用于PCR的引物均由上海捷瑞生物工程技术有限公司合成、纯化和经质谱法鉴定正确。
实施例中构建的表达质粒都经过序列测定,序列测定由华大基因公司和杰李测序公司完成。
各实施例所用的Taq DNA聚合酶购自东盛生物,pfu DNA聚合酶购自天根生化科技(北京)有限公司,primeSTAR DNA聚合酶购自TaKaRa公司,三种聚合酶购买时都附带赠送对应聚合酶缓冲液和dNTP。BamHI、BglII、HindIII、NdeI、XhoI、EcoRI、SpeI等限制性内切酶、T4连接酶、T4磷酸化酶(T4 PNK)购自Fermentas公司,购买时附带有相对应的缓冲液等。Trp,ADP等均购自Merck公司。除非特别声明,无机盐类等化学试剂均购自sigma-aldrich公司。HEPES盐,氨苄青霉素(Amp)和嘌呤霉素购自Ameresco公司;96孔检测黑板、384孔荧光检测黑板购自Grenier公司。
实施例中所用的DNA纯化试剂盒购自BBI公司(加拿大),普通质粒小抽试剂盒购自天根生化科技(北京)有限公司,转染级别质粒小抽试剂盒购自OMEGA公司。克隆菌株Mach1购自Invitrogen公司。镍柱亲和层析柱和脱盐柱填料均来自GE healthcare公司。
实施例中所用的HEK293等细胞购自ATCC细胞保藏库,磷酸盐缓冲液(PBS),胰酶,澳洲特级胎牛血清,Lipofectamine 2000,DMEM培养基都是购自美国Invitrogen公司,小干扰RNA(siRNA)由上海吉玛公司合成。
II.实施例中用到的常规分子生物学方法和细胞实验方法
(一)聚合酶链式反应(PCR):
1.目的片段扩增PCR
该方法主要用于基因片段扩增和菌落PCR鉴定阳性克隆。目的片段PCR扩增反应体系包含如表1。
表1
扩增步骤(bp表示扩增片段的核苷酸数量)如表2。
表2
2.长片段(>2500bp)扩增PCR
本发明中使用的长片段扩增,主要是反向PCR扩增载体,在下述实施例中用于获得定点突变的一种技术。在变异部位设计反向PCR引物,其中一条引物的5’端包含变异的核苷酸序列。扩增后的产物就含有相应的突变位点。如表3。
表3
扩增步骤(bp表示扩增片段的核苷酸数量)如表4。
表4
或者如表5。
表5
(二)核酸内切酶酶切反应
对质粒载体进行双酶切的体系(n代表使体系达到总体积所需要加入的灭菌超纯水μL量)如表6。
表6
(三)DNA片段5’端磷酸化反应然后自身环化反应
从微生物中抽提出的质粒或者基因组末端都含有磷酸基团,而PCR产物没有,故需对PCR产物的5’端碱基进行磷酸基团加成反应,只有末端含有磷酸基团DNA分子才能发生连接反应。自身环化连接反应指线性化载体的3’端和5’端连接反应。如表7。
表7
/>
T4 PNK为T4多聚核苷酸激酶的简写,用于对DNA分子的5’端磷酸基团的加成反应。
(四)目的片段和载体的连接反应
不同的片段和载体之间的连接方法有所差异,本发明中使用了两种连接方法
1.含有粘性末端的DNA片段和含有粘性末端载体片段的连接
通过限制性内切酶切割的DNA片段通常会产生突出的粘性末端,因此可以和含有序列互补的粘性末端载体片段连接,形成重组质粒。连接体系如表8。
表8
注:PCR产物片段与载体双酶切产物的质量比大致在2:1-6:1之间。
2.反向PCR引入定点突变后5’端磷酸化的DNA片段产物自身环化的连接反应如表9。
表9
3.基于同源重组的连接反应
该反应要求载体和基因片段具有15-20bp的同源片段,载体或者基因可以通过酶切或者PCR产生,在同源重组酶的作用下,载体和基因会发生同源重组,形成重组质粒。如表10。
表10
/>
注:载体与基因片段的摩尔比大致在1:2—1:3之间。
(五)感受态细胞的制备与转化
感受态细胞的制备:
1.挑取单菌落(如Mach1)接种于5mL LB培养基中,37℃摇床过夜。
2.取0.5-1ml过夜培养的菌液转种到50mL LB培养基中,37℃,220rpm培养3至5h,直到OD600达到0.5。
3.冰浴预冷细胞2h。
4.4℃4000rpm离心10min。
5.弃上清,用5ml预冷的重悬缓冲液悬浮细胞,待均匀后再加入重悬缓冲液至终体积为50mL。
6.冰浴45min。
7.4℃4000rpm离心10min,用5mL冰预冷的储存缓冲液重悬细菌。
8.每个EP管中放100μL菌液,-80℃或液氮冻存。
重悬缓冲液:CaCl2(100mM)、MgCl2(70mM)、NaAc(40mM)
储存缓冲液:0.5mL DMSO、1.9mL 80%甘油、1mL 10×CaCl2(1M)、1mL 10×MgCl2(700mM)、1mL 10×NaAc(400mM)、4.6mL ddH2O
转化:
1.取100μl感受态细胞于冰浴上融化。
2.加入适当体积的连接产物,轻轻吹打混匀,冰浴30min。通常加入的连接产物的体积少于感受态细胞体积的1/10。
3.将菌液放入42℃水浴中热激90秒,迅速转移至冰浴中放置5min。
4.加入500μl LB,于37℃恒温摇床上200转培养15min。
5.将菌液4000rpm离心3min,留200μl上清将菌体吹匀,均匀涂布于含适当抗生素的琼脂平板表面,平板于37℃恒温培养箱内倒置过夜。
(六)Trp荧光探针的细胞裂解上清液检测
1.将pRSETb为基础的L-色氨酸探针质粒转化JM109(DE3),倒置培养过夜,从平板上挑取克隆到96深孔板中,置于37℃摇床,220rpm培养至OD在0.4~0.6之间,加入千分之一终浓度的IPTG,18℃下诱导24~36小时
2.4000rpm离心5min,离心后,弃去上清,使用PBS缓冲液冲洗细胞沉淀一次,4000rpm离心5min,弃去上清,冻存于-80℃冰箱中过夜。
3.使用PBS缓冲液冲洗细胞沉淀一次,4000rpm离心5min,取上清适量上清液用于检测
4.设置好酶标仪的参数,使用常温检测不同浓度的L-色氨酸下探针的荧光变化
(七)蛋白质荧光探针的表达,纯化和检测
1.将pRSETb为基础的L-色氨酸探针质粒转化JM109(DE3)感受态细胞中,倒置培养过夜,从平板上挑取克隆到250ml锥形瓶中,置于37℃摇床,220rpm培养至OD在0.4~0.6之间,加入千分之一终浓度的IPTG,18℃下诱导24~36小时离心收菌。
2.加入50mM的Tris-HCl缓冲液重悬菌体沉淀,超声破碎至菌体澄清。9600rpm,4℃离心20min。
3.离心上清通过自装的镍柱亲和层析柱纯化获得蛋白,镍柱亲和层析后的蛋白再通过自装的脱盐柱获得溶解在100mM HEPES缓冲液(100mM HEPES,100mM NaCl,pH 7.3)中的探针蛋白。
4.纯化的蛋白鉴定后,使用测定缓冲液(100mM HEPES,100mM NaCl,pH 7.3)稀释探针成终浓度为0.2μM的蛋白溶液。用测定缓冲液(100mM HEPES,100mM NaCl,pH 7.3)将L-色氨酸及其类似物分别配制成终浓度为100mM的储液,在测定前配置成为不同浓度梯度储液待用。
取100μl 0.2μM的荧光探针溶液,37℃温育5min,按照表格的浓度进行逐次滴定,测定蛋白的485nm荧光激发后528nm发射的荧光强度。对样品的荧光激发、发射测定利用多功能荧光酶标仪完成。
(八)哺乳动物细胞的转染和荧光检测
1.取对数生长期的细胞,吸出细胞培养板中的旧培养液,用磷酸盐缓冲液PBS洗涤细胞一次。
2.加入0.5ml胰酶,37℃或者常温作用数分钟,于光学显微镜下进行观察,当细胞呈现圆粒状将要离壁时,就可以终止消化。
3.加入无抗生素的含有胎牛血清的培养基,轻拍培养板使细胞脱落,用吸管轻轻吹匀打散细胞团,将单细胞悬液铺板到24孔培养板或者35毫米玻璃底培养板。
4.约12小时候转染,使用lipofectamine 2000将合适量的质粒或者siRNA转染到细胞中,4-6小时候更换培养基。
5.显微镜荧光成像:将转染后的细胞培养基移除,加入含有10mM葡萄糖的磷酸盐缓冲液PBS,将样品置于倒置荧光显微镜载物台上,选择好合适的条件进行拍照。
6.酶标仪荧光检测:消化细胞后铺板到96孔黑底的荧光检测板,加入检测药物或试剂,放入酶标仪进行荧光检测。
(九)序列信息
TrpR-DNA(SEQ ID NO:1)
ATGGCCCAACAATCACCCTATTCAGCAGCGATGGCAGAACAGCGTCACCAGGAGTGGTTACGTTTTGTCGACCTGCTTAAGAATGCCTACCAAAACGATCTCCATTTACCGTTGTTAAACCTGATGCTGACGCCAGATGAGCGCGAAGCGTTGGGGACTCGCGTGCGTATTGTCGAAGAGCTGTTGCGCGGCGAAATGAGCCAGCGTGAGTTAAAAAATGAACTCGGCGCGGGCATCGCGACGATTACGCGTGGATCGAACAGCCTGAAAGCCGCGCCTGTCGAGCTGCGCCAGTGGCTGGAAGAGGTGTTGCTGAAAAGCGAT
TrpR-AA(SEQ ID NO:2):
MAQQSPYSAAMAEQRHQEWLRFVDLLKNAYQNDLHLPLLNLMLTPDEREALGTRVRIVEELLRGEMSQRELKNELGAGIATITRGSNSLKAAPVELRQWLEEVLLKSD
cpSFYFP(SEQ ID NO:3):
FNSDNVYIMADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSFQSVLSKDPNEKRDHMVLLEFVTAAGITLGMDELYNVDGGSGGTGSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKLICTTGKLPVPWPTLVTTLGYGLKCFARYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGTYKTRAEVKFEGDTLVNRIELKGIGFKEDGNILGHKLEYN
64/66-AA(SEQ ID NO:4;其中以cpSFYFP插入TrpR氨基酸第64-66位之间,替换其第65位氨基酸E):
MAQQSPYSAAMAEQRHQEWLRFVDLLKNAYQNDLHLPLLNLMLTPDEREALGTRVRIVEELLRGSAGFNSDNVYIMADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSFQSVLSKDPNEKRDHMVLLEFVTAAGITLGMDELYNVDGGSGGTGSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKLICTTGKLPVPWPTLVTTLGYGLKCFARYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGTYKTRAEVKFEGDTLVNRIELKGIGFKEDGNILGHKLEYNGGTMSQRELKNELGAGIATITRGSNSLKAAPVELRQWLEEVLLKSD
64/67-AA(SEQ ID NO:5;其中以cpSFYFP插入TrpR氨基酸第64-67位之间,替换其第65-66位氨基酸EM):
MAQQSPYSAAMAEQRHQEWLRFVDLLKNAYQNDLHLPLLNLMLTPDEREALGTRVRIVEELLRGSAGFNSDNVYIMADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSFQSVLSKDPNEKRDHMVLLEFVTAAGITLGMDELYNVDGGSGGTGSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKLICTTGKLPVPWPTLVTTLGYGLKCFARYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGTYKTRAEVKFEGDTLVNRIELKGIGFKEDGNILGHKLEYNGGTSQRELKNELGAGIATITRGSNSLKAAPVELRQWLEEVLLKSD
65/68-AA(SEQ ID NO:6;其中以cpSFYFP插入TrpR氨基酸第65-68位之间,替换其第66-67位氨基酸MS):
MAQQSPYSAAMAEQRHQEWLRFVDLLKNAYQNDLHLPLLNLMLTPDEREALGTRVRIVEELLRGESAGFNSDNVYIMADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSFQSVLSKDPNEKRDHMVLLEFVTAAGITLGMDELYNVDGGSGGTGSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKLICTTGKLPVPWPTLVTTLGYGLKCFARYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGTYKTRAEVKFEGDTLVNRIELKGIGFKEDGNILGHKLEYNGGTQRELKNELGAGIATITRGSNSLKAAPVELRQWLEEVLLKSD
P2-N3C1-AA(SEQ ID NO:7):
MAQQSPYSAAMAEQRHQEWLRFVDLLKNAYQNDLHLPLLNLMLTPDEREALGTRVRIVEELLRGFNSDNVYIMADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSFQSVLSKDPNEKRDHMVLLEFVTAAGITLGMDELYNVDGGSGGTGSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKLICTTGKLPVPWPTLVTTLGYGLKCFARYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGTYKTRAEVKFEGDTLVNRIELKGIGFKEDGNILGHKLEYNGTMSQRELKNELGAGIATITRGSNSLKAAPVELRQWLEEVLLKSD
P2-N3C1-R69E/V206M/P53T:AA(SEQ ID NO:8):
MAQQSPYSAAMAEQRHQEWLRFVDLLKNAYQNDLHLPLLNLMLTPDEREALGTRVRIVEELLRGFNSDNVYIMADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSFQSMLSKDPNEKRDHMVLLEFVTAAGITLGMDELYNVDGGSGGTGSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKLICTTGKLPVPWTTLVTTLGYGLKCFARYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGTYKTRAEVKFEGDTLVNRIELKGIGFKEDGNILGHKLEYNGTMSQEELKNELGAGIATITRGSNSLKAAPVELRQWLEEVLLKSD
GRIT:AA(SEQ ID NO:9):
MAQQSPYSAAMAEQRHQEWLRFVDLLKNAYQNDLHLPLLNLMLTPDEREALGTRVRIVEELLRGFNSDNVYIMADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSFQSMLSKDPNEKRDHMVLLEFVTAAGITLGMDELYNVDGGSGGTGSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKLICTTGKLPVPWTTLVTTLGYGLKCFARYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGTYKTRAEVKFEGDTLVNRIELKGIGFKEDGNILGHKLEYNQAMSQEELKNELGAGIATITRGSNSLKAAPVELRQWLEEVLLKSD
GRITol:AA(SEQ ID NO:10)
MAQQSPYSAAMAEQRHQEWLRFVDLLKNAYQNDLHLPLLNLMLTPDEREALGTGVRIVEELLRGFNSDNVYIMADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSFQSMLSKDPNEKRDHMVLLEFVTAAGITLGMDELYNVDGGSGGTGSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKLICTTGKLPVPWTTLVTTLGYGLKCFARYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGTYKTRAEVKFEGDTLVNRIELKGIGFKEDGNILGHKLEYNGTMSQEELKNELGAGIATITRGSNSLKAAPVELRQWLEEVLLKSD
GRIT:DNA(SEQ ID NO:11)
atggcccaacaatcaccctattcagcagcgatggcagaacagcgtcaccaggagtggttacgttttgtcgacctgcttaagaatgcctaccaaaacgatctccatttaccgttgttaaacctgatgctgacgccagatgagcgcgaagcgttggggactcgcgtgcgtattgtcgaagagctgttgcgcggcttcaacagcgacaacgtctatatcatggccgacaagcagaagaacggcatcaaggccaacttcaagatccgccacaacgtcgaggacggcagcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccactacctgagcttccagtccatgctgagcaaagaccccaacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcggcatggacgagctgtacaacgtggatggcggtagcggtggcaccggcagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaagttcagcgtgcgtggcgagggcgagggcgatgccaccaacggcaagctgaccctgaagctgatctgcaccaccggcaagctgcccgtgccctggaccaccctcgtgaccaccctcggctacggcctgaagtgcttcgcccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttcaaggacgacggcacttacaagacccgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcggcttcaaggaggacggcaacatcctggggcacaagctggagtacaaccaggccatgagccaggaggagttaaaaaatgaactcggcgcgggcatcgcgacgattacgcgtggatctaacagcctgaaagccgcgcctgtcgagctgcgccagtggctggaagaggtgttgctgaaaagcgatctagcataa
tdNES-cyto(SEQ ID NO:12)
MALQKKLEELELDEQQRKRLEDLMALQKKLEELELDEQQRKRL
mito(SEQ ID NO:13)
MSVLTPLLLRGLTGSARRLPVPRAKIHSLGDLSVLTPLLLRGLTGSARRLPVPRAKIHSL
Nuc(SEQ ID NO:14)
DPKKKRKVDPKKKRKVDPKKKRKV
Mem(SEQ ID NO:15)
MLCCMRRTKQVEKNDEDQKI
mCherry-L20-GRIT:AA(SEQ ID NO:16)
MVSKGEEDNMAIIKEFMRFKVHMEGSVNGHEFEIEGEGEGRPYEGTQTAKLKVTKGGPLPFAWDILSPQFMYGSKAYVKHPADIPDYLKLSFPEGFKWERVMNFEDGGVVTVTQDSSLQDGEFIYKVKLRGTNFPSDGPVMQKKTMGWEASSERMYPEDGALKGEIKQRLKLKDGGHYDAEVKTTYKAKKPVQLPGAYNVNIKLDITSHNEDYTIVEQYERAEGRHSTGGMDELYKASGGGGSGGGGSGGGGSGGGGSGTMAQQSPYSAAMAEQRHQEWLRFVDLLKNAYQNDLHLPLLNLMLTPDEREALGTRVRIVEELLRGFNSDNVYIMADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSFQSMLSKDPNEKRDHMVLLEFVTAAGITLGMDELYNVDGGSGGTGSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKLICTTGKLPVPWTTLVTTLGYGLKCFARYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGTYKTRAEVKFEGDTLVNRIELKGIGFKEDGNILGHKLEYNQAMSQEELKNELGAGIATITRGSNSLKAAPVELRQWLEEVLLKSD
实施例1、L-色氨酸探针的方案设计
现有的TrpR氨基酸序列如SEQ ID NO:2所示。
本发明人根据现有的TrpR与色氨酸结合或者脱辅基状态下的进行晶体结构分析,经反复研究,发现G64-Q68是是潜在地能发生空间构象变化的区域,而在这个部位融合荧光蛋白,将有可能产生一个对L-trp响应的探针。
cpSFYFP(环状排列超折叠YFP)氨基酸序列如SEQ ID NO:3所示,其是一个环状变换的黄色荧光蛋白,本发明人经过研究后,选择将荧光蛋白如cpSFYFP插入上述G64-Q68或附近的区域,并进行荧光筛选。
本发明人制备了15种L-色氨酸荧光探针突变体P1-P15,置于pRSETb质粒中,引入到JM109(DE3)细菌中,对它们进行诱导表达和活菌检测,检测的荧光变化,如图2所示。
其中P2,P3,P8三个荧光探针展现了对Trp的较好的响应,探针的双通道荧光比例改变了将近1倍。其中,P2的插入位点为64/66(SEQ ID NO:4),P3为64/67(SEQ ID NO:5),P8为65/68(SEQ ID NO:6)。
之后,本发明人决定使用这些荧光探针进行连接区的长度优化,其中先对N端的6个氨基酸截短,随后本发明人对这些荧光探针突变体进行诱导表达和活菌检测,检测的荧光变化如图2A,图2C所示。
本发明人发现P2和P3探针,N端截短3个氨基酸后具有较大的荧光变化,然后又对其进行了C端的3个氨基酸截短,置于pRSETb质粒中,引入到JM109(ED3)细菌中,同样进行荧光探针突变体进行诱导表达和活菌检测,检测的荧光变化,如图2A和2D所示。
结果显示有四个荧光变化有显著增加的突变体P2-N3C1(与前面设计的序列如P8相比,荧光蛋白的N端linker截短3aa,C端linker截短1aa),P2-N3C2(荧光蛋白的N端linker截短3aa,C端linker截短2aa),P3-N3C1,P3-N3C2。如表11。
表11
实施例2、探针的理性设计优化
本发明人选择突变体P2-N3C1进行更进一步的优化,根据晶体结构分析,认为TrpR-R69这个碱性氨基酸可能会与cpSFYFP蛋白上的碱性氨基酸存在静电排斥作用,因此突变为酸性氨基酸可能会增加探针对色氨酸的响应。不仅如此,还对cpSFYFP的结构进行分析,推测V206M和P53X可能会改变探针的性质。在引物中掺入相应的突变,并反向PCR扩增所需的线性化载体,回收后通过T4 PNK和T4 DNA ligase将pRSETb载体磷酸化并自连接转化后,挑取>8000个克隆进行表达筛选,并将荧光变化大的克隆送测序。
本发明人对产生的L-色氨酸荧光探针突变体进行转化、诱导表达和活菌检测,结果如图2D,发现R316E(相应于TrpR第69位R69E)可以增加荧光变化约1倍,而V126M(相应于荧光蛋白第62位V62M)可以增加探针变化约20%,P224T(相应于荧光蛋白第160位P160T)可以增加探针变化约20%。最终本发明人综合三个突变到色氨酸探针上,结果显示P2-N3C1-V126M/P224T/R316E大约展现出了近6倍的比例型荧光变化,并将之命名为GRIT0(P2-N3C1-V126M/P224T/R316E)。
本发明人更进一步对该探针进行连接区的氨基酸进行饱和突变,将cpSFYFP的分别位于两端的两个氨基酸视为L1和L2,在引物中掺入相应的突变,并反向PCR扩增所需的线性化载体,回收后通过T4 PNK和T4 DNA ligase将载体磷酸化并自连接转化后,挑取>8000个克隆进行表达筛选,并将荧光变化大的克隆送测序。
本发明人对产生的L-色氨酸荧光探针突变体进行转化、诱导表达和活菌检测,结果如图2D,对L1进行筛选,并未观察到性质明显改变的突变体。本发明人对L2进行筛选,得出了一些较好的突变体(如图2D所示),其中性质最好的是L2-QA,它对L-色氨酸显示出最大的荧光变化有13倍左右,而且在对L-色氨酸的解离常数(Kd)在0.4mM左右。本发明人将最优异的突变体命名为GRIT(SEQ ID NO:9)(图1和图2A)。如表12。
表12
P3-N3C1-MTD为P2-N3C1-V126M/P224T/R316D。
P3-N3C1-MTE(GRIT0)为P2-N3C1-V126M/P224T/R316E。
GRIT0-L2-NT为:GRIT0基础上,L2变为“NT”。
GRIT0-L2-AC为:GRIT0基础上,L2变为“AC”。
GRIT0-L2-AS为:GRIT0基础上,L2变为“AS”。
GRIT0-L2-CT为:GRIT0基础上,L2变为“CT”。
GRIT0-L2-QC为:GRIT0基础上,L2变为“QC”。
GRIT0-L2-ST为:GRIT0基础上,L2变为“ST”。
GRIT0-L2-YC为:GRIT0基础上,L2变为“YC”。
GRIT0-L2-EC为:GRIT0基础上,L2变为“EC”。
实施例3、L-色氨酸荧光探针GRIT的对Trp亲和力的调节
本发明人希望构建一个对色氨酸不敏感的对照探针Gritol,用于矫正可能存在的干扰。突变R54G可以消除TrpR对L-色氨酸亲和能力,本发明人将该位突变位点引入,希望得到对照探针。在实施例2获得的GRIT的基础上,通过反向PCR引入定点突变,诱导表达并进行上清液的Trp检测,挑选阳性克隆由北京六合华大基因科技股份有限公司上海分公司完成测序。
本发明人对产生的L-色氨酸荧光探针文库进行转化、诱导表达和活菌检测,结果如图2D和下表所示,结果显示这些突变体对L-色氨酸几乎不响应,因此是一个相当好的对照质粒(GRITOL)。如表13。
表13
实施例4、L-色氨酸荧光探针和其它蛋白的融合和应用
以含有实施例3的突变体GRIT的质粒(突变质粒GRIT)为所选的荧光探针,将其直接酶切亚克隆到含有不同蛋白纯化标签和蛋白免疫印迹标签的质粒上,经过测序正确后,将重组质粒转化到JM109(DE3)中诱导表达,使用活菌检测探针对于L-色氨酸的响应。其中pcDNA3.1-flag在细胞中表达,检测方法和重组菌相似。如表14。
表14
结果显示,所有的测试蛋白标签和L-色氨酸荧光探针融合都不影响其性质,而GST和sumo标签因为本身存在分子伴侣的功能,融合蛋白的荧光甚至比原始探针的荧光还强,这使得探针可以在不同的表达系统中使用。
以GRIT为所选的荧光探针,在含有GRIT的质粒中,使用不同长度的柔性连接区重复单元GGGGS,将其中的GRIT和其他颜色的荧光蛋白融合,获得重组质粒,经过测序正确后,将重组质粒转化到JM109(DE3)中诱导表达活菌检测探针对于L-色氨酸的响应。如表15。
表15
结果显示,在蛋白探针的氨基端或者羧基端融合红色荧光蛋白mCherry都不会明显影响探针的荧光性质,当柔性的连接区的氨基酸数目在20个时,探针的荧光性质和原始探针改变最小,这个结论在BFP上也成立,其中部分荧光探针融合蛋白mCherry-L20-GRIT的氨基酸序列如SEQ ID NO:ID:15所示。
实施例5、L-色氨酸荧光探针的光谱性质
将GRIT转化JM109(DE3),诱导表达,并纯化蛋白,通过SDS-PAGE鉴定,两个蛋白的纯度很高,大小正确。将如上所述制备的荧光探针GRIT溶解于测定缓冲液(100mM HEPES,100mM NaCl,pH 7.3)中配制成终浓度为5μM的荧光探针溶液。利用荧光分光光度计测定激发和发射光谱(图3A-C)。
荧光光谱特性测定的实验结果表明,GRIT蛋白光谱性质和其他cpSFYFP探针相同,具有两个激发峰,分别为420nm和490nm,其中490nm为主峰,而420nm处的为肩峰,仅有一个发射峰在515nm左右。在加入1mM的L-色氨酸后,420nm的肩峰有大约4倍的降低,而490nm的主峰则由高达近3.5倍左右的提升,因此GRIT本身也是一个比例型的荧光探针。
实施例6、L-色氨酸荧光探针对L-色氨酸及其类似物的响应性质
将荧光探针GRIT,GRITOL中诱导表达24h后,加入不同浓度的L-色氨酸,苯丙氨酸或酪氨酸等进行检测。
测定结果显示,GRIT荧光探针仅对L-色氨酸有明显响应,而对于其他氨基酸类似物并无明显响应,探针的解离常数(Kd)在0.35μM左右(如图4A-B),探针存在一个响应时间,可能是因为L-色氨酸需要跨膜运输导致。
实施例7、L-色氨酸荧光探针在不同亚细胞器内定位表达
以pRSETb-GRIT为模板,通过双酶切的方法获得L-色氨酸荧光探针基因,酶切产物片段回收后分别连接到pcDNA3.1-Hygro-Cyto&Nuc(pcDNA3.1来自invitrogen,Cyto&Nuc信号肽为细胞质以及核相应的信号肽)、pcDNA3.1-tdNES-Cyto(tdNES信号肽为细胞核排阻定位信号肽)、pcDNA3.1-Mito(Mito为线粒体相应的信号肽)、pcDNA3.1-Nuc(Nuc信号肽为核相应的信号肽)、pcDNA3.1-Mem(Men信号肽为细胞膜相应的信号肽)载体上,各种不同定位的信号肽氨基酸序列如序列表中SEQ ID NO:11-14所示。利用所得的重组质粒转染HELA细胞,用倒置荧光显微镜观察转染后的细胞,两组滤镜分别选择FITC。
GRIT-Cyto&Nuc在HELA细胞中高效、准确定位于细胞浆和细胞核中(图5A);GRIT-Cyto(tdNES)在HELA细胞中高效、准确定位于细胞浆中(图5B);GRIT-Mito在HELA细胞中高效、准确定位于线粒体中(图5C);GRIT-Nuc在HELA细胞中高效、准确定位于细胞核中(图5D);GRIT-Mem在HELA细胞中高效、准确定位于细胞内膜上(图5E);
实施例8、用L-色氨酸荧光探针检测细胞内Trp的变化
在HELA细胞胞浆中和线粒体分别表达GRIT荧光探针,在培养基中外加Trp,该GRIT荧光探针能够实时地检测细胞内L-色氨酸的上升分别2.3倍和1.3倍(图6A、图6C),而外源加入组氨酸则会引起GRIT探针的荧光下降了70%,线粒体中探针的荧光下降了30%(图6B、图6D),证明组氨酸可以促进色氨酸从胞浆中排除,并影响线粒体色氨酸的代谢(图6)。
实施例9、基于Trp荧光探针的高通量药物筛选
色氨酸代谢对于免疫细胞功能维持,神经递质合成等具有重要作用,它的失调与癌症、神经退行性疾病等非常相关,特别是色氨酸的膜运载蛋白LAT1和分解代谢的关键酶IDO等,因此可以使用稳定转染色氨酸探针的细胞筛选和LAT1、IDO等有关的抑制剂或者激活剂。
本发明人随后将表达GRIT的稳定细胞株添加到黑底的384孔板中,筛选了数千种小分子抑制剂化合物库(图7),最终发现了3种能够提高细胞内Trp水平的药物(药物1),10多种能够降低细胞内Trp水平的药物(药物2)。它们将会有潜力用于IDO、LAT1等为靶点的肿瘤和神经疾病中。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。同时,在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。
序列表
<110> 中国科学院脑科学与智能技术卓越创新中心
<120> 检测色氨酸的新型探针,其制备方法及应用
<130> 220506
<160> 16
<170> SIPOSequenceListing 1.0
<210> 1
<211> 324
<212> DNA
<213> E. Coli.
<400> 1
atggcccaac aatcacccta ttcagcagcg atggcagaac agcgtcacca ggagtggtta 60
cgttttgtcg acctgcttaa gaatgcctac caaaacgatc tccatttacc gttgttaaac 120
ctgatgctga cgccagatga gcgcgaagcg ttggggactc gcgtgcgtat tgtcgaagag 180
ctgttgcgcg gcgaaatgag ccagcgtgag ttaaaaaatg aactcggcgc gggcatcgcg 240
acgattacgc gtggatcgaa cagcctgaaa gccgcgcctg tcgagctgcg ccagtggctg 300
gaagaggtgt tgctgaaaag cgat 324
<210> 2
<211> 108
<212> PRT
<213> E. Coli.
<400> 2
Met Ala Gln Gln Ser Pro Tyr Ser Ala Ala Met Ala Glu Gln Arg His
1 5 10 15
Gln Glu Trp Leu Arg Phe Val Asp Leu Leu Lys Asn Ala Tyr Gln Asn
20 25 30
Asp Leu His Leu Pro Leu Leu Asn Leu Met Leu Thr Pro Asp Glu Arg
35 40 45
Glu Ala Leu Gly Thr Arg Val Arg Ile Val Glu Glu Leu Leu Arg Gly
50 55 60
Glu Met Ser Gln Arg Glu Leu Lys Asn Glu Leu Gly Ala Gly Ile Ala
65 70 75 80
Thr Ile Thr Arg Gly Ser Asn Ser Leu Lys Ala Ala Pro Val Glu Leu
85 90 95
Arg Gln Trp Leu Glu Glu Val Leu Leu Lys Ser Asp
100 105
<210> 3
<211> 246
<212> PRT
<213> Artificial Sequence
<400> 3
Phe Asn Ser Asp Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly
1 5 10 15
Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser Val
20 25 30
Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro
35 40 45
Val Leu Leu Pro Asp Asn His Tyr Leu Ser Phe Gln Ser Val Leu Ser
50 55 60
Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val
65 70 75 80
Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Asn Val Asp
85 90 95
Gly Gly Ser Gly Gly Thr Gly Ser Lys Gly Glu Glu Leu Phe Thr Gly
100 105 110
Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys
115 120 125
Phe Ser Val Arg Gly Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu
130 135 140
Thr Leu Lys Leu Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro
145 150 155 160
Thr Leu Val Thr Thr Leu Gly Tyr Gly Leu Lys Cys Phe Ala Arg Tyr
165 170 175
Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu
180 185 190
Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Thr Tyr
195 200 205
Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg
210 215 220
Ile Glu Leu Lys Gly Ile Gly Phe Lys Glu Asp Gly Asn Ile Leu Gly
225 230 235 240
His Lys Leu Glu Tyr Asn
245
<210> 4
<211> 359
<212> PRT
<213> Artificial Sequence
<400> 4
Met Ala Gln Gln Ser Pro Tyr Ser Ala Ala Met Ala Glu Gln Arg His
1 5 10 15
Gln Glu Trp Leu Arg Phe Val Asp Leu Leu Lys Asn Ala Tyr Gln Asn
20 25 30
Asp Leu His Leu Pro Leu Leu Asn Leu Met Leu Thr Pro Asp Glu Arg
35 40 45
Glu Ala Leu Gly Thr Arg Val Arg Ile Val Glu Glu Leu Leu Arg Gly
50 55 60
Ser Ala Gly Phe Asn Ser Asp Asn Val Tyr Ile Met Ala Asp Lys Gln
65 70 75 80
Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp
85 90 95
Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly
100 105 110
Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Phe Gln Ser
115 120 125
Val Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu
130 135 140
Glu Phe Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr
145 150 155 160
Asn Val Asp Gly Gly Ser Gly Gly Thr Gly Ser Lys Gly Glu Glu Leu
165 170 175
Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn
180 185 190
Gly His Lys Phe Ser Val Arg Gly Glu Gly Glu Gly Asp Ala Thr Asn
195 200 205
Gly Lys Leu Thr Leu Lys Leu Ile Cys Thr Thr Gly Lys Leu Pro Val
210 215 220
Pro Trp Pro Thr Leu Val Thr Thr Leu Gly Tyr Gly Leu Lys Cys Phe
225 230 235 240
Ala Arg Tyr Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala
245 250 255
Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp
260 265 270
Gly Thr Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu
275 280 285
Val Asn Arg Ile Glu Leu Lys Gly Ile Gly Phe Lys Glu Asp Gly Asn
290 295 300
Ile Leu Gly His Lys Leu Glu Tyr Asn Gly Gly Thr Met Ser Gln Arg
305 310 315 320
Glu Leu Lys Asn Glu Leu Gly Ala Gly Ile Ala Thr Ile Thr Arg Gly
325 330 335
Ser Asn Ser Leu Lys Ala Ala Pro Val Glu Leu Arg Gln Trp Leu Glu
340 345 350
Glu Val Leu Leu Lys Ser Asp
355
<210> 5
<211> 358
<212> PRT
<213> Artificial Sequence
<400> 5
Met Ala Gln Gln Ser Pro Tyr Ser Ala Ala Met Ala Glu Gln Arg His
1 5 10 15
Gln Glu Trp Leu Arg Phe Val Asp Leu Leu Lys Asn Ala Tyr Gln Asn
20 25 30
Asp Leu His Leu Pro Leu Leu Asn Leu Met Leu Thr Pro Asp Glu Arg
35 40 45
Glu Ala Leu Gly Thr Arg Val Arg Ile Val Glu Glu Leu Leu Arg Gly
50 55 60
Ser Ala Gly Phe Asn Ser Asp Asn Val Tyr Ile Met Ala Asp Lys Gln
65 70 75 80
Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp
85 90 95
Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly
100 105 110
Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Phe Gln Ser
115 120 125
Val Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu
130 135 140
Glu Phe Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr
145 150 155 160
Asn Val Asp Gly Gly Ser Gly Gly Thr Gly Ser Lys Gly Glu Glu Leu
165 170 175
Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn
180 185 190
Gly His Lys Phe Ser Val Arg Gly Glu Gly Glu Gly Asp Ala Thr Asn
195 200 205
Gly Lys Leu Thr Leu Lys Leu Ile Cys Thr Thr Gly Lys Leu Pro Val
210 215 220
Pro Trp Pro Thr Leu Val Thr Thr Leu Gly Tyr Gly Leu Lys Cys Phe
225 230 235 240
Ala Arg Tyr Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala
245 250 255
Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp
260 265 270
Gly Thr Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu
275 280 285
Val Asn Arg Ile Glu Leu Lys Gly Ile Gly Phe Lys Glu Asp Gly Asn
290 295 300
Ile Leu Gly His Lys Leu Glu Tyr Asn Gly Gly Thr Ser Gln Arg Glu
305 310 315 320
Leu Lys Asn Glu Leu Gly Ala Gly Ile Ala Thr Ile Thr Arg Gly Ser
325 330 335
Asn Ser Leu Lys Ala Ala Pro Val Glu Leu Arg Gln Trp Leu Glu Glu
340 345 350
Val Leu Leu Lys Ser Asp
355
<210> 6
<211> 358
<212> PRT
<213> Artificial Sequence
<400> 6
Met Ala Gln Gln Ser Pro Tyr Ser Ala Ala Met Ala Glu Gln Arg His
1 5 10 15
Gln Glu Trp Leu Arg Phe Val Asp Leu Leu Lys Asn Ala Tyr Gln Asn
20 25 30
Asp Leu His Leu Pro Leu Leu Asn Leu Met Leu Thr Pro Asp Glu Arg
35 40 45
Glu Ala Leu Gly Thr Arg Val Arg Ile Val Glu Glu Leu Leu Arg Gly
50 55 60
Glu Ser Ala Gly Phe Asn Ser Asp Asn Val Tyr Ile Met Ala Asp Lys
65 70 75 80
Gln Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu
85 90 95
Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile
100 105 110
Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Phe Gln
115 120 125
Ser Val Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu
130 135 140
Leu Glu Phe Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu
145 150 155 160
Tyr Asn Val Asp Gly Gly Ser Gly Gly Thr Gly Ser Lys Gly Glu Glu
165 170 175
Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val
180 185 190
Asn Gly His Lys Phe Ser Val Arg Gly Glu Gly Glu Gly Asp Ala Thr
195 200 205
Asn Gly Lys Leu Thr Leu Lys Leu Ile Cys Thr Thr Gly Lys Leu Pro
210 215 220
Val Pro Trp Pro Thr Leu Val Thr Thr Leu Gly Tyr Gly Leu Lys Cys
225 230 235 240
Phe Ala Arg Tyr Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser
245 250 255
Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp
260 265 270
Asp Gly Thr Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr
275 280 285
Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Gly Phe Lys Glu Asp Gly
290 295 300
Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Gly Gly Thr Gln Arg Glu
305 310 315 320
Leu Lys Asn Glu Leu Gly Ala Gly Ile Ala Thr Ile Thr Arg Gly Ser
325 330 335
Asn Ser Leu Lys Ala Ala Pro Val Glu Leu Arg Gln Trp Leu Glu Glu
340 345 350
Val Leu Leu Lys Ser Asp
355
<210> 7
<211> 355
<212> PRT
<213> Artificial Sequence
<400> 7
Met Ala Gln Gln Ser Pro Tyr Ser Ala Ala Met Ala Glu Gln Arg His
1 5 10 15
Gln Glu Trp Leu Arg Phe Val Asp Leu Leu Lys Asn Ala Tyr Gln Asn
20 25 30
Asp Leu His Leu Pro Leu Leu Asn Leu Met Leu Thr Pro Asp Glu Arg
35 40 45
Glu Ala Leu Gly Thr Arg Val Arg Ile Val Glu Glu Leu Leu Arg Gly
50 55 60
Phe Asn Ser Asp Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly
65 70 75 80
Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser Val
85 90 95
Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro
100 105 110
Val Leu Leu Pro Asp Asn His Tyr Leu Ser Phe Gln Ser Val Leu Ser
115 120 125
Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val
130 135 140
Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Asn Val Asp
145 150 155 160
Gly Gly Ser Gly Gly Thr Gly Ser Lys Gly Glu Glu Leu Phe Thr Gly
165 170 175
Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys
180 185 190
Phe Ser Val Arg Gly Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu
195 200 205
Thr Leu Lys Leu Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro
210 215 220
Thr Leu Val Thr Thr Leu Gly Tyr Gly Leu Lys Cys Phe Ala Arg Tyr
225 230 235 240
Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu
245 250 255
Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Thr Tyr
260 265 270
Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg
275 280 285
Ile Glu Leu Lys Gly Ile Gly Phe Lys Glu Asp Gly Asn Ile Leu Gly
290 295 300
His Lys Leu Glu Tyr Asn Gly Thr Met Ser Gln Arg Glu Leu Lys Asn
305 310 315 320
Glu Leu Gly Ala Gly Ile Ala Thr Ile Thr Arg Gly Ser Asn Ser Leu
325 330 335
Lys Ala Ala Pro Val Glu Leu Arg Gln Trp Leu Glu Glu Val Leu Leu
340 345 350
Lys Ser Asp
355
<210> 8
<211> 355
<212> PRT
<213> Artificial Sequence
<400> 8
Met Ala Gln Gln Ser Pro Tyr Ser Ala Ala Met Ala Glu Gln Arg His
1 5 10 15
Gln Glu Trp Leu Arg Phe Val Asp Leu Leu Lys Asn Ala Tyr Gln Asn
20 25 30
Asp Leu His Leu Pro Leu Leu Asn Leu Met Leu Thr Pro Asp Glu Arg
35 40 45
Glu Ala Leu Gly Thr Arg Val Arg Ile Val Glu Glu Leu Leu Arg Gly
50 55 60
Phe Asn Ser Asp Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly
65 70 75 80
Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser Val
85 90 95
Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro
100 105 110
Val Leu Leu Pro Asp Asn His Tyr Leu Ser Phe Gln Ser Met Leu Ser
115 120 125
Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val
130 135 140
Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Asn Val Asp
145 150 155 160
Gly Gly Ser Gly Gly Thr Gly Ser Lys Gly Glu Glu Leu Phe Thr Gly
165 170 175
Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys
180 185 190
Phe Ser Val Arg Gly Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu
195 200 205
Thr Leu Lys Leu Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Thr
210 215 220
Thr Leu Val Thr Thr Leu Gly Tyr Gly Leu Lys Cys Phe Ala Arg Tyr
225 230 235 240
Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu
245 250 255
Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Thr Tyr
260 265 270
Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg
275 280 285
Ile Glu Leu Lys Gly Ile Gly Phe Lys Glu Asp Gly Asn Ile Leu Gly
290 295 300
His Lys Leu Glu Tyr Asn Gly Thr Met Ser Gln Glu Glu Leu Lys Asn
305 310 315 320
Glu Leu Gly Ala Gly Ile Ala Thr Ile Thr Arg Gly Ser Asn Ser Leu
325 330 335
Lys Ala Ala Pro Val Glu Leu Arg Gln Trp Leu Glu Glu Val Leu Leu
340 345 350
Lys Ser Asp
355
<210> 9
<211> 355
<212> PRT
<213> Artificial Sequence
<400> 9
Met Ala Gln Gln Ser Pro Tyr Ser Ala Ala Met Ala Glu Gln Arg His
1 5 10 15
Gln Glu Trp Leu Arg Phe Val Asp Leu Leu Lys Asn Ala Tyr Gln Asn
20 25 30
Asp Leu His Leu Pro Leu Leu Asn Leu Met Leu Thr Pro Asp Glu Arg
35 40 45
Glu Ala Leu Gly Thr Arg Val Arg Ile Val Glu Glu Leu Leu Arg Gly
50 55 60
Phe Asn Ser Asp Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly
65 70 75 80
Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser Val
85 90 95
Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro
100 105 110
Val Leu Leu Pro Asp Asn His Tyr Leu Ser Phe Gln Ser Met Leu Ser
115 120 125
Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val
130 135 140
Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Asn Val Asp
145 150 155 160
Gly Gly Ser Gly Gly Thr Gly Ser Lys Gly Glu Glu Leu Phe Thr Gly
165 170 175
Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys
180 185 190
Phe Ser Val Arg Gly Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu
195 200 205
Thr Leu Lys Leu Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Thr
210 215 220
Thr Leu Val Thr Thr Leu Gly Tyr Gly Leu Lys Cys Phe Ala Arg Tyr
225 230 235 240
Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu
245 250 255
Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Thr Tyr
260 265 270
Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg
275 280 285
Ile Glu Leu Lys Gly Ile Gly Phe Lys Glu Asp Gly Asn Ile Leu Gly
290 295 300
His Lys Leu Glu Tyr Asn Gln Ala Met Ser Gln Glu Glu Leu Lys Asn
305 310 315 320
Glu Leu Gly Ala Gly Ile Ala Thr Ile Thr Arg Gly Ser Asn Ser Leu
325 330 335
Lys Ala Ala Pro Val Glu Leu Arg Gln Trp Leu Glu Glu Val Leu Leu
340 345 350
Lys Ser Asp
355
<210> 10
<211> 355
<212> PRT
<213> Artificial Sequence
<400> 10
Met Ala Gln Gln Ser Pro Tyr Ser Ala Ala Met Ala Glu Gln Arg His
1 5 10 15
Gln Glu Trp Leu Arg Phe Val Asp Leu Leu Lys Asn Ala Tyr Gln Asn
20 25 30
Asp Leu His Leu Pro Leu Leu Asn Leu Met Leu Thr Pro Asp Glu Arg
35 40 45
Glu Ala Leu Gly Thr Gly Val Arg Ile Val Glu Glu Leu Leu Arg Gly
50 55 60
Phe Asn Ser Asp Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly
65 70 75 80
Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser Val
85 90 95
Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro
100 105 110
Val Leu Leu Pro Asp Asn His Tyr Leu Ser Phe Gln Ser Met Leu Ser
115 120 125
Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val
130 135 140
Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Asn Val Asp
145 150 155 160
Gly Gly Ser Gly Gly Thr Gly Ser Lys Gly Glu Glu Leu Phe Thr Gly
165 170 175
Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys
180 185 190
Phe Ser Val Arg Gly Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu
195 200 205
Thr Leu Lys Leu Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Thr
210 215 220
Thr Leu Val Thr Thr Leu Gly Tyr Gly Leu Lys Cys Phe Ala Arg Tyr
225 230 235 240
Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu
245 250 255
Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Thr Tyr
260 265 270
Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg
275 280 285
Ile Glu Leu Lys Gly Ile Gly Phe Lys Glu Asp Gly Asn Ile Leu Gly
290 295 300
His Lys Leu Glu Tyr Asn Gly Thr Met Ser Gln Glu Glu Leu Lys Asn
305 310 315 320
Glu Leu Gly Ala Gly Ile Ala Thr Ile Thr Arg Gly Ser Asn Ser Leu
325 330 335
Lys Ala Ala Pro Val Glu Leu Arg Gln Trp Leu Glu Glu Val Leu Leu
340 345 350
Lys Ser Asp
355
<210> 11
<211> 1074
<212> DNA
<213> Artificial Sequence
<400> 11
atggcccaac aatcacccta ttcagcagcg atggcagaac agcgtcacca ggagtggtta 60
cgttttgtcg acctgcttaa gaatgcctac caaaacgatc tccatttacc gttgttaaac 120
ctgatgctga cgccagatga gcgcgaagcg ttggggactc gcgtgcgtat tgtcgaagag 180
ctgttgcgcg gcttcaacag cgacaacgtc tatatcatgg ccgacaagca gaagaacggc 240
atcaaggcca acttcaagat ccgccacaac gtcgaggacg gcagcgtgca gctcgccgac 300
cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac 360
ctgagcttcc agtccatgct gagcaaagac cccaacgaga agcgcgatca catggtcctg 420
ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta caacgtggat 480
ggcggtagcg gtggcaccgg cagcaagggc gaggagctgt tcaccggggt ggtgcccatc 540
ctggtcgagc tggacggcga cgtaaacggc cacaagttca gcgtgcgtgg cgagggcgag 600
ggcgatgcca ccaacggcaa gctgaccctg aagctgatct gcaccaccgg caagctgccc 660
gtgccctgga ccaccctcgt gaccaccctc ggctacggcc tgaagtgctt cgcccgctac 720
cccgaccaca tgaagcagca cgacttcttc aagtccgcca tgcccgaagg ctacgtccag 780
gagcgcacca tcttcttcaa ggacgacggc acttacaaga cccgcgccga ggtgaagttc 840
gagggcgaca ccctggtgaa ccgcatcgag ctgaagggca tcggcttcaa ggaggacggc 900
aacatcctgg ggcacaagct ggagtacaac caggccatga gccaggagga gttaaaaaat 960
gaactcggcg cgggcatcgc gacgattacg cgtggatcta acagcctgaa agccgcgcct 1020
gtcgagctgc gccagtggct ggaagaggtg ttgctgaaaa gcgatctagc ataa 1074
<210> 12
<211> 43
<212> PRT
<213> Artificial Sequence
<400> 12
Met Ala Leu Gln Lys Lys Leu Glu Glu Leu Glu Leu Asp Glu Gln Gln
1 5 10 15
Arg Lys Arg Leu Glu Asp Leu Met Ala Leu Gln Lys Lys Leu Glu Glu
20 25 30
Leu Glu Leu Asp Glu Gln Gln Arg Lys Arg Leu
35 40
<210> 13
<211> 60
<212> PRT
<213> Artificial Sequence
<400> 13
Met Ser Val Leu Thr Pro Leu Leu Leu Arg Gly Leu Thr Gly Ser Ala
1 5 10 15
Arg Arg Leu Pro Val Pro Arg Ala Lys Ile His Ser Leu Gly Asp Leu
20 25 30
Ser Val Leu Thr Pro Leu Leu Leu Arg Gly Leu Thr Gly Ser Ala Arg
35 40 45
Arg Leu Pro Val Pro Arg Ala Lys Ile His Ser Leu
50 55 60
<210> 14
<211> 24
<212> PRT
<213> Artificial Sequence
<400> 14
Asp Pro Lys Lys Lys Arg Lys Val Asp Pro Lys Lys Lys Arg Lys Val
1 5 10 15
Asp Pro Lys Lys Lys Arg Lys Val
20
<210> 15
<211> 20
<212> PRT
<213> Artificial Sequence
<400> 15
Met Leu Cys Cys Met Arg Arg Thr Lys Gln Val Glu Lys Asn Asp Glu
1 5 10 15
Asp Gln Lys Ile
20
<210> 16
<211> 615
<212> PRT
<213> Artificial Sequence
<400> 16
Met Val Ser Lys Gly Glu Glu Asp Asn Met Ala Ile Ile Lys Glu Phe
1 5 10 15
Met Arg Phe Lys Val His Met Glu Gly Ser Val Asn Gly His Glu Phe
20 25 30
Glu Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr
35 40 45
Ala Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp
50 55 60
Ile Leu Ser Pro Gln Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His
65 70 75 80
Pro Ala Asp Ile Pro Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe
85 90 95
Lys Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val
100 105 110
Thr Gln Asp Ser Ser Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys
115 120 125
Leu Arg Gly Thr Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys
130 135 140
Thr Met Gly Trp Glu Ala Ser Ser Glu Arg Met Tyr Pro Glu Asp Gly
145 150 155 160
Ala Leu Lys Gly Glu Ile Lys Gln Arg Leu Lys Leu Lys Asp Gly Gly
165 170 175
His Tyr Asp Ala Glu Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val
180 185 190
Gln Leu Pro Gly Ala Tyr Asn Val Asn Ile Lys Leu Asp Ile Thr Ser
195 200 205
His Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly
210 215 220
Arg His Ser Thr Gly Gly Met Asp Glu Leu Tyr Lys Ala Ser Gly Gly
225 230 235 240
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
245 250 255
Gly Ser Gly Thr Met Ala Gln Gln Ser Pro Tyr Ser Ala Ala Met Ala
260 265 270
Glu Gln Arg His Gln Glu Trp Leu Arg Phe Val Asp Leu Leu Lys Asn
275 280 285
Ala Tyr Gln Asn Asp Leu His Leu Pro Leu Leu Asn Leu Met Leu Thr
290 295 300
Pro Asp Glu Arg Glu Ala Leu Gly Thr Arg Val Arg Ile Val Glu Glu
305 310 315 320
Leu Leu Arg Gly Phe Asn Ser Asp Asn Val Tyr Ile Met Ala Asp Lys
325 330 335
Gln Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu
340 345 350
Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile
355 360 365
Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Phe Gln
370 375 380
Ser Met Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu
385 390 395 400
Leu Glu Phe Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu
405 410 415
Tyr Asn Val Asp Gly Gly Ser Gly Gly Thr Gly Ser Lys Gly Glu Glu
420 425 430
Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val
435 440 445
Asn Gly His Lys Phe Ser Val Arg Gly Glu Gly Glu Gly Asp Ala Thr
450 455 460
Asn Gly Lys Leu Thr Leu Lys Leu Ile Cys Thr Thr Gly Lys Leu Pro
465 470 475 480
Val Pro Trp Thr Thr Leu Val Thr Thr Leu Gly Tyr Gly Leu Lys Cys
485 490 495
Phe Ala Arg Tyr Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser
500 505 510
Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp
515 520 525
Asp Gly Thr Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr
530 535 540
Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Gly Phe Lys Glu Asp Gly
545 550 555 560
Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Gln Ala Met Ser Gln Glu
565 570 575
Glu Leu Lys Asn Glu Leu Gly Ala Gly Ile Ala Thr Ile Thr Arg Gly
580 585 590
Ser Asn Ser Leu Lys Ala Ala Pro Val Glu Leu Arg Gln Trp Leu Glu
595 600 605
Glu Val Leu Leu Lys Ser Asp
610 615

Claims (20)

1.一种L-色氨酸荧光探针,其特征在于,包括:
多肽B,其为对Trp敏感的多肽或其变体;以及
多肽A,其为对Trp进行表现的荧光蛋白或其变体,其与多肽B操作性连接;
所述多肽B探测Trp,与Trp相互作用,使得多肽A的荧光强度发生变化,从而确定Trp的存在情况或存在量。
2.如权利要求1或2所述的L-色氨酸荧光探针,其特征在于,所述对Trp进行表现的荧光蛋白A或其变体插入到所述对Trp敏感的多肽B或其变体的氨基酸序列中,将多肽B分为第一部分B1和第二部分B2,形成式(I)结构:
B1-(L1-)A-(L2-)B2(I);
其中,L1为接头肽或为无;L2为接头肽或为无。
3.如权利要求1或2所述的L-色氨酸荧光探针,其特征在于,所述多肽B为TrpR多肽、或其L-色氨酸结合结构域,或其变体;较佳地,所述TrpR多肽的氨基酸如SEQ ID NO 2所示;较佳地,所述TrpR多肽由SEQ ID NO:1或与SEQ ID NO:1简并的核苷酸序列所编码。
4.如权利要求3所述的L-色氨酸荧光探针,其特征在于,相应于SEQ ID NO:2所示的多肽B的序列,多肽A插入到多肽B的第64-68位氨基酸中;
较佳地,多肽A插入到多肽B的选自以下的氨基酸位置:
第64位之后、第66位之前,替换其中第65位氨基酸;
第64位之后、第67位之前,替换其中第65-66位氨基酸;或
第65位之后、第68为之前,替换其中第66-67位氨基酸。
5.如权利要求3所述的L-色氨酸荧光探针,其特征在于,所述多肽B变体包括以下突变:相应于SEQ ID NO:2所示氨基酸序列,第69位突变,较佳地为R69E。
6.如权利要求1或2所述的L-色氨酸荧光探针,其特征在于,所述多肽A的荧光蛋白包括:黄色荧光蛋白,绿色荧光蛋白,红色荧光蛋白,远红光荧光蛋白,蓝色荧光蛋白,青色荧光蛋白,近红外荧光蛋白;
较佳地,所述多肽A的荧光蛋白为环状排列荧光蛋白;更佳地选自:环状重排黄色荧光蛋白,环状重排蓝色荧光蛋白,环状重排绿色荧光蛋白,环状重排绿色荧光蛋白,环状重排橙色荧光蛋白,环状重排苹果红荧光蛋白。
7.如权利要求6所述的L-色氨酸荧光探针,其特征在于,所述多肽A为环状重排黄色荧光蛋白,较佳地为维多利亚水母的环状变换的绿色荧光蛋白的突变体黄色荧光蛋白cpSFYFP;较佳地,所述多肽A的变体包括选自下组的突变:
相应于SEQ ID NO:3所示氨基酸序列,第160位突变,较佳地为P160T;和/或
相应于SEQ ID NO:3所示氨基酸序列,第62位突变,较佳地为V62M。
8.如权利要求2所述的L-色氨酸荧光探针,其特征在于,所述L1选自:无,SAG;较佳地为无;和/或
所述L2选自:QA,CT,QC,EC,ST,YC,AS,AC,DG,GGT;较佳地为QA。
9.如权利要求1或2所述的L-色氨酸荧光探针,其特征在于,所述的荧光探针选自:SEQID NO:9,SEQ ID NO:8,SEQ ID NO:7,SEQ ID NO:6,SEQ ID NO:5或SEQ ID NO:4所示氨基酸序列的多肽。
10.一种L-色氨酸荧光探针的对照探针,其特征在于,其基于权利要求1-9任一所述的L-色氨酸荧光探针,但发生点突变、插入突变或缺失突变,从而对L-色氨酸的亲和力非常弱、不显著或无;较佳地,所述多肽B为TrpR多肽、或其L-色氨酸结合结构域,或其变体,该对照探针中该TrpR多肽或其变体的第54位发生突变,较佳地该突变为R54G;更佳地,所述对照探针的氨基酸序列如SEQ ID NO:10所示。
11.一种融合蛋白,包括:权利要求1-9任一所述的L-色氨酸荧光探针或权利要求10所述的对照探针;以及,与之融合的异源功能结构域;较佳地,所述异源功能结构域包括:胞内定位信号,报告蛋白、检测标记或标签蛋白、蛋白质靶向部分、具有延长体内半衰期作用的分子;较佳地,所述报告蛋白包括:mCherry,GFP、HcRed、DsRed、CFP、YFP、BFP;较佳地,所述标签蛋白包括:GST、His、sumo、myc、Flag。
12.如权利要求11所述的融合蛋白,其特征在于,所述胞内定位信号为定位到不同亚细胞器的信号肽;较佳地,所述胞内定位信号包括:胞质定位信号,线粒体定位信号,膜定位信号,核定位信号,胞质定位信号;较佳地,所述信号肽为氨基酸序列如SEQ ID NO:12-15任一所述的信号肽。
13.一种多核苷酸,其编码:
权利要求1-9任一所述的L-色氨酸荧光探针;或
权利要求10所述的L-色氨酸荧光探针的对照探针;或
权利要求11或12所述的融合蛋白。
14.一种表达构建体,其特征在于,其含有权利要求13所述的分离的多核苷酸。
15.一种表达系统,其特征在于,所述表达系统含有权利要求14所述的构建体或基因组中整合有权利要求13所述的多核苷酸;较佳地所述表达系统为细胞表达系统。
16.一种制备权利要求1-9任一所述的L-色氨酸荧光探针、权利要求10所述的L-色氨酸荧光探针的对照探针或权利要求11或12所述的融合蛋白的方法,其特征在于,所述方法包括以下步骤:
1)将权利要求14所述的表达构建体转移到宿主细胞中,形成权利要求15所述的表达系统;
2)在所述的表达系统表达所述荧光探针或对照探针。
17.权利要求1-9任一所述的L-色氨酸荧光探针、权利要求10所述的L-色氨酸荧光探针的对照探针或权利要求11或12所述的融合蛋白的用途,
用于检测L-色氨酸,或用于制备检测L-色氨酸的试剂或试剂盒;或
用于筛选调节L-色氨酸表达水平或活性水平的候选药物,或用于制备筛选调节L-色氨酸表达水平或活性水平的候选药物的试剂或试剂盒。
18.一种筛选调节L-色氨酸表达水平或活性水平的候选药物的方法,其特征在于,所述方法包括:
(1)提供一表达体系,该体系存在L-色氨酸生成途径;和
(2)在(1)的体系中添加候选物质,在添加候选物质之前或之后,在(1)的体系中引入权利要求1-9任一所述的L-色氨酸荧光探针,检测所述体系中L-色氨酸的水平;若L-色氨酸的水平发生上调,则该候选物质为L-色氨酸上调分子,若L-色氨酸的水平发生下调,则该候选物质为L-色氨酸下调分子。
19.一种用于检测L-色氨酸的组合物,其特征在于,所述组合物包括权利要求1-9任一所述的L-色氨酸荧光探针、权利要求10所述的L-色氨酸荧光探针的对照探针或权利要求11或12所述的融合蛋白;以及,生理学上或药学上可接受的载体。
20.一种用于检测L-色氨酸的试剂盒或药盒,其特征在于,包括权利要求1-9任一所述的L-色氨酸荧光探针、权利要求10所述的L-色氨酸荧光探针的对照探针,或权利要求11或12所述的融合蛋白;
较佳地,其中还包括下组的试剂:
制备感受态细胞的试剂,
细胞转染试剂,
荧光检测试剂,
细胞裂解试剂,
荧光探针的表达、纯化或检测试剂,和/或
说明检测方法的使用说明书。
CN202210229003.7A 2022-03-08 2022-03-08 检测色氨酸的新型探针,其制备方法及应用 Pending CN116769045A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210229003.7A CN116769045A (zh) 2022-03-08 2022-03-08 检测色氨酸的新型探针,其制备方法及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210229003.7A CN116769045A (zh) 2022-03-08 2022-03-08 检测色氨酸的新型探针,其制备方法及应用

Publications (1)

Publication Number Publication Date
CN116769045A true CN116769045A (zh) 2023-09-19

Family

ID=87993649

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210229003.7A Pending CN116769045A (zh) 2022-03-08 2022-03-08 检测色氨酸的新型探针,其制备方法及应用

Country Status (1)

Country Link
CN (1) CN116769045A (zh)

Similar Documents

Publication Publication Date Title
US9945860B2 (en) Nicotinamide adenine dinucleotide indicators, methods of preparation and application thereof
US20240027344A1 (en) Fluorescent Probe for Branched Chain Amino Acids and Use Thereof
Chu et al. A novel far-red bimolecular fluorescence complementation system that allows for efficient visualization of protein interactions under physiological conditions
CN109666075B (zh) 谷氨酰胺光学探针及其制备方法和应用
CN106905418B (zh) 一种组氨酸荧光探针及其制备方法和应用
CN110003344B (zh) 氨基酸光学探针及其制备方法和应用
CN109627344A (zh) cAMP荧光探针及其应用
CN104910276B (zh) 基因编码的烟酰胺腺嘌呤二核苷酸磷酸荧光探针及其制备方法和应用
CN109666068B (zh) 脯氨酸光学探针及其制备方法和应用
CN104403003B (zh) 基因编码的烟酰胺腺嘌呤二核苷酸荧光探针及其制备方法和应用
US11008369B2 (en) Bright monomeric near-infrared fluorescent proteins engineered from bacterial phytochromes and methods for making same
CN109748970B (zh) α-酮戊二酸光学探针及其制备方法和应用
CN105524175B (zh) 一种基因编码的过氧化氢荧光探针及其制备方法和应用
CN116769045A (zh) 检测色氨酸的新型探针,其制备方法及应用
CN113004420B (zh) 乳酸光学探针及其制备方法和应用
CN104277120B (zh) 氧化型烟酰胺腺嘌呤二核苷酸基因编码荧光探针及其制备方法和应用
US20230296616A1 (en) Arginine fluorescent probe, preparation method therefor and application thereof
US20230296617A1 (en) Tryptophan optical probe, preparation method therefor and use thereof
WO2024094002A1 (zh) 一种果糖-1,6-二磷酸光学探针及其制备方法和应用
US20230324373A1 (en) Pyruvic acid optical probe, preparation method therefor, and application thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication