CN114645065A - 一种新型光-化学小分子双诱导基因表达系统 - Google Patents

一种新型光-化学小分子双诱导基因表达系统 Download PDF

Info

Publication number
CN114645065A
CN114645065A CN202011501880.2A CN202011501880A CN114645065A CN 114645065 A CN114645065 A CN 114645065A CN 202011501880 A CN202011501880 A CN 202011501880A CN 114645065 A CN114645065 A CN 114645065A
Authority
CN
China
Prior art keywords
leu
pro
gly
ala
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011501880.2A
Other languages
English (en)
Inventor
杨弋
陈显军
李婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China University of Science and Technology
Original Assignee
East China University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China University of Science and Technology filed Critical East China University of Science and Technology
Priority to CN202011501880.2A priority Critical patent/CN114645065A/zh
Publication of CN114645065A publication Critical patent/CN114645065A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian

Abstract

本发明提供一种光‑化学小分子双诱导基因表达系统,包括:a)重组转录因子编码基因,所述重组转录因子包括作为荧光素酶的第一多肽,作为DNA结合结构域的第二多肽、作为光敏结构域的第三多肽和作为转录调节结构域的第四多肽;b)靶转录单元,包括被所述第二多肽识别/结合的至少一个反应元件、被第四多肽调节的启动子和待转录核酸序列。本发明还提供包含这种光‑化学小分子双诱导基因表达系统的真核表达载体,及用这种光‑化学小分子双诱导基因表达系统在宿主细胞中调控基因表达的方法。本发明还提供装有所述光‑化学小分子双诱导基因表达系统各组分的试剂盒。本发明的光‑化学小分子双诱导基因表达系统诱导快速、高效且强,具有良好的可逆性。

Description

一种新型光-化学小分子双诱导基因表达系统
技术领域
本发明涉及遗传工程和合成生物学领域,具体涉及基因表达,更具体涉及一种新型光-化学小分子双调控蛋白的可诱导基因表达系统和采用该表达系统调控宿主细胞中基因表达的方法。
背景技术
生物体在生命活动中所需的基因并非同时表达或同剂量表达的,比如生物发育过程所需的有关基因必须在特定时间和空间进行表达。所以生物体内基因表达的调节控制就需要有相应的基因表达调控系统,使细胞中的基因表达在时间和空间上均处于有序状态,并能针对环境的变化做出复杂的反应过程。因此,调控外源基因的表达对于功能基因组学、组织工程、基因治疗、生物制药等各种基础和应用生物学研究具有重要的意义。
传统的外源基因表达方法一般采用组成型启动子持续驱动外源基因的表达。将含有相应启动子和目的基因的质粒共转染至宿主细胞,则基因会进入细胞质或被整合到宿主细胞的基因组中,相应的TF与启动子结合后,下游目的基因会在细胞中高效、持续的转录翻译成蛋白质。常见的组成型启动子有CMV启动子、PGK启动子、SV40启动子等。然而,很多基因在生物体中是需要在不同表达丰度下发挥作用的,过量的基因表达可能无法反映其生物学功能甚至导致生物体死亡,所以需要严格控制这类基因的表达水平。除此之外,生物体中的许多基因还需要在特定组织或特定发育阶段进行表达,这就要求能在时间与空间上精确控制这类基因的表达。因此,可以调控目的基因表达的诱导型启动子应运而生,弥补了组成型启动子存在的缺陷。
化学分子诱导基因回路发展较为成熟,普遍具有低本底表达与高诱导倍数等优势,在合成生物学的出现中发挥了核心作用,已经成为哺乳动物细胞生物学研究的常规工具。然而,化学诱导剂的难去除增加了开关目的基因表达的时间与操作难度,限制了化学诱导基因回路的后续发展与应用。例如,四环素诱导基因回路(Tet-ON/Tet-OFF系统)在控制基因表达的研究中被广泛使用[Szulc,J.等,Nat Methods,2006.3(2):p.109-16.],然而该系统在“开关”目的基因表达时表现出四环素的难去除及缓慢的可逆性。GeneSwitch系统已经在体内得到了成功的应用和验证[Hjelm,B.E.等,Gene Ther,2016.23(5):p.424-37.],但其依然需要通过去除RU486(米非司酮)来实现基因表达的开关切换,并且表达动力学较为缓慢。GVECR系统与脊椎动物信号转导过程具有正交性、并且可以具有高诱导水平和快速动力学[Esengil,H.等,Nat Chem Biol,2007.3(3):p.154-5.],然而快速动力学仍需要去除TBF(4-羟基他莫昔芬)化学分子。
国内外众多科研人员通过把光敏蛋白引入真核细胞内,将其改造成为光调节的转录因子,便于开发光诱导基因回路来实现无需去除诱导物操作的目的。Shimizu-Sato等人[Shimizu-Sato,S.等,Nat Biotechnol,2002.20(10):p.1041-4.]报道了酵母细胞中的红光调控基因表达系统,植物色素相互作用因子(PIF3)和植物色素(Phy)分别与酵母双杂交系统的酵母菌的Gal4蛋白的转录激活结构域(GAD)或Gal4蛋白的DNA结合结构域相连,得到了基于红光诱导的双组分转录因子PIF3-GAD和Gal4-Phy。phyB(NT)–GBD/PIF3–GAD系统具有低本底泄露、可逆性好等优点,但在诱导过程中需要外源加入生色团藻胆青素(PCB),增加了系统的复杂性。第一个用于哺乳动物细胞的蓝光调控基因表达系统是基于拟南芥中的光敏蛋白flavin-binding kelch repeat F-box1(FKF1),它包含了一个LOV结构域和GIGANTEA(GI)。蓝光光照下,FKF1和GI会发生相互作用形成异源二聚体。将GI和FKF1分别与单纯疱疹病毒颗粒蛋白16(VP16)的转录激活结构域和酵母双杂交系统的Gal4的DNA结合结构域相融合,组成VP16-GI和Gal4-FKF1双转录因子,但是该系统诱导倍数低,仅有5倍左右,难以满足生物学实验需求。通过使用蓝光控制的隐色素2(CRY2)-CIB1之间的相互作用[Konermann,S.等,Nature,2013.500(7463):p.472-476.],Konermann等人获得了蓝光诱导基因表达系统——LITE系统,该系统使用两个独立组件组成的模块化设计。第一个组成部分是基因组锚,包括一个可定制的DNA结合域,基于黄单胞菌中的转录激活效应器(TALEs)与拟南芥中的光敏隐色素2(CRY2)蛋白融合(TALE–CRY2)。第二个组件包括了CRY2与CIB1相互作用的部分,融合到VP64结构域(CIB1–VP64)。在没有光(不活跃状态)的状态下,TALE–CRY2与目的基因的启动子区域结合,而CIB1–VP64在细胞核内仍然是游离的。蓝光光照触发了CRY2的构象变化,并随后聚集CIB1–VP64到目标簇中,从而调控转录。Wang等人[Wang,X.等,Nat Methods,2012.9(3):p.266-9.]利用来自粗糙脉孢菌的VIVID蛋白质设计了一种基于光诱导同源二聚化的光控基因表达系统—LightOn系统。VIVID是最小的含有光-氧-电压(LOV)结构域的光敏蛋白,蓝光光照下可以形成同源二聚体。将GAL65同VVD蛋白和转录激活域蛋白融合,得到光敏转录因子GAVPO。蓝光光照后,GAVPO发生同源二聚化,激活下游目的基因的表达;恢复黑暗状态时,GAVPO解离成单体状态,转录沉默。然而光在深层组织中的穿透能力弱,影响了未来临床转化研究。
综上所述,目前广泛使用的基因表达系统大多采用化学诱导剂调控,其诱导效果较好,背景低、表达强度高,但化学诱导剂难去除,增加了开关目的基因表达的时间与操作难度,无法实现快速基因表达动力学以及无需移除化学诱导分子就实现“开关”切换的目的,限制了化学诱导基因回路的后续发展与应用。光诱导基因表达系统虽能方便的切换基因的开关,但是避光操作的困难度以及光的弱穿透性限制了其应用。因此可以通过新思路创造出一种更优秀的新的光-化学小分子双诱导基因表达系统,克服已有系统的限制,便于广泛用于生物医药科学与技术研究中。Chen,X.等人[Chen,X.等,Nucleic Acids Res,2016.44(6):p.2677-90.]利用LightOn系统和Tet系统组合,获得具有协同作用或拮抗作用的光-四环素双诱导基因表达系统。但是该系统具有双组分转录因子,增加了应用的复杂性。因此,需要开发系统组分简单、诱导性质优良、能快速开关基因表达且可广泛用于活体深层组织的基因回路。
荧光素酶是能催化相应化合物(荧光素)氧化的酶,氧化过程伴随着光的发射和氧化荧光素的释放。细菌荧光素酶是在生物发光细菌中发现的,由α、β两个亚基组成,通过催化长链脂肪醛,FMNH2和O2,产生约490nm的蓝绿光。萤火虫荧光素酶(Fluc),分子量为61kDa,它在ATP、O2及Mg2+共同存在时能够催化发光底物D-luciferin[Leitao,J.M.M.等,Journal of Photochemistry and Photobiology B-Biology,2010.101(1):p.1-8.],产生峰值约为560nm的黄绿光,该过程为氧化脱羧的过程。Gaussia荧光素酶(Gluc)来源于海洋桡脚类动物,分子量为19.9kDa,由185个氨基酸构成,是一种分泌型荧光素酶。Gluc的发光底物为腔肠素(coelenterazine,CTZ),其催化反应不依赖于ATP的存在,催化产生光子发射峰值为480nm[Verhaegent,M.等,Anal Chem,2002.74(17):p.4378-85.],发光强度高于天然的Fluc和Rluc。海肾荧光素酶(Rluc),分子量为36kDa,不依赖于ATP催化CTZ氧化从而产生450nm-475nm的蓝光[Bhaumik,S.等,Proc Natl Acad Sci U S A,2002.99(1):p.377-82.]。2012年,Promega公司对Oluc-19的氨基酸序列进行分析,优化酶的结构并筛选底物类似物,最终开发出了新型生物发光系统Nanoluc-furimazine组合[Hall,M.P.等,ACS ChemBiol,2012.7(11):p.1848-57.]。Nanoluc的发光不依赖于Mg2+,Ca2+和ATP,体积更小,稳定性更高,所产生的456nm的发光信号是Rluc的150倍。
萤光素酶涉及的BRET技术已经被用于分析蛋白质之间的相互作用,筛选蛋白质,监测基因组编辑蛋白或用于体内成像。虽然这些结果表明基于BRET技术来合成荧光素酶相关的融合蛋白可以用于各种生物过程,同样基于BRET技术可以将荧光素酶用于基因回路的构建。经过潜心研究,本申请人发明了一种基于光敏蛋白和荧光素酶之间BRET原理构建的新型的光-化学小分子双诱导基因表达系统,它由重组转录因子及其对应的靶转录单元两部分组成,能通过荧光素酶底物或光来精准控制基因的短暂表达或脉冲式表达,具有良好的基因表达调控能力,良好的可逆性,快速高效的诱导能力,并且可用于I型糖尿病小鼠的治疗,为I型糖尿病治疗提供新的策略。
因此,本发明的第一个目的是提供一种新型的光-化学小分子双诱导基因表达系统。
本发明的第二个目的是提供含有所述光-化学小分子双诱导基因表达系统的真核表达载体。
本发明的第三个目的是提供用所述光-化学小分子双诱导基因表达系统调节宿主细胞中基因表达的方法。
本发明的第四个目的是提供装有所述光-化学小分子双诱导基因表达系统各组分的试剂盒。
本发明的第五个目的是提供一种用光-化学小分子双诱导基因表达系统进行基因治疗的方法。
发明概述
本发明涉及一种光-化学小分子双诱导基因表达系统,包括两个部分:a)重组转录因子编码基因,所述重组转录因子包括作为荧光素酶的第一多肽,作为DNA结合结构域的第二多肽、作为光敏结构域的第三多肽和作为转录调节结构域的第四多肽;b)靶转录单元,包括识别/结合所述第二多肽的至少一个反应元件、与之连接的启动子和待转录核酸序列。
按照本发明的光-化学小分子双诱导基因表达系统,第一部分中重组转录因子的第一多肽为荧光素酶,它的发射光谱能够与第三多肽的光敏结构域的吸收光谱重合,通过BRET实现对第三多肽的控制。第一多肽可选自来源于深海虾的荧光素酶Nanoluc、来源于海洋珊瑚虫类肠腔动物海肾的荧光素酶Rluc、来源于海洋桡脚类动物的高斯荧光素酶Gluc。第二多肽为DNA结合结构域,它能够特异性地识别反应元件,单独不能够结合到反应元件上或者是结合能力很弱,需要第二多肽来辅助其结合到反应元件。第二多肽可选自螺旋-转角-螺旋DNA结合结构域、锌指基序或锌簇DNA结合结构域、亮氨酸拉链DNA结合结构域、翼状螺旋DNA结合结构域、翼状螺旋-转角-螺旋、螺旋-环-螺旋DNA结合结构域、高迁移率族DNA结合结构域、B3 DNA结合结构域。第三多肽为光敏结构域,通常来自以黄素类为生色团的光敏蛋白;第四多肽为转录调节结构域,包括转录激活结构域和转录阻遏结构域。
第一多肽、第二多肽、第三多肽和第四多肽之间可以直接连接,也可操作性地通过接头肽连接。接头肽的氨基酸个数是可变的(如0,1,2,3,4,5,6,7,8,9,10个或更多)。
第一多肽、第二多肽和第三多肽可构成一种光-化学小分子双控的DNA结合蛋白融合蛋白(简称为光-化学小分子双控DNA结合蛋白),可以用于体外研究重组转录因子的DNA结合特点。本发明的光-化学小分子双诱导基因表达系统中,第二部分靶转录单元中的反应元件、启动子和待转录核酸序列之间也可直接连接,或操作性连接。
按照本发明的光-化学小分子双诱导基因表达系统,第一部分中的重组转录因子还可进一步包含附加的多肽,如促进重组光敏转录因子融合蛋白向细胞核运输的第五多肽(即细胞核定位信号肽。第五多肽与第一、第二、第三多肽可直接连接或通过接头肽连接。
本发明还涉及含有本发明的光-化学小分子双诱导基因表达系统的真核表达载体。所述表达载体可以是单独含有重组转录因子编码基因的载体,也可以是单独含有靶转录单元的真核表达载体,所述靶转录单元中含有反应元件-启动子但待转录核酸序列空缺。或者,也可以是同时含有重组转录因子编码基因和靶转录单元中的反应元件-启动子的真核表达载体。
本发明也涉及用本发明的光-化学小分子双诱导基因表达系统在宿主细胞中调控基因表达的方法,包括以下步骤:
a)将所述光-化学小分子双诱导基因表达系统构建在真核质粒表达载体中;
b)引入含被调控基因的哺乳动物细胞;和
c)光照或荧光素酶底物化学分子诱导所述哺乳动物细胞,使所述不如动物细胞中的被调控的核苷酸进行表达。
本发明的在宿主细胞中调控基因表达的方法,所涉及的诱导方法,包括光源或荧光素酶底物的选择和控制。光源非限制地包括LED灯、白炽灯、荧光灯、激光;光照方法包括光照量、光照时间、光照强度及光照频率的选定。用扫描、投影、光模具等方法在空间上控制目的基因的表达也包含在本发明范围中。荧光素酶底物非限制地包括furimazine及其类似物;底物方法包括底物加入浓度、加入时间、加入频率的选定。
本发明进一步涉及一种试剂盒,该试剂盒装有含本发明光-化学小分子双诱导基因表达系统的真核表达载体或/和转染了所述转录因子的真核表达载体的哺乳动物细胞,及相应的说明书。本发明的试剂盒还可装有含反应元件-启动子、但待转录核酸序列空缺的靶转录单元的真核表达载体。
本发明还进一步涉及用光-化学小分子双诱导基因表达系统进行基因治疗的方法。
发明详述
本发明提供一种基于光敏多肽及荧光素酶的光-化学小分子双诱导基因表达系统,用于在精确调节目的基因在真核生物宿主细胞中的表达。本发明的光-化学小分子双诱导基因表达系统涉及至少两个部分:第一部分是能够在宿主细胞中表达的重组转录因子融合蛋白的编码核苷酸序列,该融合蛋白由四个或五个多肽组成,其中第一多肽是荧光素酶,第二多肽是其DNA结合结构域,第三多肽为光敏结构域,第四多肽为转录调节结构域,第五多肽为核定位信号片段;第二部分是由反应元件-启动子-待转录核苷酸序列组成的靶转录单元核苷酸序列,其中的反应元件为上述重组转录因子融合蛋白第二多肽所识别/结合的DNA核苷酸基序,启动子通常为最小启动子,也可以是其他完整的启动子。第一部分的四个多肽或五个多肽优选采用有关蛋白的截短的功能活性片段(即结构域)。可通过基因工程技术将本发明的光-化学小分子双诱导基因表达系统的第一部分和第二部分构建在一个真核表达载体中或分别构建在二个真核表达载体中。针对特定的宿主细胞类型采用不同的常规方法将其导入宿主细胞,使之表达本发明的重组光敏转录因子融合蛋白,用适当波长的光照射或加入适当浓度的荧光素酶底物可导致其第三光敏多肽二聚化能力改变,使重组转录因子的二聚化能力发生变化,二聚化的转录因子可结合于本发明第二部分靶转录单元核苷酸序列中的反应元件,并通过该融合蛋白的第三多肽的转录激活/阻遏结构域和募集的宿主细胞本身的其它转录辅因子,一起协同作用于该靶转录单元中的启动子,从而调节(启动或阻遏)目的基因的转录和表达。本发明提供的这种光-化学小分子双诱导基因表达系统,可利用几乎不会损伤细胞或机体的光照射,在时间上和空间上调节目的蛋白基因在哺乳动物细胞中的表达;也可加入荧光素酶底物进行诱导,实现在哺乳动物细胞或动物深层组织中的脉冲式表达。
本发明的这种光-化学小分子双诱导基因表达系统,可利用光和化合物在时间上和空间上调节目的蛋白基因在哺乳动物细胞中的表达。
本发明的这种光-化学小分子双诱导基因表达系统,可利用不同的光照强度和不同的化合物浓度的差异来调节目的蛋白基因在细菌细胞中的表达。
本发明的这种光-化学小分子双诱导基因表达系统,能通过荧光素酶底物或光来精准控制基因的短暂表达或脉冲式表达,具有良好的基因表达调控能力,良好的可逆性,快速高效的诱导能力,并且可用于I型糖尿病小鼠的治疗,为I型糖尿病治疗提供新的策略。
本文所用术语的定义和解释
“宿主细胞”在本专利中特指哺乳动物细胞,可以是原始的未经改造的哺乳动物细胞,比如HEK293,Hela,H1299细胞等,也可以是在细胞株上再进行基因组改造的得到的哺乳动物细胞株,如本发明中luminON系统得到的稳转细胞株,也可以是其他和本发明的光控基因表达系统相容的宿主细胞均可以。
荧光素酶”和“萤光素酶”在本文中含义相同,可互换使用,指自然界中能够产生生物荧光的酶的统称。在相应化学反应中,萤光的产生是来自于萤光素的氧化,有些情况下反应体系中也包括三磷酸腺苷(ATP)。没有萤光素酶的情况下,萤光素与氧气反应的速率非常慢,而钙离子的存在常常可以进一步加速反应(与肌肉收缩的情况相似)。常用的荧光素酶有来源于深海虾的荧光素酶Nanoluc、来源于萤火虫的荧光素酶Fluc、来源于海洋珊瑚虫类肠腔动物海肾的荧光素酶Rluc、来源于海洋桡脚类动物的高斯荧光素酶Gluc。
“底物”指萤光素底物,在对应的萤光素酶中加入正确的萤光素底物就可以放出萤光,而发出的光子可以被光敏感元件探测到。常用的底物有被Nanoluc催化的furimazine、被Fluc催化的虫荧光素和三磷酸腺苷、被Rluc或Gluc催化的腔肠素。
“目的蛋白”也可称为“感兴趣蛋白”指任何有用的蛋白,例如可用于预防或治疗目的或其他用途的、需要在哺乳动物细胞中表达的有用真核生物蛋白质,包括天然的或人工修饰或突变的有用蛋白质,特别是必须经翻译后修饰(如糖基化、酰胺化等修饰)才有活性的蛋白质,它们在真核细胞中表达才能获得这种修饰。
“报告蛋白”为目的蛋白的一种,指其表达容易被检测的有用蛋白质。为便于检测本发明基于光敏多肽的、光可诱导的目的蛋白基因表达系统的效果,可以选择以下已知的广泛应用的报告蛋白:高斯荧光素酶(Gluc)、绿色荧光蛋白(GFP),氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶(LacZ)、红色荧光蛋白(mCherry)等。但本发明的光可诱导目的蛋白基因表达系统不限于表达报告蛋白,而可用于表达任何有用的目的蛋白。
“基因”,蛋白质的“编码核苷酸序列”,“待转录核苷酸序列”在本文中含义相同可互换使用,指天然或重组的携带蛋白质氨基酸序列信息密码子的DNA序列,也指编码功能性RNA,如反义RNA的DNA序列。
“目的蛋白基因”、“目的蛋白的编码核苷酸序列”或简称为“目的基因”在本文中含义相同,可互换使用,指编码目的蛋白的基因,通常为脱氧核糖核酸DNA双链序列。这种基因可包含在宿主细胞的染色体DNA序列中或包含在人工构建的表达载体中,如本发明的靶转录单元序列中。同样,“报告基因”指编码报告蛋白的基因。
“转录”在本文中专指真核生物宿主细胞中通过RNA聚合酶将目的基因转录产生携带该基因信息RNA的过程。真核生物基因的转录比原核生物复杂得多,真核生物的三类RNA聚合酶I、II和III分别转录三类真核基因DNA,产生三类RNA(rRNA、mRNA、tRNA)及反义RNA。文中的转录因子调节的转录过程为RNA聚合酶II启动的转录,即DNA转录为mRNA。“转录调节”本文指真核基因转录的调节,包括启动或阻遏转录,增强或抑制转录,上调或下调转录。
“表达”、“目的蛋白基因表达”、“基因表达”在本文中含义相同可互换使用,指目的基因的DNA序列转录产生携带该基因信息的RNA(mRNA或反义RNA)和该RNA携带的信息在核糖体中被翻译产生目的蛋白二者,即转录产生信息RNA和翻译产生目的蛋白都叫做表达。本文包括这两种含义,主要指产生目的蛋白。
“转录因子”或“转录因子融合蛋白”在本文中含义相同可互换使用,指真核生物的转录因子,它不是一个蛋白质,而是多个相互作用的蛋白或多肽的统称,可以是天然的或人工改造的或人为融合的,包括能识别/结合靶转录单元核苷酸序列中的反应元件的多肽和能募集其它转录激活/阻遏辅因子的多肽,通过与靶转录单元中反应元件的结合和相互作用,与募集的其它转录激活或阻遏辅因子一起作用于待转录核酸序列上游的启动子,从而启动并调节目的蛋白基因的转录。转录因子视其组成的不同可分为“转录激活因子”或“转录阻遏因子”,二者统称“转录因子”。
“靶转录单元”指人造的由反应元件、启动子和待转录核酸序列组成的DNA序列(不是蛋白质),其中反应元件通常位于启动子上游,有时也可位于启动子下游,待转录核酸序列位于反应元件和启动子的下游,三者可直接相连或操作性(即可隔开若干个核苷酸)相连。
“反应元件”指转录因子特异性识别/结合的一个或多个顺式DNA基序,不同的转录因子有与其相对应的不同的反应元件,转录因子包含能与这种DNA基序结合的结合结构域。当转录因子与其相应的反应元件特异性结合后,转录因子的第三多肽募集的辅因子协同作用于启动子,激活或阻遏其下游目的基因转录产生相应的RNA。在本发明中,反应元件指能够与重组光敏转录因子的第二多肽特异性识别/结合的DNA基序,例如Gal4的反应元件为长17bp的DNA基序(序列1)。
“启动子”指启动和导致其下游基因转录产生RNA的DNA序列。启动子可以是天然基因的启动子或人工修饰的启动子。不同的启动子可指导基因在不同发育阶段的不同类型的组织或细胞中转录,或对不同环境或生理条件反应时的基因表达。启动子通常可分为“组成型启动子”、“可诱导启动子”或“可调控启动子”;按组织和细胞划分可分为“细胞特异性启动子”、“组织特异性启动子”、“发育特异性启动子”或“细胞分化特异性启动子”。可表达的天然细胞结构蛋白基因上游都有与其相配的启动子,不同的基因DNA片段可以有相同的启动子。可用于表达本发明重组光敏转录因子的常用组成型启动子的非限制性例子有:来源于多瘤病毒、腺病毒2、巨细胞病毒CMV和猿病毒40(SV40)的启动子。多数真核基因转录起始点上游大约-25于-30位核苷酸处有富含AT的区域称为TATA盒,本文称为“最小启动子”,它确定了目的基因的转录起始位点,但本身不足以有效地启动基因转录。在TATA盒上游还有其它转录必须的核苷酸基序,即本文所述的转录因子其特异性识别/结合的反应元件,该反应元件被其相应的转录因子结合后向最小启动子传达反应性,并在转录因子募集的辅因子协同作用下激活最小启动子引起下游目的基因转录产生相应的RNA。
“载体”、“表达载体”、“基因表达载体”、“重组基因表达载体”或“质粒”在本文中含义相同可互换使用,指能在真核细胞中表达重组目的蛋白的载体,这种真核表达载体可以是人工构建的质粒或重组病毒载体
“转染”指宿主细胞经物理或化学方法,如电穿孔、磷酸钙共沉淀、脂质转染胺或DEAE-葡聚糖介导的转染、DNA粒子轰击和显微注射等处理,使细胞摄入外源加入的携带基因的表达载体,或通过生物学媒介,如逆转录病毒载体、腺病毒载体、受体介导的DNA摄取等将携带基因的表达载体递送入宿主细胞中。这些载体进入宿主细胞后可作为游离体形式存在于胞质中,或整合入细胞染色体中,在适当条件下该细胞可瞬时表达或长期表达载体所携带的基因编码的蛋白质或功能性RNA。这种宿主细胞就叫做被载体转染的细胞。用表达载体转染宿主细胞的方法可参见Sambrooka等人(分子克隆实验手册,第二版,冷泉港出版社(1989)),和其它有关教材。
本发明基于光敏多肽及萤光素酶的光-化学小分子双诱导基因表达系统第一部分的重组转录因子是由四种、五种功能性多肽片段直接通过肽键串联连接或通过接头肽串联连接形成的融合蛋白。在适当波长的光照射下或底物加入后,该融合蛋白能结合于本发明第二部分靶转录单元核苷酸序列的反应元件,并通过其转录激活/阻遏结构域和募集宿主细胞本身的转录辅因子,一起协同作用于靶转录单元中的启动子,从而启动或阻遏靶转录单元中目的蛋白基因的表达。
本文中,“重组转录因子融合蛋白”与“重组转录因子”含义相同,可互换使用。
本发明的重组转录因子含有第一多肽,该多肽是萤光素酶。萤光素酶催化荧光素得到的450nm-480nm范围的发光可以引起转录因子中的第三光敏多肽结构的变化。分析相关文献,可用作本发明的第一多肽优选包括但不限于:Nanoluc、Gluc、Rluc。在Oluc-19基础上优化得到的Nanoluc-furimazine[Hall,M.P.等,ACS Chem Biol,2012.7(11):p.1848-57.]新型生物发光系统组合中,Nanoluc萤光素酶(其氨基酸序列为序列1)的发光不依赖于Mg2+,Ca2+和ATP,体积更小,稳定性更高,所产生的456nm的发光信号是Rluc的150倍。Gluc荧光素酶(其氨基酸序列为序列2)来源于海洋桡脚类动物,分子量为19.9kDa,由185个氨基酸构成,是一种分泌型荧光素酶。Gluc的发光底物为腔肠素(coelenterazine,CTZ),其催化反应不依赖于ATP的存在,催化产生光子发射峰值为480nm[Verhaegent,M.等,Anal Chem,2002.74(17):p.4378-85.],发光强度高于天然的Fluc和Rluc。Rluc荧光素酶(其氨基酸序列为序列3),分子量为36kDa,不依赖于ATP催化CTZ氧化从而产生450nm-475nm的蓝光[Bhaumik,S.等,Proc Natl Acad Sci U S A,2002.99(1):p.377-82.]。
本发明的重组转录因子含有第二多肽,该多肽虽能特异性识别所述靶转录单元核苷酸序列中的反应元件但不能与其结合或结合能力弱,只有在第三多肽的协助下转录因子发生同质二聚化后第二多肽方能结合反应元件;第二多肽选自:螺旋-转角-螺旋DNA结合结构域、锌指基序或锌簇DNA结合结构域、亮氨酸拉链DNA结合结构域、翼状螺旋DNA结合结构域、翼状螺旋-转角-螺旋DNA结合结构域、螺旋-环-螺旋DNA结合结构域、高迁移率族DNA结合结构域、B3 DNA结合结构域。分析相关文献,可用作本发明的第二多肽优选包括但不限于:Gal4蛋白的DNA结合结构域、LexA蛋白的DNA结合结构域、Lac阻遏蛋白LacI的DNA结合结构域、λ噬菌体cI阻遏蛋白的DNA结合结构域、四环素阻遏蛋白TetR的DNA结合结构域、色氨酸阻遏蛋白TrpR的DNA结合结构域等,更优选Gal4的DNA结合结构域和LexA的DNA结合结构域。Gal4是酿酒酵母菌(Saccharomyces cerevisiae)的转录激活蛋白,能识别/结合基因启动子的上游反应元件-UASG基序。Gal4的N末端第1-94位氨基酸为DNA结合结构域,此DNA结合结构域是一种锌簇DNA结合结构域,其中第1-65位氨基酸用于DNA特异性识别,第66-94位氨基酸用于二聚化,Gal4需形成同质二聚体才能结合反应元件发挥其作用[Marmorstein,R.等,Nature,1992.356(6368):p.408-14.]。基于Gal4/UAS的双杂交系统是用于研究基因表达的一种有效工具。例如,普洛麦格公司(Promega)公司生产的哺乳动物双杂交系统(CheckMateTM Mammalian Two-Hybrid System)就采用了此Gal4/UAS系统。LexA蛋白是存在于大肠杆菌细胞内的一种转录阻遏蛋白,能调控20多种基因的转录,它二聚化后能识别/结合基因启动子上游的反应元件回文结构阻止RNA聚合酶对后面基因的转录。LexA含有202个氨基酸,其DNA结合结构域是一种翼状螺旋-转角-螺旋DNA结合结构域,其中第1-87位氨基酸用于DNA特异性识别,第88-202位氨基酸用于二聚化,只有二聚化的LexA才能特异性结合相应的反应元件,单体LexA则不能。正常情况下细胞内存在的LexA是二聚体形式,当细胞受到内部或外部SOS信号刺激时,二聚化的LexA被体内某些酶切断分开并从DNA上解离,使得原来被LexA阻遏的基因激活[Fogh,R.H.等,EMBO J,1994.13(17):p.3936-44.]。基于LexA的双杂交系统也被用于研究基因表达与蛋白质相互作用。例如,Clontech公司生产的酵母双杂交系统(MATCHMAKERTM LexA Two-Hybrid System)就是基于此系统。Lac阻遏蛋白LacI能特异性识别/结合大肠杆菌乳糖系统操纵子而调节相关基因的转录。LacI的DNA结合结构域是一种螺旋-转角-螺旋DNA结合结构域,其中第1-62位氨基酸用于DNA的特异性识别,只有二聚化或者四聚化的LacI才能与之结合,单体LacI蛋白几乎不能结合[Lewis,M.等,Science,1996.271(5253):p.1247-54.]。cI蛋白是λ噬菌体cI基因编码的一种转录阻遏蛋白,它可以阻止λ左、右两个早期起动子的转录导致不能进行复制及细胞分裂的蛋白。cI蛋白含有236个氨基酸,其DNA结合结构域一种螺旋-转角-螺旋DNA结合结构域,第1-102位氨基酸用于DNA特异性识别,第132-236位氨基酸用二聚化,只有二聚化的cI才能特异性结合相应的反应元件。cI蛋白同质二聚体识别/结合PL和PR两个操纵子序列上,每个操纵子各含有cI三个识别结合位点,分为PL的OL1、OL2和OL3以及PR的OR1、OR2和OR3。cI与OR1的结合能力相对强些,单体cI蛋白几乎无这种结合能力[Burz,D.S.等,Biochemistry,1994.33(28):p.8399-405.]。四环素阻遏蛋白(TetR)是存在于很多革兰阴性菌中的一种转录因子,通过结合特定DNA基序阻遏相关基因的转录。TetR蛋白的DNA结合结构域是一种螺旋-转角-螺旋DNA结合结构域,单体TetR蛋白可形成同质二聚体而识别/结合含有特定DNA序列的操纵子上,单体TetR几乎无结合能力。
在本发明一优选实施方式中,第二多肽为Gal4蛋白DNA结合结构域(氨基酸序列为序列4)的1-65位氨基酸,即其DNA结合结构域的截短体,其单独不能结合反应元件。在本发明另一优选实施方式中,第二多肽为LexA蛋白DNA结合结构域(氨基酸序列为序列5)的1-87位氨基酸,即其DNA结合结构域的截短体,其单独不能结合反应元件。在本发明另一优选实施方式中,第二多肽为LacI蛋白DNA结合结构域(氨基酸序列为序列6)的1-62位氨基酸,即其DNA结合结构域的截短体,其单独也不能结合反应元件。在本发明另一优选实施方式中,第二多肽为TetR蛋白DNA结合结构域(氨基酸序列为序列7)的1-63位氨基酸,即其DNA结合结构域的截短体,其单独也不能结合反应元件。在本发明另一优选实施方式中,第二多肽为cI蛋白DNA结合结构域(氨基酸序列为序列8)的1-102位氨基酸,即其DNA结合结构域的截短体,其单独也不能结合反应元件。
本发明重组转录因子融合蛋白中的第三多肽是光敏多肽,该多肽来自以黄素类(FMN或FAD)为生色团的光敏结构域。如含有光-氧-电压(LOV)结构域的光敏蛋白;类似光裂解酶的隐花色素(photolyase-like cryptochromes);利用FAD的蓝光蛋白(blue lightusing FAD,BLUF)。优选含LOV结构域的光敏蛋白,经适当波长光照射后,第二多肽的二聚化能力发生改变,使转录因子的二聚化能力发生变化,二聚化的转录因子结合于相应的反应元件,从而调节目的基因的表达水平。本发明包括但不限于以下所述的优选光敏蛋白或其功能活性截短体。
本发明第一个优选的第三多肽是粗糙链孢霉菌的VIVID蛋白的光敏结构域及其突变体。VIVID是存在于粗糙链孢霉菌(Neurospora crassa)细胞内参与蓝光调控细胞信号传导通路的一种光敏蛋白质。在蓝光照射下它能与黄素腺嘌呤二核苷酸(FAD,FlavinAdenine Dinucleotide)发生蛋白分子间反应形成二聚体。全长VIVID蛋白含有186个氨基酸,只含一个对光敏感的LOV结构域。研究表明VIVID蛋白缺失了N端36个氨基酸的截短体蛋白(VIVID-36)稳定性比全长蛋白更好,而蓝光照射后形成的VIVID-36二聚体不光照恢复其单体形式的半衰期为18000s,含点突变C71V的VIVID-36二聚化能力更强。在本发明一优选实施方式中,第三多肽是含一个点突变的删除前1-36个氨基酸的VIVID(C71V)、VIVID(N56K)、VIVID(Y50W)突变蛋白(氨基酸序列分别为9、10、11)。在本发明一个更优选实施方式中,第三多肽是含二个点突变的删除前1-36个氨基酸VIVID(N56K+C71V)突变蛋白(其氨基酸序列为序列12)。
本发明第二个优选的第三多肽是燕麦(Avena sativa)光敏色素1基因的LOV2结构域(简写为AsLOV2)[Peter,E.等,Nat Commun,2010.1:p.122.]。燕麦细胞光敏色素1的N端为LOV1和LOV2光氧电压(LOV)结构域,在蓝光照射下均能与黄素单核苷酸(flavinmononucleotide,FMN)结合生成一种加成产物。本发明将燕麦光敏色素1的LOV2结构域连接于第二多肽,成功导致可用光照调控转录因子的第二多肽与对相应的反应元件的结合能力。本发明含有AsLOV2(氨基酸序列为序列13)第三多肽的转录因子NGALP在黑暗时可以结合其对应的反应元件导致目的基因表达,而在光照或化学小分子诱导下这种结合减弱导致目的基因表达水平下调。
本发明第三个优选的第三多肽是无隔藻(Stramenopile algae Vaucheriafrigida)金色素1(aureochrome1)蛋白C端的LOV结构域(简写为AuLOV)[Takahashi,F.等,Proc Natl Acad Sci U S A,2007.104(49):p.19625-30.]。本发明含有AuLOV(氨基酸序列为序列14)第三多肽的重组转录因子NGAAP光照或化学小分子诱导下二聚化能力增强使目的基因的表达水平上调。
以上所述的第三光敏多肽中,VIVID和AuLOV用适当波长光照射可使由其构成的重组光敏转录因子二聚化增强,导致结合反应元件而启动或上调转录;而AsLOV2构成的重组光敏转录因子,在黑暗时二聚化而结合反应元件,光照反使其解二聚成为单体减弱与反应元件的结合或不再结合,从而阻遏或下调转录。
本发明的重组转录因子含有第四多肽,该多肽是一种转录调节结构域,可以是转录结构激活域(简写为AD)或转录结构阻遏域。可用作本发明第四多肽的转录结构激活域或转录结构阻遏域包括但不限于:富含酸性氨基酸的转录激活结构域(如VP16和Gal4的AD)、富含脯氨酸的转录激活结构域(如CTF/NF1的氨基酸残基399-499)、富含丝氨酸/苏氨酸的转录激活结构域(如ITF1的氨基酸残基1-427)和富含谷氨酰胺的转录激活结构域(Oct1的氨基酸残基175-269),Seipel等公开了它们的氨基酸序列和其他有用的转录激活结构域。还有已报导了的Kruppel相关盒(KRAB)转录阻遏结构域[Peng,H.等,J Biol Chem,2000.275(24):p.18000-10.]的序列。
在本发明的实施方案中,第四多肽为VP16转录激活结构域(简写为VP16,氨基酸序列为序列15)、NF-κB p65转录激活结构域(简写为p65AD,氨基酸序列为序列16),或锌指蛋白354A的KRAB转录阻遏结构域(氨基酸序列为序列17)。NF-κB的二类亚基常形成同质或异质二聚体,最常见p65/p50或p65/p65二聚体,p65亚基的转录激活结构域已被广泛应用于构建诱导基因表达的各种系统效果良好[Wang,Y.等,Gene Ther,1997.4(5):p.432-41.]。VP16为单纯疱疹病毒HSV-1的UL48结构基因表达的含490个氨基酸残基的病毒间层蛋白,其羧基端富含酸性氨基酸残基为转录激活结构域。VP16的转录激活结构域已成功用于多种基因表达系统中效果良好[Gossen,M等,Proc Natl Acad Sci U S A,1992.89(12):p.5547-51.]。在本发明一优选实施方式中,第四多肽采用VP16的转录激活结构域。在本发明另一优选实施方式中,第四多肽采用NF-κB p65转录激活结构域。在本发明另一优选实施方式中,第四多肽采用锌指蛋白354A的KRAB转录阻遏结构域。
本发明的重组转录因子融合蛋白还可包括第五多肽,该多肽是核定位信号肽用以促进融合蛋白向细胞核运输。如果第一、第二、第三和第四多肽不含核定位信号(NLS)时,可融合加入第五多肽。核定位信号肽典型地包括一段碱性氨基酸。本发明优选的核定位信号肽为猿猴空泡病毒40核定位信号肽(SV40 NLS)。在一个具体实施方案中,本发明的重组光敏转录因子第二多肽为含有核定位信号的Gal4蛋白,故融合蛋白不含第五多肽。在另一个具体的方案中,第五多肽与第一、第二、第三多肽和第四多肽直接或通过接头相连。
如上所述,本发明的重组转录因子所含的四种或五种多肽各自可以有多种选择,将四种或五种多肽连接成融合蛋白又可以有多种组合选择,本发明优选具有良好活性的各多肽的功能结构域片段制备重组转录因子融合蛋白,通过在哺乳动物细胞中表达优选的转录调节能力强的,即诱导和非诱导时导致目的基因表达量差异大的该重组转录因子,用于调节待转录核酸序列的表达,但不论何种选择与组合,只要能实现本发明所设想的光-化学小分子双控基因表达性能的重组转录因子各种组合都属于本发明的范围。
本发明基于重组转录多肽的、光-化学小分子双诱导基因表达系统的第二部分是由转录因子特异性识别/结合的反应元件-启动子-待转录核苷酸序列组成的靶转录单元(核苷酸序列),具体来说,其中反应元件的核苷酸基序视本发明不同实施方式所选的重组光敏转录因子融合蛋白的第二多肽不同而不同。换句语说,反应元件是第二多肽的特异性反应元件,必须根据所选择的第二多肽来选择与其相应的反应元件。例如,第二多肽为Gal4、LexA、LacI、TetR、cI蛋白的DNA识别/结合结构域时,其相应的反应元件应为“序列1、4、5、6、7”基序。靶转录单元中的反应元件至少为一个或可以有多个,在具体的实施方式中,反应元件为1、2、3、4或5个,如果需要或多个效果更好的话优选多个。
与反应元件操作性相连的通常是是最小启动子,此最小启动子本身不足以有效地起启动基因转录,必须和其上游的反应元件一起与转录因子诸成员相互作用后方能激活或上调下游目的基因转录。分析相关文献,可用作本发明最小启动子的包括但不限于:腺病毒主要晚期启动子(DNA序列为序列18)、巨细胞病毒CMV最小启动子(DNA序列为序列19)、酵母Gal1基因的启动子(核酸序列为序列20),在本发明具体的实施方式中,最小启动子是腺病毒晚期启动子、酵母Gal1启动子,但也可采用其它最小启动子。与反应元件操作性相连的启动子也可以是完整的启动子,这类启动子本身具有启动基因转录的能力,当转录因子结合在反应元件后,可增强或阻遏下游待转录核酸的表达,在另一个具体的实施方式中,启动子为SV40启动子(DNA序列为序列21)。在本发明的本领域技术人员知道,所谓“操作性相连指反应元件与启动子之间或多个反应元件之间不是直接相连而可以隔开若干个核苷酸,只要仍能协同作用即可。本领域技术人员知道,所谓“操作性连接”指反应元件与启动子之间或多个反应元件之间不是直接相连而可以隔开若干个核苷酸,只要仍能协同作用即可。
本发明靶转录单元启动子下游是待转录的核苷酸序列,可以是编码目的蛋白或功能性RNA的核苷酸序列。如上面所述,目的蛋白可以是任何有用的蛋白。为了验证本发明系统的效果和便于检测,在本发明的实施例中,采用了示范性的报告蛋白:高斯荧光素酶(Gluc,氨基酸序列为序列2)、红色荧光蛋白mCherry(氨基酸序列为序列22)、绿色荧光蛋白(hrGFP,氨基酸序列为序列23),胰岛素(Insulin,氨基酸序列为序列24),但本发明的目的蛋白不限于这些报告蛋白。待转录的核苷酸序列也可以编码功能性RNA分子,例反义RNA分子。在宿主细胞或动物中表达这种功能性RNA分子可调节宿主细胞内的一些活动,例如,抑制编码蛋白mRNA的翻译,从而阻止目的蛋白的表达。
可用标准重组DNA技术将本发明光可诱导的目的蛋白基因表达系统的第一部分和第二部分构建在一个真核表达载体中或分别构建在二个真核表达载体中。可用标准技术将这种表达载体引入各种真核宿主细胞群中表达所需目的蛋白,进一步选择产生有用的转基因生物,如转基因小鼠。
本发明的表达系统可用于在真核细胞中表达内源蛋白或外源蛋白,用于基因治疗和利用转基因或同源重组生物体内基因的表达。
本发明提供由四种或五种多肽组成的多种重组转录因子融合蛋白的氨基酸序列和其真核表达载体。在本发明的一优选实施方式中,提供重组转录因子Nluc-Gal4-VVD(N56K+C71V)-P65(简写为NGAVP)的氨基酸序列(序列25)和哺乳动物细胞表达载体pNGAVP。本发明另一实施方式中,提供重组转录因子Gluc-Gal4-VVD(N56K+C71V)-P65(简写为GGAVP)的氨基酸序列(序列26)和哺乳动物细胞表达载体pGGAVP。本发明另一实施方式中,提供重组转录因子Rluc-Gal4-VVD(N56K+C71V)-P65(简写为RGAVP)的氨基酸序列(序列27)和哺乳动物细胞表达载体pRGAVP。本发明另一实施方式中,提供重组转录因子Nluc-LexA-VVD(N56K+C71V)-p65(简写为NLEVP)的氨基酸序列(序列28)和哺乳动物细胞表达载体pNLEVP。本发明另一实施方式中,提供重组转录因子Nluc-LacI-VVD(N56K+C71V)-p65(简写为NLAVP)的氨基酸序列(序列29)和哺乳动物细胞表达载体pNLAVP。本发明另一实施方式中,提供重组转录因子Nluc-TetR-VVD(N56K+C71V)-p65(简写为NTRVP)的氨基酸序列(序列30)和哺乳动物细胞表达载体pNTRVP。本发明另一实施方式中,提供重组转录因子Nluc-cI-VVD(N56K+C71V)-p65(简写为NCIVP)的氨基酸序列(序列31)和哺乳动物细胞表达载体pNCIVP。本发明另一实施方式中,提供重组转录因子Nluc-Gal4-AsLOV2-P65(简写为NGASP)的氨基酸序列(序列32)和哺乳动物细胞表达载体pNGASP。本发明另一实施方式中,提供重组转录因子Nluc-Gal4-AuLOV2-P65(简写为NGAUP)的氨基酸序列(序列33)和哺乳动物细胞表达载体pNGAUP。本发明另一实施方式中,提供重组转录因子Nluc-Gal4-VVD(N56K+C71V)-VP16(简写为NGAVV)的氨基酸序列(序列34)和哺乳动物细胞表达载体pNGAVV。本发明另一实施方式中,提供重组转录因子Nluc-Gal4-VVD(N56K+C71V)-KRAB(简写为NGAVK)的氨基酸序列(序列35)和哺乳动物细胞表达载体pNGAVK。本发明另一实施方式中,VIVID含有点突变的三种重组转录因子Nluc-Gal4-VIVID(C71V)-p65、Nluc-Gal4-VIVID(N56K)-p65、Nluc-Gal4-VIVID(Y50W)-p65的氨基酸序列(序列36、37、38)和哺乳动物细胞表达载体pNGAVP(C71V)、pNGAVP(N56K)和pNGAVP(Y50W),其中括弧中为VIVID中的突变位点。
本领域众所周知,氨基酸的密码子核苷酸有简并性(即某些氨基酸可有二个、或三个、或四个密码子,它们称为该氨基酸的简并密码子),上述的各种重组转录因子的编码核酸,本发明包括它们各自的所有简并核苷酸序列。上述的各种重组光敏转录因子的氨基酸序列,本发明包括它们各自的所有含保守性缺失、添加、置换修饰但仍保留了其原有功能活性的氨基酸序列类似物。
在一实施方式中,提供重组转录因子NGAVP对应的靶转录单元5×UASG-TATA-Gluc(简写U5-Gluc,DNA序列为39)、5×UASG-TATA-hrGFP(简写U5-hrGFP,DNA序列为40)、5×UASG-TATA-mCherry(简写U5-mCherry,DNA序列为41)和5×UASG-TATA-Insulin(简写U5-Insulin,DNA序列为42)的哺乳动物细胞表达载体。
本发明提供含待转录核苷酸序列空缺的靶转录单元的哺乳动物细胞表达载体,待转录的核苷酸序列空缺是让用户可以自行选择所需的待转录的核苷酸序列,例如目的蛋白的编码基因,用标准的重组DNA技术将其插入本发明的这种表达载体中,通过上面所述重组光敏转录因子来调节待转录核苷酸序列(基因)的表达。在本发明的一些实施方式中,哺乳动物细胞表达载体的靶转录单元中空缺的待转录核苷酸序列分别是:Gal4对应的UASG(DNA序列为43)-待转录核苷酸序列、LexA对应的LexAO(DNA序列为44)-待转录核苷酸序列、LacI对应的LacIO(DNA序列为45)-待转录核苷酸序列、TetR对应的TetRO(DNA序列为46)-待转录核苷酸序列、cI对应的cIO(DNA序列为47)-待转录核苷酸序列。
本发明也提供分别转化了各种重组转录因子基因的哺乳动物细胞表达载体或者基因组上整合了各种重组转录因子表达框的哺乳动物细胞株,同时提供含有启动子或启动子-反应元件或反应元件-启动子而待转录核苷酸序列空缺的哺乳动物细胞表达载体。用户可用标准重组DNA技术将自行选择的待转录核苷酸序列(目的蛋白基因)插入该表达载体中,然后用该重新构建的载体转化已转化了各种重组转录因子基因的哺乳动物细胞表达载体或者基因组上已整合了各种重组转录因子表达框的哺乳动物细胞株,并培养这种哺乳动物细胞表达他们所需的目的基因,或供他们研究如何调节目的基因的表达。
本发明还提供装有各种表达载体或已转化了这种载体或者基因组上整合了各种重组转录因子表达框的哺乳动物细胞的试剂盒。在一个实施方式中,该试剂盒中一些容器分别装有含一种或多种重组转录因子基因的哺乳动物细胞表达载体。在另一个实施方式中,该试剂盒中的一些容器分别装有含一种或多种重组转录因子基因的哺乳动物细胞表达载体,另一些容器分别装有含靶转录单元(其中启动子-待转录核苷酸序列空缺或启动子-反应元件-待转录核苷酸序列空缺或反应元件-启动子-待转录核苷酸序列空缺)的哺乳动物细胞表达载体。在还有一个实施方式中,该试剂盒中一些容器装有已转化了含重组转录因子基因的哺乳动物细胞表达载体或者基因组上已整合了各种重组转录因子表达框的哺乳动物细胞,另一些容器装有启动子-待转录核苷酸序列空缺或者启动子-反应元件-待转录核苷酸序列空缺或者反应元件-启动子-待转录核苷酸序列空缺的哺乳动物细胞表达载体。本发明的试剂盒还可以包含相应的光照控制设备,例如LED灯及其调控装置。所有试剂盒都装有相应的说明书,以说明盒中的各成分、使用目的和使用方法,并提供有关的参考文献目录。
本发明还包括光-化学小分子双控基因表达系统在哺乳动物细胞中调控基因表达的方法,包括步骤:
a)将所述光-化学小分子双控基因表达系统构建在哺乳动物细胞表达载体中;
b)引入含被调控基因的哺乳动物细胞;和
c)光照或底物诱导所述哺乳动物细胞,使所述哺乳动物细胞中的被调控的核苷酸进行表达。
光照诱导所述哺乳动物细胞的方法包括光源的选择和光源的使用。光源非限制地包括LED灯、白炽灯、荧光灯、激光。在本发明的一个实施方式中,光源选用蓝色LED(460-470nm)。光照方法包括光照量、光照强度、光照时间、光照频率以及用扫描、投影、光模具等方法在空间上控制目的基因的表达也包含在本发明范围中。在本发明的一个实施方式中,光照强度为0-30mW/cm2不等;在另一个实施方式中,用打印的投影片作为光模具,在空间上调节不同位置的细胞的目的基因的表达水平;在另一个实施方式中,用中性灰度片作为光模具,在空间上调节不同位置的细胞的目的基因的表达水平。
底物诱导所述哺乳动物细胞的方法包括底物的选择、底物浓度的选择以及底物加入的方式。底物需要选择萤光素酶相对应的底物。在本发明的一个优选实施方式中,底物选择Nluc对应的Furimazine。在本发明的另一个实施方式中,底物选择Gluc对应的腔肠素。在本发明的另一个实施方式中,底物选择Rluc对应的腔肠素。底物的浓度可根据需求的表达水平进行选择,底物加入的方式可根据具体需求选择,小鼠上底物的加入方式包括但不限于尾静脉注射、腹腔注射和灌胃。
附图简要说明
图1含有Nluc、Gluc和Rluc为第一多肽的重组转录因子的哺乳动物细胞表达载体的构建。
图2含有Gal4、LexA、LacI、cI和TetR为第二多肽的重组转录因子的哺乳动物细胞表达载体的构建。
图3含有VVD、AsLOV2和AuLOV2为第三多肽的重组转录因子的哺乳动物细胞表达载体的构建。
图4含P65、VP16和KRAB为第四多肽的重组转录因子的哺乳动物细胞表达载体的构建
图5分别构建含有Gal4、LexA、LacI、cI和TetR相对应反应元件的靶转录单元的哺乳动物细胞表达载体
图6分别构建含有Gluc、Fluc、hrGFP、mCherry和Insulin相对应反应元件的靶转录单元的哺乳动物细胞表达载体
图7含有Nluc、Gluc和Rluc为第一多肽的重组转录因子与报告基因U5-Gluc在哺乳动物细胞中的诱导倍数。
图8含有Gal4、LexA、LacI、cI和TetR为第二多肽的重组转录因子与报告基因U5-Gluc在哺乳动物细胞中的诱导倍数。
图9含有VVD、AsLOV2和AuLOV2为第三多肽的重组转录因子与报告基因U5-Gluc在哺乳动物细胞中的诱导倍数。
图10含P65、VP16和KRAB为第四多肽的重组转录因子与报告基因U5-Gluc在哺乳动物细胞中的诱导倍数。
图11重组转录因子NGAVP与报告基因U5-mCherry在小鼠肝脏中的诱导效果。
图12重组转录因子NGAVP与报告基因U5-Insulin控制I型糖尿病小鼠的血糖。
具体实施方式
以下用实施例对本发明作进一步阐述。这些实施例仅仅用于举例说明,而不对本发明的范围构成任何限制。实施例中主要采用常规的基因工程分子生物学克隆方法,这些方法是本领域普通技术人员所熟知的,例如:简·罗斯凯姆斯等的《分子生物学实验参考手册》和J.萨姆布鲁克,D.W.拉塞尔著,黄培堂等译:《分子克隆实验指南》(第三版,2002年8月,科学出版社出版,北京)中的有关章节。本领域普通技术人员按照以下实施例,不难根据具体情况略作修改和变换而成功实施本发明,这些修改和变换均落在本申请权利要求的范围内。
实施例中所用的pEGFP-N1质粒载体购自Clontech公司,pcDNA3.1(+)-hygro质粒载体购自Invitrogen公司,PNL1.2、pG5luc、pBIND、pACT、pRL质粒均购自Promega公司。pcDNA3.1(+)-hygro和pEGFP-N1用于构建用于哺乳细胞内表达目的蛋白的真核表达载体,二者均有CMV启动子,前者具有潮霉素抗性基因,后者具有新霉素抗性基因。PNL1.2含有Nluc基因序列。pRL含有Rluc基因序列。pBIND含有酵母菌Gal4的DNA结合结构域基因,pACT含有VP16转录激活结构域基因。pIRES-hrGFP购自Stratagene公司,含有hrGFP基因。pCDFDuet1质粒购自Novagen公司,含有LacI基因。pWS251由华东师范大学叶海峰实验室馈赠,含有Insulin基因。所有用于PCR的引物均由上海杰瑞生物工程技术有限公司合成、纯化和经质谱法鉴定正确。实施例中构建的表达质粒都经过序列测定,序列测定由华大基因公司和杰李测序公司完成。各实施例所用的Taq DNA聚合酶购自东盛生物,pfu DNA聚合酶购自天根生化科技(北京)有限公司,PrimeSTAR DNA聚合酶购自TaKaRa公司,三种聚合酶购买时都附带赠送对应聚合酶缓冲液和dNTP。BamHI、BglII、HindIII、NdeI、XhoI、SacI、EcoRI、SpeI等限制性内切酶、T4连接酶、T4磷酸化酶(T4 PNK)购自Fermentas公司,购买时附带有相对应的缓冲液等。实施例中所用的CloneEZ PCR克隆试剂盒(含同源重组酶)购自南京金斯瑞生物科技有限公司(原金思特科技(南京)有限公司),CCK-8试剂盒购自上海翊圣生物科技有限公司。除非特别声明,无机盐类化学试剂均购自国药集团上海化学试剂公司。卡那霉素(Kanamycin)购自Ameresco公司;氨苄青霉素(Amp)购自Ameresco公司;链霉素购自Ameresco公司;ONPG购自Ameresco公司;384孔发光检测白板购自Grenier公司;Gluc检测试剂盒购自NEB公司;Furimazine购自Promega公司;胰蛋白酶(Trpsin-EDTA)、特级胎牛血清(FBS)、Opti-mem培养基、青霉素/链霉素双抗购自Invitrogen公司;HiffTrans转染试剂购自翊圣公司;DMEM高糖培养基(无酚红/有酚红)购自Hyclone公司;海藻酸钠购自BUCHI公司。除特别指出外,细胞培养一次性器材购自Corning公司。20mm直径玻璃底细胞培养皿购自NEST公司。96方孔细胞培养板购自GE healthcare公司。
实施例中所用的DNA纯化试剂盒购自BBI公司(加拿大);普通质粒小抽试剂盒购自天根生化科技(北京)有限公司;转染级质粒抽提试剂盒购自Omega公司;克隆菌株Mach1购自Invitrogen公司;细胞系HEK293购自ATCC(美国模式培养物保藏所)。
实施例中用到的主要仪器:Biotek Synergy 2多功能酶标仪(美国Bio-Tek公司),Microfuge22R台式高速冷冻离心机(美国Beckman公司),PCR扩增仪(德国Biometra公司),活体成像系统(美国Kodak公司),光度计(日本和光公司),核酸电泳仪(申能博彩公司);Leica SP8系列倒置荧光显微镜(德国Leica公司);血糖仪(Roche公司);细胞微胶囊造粒仪(瑞士BUCHI公司)。
缩写词意义如下:“h”指小时,“min”指分钟,“s”指秒,“d”指天,“μL”指微升,“ml”指毫升,“L“指升,“bp”指碱基对,“mM”指毫摩尔,“μM”指微摩尔。
实施例1含有Nluc、Gluc和Rluc为第一多肽的重组转录因子的哺乳动物细胞表达载体的构建。
Nluc、Gluc和Rluc基因分别从质粒PNL1.2(Promega)、pU5-Gluc(本实验室收藏,相关文章:Wang,X.等,Nature Methods,2012.)、pRL(Promega)中扩增获得,与pGAVPO质粒(本实验室收藏,相关文章:Wang,X.等,Nature Methods,2012.)中的光敏转录因子融合构建重组转录因子。质粒图谱如图1所示,得到重组转录因子质粒pEGFP-Nluc-Gal4-VVD-P65(pNGAVP),pEGFP-Gluc-Gal4-VVD-P65(pGGAVP)和pEGFP-Rluc--Gal4-VVD-P65(pRGAVP)。
实施例2含有Gal4、LexA、LacI、cI或TetR为第二多肽的重组转录因子的哺乳动物细胞表达载体的构建。
为了构建以Gal4、LexA、LacI、cI和TetR为第二多肽的重组转录因子的哺乳动物细胞表达载体,从质粒pLEVI-mCherry(本实验室收藏,相关文章:Chen,X.等,Cell Research,2016.)中扩增获得LexA,从λ噬菌体基因组中PCR扩增cI(1-102)基因片段,以pBIND质粒(Promega公司)为模板扩增Gal4(1-65)DNA结合结构域基因片段,TetR的DNA结合结构域基因片段(1-63位氨基酸)基因片段由上海捷瑞生物有限公司全基因合成,分别将LexA、cI、Gal4和TetR与VVD基因融合构建重组转录因子,质粒图谱如图2所示,得到重组转录因子质粒pEGFP-Nluc-Gal4-VVD-P65(pNGAVP),pEGFP-Nluc-LexA-VVD-P65(pNLEVP),pEGFP-Nluc-LacI-VVD-P65(pNLAVP),pEGFP-Nluc-TetR-VVD-P65(pNTRVP),pEGFP-Nluc-cI-VVD-P65(pNCIVP)。
实施例3分别构建含有VVD突变体、AsLOV2或AuLOV2为第三多肽的重组转录因子的哺乳动物细胞表达载体。
为了构建以VVD突变体或AsLOV2为第三多肽的重组转录因子的哺乳动物细胞表达载体,分别从质粒pGAVPO(本实验室收藏,相关文章:Wang,X.等,Nature Methods,2012.)、AsLOV2的cDNA(cDNA由美国德克萨斯大学西南医学中心达拉斯校区Gardner实验室馈赠)和AuLOV2的cDNA(cDNA由日本滋贺县立命馆大学Hironao Kataoka实验室馈赠)中扩增AsLOV2或AuLOV2基因片段,分别使用AsLOV2或AuLOV2基因片段替换VVD,获得含AsLOV2或AuLOV2为第三多肽的重组转录因子的哺乳动物细胞表达载体,质粒图谱如图3所示,得到重组转录因子质粒pEGFP-Nluc-Gal4-VVD-P65(pNGAVP),pEGFP-Nluc-Gal4-AsLOV2-P65(pNGASP),pEGFP-Nluc-Gal4-AuLOV2-P65(pNGAUP)。
实施例4含P65、VP16和KRAB为第四多肽的重组转录因子哺乳动物细胞表达载体的构建。
为了构建含VP16和KRAB为重组转录因子第四多肽的哺乳动物细胞表达载体,从质粒pACT中扩增VP16基因片段。使用VP16或KRAB(上海捷瑞公司全基因人工合成)基因片段替换P65,获得以VP16和KRAB为重组转录因子第四多肽的哺乳动物细胞表达载体,质粒图谱如图4所示,得到重组转录因子质粒pEGFP-Nluc-Gal4-VVD-P65(pNGAVP),pEGFP-Nluc-Gal4-VVD-VP16(pNGAVV),pEGFP-Nluc-Gal4-VVD-KRAB(pNGAVK)。
实施例5分别构建含有Gal4、LexA、LacI、cI和TetR相对应反应元件的靶转录单元的哺乳动物细胞表达载体。
为了构建含有LexA、LacI、cI和TetR相对应反应元件的靶转录单元的哺乳动物细胞表达载体,通过双引物退火方式得到LexA、LacI、cI和TetR相对应反应元件的基因片段,利用重叠PCR方式将pU5-Gluc(本实验室收藏,相关文章:Wang,X.等,Nature Methods,2012.)中的UASG替换,从而获得含有LexA、LacI、cI和TetR相对应反应元件的靶转录单元的哺乳动物细胞表达载体,质粒图谱如图5所示,得到靶转录单元质粒pcDNA3.1-5×UASG-Gluc(pU5-Gluc),pcDNA3.1-4×LacIO-Gluc(pLacI4-Gluc),pcDNA3.1-4×LexAO-Gluc(pLexA4-Gluc),pcDNA3.1-4×TetRO-Gluc(pTetR4-Gluc),pcDNA3.1-4×cIO-Gluc(pcI4-Gluc)。
实施例6分别构建含有Gluc、Fluc、hrGFP、mCherry和Insulin相对应反应元件的靶转录单元的哺乳动物细胞表达载体。
为构建含有Fluc、hrGFP相对应反应元件的靶转录单元的哺乳动物细胞表达载体,分别从质粒pG5luc(Promega)、pIRES-hrGFP(Stratagene)、pWS213(由华东师范大学叶海峰实验室馈赠)中扩增Fluc、hrGFP和Insulin基因片段,利用双酶切方法用Fluc或hrGFP替换质粒pU5-Gluc或pU5-mCherry(本实验室收藏,相关文章:Wang,X.等,Nature Methods,2012.)中的Gluc或mCherry,获得pU5-Fluc、pU5-hrGFP和pU5-Insulin,质粒图谱如图6所示。
实施例7含有Nluc、Gluc和Rluc为第一多肽的重组转录因子在哺乳动物细胞中的光或化学小分子的诱导倍数。
我们用实施例1构建的重组转录因子质粒pNGAVP、pGGAVP、pRGAVP与实施例5构建的对应反应元件的报告质粒pU5-Gluc共转染至HEK293细胞中,转染后的细胞置37℃黑暗条件下培养24小时候开始进行黑暗、光照(0-1.63W/m2)3小时、化学小分子(0-25μM)以及光照3小时并加化学小分子四个条件下进行培养。诱导24小时后检测目的基因Gluc的表达,Gluc的活性测定参照NEB公司相应产品的说明书进行操作。实施例8,9,10,11,12也是采用相同的实验方法,如图7所示。结果表明,在单独的化学小分子或光或者同时光与化学小分子条件下,重组转录因子NGAVP、GGAVP或RGAVP与报告因子组合的系统都能激活目的基因的表达。
实施例8含有Gal4、LexA、LacI、cI或TetR为第二多肽的重组转录因子在哺乳动物细胞中的光或化学小分子的诱导倍数。
我们用实施例2构建的重组转录因子质粒pNGAVP、pNLEVP、pNLAVP、pNTRVP或pNCIVP与实施例5构建的对应的报告质粒pU5-Gluc、pLacI4-Gluc、pLexA4-Gluc、pTetR4-Gluc、pcI4-Gluc分别共转染至HEK293细胞中,转染后的细胞置37℃黑暗条件下培养24小时候开始进行黑暗、光照(0-1.63W/m2)3小时、化学小分子(0-25μM)以及光照3小时并加化学小分子四个条件下进行培养。诱导24小时后检测目的基因Gluc的表达,如图8所示。结果表明,在单独的化学小分子或光或者同时光与化学小分子条件下,重组转录因子NGAVP、NLEVP、NLAVP、NTRVP或NCIVP与对应报告因子组合的系统都能激活目的基因的表达。
实施例9含有VVD突变体、AsLOV2或AuLOV2为第三多肽的重组转录因子在哺乳动物细胞中的光或化学小分子的诱导倍数。
我们用实施例3构建的重组转录因子质粒pNGAVP、pNGASP、pNGAUP分别与实施例5构建的报告质粒pU5-Gluc共转染至HEK293细胞株中,转染后的细胞置37℃黑暗条件下培养24小时候开始进行黑暗、光照(0-1.63W/m2)3小时、化学小分子(0-25μM)以及光照3小时并加化学小分子四个条件下进行培养。诱导24小时后检测目的基因Gluc的表达,如图9所示。结果表明,在单独的化学小分子或光或者同时光与化学小分子条件下,重组转录因子NGAVP、NGASP或NGAUP与报告因子组合的系统都能激活目的基因的表达。
实施例10含P65、VP16和KRAB为第四多肽的重组转录因子在哺乳动物细胞中的光或化学小分子的诱导倍数。
我们用实施例4构建的重组转录因子质粒pNGAVP、pNGAVV、pNGAVK分别与实施例5构建的报告质粒pU5-Gluc共转染至HEK293细胞株中,转染后的细胞置37℃黑暗条件下培养24小时候开始进行黑暗、光照(0-1.63W/m2)3小时、化学小分子(0-25μM)以及光照3小时并加化学小分子四个条件下进行培养。诱导24小时后检测目的基因Gluc的表达,如图10所示。结果表明,在单独的化学小分子或光或者同时光与化学小分子条件下,重组转录因子NGAVP、NGAVV、NGAVK与报告因子组合的系统都能激活或抑制目的基因的表达。
实施例11光-化学小分子双诱导基因表达系统在小鼠肝脏中调控基因表达。
我们用实施例4构建的重组转录因子质粒pNGAVP与实施例6构建的报告质粒pU5-mCherry质粒混合后以Ringer’液(147mM NaCl,4mM KCl,1.13mM CaCl2)稀释,小鼠尾静脉注射上述质粒溶液(0.12ml/g小鼠,通常每只3ml左右),5-7秒钟内注射完毕,即通过水动力学法将质粒共转染至小鼠肝脏中,转染6小时后对小鼠分别进行黑暗、光照、化学小分子以及光照并加化学小分子四个条件下饲养。饲养12小时后用Kodak公司的活体成像仪进行肝脏成像拍照(mCherry激发光波长为550nm,发射光波长为600nm),如图11所示。结果表明,光-化学小分子双诱导基因表达系统可以在小鼠肝脏中诱导基因的表达。
实施例12光-化学小分子双诱导基因表达系统控制I型糖尿病小鼠的血糖。
1.链脲佐菌素(STZ)诱导I型糖尿病小鼠模型的建立:
(1)将雄性昆明小鼠(体重约20g,四周龄,购自斯莱克动物中心)在16:00断饲料不断水饥饿处理过夜,次日9:00称量后做好标记;
(2)用柠檬酸缓冲液(0.1M,pH 5)配制STZ注射液,避光冰上放置;
(3)给小鼠腹腔注射STZ 50mg/kg;
(4)给予小鼠充足的食物,饲养至16:00,重复(1)-(4)的操作共计7天;
(5)第7天后,给予小鼠充足的食物,常规饲养;
(6)在STZ诱导结束后的5-7天用罗氏ACCU-CHEK整合型血糖仪测定每只小鼠的血糖,血糖值30mM以上的小鼠(I型糖尿病小鼠)用于后面的实验。
2.构建含有光-化学小分子双诱导基因表达系统的细胞株:将实施例4构建的转录因子质粒pNGAVP与实施例6构建的报告质粒pU5-Insulin共转至HEK293T细胞中,转染后6小时即为含有光-化学小分子双诱导基因表达系统的细胞株。
3.微胶囊包裹细胞株:
(1)准备所有溶液及微胶囊造粒仪的器具,溶液包括:1.5%和0.03%的海藻酸钠;0.05%多聚赖氨酸溶液;Mops清洗缓冲液(10mM mops,0.85%NaCl);聚合缓冲液(10mMmops,100mM CaCl2);解聚缓冲液(50mM柠檬酸钠,0.45%NaCl,10mM mops);
(2)在已经高温高压消毒的反应器中注入225mL聚合物溶液;
(3)对具有大约6×106个细胞的细胞培养基进行离心分离,小颗粒在2mL无菌MOPS清洗缓冲液中重悬,并与10mL 1.5%的海藻酸钠溶液混合,不要引入气泡;
(4)在20mL注射器中注入细胞-海藻酸钠悬浮液,并将注射器链接到层流空气罩中的反应容器;
(5)将反应器固定到工作台上的微胶囊造粒仪控制单元;
(6)设定参数开始液珠成形;
(7)液珠固化5分钟后,停止搅拌并排净聚合物溶液;
(8)加入75mL 0.05%多聚赖氨酸溶液,反应10分钟;
(9)排净多聚赖氨酸溶液;
(10)加入150mL MOPS清洗缓冲液,搅拌1分钟后排净;
(11)再次加入150mL MOPS清洗缓冲液,搅拌5分钟后排净;
(12)加入100mL 0.03%海藻酸钠溶液,可搅拌5分钟形成外部藻酸盐隔膜;
(13)排净藻酸盐溶液;
(14)加入150mL MOPS清洗缓冲液,搅拌1分钟后排净;
(15)加入150mL解聚缓冲液,搅拌10分钟使液珠芯材的藻酸盐溶解。
(16)排净解聚缓冲液;
(17)加入150mL MOPS清洗缓冲液,重新悬浮胶囊并传送至液珠收集瓶。
4.小鼠背部皮下注射微胶囊细胞:将上述包裹细胞的微胶囊注射至糖尿病I型小鼠的背部皮下用于后面的实验。
5.血糖测定:给未移植或移植了细胞胶囊的糖尿病I型小鼠注射底物或者黑暗条件下饲养8h,其间只给水不给食物。4h结束后利用罗氏血糖仪侧测定每只小鼠的血糖值。
图12显示光-化学小分子双诱导基因表达系统可以通过化学小分子诱导胰岛素基因的表达,显著降低小鼠的血糖值,而黑暗条件下的小鼠血糖值的下降不明显。因此,光-化学小分子双诱导基因表达系统可以用于I型糖尿病小鼠的基因治疗。
应该理解,在实施例或实验材料方法中所显示的成分用量、反应条件等数字或是本说明书所使用的其它参数均为近似值(除非特别注明),可根据所需要获得的结果而加以改变。并且,这些参数并非用来限定本发明保护范围,而是应用正常的操作技术下所得到的较佳数据。除非另行定义,文中所使用的所有专业与科学用语术与本领域技术人员所熟悉的意义相同。此外,任何与所记载内容相似或均等的方法及材料及均可以应用于本发明中。文中本说明书中所述的较佳实验方法与材料仅作为示范之用。本说明书提及的所有文献都全文引入作为参考。此外应该理解,在阅读了本发明的上述内容后,本领域的技术人员可以对本发明作各种改动或修改,这些等价形式同样落在本申请所附权利要求书所限定的范围内。
SEQUENCE LISTING
<110> 华东理工大学
<120> 一种新型光-化学小分子双诱导基因表达系统
<130> 2020-12-16
<160> 47
<170> PatentIn version 3.3
<210> 1
<211> 171
<212> PRT
<213> Synthetic Sequence
<400> 1
Met Val Phe Thr Leu Glu Asp Phe Val Gly Asp Trp Arg Gln Thr Ala
1 5 10 15
Gly Tyr Asn Leu Asp Gln Val Leu Glu Gln Gly Gly Val Ser Ser Leu
20 25 30
Phe Gln Asn Leu Gly Val Ser Val Thr Pro Ile Gln Arg Ile Val Leu
35 40 45
Ser Gly Glu Asn Gly Leu Lys Ile Asp Ile His Val Ile Ile Pro Tyr
50 55 60
Glu Gly Leu Ser Gly Asp Gln Met Gly Gln Ile Glu Lys Ile Phe Lys
65 70 75 80
Val Val Tyr Pro Val Asp Asp His His Phe Lys Val Ile Leu His Tyr
85 90 95
Gly Thr Leu Val Ile Asp Gly Val Thr Pro Asn Met Ile Asp Tyr Phe
100 105 110
Gly Arg Pro Tyr Glu Gly Ile Ala Val Phe Asp Gly Lys Lys Ile Thr
115 120 125
Val Thr Gly Thr Leu Trp Asn Gly Asn Lys Ile Ile Asp Glu Arg Leu
130 135 140
Ile Asn Pro Asp Gly Ser Leu Leu Phe Arg Val Thr Ile Asn Gly Val
145 150 155 160
Thr Gly Trp Arg Leu Cys Glu Arg Ile Leu Ala
165 170
<210> 2
<211> 187
<212> PRT
<213> Synthetic Sequence
<400> 2
Met Gly Val Lys Val Leu Phe Ala Leu Ile Cys Ile Ala Val Ala Glu
1 5 10 15
Ala Lys Pro Thr Glu Asn Asn Glu Asp Phe Asn Ile Val Ala Val Ala
20 25 30
Ser Asn Phe Ala Thr Thr Asp Leu Asp Ala Asp Arg Gly Lys Leu Pro
35 40 45
Gly Lys Lys Leu Pro Leu Glu Val Leu Lys Glu Met Glu Ala Asn Ala
50 55 60
Arg Lys Ala Gly Cys Thr Arg Gly Cys Leu Ile Cys Leu Ser His Ile
65 70 75 80
Lys Cys Thr Pro Lys Met Lys Lys Phe Ile Pro Gly Arg Cys His Thr
85 90 95
Tyr Glu Gly Asp Lys Glu Ser Ala Gln Gly Gly Ile Gly Glu Ala Ile
100 105 110
Val Asp Ile Pro Glu Ile Pro Gly Phe Lys Asp Leu Glu Pro Met Glu
115 120 125
Gln Phe Ile Ala Gln Val Asp Leu Cys Val Asp Cys Thr Thr Gly Cys
130 135 140
Leu Lys Gly Leu Ala Asn Val Gln Cys Ser Asp Leu Leu Lys Lys Trp
145 150 155 160
Leu Pro Gln Arg Cys Ala Thr Phe Ala Ser Lys Ile Gln Gly Gln Val
165 170 175
Asp Lys Ile Lys Gly Ala Gly Gly Asp Gly Ser
180 185
<210> 3
<211> 311
<212> PRT
<213> Synthetic Sequence
<400> 3
Met Thr Ser Lys Val Tyr Asp Pro Glu Gln Arg Lys Arg Met Ile Thr
1 5 10 15
Gly Pro Gln Trp Trp Ala Arg Cys Lys Gln Met Asn Val Leu Asp Ser
20 25 30
Phe Ile Asn Tyr Tyr Asp Ser Glu Lys His Ala Glu Asn Ala Val Ile
35 40 45
Phe Leu His Gly Asn Ala Ala Ser Ser Tyr Leu Trp Arg His Val Val
50 55 60
Pro His Ile Glu Pro Val Ala Arg Cys Ile Ile Pro Asp Leu Ile Gly
65 70 75 80
Met Gly Lys Ser Gly Lys Ser Gly Asn Gly Ser Tyr Arg Leu Leu Asp
85 90 95
His Tyr Lys Tyr Leu Thr Ala Trp Phe Glu Leu Leu Asn Leu Pro Lys
100 105 110
Lys Ile Ile Phe Val Gly His Asp Trp Gly Ala Cys Leu Ala Phe His
115 120 125
Tyr Ser Tyr Glu His Gln Asp Lys Ile Lys Ala Ile Val His Ala Glu
130 135 140
Ser Val Val Asp Val Ile Glu Ser Trp Asp Glu Trp Pro Asp Ile Glu
145 150 155 160
Glu Asp Ile Ala Leu Ile Lys Ser Glu Glu Gly Glu Lys Met Val Leu
165 170 175
Glu Asn Asn Phe Phe Val Glu Thr Met Leu Pro Ser Lys Ile Met Arg
180 185 190
Lys Leu Glu Pro Glu Glu Phe Ala Ala Tyr Leu Glu Pro Phe Lys Glu
195 200 205
Lys Gly Glu Val Arg Arg Pro Thr Leu Ser Trp Pro Arg Glu Ile Pro
210 215 220
Leu Val Lys Gly Gly Lys Pro Asp Val Val Gln Ile Val Arg Asn Tyr
225 230 235 240
Asn Ala Tyr Leu Arg Ala Ser Asp Asp Leu Pro Lys Met Phe Ile Glu
245 250 255
Ser Asp Pro Gly Phe Phe Ser Asn Ala Ile Val Glu Gly Ala Lys Lys
260 265 270
Phe Pro Asn Thr Glu Phe Val Lys Val Lys Gly Leu His Phe Ser Gln
275 280 285
Glu Asp Ala Pro Asp Glu Met Gly Lys Tyr Ile Lys Ser Phe Val Glu
290 295 300
Arg Val Leu Lys Asn Glu Gln
305 310
<210> 4
<211> 65
<212> PRT
<213> Synthetic Sequence
<400> 4
Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile Cys Arg Leu
1 5 10 15
Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala Lys Cys Leu
20 25 30
Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys Arg Ser Pro
35 40 45
Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu Glu Arg Leu
50 55 60
Glu
65
<210> 5
<211> 87
<212> PRT
<213> Escherichia coli
<400> 5
Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg
1 5 10 15
Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala
20 25 30
Gln Arg Leu Gly Phe Arg Ser Pro Asn Ala Ala Glu Glu His Leu Lys
35 40 45
Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg
50 55 60
Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly
65 70 75 80
Arg Val Ala Ala Gly Glu Pro
85
<210> 6
<211> 62
<212> PRT
<213> Synthetic Sequence
<400> 6
Met Lys Pro Val Thr Leu Tyr Asp Val Ala Glu Tyr Ala Gly Val Ser
1 5 10 15
Tyr Gln Thr Val Ser Arg Val Val Asn Gln Ala Ser His Val Ser Ala
20 25 30
Lys Thr Arg Glu Lys Val Glu Ala Ala Met Ala Glu Leu Asn Tyr Ile
35 40 45
Pro Asn Arg Val Ala Gln Gln Leu Ala Gly Lys Gln Ser Leu
50 55 60
<210> 7
<211> 63
<212> PRT
<213> Synthetic Sequence
<400> 7
Met Ser Arg Leu Asp Lys Ser Lys Val Ile Asn Ser Ala Leu Glu Leu
1 5 10 15
Leu Asn Glu Val Gly Ile Glu Gly Leu Thr Thr Arg Lys Leu Ala Gln
20 25 30
Lys Leu Gly Val Glu Gln Pro Thr Leu Tyr Trp His Val Lys Asn Lys
35 40 45
Arg Ala Leu Leu Asp Ala Leu Ala Ile Glu Met Leu Asp Arg His
50 55 60
<210> 8
<211> 102
<212> PRT
<213> 位 Bacteriophage
<400> 8
Met Ser Thr Lys Lys Lys Pro Leu Thr Gln Glu Gln Leu Glu Asp Ala
1 5 10 15
Arg Arg Leu Lys Ala Ile Tyr Glu Lys Lys Lys Asn Glu Leu Gly Leu
20 25 30
Ser Gln Glu Ser Val Ala Asp Lys Met Gly Met Gly Gln Ser Gly Val
35 40 45
Gly Ala Leu Phe Asn Gly Ile Asn Ala Leu Asn Ala Tyr Asn Ala Ala
50 55 60
Leu Leu Ala Lys Ile Leu Lys Val Ser Val Glu Glu Phe Ser Pro Ser
65 70 75 80
Ile Ala Arg Glu Ile Tyr Glu Met Tyr Glu Ala Val Ser Met Gln Pro
85 90 95
Ser Leu Arg Ser Glu Tyr
100
<210> 9
<211> 150
<212> PRT
<213> Synthetic Sequence
<400> 9
His Thr Leu Tyr Ala Pro Gly Gly Tyr Asp Ile Met Gly Tyr Leu Ile
1 5 10 15
Gln Ile Met Asn Arg Pro Asn Pro Gln Val Glu Leu Gly Pro Val Asp
20 25 30
Thr Ser Val Ala Leu Ile Leu Cys Asp Leu Lys Gln Lys Asp Thr Pro
35 40 45
Ile Val Tyr Ala Ser Glu Ala Phe Leu Tyr Met Thr Gly Tyr Ser Asn
50 55 60
Ala Glu Val Leu Gly Arg Asn Cys Arg Phe Leu Gln Ser Pro Asp Gly
65 70 75 80
Met Val Lys Pro Lys Ser Thr Arg Lys Tyr Val Asp Ser Asn Thr Ile
85 90 95
Asn Thr Met Arg Lys Ala Ile Asp Arg Asn Ala Glu Val Gln Val Glu
100 105 110
Val Val Asn Phe Lys Lys Asn Gly Gln Arg Phe Val Asn Phe Leu Thr
115 120 125
Met Ile Pro Val Arg Asp Glu Thr Gly Glu Tyr Arg Tyr Ser Met Gly
130 135 140
Phe Gln Cys Glu Thr Glu
145 150
<210> 10
<211> 150
<212> PRT
<213> Synthetic Sequence
<400> 10
His Thr Leu Tyr Ala Pro Gly Gly Tyr Asp Ile Met Gly Tyr Leu Ile
1 5 10 15
Gln Ile Met Lys Arg Pro Asn Pro Gln Val Glu Leu Gly Pro Val Asp
20 25 30
Thr Ser Cys Ala Leu Ile Leu Cys Asp Leu Lys Gln Lys Asp Thr Pro
35 40 45
Ile Val Tyr Ala Ser Glu Ala Phe Leu Tyr Met Thr Gly Tyr Ser Asn
50 55 60
Ala Glu Val Leu Gly Arg Asn Cys Arg Phe Leu Gln Ser Pro Asp Gly
65 70 75 80
Met Val Lys Pro Lys Ser Thr Arg Lys Tyr Val Asp Ser Asn Thr Ile
85 90 95
Asn Thr Met Arg Lys Ala Ile Asp Arg Asn Ala Glu Val Gln Val Glu
100 105 110
Val Val Asn Phe Lys Lys Asn Gly Gln Arg Phe Val Asn Phe Leu Thr
115 120 125
Met Ile Pro Val Arg Asp Glu Thr Gly Glu Tyr Arg Tyr Ser Met Gly
130 135 140
Phe Gln Cys Glu Thr Glu
145 150
<210> 11
<211> 150
<212> PRT
<213> Synthetic Sequence
<400> 11
His Thr Leu Tyr Ala Pro Gly Gly Tyr Asp Ile Met Gly Trp Leu Ile
1 5 10 15
Gln Ile Met Asn Arg Pro Asn Pro Gln Val Glu Leu Gly Pro Val Asp
20 25 30
Thr Ser Cys Ala Leu Ile Leu Cys Asp Leu Lys Gln Lys Asp Thr Pro
35 40 45
Ile Val Tyr Ala Ser Glu Ala Phe Leu Tyr Met Thr Gly Tyr Ser Asn
50 55 60
Ala Glu Val Leu Gly Arg Asn Cys Arg Phe Leu Gln Ser Pro Asp Gly
65 70 75 80
Met Val Lys Pro Lys Ser Thr Arg Lys Tyr Val Asp Ser Asn Thr Ile
85 90 95
Asn Thr Met Arg Lys Ala Ile Asp Arg Asn Ala Glu Val Gln Val Glu
100 105 110
Val Val Asn Phe Lys Lys Asn Gly Gln Arg Phe Val Asn Phe Leu Thr
115 120 125
Met Ile Pro Val Arg Asp Glu Thr Gly Glu Tyr Arg Tyr Ser Met Gly
130 135 140
Phe Gln Cys Glu Thr Glu
145 150
<210> 12
<211> 150
<212> PRT
<213> Synthetic Sequence
<400> 12
His Thr Leu Tyr Ala Pro Gly Gly Tyr Asp Ile Met Gly Tyr Leu Ile
1 5 10 15
Gln Ile Met Asn Arg Pro Asn Pro Gln Val Glu Leu Gly Pro Val Asp
20 25 30
Thr Ser Cys Ala Leu Ile Leu Cys Asp Leu Lys Gln Lys Asp Thr Pro
35 40 45
Ile Val Tyr Ala Ser Glu Ala Phe Leu Tyr Met Thr Gly Tyr Ser Asn
50 55 60
Ala Glu Val Leu Gly Arg Asn Cys Arg Phe Leu Gln Ser Pro Asp Gly
65 70 75 80
Met Val Lys Pro Lys Ser Thr Arg Lys Tyr Val Asp Ser Asn Thr Ile
85 90 95
Asn Thr Met Arg Lys Ala Ile Asp Arg Asn Ala Glu Val Gln Val Glu
100 105 110
Val Val Asn Phe Lys Lys Asn Gly Gln Arg Phe Val Asn Phe Leu Thr
115 120 125
Met Ile Pro Val Arg Asp Glu Thr Gly Glu Tyr Arg Tyr Ser Met Gly
130 135 140
Phe Gln Cys Glu Thr Glu
145 150
<210> 13
<211> 144
<212> PRT
<213> Synthetic Sequence
<400> 13
Phe Leu Ala Thr Thr Leu Glu Arg Ile Glu Lys Asn Phe Val Ile Thr
1 5 10 15
Asp Pro Arg Leu Pro Asp Asn Pro Ile Ile Phe Ala Ser Asp Ser Phe
20 25 30
Leu Gln Leu Thr Glu Tyr Ser Arg Glu Glu Ile Leu Gly Arg Asn Cys
35 40 45
Arg Phe Leu Gln Gly Pro Glu Thr Asp Arg Ala Thr Val Arg Lys Ile
50 55 60
Arg Asp Ala Ile Asp Asn Gln Thr Glu Val Thr Val Gln Leu Ile Asn
65 70 75 80
Tyr Thr Lys Ser Gly Lys Lys Phe Trp Asn Leu Phe His Leu Gln Pro
85 90 95
Met Arg Asp Gln Lys Gly Asp Val Gln Tyr Phe Ile Gly Val Gln Leu
100 105 110
Asp Gly Thr Glu His Val Arg Asp Ala Ala Glu Arg Glu Gly Val Met
115 120 125
Leu Ile Lys Lys Thr Ala Glu Asn Ile Asp Glu Ala Ala Lys Glu Leu
130 135 140
<210> 14
<211> 113
<212> PRT
<213> Synthetic Sequence
<400> 14
Gln Asn Phe Val Ile Thr Asp Ala Ser Leu Pro Asp Asn Pro Ile Val
1 5 10 15
Tyr Ala Ser Arg Gly Phe Leu Thr Leu Thr Gly Tyr Ser Leu Asp Gln
20 25 30
Ile Leu Gly Arg Asn Cys Arg Phe Leu Gln Gly Pro Glu Thr Asp Pro
35 40 45
Arg Ala Val Asp Lys Ile Arg Asn Ala Ile Thr Lys Gly Val Asp Thr
50 55 60
Ser Val Cys Leu Leu Asn Tyr Arg Gln Asp Gly Thr Thr Phe Trp Asn
65 70 75 80
Leu Phe Phe Val Ala Gly Leu Arg Asp Ser Lys Gly Asn Ile Val Asn
85 90 95
Tyr Val Gly Val Gln Ser Lys Val Ser Glu Asp Tyr Ala Lys Leu Leu
100 105 110
Val
<210> 15
<211> 84
<212> PRT
<213> Synthetic Sequence
<400> 15
Gly Gly Thr Arg Ala Pro Pro Thr Asp Val Ser Leu Gly Asp Glu Leu
1 5 10 15
His Leu Asp Gly Glu Asp Val Ala Met Ala His Ala Asp Ala Leu Asp
20 25 30
Asp Phe Asp Leu Asp Met Leu Gly Asp Gly Asp Ser Pro Gly Pro Gly
35 40 45
Phe Thr Pro His Asp Ser Ala Pro Tyr Gly Ala Leu Asp Met Ala Asp
50 55 60
Phe Glu Phe Glu Gln Met Phe Thr Asp Ala Leu Gly Ile Asp Glu Tyr
65 70 75 80
Gly Gly Thr Gly
<210> 16
<211> 265
<212> PRT
<213> Synthetic Sequence
<400> 16
Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg
1 5 10 15
Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro Phe
20 25 30
Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val Pro
35 40 45
Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Pro
50 55 60
Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr Met
65 70 75 80
Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala
85 90 95
Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala
100 105 110
Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala
115 120 125
Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln
130 135 140
Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp
145 150 155 160
Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val
165 170 175
Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu
180 185 190
Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met
195 200 205
Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro
210 215 220
Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly
225 230 235 240
Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe
245 250 255
Ser Ala Leu Leu Ser Gln Ile Ser Ser
260 265
<210> 17
<211> 121
<212> PRT
<213> Synthetic Sequence
<400> 17
Asp Gly Gly Gly Ala Leu Ser Pro Gln His Ser Ala Val Thr Gln Gly
1 5 10 15
Ser Ile Ile Lys Asn Lys Glu Gly Met Asp Ala Lys Ser Leu Thr Ala
20 25 30
Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr
35 40 45
Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Val Tyr Arg
50 55 60
Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln
65 70 75 80
Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro
85 90 95
Trp Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu
100 105 110
Thr Ala Phe Glu Ile Lys Ser Ser Val
115 120
<210> 18
<211> 42
<212> DNA
<213> Synthetic Sequence
<400> 18
cggggggcta taaaaggggg tgggggcgtt cgtcctcact ct 42
<210> 19
<211> 120
<212> DNA
<213> Synthetic Sequence
<400> 19
gtaggcgtgt acggtgggag gcctatataa gcagagctcg tttagtgaac cgtcagatcg 60
cctggagacg ccatccacgc tgttttgacc tccatagaag acaccgggac cgatccagcc 120
<210> 20
<211> 451
<212> DNA
<213> Synthetic Sequence
<400> 20
acggattaga agccgccgag cgggtgacag ccctccgaag gaagactctc ctccgtgcgt 60
cctcgtcttc accggtcgcg ttcctgaaac gcagatgtgc ctcgcgccgc actgctccga 120
acaataaaga ttctacaata ctagctttta tggttatgaa gaggaaaaat tggcagtaac 180
ctggccccac aaaccttcaa atgaacgaat caaattaaca accataggat gataatgcga 240
ttagtttttt agccttattt ctggggtaat taatcagcga agcgatgatt tttgatctat 300
taacagatat ataaatgcaa aaactgcata accactttaa ctaatacttt caacattttc 360
ggtttgtatt acttcttatt caaatgtaat aaaagtatca acaaaaaatt gttaatatac 420
ctctatactt taacgtcaag gagaaaaaac c 451
<210> 21
<211> 344
<212> DNA
<213> Synthetic Sequence
<400> 21
ctgtggaatg tgtgtcagtt agggtgtgga aagtccccag gctccccagc aggcagaagt 60
atgcaaagca tgcatctcaa ttagtcagca accaggtgtg gaaagtcccc aggctcccca 120
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccatagt cccgccccta 180
actccgccca tcccgcccct aactccgccc agttccgccc attctccgcc ccatggctga 240
ctaatttttt ttatttatgc agaggccgag gccgcctctg cctctgagct attccagaag 300
tagtgaggag gcttttttgg aggcctaggc ttttgcaaaa agct 344
<210> 22
<211> 236
<212> PRT
<213> Synthetic Sequence
<400> 22
Met Val Ser Lys Gly Glu Glu Asp Asn Met Ala Ile Ile Lys Glu Phe
1 5 10 15
Met Arg Phe Lys Val His Met Glu Gly Ser Val Asn Gly His Glu Phe
20 25 30
Glu Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr
35 40 45
Ala Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp
50 55 60
Ile Leu Ser Pro Gln Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His
65 70 75 80
Pro Ala Asp Ile Pro Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe
85 90 95
Lys Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val
100 105 110
Thr Gln Asp Ser Ser Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys
115 120 125
Leu Arg Gly Thr Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys
130 135 140
Thr Met Gly Trp Glu Ala Ser Ser Glu Arg Met Tyr Pro Glu Asp Gly
145 150 155 160
Ala Leu Lys Gly Glu Ile Lys Gln Arg Leu Lys Leu Lys Asp Gly Gly
165 170 175
His Tyr Asp Ala Glu Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val
180 185 190
Gln Leu Pro Gly Ala Tyr Asn Val Asn Ile Lys Leu Asp Ile Thr Ser
195 200 205
His Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly
210 215 220
Arg His Ser Thr Gly Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 23
<211> 239
<212> PRT
<213> Synthetic Sequence
<400> 23
Met Val Ser Lys Gln Ile Leu Lys Asn Thr Gly Leu Gln Glu Ile Met
1 5 10 15
Ser Phe Lys Val Asn Leu Glu Gly Val Val Asn Asn His Val Phe Thr
20 25 30
Met Glu Gly Cys Gly Lys Gly Asn Ile Leu Phe Gly Asn Gln Leu Val
35 40 45
Gln Ile Arg Val Thr Lys Gly Ala Pro Leu Pro Phe Ala Phe Asp Ile
50 55 60
Leu Ser Pro Ala Phe Gln Tyr Gly Asn Arg Thr Phe Thr Lys Tyr Pro
65 70 75 80
Glu Asp Ile Ser Asp Phe Phe Ile Gln Ser Phe Pro Ala Gly Phe Val
85 90 95
Tyr Glu Arg Thr Leu Arg Tyr Glu Asp Gly Gly Leu Val Glu Ile Arg
100 105 110
Ser Asp Ile Asn Leu Ile Glu Glu Met Phe Val Tyr Arg Val Glu Tyr
115 120 125
Lys Gly Arg Asn Phe Pro Asn Asp Gly Pro Val Met Lys Lys Thr Ile
130 135 140
Thr Gly Leu Gln Pro Ser Phe Glu Val Val Tyr Met Asn Asp Gly Val
145 150 155 160
Leu Val Gly Gln Val Ile Leu Val Tyr Arg Leu Asn Ser Gly Lys Phe
165 170 175
Tyr Ser Cys His Met Arg Thr Leu Met Lys Ser Lys Gly Val Val Lys
180 185 190
Asp Phe Pro Glu Tyr His Phe Ile Gln His Arg Leu Glu Lys Thr Tyr
195 200 205
Val Glu Asp Gly Gly Phe Val Glu Gln His Glu Thr Ala Ile Ala Gln
210 215 220
Leu Thr Ser Leu Gly Lys Pro Leu Gly Ser Leu His Glu Trp Val
225 230 235
<210> 24
<211> 110
<212> PRT
<213> Synthetic Sequence
<400> 24
Met Ala Leu Trp Met Arg Phe Leu Pro Leu Leu Ala Leu Leu Val Leu
1 5 10 15
Trp Glu Pro Lys Pro Ala Gln Ala Phe Val Lys Gln His Leu Cys Gly
20 25 30
Pro His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe
35 40 45
Phe Tyr Thr Pro Lys Ser Arg Arg Lys Arg Glu Asp Pro Gln Val Pro
50 55 60
Gln Leu Glu Leu Gly Gly Gly Pro Glu Ala Gly Asp Leu Gln Thr Leu
65 70 75 80
Ala Leu Glu Val Ala Arg Gln Lys Arg Gly Ile Val Asp Gln Cys Cys
85 90 95
Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn
100 105 110
<210> 25
<211> 687
<212> PRT
<213> Synthetic Sequence
<400> 25
Met Val Phe Thr Leu Glu Asp Phe Val Gly Asp Trp Arg Gln Thr Ala
1 5 10 15
Gly Tyr Asn Leu Asp Gln Val Leu Glu Gln Gly Gly Val Ser Ser Leu
20 25 30
Phe Gln Asn Leu Gly Val Ser Val Thr Pro Ile Gln Arg Ile Val Leu
35 40 45
Ser Gly Glu Asn Gly Leu Lys Ile Asp Ile His Val Ile Ile Pro Tyr
50 55 60
Glu Gly Leu Ser Gly Asp Gln Met Gly Gln Ile Glu Lys Ile Phe Lys
65 70 75 80
Val Val Tyr Pro Val Asp Asp His His Phe Lys Val Ile Leu His Tyr
85 90 95
Gly Thr Leu Val Ile Asp Gly Val Thr Pro Asn Met Ile Asp Tyr Phe
100 105 110
Gly Arg Pro Tyr Glu Gly Ile Ala Val Phe Asp Gly Lys Lys Ile Thr
115 120 125
Val Thr Gly Thr Leu Trp Asn Gly Asn Lys Ile Ile Asp Glu Arg Leu
130 135 140
Ile Asn Pro Asp Gly Ser Leu Leu Phe Arg Val Thr Ile Asn Gly Val
145 150 155 160
Thr Gly Trp Arg Leu Cys Glu Arg Ile Leu Ala Ser Gly Gly Ser Gly
165 170 175
Gly Ser Gly Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile
180 185 190
Cys Arg Leu Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala
195 200 205
Lys Cys Leu Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys
210 215 220
Arg Ser Pro Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu
225 230 235 240
Glu Arg Leu Glu Arg Ser Ile Ala Thr Arg Ser His Thr Leu Tyr Ala
245 250 255
Pro Gly Gly Tyr Asp Ile Met Gly Tyr Leu Ile Gln Ile Met Lys Arg
260 265 270
Pro Asn Pro Gln Val Glu Leu Gly Pro Val Asp Thr Ser Val Ala Leu
275 280 285
Ile Leu Cys Asp Leu Lys Gln Lys Asp Thr Pro Ile Val Tyr Ala Ser
290 295 300
Glu Ala Phe Leu Tyr Met Thr Gly Tyr Ser Asn Ala Glu Val Leu Gly
305 310 315 320
Arg Asn Cys Arg Phe Leu Gln Ser Pro Asp Gly Met Val Lys Pro Lys
325 330 335
Ser Thr Arg Lys Tyr Val Asp Ser Asn Thr Ile Asn Thr Met Arg Lys
340 345 350
Ala Ile Asp Arg Asn Ala Glu Val Gln Val Glu Val Val Asn Phe Lys
355 360 365
Lys Asn Gly Gln Arg Phe Val Asn Phe Leu Thr Met Ile Pro Val Arg
370 375 380
Asp Glu Thr Gly Glu Tyr Arg Tyr Ser Met Gly Phe Gln Cys Glu Thr
385 390 395 400
Glu Leu Gln Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Glu Phe Gln Tyr
405 410 415
Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg Lys Arg
420 425 430
Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro Phe Ser Gly
435 440 445
Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val Pro Ser Arg
450 455 460
Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr
465 470 475 480
Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr Met Val Phe
485 490 495
Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro
500 505 510
Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val
515 520 525
Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly
530 535 540
Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly
545 550 555 560
Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu
565 570 575
Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr
580 585 590
Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln
595 600 605
Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr
610 615 620
Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp
625 630 635 640
Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu
645 650 655
Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala
660 665 670
Leu Leu Ser Gln Ile Ser Ser Asp Tyr Lys Asp Asp Asp Asp Lys
675 680 685
<210> 26
<211> 708
<212> PRT
<213> Synthetic Sequence
<400> 26
Met Lys Pro Thr Glu Asn Asn Glu Asp Phe Asn Ile Val Ala Val Ala
1 5 10 15
Ser Asn Phe Ala Thr Thr Asp Leu Asp Ala Asp Arg Gly Lys Leu Pro
20 25 30
Gly Lys Lys Leu Pro Leu Glu Val Leu Lys Glu Leu Glu Ala Asn Ala
35 40 45
Arg Lys Ala Gly Cys Thr Arg Gly Cys Leu Ile Cys Leu Ser His Ile
50 55 60
Lys Cys Thr Pro Lys Met Lys Lys Phe Ile Pro Gly Arg Cys His Thr
65 70 75 80
Tyr Glu Gly Asp Lys Glu Ser Ala Gln Gly Gly Ile Gly Glu Ala Ile
85 90 95
Val Asp Ile Pro Glu Ile Pro Gly Phe Lys Asp Leu Glu Pro Leu Glu
100 105 110
Gln Phe Ile Ala Gln Val Asp Leu Cys Val Asp Cys Thr Thr Gly Cys
115 120 125
Leu Lys Gly Leu Ala Asn Val Gln Cys Ser Asp Leu Leu Lys Lys Trp
130 135 140
Leu Pro Gln Arg Cys Ala Thr Phe Ala Ser Lys Ile Gln Gly Gln Val
145 150 155 160
Asp Lys Ile Lys Gly Ala Gly Gly Asp Gly Ser Asp Tyr Lys Asp Asp
165 170 175
Asp Asp Lys Asp Tyr Lys Asp Asp Asp Asp Lys Ser Arg Gly Pro Val
180 185 190
Ser Gly Gly Ser Gly Gly Ser Gly Met Lys Leu Leu Ser Ser Ile Glu
195 200 205
Gln Ala Cys Asp Ile Cys Arg Leu Lys Lys Leu Lys Cys Ser Lys Glu
210 215 220
Lys Pro Lys Cys Ala Lys Cys Leu Lys Asn Asn Trp Glu Cys Arg Tyr
225 230 235 240
Ser Pro Lys Thr Lys Arg Ser Pro Leu Thr Arg Ala His Leu Thr Glu
245 250 255
Val Glu Ser Arg Leu Glu Arg Leu Glu Arg Ser Ile Ala Thr Arg Ser
260 265 270
His Thr Leu Tyr Ala Pro Gly Gly Tyr Asp Ile Met Gly Tyr Leu Ile
275 280 285
Gln Ile Met Lys Arg Pro Asn Pro Gln Val Glu Leu Gly Pro Val Asp
290 295 300
Thr Ser Val Ala Leu Ile Leu Cys Asp Leu Lys Gln Lys Asp Thr Pro
305 310 315 320
Ile Val Tyr Ala Ser Glu Ala Phe Leu Tyr Met Thr Gly Tyr Ser Asn
325 330 335
Ala Glu Val Leu Gly Arg Asn Cys Arg Phe Leu Gln Ser Pro Asp Gly
340 345 350
Met Val Lys Pro Lys Ser Thr Arg Lys Tyr Val Asp Ser Asn Thr Ile
355 360 365
Asn Thr Met Arg Lys Ala Ile Asp Arg Asn Ala Glu Val Gln Val Glu
370 375 380
Val Val Asn Phe Lys Lys Asn Gly Gln Arg Phe Val Asn Phe Leu Thr
385 390 395 400
Met Ile Pro Val Arg Asp Glu Thr Gly Glu Tyr Arg Tyr Ser Met Gly
405 410 415
Phe Gln Cys Glu Thr Glu Leu Gln Tyr Pro Tyr Asp Val Pro Asp Tyr
420 425 430
Ala Glu Phe Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu
435 440 445
Glu Lys Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys
450 455 460
Ser Pro Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile
465 470 475 480
Ala Val Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln
485 490 495
Pro Tyr Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe
500 505 510
Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu
515 520 525
Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro
530 535 540
Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro
545 550 555 560
Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys
565 570 575
Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu
580 585 590
Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp
595 600 605
Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln
610 615 620
Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro
625 630 635 640
Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala
645 650 655
Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu
660 665 670
Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp
675 680 685
Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Asp Tyr Lys Asp
690 695 700
Asp Asp Asp Lys
705
<210> 27
<211> 827
<212> PRT
<213> Synthetic Sequence
<400> 27
Met Thr Ser Lys Val Tyr Asp Pro Glu Gln Arg Lys Arg Met Ile Thr
1 5 10 15
Gly Pro Gln Trp Trp Ala Arg Cys Lys Gln Met Asn Val Leu Asp Ser
20 25 30
Phe Ile Asn Tyr Tyr Asp Ser Glu Lys His Ala Glu Asn Ala Val Ile
35 40 45
Phe Leu His Gly Asn Ala Ala Ser Ser Tyr Leu Trp Arg His Val Val
50 55 60
Pro His Ile Glu Pro Val Ala Arg Cys Ile Ile Pro Asp Leu Ile Gly
65 70 75 80
Met Gly Lys Ser Gly Lys Ser Gly Asn Gly Ser Tyr Arg Leu Leu Asp
85 90 95
His Tyr Lys Tyr Leu Thr Ala Trp Phe Glu Leu Leu Asn Leu Pro Lys
100 105 110
Lys Ile Ile Phe Val Gly His Asp Trp Gly Ala Cys Leu Ala Phe His
115 120 125
Tyr Ser Tyr Glu His Gln Asp Lys Ile Lys Ala Ile Val His Ala Glu
130 135 140
Ser Val Val Asp Val Ile Glu Ser Trp Asp Glu Trp Pro Asp Ile Glu
145 150 155 160
Glu Asp Ile Ala Leu Ile Lys Ser Glu Glu Gly Glu Lys Met Val Leu
165 170 175
Glu Asn Asn Phe Phe Val Glu Thr Met Leu Pro Ser Lys Ile Met Arg
180 185 190
Lys Leu Glu Pro Glu Glu Phe Ala Ala Tyr Leu Glu Pro Phe Lys Glu
195 200 205
Lys Gly Glu Val Arg Arg Pro Thr Leu Ser Trp Pro Arg Glu Ile Pro
210 215 220
Leu Val Lys Gly Gly Lys Pro Asp Val Val Gln Ile Val Arg Asn Tyr
225 230 235 240
Asn Ala Tyr Leu Arg Ala Ser Asp Asp Leu Pro Lys Met Phe Ile Glu
245 250 255
Ser Asp Pro Gly Phe Phe Ser Asn Ala Ile Val Glu Gly Ala Lys Lys
260 265 270
Phe Pro Asn Thr Glu Phe Val Lys Val Lys Gly Leu His Phe Ser Gln
275 280 285
Glu Asp Ala Pro Asp Glu Met Gly Lys Tyr Ile Lys Ser Phe Val Glu
290 295 300
Arg Val Leu Lys Asn Glu Gln Ser Gly Gly Ser Gly Gly Ser Gly Met
305 310 315 320
Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile Cys Arg Leu Lys
325 330 335
Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala Lys Cys Leu Lys
340 345 350
Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys Arg Ser Pro Leu
355 360 365
Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu Glu Arg Leu Glu
370 375 380
Arg Ser Ile Ala Thr Arg Ser His Thr Leu Tyr Ala Pro Gly Gly Tyr
385 390 395 400
Asp Ile Met Gly Tyr Leu Ile Gln Ile Met Lys Arg Pro Asn Pro Gln
405 410 415
Val Glu Leu Gly Pro Val Asp Thr Ser Val Ala Leu Ile Leu Cys Asp
420 425 430
Leu Lys Gln Lys Asp Thr Pro Ile Val Tyr Ala Ser Glu Ala Phe Leu
435 440 445
Tyr Met Thr Gly Tyr Ser Asn Ala Glu Val Leu Gly Arg Asn Cys Arg
450 455 460
Phe Leu Gln Ser Pro Asp Gly Met Val Lys Pro Lys Ser Thr Arg Lys
465 470 475 480
Tyr Val Asp Ser Asn Thr Ile Asn Thr Met Arg Lys Ala Ile Asp Arg
485 490 495
Asn Ala Glu Val Gln Val Glu Val Val Asn Phe Lys Lys Asn Gly Gln
500 505 510
Arg Phe Val Asn Phe Leu Thr Met Ile Pro Val Arg Asp Glu Thr Gly
515 520 525
Glu Tyr Arg Tyr Ser Met Gly Phe Gln Cys Glu Thr Glu Leu Gln Tyr
530 535 540
Pro Tyr Asp Val Pro Asp Tyr Ala Glu Phe Gln Tyr Leu Pro Asp Thr
545 550 555 560
Asp Asp Arg His Arg Ile Glu Glu Lys Arg Lys Arg Thr Tyr Glu Thr
565 570 575
Phe Lys Ser Ile Met Lys Lys Ser Pro Phe Ser Gly Pro Thr Asp Pro
580 585 590
Arg Pro Pro Pro Arg Arg Ile Ala Val Pro Ser Arg Ser Ser Ala Ser
595 600 605
Val Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser Leu Ser
610 615 620
Thr Ile Asn Tyr Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln
625 630 635 640
Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro
645 650 655
Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala
660 665 670
Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala
675 680 685
Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu
690 695 700
Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala
705 710 715 720
Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser
725 730 735
Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val
740 745 750
Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile
755 760 765
Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala
770 775 780
Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu
785 790 795 800
Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln
805 810 815
Ile Ser Ser Asp Tyr Lys Asp Asp Asp Asp Lys
820 825
<210> 28
<211> 709
<212> PRT
<213> Synthetic Sequence
<400> 28
Met Val Phe Thr Leu Glu Asp Phe Val Gly Asp Trp Arg Gln Thr Ala
1 5 10 15
Gly Tyr Asn Leu Asp Gln Val Leu Glu Gln Gly Gly Val Ser Ser Leu
20 25 30
Phe Gln Asn Leu Gly Val Ser Val Thr Pro Ile Gln Arg Ile Val Leu
35 40 45
Ser Gly Glu Asn Gly Leu Lys Ile Asp Ile His Val Ile Ile Pro Tyr
50 55 60
Glu Gly Leu Ser Gly Asp Gln Met Gly Gln Ile Glu Lys Ile Phe Lys
65 70 75 80
Val Val Tyr Pro Val Asp Asp His His Phe Lys Val Ile Leu His Tyr
85 90 95
Gly Thr Leu Val Ile Asp Gly Val Thr Pro Asn Met Ile Asp Tyr Phe
100 105 110
Gly Arg Pro Tyr Glu Gly Ile Ala Val Phe Asp Gly Lys Lys Ile Thr
115 120 125
Val Thr Gly Thr Leu Trp Asn Gly Asn Lys Ile Ile Asp Glu Arg Leu
130 135 140
Ile Asn Pro Asp Gly Ser Leu Leu Phe Arg Val Thr Ile Asn Gly Val
145 150 155 160
Thr Gly Trp Arg Leu Cys Glu Arg Ile Leu Ala Ser Gly Gly Ser Gly
165 170 175
Gly Ser Gly Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp
180 185 190
Leu Ile Arg Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala
195 200 205
Glu Ile Ala Gln Arg Leu Gly Phe Arg Ser Pro Asn Ala Ala Glu Glu
210 215 220
His Leu Lys Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly
225 230 235 240
Ala Ser Arg Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro
245 250 255
Leu Val Gly Arg Val Ala Ala Gly Glu Pro Arg Ser Ile Ala Thr Arg
260 265 270
Ser His Thr Leu Tyr Ala Pro Gly Gly Tyr Asp Ile Met Gly Tyr Leu
275 280 285
Ile Gln Ile Met Lys Arg Pro Asn Pro Gln Val Glu Leu Gly Pro Val
290 295 300
Asp Thr Ser Val Ala Leu Ile Leu Cys Asp Leu Lys Gln Lys Asp Thr
305 310 315 320
Pro Ile Val Tyr Ala Ser Glu Ala Phe Leu Tyr Met Thr Gly Tyr Ser
325 330 335
Asn Ala Glu Val Leu Gly Arg Asn Cys Arg Phe Leu Gln Ser Pro Asp
340 345 350
Gly Met Val Lys Pro Lys Ser Thr Arg Lys Tyr Val Asp Ser Asn Thr
355 360 365
Ile Asn Thr Met Arg Lys Ala Ile Asp Arg Asn Ala Glu Val Gln Val
370 375 380
Glu Val Val Asn Phe Lys Lys Asn Gly Gln Arg Phe Val Asn Phe Leu
385 390 395 400
Thr Met Ile Pro Val Arg Asp Glu Thr Gly Glu Tyr Arg Tyr Ser Met
405 410 415
Gly Phe Gln Cys Glu Thr Glu Leu Gln Tyr Pro Tyr Asp Val Pro Asp
420 425 430
Tyr Ala Glu Phe Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile
435 440 445
Glu Glu Lys Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys
450 455 460
Lys Ser Pro Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg
465 470 475 480
Ile Ala Val Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro
485 490 495
Gln Pro Tyr Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu
500 505 510
Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala
515 520 525
Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala
530 535 540
Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val
545 550 555 560
Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro
565 570 575
Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln
580 585 590
Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr
595 600 605
Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe
610 615 620
Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu
625 630 635 640
Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly
645 650 655
Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly
660 665 670
Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala
675 680 685
Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Asp Tyr Lys
690 695 700
Asp Asp Asp Asp Lys
705
<210> 29
<211> 684
<212> PRT
<213> Synthetic Sequence
<400> 29
Met Val Phe Thr Leu Glu Asp Phe Val Gly Asp Trp Arg Gln Thr Ala
1 5 10 15
Gly Tyr Asn Leu Asp Gln Val Leu Glu Gln Gly Gly Val Ser Ser Leu
20 25 30
Phe Gln Asn Leu Gly Val Ser Val Thr Pro Ile Gln Arg Ile Val Leu
35 40 45
Ser Gly Glu Asn Gly Leu Lys Ile Asp Ile His Val Ile Ile Pro Tyr
50 55 60
Glu Gly Leu Ser Gly Asp Gln Met Gly Gln Ile Glu Lys Ile Phe Lys
65 70 75 80
Val Val Tyr Pro Val Asp Asp His His Phe Lys Val Ile Leu His Tyr
85 90 95
Gly Thr Leu Val Ile Asp Gly Val Thr Pro Asn Met Ile Asp Tyr Phe
100 105 110
Gly Arg Pro Tyr Glu Gly Ile Ala Val Phe Asp Gly Lys Lys Ile Thr
115 120 125
Val Thr Gly Thr Leu Trp Asn Gly Asn Lys Ile Ile Asp Glu Arg Leu
130 135 140
Ile Asn Pro Asp Gly Ser Leu Leu Phe Arg Val Thr Ile Asn Gly Val
145 150 155 160
Thr Gly Trp Arg Leu Cys Glu Arg Ile Leu Ala Ser Gly Gly Ser Gly
165 170 175
Gly Ser Gly Met Lys Pro Val Thr Leu Tyr Asp Val Ala Glu Tyr Ala
180 185 190
Gly Val Ser Tyr Gln Thr Val Ser Arg Val Val Asn Gln Ala Ser His
195 200 205
Val Ser Ala Lys Thr Arg Glu Lys Val Glu Ala Ala Met Ala Glu Leu
210 215 220
Asn Tyr Ile Pro Asn Arg Val Ala Gln Gln Leu Ala Gly Lys Gln Ser
225 230 235 240
Leu Arg Ser Ile Ala Thr Arg Ser His Thr Leu Tyr Ala Pro Gly Gly
245 250 255
Tyr Asp Ile Met Gly Tyr Leu Ile Gln Ile Met Lys Arg Pro Asn Pro
260 265 270
Gln Val Glu Leu Gly Pro Val Asp Thr Ser Val Ala Leu Ile Leu Cys
275 280 285
Asp Leu Lys Gln Lys Asp Thr Pro Ile Val Tyr Ala Ser Glu Ala Phe
290 295 300
Leu Tyr Met Thr Gly Tyr Ser Asn Ala Glu Val Leu Gly Arg Asn Cys
305 310 315 320
Arg Phe Leu Gln Ser Pro Asp Gly Met Val Lys Pro Lys Ser Thr Arg
325 330 335
Lys Tyr Val Asp Ser Asn Thr Ile Asn Thr Met Arg Lys Ala Ile Asp
340 345 350
Arg Asn Ala Glu Val Gln Val Glu Val Val Asn Phe Lys Lys Asn Gly
355 360 365
Gln Arg Phe Val Asn Phe Leu Thr Met Ile Pro Val Arg Asp Glu Thr
370 375 380
Gly Glu Tyr Arg Tyr Ser Met Gly Phe Gln Cys Glu Thr Glu Leu Gln
385 390 395 400
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Glu Phe Gln Tyr Leu Pro Asp
405 410 415
Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg Lys Arg Thr Tyr Glu
420 425 430
Thr Phe Lys Ser Ile Met Lys Lys Ser Pro Phe Ser Gly Pro Thr Asp
435 440 445
Pro Arg Pro Pro Pro Arg Arg Ile Ala Val Pro Ser Arg Ser Ser Ala
450 455 460
Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser Leu
465 470 475 480
Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly
485 490 495
Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu
500 505 510
Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu
515 520 525
Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln
530 535 540
Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr
545 550 555 560
Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly
565 570 575
Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala
580 585 590
Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro
595 600 605
Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala
610 615 620
Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro
625 630 635 640
Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp
645 650 655
Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser
660 665 670
Gln Ile Ser Ser Asp Tyr Lys Asp Asp Asp Asp Lys
675 680
<210> 30
<211> 685
<212> PRT
<213> Synthetic Sequence
<400> 30
Met Val Phe Thr Leu Glu Asp Phe Val Gly Asp Trp Arg Gln Thr Ala
1 5 10 15
Gly Tyr Asn Leu Asp Gln Val Leu Glu Gln Gly Gly Val Ser Ser Leu
20 25 30
Phe Gln Asn Leu Gly Val Ser Val Thr Pro Ile Gln Arg Ile Val Leu
35 40 45
Ser Gly Glu Asn Gly Leu Lys Ile Asp Ile His Val Ile Ile Pro Tyr
50 55 60
Glu Gly Leu Ser Gly Asp Gln Met Gly Gln Ile Glu Lys Ile Phe Lys
65 70 75 80
Val Val Tyr Pro Val Asp Asp His His Phe Lys Val Ile Leu His Tyr
85 90 95
Gly Thr Leu Val Ile Asp Gly Val Thr Pro Asn Met Ile Asp Tyr Phe
100 105 110
Gly Arg Pro Tyr Glu Gly Ile Ala Val Phe Asp Gly Lys Lys Ile Thr
115 120 125
Val Thr Gly Thr Leu Trp Asn Gly Asn Lys Ile Ile Asp Glu Arg Leu
130 135 140
Ile Asn Pro Asp Gly Ser Leu Leu Phe Arg Val Thr Ile Asn Gly Val
145 150 155 160
Thr Gly Trp Arg Leu Cys Glu Arg Ile Leu Ala Ser Gly Gly Ser Gly
165 170 175
Gly Ser Gly Met Ser Arg Leu Asp Lys Ser Lys Val Ile Asn Ser Ala
180 185 190
Leu Glu Leu Leu Asn Glu Val Gly Ile Glu Gly Leu Thr Thr Arg Lys
195 200 205
Leu Ala Gln Lys Leu Gly Val Glu Gln Pro Thr Leu Tyr Trp His Val
210 215 220
Lys Asn Lys Arg Ala Leu Leu Asp Ala Leu Ala Ile Glu Met Leu Asp
225 230 235 240
Arg His Arg Ser Ile Ala Thr Arg Ser His Thr Leu Tyr Ala Pro Gly
245 250 255
Gly Tyr Asp Ile Met Gly Tyr Leu Ile Gln Ile Met Lys Arg Pro Asn
260 265 270
Pro Gln Val Glu Leu Gly Pro Val Asp Thr Ser Val Ala Leu Ile Leu
275 280 285
Cys Asp Leu Lys Gln Lys Asp Thr Pro Ile Val Tyr Ala Ser Glu Ala
290 295 300
Phe Leu Tyr Met Thr Gly Tyr Ser Asn Ala Glu Val Leu Gly Arg Asn
305 310 315 320
Cys Arg Phe Leu Gln Ser Pro Asp Gly Met Val Lys Pro Lys Ser Thr
325 330 335
Arg Lys Tyr Val Asp Ser Asn Thr Ile Asn Thr Met Arg Lys Ala Ile
340 345 350
Asp Arg Asn Ala Glu Val Gln Val Glu Val Val Asn Phe Lys Lys Asn
355 360 365
Gly Gln Arg Phe Val Asn Phe Leu Thr Met Ile Pro Val Arg Asp Glu
370 375 380
Thr Gly Glu Tyr Arg Tyr Ser Met Gly Phe Gln Cys Glu Thr Glu Leu
385 390 395 400
Gln Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Glu Phe Gln Tyr Leu Pro
405 410 415
Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg Lys Arg Thr Tyr
420 425 430
Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro Phe Ser Gly Pro Thr
435 440 445
Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val Pro Ser Arg Ser Ser
450 455 460
Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser
465 470 475 480
Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr Met Val Phe Pro Ser
485 490 495
Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val
500 505 510
Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala
515 520 525
Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro
530 535 540
Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly
545 550 555 560
Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu
565 570 575
Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu
580 585 590
Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile
595 600 605
Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu
610 615 620
Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala
625 630 635 640
Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly
645 650 655
Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu
660 665 670
Ser Gln Ile Ser Ser Asp Tyr Lys Asp Asp Asp Asp Lys
675 680 685
<210> 31
<211> 724
<212> PRT
<213> Synthetic Sequence
<400> 31
Met Val Phe Thr Leu Glu Asp Phe Val Gly Asp Trp Arg Gln Thr Ala
1 5 10 15
Gly Tyr Asn Leu Asp Gln Val Leu Glu Gln Gly Gly Val Ser Ser Leu
20 25 30
Phe Gln Asn Leu Gly Val Ser Val Thr Pro Ile Gln Arg Ile Val Leu
35 40 45
Ser Gly Glu Asn Gly Leu Lys Ile Asp Ile His Val Ile Ile Pro Tyr
50 55 60
Glu Gly Leu Ser Gly Asp Gln Met Gly Gln Ile Glu Lys Ile Phe Lys
65 70 75 80
Val Val Tyr Pro Val Asp Asp His His Phe Lys Val Ile Leu His Tyr
85 90 95
Gly Thr Leu Val Ile Asp Gly Val Thr Pro Asn Met Ile Asp Tyr Phe
100 105 110
Gly Arg Pro Tyr Glu Gly Ile Ala Val Phe Asp Gly Lys Lys Ile Thr
115 120 125
Val Thr Gly Thr Leu Trp Asn Gly Asn Lys Ile Ile Asp Glu Arg Leu
130 135 140
Ile Asn Pro Asp Gly Ser Leu Leu Phe Arg Val Thr Ile Asn Gly Val
145 150 155 160
Thr Gly Trp Arg Leu Cys Glu Arg Ile Leu Ala Ser Gly Gly Ser Gly
165 170 175
Gly Ser Gly Met Ser Thr Lys Lys Lys Pro Leu Thr Gln Glu Gln Leu
180 185 190
Glu Asp Ala Arg Arg Leu Lys Ala Ile Tyr Glu Lys Lys Lys Asn Glu
195 200 205
Leu Gly Leu Ser Gln Glu Ser Val Ala Asp Lys Met Gly Met Gly Gln
210 215 220
Ser Gly Val Gly Ala Leu Phe Asn Gly Ile Asn Ala Leu Asn Ala Tyr
225 230 235 240
Asn Ala Ala Leu Leu Ala Lys Ile Leu Lys Val Ser Val Glu Glu Phe
245 250 255
Ser Pro Ser Ile Ala Arg Glu Ile Tyr Glu Met Tyr Glu Ala Val Ser
260 265 270
Met Gln Pro Ser Leu Arg Ser Glu Tyr Arg Ser Ile Ala Thr Arg Ser
275 280 285
His Thr Leu Tyr Ala Pro Gly Gly Tyr Asp Ile Met Gly Tyr Leu Ile
290 295 300
Gln Ile Met Lys Arg Pro Asn Pro Gln Val Glu Leu Gly Pro Val Asp
305 310 315 320
Thr Ser Val Ala Leu Ile Leu Cys Asp Leu Lys Gln Lys Asp Thr Pro
325 330 335
Ile Val Tyr Ala Ser Glu Ala Phe Leu Tyr Met Thr Gly Tyr Ser Asn
340 345 350
Ala Glu Val Leu Gly Arg Asn Cys Arg Phe Leu Gln Ser Pro Asp Gly
355 360 365
Met Val Lys Pro Lys Ser Thr Arg Lys Tyr Val Asp Ser Asn Thr Ile
370 375 380
Asn Thr Met Arg Lys Ala Ile Asp Arg Asn Ala Glu Val Gln Val Glu
385 390 395 400
Val Val Asn Phe Lys Lys Asn Gly Gln Arg Phe Val Asn Phe Leu Thr
405 410 415
Met Ile Pro Val Arg Asp Glu Thr Gly Glu Tyr Arg Tyr Ser Met Gly
420 425 430
Phe Gln Cys Glu Thr Glu Leu Gln Tyr Pro Tyr Asp Val Pro Asp Tyr
435 440 445
Ala Glu Phe Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu
450 455 460
Glu Lys Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys
465 470 475 480
Ser Pro Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile
485 490 495
Ala Val Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln
500 505 510
Pro Tyr Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe
515 520 525
Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu
530 535 540
Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro
545 550 555 560
Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro
565 570 575
Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys
580 585 590
Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu
595 600 605
Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp
610 615 620
Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln
625 630 635 640
Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro
645 650 655
Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala
660 665 670
Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu
675 680 685
Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp
690 695 700
Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Asp Tyr Lys Asp
705 710 715 720
Asp Asp Asp Lys
<210> 32
<211> 681
<212> PRT
<213> Synthetic Sequence
<400> 32
Met Val Phe Thr Leu Glu Asp Phe Val Gly Asp Trp Arg Gln Thr Ala
1 5 10 15
Gly Tyr Asn Leu Asp Gln Val Leu Glu Gln Gly Gly Val Ser Ser Leu
20 25 30
Phe Gln Asn Leu Gly Val Ser Val Thr Pro Ile Gln Arg Ile Val Leu
35 40 45
Ser Gly Glu Asn Gly Leu Lys Ile Asp Ile His Val Ile Ile Pro Tyr
50 55 60
Glu Gly Leu Ser Gly Asp Gln Met Gly Gln Ile Glu Lys Ile Phe Lys
65 70 75 80
Val Val Tyr Pro Val Asp Asp His His Phe Lys Val Ile Leu His Tyr
85 90 95
Gly Thr Leu Val Ile Asp Gly Val Thr Pro Asn Met Ile Asp Tyr Phe
100 105 110
Gly Arg Pro Tyr Glu Gly Ile Ala Val Phe Asp Gly Lys Lys Ile Thr
115 120 125
Val Thr Gly Thr Leu Trp Asn Gly Asn Lys Ile Ile Asp Glu Arg Leu
130 135 140
Ile Asn Pro Asp Gly Ser Leu Leu Phe Arg Val Thr Ile Asn Gly Val
145 150 155 160
Thr Gly Trp Arg Leu Cys Glu Arg Ile Leu Ala Ser Gly Gly Ser Gly
165 170 175
Gly Ser Gly Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile
180 185 190
Cys Arg Leu Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala
195 200 205
Lys Cys Leu Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys
210 215 220
Arg Ser Pro Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu
225 230 235 240
Glu Arg Leu Glu Arg Ser Ile Ala Thr Arg Ser Phe Leu Ala Thr Thr
245 250 255
Leu Glu Arg Ile Glu Lys Asn Phe Val Ile Thr Asp Pro Arg Leu Pro
260 265 270
Asp Asn Pro Ile Ile Phe Ala Ser Asp Ser Phe Leu Gln Leu Thr Glu
275 280 285
Tyr Ser Arg Glu Glu Ile Leu Gly Arg Asn Cys Arg Phe Leu Gln Gly
290 295 300
Pro Glu Thr Asp Arg Ala Thr Val Arg Lys Ile Arg Asp Ala Ile Asp
305 310 315 320
Asn Gln Thr Glu Val Thr Val Gln Leu Ile Asn Tyr Thr Lys Ser Gly
325 330 335
Lys Lys Phe Trp Asn Leu Phe His Leu Gln Pro Met Arg Asp Gln Lys
340 345 350
Gly Asp Val Gln Tyr Phe Ile Gly Val Gln Leu Asp Gly Thr Glu His
355 360 365
Val Arg Asp Ala Ala Glu Arg Glu Gly Val Met Leu Ile Lys Lys Thr
370 375 380
Ala Glu Asn Ile Asp Glu Ala Ala Lys Glu Leu Leu Gln Tyr Pro Tyr
385 390 395 400
Asp Val Pro Asp Tyr Ala Glu Phe Gln Tyr Leu Pro Asp Thr Asp Asp
405 410 415
Arg His Arg Ile Glu Glu Lys Arg Lys Arg Thr Tyr Glu Thr Phe Lys
420 425 430
Ser Ile Met Lys Lys Ser Pro Phe Ser Gly Pro Thr Asp Pro Arg Pro
435 440 445
Pro Pro Arg Arg Ile Ala Val Pro Ser Arg Ser Ser Ala Ser Val Pro
450 455 460
Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser Leu Ser Thr Ile
465 470 475 480
Asn Tyr Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser
485 490 495
Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala
500 505 510
Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala
515 520 525
Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala
530 535 540
Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu
545 550 555 560
Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu
565 570 575
Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp
580 585 590
Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro
595 600 605
His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg
610 615 620
Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu
625 630 635 640
Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe
645 650 655
Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser
660 665 670
Ser Asp Tyr Lys Asp Asp Asp Asp Lys
675 680
<210> 33
<211> 650
<212> PRT
<213> Synthetic Sequence
<400> 33
Met Val Phe Thr Leu Glu Asp Phe Val Gly Asp Trp Arg Gln Thr Ala
1 5 10 15
Gly Tyr Asn Leu Asp Gln Val Leu Glu Gln Gly Gly Val Ser Ser Leu
20 25 30
Phe Gln Asn Leu Gly Val Ser Val Thr Pro Ile Gln Arg Ile Val Leu
35 40 45
Ser Gly Glu Asn Gly Leu Lys Ile Asp Ile His Val Ile Ile Pro Tyr
50 55 60
Glu Gly Leu Ser Gly Asp Gln Met Gly Gln Ile Glu Lys Ile Phe Lys
65 70 75 80
Val Val Tyr Pro Val Asp Asp His His Phe Lys Val Ile Leu His Tyr
85 90 95
Gly Thr Leu Val Ile Asp Gly Val Thr Pro Asn Met Ile Asp Tyr Phe
100 105 110
Gly Arg Pro Tyr Glu Gly Ile Ala Val Phe Asp Gly Lys Lys Ile Thr
115 120 125
Val Thr Gly Thr Leu Trp Asn Gly Asn Lys Ile Ile Asp Glu Arg Leu
130 135 140
Ile Asn Pro Asp Gly Ser Leu Leu Phe Arg Val Thr Ile Asn Gly Val
145 150 155 160
Thr Gly Trp Arg Leu Cys Glu Arg Ile Leu Ala Ser Gly Gly Ser Gly
165 170 175
Gly Ser Gly Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile
180 185 190
Cys Arg Leu Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala
195 200 205
Lys Cys Leu Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys
210 215 220
Arg Ser Pro Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu
225 230 235 240
Glu Arg Leu Glu Arg Ser Ile Ala Thr Arg Ser Gln Asn Phe Val Ile
245 250 255
Thr Asp Ala Ser Leu Pro Asp Asn Pro Ile Val Tyr Ala Ser Arg Gly
260 265 270
Phe Leu Thr Leu Thr Gly Tyr Ser Leu Asp Gln Ile Leu Gly Arg Asn
275 280 285
Cys Arg Phe Leu Gln Gly Pro Glu Thr Asp Pro Arg Ala Val Asp Lys
290 295 300
Ile Arg Asn Ala Ile Thr Lys Gly Val Asp Thr Ser Val Cys Leu Leu
305 310 315 320
Asn Tyr Arg Gln Asp Gly Thr Thr Phe Trp Asn Leu Phe Phe Val Ala
325 330 335
Gly Leu Arg Asp Ser Lys Gly Asn Ile Val Asn Tyr Val Gly Val Gln
340 345 350
Ser Lys Val Ser Glu Asp Tyr Ala Lys Leu Leu Val Leu Gln Tyr Pro
355 360 365
Tyr Asp Val Pro Asp Tyr Ala Glu Phe Gln Tyr Leu Pro Asp Thr Asp
370 375 380
Asp Arg His Arg Ile Glu Glu Lys Arg Lys Arg Thr Tyr Glu Thr Phe
385 390 395 400
Lys Ser Ile Met Lys Lys Ser Pro Phe Ser Gly Pro Thr Asp Pro Arg
405 410 415
Pro Pro Pro Arg Arg Ile Ala Val Pro Ser Arg Ser Ser Ala Ser Val
420 425 430
Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser Leu Ser Thr
435 440 445
Ile Asn Tyr Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile
450 455 460
Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln
465 470 475 480
Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln
485 490 495
Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val
500 505 510
Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser
515 520 525
Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu
530 535 540
Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val
545 550 555 560
Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala
565 570 575
Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr
580 585 590
Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro
595 600 605
Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp
610 615 620
Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile
625 630 635 640
Ser Ser Asp Tyr Lys Asp Asp Asp Asp Lys
645 650
<210> 34
<211> 506
<212> PRT
<213> Synthetic Sequence
<400> 34
Met Val Phe Thr Leu Glu Asp Phe Val Gly Asp Trp Arg Gln Thr Ala
1 5 10 15
Gly Tyr Asn Leu Asp Gln Val Leu Glu Gln Gly Gly Val Ser Ser Leu
20 25 30
Phe Gln Asn Leu Gly Val Ser Val Thr Pro Ile Gln Arg Ile Val Leu
35 40 45
Ser Gly Glu Asn Gly Leu Lys Ile Asp Ile His Val Ile Ile Pro Tyr
50 55 60
Glu Gly Leu Ser Gly Asp Gln Met Gly Gln Ile Glu Lys Ile Phe Lys
65 70 75 80
Val Val Tyr Pro Val Asp Asp His His Phe Lys Val Ile Leu His Tyr
85 90 95
Gly Thr Leu Val Ile Asp Gly Val Thr Pro Asn Met Ile Asp Tyr Phe
100 105 110
Gly Arg Pro Tyr Glu Gly Ile Ala Val Phe Asp Gly Lys Lys Ile Thr
115 120 125
Val Thr Gly Thr Leu Trp Asn Gly Asn Lys Ile Ile Asp Glu Arg Leu
130 135 140
Ile Asn Pro Asp Gly Ser Leu Leu Phe Arg Val Thr Ile Asn Gly Val
145 150 155 160
Thr Gly Trp Arg Leu Cys Glu Arg Ile Leu Ala Ser Gly Gly Ser Gly
165 170 175
Gly Ser Gly Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile
180 185 190
Cys Arg Leu Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala
195 200 205
Lys Cys Leu Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys
210 215 220
Arg Ser Pro Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu
225 230 235 240
Glu Arg Leu Glu Arg Ser Ile Ala Thr Arg Ser His Thr Leu Tyr Ala
245 250 255
Pro Gly Gly Tyr Asp Ile Met Gly Tyr Leu Ile Gln Ile Met Lys Arg
260 265 270
Pro Asn Pro Gln Val Glu Leu Gly Pro Val Asp Thr Ser Val Ala Leu
275 280 285
Ile Leu Cys Asp Leu Lys Gln Lys Asp Thr Pro Ile Val Tyr Ala Ser
290 295 300
Glu Ala Phe Leu Tyr Met Thr Gly Tyr Ser Asn Ala Glu Val Leu Gly
305 310 315 320
Arg Asn Cys Arg Phe Leu Gln Ser Pro Asp Gly Met Val Lys Pro Lys
325 330 335
Ser Thr Arg Lys Tyr Val Asp Ser Asn Thr Ile Asn Thr Met Arg Lys
340 345 350
Ala Ile Asp Arg Asn Ala Glu Val Gln Val Glu Val Val Asn Phe Lys
355 360 365
Lys Asn Gly Gln Arg Phe Val Asn Phe Leu Thr Met Ile Pro Val Arg
370 375 380
Asp Glu Thr Gly Glu Tyr Arg Tyr Ser Met Gly Phe Gln Cys Glu Thr
385 390 395 400
Glu Leu Gln Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Glu Phe Gly Gly
405 410 415
Thr Arg Ala Pro Pro Thr Asp Val Ser Leu Gly Asp Glu Leu His Leu
420 425 430
Asp Gly Glu Asp Val Ala Met Ala His Ala Asp Ala Leu Asp Asp Phe
435 440 445
Asp Leu Asp Met Leu Gly Asp Gly Asp Ser Pro Gly Pro Gly Phe Thr
450 455 460
Pro His Asp Ser Ala Pro Tyr Gly Ala Leu Asp Met Ala Asp Phe Glu
465 470 475 480
Phe Glu Gln Met Phe Thr Asp Ala Leu Gly Ile Asp Glu Tyr Gly Gly
485 490 495
Thr Gly Asp Tyr Lys Asp Asp Asp Asp Lys
500 505
<210> 35
<211> 543
<212> PRT
<213> Synthetic Sequence
<400> 35
Met Val Phe Thr Leu Glu Asp Phe Val Gly Asp Trp Arg Gln Thr Ala
1 5 10 15
Gly Tyr Asn Leu Asp Gln Val Leu Glu Gln Gly Gly Val Ser Ser Leu
20 25 30
Phe Gln Asn Leu Gly Val Ser Val Thr Pro Ile Gln Arg Ile Val Leu
35 40 45
Ser Gly Glu Asn Gly Leu Lys Ile Asp Ile His Val Ile Ile Pro Tyr
50 55 60
Glu Gly Leu Ser Gly Asp Gln Met Gly Gln Ile Glu Lys Ile Phe Lys
65 70 75 80
Val Val Tyr Pro Val Asp Asp His His Phe Lys Val Ile Leu His Tyr
85 90 95
Gly Thr Leu Val Ile Asp Gly Val Thr Pro Asn Met Ile Asp Tyr Phe
100 105 110
Gly Arg Pro Tyr Glu Gly Ile Ala Val Phe Asp Gly Lys Lys Ile Thr
115 120 125
Val Thr Gly Thr Leu Trp Asn Gly Asn Lys Ile Ile Asp Glu Arg Leu
130 135 140
Ile Asn Pro Asp Gly Ser Leu Leu Phe Arg Val Thr Ile Asn Gly Val
145 150 155 160
Thr Gly Trp Arg Leu Cys Glu Arg Ile Leu Ala Ser Gly Gly Ser Gly
165 170 175
Gly Ser Gly Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile
180 185 190
Cys Arg Leu Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala
195 200 205
Lys Cys Leu Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys
210 215 220
Arg Ser Pro Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu
225 230 235 240
Glu Arg Leu Glu Arg Ser Ile Ala Thr Arg Ser His Thr Leu Tyr Ala
245 250 255
Pro Gly Gly Tyr Asp Ile Met Gly Tyr Leu Ile Gln Ile Met Lys Arg
260 265 270
Pro Asn Pro Gln Val Glu Leu Gly Pro Val Asp Thr Ser Val Ala Leu
275 280 285
Ile Leu Cys Asp Leu Lys Gln Lys Asp Thr Pro Ile Val Tyr Ala Ser
290 295 300
Glu Ala Phe Leu Tyr Met Thr Gly Tyr Ser Asn Ala Glu Val Leu Gly
305 310 315 320
Arg Asn Cys Arg Phe Leu Gln Ser Pro Asp Gly Met Val Lys Pro Lys
325 330 335
Ser Thr Arg Lys Tyr Val Asp Ser Asn Thr Ile Asn Thr Met Arg Lys
340 345 350
Ala Ile Asp Arg Asn Ala Glu Val Gln Val Glu Val Val Asn Phe Lys
355 360 365
Lys Asn Gly Gln Arg Phe Val Asn Phe Leu Thr Met Ile Pro Val Arg
370 375 380
Asp Glu Thr Gly Glu Tyr Arg Tyr Ser Met Gly Phe Gln Cys Glu Thr
385 390 395 400
Glu Leu Gln Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Glu Phe Asp Gly
405 410 415
Gly Gly Ala Leu Ser Pro Gln His Ser Ala Val Thr Gln Gly Ser Ile
420 425 430
Ile Lys Asn Lys Glu Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser
435 440 445
Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu
450 455 460
Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Val Tyr Arg Asn Val
465 470 475 480
Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr
485 490 495
Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu
500 505 510
Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu Thr Ala
515 520 525
Phe Glu Ile Lys Ser Ser Val Asp Tyr Lys Asp Asp Asp Asp Lys
530 535 540
<210> 36
<211> 516
<212> PRT
<213> Synthetic Sequence
<400> 36
Ser Gly Gly Ser Gly Gly Ser Gly Met Lys Leu Leu Ser Ser Ile Glu
1 5 10 15
Gln Ala Cys Asp Ile Cys Arg Leu Lys Lys Leu Lys Cys Ser Lys Glu
20 25 30
Lys Pro Lys Cys Ala Lys Cys Leu Lys Asn Asn Trp Glu Cys Arg Tyr
35 40 45
Ser Pro Lys Thr Lys Arg Ser Pro Leu Thr Arg Ala His Leu Thr Glu
50 55 60
Val Glu Ser Arg Leu Glu Arg Leu Glu Arg Ser Ile Ala Thr Arg Ser
65 70 75 80
His Thr Leu Tyr Ala Pro Gly Gly Tyr Asp Ile Met Gly Tyr Leu Ile
85 90 95
Gln Ile Met Asn Arg Pro Asn Pro Gln Val Glu Leu Gly Pro Val Asp
100 105 110
Thr Ser Val Ala Leu Ile Leu Cys Asp Leu Lys Gln Lys Asp Thr Pro
115 120 125
Ile Val Tyr Ala Ser Glu Ala Phe Leu Tyr Met Thr Gly Tyr Ser Asn
130 135 140
Ala Glu Val Leu Gly Arg Asn Cys Arg Phe Leu Gln Ser Pro Asp Gly
145 150 155 160
Met Val Lys Pro Lys Ser Thr Arg Lys Tyr Val Asp Ser Asn Thr Ile
165 170 175
Asn Thr Met Arg Lys Ala Ile Asp Arg Asn Ala Glu Val Gln Val Glu
180 185 190
Val Val Asn Phe Lys Lys Asn Gly Gln Arg Phe Val Asn Phe Leu Thr
195 200 205
Met Ile Pro Val Arg Asp Glu Thr Gly Glu Tyr Arg Tyr Ser Met Gly
210 215 220
Phe Gln Cys Glu Thr Glu Leu Gln Tyr Pro Tyr Asp Val Pro Asp Tyr
225 230 235 240
Ala Glu Phe Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu
245 250 255
Glu Lys Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys
260 265 270
Ser Pro Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile
275 280 285
Ala Val Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln
290 295 300
Pro Tyr Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe
305 310 315 320
Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu
325 330 335
Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro
340 345 350
Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro
355 360 365
Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys
370 375 380
Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu
385 390 395 400
Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp
405 410 415
Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln
420 425 430
Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro
435 440 445
Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala
450 455 460
Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu
465 470 475 480
Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp
485 490 495
Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Asp Tyr Lys Asp
500 505 510
Asp Asp Asp Lys
515
<210> 37
<211> 687
<212> PRT
<213> Synthetic Sequence
<400> 37
Met Val Phe Thr Leu Glu Asp Phe Val Gly Asp Trp Arg Gln Thr Ala
1 5 10 15
Gly Tyr Asn Leu Asp Gln Val Leu Glu Gln Gly Gly Val Ser Ser Leu
20 25 30
Phe Gln Asn Leu Gly Val Ser Val Thr Pro Ile Gln Arg Ile Val Leu
35 40 45
Ser Gly Glu Asn Gly Leu Lys Ile Asp Ile His Val Ile Ile Pro Tyr
50 55 60
Glu Gly Leu Ser Gly Asp Gln Met Gly Gln Ile Glu Lys Ile Phe Lys
65 70 75 80
Val Val Tyr Pro Val Asp Asp His His Phe Lys Val Ile Leu His Tyr
85 90 95
Gly Thr Leu Val Ile Asp Gly Val Thr Pro Asn Met Ile Asp Tyr Phe
100 105 110
Gly Arg Pro Tyr Glu Gly Ile Ala Val Phe Asp Gly Lys Lys Ile Thr
115 120 125
Val Thr Gly Thr Leu Trp Asn Gly Asn Lys Ile Ile Asp Glu Arg Leu
130 135 140
Ile Asn Pro Asp Gly Ser Leu Leu Phe Arg Val Thr Ile Asn Gly Val
145 150 155 160
Thr Gly Trp Arg Leu Cys Glu Arg Ile Leu Ala Ser Gly Gly Ser Gly
165 170 175
Gly Ser Gly Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile
180 185 190
Cys Arg Leu Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala
195 200 205
Lys Cys Leu Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys
210 215 220
Arg Ser Pro Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu
225 230 235 240
Glu Arg Leu Glu Arg Ser Ile Ala Thr Arg Ser His Thr Leu Tyr Ala
245 250 255
Pro Gly Gly Tyr Asp Ile Met Gly Tyr Leu Ile Gln Ile Met Lys Arg
260 265 270
Pro Asn Pro Gln Val Glu Leu Gly Pro Val Asp Thr Ser Cys Ala Leu
275 280 285
Ile Leu Cys Asp Leu Lys Gln Lys Asp Thr Pro Ile Val Tyr Ala Ser
290 295 300
Glu Ala Phe Leu Tyr Met Thr Gly Tyr Ser Asn Ala Glu Val Leu Gly
305 310 315 320
Arg Asn Cys Arg Phe Leu Gln Ser Pro Asp Gly Met Val Lys Pro Lys
325 330 335
Ser Thr Arg Lys Tyr Val Asp Ser Asn Thr Ile Asn Thr Met Arg Lys
340 345 350
Ala Ile Asp Arg Asn Ala Glu Val Gln Val Glu Val Val Asn Phe Lys
355 360 365
Lys Asn Gly Gln Arg Phe Val Asn Phe Leu Thr Met Ile Pro Val Arg
370 375 380
Asp Glu Thr Gly Glu Tyr Arg Tyr Ser Met Gly Phe Gln Cys Glu Thr
385 390 395 400
Glu Leu Gln Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Glu Phe Gln Tyr
405 410 415
Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg Lys Arg
420 425 430
Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro Phe Ser Gly
435 440 445
Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val Pro Ser Arg
450 455 460
Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr
465 470 475 480
Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr Met Val Phe
485 490 495
Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro
500 505 510
Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val
515 520 525
Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly
530 535 540
Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly
545 550 555 560
Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu
565 570 575
Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr
580 585 590
Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln
595 600 605
Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr
610 615 620
Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp
625 630 635 640
Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu
645 650 655
Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala
660 665 670
Leu Leu Ser Gln Ile Ser Ser Asp Tyr Lys Asp Asp Asp Asp Lys
675 680 685
<210> 38
<211> 687
<212> PRT
<213> Synthetic Sequence
<400> 38
Met Val Phe Thr Leu Glu Asp Phe Val Gly Asp Trp Arg Gln Thr Ala
1 5 10 15
Gly Tyr Asn Leu Asp Gln Val Leu Glu Gln Gly Gly Val Ser Ser Leu
20 25 30
Phe Gln Asn Leu Gly Val Ser Val Thr Pro Ile Gln Arg Ile Val Leu
35 40 45
Ser Gly Glu Asn Gly Leu Lys Ile Asp Ile His Val Ile Ile Pro Tyr
50 55 60
Glu Gly Leu Ser Gly Asp Gln Met Gly Gln Ile Glu Lys Ile Phe Lys
65 70 75 80
Val Val Tyr Pro Val Asp Asp His His Phe Lys Val Ile Leu His Tyr
85 90 95
Gly Thr Leu Val Ile Asp Gly Val Thr Pro Asn Met Ile Asp Tyr Phe
100 105 110
Gly Arg Pro Tyr Glu Gly Ile Ala Val Phe Asp Gly Lys Lys Ile Thr
115 120 125
Val Thr Gly Thr Leu Trp Asn Gly Asn Lys Ile Ile Asp Glu Arg Leu
130 135 140
Ile Asn Pro Asp Gly Ser Leu Leu Phe Arg Val Thr Ile Asn Gly Val
145 150 155 160
Thr Gly Trp Arg Leu Cys Glu Arg Ile Leu Ala Ser Gly Gly Ser Gly
165 170 175
Gly Ser Gly Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile
180 185 190
Cys Arg Leu Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala
195 200 205
Lys Cys Leu Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys
210 215 220
Arg Ser Pro Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu
225 230 235 240
Glu Arg Leu Glu Arg Ser Ile Ala Thr Arg Ser His Thr Leu Tyr Ala
245 250 255
Pro Gly Gly Tyr Asp Ile Met Gly Trp Leu Ile Gln Ile Met Asn Arg
260 265 270
Pro Asn Pro Gln Val Glu Leu Gly Pro Val Asp Thr Ser Cys Ala Leu
275 280 285
Ile Leu Cys Asp Leu Lys Gln Lys Asp Thr Pro Ile Val Tyr Ala Ser
290 295 300
Glu Ala Phe Leu Tyr Met Thr Gly Tyr Ser Asn Ala Glu Val Leu Gly
305 310 315 320
Arg Asn Cys Arg Phe Leu Gln Ser Pro Asp Gly Met Val Lys Pro Lys
325 330 335
Ser Thr Arg Lys Tyr Val Asp Ser Asn Thr Ile Asn Thr Met Arg Lys
340 345 350
Ala Ile Asp Arg Asn Ala Glu Val Gln Val Glu Val Val Asn Phe Lys
355 360 365
Lys Asn Gly Gln Arg Phe Val Asn Phe Leu Thr Met Ile Pro Val Arg
370 375 380
Asp Glu Thr Gly Glu Tyr Arg Tyr Ser Met Gly Phe Gln Cys Glu Thr
385 390 395 400
Glu Leu Gln Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Glu Phe Gln Tyr
405 410 415
Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg Lys Arg
420 425 430
Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro Phe Ser Gly
435 440 445
Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val Pro Ser Arg
450 455 460
Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr
465 470 475 480
Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr Met Val Phe
485 490 495
Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro
500 505 510
Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val
515 520 525
Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly
530 535 540
Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly
545 550 555 560
Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu
565 570 575
Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr
580 585 590
Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln
595 600 605
Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr
610 615 620
Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp
625 630 635 640
Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu
645 650 655
Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala
660 665 670
Leu Leu Ser Gln Ile Ser Ser Asp Tyr Lys Asp Asp Asp Asp Lys
675 680 685
<210> 39
<211> 749
<212> DNA
<213> Synthetic Sequence
<400> 39
tctagacgga gtactgtcct ccgagcggag tactgtcctc cgactcgagc ggagtactgt 60
cctccgatcg gagtactgtc ctccgcgaat tccggagtac tgtcctccga agacgctagc 120
ggggggctat aaaagggggt gggggcgttc gtcctcactc tagatctgcg atctaagtaa 180
gcttggccac catgggagtc aaagttctgt ttgccctgat ctgcatcgct gtggccgagg 240
ccaagcccac cgagaacaac gaagacttca acatcgtggc cgtggccagc aacttcgcga 300
ccacggatct cgatgctgac cgcgggaagt tgcccggcaa gaagctgccg ctggaggtgc 360
tcaaagagat ggaagccaat gcccggaaag ctggctgcac caggggctgt ctgatctgcc 420
tgtcccacat caagtgcacg cccaagatga agaagttcat cccaggacgc tgccacacct 480
acgaaggcga caaagagtcc gcacagggcg gcataggcga ggcgatcgtc gacattcctg 540
agattcctgg gttcaaggac ttggagccca tggagcagtt catcgcacag gtcgatctgt 600
gtgtggactg cacaactggc tgcctcaaag ggcttgccaa cgtgcagtgt tctgacctgc 660
tcaagaagtg gctgccgcaa cgctgtgcga cctttgccag caagatccag ggccaggtgg 720
acaagatcaa gggggccggt ggtgactaa 749
<210> 40
<211> 911
<212> DNA
<213> Synthetic Sequence
<400> 40
tctagacgga gtactgtcct ccgagcggag tactgtcctc cgactcgagc ggagtactgt 60
cctccgatcg gagtactgtc ctccgcgaat tccggagtac tgtcctccga agacgctagc 120
ggggggctat aaaagggggt gggggcgttc gtcctcactc tagatctgcg atctaagtaa 180
gcttggccac catggtgagc aagcagatcc tgaagaacac cggcctgcag gagatcatga 240
gcttcaaggt gaacctggag ggcgtggtga acaaccacgt gttcaccatg gagggctgcg 300
gcaagggcaa catcctgttc ggcaaccagc tggtgcagat ccgcgtgacc aagggcgccc 360
ccctgccctt cgccttcgac atcctgagcc ccgccttcca gtacggcaac cgcaccttca 420
ccaagtaccc cgaggacatc agcgacttct tcatccagag cttccccgcc ggcttcgtgt 480
acgagcgcac cctgcgctac gaggacggcg gcctggtgga gatccgcagc gacatcaacc 540
tgatcgagga gatgttcgtg taccgcgtgg agtacaaggg ccgcaacttc cccaacgacg 600
gccccgtgat gaagaagacc atcaccggcc tgcagcccag cttcgaggtg gtgtacatga 660
acgacggcgt gctggtgggc caggtgatcc tggtgtaccg cctgaacagc ggcaagttct 720
acagctgcca catgcgcacc ctgatgaaga gcaagggcgt ggtgaaggac ttccccgagt 780
accacttcat ccagcaccgc ctggagaaga cctacgtgga ggacggcggc ttcgtggagc 840
agcacgagac cgccatcgcc cagctgacca gcctgggcaa gcccctgggc agcctgcacg 900
agtgggtgta a 911
<210> 41
<211> 902
<212> DNA
<213> Synthetic Sequence
<400> 41
tctagacgga gtactgtcct ccgagcggag tactgtcctc cgactcgagc ggagtactgt 60
cctccgatcg gagtactgtc ctccgcgaat tccggagtac tgtcctccga agacgctagc 120
ggggggctat aaaagggggt gggggcgttc gtcctcactc tagatctgcg atctaagtaa 180
gcttggccac catggtgagc aagggcgagg aggataacat ggccatcatc aaggagttca 240
tgcgcttcaa ggtgcacatg gagggctccg tgaacggcca cgagttcgag atcgagggcg 300
agggcgaggg ccgcccctac gagggcaccc agaccgccaa gctgaaggtg accaagggtg 360
gccccctgcc cttcgcctgg gacatcctgt cccctcagtt catgtacggc tccaaggcct 420
acgtgaagca ccccgccgac atccccgact acttgaagct gtccttcccc gagggcttca 480
agtgggagcg cgtgatgaac ttcgaggacg gcggcgtggt gaccgtgacc caggactcct 540
ccctgcagga cggcgagttc atctacaagg tgaagctgcg cggcaccaac ttcccctccg 600
acggccccgt aatgcagaag aagaccatgg gctgggaggc ctcctccgag cggatgtacc 660
ccgaggacgg cgccctgaag ggcgagatca agcagaggct gaagctgaag gacggcggcc 720
actacgacgc tgaggtcaag accacctaca aggccaagaa gcccgtgcag ctgcccggcg 780
cctacaacgt caacatcaag ttggacatca cctcccacaa cgaggactac accatcgtgg 840
aacagtacga acgcgccgag ggccgccact ccaccggcgg catggacgag ctgtacaagt 900
ag 902
<210> 42
<211> 524
<212> DNA
<213> Synthetic Sequence
<400> 42
tctagacgga gtactgtcct ccgagcggag tactgtcctc cgactcgagc ggagtactgt 60
cctccgatcg gagtactgtc ctccgcgaat tccggagtac tgtcctccga agacgctagc 120
ggggggctat aaaagggggt gggggcgttc gtcctcactc tagatctgcg atctaagtaa 180
gcttggccac catggccctg tggatgcgct tcctgcccct gctggccctg ctcgtcctct 240
gggagcccaa gcctgcccag gcttttgtca aacagcacct ttgtggtcct cacctggtgg 300
aggctctgta cctggtgtgt ggggaacgtg gtttcttcta cacacccaag tcccgtcgta 360
aaagggagga cccgcaagtg ccacaactgg agctgggtgg aggcccggag gccggggatc 420
ttcagacctt ggcactggag gttgcccggc agaagcgtgg cattgtggat cagtgctgca 480
ccagcatctg ctccctctac caactggaga actactgcaa ctag 524
<210> 43
<211> 19
<212> DNA
<213> Synthetic Sequence
<220>
<221> misc_feature
<222> (5)..(6)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (10)..(10)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (12)..(12)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (14)..(14)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (16)..(16)
<223> n is a, c, g, or t
<400> 43
cggrnnrcyn ynyncnccg 19
<210> 44
<211> 16
<212> DNA
<213> Synthetic Sequence
<220>
<221> misc_feature
<222> (5)..(12)
<223> n is a, c, g, or t
<400> 44
ctgtnnnnnn nnacag 16
<210> 45
<211> 21
<212> DNA
<213> Synthetic Sequence
<400> 45
gaattgtgag cgctcacaat t 21
<210> 46
<211> 19
<212> DNA
<213> Synthetic Sequence
<400> 46
tccctatcag tgatagaga 19
<210> 47
<211> 64
<212> DNA
<213> Synthetic Sequence
<400> 47
tatcaccgca agggataaat atctaacacc gtgcgtgttg actattttac ctctggcggt 60
gata 64

Claims (20)

1.一种光-化学小分子双诱导基因表达系统,包括:a)重组转录因子编码基因,所述重组转录因子包括作为荧光素酶的第一多肽,作为DNA结合结构域的第二多肽、作为光敏结构域的第三多肽和作为转录调节结构域的第四多肽;b)靶转录单元,包括被所述第二多肽识别/结合的至少一个反应元件、被第四多肽调节的启动子和待转录核酸序列。
2.如权利要求1所述的光-化学小分子双诱导基因表达系统,其中所述第一多肽、第二多肽、第三多肽和第四多肽之间可操作性连接,和/或其中反应元件、启动子和待转录核酸序列之间可操作性连接。
3.如权利要求1所述的光-化学小分子双诱导基因表达系统,其中所述第一多肽选自能产生催化反应进而产生生物发光的荧光素酶。所述第一多肽更优地选自来源于深海虾的荧光素酶Nanoluc、来源于海洋珊瑚虫类肠腔动物海肾的荧光素酶Rluc、来源于海洋桡脚类动物的高斯荧光素酶Gluc。
4.如权利要求1所述的光-化学小分子双诱导基因表达系统,其中所述第二多肽选自螺旋-转角-螺旋DNA结合结构域、锌指基序或锌簇DNA结合结构域、亮氨酸拉链DNA结合结构域、翼状螺旋DNA结合结构域、翼状螺旋-转角-螺旋DNA结合结构域、螺旋-环-螺旋DNA结合结构域、高迁移率族DNA结合结构域、B3 DNA结合结构域。
5.如权利要求4所述的光-化学小分子双诱导基因表达系统,其中所述第二多肽选自酵母Gal4 DNA结合结构域、大肠杆菌LexA DNA结合结构域、Lac阻遏蛋白LacI的DNA结合结构域、λ噬菌体cI阻遏蛋白的DNA结合结构域和四环素组合蛋白TetR的DNA结合结构域,及其截短体或/和氨基酸序列同源性80%-99%的突变体。
6.如权利要求1所述的光-化学小分子双诱导基因表达系统,其中所述第三多肽是含黄素类生色团的光敏蛋白的光敏结构域,选自含LOV结构域的光敏蛋白的光敏结构域。所述第三多肽与第一、第二多肽直接或通过接头肽相连。
7.如权利要求6所述的光-化学小分子双诱导基因表达系统,其中所述第三多肽选自粗糙链孢霉菌的VIVID的LOV2结构域、燕麦光敏色素1基因的LOV2结构域AsLOV2和无隔藻金色素蛋白1的LOV结构域AuLOV,及其截短体或氨基酸序列15%-99%相同或氨基酸序列36%-99%相似的突变体。
8.如权利要求1所述的光-化学小分子双诱导基因表达系统,其中所述第四多肽选自富含酸性氨基酸的转录激活结构域、富含脯氨酸的转录激活结构域、富含丝氨酸/苏氨酸的转录激活结构域和富含谷氨酰胺的转录激活结构域,及Kruppel相关盒转录阻遏结构域。
9.如权利要求8所述的光-化学小分子双诱导基因表达系统,其中所述第三多肽选自单纯疱疹病毒颗粒蛋白VP16转录激活结构域、酵母Gal4转录激活结构域、NF-κB p65亚基转录激活结构域、酵母通用控制蛋白4的转录激活结构域和锌指蛋白354A的Kruppel相关盒转录阻遏结构域。
10.如权利要求1所述的光-化学小分子双诱导基因表达系统,其中还包含促进所述重组光敏转录因子向细胞核运输的核定位信号肽第五多肽,所述第五多肽与第一、第二、第三多肽、第四多肽直接或通过接头肽相连。
11.如权利要求1所述的光-化学小分子双诱导基因表达系统,其中所述反应元件为可被所述第二多肽特异性识别和结合的DNA基序,选自Gal4结合元件、LexA结合元件、TetR结合元件、LacI结合元件和cI结合元件。
12.如权利要求1所述的光-化学小分子双诱导基因表达系统,其中所述启动子选自腺病毒晚期启动子、巨细胞病毒CMV最小启动子、酵母Gal1基因的启动子和SV40启动子。
13.含有权利要求1-12之一所述光-化学小分子双诱导基因表达系统中所述第一多肽、第二多肽和第三多肽构成重组光-化学小分子转录因子编码基因和/或所述靶转录单元的真核细胞表达载体。
14.如权利要求13所述的真核表达载体,所述靶转录单元中含有反应元件-启动子但待转录核酸序列空缺。
15.如权利要求13所述的真核表达载体,其中所述光-化学小分子重组转录因子的氨基酸序列选自序列1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17。
16.用权利要求1-12之一所述光-化学小分子双诱导基因表达系统在宿主细胞中调控基因表达的方法,包括步骤:
a)将所述光-化学小分子双诱导基因表达系统构建在真核质粒表达载体中;
b)引入含被调控基因的哺乳动物细胞;和
c)光照或化学分子诱导所述哺乳动物细胞,使所述哺乳动物细胞中的被调控的核苷酸进行表达。
17.如权利要求16所述的调控基因表达的方法,其中还包括光源的选择和照射方法的选择,所述光源包括LED灯、荧光灯、激光和白炽灯,所述照射方法包括持续的光照或不连续的光照,光扫描、投影、光模具、打印的投影胶片、中性灰度片在空间上控制不同位置的细胞的基因表达水平。
18.如权利要求16所述的调控基因表达的方法,其中还包括化学分子的选择,所述化学分子包括被Furimazine对应的第一多肽Nanoluc、腔肠素对应的第一多肽Rluc或Gluc。
19.一种试剂盒,装有权利要求13所述真核表达载体或/和转染了含有所述转录因子的真核表达载体的哺乳动物细胞,及相应的说明书,或/和还装有含反应元件-启动子但待转录核酸序列空缺的靶转录单元的真核表达载体。
20.一种I型糖尿病的基因治疗方法,包括对需要治疗的哺乳动物(包括人)给予权利要求1所述光-化学小分子双诱导基因表达系统进行治疗。
CN202011501880.2A 2020-12-17 2020-12-17 一种新型光-化学小分子双诱导基因表达系统 Pending CN114645065A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011501880.2A CN114645065A (zh) 2020-12-17 2020-12-17 一种新型光-化学小分子双诱导基因表达系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011501880.2A CN114645065A (zh) 2020-12-17 2020-12-17 一种新型光-化学小分子双诱导基因表达系统

Publications (1)

Publication Number Publication Date
CN114645065A true CN114645065A (zh) 2022-06-21

Family

ID=81989852

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011501880.2A Pending CN114645065A (zh) 2020-12-17 2020-12-17 一种新型光-化学小分子双诱导基因表达系统

Country Status (1)

Country Link
CN (1) CN114645065A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102643852A (zh) * 2011-02-28 2012-08-22 华东理工大学 光可控的基因表达系统
CN103031327A (zh) * 2012-08-02 2013-04-10 华东理工大学 原核细菌光诱导基因表达系统及其调控基因表达的方法
US20170122932A1 (en) * 2014-06-10 2017-05-04 Medical & Biological Laboratories Co., Ltd. Method for determining a protein-protein interaction

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102643852A (zh) * 2011-02-28 2012-08-22 华东理工大学 光可控的基因表达系统
CN103031327A (zh) * 2012-08-02 2013-04-10 华东理工大学 原核细菌光诱导基因表达系统及其调控基因表达的方法
US20170122932A1 (en) * 2014-06-10 2017-05-04 Medical & Biological Laboratories Co., Ltd. Method for determining a protein-protein interaction

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CHRISTINA K KIM ET AL.: "Luciferase-LOV BRET enables versatile and specific transcriptional readout of cellular protein-protein interactions", 《ELIFE》, vol. 8, pages 43826 *
TING LI ET AL.: "A synthetic BRET-based optogenetic device for pulsatile transgene expression enabling glucose homeostasis in mice", 《NATURE COMMUNICATIONS》, pages 615 *
XUE WANG ET AL.: "Spatiotemporal control of gene expression by a light-switchable transgene system", 《NATURE METHODS》, pages 266 *
王建华 等: "光诱导RNAi系统的构建及优化", 《华东理工大学学报》, pages 28 - 33 *

Similar Documents

Publication Publication Date Title
JP6140615B2 (ja) 光制御可能な遺伝子発現システム
JP2014509196A5 (zh)
JP5513885B2 (ja) ポリペプチド、および、当該ポリペプチドをコードするポリヌクレオチド、および、虚血に関連する医学的状態の治療におけるそれらの使用
US10221422B2 (en) Blue light-inducible system for gene expression
CN112266411A (zh) 一种新型冠状病毒疫苗及其应用
CA2715080A1 (en) Therapeutic gene-switch constructs and bioreactors for the expression of biotherapeutic molecules, and uses thereof
WO2015086818A1 (en) Optically activated receptors
WO2019109017A1 (en) Light-responsive fusion proteins for controlling binding to targets
Zeng et al. The development of a sensitive fluorescent protein-based transcript reporter for high throughput screening of negative modulators of lncRNAs
Chen et al. A light-switchable bidirectional expression module allowing simultaneous regulation of multiple genes
CN114645065A (zh) 一种新型光-化学小分子双诱导基因表达系统
US10889628B2 (en) Optogenetic inhibition of overactive neuronal activity
Chinenov et al. Isolation of a bi-directional promoter directing expression of the mouse GABPα and ATP synthase coupling factor 6 genes
Inouye Single-step purification of recombinant Gaussia luciferase from serum-containing culture medium of mammalian cells
JP4130955B2 (ja) 有酸素条件下の細胞内でタンパク質を不安定化させるポリペプチドとそれをコードするdna
CN113088532B (zh) 一种红光与远红光调控的基因表达开关及其构建方法和应用
EP3293263A1 (en) Inducible gene expression by linear at-rich dna fragments in mammalian cells and methods relating thereto
Close et al. Mammalian‐based bioreporter targets: Protein expression for bioluminescent and fluorescent detection in the mammalian cellular background
JP7356749B2 (ja) 改変型ルシフェラーゼ
TWI580691B (zh) 源自地毯海葵之藍色螢光蛋白
JP5788160B2 (ja) 特定部位のアミノ酸を置換した緑色蛍光蛋白質又はそのホモログを用いたカルシウムセンサー蛋白質
JP5669080B2 (ja) 特定部位のアミノ酸を置換した緑色蛍光蛋白質またはそのホモログを用いたカルシウムセンサー蛋白質
CN117241819A (zh) 用于蛋白酶报告基因检测方法和蛋白酶报告基因调节剂的方法和组合物
CN115960960A (zh) 一种双启动子真核表达报告质粒及其应用
WO2005090580A1 (ja) 非ヒト動物モデルにおける転写活性測定方法、細胞数の測定方法及び腫瘍体積の測定方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination