CN107430128A

CN107430128A - 配体诱导型多肽耦合器系统

Info

Publication number: CN107430128A
Application number: CN201680020980.9A
Authority: CN
Inventors: D·P·贝德纳利克; C·C·里德; V·库雷拉
Original assignee: University of Pittsburgh
Current assignee: University of Pittsburgh
Priority date: 2015-03-30
Filing date: 2016-03-29
Publication date: 2017-12-01
Also published as: EP3278110A1; WO2016160791A1; KR20180012247A; US20180348231A1; RU2017131505A3; CA2979724A1; SG11201707652WA; HK1248811A1; PH12017501763A1; EP3278110A4; IL254340A0; RU2017131505A; AU2016243464A1; MX2017012455A; JP2018511602A

Abstract

本发明涉及新型配体诱导型多肽耦合系统和调节细胞信号转导通路以及其他胞内和胞外蛋白质‑蛋白质相互作用的方法。

Description

配体诱导型多肽耦合器系统

序列表

本申请包含以ASCII格式电子提交的序列表，并通过引用全文纳入本文。2016年3月24日创建的所述ASCII拷贝命名为0100-0013WO1_SL.txt，大小为192,837字节。

技术领域

本发明的领域是细胞和分子生物学。具体地，本发明的领域是细胞信号传导及其遗传工程改造或修饰的方法。更具体地，本发明涉及新的基于核受体的配体诱导型多肽耦合器以及在宿主细胞中调节蛋白质-蛋白质相互作用的方法。

背景技术

在遗传工程改造和医学领域中，精确控制并调整细胞信号传导通路是有价值并长期寻求的用于研究、操纵和控制发育和其他生理过程(例如，病理状态)的工具。已知信号传导通路调节多种细胞过程和功能，包括增殖、分化和凋亡。可通过多种机制来调节信号转导通路，如翻译后修饰(例如，磷酸化、泛素化等)和蛋白质-蛋白质相互作用。一种激活或调节信号传导通路的常用机制是通过蛋白质-蛋白质相互作用来形成多蛋白质复合物(例如，二聚体、三聚体和寡聚体)。这种复合物可包括相同蛋白的多个拷贝(同源-复合物)或不同蛋白质的拷贝(异源-复合物)。在一些情况下，蛋白质-蛋白质相互作用的诱导和复合物的形成由配体与一种或多种成员蛋白质(例如，受体分子)的结合触发。虽然已经发现并表征了多种这样的细胞信号传导通路，仍然需要能够使用药学上可接受的且可用的激活配体以快速、高效和可靠的方式靶向和操纵这些通路。

与细胞信号传导途径的调节系统的相对稀缺相反，已经开发并采用了通过诱导跨转录因子之间的蛋白质-蛋白质相互作用来调节基因表达的方法。为了触发基因表达，使得其产生作为蛋白质合成中的第一步所必需的RNA，转录激活子必须接近控制基因转录的启动子。通常，转录激活物本身与具有至少一个DNA结合结构域的蛋白质结合，所述结合结构域与存在于基因启动子区域中的DNA结合位点结合。因此，为了发生基因表达，必须将包含DNA结合结构域和位于距离DNA结合结构域适当距离的激活结构域的蛋白质置于基因的启动子区域中的正确位置。

诱导蛋白质-蛋白质相互作用的一种方法依赖于免疫抑制分子如FK506、雷帕霉素和环孢菌素A，其可以结合亲免素、FKBP12、亲环素等。已经设计了一般策略，通过将FK506放置在两个蛋白质的每一个上或通过将FK506置于另一个蛋白上并将环孢素A置于另一个上来将任何两个蛋白质在一起。然后可以使用FK506(FK1012)的合成同二聚体或由FK506-环孢菌素(FKCsA)融合产生的化合物诱导这些分子的二聚化(Spencer等，1993，Science 262：1019-24；Belshaw等，1996 Proc Natl Acad Sci USA 93：4604-7)。与FKBP12融合的Gal4DNA结合结构域和与亲环蛋白融合的VP16激活剂结构域和FKCA化合物用于显示在含有Gal4结合位点的启动子控制下的报告基因的异二聚化和激活。不幸的是，该系统包括可能具有不想要的副作用并因此限制其于各种哺乳动物的应用的免疫抑制剂。

高等真核转录激活系统如类固醇激素受体系统也被用于调节基因表达。类固醇激素受体是核受体超家族的成员，并在脊椎动物和无脊椎动物细胞中发现。不幸的是，使用激活受体以调节基因表达的甾族化合物，特别是在植物和哺乳动物中，受限于它们参与这些生物体中许多其它天然生物学途径。为了克服这些困难，已经使用昆虫蜕皮激素受体(EcR)开发了替代系统。

昆虫中的生长、蜕皮和发育受蜕皮类固醇激素(蜕皮激素)和保幼激素(Dhadialla等，1998，Annu.Rev.Entomol.43：545-569)的调节。蜕皮激素在昆虫中的分子靶标至少包括蜕皮激素受体(EcR)和超气门蛋白(USP)。EcR是核甾体受体超家族成员，表现为特征DNA和配体结合域，以及激活域(Koelle等，1991，Cell，67：59-77)。EcR素受体对许多甾体化合物有响应，例如松甾酮A和莫瑞甾酮A(muristerone A)。还描述了具有蜕皮甾酮激动剂活性的非甾体化合物，包括商业上可得到的杀虫剂虫酰肼和甲氧虫酰肼(参见国际专利申请PCT/EP96/00686和美国专利5,530,028，其各自通过引用全文纳入本文)。两种类似物在其他生物体中都具有卓越的安全性。

昆虫蜕皮激素受体(EcR)与超气门蛋白(USP)(其是哺乳动物类视黄醇X受体(RXR)的昆虫同源物)异二聚化，通过其配体结合结构域结合蜕皮甾醇激素，并且还结合蜕皮激素受体响应元件以激活蜕皮激素反应基因的转录(Riddiford等，2000)。

EcR具有5个模块域，A/B(转活)，C(DNA结合，异源二聚化)，D(铰链，异源二聚化)，E(配体结合，异源二聚化和转活)和F(转活)结构域。这些结构域中的一些，例如A/B、C和E在与其他蛋白融合后保留功能。EcR是核受体超家族的成员，并分为亚类1，H组(本文称为“H组核受体”)。每个组的成员在E(配体结合)结构域中具有40-60％的氨基酸相同性(Laudet等，核受体亚类的统一命名系统(A Unified Nomenclature System for the NuclearReceptor Subfamily)，1999；Cell 97：161-163)。除了蜕皮激素受体外，该核受体亚类1，H组的其他成员包括：普遍存在受体(UR)，孤儿受体1(OR-1)，类固醇激素核受体1(NER-1)，RXR相互作用蛋白-15(RIP-15)，肝x受体β(LXRβ)，类固醇激素受体样蛋白(RLD-1)，肝x受体(LXR)，肝x受体α(LXRα)，法尼酯x受体(FXR)，受体相互作用蛋白14(RIP-14)和法尼醇受体(HRR-1)。

在哺乳动物细胞中，已经证明昆虫蜕皮激素受体(EcR)可以与哺乳动物类视黄醇X受体(RXR)异二聚化，并且可用于以配体依赖的方式调节靶基因的表达。然而，这种表达系统组分的使用尚未被考虑、证明或应用于调节蛋白质-蛋白质相互作用或用于例如调节、控制、诱导或抑制细胞外和细胞内信号转导通路和蛋白质-蛋白关联。

虽然已经开发了其他基因表达系统，但仍然需要通过调节蛋白质-蛋白质相互作用来允许在植物和动物中精确调节细胞信号传导途径的系统。

通过引用，将本文引用的各种发表物的全部内容纳入本文。

发明内容

在一些实施方式中，本发明包含两种多肽，其包含第一非天然存在的多肽和第二非天然存在的多肽，该第一非天然存在的多肽包含核受体蛋白的片段或结构域，该第二非天然存在的多肽包含核受体蛋白的不同片段或结构域，其中第一多肽能够结合激活配体，其中第二多肽能够在激活配体存在下与第一多肽缔合，其中第一和第二多肽中的每一个还包含异源氨基酸或多肽序列，使得激活配体诱导的第一和第二多肽的缔合(association)导致激活的功能、生物或细胞信号转导状态。

在本发明的某些实施方式中，一个或两个核受体蛋白质片段或结构域包含节肢动物核受体氨基酸序列。

在本发明的一些实施方式中，一个或两个核受体蛋白质片段或结构域包含H组核受体氨基酸序列。

在本发明的某些实施方式中，第一多肽的核受体氨基酸序列包含蜕皮激素受体(EcR)配体结合结构域，其多肽片段或取代突变体。

在本发明的一些实施方式中，第二多肽核受体蛋白质片段或结构域包含哺乳动物核受体氨基酸序列。

在本发明的某些实施方式中，哺乳动物核受体蛋白质片段或结构域包含RXR核受体多肽片段或其取代突变体。

在本发明的一些实施方式中，第二多肽核受体蛋白质片段或结构域包含无脊椎动物和哺乳动物核受体氨基酸序列的嵌合体或其取代突变体。

在本发明的某些实施方式中，第二多肽核受体蛋白质片段或结构域包含无脊椎动物USP(RXR同源物)和哺乳动物RXR核受体氨基酸序列的嵌合体或其取代突变体。

在一些实施方式中，本发明包括配体诱导型多肽耦合(LIPC)系统，其包含：a)包含节肢动物核受体蛋白的片段或结构域的第一非天然存在的多肽，和b)包含节肢动物和/或哺乳动物核受体蛋白质的片段或结构域的第二非天然存在的多肽，其中第一和第二多肽包含能够在与激活配体接触后产生激活的功能、生物或细胞信号转导状况的其它异源序列。

在本发明的一些实施方式中，LIPC的一个或两个核受体蛋白质片段或结构域包含H组核受体氨基酸序列。

在本发明的某些实施方式中，LIPC的第一多肽包含蜕皮激素受体(EcR)配体结合结构域，多肽片段或其取代突变体。

在本发明的一些实施方式中，LIPC的第二多肽包含哺乳动物核受体氨基酸序列。

在本发明的某些实施方式中，LIPC的第二多肽包含RXR核受体多肽片段或其取代突变体。

在本发明的一些实施方式中，LIPC的第二多肽包含无脊椎动物和哺乳动物核受体氨基酸序列的嵌合体或其取代突变体。

在本发明的某些实施方式中，LIPC的第二多肽包含无脊椎动物USP(RXR同系物)和哺乳动物RXR核受体氨基酸序列的嵌合体或其取代突变体。

在本发明的一些实施方式中，包括LIPC的本发明的第一和第二多肽的核受体蛋白质片段衍生自选自下组的蜕皮激素受体多肽：云杉卷叶蛾(Choristoneura fumiferana)EcR(“CfEcR”)LBD、黄粉虫(Tenebrio molitor)EcR(“TmEcR”)LBD、烟草天蛾(Manducasexta)EcR(“MsEcR”)LBD、绿棉铃虫(Heliothies virescens)EcR(“HvEcR”)LBD、摇蚊(Chironomus tentans)(“CfEcR”)LBD、家蚕蛾(Bombyx mori)EcR(“BmEcR”)LBD、黑腹果蝇(Drosophila melanogaster)EcR(“DmEcR”)LBD、埃及伊蚊(Aedes aegypti)EcR(“AaEcR”)LBD、绿蝇(Lucilia capitata)EcR(“LcEcR”)LBD、铜绿蝇(Lucilia cuprina)EcR(“LucEcR”)LBD、地中海果蝇(Ceratitis capitata)EcR(“CcEcR”)LBD、飞蝗(Locustamigratoria)EcR(“LmEcR”)LBD、紫堇瘤蚜(Myzus persicae)EcR(“MpEcR”)LBD、招潮蟹(Celuca pugilator)EcR(“CpEcR”)LBD、银液粉虱(Bamecia argentifoli)EcR(BaEcR)LBD、黑尾叶蝉(Nephotetix cincticeps)EcR(NcEcR)LBD、和美洲钝眼蜱(Amblyommaamericanum)EcR(“AmaEcR”)LBD。

在本发明的某些实施方式中，包括LIPC的本发明的第一和第二多肽的核受体蛋白质片段衍生自由包含SEQ ID NO：1(CfEcR-DEF)、SEQ ID NO：2(CfEcR-CDEF)、SEQ ID NO：3(DmEcR-DEF)、SEQ ID NO：4(TmEcR-DEF)SEQ ID NO：5(AmaEcR-DEF)的核酸序列的多核苷酸所编码的蜕皮激素受体多肽，或编码与其基本相同的功能变体的多核苷酸。

在本发明的某些实施方式中，蜕皮激素受体多肽中的至少一种包含SEQ ID NO：6(CfEcR-DEF)，SEQ ID NO：7(DmEcR-DEF)，SEQ ID NO：8(CfEcR-CDEF)，SEQ ID NO：9(TmEcR-DEF)，SEQ ID NO：10(AmaEcR-DEF)的多肽序列，或与其基本相同的多肽序列。

在本发明的某些实施方式中，蜕皮激素受体多肽序列包含约或至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或相对于相应的野生型蜕皮激素受体多肽的取代突变。

在本发明的某些实施方式中，蜕皮激素受体多肽由包含导致氨基酸残基取代的密码子突变的多核苷酸编码，其中该氨基酸残基位于等同于或类似于以下的位置：a)SEQ IDNO：17的氨基酸残基20、21、48、51、52、55、58、59、61、62、92、93、95、96、107、109、110、120、123、125、175、218、234或238，b)SEQ ID NO：17的氨基酸残基95和110，c)SEQ ID NO：17的氨基酸残基218和219，d)SEQ ID NO：17的氨基酸残基107和175，e)SEQ ID NO：17的氨基酸残基127和175，f)SEQ ID NO：17的氨基酸残基107和127，g)SEQ ID NO：17的氨基酸残基107、127和175，h)SEQ ID NO：17的氨基酸残基52、107和175，i)SEQ ID NO：17的氨基酸残基96、107和175，j)SEQ ID NO：17的氨基酸残基107、110和175，k)SEQ ID NO：18的氨基酸残基107、121、213或217，或1)SEQ ID NO：19的氨基酸残基91或105。

在本发明的某些实施方式中，蜕皮激素受体多肽的取代突变选自下组：a)SEQ IDNO：17的E20A，Q21A，F48A，I51A，T52A，T52V，T52I，T52L，T55A，T58A，V59A，L61A，I62A，M92A，M93A，R95A，V96A，V96T，V96D，V96M，V107I，F109A，A110P，A110S，A110M，A110L，Y120A，A123F，M125A，R175E，M218A，C219A，L223A，L230A，L234A，W238A，R95A/A110P，M218A/C219A/R175E，V107I/R175E，V107I/Y127E，V107I/Y127E/R175E，T52V/V107I/R175E，V96A/V107I/R175E，T52A/V107I/R175E，V96T/V107I/R175E或V107I/A110P/R75E取代突变，b)SEQ IDNO：18的A107P，G121R，G121L，N213A，C217A或C217S取代突变，以及c)SEQ ID NO：19的G91A或A105P取代突变。

在本发明的一些实施方式中，类视黄醇X受体多肽包含选自下组的多肽：脊椎动物类维生素X受体多肽，无脊椎动物类维生素X受体多肽(USP)和包含来自脊椎动物和无脊椎动物RXR的多肽片段的嵌合类视黄醇X多肽。

在本发明的某些实施方式中，嵌合类视黄醇X受体多肽包含至少两种不同的类视黄醇X受体多肽片段，其选自脊椎动物类视黄醇X受体多肽片段，无脊椎动物类视黄醇X受体多肽片段，和非双翅目/非鳞翅目无脊椎动物物种类视黄醇X受体多肽片段。

在本发明的一些实施方式中，嵌合类视黄醇X受体多肽包含类视黄酸X受体多肽，其包含至少一种类视黄醇X受体多肽片段，其选自EF结构域螺旋1，EF结构域螺旋2，EF结构域螺旋3，EF结构域螺旋4，EF结构域螺旋5，EF结构域螺旋6，EF结构域螺旋7，EF结构域螺旋8，EF结构域螺旋9，EF结构域螺旋10，EF结构域螺旋11，EF结构域螺旋12，F结构域和EF结构域β-折叠，其中类视黄醇X受体多肽片段来自不同物种的类视黄醇X受体多肽或与第二类视黄醇X受体多肽片段不同的同种型类视黄醇X受体多肽。

在本发明的某些实施方式中，嵌合类视黄醇X受体多肽由包含下述核酸序列的多核苷酸编码：a)SEQ ID NO：11，b)SEQ ID NO：12的核苷酸1-348和SEQ ID NO：13的核苷酸268-630，c)SEQ ID NO：12的核苷酸1-408和SEQ ID NO：13的核苷酸337-630，d)SEQ ID NO：12的核苷酸1465和SEQ ID NO：13的核苷酸403-630，e)SEQ ID NO：12的核苷酸1-555和SEQID NO：13的核苷酸490-630，f)SEQ ID NO：12的核苷酸1-624和SEQ ID NO：13的核苷酸547-630，g)SEQ ID NO：12的核苷酸1-645和SEQ ID NO：13的核苷酸601-630，和h)SEQ ID NO：12的核苷酸1-717，SEQ ID NO：13的核苷酸613-630，或编码与其基本相同的功能变体的多核苷酸。

在本发明的一些实施方式中，嵌合类视黄醇X多肽包含以下的多肽序列：a)SEQ IDNO：14，b)SEQ ID NO：15的氨基酸1-116和SEQ ID NO：16的氨基酸90-210，c)SEQ ID NO：15的氨基酸1-136和SEQ ID NO：16的氨基酸113-210，d)SEQ ID NO：15的氨基酸1-155和SEQID NO：16的氨基酸135-210，e)SEQ ID NO：15的氨基酸1-185和SEQ ID NO：16的氨基酸164-210，f)SEQ ID NO：15的氨基酸1-208和SEQ ID NO：16的氨基酸183-210，g)SEQ ID NO：15的氨基酸1-215和SEQ ID NO：16的氨基酸201-210，以及h)SEQ ID NO：15的氨基酸1-239，SEQID NO：16的氨基酸205-210，或与其基本相同的多肽序列。

在本发明的某些实施方式中，第一和第二多肽或LIPC系统的一个或两个其它异源序列包含跨膜结构域。

在本发明的某些实施方式中，第一和第二多肽或LIPC系统的至少一个跨膜结构域是单次I型跨膜。

在本发明的某些实施方式中，LIPC组分与异源多肽融合，所述异源多肽在配体诱导的二聚化时导致或产生细胞死亡或无反应；这样的系统可以被称为“自杀”或“杀死”开关。

在一些实施方式中，本发明包括分离的多核苷酸，其包含编码本文所述的第一或第二多肽的多核苷酸序列。

在某些实施方式中，本发明包括包含编码第一多肽的核苷酸序列的第一多核苷酸和包含编码本文所述的第二多肽的核苷酸序列的第二多核苷酸。

在一些实施方式中，本发明包括包含上述多核苷酸中的任一种的载体。在某些实施方式中，本发明包含同时包含本文所述的第一和第二多核苷酸的载体。在一些实施方式中，本发明的载体是表达载体。

在某些实施方式中，本发明包括包含上述任一载体的宿主细胞。在一些实施方式中，宿主细胞是哺乳动物T细胞。在某些实施方式中，宿主细胞是人类T细胞。

在一些实施方式中，本发明包括诱导细胞信号转导的方法，包括引入本文所述的第一和第二多肽，LIPC系统，多核苷酸和/或任何载体并使宿主细胞与激活配体接触。

在本发明的某些实施方式中，本文所述的第一和第二多肽，LIPC系统，多核苷酸，载体和/或方法的激活配体是：

a)下式的化合物：

其中：

E是含叔碳的(C₄-C₆)烷基或含叔碳的氰基(C₃-C5)烷基；R¹是H、Me、Et、i-Pr、F、甲酰基、CF₃、CHF₂、CHCl₂、CH₂F、CH₂Cl、CH₂OH、CH₂OMe、CH₂CN、CN、C≡CH、1-丙炔基、2-丙炔基、乙烯基、OH、OMe、OEt、环丙基、CF₂CF₃、CH＝CHCN、烯丙基、叠氮基、SCN、或SCHF₂；

R²是H、Me、Et、n-Pr、i-Pr、甲酰基、CF₃、CHF₂、CHCl₂、CH₂F、CH₂Cl、CH₂OH、CH₂OMe、CH₂CN、CN、C≡CH、1-丙炔基、2-丙炔基、乙烯基、Ac、F、Cl、OH、OMe、OEt、O-n-Pr、OAc、NMe₂、NEt₂、SMe、Set、SOCF₃、OCF₂CF₂H、COEt、环丙基、CF₂CF₃、CH＝CHCN、烯丙基、叠氮基、OCF₃、OCHF₂、O-i-Pr、SCN、SCHF₂、SOMe、NH-CN，或与R³以及R²和R³接合的苯基碳连接以形成亚乙基二氧基，与苯基碳相邻的氧形成二氢呋喃环，或与苯基碳相邻的氧形成二氢吡喃环；

R³是H、Et，或与R²以及R²和R³接合的苯基碳连接以形成亚乙基二氧基，与苯基碳相邻的氧形成二氢呋喃环，或与苯基碳相邻的氧形成二氢吡喃环；

R⁴、R⁵、和R⁶独立地是H、Me、Et、F、Cl、Br、甲酰基、CF₃、CHF₂、CHCl₂、CH₂F、CH₂Cl、CH₂OH、CN、C≡CH、1-丙炔基、2-丙炔基、乙烯基、OMe、OEt、SMe、或Set；或

b)蜕皮激素、20-羟基蜕皮激素、松甾酮A、莫瑞甾酮A、氧甾醇、22(R)羟基胆甾醇、24(S)羟基胆甾醇、25-环氧胆固醇、T0901317、5-α-6-α-环氧胆固醇-3-硫酸盐、7-酮胆固醇-3-硫酸盐、金合欢醇、胆酸、1，1-二膦酸酯、或保幼激素III。

在本发明的某些实施方式中，本文所述的第一和第二多肽，LIPC系统，多核苷酸，载体和/或方法的激活配体是具有下式的化合物：

或者

其中R¹、R²、R³和R⁴是：a)H，(C₁-C₆)烷基；(C₁-C₆)卤代烷基；(C₁-C₆)氰基烷基；(C₁-C₆)羟基烷基；(C₁-C₄)烷氧基(C₁-C₆)烷基；任选地被卤素、氰基、羟基或(C₁-C₄)烷基取代的(C₂-C₆)烯基；任选地被卤素、氰基、羟基或(C₁-C₄)烷基取代的(C₂-C₆)炔基；任选地被卤素、氰基、羟基或(C₁-C₄)烷基取代的(C₃-C₅)环烷基；或b)未取代或取代的苄基，其中取代基独立地是1至5H、卤素、硝基、氰基、羟基、(C₁-C₆)烷基、或(C₁-C₆)烷氧基；并且

R⁵是H；OH；F；Cl；或(C₁-C₆)烷氧基；

前提是：当R¹、R²、R³、和R⁴是异丙基时，R⁵不是羟基；

当R⁵是H、羟基、甲氧基或氟时，R¹、R²、R³、和R⁴中的至少一个不是H；

当R¹、R²、R³、和R⁴中仅一个是甲基，并且R⁵是H或羟基时，其余的R¹、R²、R³、和R⁴不是H；

当R⁴以及R¹、R²、和R³之一都是甲基时，R⁵不是H或羟基；

当R¹、R²、R³、和R⁴都是甲基时，R⁵不是羟基；

当R¹、R²、和R³都是H并且R⁵是羟基时，R⁴不是乙基、正丙基、正丁基、烯丙基、或苄基。

其中X和X′独立地是O或S；

Y是：

(a)取代或未取代的苯基，其中取代基独立地是1-5H、(C₁-C₄)烷基、(C₁-C₄)烷氧基、(C₂-C₄)烯基、卤素(F，Cl，Br，I)、(C₁-C₄)卤代烷基、羟基、氨基、氰基、或硝基；或

(b)取代或未取代的2-吡啶基、3-吡啶基、或4-吡啶基，其中取代基独立地是1-4H、(C₁-C₄)烷基、(C₁-C₄)烷氧基、(C₂-C₄)烯基、卤素(F，Cl，Br，I)、(C₁-C₄)卤代烷基、羟基、氨基、氰基、或硝基；

R¹和R²独立地是：H；氰基；氰基取代或未取代的(C₁-C₇)支链或直链烷基；氰基取代或未取代的(C₂-C₇)支链或直链烯基；氰基取代或未取代的(C₃-C₇)支链或直链烯基烷基；或R¹和R²的价态一起形成(C₁-C₇)氰基取代或未取代的亚烷基(R^aR^bC＝)其中R^a和R^b中非取代碳的总和为0-6；

R³是H、甲基、乙基、正丙基、异丙基、或氰基；

R⁴、R⁷、和R⁸独立地是：H、(C₁-C₄)烷基、(C₁-C₄)烷氧基、(C₂-C₄)烯基、卤素(F，Cl，Br，I)、(C₁-C₄)卤代烷基、羟基、氨基、氰基、或硝基；并且

R⁵和R⁶独立地是：H、(C₁-C₄)烷基、(C₂-C₄)烯基、(C₃-C₄)烯基烷基、卤素(F，Cl，Br，I)、C₁-C₄卤代烷基、(C₁-C₄)烷氧基、羟基、氨基、氰基、硝基，或一起以(-OCHR⁹CHR¹⁰O-)型连接和与它们所接合的苯基碳形成环；其中R⁹和R¹⁰独立地是：H、卤素、(C₁-C₃)烷基、(C₂-C₃)烯基、(C₁-C₃)烷氧基(C₁-C₃)烷基、苯甲酰基氧基(C₁-C₃)烷基、羟基(C₁-C₃)烷基、卤代(C₁-C₃)烷基、甲酰基、甲酰基(C₁-C₃)烷基、氰基、氰基(C₁-C₃)烷基、羧基、羧基(C₁-C₃)烷基、(C₁-C₃)烷氧基羰基(C₁-C₃)烷基、(C₁-C₃)烷基羰基(C₁-C₃)烷基、(C₁-C₃)烷酰氧基(C₁-C₃)烷基、氨基(C₁-C₃)烷基、(C₁-C₃)烷基氨基(C₁-C₃)烷基(-(CH₂)_nR^cR^e)、肟(-CH＝NOH)、肟(C₁-C₃)烷基、(C₁-C₃)链肟(alkoximo)(-C＝NOR^d)、链肟(C₁-C₃)烷基、(C₁-C₃)甲酰胺基(-C(O)NR^eR^f)、(C₁-C₃)甲酰胺基(C₁-C₃)烷基、(C₁-C₃)脲氨基(-C＝NNHC(O)NR^eR^f)、脲氨基(C₁-C₃)烷基、氨基羰氧基(-OC(O)NHR^g)、氨基羰氧基(C₁-C₃)烷基、五氟苯氧基羰基、五氟苯氧基羰基(C₁-C₃)烷基、对-甲苯磺酰氧基(C₁-C₃)烷基、芳基磺酰氧基(C₁-C₃)烷基、(C₁-C₃)硫代(C₁-C₃)烷基、(C₁-C₃)烷基亚砜基(C₁-C₃)烷基、(C₁-C₃)烷基磺酰基(C₁-C₃)烷基、或(C₁-C₅)三取代-甲硅烷氧基(C₁-C₃)烷基(-(CH₂)_nSiOR^dR^eR^g)；其中n＝1-3，R^c和R^d表示所示长度的直链或支链烃链，R^e，R^f表示H或所示长度的直链或支链烃链，R^g表示任选地被卤素或(C₁-C₃)烷基取代的(C₁-C₃)烷基或芳基，并且R^c、R^d、R^e、R^f、和R^g互相独立；

前提是：

i)当R⁹和R¹⁰都是H时，或

ii)当R⁹或R¹⁰是卤素、(C₁-C₃)烷基、(C₁-C₃)烷氧基(C₁-C₃)烷基、或苯甲酰氧基(C₁-C₃)烷基时，或

iii)当R⁵和R⁶不一起形成(-OCHR⁹CHR¹⁰O-)型连接时，

基团R¹或R²的任一或两者的碳原子的数量，排除氰基取代的那些，超过4，并且基团R¹、R²、和R³的总和的碳原子的数量，排除氰基取代的那些，是10、11或12。

附图简要说明

当考虑附图及相应详细描述时，可以更完整地理解本发明。附图所示实施方式仅仅是举例说明发明，不应考虑为将发明限制于所示实施方式。其他实施方式和配置可提供其他有用的实施方式。

图1：示出使用EcR和RXR组件的示例性转录开关的配置和操作模式的示意图。

图2：配体诱导型多肽耦合器(LIPC)组分的概念的示意图。在激活配体的存在下，EcR和RXR组分缔合，导致融合组分(例如，信号传导分子，信号传导结构域，互补蛋白质片段和蛋白质亚基)的缔合。

图3：示出配体诱导型多肽耦合器(LIPC)系统的示意图，其中细胞内EcR和RXR组分通过跨膜结构域融合到细胞外组分(例如，信号传导分子或结构域)。在配体存在下，EcR和RXR组分缔合，导致细胞外融合组分的缔合。

图4A和4B：示出配体诱导型多肽耦合器(LIPC)系统的示意图，其中细胞外EcR和RXR组分通过跨膜结构域融合到细胞内组分(例如，信号传导分子或结构域)(图4A)。在配体存在下，EcR和RXR组分缔合，导致细胞内融合组分的缔合。示出配体诱导型多肽耦合器(LIPC)系统的示意图，其中细胞内EcR和RXR组分系连至膜并且融合到细胞内组分(例如，信号传导分子或结构域)(图4B)。在配体存在下，EcR和RXR组分缔合，导致细胞内融合组分的缔合。

图5：示出配体诱导型多肽耦合器(LIPC)系统的示意图，其中EcR或RXR组分系连至膜，而另一种互补成分在胞质中游离。在配体存在下，膜系连的EcR或RXR组分与胞质EcR或RXR组分缔合，导致融合组分(例如，信号传导分子或结构域)的缔合。

图6：分裂荧光素酶(fLuc)配体诱导型多肽耦合器(LIPC)系统的示意图。只有在配体的存在下，EcR和RXR组分缔合，促进分裂fLuc的缔合和随后的活性。

图7：证明本文所述的配体诱导型多肽耦合器(LIPC)仅在激活配体存在下驱动分裂fLuc信号的数据。

图8：用于构建如本文所述的配体诱导型多肽耦合器(LIPC)系统的示例性构建体的示意图。

图9：使用Veledimex配体的RxR_Nluc+Cluc_EcR和EcR_Nluc+Cluc_RxR的配体剂量反应曲线。

图10：使用Veledimex配体的RxR_Nluc+Cluc_EcR和EcR_Nluc+Cluc_RxR的配体剂量反应曲线。

图11：通过Veledimex配体诱导EcR二聚化。

图12：通过Veledimex配体诱导EcR二聚化。

具体实施方式

本文提供的发明使用EcR-RXR转录开关系统的组件(参见例如PCT公开号WO 2001/070816，WO 2002/066612，WO 2002/066613，WO 2002/066614，WO2002/066615，WO 2003/027266，WO 2003/027289和WO 2005/108617，其各自通过引用纳入本文)，其可以在宿主细胞中表达或由宿主细胞表达以控制、调节或调整融合蛋白组分的缔合。蛋白质-蛋白质相互作用的一个作用是启动细胞信号转导过程，例如通过激活胞质和/或细胞外信号传导结构域或通过受体-配体结合相互作用恢复片段化或分裂的蛋白质功能。因此，这种天然存在的系统可以通过在EcR和RXR组分(存在EcR配体)之间诱导形成“桥”驱动两个不活跃的信号传导结构域的缔合而被人为地调节，其中后一个组分已被并入(即，融合)信号传导结构域多肽。

在某些实施方式中，本文描述了与通过配体诱导的多肽耦合选择性激活细胞信号传导结构域有关的系统和方法。所述系统和方法提供配体诱导的多肽耦合系统，其允许诱导蛋白质-蛋白质相互作用(例如，调节，控制，调控)和(“根据需要”)激活信号传导结构域或失活/抑制信号传导结构域。

因此，本文公开的是使用基因转录开关系统的蛋白质组分(在宿主细胞表达)用于诱导彼此物理缔合(通过激活配体)以形成其他相关蛋白或结构域的复合物(即，诱导蛋白质-蛋白质相互作用)的系统和方法。配体诱导的蛋白质缔合可以例如引发功能，例如在激活配体存在下激活胞质和/或细胞外信号传导结构域。因此，在激活配体的存在下，通常通过EcR和USP/RXR组分之间的“桥”将它们桥连在一起可以激活通常无活性的两个信号传导结构域。

术语“一种”或“一个”当与“包含”在权利要求和说明书中联用时，可表示“一个”，但也与“一个或多个”，“至少一个”和“一个或多于一个”的意思一致。

使用术语“例如”及其相应缩写“例”(无论是否斜体)表示特定术语仅是代表性的示例(即，试样、样品、说明、模型等)并且本发明的实施方式比并不旨在限于所引用或参考的具体实施例，除非另有明确说明。

当在本文中用于提及基因或多肽组分(除非另有说明)时，正斜线字符(“/”)是词“和/或”的缩写。例如，除非另有说明，术语“USP/RXR”表示可以具有USP和RXR多肽或其片段(例如，嵌合多肽)，或仅USP多肽组分或其片段(例如，结构域)的混合物，或仅RXR组分或其残基(例如，结构域)。

如本说明书和权利要求中所使用的，词语“包含”(和任何形式的包含，例如“含有”和“含”)，“具有”(以及任何形式的具有，例如“有”和“拥有”)，“包括”(以及任何形式的“包括”，例如“囊括”和“括入”)或“含有”(以及任何形式的含有，例如“含”和“包含”)都是纳入性或开放性的，并不排除额外的未提到的元素或方法步骤。考虑本说明书中所讨论的任何实施方式可以用任何本发明的方法、系统、宿主细胞、表达载体或组合物实现，反之亦然。此外，本发明的系统、宿主细胞、表达载体和/或组合物可用于实现本发明的方法。

本文所用的“合成”是指通过人类施为的化学过程形成的化合物，而不是天然来源的化合物。

“分离的”是指从其天然环境中去除核酸、肽或多肽。“纯化的”是指给定的核酸，无论是从自然界(包括基因组DNA和mRNA)还是合成的(包括cDNA)中被除去和/或在实验室条件下扩增的核酸，肽或多肽已经增加了纯度，其中“纯度”是相对术语，而不是“绝对纯度”。然而，应当理解，核酸、肽和多肽可以用稀释剂或佐剂配制，并且仍然出于实际目的被分离。例如，当用于引入细胞时，核酸通常与可接受的运载体或稀释剂混合。

“核酸”是由称为核苷酸的共价连接的亚基组成的聚合物。核酸包括多核糖核酸(RNA)和多脱氧核糖核酸(DNA)，它们都可以是单链或双链的。DNA包括但不限于cDNA、基因组DNA、质粒DNA、合成DNA和半合成DNA。DNA可以是线性的、圆形的或超螺旋的。

“核酸分子”是指核糖核苷(腺苷、鸟苷、尿苷或胞苷；“RNA分子”)或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷或脱氧胞苷；“DNA分子”)的磷酸酯聚合形式，或其采用单链形式或双链螺旋的任何磷酸酯类似物，如硫代磷酸酯和硫酯。双链DNA-DNA、DNA-RNA和RNA-RNA螺旋是可能的。术语核酸分子且特别是DNA或RNA分子，仅仅指分子的一级和二级结构，不限于任何特定三级形式。因此，该术语包含特别是在线状或环状DNA分子(如限制性片段)、质粒、和染色体等中发现的双链DNA。当讨论特定双链DNA分子的结构时，本文可以按常规惯例描述序列，仅沿非转录的DNA链(即具有mRNA互补序列的链)以5′到3′方向显示序列。“重组DNA分子”是经过分子生物学操作的DNA分子。

用于多核苷酸序列的术语“片段”将理解为表示相对于参照核酸长度减少的核苷酸序列，在所述共有部分包含与参照核酸相同的核苷酸序列。就本发明而言，这种核酸片段可合适地包含在其作为组分的更大多核苷酸中。这样的片段包含，或者由以下组成：长度为至少6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、105、110、120、125、130、135、140、145、150、200、300、400、500、600、700、800、900、1000、1250、1500、2000、2500、3000、3500、4000、4500、5000或6000个本发明的核酸的连续核苷酸的寡核苷酸。在某些实施方式中，这样的片段可包含长度范围为6至6,000个核苷酸的任何整数的寡核苷酸，或由其组成。在某些实施方式中，这样的片段可以是长度上可以被3整除的任何整数(例如，使得多核苷酸编码全部或部分多肽开放阅读框)。在某些实施方式中，这些部分多肽片段可以是任何整数长度(例如，使得多核苷酸可以用作PCR引物或其他可杂交的片段或用于产生合成或限制性片段长度多核苷酸)。

本文使用的“分离核酸片段”是单或双链的RNA或DNA聚合物，可选包含合成、非天然或改变的核苷酸碱基。DNA聚合物形式的经分离核酸片段可包含一个或多个区段的cDNA、基因组DNA或合成DNA。

“基因”是指编码多肽的核苷酸的组合，并且包括cDNA和基因组DNA核酸。“基因”也指表达特定蛋白或多肽的核酸片段，包含所述编码序列之前(5′非编码序列)和之后(3′非编码序列)的调节序列。“天然基因”指自然存在且具有自身调控序列的基因。“嵌合基因”指作为非天然基因的任何基因，包含未天然一起发现的调节和/或编码序列。因此，嵌合基因可能包含获自不同来源的调节序列和编码序列，或获自相同来源但是与天然发现方式不同排列的调节序列和编码序列。嵌合基因可能包含获自不同来源的编码序列和/或获自不同来源的调节序列。“内源基因”指在生物体基因组中天然定位的天然基因。“外来”基因或“异源”基因指在宿主生物体或细胞内正常未发现，但是通过基因转移引入宿主生物体或细胞的基因。外来基因可包含但不限于插入到非天然生物体的天然基因或嵌合基因。“转基因”是已被引入宿主生物体或细胞基因组的外来或异源基因。“异源性DNA”指不是天然定位到所述细胞或细胞基因组的染色体位点的DNA。在一些实施方式中，异源DNA包含对细胞外来的基因。

本文所用的“多核苷酸”或“寡核苷酸”是指任何长度的核苷酸(核糖核苷酸或脱氧核糖核苷酸)的聚合形式。该术语仅指该分子的一级结构。因此，该术语包括双链和单链DNA，三链DNA以及双链和单链RNA。其还包括例如通过甲基化和/或通过加帽和未修饰形式的多核苷酸进行修饰。该术语还旨在包括含非天然存在或合成核苷酸以及核苷酸类似物的分子。在某些实施方式中，寡核苷酸可与基因组DNA分子、cDNA分子、质粒DNA或mRNA分子杂交。寡核苷酸能用例如³²P核苷酸或共价偶联标记如生物素的核苷酸来标记。在一些实施方式中，标记的寡核苷酸可用作探针以检测核酸的存在。寡核苷酸(二者之一或都可以被标记)能用作PCR引物以克隆全长或核酸片段，或检测核酸的出现。也可以使用寡核苷酸与DNA分子形成三螺旋。在某些实施方式中，合成制备寡核苷酸，例如，在核酸合成仪上。因此，寡核苷酸能用非天然产生的磷酸酯类似物键例如硫酯键等制备。

当核酸和/或核酸序列从共同的祖先核酸或核酸序列天然或人工衍生时，它们是“同源的”。当编码DNA从共同的祖先核酸或核酸序列天然或人工衍生时，蛋白质和/或蛋白质序列是同源的。同源分子可以称为同源物。例如，如本文所述的任何天然存在的蛋白质可以通过任何可用的诱变方法进行修饰。当表达时，该诱变的核酸编码与由原始核酸编码的蛋白质同源的多肽。同源性通常从两个或多个核酸或蛋白质(或其序列)之间的序列相同性推导。用于建立同源性的序列之间的相同性的确切百分比随着所涉及的核酸和蛋白质而变化，但通常使用少至25％的序列相同性来建立同源性。更高水平的序列相同性，例如，30％，40％，50％，60％，70％，80％，90％，95％或99％或更高，也可用于建立同源性。用于确定序列相同性百分比的方法(例如，使用默认参数的BLASTP和BLASTN)在本文中描述并且通常是可用的。

DNA“编码序列”是双链DNA序列，当被置于适当调节序列的控制下时，其在体外或体内转录并翻译为细胞中的多肽。“合适的调控序列”指位于编码序列上游(5’非编码序列)、之内或下游(3’非编码序列)的核苷酸序列，其影响相关编码序列的转录、RNA加工或稳定性、或翻译。调控序列可包含启动子、翻译前导序列、内含子、聚腺苷酸识别序列、RNA加工位点、效应物结合位点和茎环结构。编码序列的边界由5’(氨基)末端的起始密码子和3’(羧基)末端的翻译终止密码子确定。编码序列可包括但不限于，原核序列、来自mRNA的cDNA、基因组DNA序列和合成DNA序列。如果所述编码序列意在用于真核细胞中的表达，聚腺苷酸化信号和转录终止序列常位于该编码序列的3’。

“开放阅读框”缩写为ORF，指包含翻译起始信号或起始密码子如ATG或AUG和终止密码子并且能潜在翻译成多肽序列的某一核酸序列(DNA、cDNA或RNA)长度。

“同源重组”指将外源DNA序列插入另一个DNA分子中，例如将载体插入染色体中。在一些实施方式中，所述载体靶向用于同源重组的特定染色体位点。对特异性同源重组而言，所述载体会包含足够长的与染色体序列同源区域以使载体与染色体互补结合并纳入其中。更长的同源区域和更高的序列相似性程度可以增加同源重组的效率。

“载体”或“表达载体”指用于克隆和/或转移核酸到宿主细胞的任何形态。载体可以是连接另一DNA区段的复制子，以实现所连接区段的复制。“复制子”是在细胞中用作DNA自主复制单位的任何遗传元件(例如质粒、噬菌体、粘粒、染色体、病毒)。术语“载体”包含体外、离体或体内引入核酸到细胞的病毒和非病毒手段。

术语“质粒”指通常载有不是细胞中心代谢部分的基因的染色体外元件，且可以呈环状双链DNA分子的形式。这些元件可以是自主复制序列、基因整合序列、噬菌体或核苷酸序列、线性、环状或超螺旋的单链或双链DNA或RNA，源自任何来源，其中大量核苷酸序列已连接或重组入能够将选定基因产物的启动子片段和DNA序列与合适的3’未翻译序列引入细胞的独特结构。

载体可以通过本领域已知的方式引入所需的宿主细胞，例如转染、电穿孔、显微注射、转导、细胞融合、DEAE右旋糖苷、磷酸钙沉淀、脂质转染(溶酶体融合)、利用基因枪、或DNA载体转运子(参见例如，Wu等，1992，J.Biol.Chem.267：963-967；Wu和Wu，1988，J.Biol.Chem.263：14621-14624；和Hartmut等，1990年3月15日提交的加拿大专利申请号2,012,311，其各自全部内容通过引用并入本文)。

还可能在体内引入作为裸DNA质粒的载体(参见例如，美国专利5,693,622、5,589,466和5,580,859，其各自通过引用全文纳入本文)。还可以使用受体介导的DNA递送方法(参见例如，Curel等，1992，Hum.Gene Ther 3：147-154；和Wu和Wu，1987，J.Biol.Chem 262：4429-4432，其各自的全部内容通过引用纳入本文)。

术语“转染”指细胞摄入外源或异源RNA或DNA。当这种RNA或DNA引入到细胞内时，细胞被外源或异源RNA或DNA“转染”。当转染的RNA或DNA影响表型改变时，细胞被外源或异源RNA或DNA“转化”。转化RNA或DNA能整合(共价连接)到构成所述细胞基因组的染色体DNA中。

“转化”指将核酸片段转移到宿主生物的基因组中，产生遗传上稳定的遗传。包含转化核酸片段的宿主生物称为“转基因”或“重组”或“转化”生物。

术语“选择标记”指能基于标记基因效果来选择的鉴定因子，通常是抗生素或化学抗性基因，所述效果即耐受抗生素、耐受除草剂、比色标记物、酶、荧光标记物等，其中所述效果用于追踪感兴趣核酸的遗传和/或鉴定遗传所述感兴趣核酸的细胞或生物。本领域已知和使用的可选择标记基因的实例包括但不限于：对氨苄青霉素，链霉素，庆大霉素，卡那霉素，潮霉素，双丙二酸除草剂，磺酰胺等提供抗性的基因；以及用作表型标记的基因，例如花青素调节基因，异戊烷转移酶基因等。

术语“报道基因”指编码能基于报道基因效果分辨的鉴定因子的核酸，其中所述效果用于追踪感兴趣核酸的遗传，鉴定遗传有感兴趣核酸的细胞或生物，和/或测量基因表达诱导或转录。本领域已知和使用的报告基因的实例包括但不限于：荧光素酶(Luc)，绿色荧光蛋白(GFP)，氯霉素乙酰转移酶(CAT)，β-半乳糖苷酶(LacZ)，β-葡糖苷酸酶(Gus)等。选择标记基因也可视作报道基因。

本文所用的“可操作地连接”是指DNA区段与另一DNA区段的物理和/或功能连接，以允许该区段以其预期的方式起作用。当编码基因产物的DNA序列与调节序列(例如启动子，增强子和/或沉默子)以允许调节DNA序列的转录的方式直接或间接连接时，其与调控序列可操作地连接。例如，当DNA序列相对于启动子的转录起始位点在正确的阅读框架中，当连接到启动子的转录起始位点下游的启动子并允许转录延伸进行通过DNA序列时，DNA序列可操作地连接到启动子上。当增强子或沉默子以分别增加或减少DNA序列转录的方式连接到DNA序列时，其与编码基因产物的DNA序列可操作地连接。增强子和沉默子可以位于DNA序列的编码区的上游、下游或包埋其中。如果信号序列被表达为参与多肽分泌的前蛋白，则信号序列的DNA可操作地连接到编码多肽的DNA。术语“盒”、“表达盒”和“基因表达盒”指能够(例如，特定限制位点或者通过同源重组)插入核酸或多核苷酸的DNA区段。该DNA区段可包括编码感兴趣多肽的多核苷酸，并且盒和限制位点可设计成能够确保所述盒插入适当阅读框进行转录和翻译。“转化盒”指包含编码感兴趣多肽的多核苷酸并具有除有利于特定宿主细胞转化的多核苷酸之外元件的载体。本发明的盒、表达盒、基因表达盒和转化盒也可以包含使宿主细胞中编码感兴趣多肽的多核苷酸表达增强的元件。这些元件包括但不限于：启动子、最小启动子、增强子、响应元件、终止子序列、聚腺苷酸化序列等。“调节区”指调节第二核酸序列表达的核酸序列。调节区可以包含天然负责特定核酸表达的序列(同源区域)，或可以包含负责表达不同蛋白质或甚至合成蛋白质的不同起源序列(异源区域)。特别地，所述序列能是原核、真核或病毒基因序列，或以特定或非特定方式和诱导或非诱导方式刺激或抑制基因转录的衍生序列。调节区包含复制起点、RNA剪接位点、启动子、增强子、转录终止序列和指导多肽到靶标细胞中分泌通路的信号序列。来自“异源来源”的调节区指与所表达核酸不是天然相关的调节区。异源调节区中包括来自不同物种的调节区，来自不同基因的调节区，杂交调控序列和自然界中不存在的调控序列。

“肽”在本文中用于指在链中连接的含有两个或更多个氨基酸残基的化合物。“多肽”是由共价连接的氨基酸残基组成的聚合物。氨基酸具有以下一般结构：

基于侧链R将氨基酸分为七组：(1)脂肪族侧链，(2)含有羟基(OH)基团的侧链，(3)含有硫原子的侧链，(4)含有酸性或酰胺基团的侧链，(5)含有碱性基团的侧链，(6)含有芳环的侧链，和(7)脯氨酸，侧链与氨基稠合的亚氨基酸。

“蛋白质”包括多肽。“分离的多肽”或“分离的蛋白质”指基本不含与其天然状态正常相关的那些化合物(例如其它蛋白质或多肽、核酸、糖、脂质)的多肽或蛋白质。“分离的”并不意味着排除有其它化合物的人工或合成混合物或者出现杂质，所述杂质不干扰生物功能并且可以是例如归因于不完全纯化、加入稳定剂或复合入药学上可接受制剂。

本文所用的“取代突变体多肽”或“取代突变体”是指包含约或至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或更多个用相对于野生型或天然存在的多肽不同的氨基酸取代的野生型或天然存在的氨基酸，或由其组成的多肽。与野生型或天然存在的多肽相比，取代突变体多肽可以仅包含一个(1)氨基酸取代，并且可以称为“点突变体”或“单点突变体”多肽。

当取代突变体多肽包含一个(1)或更多个野生型或天然存在的氨基酸的取代或由其组成时，该取代可以包含或由等量的野生型或天然存在的氨基为取代而删除的酸，即被两个非野生型或非天然存在的氨基酸取代的两个野生型或天然存在的氨基酸，或为取代缺失的非等价数量的野生型氨基酸，例如用一个非野生型氨基酸(取代+缺失突变)取代的两个野生型氨基酸，或被三个非野生型氨基酸取代的两个野生型氨基酸(取代+插入突变)。取代突变体可以使用缩写术语系统描述以指示在参照多肽序列内取代的氨基酸残基和数目和新取代的氨基酸残基。例如，其中多肽的第二十(20)个氨基酸残基被取代的取代突变体可以缩写为“x20z”，其中“x”是待替代的母体，正常存在或天然存在的氨基酸，“20”是多肽中引用的氨基酸残基位置或数字，“z”是新取代的氨基酸。因此，互换缩写成“E20A”或“Glu20Ala”的取代突变体指示包含多肽位置20处丙氨酸残基(本领域通常缩写成“A”或“Ala”)取代谷氨酸(本领域通常缩写成“E”或“Glu”)的突变体。

“片段”当与多肽相关地使用时，是指其氨基酸序列短于参考多肽的氨基酸序列的多肽，并且其包含或组成在参考多肽的整个部分上，相同的氨基酸序列(除非另有明确说明，例如“与...有95％相同的片段”)。合适时，这些片段可以包含在其作为一部分的更大多肽中。本发明的多肽的这样的片段可包含长度为至少4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、105、110、120、125、130、135、140、145、150、200、300、400、500、600、700、800、900、1000、1250、1500、2000、2500、3000、3500、4000、4500、或5000个氨基酸残基的聚合物，或由其组成。在某些实施方式中，这样的片段可以包含长度范围为例如4至5,000的任何整数个残基的氨基酸聚合物(即肽，多肽)或者由其组成。

当与多肽相关地使用时，“截断”或“截短”是与参考多肽(例如，可能由氨基酸残基的删除或酶加工产生)相比氨基酸序列较短的多肽片段(在N-末端，C-末端或者N-和C-末端)。

多肽或蛋白质的“变体”是衍生自或不同于相似多肽或蛋白质但是保留原始或参考多肽或蛋白质的至少一种生物学特性的任何类似物、片段、截短、衍生物或突变体。多肽或蛋白质的不同变体可以天然存在。这些变体可以是天然存在的等位基因变异，其特征在于编码蛋白质的结构基因的核苷酸序列的差异，或者可能涉及差异剪接或翻译后修饰，或者可以人工(例如遗传，合成，重组)工程改造变体。技术人员能生成有单个或多个氨基酸取代、删除、加入或替换的变体。这些变体可以包括：(a)其中一个或多个氨基酸残基被保守或非保守氨基酸取代的变体，(b)其中一个或多个氨基酸加入到多肽或蛋白质中的变体，(c)其中一个或多个氨基酸包括取代基团的变体，和/或(d)其中多肽或蛋白质与另一多肽融合的变体。获得这些变体的技术包括遗传学(抑制、删除、突变等)、化学和酶学技术，所述技术为本领域普通技术人员已知。本文公开的蛋白质的“功能变体”或“功能片段”保留参考蛋白质的功能的至少一部分。例如，蛋白质的“功能变体”或“功能片段”可以保留至少约10％、约20％、约30％、约40％、约50％、约60％、约70％、约80％、约90％或约100％的比较的参考蛋白的生物活性或功能。此外，蛋白质的“功能变体”或“功能片段”可以，例如，包含每100个连续的氨基酸残基具有至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个保守氨基酸取代的参考蛋白质的氨基酸序列或由其组成。术语“保守氨基酸取代”或“保守突变”是指由具有共同性质(例如，疏水性，亲水性，离子电荷，碱性，酸性，极性，非极性等)的一个氨基酸替代另一个氨基酸。定义各个氨基酸之间共同特性的功能方法是分析同源生物体的相应蛋白质之间氨基酸变化的归一化频率(Schulz，G.E.和Schirmer，R.H.，《蛋白质结构原理》(Principles of Protein Structure)，Springer-Verlag，纽约(1979)，其通过引用全文纳入本文)。根据这样的分析，可以定义多组氨基酸，其中一组中的氨基酸彼此优先交换，并且因此在其对整个蛋白质结构的影响中彼此最相似(Schulz，G.E.和Schirmer，R.H.，同上)。保守突变的实例包括上述亚组中的氨基酸的氨基酸取代，例如用赖氨酸取代精氨酸，反之亦然，从而可以保持正电荷；用谷氨酸取代天冬氨酸，反之亦然，从而可以保持负电荷；用丝氨酸取代苏氨酸，从而可以保持游离的-OH；和用谷氨酰胺取代天冬酰胺，从而可以保持游离的-NH₂。在某些情况下，优选保守氨基酸取代不干扰或抑制功能变体的生物活性。在一些情况下，保守氨基酸取代可以增强功能变体的生物活性，从而与母体分子相比，功能变体的生物活性增加。在其他情况下，保守取代可能需要干扰、消除或减少至少一种或多种生物活性。

或者或另外，功能变体可以包含具有至少一个非保守氨基酸取代的参考蛋白质的氨基酸序列或由其组成。“非保守突变”涉及不同组之间的氨基酸取代(即，其中原始和取代的AA具有不同的化学性质，例如涉及疏水性、亲水性、离子电荷、极性、非极性、酸性、碱性等的性质差异)。非保守取代的几个例子是，用赖氨酸(碱性)取代色氨酸(非极性)或谷氨酸(酸性)，用天冬氨酸(酸性)取代酪氨酸(极性)或组氨酸(碱性)，或者用苯丙氨酸(非极性)取代精氨酸(碱性)或丝氨酸(极性)等。在某些情况下，优选非保守氨基酸取代不干扰或抑制功能变体的生物活性。在一些情况下，非保守氨基酸取代可以增强功能变体的生物活性，从而与母体分子相比，功能变体的生物活性增加。在其他情况下，非保守取代可能需要干扰、消除或减少至少一种或多种生物活性。

“异源蛋白”是指在细胞中不天然产生的蛋白质。“成熟蛋白质”是指翻译后加工的多肽，即，已经除去存在于主要翻译产物中的任何前体肽或前肽。“前体”蛋白质是指mRNA翻译的主要产物，即仍然存在前体肽和前肽。前体肽和前肽可以是但不限于信号肽或细胞内定位信号。

术语“信号肽”是指分泌的成熟蛋白之前的氨基末端多肽。信号肽被切割并因此不存在于成熟蛋白质中。信号肽具有引导和转位分泌的蛋白质跨细胞膜的功能。信号肽也称为信号蛋白。

待在细胞表面上表达的蛋白质的编码序列的开始处包含“信号序列”。该序列编码成熟多肽的N末端的信号肽，其指导宿主细胞易位多肽。术语“易位信号序列”也可以用于指这种类型的信号序列。可以发现易位信号序列与真核生物和原核生物天然的多种蛋白质相关，并且在两种类型的生物体中通常是功能性的。

术语“同源性”指两个多核苷酸或两个多肽部分之间的相同性百分比。一个分子与另一个分子的序列之间的对应关系可以通过本领域已知的技术来确定。例如，可以通过比对序列信息并使用容易得到的计算机程序来直接比较两个多肽分子之间的序列信息来确定同源性。或者，测定同源性可以通过多核苷酸在允许同源区域间形成稳定双链体的条件下杂交，然后用单链特异性核酸酶消化并确定已消化片段的大小。

因此，其所有语法形式的术语“序列相似性”是指可能共享或可能不共享共同进化起源的蛋白质的核酸或氨基酸序列之间的相同性、同源性或对应性的程度(参见Reeck等，1987，Cell 50：667，其全部内容通过引用纳入本文)。在某些实施方式中，当至少约50％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约97％、至少约98％、至少约99％的核苷酸在DNA或氨基酸序列的限定长度上匹配时，两个DNA序列是“基本上同源的”或“基本上相似的”。基本上同源的序列可以通过使用序列数据库中可用的标准软件或在例如本领域普通技术人员所理解的严格条件下的Southern杂交实验中比较序列来鉴定。例如，严格的杂交条件可包括将任意靶，“探针”或检测试剂DNA在约45℃下杂交以6×氯化钠/柠檬酸钠(SSC)中过滤结合的DNA，随后通过在约50-65℃下在0.2×SSC，0.1％SDS中洗涤一次或多次)，然后在约68℃下的0.1×SSC，0.2％SDS中洗涤一次或多次，或者由其组成；或者在本领域技术人员已知的其他严格杂交条件下(参见，例如，Ausubel，F.M.等编，1989《分子生物学实验指南》(Current Protocols in Molecular Biology)，格林出版联合公司和约翰威立父子出版公司(Green publishing associates，Inc.，and John Wiley&SonsInc.)，纽约，第6.3.1-6.3.6和2.10.3页)。本发明也包括编码这种多肽的多核苷酸。

在两个核酸序列或多肽的氨基酸序列的情况中，术语“相同”或“序列相同性”是指两个序列中的残基在相对于指定的比较窗的最大对应度下比对时相同。如本文所用的“比较窗”是指至少约10个，至少约20个，至少约50个，至少约100个，至少约200个，至少约300个，至少约500个，或至少约1000个残基的区段，其中序列可以与两个序列最佳比对后相同数目的连续位置的参考序列进行比较。比对序列的比较方法是本领域熟知的。用于比较的序列最佳比对可以通过Smith和Waterman(1981)Adv.Appl.Math.2：482的局部同源性算法进行，通过引用全文纳入本文；通过Needleman和Wunsch(1970)J.Mol.Biol.48：443的比对算法，通过引用全文纳入本文；通过Pearson和Lipman(1988)Proc.Nat.Acad.SciU.S.A.85：2444的相似性搜索法，通过引用全文纳入本文；通过计算机执行这些算法(包括，但不限于，加利福尼亚州芒廷维尤的智慧遗传公司(Intelligenetics，Mountain View，Calif.)的PC/Gene程序中的CLUSTAL，威斯康星遗传学软件包中的GAP、BESTFIT、FASTA和TFASTA，遗传学计算组(GCG)，美国威斯康星州麦迪逊的科学路575号(575 Science Dr.，Madison，WI))；CLUSTAL详细描述于Higgins和Sharp(1988)Gene 73：237-244以及Higgins和Sharp(1989)CABIOS 5：151-153；Corpet等，(1988)Nucleic Acids Res.16：10881-10890；Huang等，(1992)Computer Applications in the Biosciences8：155-165；和Pearson等，(1994)Methods in Molecular Biology 24：307-331，其各自全部内容通过引用纳入本文。除了基于计算机软件的对准外，还可以通过手动检查和手动比对进行比对。

在一类实施方式中，使用默认参数，多肽与参考多肽或其片段70％，至少70％，75％，至少75％，80％，至少80％，85％，至少85％，90％，至少90％，95％，至少95％，97％，至少97％，98％，至少98％，99％，或至少99％或100％相同(例如，通过BLASTP或CLUSTAL或其他比对软件测量)。类似地，核酸也可以参考起始核酸来描述，例如，它们可以是与参考核酸或其片段50％，至少50％，60％，至少60％，70％，至少70％，75％75％，80％，至少80％，85％，至少85％，90％，至少90％，95％，至少95％，97％，至少97％，98％，至少98％，99％，至少99％或100％相同(例如，通过BLASTN或CLUSTAL或使用默认参数的其他比对软件测量)。当一个分子被认为与较大分子具有一定百分比的序列相同性时，这意味着当两个分子是最佳比对时，较小分子中所述百分比的残基根据两个分子最佳比对的顺序在较大分子中找到匹配残基，并且根据较小分子的长度计算“％”(百分比)相同性。

术语“基本相同”适用于核酸或氨基酸序列，表示核酸或氨基酸序列包含与参考序列相比具有70％，至少70％，75％，至少75％，80％，至少80％，85％，至少85％，90％，至少90％，95％，至少95％，97％，至少97％，98％，至少98％，99％，或至少99％或100％的序列，或由其组成。如上所述，序列相同性可以例如使用本领域普通技术人员公知和常规使用的程序来计算。例如，BLASTN程序(对核苷酸序列而言)采用的默认值如下：字长(W)1，期望值(E)10，M＝5，N＝-4，以及比较两条链。就氨基酸序列而言，BLASTP程序使用默认参数，字长(W)3、期望值(E)10、使用BLOSUM62评分矩阵(参见Henikoff和Henikoff(1992)Proc NatlAcad Sci USA 89：10915(1989)，其全部内容通过引用纳入本文)。序列相同性百分比通过在比较窗口中对比两种最佳比对序列而测定，其中比较窗口中多核苷酸序列的部分与参考序列(不含添加或缺失)相比可包含添加或缺失(即缺口)以最佳比对所述两种序列。该百分比如下计算：通过测定两种序列中出现相同核酸碱基或氨基酸残基的位置数产生匹配位置数，将该匹配位置数除以比较窗口中位置的总数，得到的结果乘以100产生序列相同性百分比。优选地，基本相同性存在于长度至少约10个、至少约20个、至少约50个、至少约100个、至少约200个、至少约300个、至少约500个、或至少约1000个残疾的序列的区域中。在最优选的实施方式中，序列在编码区的整个长度上基本相同。

本文公开的蛋白质(包括其功能部分及功能变体)可以包含合成氨基酸代替一种或多种天然存在的氨基酸。这样的合成氨基酸是本领域已知的，并且包括，例如但不限于氨基环己烷羧酸，正亮氨酸，α-氨基正癸酸，高丝氨酸，S-乙酰氨基甲基-半胱氨酸，反式-3-和反式-4-羟基苯丙氨酸，4-氨基苯丙氨酸，4-硝基苯丙氨酸，4-氯苯丙氨酸，4-羧基苯丙氨酸，β-苯基丝氨酸，β-羟基苯丙氨酸，苯基甘氨酸，α-萘基丙氨酸，环己基丙氨酸，环己基甘氨酸，二氢吲哚-2-羧酸，1，2，3，4-四氢异喹啉-3-羧酸，氨基马来酸，氨基马来酸单酰胺，N′-苄基-N′-甲基-赖氨酸，N′，N′-二苄基-赖氨酸，6-羟基赖氨酸，鸟氨酸，α-氨基环戊烷羧酸，α-氨基环己烷羧酸，α-氨基环庚烷羧酸，α-(2-氨基-2-降冰片烷)-羧酸，α，γ-二氨基丁酸，α，β-二氨基丙酸，高苯丙氨酸和α-叔丁基甘氨酸。

术语“基本上纯化的”是指核酸序列、多肽、蛋白质或其它化合物，基本上是不含，即不含超过约50％，不含超过约70％，不含超过约90％的，与该核酸、多肽、蛋白质或其他化合物天然相关的多核苷酸、蛋白质、多肽和其他分子。

可以使用本领域技术人员已知的方法化学合成的寡核苷酸构建块组装“合成基因”。将这些构建单元连接并退火以形成基因区段，然后将其酶促组装以构建整个基因。关于DNA序列的“化学合成”指体外组装的组分核苷酸。DNA的人工化学合成可以使用完善的过程完成。本领域技术人员想到如果密码子使用偏向于其表达的宿主细胞或生物体所偏爱的密码子，则增强基因表达的可能性。优选密码子的确定可以基于对从序列信息可得的宿主细胞衍生的基因的调查。

当针对多肽、核苷酸或其片段使用时，本文所用的术语“杂合体”是指多肽，多核苷酸或其片段，其氨基酸和/或核苷酸序列天然不存在。例如，两种异源蛋白质或多肽的融合蛋白或编码融合多肽的cDNA。

“配体诱导型多肽耦合器”在本文中可与“LIPC”互换使用，即“LIPC”可指“耦合器”(单数)或“耦合器”(复数)。如此，LIPC是指系统和该系统的多肽组分，其通过将核受体多肽组分并入融合蛋白(例如，使用的H组核受体和EcR受体多肽组分(例如，EcR多肽片段或结构域))中，以小分子配体依赖的方式在一起(“耦合”，即，寡聚化，二聚化)；包括如本文所述的EcR配体结合多肽和核受体USP和/或RXR核受体多肽组分(例如，多肽片段或其结构域)。

激活配体的给予和LIPC组分的配置可用于调节二聚化和多肽偶联激活的时间和位置。LIPC依赖于由非宿主天然的基因编码，并且由异源序列编码的蛋白质因子。用于控制宿主系统中多肽组分的空间和时间关联的LIPC可以衍生自外来来源，例如细菌、酵母、植物、昆虫、或病毒。因此，LIPC核受体多肽组分通过提供控制LIPC组分“融合”(即，被工程化为融合蛋白)的多肽或蛋白质的缔合(例如，二聚化，寡聚化)的机制，在宿主中赋予效用。

也被称为“基因开关”或“转录开关”的“遗传开关”用于控制基因表达，并被人工设计用于故意调节转基因。基因开关通常编码可以调节其活性的反式激活物或反式抑制剂，以及用于控制感兴趣的基因的反式激活物反应性或反式抑制剂敏感的启动子。这些因子可以分别是配体反应性的，含有DNA结合结构域，配体结合结构域和转录激活结构域或抑制结构域的嵌合蛋白。这些包括例如基于四环素-感觉反式激活剂和反式抑制剂的抗生素应答开关，哺乳动物或昆虫类固醇受体衍生的反式激活剂和雷帕霉素诱导的反式激活剂。其他遗传开关利用可被物理线索或信号故意激活的内源性转录因子，其瞬时激活被宿主细胞所耐受。这种系统的实例包括利用例如通过热或电离辐射激活的转录因子的基因开关。参见例如，Auslander，S.和Fussenegger，M.(2012).《生物技术趋势》(Trends inBiotechnology)(电子版)第1-14页；Vilaboa N，Boellmann F，Voellmy R(2011)用于故意调节转基因表达的基因开关：系统开发和使用的最新进展(Gene Switches forDeliberate Regulation of Transgene Expression：Recent Advances in SystemDevelopment and Uses).J Genet Syndr Gene Ther2：107，其全部内容通过引用纳入本文。

在一个实施方式中，遗传开关包括以下组分：1)在不存在激活剂配体的情况下，形成不稳定和非生产性异二聚体的共激活伴侣(CAP)和配体诱导型转录因子(LTF)；2)激活剂配体：分子(例如，蜕皮激素类似物或其他非类固醇小分子)；和3)诱导型启动子(例如，结合LTF的定制启动子)。在一个实施方式中，仅当小分子激活剂配体与开关组分(CAP和LTF)结合从而从诱导型启动子激活基因转录并最终导致所需蛋白质的表达时，遗传开关才允许转导基因的表达。遗传开关的时间、位置和浓度可以用激活剂配体以剂量依赖的方式调节。在某些实施方式中，由申请人开发的基于EcR的遗传开关的组件(例如，以商标使用)作为组成部分用于产生本发明的配体诱导型多肽耦合器(参见例如，PCT公开号WO2001/070816，WO 2002/066612，WO 2002/066613，WO 2002/066614，WO 2002/066615，WO2003/027266，WO2003/027289和WO 2005/108617，各自通过引用全文纳入本文)。

在本发明中，使用基于EcR的“遗传开关”的组分来产生本文公开内容所描述和设想的“配体诱导型多肽耦合器”。“蜕皮激素受体”和“EcR”在本文中可互换使用，是指分为亚类1，H组(本文称为“H组核受体”)的节肢动物核受体超家族成员。每个组的成员在E(配体结合)结构域中具有40-60％的氨基酸相同性(Laudet等，核受体亚类的统一命名系统(AUnified Nomenclature System for the Nuclear Receptor Subfamily)，1999；Cell 97：161-163，其通过引用全文纳入本文)。除了蜕皮激素受体外，该核受体亚类1，H组的其他成员包括：普遍存在受体(UR)，孤儿受体1(OR-1)，类固醇激素核受体1(NER-1)，RXR相互作用蛋白-15(RIP-15)，肝x受体β(LXRβ)，类固醇激素受体样蛋白(RLD-1)，肝x受体(LXR)，肝x受体α(LXRα)，法尼酯x受体(FXR)，受体相互作用蛋白14(RIP-14)和法尼醇受体(HRR-1)。EcR蛋白的特征在于特征DNA和配体结合结构域(LBD)和激活结构域(Koelle等，1991，Cell，67：59-77，其全部内容通过引用纳入本文)。EcR受体对多种甾族和非甾族化合物，即激活配体有反应。

“类视黄醇X受体”和“RXR”在本文中可互换使用，指核激素受体家族，特别是类固醇和甲状腺激素受体超家族的成员。脊椎动物RXR包括至少三个不同的基因(RXRα，β和γ)，其通过差异启动子使用和选择性剪接产生大量的蛋白质产物。RXR的无脊椎动物类似物(例如，超气门蛋白(USP))被发现在广泛的物种中，并被设想用于本发明。

本文所用的“激活配体”是指能够结合核类固醇受体超家族成员(例如，EcR和RXR)并通过诱导核受体组分的缔合而激活成员的化合物(例如，二聚化，寡聚化或蛋白质-蛋白质相互作用)。以下提供本发明的示例性激活配体。

当涉及本文所用的无活性多肽、结构域、信号分子、蛋白质或多肽片段、或多肽的蛋白质亚基时，术语“无活性”或“失活的”是指当前不产生全部或基本上全部一种或更多其固有的生物功能或活性的蛋白质或多肽。在一些实施方式中，通过与另一种蛋白质或多肽的缔合，即蛋白质-蛋白质相互作用而使无活性或失活的蛋白质或多肽被激活。这种激活可以例如，通过由第一核受体配体结合蛋白质片段与第二核受体蛋白质片段的结合诱导的寡聚而发生，其中第一和第二核受体片段是两个分开的，较大的第一和第二异源多肽，其中第一和第二异源多肽在配体诱导的寡聚化时从生物无活性变为生物活性状态。

本文所用术语“T细胞”或“T淋巴细胞”是一种类型的淋巴细胞，其在细胞介导的免疫中起核心作用通过细胞表面上的T细胞受体(TCR)的存在，它们可以区别于其它淋巴细胞，例如B细胞和天然杀伤细胞(NK细胞)。

本文所用的“抗体”是指单克隆或多克隆抗体。本文所用的术语“单克隆抗体”是指结合相同表位的抗体(例如，如由B细胞的单克隆产生的抗体)。相比之下，“多克隆抗体”是指结合相同抗原的不同表位的抗体群(例如，如由不同B细胞的异源混合物产生的抗体)。

本发明的配体诱导型多肽耦合器(LIPC)

本文描述的是配体诱导型多肽耦合器(LIPC)，其利用一对相互作用的核受体蛋白质对LIPC(即，核受体)组分工程改造以产生融合蛋白以将分离的蛋白质或结构域结合并诱导分离的蛋白质或结构域(例如，分离的，生物无活性的多肽单体，如通常需要二聚化以形成活性信号传导复合物的受体酪氨酸激酶多肽(RTK))的缔合(例如，二聚化，寡聚化)的能力。在某些实施方式中，本发明的开关系统是基于蜕皮激素受体(EcR)的系统。基于蜕皮激素受体的配体诱导型多肽耦合器相对于“亲本”非核受体(LIPC)多肽组分或结构域是异二聚或同二聚的。另一方面，应当理解，功能性核受体(例如，EcR复合物)通常是指含有两个或多个类固醇受体家族成员的异二聚蛋白质复合物。例如，从各种昆虫获得的蜕皮激素受体蛋白，以及超气门蛋白(USP)蛋白质或者USP，类视黄醇X受体(RXR)蛋白的脊椎动物同源物(参见例如，Yao等，(1993)Nature 366，476-479和Yao等，(1992)Cell 71，63-72，其各自通过引用全文纳入本文)。

本发明可以包括两个或更多个表达盒；编码与分离的多肽或结构域(例如，信号分子，信号结构域，互补蛋白质片段，蛋白质亚基以及天然或工程改造的部分或截短的蛋白质)融合的EcR和USP/RXR组分。在激活配体的存在下，含EcR的多肽与含有USP/RXR的多肽的相互作用使连接的(融合)蛋白或结构域紧密接近，使得它们缔合(蛋白质-蛋白质相互作用)，参见例如，图2-6。

蜕皮激素受体复合物一般包含作为核受体超家族成员的蛋白质，其中所有成员的特征通常是出现氨基末端反式激活结构域、DNA结合域(“DBD”)和由铰链区分开的配体结合域(“LBD”)。核受体超家族成员的特征也是出现四个或五个结构域：A/B、C、D、E和一些成员中的F(参见美国专利4,981,784和Evans，Science 240：889(1988)，各自通过引用全文纳入本文)。“A/B”结构域对应反式激活结构域，“C”对应DNA结合域，“D”对应铰链区和“E”对应配体结合域。家族的一些成员在LBD羧基末端也有另一个反式激活结构域，对应“F”。

这些结构域可以是来自不同核受体蛋白的天然(即天然存在)，修饰或嵌合体(即，异源融合蛋白)结构域。因为EcR、USP和RXR的结构域本质上是模块化的，因此可以互换LBD、DBD和反式激活结构域。

在某些实施方式中，利用双翅目(果蝇(Drosophila melanogaster))或鳞翅目昆虫(云杉卷叶蛾(Choristoneura fumiferana))超气门蛋白(USP)作为LIPC系统的一部分。在某些实施方式中，利用脊椎动物或哺乳动物类视黄醇X受体(RXR)(参见例如，国际公开号WO/2001/070816，其全部内容通过引用纳入本文)作为LIPC系统的一部分。在某些实施方式中，飞蝗(Locusta migratoria)的超气门蛋白(“LmUSP”)和美洲钝眼蜱(Amblyommaamericanum)的RXR同源物1和RXR同源物2(分别为“AmaRXR1”和“AmaRXR2”)的RXR同源物1和RXR同源物2及其非双翅目、非鳞翅目同源物，包括但不限于：招潮蟹(Celuca pugilator)RXR同源物(“CpRXR”)，黄粉虫(Tenebrio molitor)RXR同源物(“TmRXR”)，蜜蜂(Apismellifera)RXR同源物(“AmRXR”)，和桃蚜(Myzus persicae)RXR同源物(“MpRXR”)，所有这些在本文中统称为无脊椎动物RXR(并且其功能类似于脊椎动物类视黄醇X受体(RXR))被用作LIPC系统的一部分。

EcR组分

本发明提供了待用于本文所述的配体诱导型多肽耦合器系统中的蜕皮激素受体(EcR)多肽组分，例如，EcR配体结合结构域(LBD)。可以在本发明中使用的示例性EcR组分描述于，例如，国际PCT公开号WO 2001/070816，WO 2002/066612，WO 2002/066613，WO 2002/066614，WO 2002/066615，WO2003/027266，WO 2003/027289，WO 2005/108617和WO 2009/114201，其各自通过引用全文纳入本文。

在某些实施方式中，LIPC EcR组分是EcR配体结合结构域(LBD)，或相关的类固醇/甲状腺激素核受体家族成员LBD，其类似物，组合，修饰或片段。在一些实施方式中，LIPCLBD来自截短的EcR多肽或EcR LBD。其截短或取代突变可以通过本领域中使用的任何方法进行，包括但不限于限制性内切酶消化/删除，PCR介导的寡核苷酸定向删除，化学诱变，DNA链断裂等。

LIPC EcR多肽组分可以是无脊椎动物EcR，例如，选自节肢动物纲。在一些实施方式中，LIPC EcR多肽组分(或其片段)选自鳞翅目EcR、双翅目EcR、直翅目EcR、同翅目EcR和半翅目EcR。在特定实施方式中，EcR来自云杉卷叶蛾(Choristoneura fumiferana)EcR(“CfEcR”)，黄粉虫(Tenebrio molitor)EcR(“TmEcR”)，天蛾(Manduca sexta)EcR(“MsEcR”)，绿棉夜蛾(Heliothies virescens)EcR(“HvEcR”)，摇蚊(Chironomus tentans)EcR(“CfEcR”)，家蚕蛾(Bombyx mori)EcR(“BmEcR”)，果蝇(Drosophila melanogaster)EcR(“DmEcR”)，埃及斑蚊(Aedes aegypti)EcR(“AaEcR”)，绿头苍蝇(Lucilia capitata)EcR(“LcEcR”)，铜绿蝇(Lucilia cuprina)EcR(“LucEcR”)，地中海果实蝇(Ceratitiscapitata)EcR(“CcEcR”)，飞蝗(Locusta migratoria)EcR(“LmEcR”)，桃蚜(Myzuspersicae)EcR(“MpEcR”)，招潮蟹(Celuca pugilator)EcR(“CpEcR”)，美洲钝眼蜱(Amblyomma americanurn)EcR(“AmaEcR”)，银液粉虱(Bamecia argentifoli)EcR(“BaEcR”，SEQ ID NO：20)或黑尾叶蝉(Nephotetix cincticeps)EcR(“NcEcR”，SEQ ID NO：21)。在一个实施方式中，LIPC LBD(或其片段)来自云杉卷叶蛾(Choristoneurafumiferana)EcR(“CfEcR”)或果蝇(Drosophila melanogaster)EcR(“DmEcR”)。

在具体实施方式中，LIPC LBD来自截短的EcR多肽。在一些实施方式中，LIPC EcR多肽截短导致至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、240、245、250、255、260或265个氨基酸的缺失。优选地，LIPC EcR多肽截短导致至少一部分多肽结构域的缺失。更优选地，LIPC EcR多肽截短导致至少整个多肽结构域的缺失。在一个具体实施方式中，LIPC EcR多肽截短导致至少A/B-结构域、C-结构域、D-结构域、F-结构域、A/B/C-结构域、A/B/1/2-C-结构域、A/B/C/D-结构域、A/B/C/D/F-结构域、A/B/F-结构域、A/B/C/F-结构域、部分E结构域或部分F结构域的缺失。也可进行一些完整和/或部分结构域缺失的组合。

在一些实施方式中，LIPC蜕皮激素受体多肽组分或其片段由包含SEQ ID NO：22(CfEcR-EF)，SEQ ID NO：23(DmEcR-EF)，SEQ ID NO：23 SEQ ID NO：24(CfEcR-DE)，或SEQID NO：25(DmEcR-DE)的核酸序列或其片段的多核苷酸编码。

在一些实施方式中，LIPC蜕皮激素受体多肽组分或其片段由包含SEQ ID NO：1(CfEcR-DEF)，SEQ ID NO：2(CfEcR-CDEF)，SEQ ID NO：3(DmEcR-DEF)，SEQ ID NO：4(TmEcR-DEF)，或SEQ ID NO：5(AmaEcR-DEF)的核酸序列或其片段的多核苷酸编码。

在某些实施方式中，LIPC蜕皮激素受体多肽组分包含SEQ ID NO：26(CfEcR-EF)，SEQ ID NO：27(DmEcR-EF)，SEQ ID NO：28(CfEcR-DE)，或SEQ ID NO：29(DmEcR-DE)的核酸序列或其片段。在一些实施方式中，LIPC蜕皮激素受体多肽组分包含SEQ ID NO：6(CfEcR-DEF)，SEQ ID NO：8(CfEcR-CDEF)，SEQ ID NO：7(DmEcR-DEF)，SEQ ID NO：9(TmEcR-DEF)，或SEQ ID NO：10(AmaEcR-DEF)的氨基酸序列或其片段。

此外，已经鉴定了参与配体结合到H组核受体配体结合结构域(例如，EcR配体结合结构域)的氨基酸残基，其影响基于蜕皮激素受体的诱导型基因表达(“基因开关”)系统中的配体灵敏度和基因表达诱导的量级(参见例如，国际公开号WO 02/066612，其全部内容通过引用纳入本文)。这些取代突变体核受体多肽及其在LIPC系统中的用途可以在宿主细胞和生物体中提供改善的配体诱导(“激活”)的多肽耦合，其中配体灵敏度和配体诱导的寡聚化幅度的调节(调整，控制)可根据需要选择，具体取决于应用。如下文进一步描述的，包含取代突变的H组核受体(本文称为“取代突变体”)可用于本发明的配体诱导型多肽耦合器(LIPC)。

用于本发明的LIPC蜕皮激素受体(EcR)多肽组分(包括EcR配体结合结构域(LBD))可来自无脊椎动物EcR，例如，选自节肢动物EcR。在某些实施方式中，LIPC EcR多肽组分选自鳞翅目EcR、双翅目EcR、直翅目EcR、同翅目EcR和半翅目EcR。在某些实施方式中，用于本发明的EcR配体结合结构域选自云杉卷叶蛾(Choristoneura fumiferana)EcR(“CfEcR”)，黄粉虫(Tenebrio molitor)EcR(“TmEcR”)，天蛾(Manduca sexta)EcR(“MsEcR”)，绿棉夜蛾(Heliothies virescens)EcR(“HvEcR”)，摇蚊(Chironomus tentans)EcR(“CfEcR”)，家蚕蛾(Bombyx mori)EcR(“BmEcR”)，果蝇(Drosophila melanogaster)EcR(“DmEcR”)，埃及斑蚊(Aedes aegypti)EcR(“AaEcR”)，绿头苍蝇(Lucilia capitata)EcR(“LcEcR”)，铜绿蝇(Lucilia cuprina)EcR(“LucEcR”)，地中海果实蝇(Ceratitis capitata)EcR(“CcEcR”)，飞蝗(Locusta migratoria)EcR(“LmEcR”)，桃蚜(Myzus persicae)EcR(“MpEcR”)，招潮蟹(Celuca pugilator)EcR(“CpEcR”)，美洲钝眼蜱(Amblyomma americanurn)EcR(“AmaEcR”)，银液粉虱(Bamecia argentifoli)EcR(“BaEcR”)或黑尾叶蝉(Nephotetixcincticeps)EcR(“NcEcR”)。在一些实施方式中，LIPC多肽组分来自CfEcR、DmEcR或AmaEcR。

在本发明的某些实施方式中，LIPC H组核受体多肽组分由包含导致取代的密码子突变，或由其组成的多核苷酸编码，其中该取代位于：a)SEQ ID NO：17的氨基酸残基20、21、48、51、52、55、58、59、61、62、92、93、95、96、107、109、110、120、123、125、175、218、234或238，b)SEQ ID NO：17的氨基酸残基95和110，c)SEQ ID NO：17的氨基酸残基218和219，d)SEQ IDNO：17的氨基酸残基107和175，e)SEQ ID NO：17的氨基酸残基127和175，f)SEQ ID NO：17的氨基酸残基107和127，g)SEQ ID NO：17的氨基酸残基107、127和175，h)SEQ ID NO：17的氨基酸残基52、107和175，i)SEQ ID NO：17的氨基酸残基96、107和175，j)SEQ ID NO：17的氨基酸残基107、110和175，k)SEQ ID NO：18的氨基酸残基107、121、213或217，或1)SEQ IDNO：19的氨基酸残基91或105。在某些实施方式中，H组核受体陪配体结合域来自蜕皮激素受体。在某些实施方式中，包含取代突变的LIPC EcR多肽组分可包含约或至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或更多个用相对于野生型或天然存在的EcR受体配体结合结构域多肽不同的氨基酸取代的野生型或天然存在的氨基酸，或由其组成。

在另一个实施方式中，H组LIPC核受体配体多肽组分由包含导致取代的密码子突变的，或由其组成的多核苷酸编码，该取代是：a)与SEQ ID NO：17的氨基酸残基20、21、48、51、55、58、59、61、62、92、93、95、109、120、125、218、219、223、230、234或238相当或类似的位置处的丙氨酸残基，b)与SEQ ID NO：17的氨基酸残基52相当或类似的位置处的丙氨酸，缬氨酸，异亮氨酸或亮氨酸残基，c)与SEQ ID NO：17的氨基酸残基96相当或类似的位置处的丙氨酸，苏氨酸，天冬氨酸或甲硫氨酸残基，d)与SEQ ID NO：17的氨基酸残基110相当或类似的位置处的脯氨酸，丝氨酸，甲硫氨酸或亮氨酸残基，e)与SEQ ID NO：17的氨基酸残基123相当或类似位置处的苯丙氨酸残基，f)与SEQ ID NO：17的氨基酸残基95相当或类似的位置处的丙氨酸残基，和与SEQ ID NO：17的氨基酸残基110相当或类似的位置处的脯氨酸残基，g)与SEQ ID NO：17的氨基酸残基218和219相当或类似的位置处的丙氨酸残基，h)与SEQ ID NO：17的氨基酸残基107相当或类似的位置处的异亮氨酸残基，i)与SEQ ID NO：17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基，i)与SEQ ID NO：17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO：17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基，k)与SEQ ID NO：17的氨基酸残基127和175相当或类似的位置处的谷氨酰胺残基，1)与SEQ ID NO：17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO：17的氨基酸残基127相当或类似的位置处的谷氨酰胺残基，m)与SEQ IDNO：17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO：17的氨基酸残基127和175相当或类似的位置处的谷氨酰胺残基，n)与SEQ ID NO：17的氨基酸残基相当或类似的位置处的缬氨酸，与SEQ ID NO：17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO：17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基，o)与SEQ ID NO：17的氨基酸残基96相当或类似的位置处的丙氨酸残基，与SEQ ID NO：17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO：17的氨基酸残基相当或类似的位置处的谷氨酰胺残基，p)与SEQ ID NO：17的氨基酸残基52相当或类似的位置处的丙氨酸残基，与SEQ ID NO：17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQID NO：17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基，q)与SEQ ID NO：17的氨基酸残基96相当或类似的位置处的苏氨酸残基，与SEQ ID NO：17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO：17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基，r)与SEQ ID NO：17的氨基酸残基107相当或类似的位置处的异亮氨酸残基，与SEQ ID NO：17的氨基酸残基110相当或类似的位置处的脯氨酸残基和与SEQ ID NO：17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基，s)与SEQ ID NO：18的氨基酸残基107相当或类似的位置处的脯氨酸，t)与SEQ ID NO：18的氨基酸残基121相当或类似的位置处的精氨酸或亮氨酸，u)与SEQ ID NO：18的氨基酸残基213相当或类似的位置处的丙氨酸，v)与SEQ ID NO：18的氨基酸残基217相当或类似的位置处的丙氨酸或丝氨酸，w)与SEQ IDNO：19的氨基酸残基91相当或类似的位置处的丙氨酸，或x)与SEQ ID NO：19的氨基酸残基105相当或类似的位置处的脯氨酸。在某些实施方式中，LIPC H组核受体多肽组分来自蜕皮激素受体。

在另一个实施方式中，具有取代突变的LIPC H组核受体多肽组分是蜕皮激素受体配体结合结构域，其包括包含由导致取代突变的密码子突变或由其组成的多核苷酸编码的取代突变，或由其组成，该取代突变选自下组：a)SEQ ID NO：17的E20A，Q21A，F48A，I51A，T52A，T52V，T52I，T52L，T55A，T58A，V59A，L61A，I62A，M92A，M93A，R95A，V96A，V96T，V96D，V96M，V107I，F109A，A110P，A110S，A110M，A110L，Y120A，A123F，M125A，R175E，M218A，C219A，L223A，L230A，L234A，W238A，R95A/A110P，M218A/C219A/R175E，V107I/R175E，V107I/Y127E，V107I/Y127E/R175E，T52V/V107I/R175E，V96A/V107I/R175E，T52A/V107I/R175E，V96T/V107I/R175E或V107I/A110P/R75E取代突变，b)SEQ ID NO：18的A107P，G121R，G121L，N213A，C217A或C217S取代突变，以及c)SEQ ID NO：19的G91A或A105P取代突变。

在其它实施方式中，具有取代突变的LIPC H组核受体多肽组分是包含取代突变或由其组成的蜕皮激素受体配体结合结构域多肽，该取代突变由在包括小于500mM盐和至少37℃的杂交步骤，以及在2XSSPE中至少63℃的洗涤步骤的杂交条件下与包含导致选自下组的取代突变的密码子突变的多核苷酸杂交的多核苷酸编码：a)SEQ ID NO：17的T58A、A110P、A110L、A110S或A110M，b)SEQ ID NO：18的A107P，和c)和SEQ ID NO：19的A105P。在某些实施方式中，杂交条件包括针对杂交步骤的小于200mM盐和至少37℃。在另一优选的实施方式中，杂交条件包括针对杂交和洗涤步骤的2×SSPE和63℃。在另一个实施方式中，蜕皮激素受体配体结合结构域缺乏或表现出减少的类固醇结合活性，例如20-羟基蜕皮激素结合活性，松甾酮A结合活性，或莫瑞甾酮A结合活性。

在某些实施方式中，LIPC H组核受体多肽组分具有与以下相当或类似的位置处的取代突变：a)SEQ ID NO：17的氨基酸残基20、21、48、51、52、55、58、59、61、62、92、93、95、96、107、109、110、120、123、125、175、218、234或238，b)SEQ ID NO：17的氨基酸残基95和110，c)SEQ ID NO：17的氨基酸残基218和219，d)SEQ ID NO：17的氨基酸残基107和175，e)SEQ IDNO：17的氨基酸残基127和175，f)SEQ ID NO：17的氨基酸残基107和127，g)SEQ ID NO：17的氨基酸残基107、127和175，h)SEQ ID NO：17的氨基酸残基52、107和175，i)SEQ ID NO：17的氨基酸残基96、107和175，j)SEQ ID NO：17的氨基酸残基107、110和175，k)SEQ ID NO：18的氨基酸残基107、121、213或217，或1)SEQ ID NO：19的氨基酸残基91或105。在某些实施方式中，LIPC H组核受体多肽组分来自蜕皮激素受体。

在一些实施方式中，LIPC H组核受体配体多肽组分具有以下取代：a)与SEQ IDNO：17的氨基酸残基20、21、48、51、55、58、59、61、62、92、93、95、109、120、125、218、219、223、230、234或238相当或类似的位置处的丙氨酸残基，b)与SEQ ID NO：17的氨基酸残基52相当或类似的位置处的丙氨酸，缬氨酸，异亮氨酸或亮氨酸残基，c)与SEQ ID NO：17的氨基酸残基96相当或类似的位置处的丙氨酸，苏氨酸，天冬氨酸或甲硫氨酸残基，d)与SEQ ID NO：17的氨基酸残基110相当或类似的位置处的脯氨酸，丝氨酸，甲硫氨酸或亮氨酸残基，e)与SEQID NO：17的氨基酸残基123相当或类似位置处的苯丙氨酸残基，f)与SEQ ID NO：17的氨基酸残基95相当或类似的位置处的丙氨酸残基，和与SEQ ID NO：17的氨基酸残基110相当或类似的位置处的脯氨酸残基，g)与SEQ ID NO：17的氨基酸残基218和219相当或类似的位置处的丙氨酸残基，h)与SEQ ID NO：17的氨基酸残基107相当或类似的位置处的异亮氨酸残基，i)与SEQ ID NO：17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基，j)与SEQ IDNO：17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO：17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基，k)与SEQ ID NO：17的氨基酸残基127和175相当或类似的位置处的谷氨酰胺残基，1)与SEQ ID NO：17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO：17的氨基酸残基127相当或类似的位置处的谷氨酰胺残基，m)与SEQ ID NO：17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQID NO：17的氨基酸残基127和175相当或类似的位置处的谷氨酰胺残基，n)与SEQ ID NO：17的氨基酸残基相当或类似的位置处的缬氨酸，与SEQ ID NO：17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO：17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基，o)与SEQ ID NO：17的氨基酸残基96相当或类似的位置处的丙氨酸残基，与SEQID NO：17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO：17的氨基酸残基相当或类似的位置处的谷氨酰胺残基，p)与SEQ ID NO：17的氨基酸残基52相当或类似的位置处的丙氨酸残基，与SEQ ID NO：17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO：17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基，q)与SEQ ID NO：17的氨基酸残基96相当或类似的位置处的苏氨酸残基，与SEQ ID NO：17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO：17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基，r)与SEQ ID NO：17的氨基酸残基107相当或类似的位置处的异亮氨酸残基，与SEQ ID N：17的氨基酸残基110相当或类似的位置处的脯氨酸残基和与SEQ ID NO：17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基，s)与SEQ ID NO：18的氨基酸残基107相当或类似的位置处的脯氨酸，t)与SEQ ID NO：18的氨基酸残基121相当或类似的位置处的精氨酸或亮氨酸，u)与SEQ ID NO：18的氨基酸残基213相当或类似的位置处的丙氨酸，v)与SEQ ID NO：18的氨基酸残基217相当或类似的位置处的丙氨酸或丝氨酸，w)与SEQ ID NO：19的氨基酸残基91相当或类似的位置处的丙氨酸，或x)与SEQ IDNO：19的氨基酸残基105相当或类似的位置处的脯氨酸。在某些实施方式中，LIPC H组核受体多肽组分来自蜕皮激素受体。

在另一个实施方式中，具有取代突变的LIPC H组核受体多肽组分是包含取代突变的蜕皮激素受体配体结合结构域多肽，其中该取代突变选自下组：a)SEQ ID NO：17的E20A，Q21A，F48A，I51A，T52A，T52V，T52I，T52L，T55A，T58A，V59A，L61A，I62A，M92A，M93A，R95A，V96A，V96T，V96D，V96M，V107I，F109A，A110P，A110S，A110M，A110L，Y120A，A123F，M125A，R175E，M218A，C219A，L223A，L230A，L234A，W238A，R95A/A110P，M218A/C219A/R175E，V107I/R175E，V107I/Y127E，V107I/Y127E/R175E，T52V/V107I/R175E，V96A/V107I/R175E，T52A/V107I/R175E，V96T/V107I/R175E或V107I/A110P/R75E取代突变，b)SEQ ID NO：18的A107P，G121R，G121L，N213A，C217A或C217S取代突变，以及c)SEQ ID NO：19的G91A或A105P取代突变。

在某些实施方式中，本发明的LIPC蛋白质中使用的EcR多肽组分(氨基酸序列)包含一个或多个选自表1所示的一组取代的取代突变，或由其组成。

表1：可用于LIPC系统的EcR多肽取代突变。

RXR组分

本发明提供了待用于本文所述的配体诱导型多肽耦合器(LIPC)的特定RXR组分，包括RXR配体结合结构域(LBD)。可以在本发明中使用的示例性RXR组分包括，例如，国际PCT公开号WO 2001/070816，WO 2002/066612，WO 2002/066613，WO 2002/066614，WO 2002/066615，WO 2003/027266，WO2003/027289，WO 2005/108617和WO 2009/114201中所述的那些，其各自通过引用全文纳入本文。

在某些实施方式中，LIPC RXR组分是小家鼠(Mus musculus)RXR(MmRXR)或智人(Homo sapiens)RXR(HsRXR)。LIPC RXR组分可以是RXR_α，RXR_β或RXR_γ同种型或其片段。

在一些实施方式中，RXR LIPC组件是截短的RXR。LIPC RXR多肽截短可包含至少1、2、3、4、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、240、245、250、255、260或265个氨基酸的缺失，或由其组成。在某些实施方式中，LIPC RXR多肽截短包含至少部分多肽结构域的缺失或由其组成。在一些实施方式中，LIPC RXR多肽截短包含至少整个多肽结构域的缺失或由其组成。在一个具体实施方式中，LIPC EcR多肽截短包含至少A/B-结构域缺失、C-结构域缺失、D-结构域缺失、E-结构域缺失、F-结构域缺失、A/B/C-结构域缺失、A/B/1/2-C-结构域缺失、A/B/C/D-结构域缺失、A/B/C/D/F-结构域缺失、A/B/F-结构域、和A/B/C/F-结构域缺失，或由其组成。也可进行一些完整和/或部分结构域缺失的组合。

在某些实施方式中，LIPC RXR多肽组分由包含选自下组的核酸序列，或由其组成的多核苷酸编码：SEQ ID NO：30，SEQ ID NO：31，SEQ ID NO：32，SEQ ID NO：33，SEQ ID NO：34，SEQ ID NO：35，SEQ ID NO：36，SEQ ID NO：37，SEQ ID NO：38，和SEQ ID NO：39，或其片段。

在另一个实施方式中，LIPC RXR组分包含选自下组的多肽序列，或由其组成：SEQID NO：40，SEQ ID NO：41，SEQ ID NO：42，SEQ ID NO：43，SEQ ID NO：44，SEQ ID NO：45，SEQID NO：46，SEQ ID NO：47，SEQ ID NO：48，和SEQ ID NO：49，或其片段。

在某些实施方式中，本发明的LIPC包括嵌合RXR多肽，其包含选自下组的至少两种多肽片段：1)脊椎动物物种RXR多肽片段；2)无脊椎动物物种RXR多肽片段；和3)非双翅目/非鳞翅目无脊椎动物物种RXR多肽片段。本发明的LIPC嵌合RXR多肽组分可以包含两种不同的动物物种RXR多肽片段，或由其组成，或者当动物物种相同时，两个或多个多肽片段可以来自动物物种RXR多肽片段的两个或多个不同同种型。

在一些实施方式中，脊椎动物物种LIPC RXR多肽片段包含小家鼠(Mus musculus)RXR(MmRXR)或智人(Homo sapiens)RXR(HsRXR)或其片段，或由其组成。LIPC RXR多肽组分可以包含RXR_α，RXR_β或RXR_γ同种型或其片段，或由其组成。

在一些实施方式中，脊椎动物物种LIPC RXR多肽片段来自由多核苷酸编码的脊椎动物物种RXR，该多核苷酸包含SEQ ID NO：62、SEQ ID NO：63、SEQ ID NO：64、SEQ ID NO：65、SEQ ID NO：66和SEQ ID NO：67或其片段的核酸序列，或其组成。在另一个实施方式中，脊椎动物物种LIPC RXR多肽片段来自脊椎动物物种RXR，其包含选自SEQ ID NO：68、SEQ IDNO：69、SEQ ID NO：70、SEQ ID NO：71、SEQ ID NO：72和SEQ ID NO：73或其片段的核酸序列，或其组成。

在另一个实施方式中，LIPC无脊椎动物物种RXR多肽片段来自飞蝗(Locustamigratoria)超气门多肽(LmUSP)、美洲钝眼蜱(Amblyomma americanum)RXR同源物1(AmaRXR1)、美洲钝眼蜱(Amblyomma americanum)RXR同源物2(AmaRXR2)、招潮蟹(Celucapugilator)RXR同源物(CpRXR)、黄粉虫(Tenebrio molitor)RXR同源物(TmRXR)、蜜蜂(Apismellifera)RXR同源物(AmRXR)、和桃蚜(Myzus persicae)RXR同源物(MpRXR)。

在某些实施方式中，LIPC无脊椎动物物种RXR多肽片段来自由多核苷酸编码的无脊椎动物物种RXR多肽，该多核苷酸包含SEQ ID NO：50、SEQ ID NO：51、SEQ ID NO：52、SEQID NO：53、SEQ ID NO：54或SEQ ID NO：55或其片段的核酸序列，或其组成。在另一个实施方式中，LIPC无脊椎动物物种RXR多肽片段来自无脊椎动物物种RXR多肽，其包含SEQ ID NO：56、SEQ ID NO：57、SEQ ID NO：58、SEQ ID NO：59、SEQ ID NO：60或SEQ ID NO：61或其片段的氨基酸序列，或其组成。

在某些实施方式中，LIPC无脊椎动物物种RXR多肽片段来自非双翅目/非鳞翅目无脊椎动物物种RXR同源物。

在一些实施方式中，LIPC嵌合RXR组分包含至少一个脊椎动物种RXR多肽片段和一个无脊椎动物种RXR多肽片段，或由其组成。

在另一个实施方式中，LIPC嵌合RXR组分包含至少一个脊椎动物种RXR多肽片段和一个非双翅目/非鳞翅目无脊椎动物种RXR同源物多肽片段，或由其组成。

在另一个实施方式中，LIPC嵌合RXR组分包含至少一个无脊椎动物种RXR多肽片段和一个非双翅目/非鳞翅目无脊椎动物种RXR同源物多肽片段，或由其组成。

在另一个实施方式中，LIPC嵌合RXR组分包含至少一个脊椎动物种RXR多肽片段和一个不同脊椎动物种RXR多肽片段，或由其组成。

在另一个实施方式中，LIPC嵌合RXR组分包含至少一个无脊椎动物种RXR多肽片段和一个不同无脊椎动物种RXR多肽片段，或由其组成。

在另一个实施方式中，LIPC嵌合RXR组分包含至少一个非双翅目/非鳞翅目无脊椎动物种RXR多肽片段和一个不同的非双翅目/非鳞翅目无脊椎动物种RXR多肽片段，或由其组成。

在某些实施方式中，LIPC嵌合RXR组分具有包含至少一个多肽片段的RXR区域，所述多肽片段选自EF结构域螺旋1，EF结构域螺旋2，EF结构域螺旋3，EF结构域螺旋4，EF结构域螺旋5，EF结构域螺旋6，EF结构域螺旋7，EF结构域螺旋8，和EF结构域螺旋9，EF结构域螺旋10，EF结构域螺旋11，EF结构域螺旋12，F结构域，和/或EF结构域β折叠片，其中两个或多个结构域中的至少一个来自不同物种RXR(例如，人RXR多肽片段和鼠RXR多肽片段)。

在另一个实施方式中，LIPC嵌合RXR组分的第一多肽片段包含第一物种RXR的螺旋1-6，螺旋1-7，螺旋1-8，螺旋1-9，螺旋1-10，螺旋1-11，或螺旋1-12，或由其组成，并且嵌合LIPC RXR组分的第二多肽片段包含第二物种RXR的螺旋7-12，螺旋8-12，螺旋9-12，螺旋10-12，螺旋11-12，螺旋12，或F结构域，或由其组成。

在另一个实施方式中，LIPC嵌合RXR组分的第一多肽片段包含第一物种RXR的螺旋1-6或由其组成，并且LIPC嵌合RXR组分的第二多肽片段包含第二物种RXR的螺旋7-12。

在另一个实施方式中，LIPC嵌合RXR组分的第一多肽片段包含第一物种RXR的螺旋1-7或由其组成，并且LIPC嵌合RXR组分的第二多肽片段包含第二物种RXR的螺旋8-12或由其组成。

在另一个实施方式中，LIPC嵌合RXR组分的第一多肽片段包含第一物种RXR的螺旋1-8或由其组成，并且LIPC嵌合RXR组分的第二多肽片段包含第二物种RXR的螺旋9-12或由其组成。

在另一个实施方式中，LIPC嵌合RXR组分的第一多肽片段包含第一物种RXR的螺旋1-9或由其组成，并且LIPC嵌合RXR组分的第二多肽片段包含第二物种RXR的螺旋10-12或由其组成。

在另一个实施方式中，LIPC嵌合RXR组分的第一多肽片段包含第一物种RXR的螺旋1-10或由其组成，并且LIPC嵌合RXR组分的第二多肽片段包含第二物种RXR的螺旋11-12或由其组成。

在另一个实施方式中，LIPC嵌合RXR组分的第一多肽片段包含第一物种RXR的螺旋1-11或由其组成，并且LIPC嵌合RXR组分的第二多肽片段包含第二物种RXR的螺旋12或由其组成。

在另一个实施方式中，LIPC嵌合RXR组分的第一多肽片段包含第一物种RXR的螺旋1-12或由其组成，并且LIPC嵌合RXR组分的第二多肽片段包含第二物种RXR的F结构域或由其组成。

在另一个实施方式中，LIPC RXR组件包含截短的嵌合RXR或由截短的嵌合RXR组成。嵌合RXR截短可包括至少1、2、3、4、5、6、8、10、13、14、15、16、17、18、19、20、21、22、25、26、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、或240个氨基酸的缺失。在某些实施方式中，嵌合RXR截短导致至少部分多肽结构域的缺失。在其他实施方式中，嵌合RXR截短导致至少整个多肽结构域的缺失。在另一个实施方式中，嵌合RXR截短导致至少部分E-结构域，完整E-结构域，部分F域，完整F结构域，EF结构域螺旋1，EF结构域螺旋2，EF域螺旋3，EF结构域螺旋4，EF结构域螺旋5，EF结构域螺旋6，EF结构域螺旋7，EF结构域螺旋8和EF结构域螺旋9，EF域螺旋10，EF结构域螺旋11，EF结构域螺旋12和/或EF结构域β折叠片的缺失。也可进行几种部分和/或完整结构域缺失的组合。

在某些实施方式中，LIPC截短的嵌合RXR组分由多核苷酸编码，该多核苷酸包含SEQ ID NO：74、SEQ ID NO：75、SEQ ID NO：76、SEQ ID NO：77、SEQ ID NO：78或SEQ ID NO：79或其片段的核酸序列，或由其组成。在另一个实施方式中，LIPC截短的嵌合RXR组分包含SEQ ID NO：80、SEQ ID NO：81、SEQ ID NO：82、SEQ ID NO：83、SEQ ID NO：84或SEQ ID NO：85或其片段的核酸序列，或由其组成。

在另一个实施方式中，LIPC嵌合RXR组分由包含下述核酸序列，或由其组成的多核苷酸编码：a)SEQ ID NO：11，b)SEQ ID NO：12的核苷酸1-348和SEQ ID NO：13的核苷酸268-630，c)SEQ ID NO：12的核苷酸1-408和SEQ ID NO：13的核苷酸337-630，d)SEQ ID NO：12的核苷酸1和SEQ ID NO：13的核苷酸403-630，e)SEQ ID NO：12的核苷酸1-555和SEQ ID NO：13的核苷酸490-630，f)SEQ ID NO：12的核苷酸1-624和SEQ ID NO：13的核苷酸547-630，g)SEQ ID NO：12的核苷酸1-645和SEQ ID NO：13的核苷酸601-630，和h)SEQ ID NO：12的核苷酸1-717，和/或SEQ ID NO：13的核苷酸613-630，或其片段。

在另一个优选实施方式中，LIPC嵌合RXR组分包含以下氨基酸序列，或由其组成：a)SEQ ID NO：14，b)SEQ ID NO：15的氨基酸1-116和SEQ ID NO：16的氨基酸90-210，c)SEQID NO：15的氨基酸1-136和SEQ ID NO：16的氨基酸113-210，d)SEQ ID NO：15的氨基酸1-155和SEQ ID NO：16的氨基酸135-210，e)SEQ ID NO：15的氨基酸1-185和SEQ ID NO：16的氨基酸164-210，f)SEQ ID NO：15的氨基酸1-208和SEQ ID NO：16的氨基酸183-210，g)SEQID NO：15的氨基酸1-215和SEQ ID NO：16的氨基酸201-210，和/或h)SEQ ID NO：15的氨基酸1-239或SEQ ID NO：16的氨基酸205-210，或其片段。

EcR和/或RXR多肽组分

在某些实施方式中，在本发明的LIPC中使用的EcR和/或USP/RXR多肽包含至少一种或多种选自以下任意一个或多个国际公开所述的取代突变的EcR和/或RXR取代突变体或由其组成：WO 2001/070816，WO2002/066612，WO 2002/066613，WO 2002/066614，WO 2002/066615，WO2003/027266，WO 2003/027289，和WO 2005/108617，其各自通过引用全文纳入本文。

本发明的基因表达盒

本发明的一个实施方式包括配体诱导型多肽耦合器(LIPC)系统，其包含：a)能够在包含编码第一融合蛋白(多肽)的多核苷酸的宿主细胞中表达的第一表达盒，其包含i)核受体多肽或其片段；和ii)第一无活性信号传导结构域；和b)能够在宿主细胞中表达的第二表达盒，其包含编码第二，分离的融合蛋白(多肽)的多核苷酸序列，其包含i)第二核受体多肽或其片段；和ii)第二无活性信号传导结构域；其中所述第一和第二无活性信号传导结构域在两种融合蛋白彼此缔合时被激活。

本发明的另一个实施方式包括配体诱导型多肽耦合器(LIPC)系统，其包含：a)能够在包含编码第一融合蛋白(多肽)的多核苷酸的宿主细胞中表达的第一表达盒，其包含i)节肢动物核受体多肽或其片段；和ii)第一无活性信号传导结构域；和b)能够在宿主细胞中表达的第二表达盒，其包含编码第二，分离的融合蛋白(多肽)的多核苷酸序列，其包含i)第二非节肢动物核受体多肽或其片段；和ii)第二无活性信号传导结构域；其中所述第一和第二无活性信号传导结构域在两种融合蛋白彼此缔合时被激活。在另一个实施方式中，非节肢动物核受体包含非双翅目/非鳞翅目核受体多肽或其片段。在另一个实施方式中，非节肢动物核受体包含哺乳动物核受体多肽或其片段。在另一个实施方式中，非节肢动物核受体包含人核受体多肽或其片段。在另一个实施方式中，非节肢动物核受体包含鼠核受体多肽或其片段。在另一个实施方式中，非节肢动物核受体包含嵌合核受体多肽或其片段，其中所述嵌合体包含来自两种或更多种不同物种的多肽组分。

本发明的一个实施方式包括配体诱导型多肽耦合器(LIPC)系统，其包含：a)能够在包含编码第一融合蛋白(多肽)的多核苷酸的宿主细胞中表达的第一表达盒，其包含i)蜕皮激素受体(EcR)多肽或其片段；和ii)第一无活性信号传导结构域；和b)能够在宿主细胞中表达的第二表达盒，其包含编码第二，分离的融合蛋白(多肽)的多核苷酸序列，其包含i)类视黄醇X受体多肽或其片段；和ii)第二无活性信号传导结构域；其中所述第一和第二无活性信号传导结构域在两种融合蛋白彼此缔合时被激活。

如本文所述，当与EcR配体结合结构域和RXR配体结合结构域组合时，任选地用于如下所述的发明中的配体提供了用于外部时间调节(激活或撤回激活)信号传导结构域的手段，即通过停止给予配体或与配体接触。配体与LIPC EcR和RXR多肽组分的结合使得能够产生LIPC融合蛋白的蛋白质-蛋白质相互作用以及在某些实施方式中激活信号传导结构域。在一些实施方式中，改变一个或多个LIPC结构域产生杂合LIPC。在某些实施方式中，杂合基因和所得杂合蛋白质在所选择的宿主细胞或生物体中针对所需活性和配体的互补结合优化。

无活性信号传导结构域

本发明的实施方式包括配体诱导型多肽耦合器系统，其允许无活性结构域(例如，信号传导分子，信号传导结构域，互补蛋白质片段，蛋白质亚基以及天然的或工程改造的部分或截短的蛋白质)通过蛋白质-蛋白质相互作用或缔合来定制激活(例如，剂量调节的，诱导型)。

在某些实施方式中，其活性待调节的信号传导蛋白和/或多肽结构域是相对于宿主细胞的同源蛋白质或其片段。在其它实施方式中，其活性待调节的信号传导蛋白和/或多肽结构域是相对于宿主细胞的异源蛋白质或其片段。

本发明的实施方式包括编码涉及疾病、病症、功能障碍、遗传缺陷、药物发现目标和蛋白质组学分析和应用等的多肽或信号传导结构域的信号传导蛋白和多肽结构域的组合物和用途。

已经在广泛的生物体中鉴定了需要缔合(例如二聚化或寡聚化)或蛋白质-蛋白质相互作用的许多细胞信号传导多肽和结构域(例如，信号传导蛋白)，并可用于本发明。这些信号传导分子中的许多参与在大量生物体中保守的信号传导途径。

例如，用单个跨膜结构域锚定在膜中的许多细胞表面受体主要通过内源(即天然存在的)配体诱导的二聚化或寡聚化来激活。通常，这些分子本身不缔合，而是通过与内源胞外配体的相互作用而聚集在一起(或者靠近其结合伴侣)。与内源性天然存在的细胞信号蛋白激活相反，本发明提供了一种小分子配体诱导型多肽耦合器系统，以调节(即，开启，关闭，增加或减少)活性，即通过小分子核受体激活配体的“按需”给药(或撤回给药)二聚化或寡聚化细胞信号传导蛋白和结构域。对于利用蛋白质二聚化或寡聚化用于激活的各种分子和途径的综述，参见例如，Klemm等，Annu.Rev.Immunol.16：569-92(1998)，其全部内容通过引用纳入本文。

在某些实施方式中，设想以下来自细胞表面受体的信号传导分子和/或结构域，细胞内信号传导蛋白及其相关途径成员作为本发明的第一和/或第二无活性信号传导结构域，信号传导分子，互补蛋白质片段，蛋白质亚基，或天然或工程改造的部分或截短的蛋白质用于本发明：

受体酪氨酸激酶(RTK)受体及其相关的通路成员，包括RTK I类(EGF受体家族)(ErbB家族)，RTK II类(胰岛素受体家族)，RTK III类(PDGF受体家族)，RTK IV类(FGF受体家族)，RTK V类(VEGF受体家族)，RTK VI类(HGF受体家族)，RTK VII类(Trk受体家族)，RTKVIII类(Eph受体家族)，RTK IX类(AXL受体家族)，RTK X类(LTK受体家族)，RTK XI类(TIE受体家族)，RTK XII类(ROR受体家族)，RTK类XIII(DDR受体家族)，RTK XIV类(RET受体家族)，RTK XV类(KLG家族)，RTK XVI类(RYK受体家族)，和RTK XVII类(MuSK受体家族)。

细胞因子受体及其相关的途径成员，包括I型细胞因子受体(例如，1型白介素受体，红细胞生成素受体，GM-CSF受体，G-CSF受体，生长激素受体，催乳素受体，制瘤素M受体和白血病抑制因子受体)，II型细胞因子受体(例如，II型白介素受体，干扰素-α/β受体和干扰素-γ受体)，免疫球蛋白超家族的成员(例如，白介素-1受体，CSF1，C-kit受体和白介素-18受体)。肿瘤坏死因子受体家族(例如，CD27，CD30，CD40，CD120和淋巴毒素β受体)。趋化因子受体(例如，白介素-8受体，CCR1，CXCR4，MCAF受体，和NAP-2受体)。TGF-β受体(例如，TGFβ受体1和TGFβ受体2)。抗原受体信号传导受体(例如，B细胞和T细胞抗原受体)。

设想与本发明一起使用的其他信号传导蛋白和/或结构域包括但不限于萤火虫荧光素酶(fLuc)，信号转导和转录激活因子(STAT)蛋白，NF-κB蛋白，抗体(包括抗体片段)，转录因子，核受体，包括核激素受体，14-3-3蛋白，G蛋白偶联受体，G蛋白，驱动蛋白，磷酸丙糖异构酶(TIM)，醇脱氢酶，因子XI，因子XIII，Toll样受体，纤维蛋白原，Bcl-2家族成员，Smad家族成员等。

在某些实施方式中，本发明的无活性信号传导结构域具有跨膜结构域。在一些实施方式中，跨膜结构域是单通跨膜结构域。在某些实施方式中，单通跨膜结构域是单通I型跨膜结构域。在其它实施方式中，跨膜结构域是多通跨膜结构域。在某些实施方式中，跨膜结构域具有亲水性α螺旋基序。

激活配体

可用于本发明的可接受的激活配体是调节开关系统的信号传导结构域的蛋白质-蛋白质相互作用的任何一种，其中配体的存在导致无活性信号传导结构域的激活。这些配体包括国际PCT公开号WO 2002/066612，WO 2002/066614，WO 2003/105849，WO 2004/072254，WO 2004/005478，WO 2004/078924，WO2005/017126，WO 2008/153801，WO 2009/114201，WO 2013/036758，WO2014/144380和美国专利号6258603和8748125中公开的那些，其各自的全部内容通过引用纳入本文。

示例性配体包括但不限于：松甾酮，莫瑞甾酮A，9-顺式-视黄酸，视黄酸的合成类似物，N，N′-酰基肼，例如美国专利号6013836、5117057、5530028和537872中公开的那些，其各自的全部内容通过引用纳入本文；二苯甲酰基烷基氰基肼，例如欧洲申请号461809中公开的那些，其全部内容通过引用纳入本文；N-烷基-N，N′-二芳酰基肼，例如美国专利号5225443中公开的那些，其全部内容通过引用纳入本文；N-酰基-N-烷基羰基肼，例如欧洲申请号234994中公开的那些，其全部内容通过引用纳入本文；N-芳酰基-N-烷基-N′-芳酰基肼，例如美国专利号4985461中所述的那些，其全部内容通过引用纳入本文，以及其它类似的材料，包括3，5-二叔丁基-4-羟基-N-异丁基-苯甲酰胺，8-O-乙酰基海胆等。

在某些实施方式中，用于本发明的方法的配体是下式的化合物：

其中E是含叔碳的(C₄-C₆)烷基或含叔碳的氰基(C₃-C₅)烷基；R¹是H、Me、Et、i-Pr、F、甲酰基、CF₃、CHF₂、CHCl₂、CH₂F、CH₂Cl、CH₂OH、CH₂OMe、CH₂CN、CN、C≡CH、1-丙炔基、2-丙炔基、乙烯基、OH、OMe、OEt、环丙基、CF₂CF₃、CH＝CHCN、烯丙基、叠氮基、SCN、或SCHF₂；

R³是H、Et，或与R³以及R²和R³接合的苯基碳连接以形成亚乙基二氧基，与苯基碳相邻的氧形成二氢呋喃环，或与苯基碳相邻的氧形成二氢吡喃环；R⁴、R⁵、和R⁶独立地是H、Me、Et、F、Cl、Br、甲酰基、CF₃、CHF₂、CHCl₂、CH₂F、CH₂Cl、CH₂OH、CN、C≡CH、1-丙炔基、2-丙炔基、乙烯基、OMe、OEt、SMe、或Set。

在一些实施方式中，用于本发明的方法的配体是下式的化合物：

或者

其中，R¹、R²、R³和R⁴是：

a)H，(C₁-C₆)烷基；(C₁-C₆)卤代烷基；(C₁-C₆)氰基烷基；(C₁-C₆)羟基烷基；(C₁-C₄)烷氧基(C₁-C₆)烷基；任选地被卤素、氰基、羟基或(C₁-C₄)烷基取代的(C₂-C₆)烯基；任选地被卤素、氰基、羟基或(C₁-C₄)烷基取代的(C₂-C₆)炔基；任选地被卤素、氰基、羟基或(C₁-C₄)烷基取代的(C₃-C₅)环烷基；任选地被卤素、氰基或(C₁-C₄)烷基取代的环氧乙烷基；或

b)未取代或取代的苄基，其中取代基独立地是1至5H、卤素、硝基、氰基、羟基、(C₁-C₆)烷基、或(C₁-C₆)烷氧基；并且R⁵是H；OH；F；Cl；或(C₁-C₆)烷氧基。

在一些实施方式中，当R¹、R²、R³、和R⁴为H时，R⁵不是H或羟基。

在某些实施方式中，R¹、R²、R³、和R⁴中的至少一个不是H。在另一个实施方式中，R¹、R²、R³、和R⁴中的至少两个不是H。在另一个实施方式中，R¹、R²、R³、和R⁴中至少三个不是H。在另一个实施方式中，R¹、R²、R³、和R⁴各自不是H。

在一些实施方式中，当R¹、R²、R³、和R⁴为H时，R⁵不是甲氧基，当R¹、R²、R³、和R⁴为异丙基时，R⁵不是羟基，并且当R¹、R²、和R³为H并R⁵为羟基，R⁴不是甲基或乙基。

在具体实施方式中，R¹、R²、R³、和R⁴是：a)H、(C₁-C₆)烷基；(C₁-C₆)卤代烷基；(C₁-C₆)氰基烷基；(C₁-C₆)羟基烷基；(C₁-C₄)烷氧基(C₁-C₆)烷基；(C₂-C₆)烯基；(C₂-C₆)炔基；任选地被卤素、氰基或(C₁-C₄)烷基取代的环氧乙烷基；或b)未取代的或取代的苄基，其中取代基独立地是1至5H、卤素、氰基或(C₁-C₆)烷基；并且R⁵是H、OH、F、Cl、或(C₁-C₆)烷氧基。

在其它具体实施方式中，R¹、R²、R³、和R⁴是H，(C₁-C₆)烷基；(C₂-C₆)烯基；(C₂-C₆)炔基；2′-乙基环氧乙烷基或苄基；R⁵是H；OH；或F。

在具体实施方式中，当R¹、R²、R³、和R⁴为异丙基时，R⁵不是羟基；当R⁵是H、羟基、甲氧基或氟时，R¹、R²、R³、和R⁴中的至少一个不是H；当R¹、R²、R³、和R⁴中只有一个是甲基，且R⁵是H或羟基时，其余的R¹、R²、R³、和R⁴不是H；当R⁴以及R¹、R²、和R³中的一个为甲基时，则R⁵既不是H也不是羟基；当R¹、R²、R³、和R⁴都是甲基时，R⁵不是羟基；当R¹、R²和R³全部为H且R⁵为羟基时，R⁴不是乙基、正丙基、正丁基、烯丙基或苄基。

本发明的某些实施方式包括使用以下甾体配体：20-羟基蜕皮激素，2-甲基醚；20-羟基蜕皮激素，3-甲基醚；20-羟基蜕皮激素，14-甲基醚；20-羟基蜕皮激素，2，22-二甲基醚；20-羟基睾酮，3，22-二甲基醚；20-羟基蜕皮激素，14，22-二甲基醚；20-羟基睾酮，22，25-二甲基醚；20-羟基睾酮，2，3，14，22-四甲基醚；20-羟基睾酮，22-H-丙基醚；20-羟基蜕皮激素，22-正丁基醚；20-羟基蜕皮激素，22-烯丙基醚；20-羟基睾酮，22-苄基醚；20-羟基蜕皮激素，22-(28R，S)-2′-乙基环氧乙烷基醚；松甾酮A，2-甲基醚；松甾酮A，14-甲基醚；松甾酮A，22-甲基醚；松甾酮A，2，22-二甲基醚；松甾酮A，3，22-二甲基醚；松甾酮A，14，22-二甲基醚；海南陆均松甾酮(dacryhanansterone)，22-甲基醚。

本发明的其他实施方式包括使用以下类固醇配体：25，26-二氢硬化甾醇A，(旌节花甾酮C(Δ25(26)))，施达雄酮(shidasterone)(旌节花甾酮D)，旌节花甾酮C，22-脱氧-20-羟基蜕皮激素(紫杉烷酮)，松甾酮A，多孔菌甾酮B，22-脱氢-20-羟基蜕皮激素，松甾酮A22-甲基醚，20-羟基蜕皮激素，蕨甾酮，(25R)-牛膝甾酮，(25S)-牛膝甾酮，24(28)-脱氢罗汉松甾酮A，24-表-罗汉松甾酮A，罗汉松甾酮A，20-羟基蜕皮激素-22-甲基醚，20-羟基蜕皮激素-25-甲基醚，阿卜它甾酮，22，23-二-表-吉迪甾酮(geradiasterone)，20，26-二羟基蜕皮激素(罗汉松甾酮C)，24-表-阿卜它甾酮，吉迪甾酮，29-诺西酮，筋骨草甾酮B，24(28)[Z]-脱氢紫苋甾酮B，紫苋甾酮A，罗汉松甾酮C，鹿草甾酮C，20-羟基蜕皮激素-22，25-二甲基醚，20-羟基蜕皮激素-22-乙基醚，卡斯甾酮(carthamosterone)，24(25)-脱氢前杯苋甾酮，乐泽斯酮，杯苋甾酮，20-羟基蜕皮激素-22-烯丙基醚，24(28)[Z]-脱氢-29-羟基罗汉松甾酮C，20-羟基蜕皮激素-22-乙酸酯，维甾酮(viticosterone)E(20-羟基蜕皮激素25-乙酸酯)，20-羟基蜕皮激素-22-正丙基醚，24-羟基杯苋甾酮，20-羟基蜕皮激素-22-正丁基醚，松甾酮A 22-半琥珀酸酯，22-乙酰乙酰基-20-羟基蜕皮激素，20-羟基蜕皮激素-22-苄基醚，卡尼甾酮(canescensterone)，20-羟基蜕皮激素-22-半琥珀酸酯，牛膝甾酮-26-半琥珀酸酯，20-羟基蜕皮激素-22-苯甲酸酯，20-羟基蜕皮激素-22-β-D-吡喃葡萄糖苷，20-羟基蜕皮激素-25-β-D-吡喃葡萄糖苷，石竹皂甙(sileneoside)A(20-羟基蜕皮激素-22α-半乳糖苷)，3-脱氧-1β，20-二羟基蜕皮激素(3-脱氧七羟基胆甾烯酮(integristerone)A)，2-脱氧七羟基胆甾烯酮A，1-表-七羟基胆甾烯酮A，七羟基胆甾烯酮A，石竹皂甙C(七羟基胆甾烯酮A22α-半乳糖苷)，2，22-二脱氧-20-羟基蜕皮激素，2-脱氧-20-羟基蜕皮激素，2-脱氧-20-羟基蜕皮激素-3-乙酸酯，2-脱氧-20，26-二羟基蜕皮激素，2-脱氧-20-羟基蜕皮激素-22-乙酸酯，2-脱氧-20-羟基蜕皮激素-3，22-二乙酸酯，2-脱氧-20-羟基蜕皮激素-22-苯甲酸酯，松甾酮A 2-半琥珀酸酯，20-羟基蜕皮激素-2-甲基醚，20-羟基蜕皮激素-2-乙酸酯，20-羟基蜕皮激素-2-半琥珀酸酯，20-羟基蜕皮激素-2-β-D-吡喃葡萄糖苷，2-丹酰-20-羟基蜕皮激素，20-羟基睾酮-2，22-二甲基醚，松甾酮A 3B-D-木吡喃糖苷(limnantheoside B)，20-羟基蜕皮激素-3-甲基醚，20-羟基蜕皮激素-3-乙酸酯，20-羟基蜕皮激素-3β-D-木吡喃糖苷(limnantheoside A)，20-羟基蜕皮激素-3-β-D-吡喃葡糖苷，石竹皂甙D(20-羟基蜕皮激素-3α-半乳糖苷)，20-羟基蜕皮激素3β-D-吡喃葡萄糖基-[1-3]-β-D-木吡喃糖苷(limnantheoside C)，20-羟基蜕皮激素-3，2，2-二甲基醚，杯苋甾酮-3-乙酸酯，2-脱氢-3-表-20-羟基蜕皮激素，3-表-20-羟基蜕皮激素(冠甾酮(coronatasterone))，鹿根甾酮D，3-脱氢-20-羟基蜕皮激素，5β-羟基-25，26-二脱氢松甾酮A，5β-羟基旌节花甾酮C，25-脱氧埃克甾酮B，埃克甾酮B，25-氟埃克甾酮B，5β-羟基阿卜它甾酮，26-羟基埃克甾酮B，29-正森告甾酮，森告甾酮，6β-羟基-20-羟基蜕皮激素，6α-羟基-20-羟基蜕皮激素，20-羟基蜕皮激素-6-肟，松甾酮A 6-羧基甲基肟，20-羟基蜕皮激素-6-羧基甲基肟，筋骨草甾酮C，鹿根甾酮B，莫瑞甾酮A，阿琼甾酮B，阿琼甾酮A，土克甾酮-2-乙酸酯，杜松酮(漏芦甾酮)，土克甾酮，阿琼甾酮C，25-羟基阿琼甾酮B，25-羟基阿琼甾酮A，藜酮(paxillosterone)，土克甾酮-22，2-二乙酸酯，土克甾酮-22-乙酸酯，土克甾酮-1α-乙酸酯，土克甾酮-2，11α-二乙酸酯，土克甾酮-11α-丙酸酯，土克甾酮-11α-丁酸酯，土克甾酮-11α-己酸酯，土克甾酮-11α-癸酸酯，土克甾酮-11α-月桂酸酯，土克甾酮-11α-肉豆蔻酸酯，土克甾酮-11α-花生四烯酸，22-脱氢-12β-羟基正森告甾酮，22-脱氢-12β-羟基杯苋甾酮，22-脱氢-12β-羟基森告甾酮，14-脱氧(14α-H)-20-羟基蜕皮激素，20-羟基蜕皮激素-14-甲基醚，14α-全羟基-20-羟基蜕皮激素，20-羟基蜕皮激素14，22-二甲基醚，20-羟基蜕皮激素-2，3，14，22-四甲基醚，(20S)-22-脱氧-20，21-二羟基蜕皮激素，22，25-二脱氧蜕皮激素，(22S)-20-(2，2′-二甲基呋喃基)蜕皮激素，(22R)-20-(2，2′-二甲基呋喃基)蜕皮激素，22-脱氧蜕皮激素，25-脱氧蜕皮激素，22-脱氢蜕皮激素，蜕皮激素，22-表蜕皮激素，24-甲基蜕皮激素(20-脱氧罗汉松甾酮A)，蜕皮激素-22-半琥珀酸酯，25-脱氧蜕皮激素-22-β-D-吡喃葡萄糖苷，蜕皮激素-22-肉豆蔻酸酯，22-脱氢-20-异蜕皮激素，20-异蜕皮激素，20-异22-表蜕皮激素，2-脱氧蜕皮激素，石竹皂甙E(2-脱氧蜕皮激素3β-葡萄糖苷；槲皮苷A)，2-脱氧蜕皮激素-22-乙酸酯，2-脱氧蜕皮激素-3，22-二乙酸酯，2-脱氧蜕皮激素-22-β-D-吡喃葡萄糖苷，2-脱氧蜕皮激素25-β-D-吡喃葡萄糖苷，2-脱氧-21-羟基蜕皮激素，3-表-22-异蜕皮激素，3-脱氢-2-脱氧蜕皮激素(石竹皂甙)，3-脱氢蜕皮激素，3-脱氢-2-脱氧蜕皮激素-22-乙酸酯，蜕皮激素-6-羧基甲基肟，蜕皮激素-2，3-缩丙酮，14-表-20-羟基蜕皮激素-2，3-缩丙酮，20-羟基蜕皮激素-20，22-缩丙酮，14-表-20-羟基蜕皮激素-2，3，20，22-二缩丙酮，藜酮-20，22-对羟基亚苄基缩醛，后甾酮，(20S)-二氢后甾酮，(20S)二氢后甾酮，后甾酮-20-丹酰肼，(20S)-二氢后甾酮-2，3，20-三苯甲酸酯，(20R)-二氢后甾酮-2，3，20-三苯甲酸酯，(20R)-二氢后甾酮-2，3-缩丙酮，(20S)-二氢后甾酮-2，3-缩丙酮，(5α-H)-二氢红苋甾酮，2，14，22，25-四脱氧-5α-蜕皮激素，5α-酮二醇，蚕固醇(bombycosterol)，2α，3α，22S，25-四羟基-5α-胆甾烷-6-酮，(5α-H)-2-脱氧-21-羟基蜕皮激素，栗甾酮，24-表-栗甾酮，(5αα-H)-2-脱氧七羟基胆甾烯酮A，(5α-H)-22-脱氧七羟基胆甾烯酮A，(5α-H)-20-羟基蜕皮激素，24，25-二脱氢山梨糖苷酮(dacryhanansterone)，25，26-二脱氢山梨糖苷酮，5-脱氧卡拉达酮(kaladasterone)(山梨糖苷酮)，(14α-H)-14-脱氧-25-羟基山梨糖苷酮，25-羟基山梨糖苷酮，红苋甾酮，(5β-H)-二氢红苋甾酮，二氢红苋甾酮-17β-乙酸酯，斯迪甾酮(sidisterone)，20-羟基蜕皮激素-2，3，22-三乙酸酯，14-脱氧(14β-H)-20-羟基蜕皮激素，14-表-20-羟基蜕皮激素，9α，20-二羟基蜕皮激素，马可甾酮(malacosterone)，2-脱氧埃克甾酮B-3-β-D-吡喃葡萄糖苷，筋骨草内酯，香茅素B，2β，3β，6α-三羟基-5β-胆甾醇，2β，3β，6β-三羟基-5β-胆甾醇，14-脱氢施达雄酮，旌节花甾酮B，2β，3β，9α，20R，22R，25-六羟基-5β-胆固醇-7，14-二烯-6-酮，卡拉达酮，(14β-H)-14-脱氧-25-羟基山梨糖苷酮，4-脱氢-20-羟基蜕皮激素，14-甲基-12-烯-施达雄酮，14-甲基-12-烯-15，20-二羟基蜕皮激素，罗汉松甾酮B，2β，3β，20R，22R-四羟基-25-氟-5β-胆固醇-8，14-二烯-6-酮(25-氟罗汉松甾酮B)，卡龙酮，14-脱氧-14，18-环-20-羟基蜕皮激素，9α，14α-环氧-20-羟基蜕皮激素，9βα，14β-环氧-20-羟基蜕皮激素，9α，14α-环氧-20-羟基蜕皮激素2，3，20，22-二缩丙酮，28-同芸苔素内酯，异-同芸苔素内酯。

在一些实施方式中，用于本发明的方法的配体是下通式的化合物：

其中X和X′独立地是O或S；

Y是：

(b)取代或未取代的2-吡啶基、3-吡啶基、或4-吡啶基，其中取代基独立地是1-4H、(C₁-C₄)烷基、(C₁-C₄)烷氧基、(C₂-C₄)烯基、卤素(F，Cl，Br，I)、(C₁-C₄)卤代烷基、羟基、氨基、氰基、或硝基；R¹和R²独立地是：H；氰基；氰基取代或未取代的(C₁-C₇)支链或直链烷基；氰基取代或未取代的(C₂-C₇)支链或直链烯基；氰基取代或未取代的(C₃-C₇)支链或直链烯基烷基；或R¹和R²的化合价一起形成(C₁-C₇)氰基取代或未取代的亚烷基(R^aR^bC≡)，其中R^a和R^b中的无取代基碳之和为0-6；R³是H、甲基、乙基、正丙基、异丙基或氰基；R⁴、R⁷、和R⁸独立地为：H，(C₁-C₄)烷基，(C₁-C₄)烷氧基，(C₂-C₄)烯基，卤素(F，Cl，Br，I)，(C₁-C₄)卤代烷基，羟基，氨基，氰基或硝基；并且R⁵和R⁶独立地为：H，(C₁-C₄)烷基，(C₂-C₄)烯基，(C₃-C₄)烯基烷基，卤素(F，Cl，Br，I)，(C₁-C₄)卤代烷基，(C₁-C₄)烷氧基，羟基，氨基，氰基，硝基或一起作为(-OCHR⁹CHR¹⁰O-)型的键与它们所连接的苯基碳形成环；其中R⁹和R¹⁰独立地为：H，卤素，(C₁-C₃)烷基，(C₂-C₃)烯基，(C₁-C₃)烷氧基(C₁-C₃)烷基，苯甲酸基(C₁-C₃)烷基，羟基(C₁-C₃)烷基，卤代(C₁-C₃)烷基，甲酰基，甲酰基(C₁-C₃)烷基，氰基，氰基(C₁-C₃)烷基，羧基，羧基(C₁-C₃)烷基，(C₁-C₃)烷氧基羰基(C₁-C₃)烷基，(C₁-C₃)烷基羰基(C₁-C₃)烷基，(C₁-C₃)烷酰基氧基(C₁-C₃)烷基，氨基(C₁-C₃)烷基，(C₁-C₃)烷基氨基(C₁-C₃)烷基(-(CH₂)_nR^cR^e)，肟基(-CH＝NOH)，肟基(C₁-C₃)烷基，(C₁-C₃)烷肟基(-C＝NORd)，烷肟基(C₁-C₃)烷基，(C₁-C₃)酰胺基(-C(O)NR^eR^f)，(C₁-C₃)酰胺基(C₁-C₃)烷基，(C₁-C₃)脲氨基(-C＝NNHC(O)NR^eR^f)，脲氨基(C₁-C₃)烷基，氨基羰基氧基(-OC(O)NHR^g)，氨基羰基氧基(C₁-C₃)烷基，五氟苯氧基羰基，五氟苯氧基羰基(C₁-C₃)烷基，对甲苯磺酰基氧基(C₁-C₃)烷基，芳基磺酰基氧基(C₁-C₃)烷基，(C₁-C₃)硫代(C₁-C₃)烷基，(C₁-C₃)烷基砜(C₁-C₃)烷基，(C₁-C₃)烷基磺酰基(C₁-C₃)烷基，或(C₁-C₅)三取代-甲硅烷氧基(C₁-C₃)烷基(-(CH₂)_nSiOR^dR^eR^g)；其中n＝1-3，R^c和R^d代表指定长度的直链或支链烃链，R^e、R^f代表H或指定长度的直链或支链烃链，R^g代表(C₁-C₃)烷基或任选被卤素或(C₁-C₃)烷基取代的芳基，并且R^c，R^d，R^e，R^f和R^g彼此独立；

前提是：

i)当R⁹和R¹⁰都是H时，或

iii)当R⁵和R⁶不一起形成(-OCHR⁹CHR¹⁰O-)型连接时，

本发明的多核苷酸

本发明的新型基于蜕皮激素受体/类视黄醇X受体的配体诱导型多肽耦合器系统可以包含具有编码包含EcR核受体多肽组分和无活性信号传导结构域或RXR核受体多肽组分和无活性信号传导结构域的杂合多肽的多核苷酸序列的表达盒。这些表达盒，它们包含的多核苷酸，及其编码的杂合多肽可用作基于EcR/RXR的配体诱导型多肽耦合器系统的组分，以调节宿主细胞内信号传导结构域的活性。

因此，本发明提供编码具有EcR核受体多肽组分和物活性信号传导结构域和/或RXR核受体多肽组分和无活性信号传导结构域的杂合多肽的分离的多核苷酸。编码本发明的EcR和/或RXR核受体多肽组分的分离的多核苷酸包括但不限于上述多核苷酸序列，包括本文所述的野生型，截短和含取代突变的EcR多肽和/或本文所述的野生型，截短和嵌合RXR多肽，包括其组合。

此外，本发明的分离的多核苷酸可以具有编码信号传导结构域的多核苷酸序列，包括本文所述的那些。这些信号传导结构域的多核苷酸序列可以通过本领域普通技术人员已知的可公开获得的数据库容易地获得。这样的数据库包括但不限于GenBank(ncbi.nlm.nih.gov/genbank)，UniProt(uniprot.org)等。

本发明的多肽

本发明的新型基于蜕皮激素受体/类视黄醇X受体的配体诱导型多肽耦合器系统可以包含具有多核苷酸的表达盒，所述多核苷酸编码包含EcR多肽和/或无活性信号传导结构域或RXR多肽和无活性信号传导结构域的杂合多肽。这些表达盒，它们包含的多核苷酸，及其编码的杂合多肽可用作基于EcR/RXR的配体诱导型多肽耦合器系统的组分，以调节宿主细胞内信号传导结构域的活性。

因此，本发明还涉及具有本发明的EcR多肽和无活性信号传导结构域(例如，信号传导分子，信号传导结构域，互补蛋白质片段，蛋白质亚基以及天然或工程改造的部分或截短的蛋白质)和/或RXR多肽和无活性信号结构域(例如，信号传导分子，信号传导结构域，互补蛋白质片段，蛋白质亚基以及天然或工程改造的部分或截短的蛋白质)的分离的杂合多肽。本发明的分离的多肽的EcR和/或RXR结构域可以包括但不限于本文所述的多肽序列，包括本文所述的野生型，截短的，功能性片段和含有取代突变的EcR配体结合结构域，/或本文所述的野生型，截短的，功能片段，和嵌合RXR多肽，包括其组合。

此外，本发明的分离的杂合多肽可以具有信号传导结构域(例如，信号传导分子，信号传导结构域，互补蛋白质片段，蛋白质亚基，天然的或工程改造的部分或截短的蛋白质)，包括本文所述的那些。这种信号传导结构域的氨基酸序列可以通过本领域普通技术人员已知的可公开获得的数据库容易获得。这样的数据库包括但不限于GenBank(ncbi.nlm.nih.gov/genbank)，UniProt(uniprot.org)等。

本发明的表达载体

本发明的新型基于蜕皮激素受体/类视黄醇X受体的配体诱导型多肽耦合器系统包含含有多核苷酸的表达盒，该多核苷酸编码包含EcR配体结合域和无活性信号传导结构域的杂合多肽(例如，信号传导分子，互补蛋白质片段，蛋白质亚基，和天然或工程改造的部分或截短的蛋白质)和/或RXR多肽和无活性信号传导结构域(例如，信号传导分子，信号传导结构域，互补蛋白质片段，蛋白质亚基，以及天然的或工程改造的部分或截短的蛋白质)。这些表达盒，它们包含的多核苷酸及其编码的杂合多肽可以使用任何合适的表达载体在宿主细胞中表达。合适的表达载体是本领域普通技术人员所熟知的，并且鉴于所需宿主细胞，本领域普通技术人员可容易确定表达载体和最佳表达条件的选择。可用于本发明的示例性表达载体包括但不限于上述表达载体。

宿主细胞

如上所述，本发明的配体诱导型多肽耦合器系统可用于调节宿主细胞内的蛋白质-蛋白质相互作用，即缔合。转基因宿主细胞中的调节可用于调节各种感兴趣蛋白质。因此，本发明提供了包含根据本发明的配体诱导型多肽耦合器系统的分离的宿主细胞。本发明还提供了分离的宿主细胞，其包含配体诱导型多肽耦合器系统，其包含一种或多种根据本发明的表达盒。本发明还提供了包含多核苷酸或多肽的分离的宿主细胞。分离的宿主细胞可以是原核或真核宿主细胞。

在某些实施方式中，分离的宿主细胞是原核宿主细胞或真核宿主细胞。在另一个具体实施方式中，分离的宿主细胞是无脊椎动物宿主细胞或脊椎动物宿主细胞。这样的宿主细胞可以选自细菌细胞，真菌细胞，酵母细胞，线虫细胞，昆虫细胞，鱼细胞，植物细胞，禽细胞，动物细胞和哺乳动物细胞。更具体地，宿主细胞是酵母细胞，线虫细胞，昆虫细胞，植物细胞，斑马鱼细胞，鸡细胞，仓鼠细胞，小鼠细胞，大鼠细胞，兔细胞，猫细胞，狗细胞，牛细胞，山羊细胞，牛细胞，猪细胞，马细胞，绵羊细胞，猿猴细胞，猴细胞，黑猩猩细胞或人细胞。宿主细胞的示例包括但不限于，真菌或酵母物种，例如曲霉属，木霉属，酵母属，毕赤酵母，假丝酵母属，汉逊酵母属，或细菌物种，如集胞藻属，聚球藻属，沙门氏菌属，芽孢杆菌属，不动杆菌属，红球菌属，链霉菌属，埃希氏杆菌属，假单胞菌属，甲基单胞菌属，甲基杆菌属，产碱杆菌属，集胞藻属，鱼腥藻属，硫杆菌属，甲烷杆菌属和克雷伯氏菌属，动物和哺乳动物宿主细胞。

在某些实施方式中，宿主细胞是选自酵母属、毕赤酵母和假丝酵母属宿主细胞的酵母细胞。在一个具体实施方式中，宿主细胞是秀丽隐杆线虫(Caenorhabditis elegans)细胞。在另一个具体实施方式中，宿主细胞是仓鼠细胞。在另一个实施方式中，宿主细胞是鼠细胞。在另一个实施方式中，宿主细胞是猴细胞。在另一个具体实施方式中，宿主细胞是人细胞。

在另一个实施方式中，宿主细胞是选自仓鼠细胞，小鼠细胞，大鼠细胞，兔细胞，猫细胞，狗细胞，牛细胞，山羊细胞，牛细胞，猪细胞，马细胞，绵羊细胞，猴细胞，黑猩猩细胞和人细胞的哺乳动物细胞。在某些实施方式中，宿主细胞是永生化细胞，免疫细胞或T细胞。

宿主细胞的转化为本领域熟知，并可利用多种方法实现，所述方法包括但不限于电穿孔、病毒感染、质粒/载体转染、非病毒载体介导转染、粒子轰击等。所需基因产物的表达涉及在适当条件下培养所述经转化的宿主细胞并诱导所述转化基因的表达。原核和真核细胞的培养条件和基因表达操作方案是本领域熟知的。收集细胞、根据基因产物特定方案分离所述基因产物。

此外，可以选择调节插入的多核苷酸的表达的宿主细胞，或以所需的特定方式修饰和加工多肽产物。

本发明还涉及包含根据本发明的分离的宿主细胞的非人生物体。在某些实施方式中，非人生物体选自细菌，真菌，酵母，动物和哺乳动物。在一些实施方式中，非人生物体是酵母，小鼠，大鼠，兔，猫，狗，牛，山羊，猪，马，绵羊，猴或黑猩猩。

在某些实施方式中，非人生物体是选自酵母属，毕赤酵母和假丝酵母属的酵母。在另一个实施方式中，非人生物体是小家鼠。

调节翻译后活性的方法

申请人的发明包括将LIPC纳入多肽(产生异源多肽)以调节宿主细胞中信号传导结构域的活性的方法。具体地，申请人的发明提供了通过将LIPC组分纳入激活或抑制在宿主细胞中表达的多肽的信号，并使宿主细胞与配体接触的方法以诱导或抑制信号传导蛋白和途径的激活，以产生信号转导激活或抑制。

在一个实施方式中，细胞信号转导通过LIPC诱导的信号结构域(例如，信号传导分子，信号传导结构域，互补蛋白质片段，蛋白质亚基，以及天然或工程改造的部分或截短的蛋白质)的二聚化或寡聚化来激活。

在另一个实施方式中，通过LIPC诱导抑制性多肽对细胞信号转导(激活)途径多肽的二聚化来抑制细胞信号转导。在一个实施方式中，单独的LIPC的组分(例如，EcR或RxR/USP多肽)是抑制性多肽。

在一个实施方式中，LIPC多肽用于调节(即，激活或抑制)胞内蛋白质-蛋白质相互作用。在另一个实施方式中，LIPC多肽用于调节(即，激活或抑制)胞外蛋白质-蛋白质相互作用。在另一个实施方式中，LIPC多肽用于调节(即，激活或抑制)跨膜蛋白-蛋白质相互作用。

用于通过宿主细胞中的LIPC表达和调节活性的感兴趣基因和蛋白质可以是内源基因或异源基因。所需基因或蛋白质的核酸或氨基酸序列信息可以位于许多公共接入数据库之一，例如GenBank，EMBL，Swiss-Prot和PIR，或在许多生物学相关杂志出版物中。因此，本领域普通技术人员可获得几乎所有已知基因和蛋白质的核酸序列和/或氨基酸序列信息。然后可以使用这样的信息来构建用于在本文所述的申请人的方法中使用的表达盒内表达感兴趣蛋白质(例如，信号传导结构域)的所需构建体。

使用申请人的方法在宿主细胞中表达的感兴趣基因和蛋白质的示例包括但不限于，酶，报告基因，结构蛋白，跨膜受体，核受体，编码参与疾病、病症、功能障碍、遗传缺陷的多肽或信号传导结构域的基因，抗体，药物发现、蛋白质组学分析和应用的靶标等。

在本发明的配体诱导型多肽耦合器(LIPC)可用于并纳入生物细胞信号转导系统的控制或影响的许多不同方式中，一个一般的示例是用本发明的LIPC组分取代任何其他配体诱导型二聚化或多聚化系统(如利用FK506或雷帕霉素的那些)。

本发明的配体诱导型多肽耦合器(LIPC)可以使用并纳入生物细胞信号转导系统的控制中的具体示例是，用于产生诱导型细胞“杀死开关”或“自杀开关”；如已经提出用于破坏遗传修饰的T细胞(例如，嵌合抗原受体(CAR)T细胞)。

上述参考系统的一些示例在以下内容中综述和描述：

公开号WO2015157252(PCT/US2015/024671)“使用抗-CD19嵌合抗原受体治疗癌症”；

公开号WO2011146862(PCT/US2011/037381)“诱导选择性细胞凋亡的方法”；

公开号WO2014164348(PCT/US2014/022004)“修饰的胱天蛋白酶(caspase)及其用途”；

公开号WO2014151960(PCT/US2014/026734)“用于控制T细胞增殖的方法”；

公开号WO2014127261(PCT/US2014/016527)“嵌合抗原受体及其使用方法”；

Auslander等，″从基因开关到哺乳动物设计细胞：现在和未来预期(From geneswitches to mammalian designer cells：Present and future prospects″，Trends inBiotechnology)，第31卷，第3期，第155-168页(2013)；

Chakravarti等，″基于细胞的癌症免疫治疗的合成生物学(Synthetic biologyin cell-based cancer immunotherapy)″，Trends in Biotechnology，第33卷，第8期，第449-461页(2015)；

Ciceri等，″在针对白血病的家族造血干细胞移植后输入自杀基因工程改造的供体淋巴细胞(TK007试验)：非随机I-II期研究(Infusion of suicide-gene-engineereddonor lymphocytes after family haploidentical haemopoietic stem-celltransplantation for leukaemia(the TK007 trial)：A non-randomised phase I-IIstudy)″，Lancet Oncol.10，489-500(2009)；Medline doi：10.1016/S1470-2045(09)70074-9；

Wu等，″通过小分子门选的嵌合受体远程控制治疗性T细胞(Remote control oftherapeutic T cells through a small molecule-gated chimeric receptor)″，10.1126/science.aab4077(2015)；

Vilaboa等，″用于故意调控转基因表达的基因开关：系统开发和使用的最新进展(Gene switches for deliberate regulation of transgene rxpression：Recentadvances in system development and uses)″，J Genet Syndr Gene Ther2：107.doi：10.4172/2157-7412.1000107；

Stieger等，″使用四环四可调节系统的体内调节(In vivo regulation usingtetracycline-regulatable systems)″，Adv Drug Deliv Rev 61：527-541(2009)；

上述参考文献各自通过引用纳入本文。

实施例1-LIPC激活的荧光素酶

申请人的遗传开关技术在激活配体的存在下驱动转录。配体结合GAL4-EcR融合蛋白的EcR配体结合结构域部分，其募集RXR-VP16组分(参见例如，图1)。发明人已经确定EcR和RXR结构域(例如在系统中使用的那些)可以作为配体诱导型多肽耦合器，驱动与EcR和RXR结构域融合的其它蛋白质的缔合。

配体诱导型多肽耦合器的作用与转录基因开关不同。使用LIPC系统，蛋白质-蛋白质相互作用是受控制的，而不是基因表达。激活水平可以通过小分子配体给予的浓度和量控制，以剂量依赖的方式调节。

如本文所述，分裂萤火虫荧光素酶系统已被用于证实配体诱导型EcR-RXR融合蛋白缔合。该系统代表了使用蛋白质开关组件的新方法。这种开关与基因转录激活开关有着根本的不同，它们是针对控制蛋白质表达的。控制蛋白质-蛋白质的相互作用，即缔合，需要仔细和特异性的工程改造，因为待缔合的分子(如二聚化或寡聚化)必须在缔合时具有一些差异功能，并且在非-配体条件下各自具有有限的，或非天然的亲和性。

方法和分析方法

已经设想并设计了一系列EcR和RXR融合(一些具有分裂萤火虫荧光素酶(fLuc))蛋白(参见图2-6)。已经使用分裂荧光素酶系统来研究其他细胞系统中的蛋白质-蛋白质相互作用(参见例如，Luker等，Proc.Natl.Acad.Sci.U.S.A.101(33)：12288-93(2004)，Paulmurugan和Gambhir，Anal.Chem.75(5)：1295-302(2005)，Fujikawa和Kato，Plant J.52(1)：185-95(2007)，和Leng等，PLos One8(4)：e62230(2013)，其各自全部内容通过引用纳入本文)。分裂荧光素酶系统具有优于分裂GFP系统的优点，因为组分在缔合时不共价结合，允许解离速率分析。

将fLuc蛋白质分成两片，彼此之间没有固有亲和性(使其无活性，直到与融合的蛋白质元件紧密缔合)用作测试蛋白质-蛋白质缔合的系统。HEK293细胞如下所示用融合到EcR和RXR结构域的分裂fLuc转染：

转染

在转染前一天，将10,000个细胞(293T细胞)接种到含有100μl没有抗生素的生长培养基(含10％胎牛血清的达氏修正伊氏培养基)的96孔板的每个孔中。成对的质粒，具有Cluc_EcR的RxR_Nluc和具有Cluc_RxR的EcR_Nluc(参见图8；图8所示构建体的氨基酸序列分别以SEQ ID NO：87-92提供，SEQ ID NO：91和92分别对应于EcR和RXR氨基序列，用于图8的构建体)，根据制造商的说明书用2000转染。简言之，将个体质粒DNA(0.2μg)和0.5μl的Lipofectamine在25.0μl的I还原血清培养基中稀释，并在室温下孵育5分钟，两倍体积用于共转染。将稀释的质粒DNA与稀释的2000组合，并在室温下孵育20分钟。向96孔板的每个孔中加入50μl2000复合物。将细胞在37℃下在5％CO₂培养箱中孵育24小时，然后加入激活配体Veledimex。

生物发光试验

转染后24小时(24小时)，将96孔板的各孔的细胞培养基用100nM Veledimex激活配体和二甲亚砜-DMSO(阴性对照)置换。在含10％胎牛血清的达氏修正伊氏培养基中将每个组分稀释千倍，并在37℃下，5％CO₂培养箱中孵育6小时。将ONE-Glo^TM萤光素酶测定缓冲液与含有5′-氟荧光素(荧光素类似物)的ONE-Glo^TM荧光素酶测定底物合并。该试剂在重建后冷冻并储存在-20℃直至使用。将萤光素酶ONE-Glo^TM荧光素酶底物在水浴中解冻至室温。将96孔板从培养箱中取出并在室温下平衡约1小时，在加入底物之前，将板底部用孔微板铝密封带覆盖。将100μl的ONE-Glo^TM荧光素酶试剂缓冲液加入到96孔板的每个孔中。在室温下孵育3分钟以确保完全细胞裂解，将96孔板置于GloMax^TM96微孔板发光计中以测量每孔的生物发光。

在没有激活配体的情况下，仅观察到背景信号。在添加激活配体后检测到fLuc信号(图7；RXR-EcR配体-和+，最右边)。加入激活配体后6小时进行fLuc测定。包括使用STAT1，一种使用相同的分裂fLuc系统显示同二聚化的蛋白质(参见例如，Luker等，(2004))的构建体用于阳性对照(参见表2)。阳性对照的信号似乎不受激活配体的影响(图7；阳性对照，STAT1配体-和+)。作为阴性对照，eGFP和单独激活配体(仅载剂)样品仅给出背景读数(图7；eGFP，配体-，和配体+)。应该注意的是，在这次运行中，配体+孔的细胞计数略低于其他孔(图7；配体+*)。数据对平均背景归一化，并以相对光单位报告。标准fLuc作为附加对照运行。

添加激活配体后，使用EcR和RXR LIPC系统产生清晰的fLuc信号。在不存在配体的情况下，仅观察到背景(参见图7)。

表2：分裂荧光素酶系统的实验设置

只有在已经暴露于激活配体的互补载体对中才能观察到阳性信号，促进EcR和RXR成分的缔合并恢复fLuc活性。配体剂量反应曲线如图9和图10所示。这项工作用于说明EcR和RXR驱动配体诱导型多肽耦合的能力，即配体介导的缔合或寡聚化，其可以在翻译后水平上控制蛋白质-蛋白质相互作用和缔合。

通过Veledimex配体的EcR二聚化诱导结果显示在图11和图12中。

本系统生成的数据可以用于预示正在进行的其他系统的分子设计。这种系统的其他用途包括但不限于，通过蛋白质-蛋白质相互作用激活的信号传导结构域(例如，信号传导分子，信号传导结构域，互补蛋白质片段，蛋白质亚基，以及天然的或工程改造的部分或截短的蛋白质)的筛选。

根据用细胞内分裂fLuc报告物的实验和结果，将进行LIPC系统的新设计。将测试EcR、RXR和分裂fLuc元件的其他配置以证明其他配对。所有这些信息可用于通知生成蛋白质的比较模型，从而为未来设计提供指导。目前的分裂fLuc载体也将在其他重要细胞类型中进行测试，以保持一致的活性。由于蛋白质在本实施例中组成型表达，当给予激活配体时，二聚化事件应该是快速的。相反，考虑到fLuc半对彼此没有亲和性并且没有共价相互作用，该系统也可用于检测除去激活配体后的解离速率动力学。信号出现和衰变实验均设想并正在进行。

此外，正在寻求其他LIPC设计。一些设计类似于上述fLuc系统的设计，其区别在于，例如，参与相互作用的分子可以是单通I型跨膜蛋白。初始设计和实验将是使用细胞内定位的EcR和RXR与位于细胞外的融合蛋白的至少部分(参见图3)。然而，还可以根据实际的测定读数来设计和测试几种其他配置。其他设计包括但不限于，具有与EcR和RXR融合的跨膜结构域的分子，其中ECR和RXR定位在细胞外，并且融合蛋白位于细胞内(参见图4)。另一个配置是EcR和RXR组分融合到跨膜结构域，而EcR、RXR和融合的信号传导结构域都位于细胞内(参见图5)。注意，除了fLuc之外，其他信号传导结构域可以用于上述各种配置。

进一步的研究将包括实验以理解结合速率和解离速率，驱动期望的激活效应所需的最佳表达水平，以及减少(如果需要)潜在背景(例如，不存在配体的情况下，未结伴蛋白质的生物学效应)。

实施例2-配体诱导的核受体组分二聚化

进行实验以测试在加入配体时是否可以诱导核受体结构域(即EcR和RxR多肽)同二聚化(图11和12)。使用STAT1作为对照多肽，因为据报道其自身二聚化不依赖配体添加。图中的缩写如下：

“EcR”是蜕皮激素受体；

“EcR-EcR”是指“EcR_Nluc+Cluc_EcR”，其是分裂成两半的荧光素酶多肽，使得EcR多肽与荧光素酶多肽片段的N末端融合(EcR_Nluc)，并且另一个荧光素酶片段具有融合到其C末端的EcR多肽(Cluc_EcR)；从而在EcR同二聚化时激活荧光素酶(产生生物发光)；

“RxR”是类视黄醇X受体；

“空白”表示没有添加载体；

“eGFP”是增强的GFP(用作阴性对照)；

“RxR_EcR”是指“EcR_Nluc+Cluc_RXR”，其是分裂成两半的荧光素酶多肽，使得EcR多肽与荧光素酶多肽片段的N末端融合(EcR_Nluc)，并且另一个荧光素酶片段具有与其C末端融合的RxR多肽(Cluc_RxR)；从而在EcR同二聚化时激活荧光素酶(产生生物发光)；

结果(图11和12)表明EcR结构域可以在配体添加时诱导同二聚化。然而，生物发光信号的差异较低，这可能是由于EcR结构域之间的低亲和性。基于生物发光输出，配体添加时存在显著的EcR结构域同二聚化。相反，令人惊讶的是，RxR结构域被观察到不依赖配体的同二聚化。此外，通过由配体诱导的RxR和EcR结构域的异二聚化观察到最强的信号(生物发光)。因此，这些结果表明通过由配体诱导的异二聚化，RxR和EcR结构域之间的较强相互作用。实际上，尽管每个结构域的同二聚化有更有限的亲和性，但是意外地观察到并发现RxR结构域的配体非依赖性同二聚化。

除非另外定义，否则，本文中所使用的所有技术和科学术语都具有本发明领域普通技术人员通常所理解的同样含义。

本文所引用的所有文献以法律允许的最大程度引入以供参考。这些文献的讨论内容仅仅是为了总结其作者的主张。并不承认任何文献(或任何文献的一部分)是相关现有技术。申请人保留攻击任何引用文献的准确性和相关性的权利。

附录I-序列

序列表

<110> 英特瑞克斯顿股份有限公司（INTREXON CORPORATION）

<120> 配体诱导型多肽耦合器系统

<130> 0100-0013WO1

<140>

<141>

<150> 62/140,380

<151> 2015-03-30

<160> 94

<170> PatentIn version 3.5

<210> 1

<211> 1054

<212> DNA

<213> 云杉卷叶蛾（Choristoneura fumiferana）

<400> 1

cctgagtgcg tagtacccga gactcagtgc gccatgaagc ggaaagagaa gaaagcacag 60

aaggagaagg acaaactgcc tgtcagcacg acgacggtgg acgaccacat gccgcccatt 120

atgcagtgtg aacctccacc tcctgaagca gcaaggattc acgaagtggt cccaaggttt 180

ctctccgaca agctgttgga gacaaaccgg cagaaaaaca tcccccagtt gacagccaac 240

cagcagttcc ttatcgccag gctcatctgg taccaggacg ggtacgagca gccttctgat 300

gaagatttga agaggattac gcagacgtgg cagcaagcgg acgatgaaaa cgaagagtct 360

gacactccct tccgccagat cacagagatg actatcctca cggtccaact tatcgtggag 420

ttcgcgaagg gattgccagg gttcgccaag atctcgcagc ctgatcaaat tacgctgctt 480

aaggcttgct caagtgaggt aatgatgctc cgagtcgcgc gacgatacga tgcggcctca 540

gacagtgttc tgttcgcgaa caaccaagcg tacactcgcg acaactaccg caaggctggc 600

atggcctacg tcatcgagga tctactgcac ttctgccggt gcatgtactc tatggcgttg 660

gacaacatcc attacgcgct gctcacggct gtcgtcatct tttctgaccg gccagggttg 720

gagcagccgc aactggtgga agaaatccag cggtactacc tgaatacgct ccgcatctat 780

atcctgaacc agctgagcgg gtcggcgcgt tcgtccgtca tatacggcaa gatcctctca 840

atcctctctg agctacgcac gctcggcatg caaaactcca acatgtgcat ctccctcaag 900

ctcaagaaca gaaagctgcc gcctttcctc gaggagatct gggatgtggc ggacatgtcg 960

cacacccaac cgccgcctat cctcgagtcc cccacgaatc tctagcccct gcgcgcacgc 1020

atcgccgatg ccgcgtccgg ccgcgctgct ctga 1054

<210> 2

<211> 1288

<212> DNA

<213> 云杉卷叶蛾（Choristoneura fumiferana）

<400> 2

aagggccctg cgccccgtca gcaagaggaa ctgtgtctgg tatgcgggga cagagcctcc 60

ggataccact acaatgcgct cacgtgtgaa gggtgtaaag ggttcttcag acggagtgtt 120

accaaaaatg cggtttatat ttgtaaattc ggtcacgctt gcgaaatgga catgtacatg 180

cgacggaaat gccaggagtg ccgcctgaag aagtgcttag ctgtaggcat gaggcctgag 240

tgcgtagtac ccgagactca gtgcgccatg aagcggaaag agaagaaagc acagaaggag 300

aaggacaaac tgcctgtcag cacgacgacg gtggacgacc acatgccgcc cattatgcag 360

tgtgaacctc cacctcctga agcagcaagg attcacgaag tggtcccaag gtttctctcc 420

gacaagctgt tggagacaaa ccggcagaaa aacatccccc agttgacagc caaccagcag 480

ttccttatcg ccaggctcat ctggtaccag gacgggtacg agcagccttc tgatgaagat 540

ttgaagagga ttacgcagac gtggcagcaa gcggacgatg aaaacgaaga gtctgacact 600

cccttccgcc agatcacaga gatgactatc ctcacggtcc aacttatcgt ggagttcgcg 660

aagggattgc cagggttcgc caagatctcg cagcctgatc aaattacgct gcttaaggct 720

tgctcaagtg aggtaatgat gctccgagtc gcgcgacgat acgatgcggc ctcagacagt 780

gttctgttcg cgaacaacca agcgtacact cgcgacaact accgcaaggc tggcatggcc 840

tacgtcatcg aggatctact gcacttctgc cggtgcatgt actctatggc gttggacaac 900

atccattacg cgctgctcac ggctgtcgtc atcttttctg accggccagg gttggagcag 960

ccgcaactgg tggaagaaat ccagcggtac tacctgaata cgctccgcat ctatatcctg 1020

aaccagctga gcgggtcggc gcgttcgtcc gtcatatacg gcaagatcct ctcaatcctc 1080

tctgagctac gcacgctcgg catgcaaaac tccaacatgt gcatctccct caagctcaag 1140

aacagaaagc tgccgccttt cctcgaggag atctgggatg tggcggacat gtcgcacacc 1200

caaccgccgc ctatcctcga gtcccccacg aatctctagc ccctgcgcgc acgcatcgcc 1260

gatgccgcgt ccggccgcgc tgctctga 1288

<210> 3

<211> 1650

<212> DNA

<213> 黑腹果蝇（Drosophila melanogaster）

<400> 3

cggccggaat gcgtcgtccc ggagaaccaa tgtgcgatga agcggcgcga aaagaaggcc 60

cagaaggaga aggacaaaat gaccacttcg ccgagctctc agcatggcgg caatggcagc 120

ttggcctctg gtggcggcca agactttgtt aagaaggaga ttcttgacct tatgacatgc 180

gagccgcccc agcatgccac tattccgcta ctacctgatg aaatattggc caagtgtcaa 240

gcgcgcaata taccttcctt aacgtacaat cagttggccg ttatatacaa gttaatttgg 300

taccaggatg gctatgagca gccatctgaa gaggatctca ggcgtataat gagtcaaccc 360

gatgagaacg agagccaaac ggacgtcagc tttcggcata taaccgagat aaccatactc 420

acggtccagt tgattgttga gtttgctaaa ggtctaccag cgtttacaaa gataccccag 480

gaggaccaga tcacgttact aaaggcctgc tcgtcggagg tgatgatgct gcgtatggca 540

cgacgctatg accacagctc ggactcaata ttcttcgcga ataatagatc atatacgcgg 600

gattcttaca aaatggccgg aatggctgat aacattgaag acctgctgca tttctgccgc 660

caaatgttct cgatgaaggt ggacaacgtc gaatacgcgc ttctcactgc cattgtgatc 720

ttctcggacc ggccgggcct ggagaaggcc caactagtcg aagcgatcca gagctactac 780

atcgacacgc tacgcattta tatactcaac cgccactgcg gcgactcaat gagcctcgtc 840

ttctacgcaa agctgctctc gatcctcacc gagctgcgta cgctgggcaa ccagaacgcc 900

gagatgtgtt tctcactaaa gctcaaaaac cgcaaactgc ccaagttcct cgaggagatc 960

tgggacgttc atgccatccc gccatcggtc cagtcgcacc ttcagattac ccaggaggag 1020

aacgagcgtc tcgagcgggc tgagcgtatg cgggcatcgg ttgggggcgc cattaccgcc 1080

ggcattgatt gcgactctgc ctccacttcg gcggcggcag ccgcggccca gcatcagcct 1140

cagcctcagc cccagcccca accctcctcc ctgacccaga acgattccca gcaccagaca 1200

cagccgcagc tacaacctca gctaccacct cagctgcaag gtcaactgca accccagctc 1260

caaccacagc ttcagacgca actccagcca cagattcaac cacagccaca gctccttccc 1320

gtctccgctc ccgtgcccgc ctccgtaacc gcacctggtt ccttgtccgc ggtcagtacg 1380

agcagcgaat acatgggcgg aagtgcggcc ataggaccca tcacgccggc aaccaccagc 1440

agtatcacgg ctgccgttac cgctagctcc accacatcag cggtaccgat gggcaacgga 1500

gttggagtcg gtgttggggt gggcggcaac gtcagcatgt atgcgaacgc ccagacggcg 1560

atggccttga tgggtgtagc cctgcattcg caccaagagc agcttatcgg gggagtggcg 1620

gttaagtcgg agcactcgac gactgcatag 1650

<210> 4

<211> 894

<212> DNA

<213> 黄粉虫（Tenebrio molitor）

<400> 4

aggccggaat gtgtggtacc ggaagtacag tgtgctgtta agagaaaaga gaagaaagcc 60

caaaaggaaa aagataaacc aaacagcact actaacggct caccagacgt catcaaaatt 120

gaaccagaat tgtcagattc agaaaaaaca ttgactaacg gacgcaatag gatatcacca 180

gagcaagagg agctcatact catacatcga ttggtttatt tccaaaacga atatgaacat 240

ccgtctgaag aagacgttaa acggattatc aatcagccga tagatggtga agatcagtgt 300

gagatacggt ttaggcatac cacggaaatt acgatcctga ctgtgcagct gatcgtggag 360

tttgccaagc ggttaccagg cttcgataag ctcctgcagg aagatcaaat tgctctcttg 420

aaggcatgtt caagcgaagt gatgatgttc aggatggccc gacgttacga cgtccagtcg 480

gattccatcc tcttcgtaaa caaccagcct tatccgaggg acagttacaa tttggccggt 540

atgggggaaa ccatcgaaga tctcttgcat ttttgcagaa ctatgtactc catgaaggtg 600

gataatgccg aatatgcttt actaacagcc atcgttattt tctcagagcg accgtcgttg 660

atagaaggct ggaaggtgga gaagatccaa gaaatctatt tagaggcatt gcgggcgtac 720

gtcgacaacc gaagaagccc aagccggggc acaatattcg cgaaactcct gtcagtacta 780

actgaattgc ggacgttagg caaccaaaat tcagagatgt gcatctcgtt gaaattgaaa 840

aacaaaaagt taccgccgtt cctggacgaa atctgggacg tcgacttaaa agca 894

<210> 5

<211> 948

<212> DNA

<213> 美洲钝眼蜱（Amblyomma americanum）

<400> 5

cggccggaat gtgtggtgcc ggagtaccag tgtgccatca agcgggagtc taagaagcac 60

cagaaggacc ggccaaacag cacaacgcgg gaaagtccct cggcgctgat ggcgccatct 120

tctgtgggtg gcgtgagccc caccagccag cccatgggtg gcggaggcag ctccctgggc 180

agcagcaatc acgaggagga taagaagcca gtggtgctca gcccaggagt caagcccctc 240

tcttcatctc aggaggacct catcaacaag ctagtctact accagcagga gtttgagtcg 300

ccttctgagg aagacatgaa gaaaaccacg cccttccccc tgggagacag tgaggaagac 360

aaccagcggc gattccagca cattactgag atcaccatcc tgacagtgca gctcattgtg 420

gagttctcca agcgggtccc tggctttgac acgctggcac gagaagacca gattactttg 480

ctgaaggcct gctccagtga agtgatgatg ctgagaggtg cccggaaata tgatgtgaag 540

acagattcta tagtgtttgc caataaccag ccgtacacga gggacaacta ccgcagtgcc 600

agtgtggggg actctgcaga tgccctgttc cgcttctgcc gcaagatgtg tcagctgaga 660

gtagacaacg ctgaatacgc actcctgacg gccattgtaa ttttctctga acggccatca 720

ctggtggacc cgcacaaggt ggagcgcatc caggagtact acattgagac cctgcgcatg 780

tactccgaga accaccggcc cccaggcaag aactactttg cccggctgct gtccatcttg 840

acagagctgc gcaccttggg caacatgaac gccgaaatgt gcttctcgct caaggtgcag 900

aacaagaagc tgccaccgtt cctggctgag atttgggaca tccaagag 948

<210> 6

<211> 334

<212> PRT

<213> 云杉卷叶蛾（Choristoneura fumiferana）

<400> 6

Pro Glu Cys Val Val Pro Glu Thr Gln Cys Ala Met Lys Arg Lys Glu

1 5 10 15

Lys Lys Ala Gln Lys Glu Lys Asp Lys Leu Pro Val Ser Thr Thr Thr

20 25 30

Val Asp Asp His Met Pro Pro Ile Met Gln Cys Glu Pro Pro Pro Pro

35 40 45

Glu Ala Ala Arg Ile His Glu Val Val Pro Arg Phe Leu Ser Asp Lys

50 55 60

Leu Leu Glu Thr Asn Arg Gln Lys Asn Ile Pro Gln Leu Thr Ala Asn

65 70 75 80

Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln Asp Gly Tyr Glu

85 90 95

Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln Thr Trp Gln Gln

100 105 110

Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg Gln Ile Thr

115 120 125

Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys Gly

130 135 140

Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln Ile Thr Leu Leu

145 150 155 160

Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val Ala Arg Arg Tyr

165 170 175

Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn Gln Ala Tyr Thr

180 185 190

Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val Ile Glu Asp Leu

195 200 205

Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp Asn Ile His

210 215 220

Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp Arg Pro Gly Leu

225 230 235 240

Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr Tyr Leu Asn Thr

245 250 255

Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser Ala Arg Ser Ser

260 265 270

Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu Arg Thr Leu

275 280 285

Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys Leu Lys Asn Arg

290 295 300

Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val Ala Asp Met Ser

305 310 315 320

His Thr Gln Pro Pro Pro Ile Leu Glu Ser Pro Thr Asn Leu

325 330

<210> 7

<211> 549

<212> PRT

<213> 黑腹果蝇（Drosophila melanogaster）

<400> 7

Arg Pro Glu Cys Val Val Pro Glu Asn Gln Cys Ala Met Lys Arg Arg

1 5 10 15

Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Met Thr Thr Ser Pro Ser

20 25 30

Ser Gln His Gly Gly Asn Gly Ser Leu Ala Ser Gly Gly Gly Gln Asp

35 40 45

Phe Val Lys Lys Glu Ile Leu Asp Leu Met Thr Cys Glu Pro Pro Gln

50 55 60

His Ala Thr Ile Pro Leu Leu Pro Asp Glu Ile Leu Ala Lys Cys Gln

65 70 75 80

Ala Arg Asn Ile Pro Ser Leu Thr Tyr Asn Gln Leu Ala Val Ile Tyr

85 90 95

Lys Leu Ile Trp Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Glu Glu Asp

100 105 110

Leu Arg Arg Ile Met Ser Gln Pro Asp Glu Asn Glu Ser Gln Thr Asp

115 120 125

Val Ser Phe Arg His Ile Thr Glu Ile Thr Ile Leu Thr Val Gln Leu

130 135 140

Ile Val Glu Phe Ala Lys Gly Leu Pro Ala Phe Thr Lys Ile Pro Gln

145 150 155 160

Glu Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met

165 170 175

Leu Arg Met Ala Arg Arg Tyr Asp His Ser Ser Asp Ser Ile Phe Phe

180 185 190

Ala Asn Asn Arg Ser Tyr Thr Arg Asp Ser Tyr Lys Met Ala Gly Met

195 200 205

Ala Asp Asn Ile Glu Asp Leu Leu His Phe Cys Arg Gln Met Phe Ser

210 215 220

Met Lys Val Asp Asn Val Glu Tyr Ala Leu Leu Thr Ala Ile Val Ile

225 230 235 240

Phe Ser Asp Arg Pro Gly Leu Glu Lys Ala Gln Leu Val Glu Ala Ile

245 250 255

Gln Ser Tyr Tyr Ile Asp Thr Leu Arg Ile Tyr Ile Leu Asn Arg His

260 265 270

Cys Gly Asp Ser Met Ser Leu Val Phe Tyr Ala Lys Leu Leu Ser Ile

275 280 285

Leu Thr Glu Leu Arg Thr Leu Gly Asn Gln Asn Ala Glu Met Cys Phe

290 295 300

Ser Leu Lys Leu Lys Asn Arg Lys Leu Pro Lys Phe Leu Glu Glu Ile

305 310 315 320

Trp Asp Val His Ala Ile Pro Pro Ser Val Gln Ser His Leu Gln Ile

325 330 335

Thr Gln Glu Glu Asn Glu Arg Leu Glu Arg Ala Glu Arg Met Arg Ala

340 345 350

Ser Val Gly Gly Ala Ile Thr Ala Gly Ile Asp Cys Asp Ser Ala Ser

355 360 365

Thr Ser Ala Ala Ala Ala Ala Ala Gln His Gln Pro Gln Pro Gln Pro

370 375 380

Gln Pro Gln Pro Ser Ser Leu Thr Gln Asn Asp Ser Gln His Gln Thr

385 390 395 400

Gln Pro Gln Leu Gln Pro Gln Leu Pro Pro Gln Leu Gln Gly Gln Leu

405 410 415

Gln Pro Gln Leu Gln Pro Gln Leu Gln Thr Gln Leu Gln Pro Gln Ile

420 425 430

Gln Pro Gln Pro Gln Leu Leu Pro Val Ser Ala Pro Val Pro Ala Ser

435 440 445

Val Thr Ala Pro Gly Ser Leu Ser Ala Val Ser Thr Ser Ser Glu Tyr

450 455 460

Met Gly Gly Ser Ala Ala Ile Gly Pro Ile Thr Pro Ala Thr Thr Ser

465 470 475 480

Ser Ile Thr Ala Ala Val Thr Ala Ser Ser Thr Thr Ser Ala Val Pro

485 490 495

Met Gly Asn Gly Val Gly Val Gly Val Gly Val Gly Gly Asn Val Ser

500 505 510

Met Tyr Ala Asn Ala Gln Thr Ala Met Ala Leu Met Gly Val Ala Leu

515 520 525

His Ser His Gln Glu Gln Leu Ile Gly Gly Val Ala Val Lys Ser Glu

530 535 540

His Ser Thr Thr Ala

545

<210> 8

<211> 401

<212> PRT

<213> 云杉卷叶蛾（Choristoneura fumiferana）

<400> 8

Cys Leu Val Cys Gly Asp Arg Ala Ser Gly Tyr His Tyr Asn Ala Leu

1 5 10 15

Thr Cys Glu Gly Cys Lys Gly Phe Phe Arg Arg Ser Val Thr Lys Asn

20 25 30

Ala Val Tyr Ile Cys Lys Phe Gly His Ala Cys Glu Met Asp Met Tyr

35 40 45

Met Arg Arg Lys Cys Gln Glu Cys Arg Leu Lys Lys Cys Leu Ala Val

50 55 60

Gly Met Arg Pro Glu Cys Val Val Pro Glu Thr Gln Cys Ala Met Lys

65 70 75 80

Arg Lys Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Leu Pro Val Ser

85 90 95

Thr Thr Thr Val Asp Asp His Met Pro Pro Ile Met Gln Cys Glu Pro

100 105 110

Pro Pro Pro Glu Ala Ala Arg Ile His Glu Val Val Pro Arg Phe Leu

115 120 125

Ser Asp Lys Leu Leu Glu Thr Asn Arg Gln Lys Asn Ile Pro Gln Leu

130 135 140

Thr Ala Asn Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln Asp

145 150 155 160

Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln Thr

165 170 175

Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg

180 185 190

Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe

195 200 205

Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln Ile

210 215 220

Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val Ala

225 230 235 240

Arg Arg Tyr Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn Gln

245 250 255

Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val Ile

260 265 270

Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp

275 280 285

Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp Arg

290 295 300

Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr Tyr

305 310 315 320

Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser Ala

325 330 335

Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu

340 345 350

Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys Leu

355 360 365

Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val Ala

370 375 380

Asp Met Ser His Thr Gln Pro Pro Pro Ile Leu Glu Ser Pro Thr Asn

385 390 395 400

Leu

<210> 9

<211> 298

<212> PRT

<213> 黄粉虫（Tenebrio molitor）

<400> 9

Arg Pro Glu Cys Val Val Pro Glu Val Gln Cys Ala Val Lys Arg Lys

1 5 10 15

Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Pro Asn Ser Thr Thr Asn

20 25 30

Gly Ser Pro Asp Val Ile Lys Ile Glu Pro Glu Leu Ser Asp Ser Glu

35 40 45

Lys Thr Leu Thr Asn Gly Arg Asn Arg Ile Ser Pro Glu Gln Glu Glu

50 55 60

Leu Ile Leu Ile His Arg Leu Val Tyr Phe Gln Asn Glu Tyr Glu His

65 70 75 80

Pro Ser Glu Glu Asp Val Lys Arg Ile Ile Asn Gln Pro Ile Asp Gly

85 90 95

Glu Asp Gln Cys Glu Ile Arg Phe Arg His Thr Thr Glu Ile Thr Ile

100 105 110

Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys Arg Leu Pro Gly Phe

115 120 125

Asp Lys Leu Leu Gln Glu Asp Gln Ile Ala Leu Leu Lys Ala Cys Ser

130 135 140

Ser Glu Val Met Met Phe Arg Met Ala Arg Arg Tyr Asp Val Gln Ser

145 150 155 160

Asp Ser Ile Leu Phe Val Asn Asn Gln Pro Tyr Pro Arg Asp Ser Tyr

165 170 175

Asn Leu Ala Gly Met Gly Glu Thr Ile Glu Asp Leu Leu His Phe Cys

180 185 190

Arg Thr Met Tyr Ser Met Lys Val Asp Asn Ala Glu Tyr Ala Leu Leu

195 200 205

Thr Ala Ile Val Ile Phe Ser Glu Arg Pro Ser Leu Ile Glu Gly Trp

210 215 220

Lys Val Glu Lys Ile Gln Glu Ile Tyr Leu Glu Ala Leu Arg Ala Tyr

225 230 235 240

Val Asp Asn Arg Arg Ser Pro Ser Arg Gly Thr Ile Phe Ala Lys Leu

245 250 255

Leu Ser Val Leu Thr Glu Leu Arg Thr Leu Gly Asn Gln Asn Ser Glu

260 265 270

Met Cys Ile Ser Leu Lys Leu Lys Asn Lys Lys Leu Pro Pro Phe Leu

275 280 285

Asp Glu Ile Trp Asp Val Asp Leu Lys Ala

290 295

<210> 10

<211> 316

<212> PRT

<213> 美洲钝眼蜱（Amblyomma americanum）

<400> 10

Arg Pro Glu Cys Val Val Pro Glu Tyr Gln Cys Ala Ile Lys Arg Glu

1 5 10 15

Ser Lys Lys His Gln Lys Asp Arg Pro Asn Ser Thr Thr Arg Glu Ser

20 25 30

Pro Ser Ala Leu Met Ala Pro Ser Ser Val Gly Gly Val Ser Pro Thr

35 40 45

Ser Gln Pro Met Gly Gly Gly Gly Ser Ser Leu Gly Ser Ser Asn His

50 55 60

Glu Glu Asp Lys Lys Pro Val Val Leu Ser Pro Gly Val Lys Pro Leu

65 70 75 80

Ser Ser Ser Gln Glu Asp Leu Ile Asn Lys Leu Val Tyr Tyr Gln Gln

85 90 95

Glu Phe Glu Ser Pro Ser Glu Glu Asp Met Lys Lys Thr Thr Pro Phe

100 105 110

Pro Leu Gly Asp Ser Glu Glu Asp Asn Gln Arg Arg Phe Gln His Ile

115 120 125

Thr Glu Ile Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ser Lys

130 135 140

Arg Val Pro Gly Phe Asp Thr Leu Ala Arg Glu Asp Gln Ile Thr Leu

145 150 155 160

Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Gly Ala Arg Lys

165 170 175

Tyr Asp Val Lys Thr Asp Ser Ile Val Phe Ala Asn Asn Gln Pro Tyr

180 185 190

Thr Arg Asp Asn Tyr Arg Ser Ala Ser Val Gly Asp Ser Ala Asp Ala

195 200 205

Leu Phe Arg Phe Cys Arg Lys Met Cys Gln Leu Arg Val Asp Asn Ala

210 215 220

Glu Tyr Ala Leu Leu Thr Ala Ile Val Ile Phe Ser Glu Arg Pro Ser

225 230 235 240

Leu Val Asp Pro His Lys Val Glu Arg Ile Gln Glu Tyr Tyr Ile Glu

245 250 255

Thr Leu Arg Met Tyr Ser Glu Asn His Arg Pro Pro Gly Lys Asn Tyr

260 265 270

Phe Ala Arg Leu Leu Ser Ile Leu Thr Glu Leu Arg Thr Leu Gly Asn

275 280 285

Met Asn Ala Glu Met Cys Phe Ser Leu Lys Val Gln Asn Lys Lys Leu

290 295 300

Pro Pro Phe Leu Ala Glu Ile Trp Asp Ile Gln Glu

305 310 315

<210> 11

<211> 711

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明: 合成嵌合RXR配体结合结构域

<400> 11

gccaacgagg acatgcctgt agagaagatt ctggaagccg agcttgctgt cgagcccaag 60

actgagacat acgtggaggc aaacatgggg ctgaacccca gctcaccaaa tgaccctgtt 120

accaacatct gtcaagcagc agacaagcag ctcttcactc ttgtggagtg ggccaagagg 180

atcccacact tttctgagct gcccctagac gaccaggtca tcctgctacg ggcaggctgg 240

aacgagctgc tgatcgcctc cttctcccac cgctccatag ctgtgaaaga tgggattctc 300

ctggccaccg gcctgcacgt acaccggaac agcgctcaca gtgctggggt gggcgccatc 360

tttgacaggg tgctaacaga gctggtgtct aagatgcgtg acatgcagat ggacaagact 420

gaacttggct gcttgcgatc tgttattctt ttcaatccag aggtgagggg tttgaaatcc 480

gcccaggaag ttgaacttct acgtgaaaaa gtatatgccg ctttggaaga atatactaga 540

acaacacatc ccgatgaacc aggaagattt gcaaaacttt tgcttcgtct gccttcttta 600

cgttccatag gccttaagtg tttggagcat ttgtttttct ttcgccttat tggagatgtt 660

ccaattgata cgttcctgat ggagatgctt gaatcacctt ctgattcata a 711

<210> 12

<211> 720

<212> DNA

<213> 智人（Homo sapiens）

<400> 12

gcccccgagg agatgcctgt ggacaggatc ctggaggcag agcttgctgt ggaacagaag 60

agtgaccagg gcgttgaggg tcctggggga accgggggta gcggcagcag cccaaatgac 120

cctgtgacta acatctgtca ggcagctgac aaacagctat tcacgcttgt tgagtgggcg 180

aagaggatcc cacacttttc ctccttgcct ctggatgatc aggtcatatt gctgcgggca 240

ggctggaatg aactcctcat tgcctccttt tcacaccgat ccattgatgt tcgagatggc 300

atcctccttg ccacaggtct tcacgtgcac cgcaactcag cccattcagc aggagtagga 360

gccatctttg atcgggtgct gacagagcta gtgtccaaaa tgcgtgacat gaggatggac 420

aagacagagc ttggctgcct gagggcaatc attctgttta atccagatgc caagggcctc 480

tccaacccta gtgaggtgga ggtcctgcgg gagaaagtgt atgcatcact ggagacctac 540

tgcaaacaga agtaccctga gcagcaggga cggtttgcca agctgctgct acgtcttcct 600

gccctccggt ccattggcct taagtgtcta gagcatctgt ttttcttcaa gctcattggt 660

gacaccccca tcgacacctt cctcatggag atgcttgagg ctccccatca actggcctga 720

<210> 13

<211> 635

<212> DNA

<213> 飞蝗（Locusta migratoria）

<400> 13

tgcatacaga catgcctgtt gaacgcatac ttgaagctga aaaacgagtg gagtgcaaag 60

cagaaaacca agtggaatat gagctggtgg agtgggctaa acacatcccg cacttcacat 120

ccctacctct ggaggaccag gttctcctcc tcagagcagg ttggaatgaa ctgctaattg 180

cagcattttc acatcgatct gtagatgtta aagatggcat agtacttgcc actggtctca 240

cagtgcatcg aaattctgcc catcaagctg gagtcggcac aatatttgac agagttttga 300

cagaactggt agcaaagatg agagaaatga aaatggataa aactgaactt ggctgcttgc 360

gatctgttat tcttttcaat ccagaggtga ggggtttgaa atccgcccag gaagttgaac 420

ttctacgtga aaaagtatat gccgctttgg aagaatatac tagaacaaca catcccgatg 480

aaccaggaag atttgcaaaa cttttgcttc gtctgccttc tttacgttcc ataggcctta 540

agtgtttgga gcatttgttt ttctttcgcc ttattggaga tgttccaatt gatacgttcc 600

tgatggagat gcttgaatca ccttctgatt cataa 635

<210> 14

<211> 236

<212> PRT

<213> 人工序列

<220>

<223> 人工序列说明: 合成嵌合RXR配体结合结构域

<400> 14

Ala Asn Glu Asp Met Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala

1 5 10 15

Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn

20 25 30

Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp

35 40 45

Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe

50 55 60

Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp

65 70 75 80

Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys

85 90 95

Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala

100 105 110

His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu

115 120 125

Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys

130 135 140

Leu Arg Ser Val Ile Leu Phe Asn Pro Glu Val Arg Gly Leu Lys Ser

145 150 155 160

Ala Gln Glu Val Glu Leu Leu Arg Glu Lys Val Tyr Ala Ala Leu Glu

165 170 175

Glu Tyr Thr Arg Thr Thr His Pro Asp Glu Pro Gly Arg Phe Ala Lys

180 185 190

Leu Leu Leu Arg Leu Pro Ser Leu Arg Ser Ile Gly Leu Lys Cys Leu

195 200 205

Glu His Leu Phe Phe Phe Arg Leu Ile Gly Asp Val Pro Ile Asp Thr

210 215 220

Phe Leu Met Glu Met Leu Glu Ser Pro Ser Asp Ser

225 230 235

<210> 15

<211> 239

<212> PRT

<213> 智人（Homo sapiens）

<400> 15

Ala Pro Glu Glu Met Pro Val Asp Arg Ile Leu Glu Ala Glu Leu Ala

1 5 10 15

Val Glu Gln Lys Ser Asp Gln Gly Val Glu Gly Pro Gly Gly Thr Gly

20 25 30

Gly Ser Gly Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala

35 40 45

Ala Asp Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro

50 55 60

His Phe Ser Ser Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala

65 70 75 80

Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Asp

85 90 95

Val Arg Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn

100 105 110

Ser Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr

115 120 125

Glu Leu Val Ser Lys Met Arg Asp Met Arg Met Asp Lys Thr Glu Leu

130 135 140

Gly Cys Leu Arg Ala Ile Ile Leu Phe Asn Pro Asp Ala Lys Gly Leu

145 150 155 160

Ser Asn Pro Ser Glu Val Glu Val Leu Arg Glu Lys Val Tyr Ala Ser

165 170 175

Leu Glu Thr Tyr Cys Lys Gln Lys Tyr Pro Glu Gln Gln Gly Arg Phe

180 185 190

Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys

195 200 205

Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile

210 215 220

Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Leu Ala

225 230 235

<210> 16

<211> 210

<212> PRT

<213> 飞蝗（Locusta migratoria）

<400> 16

His Thr Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Lys Arg Val

1 5 10 15

Glu Cys Lys Ala Glu Asn Gln Val Glu Tyr Glu Leu Val Glu Trp Ala

20 25 30

Lys His Ile Pro His Phe Thr Ser Leu Pro Leu Glu Asp Gln Val Leu

35 40 45

Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His

50 55 60

Arg Ser Val Asp Val Lys Asp Gly Ile Val Leu Ala Thr Gly Leu Thr

65 70 75 80

Val His Arg Asn Ser Ala His Gln Ala Gly Val Gly Thr Ile Phe Asp

85 90 95

Arg Val Leu Thr Glu Leu Val Ala Lys Met Arg Glu Met Lys Met Asp

100 105 110

Lys Thr Glu Leu Gly Cys Leu Arg Ser Val Ile Leu Phe Asn Pro Glu

115 120 125

Val Arg Gly Leu Lys Ser Ala Gln Glu Val Glu Leu Leu Arg Glu Lys

130 135 140

Val Tyr Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr His Pro Asp Glu

145 150 155 160

Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ser Leu Arg Ser

165 170 175

Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Arg Leu Ile Gly

180 185 190

Asp Val Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser Pro Ser

195 200 205

Asp Ser

210

<210> 17

<211> 240

<212> PRT

<213> 云杉卷叶蛾（Choristoneura fumiferana）

<400> 17

Leu Thr Ala Asn Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln

1 5 10 15

Asp Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln

20 25 30

Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe

35 40 45

Arg Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu

50 55 60

Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln

65 70 75 80

Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val

85 90 95

Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn

100 105 110

Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val

115 120 125

Ile Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu

130 135 140

Asp Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp

145 150 155 160

Arg Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr

165 170 175

Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser

180 185 190

Ala Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu

195 200 205

Leu Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys

210 215 220

Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val

225 230 235 240

<210> 18

<211> 237

<212> PRT

<213> 黑腹果蝇（Drosophila melanogaster）

<400> 18

Leu Thr Tyr Asn Gln Leu Ala Val Ile Tyr Lys Leu Ile Trp Tyr Gln

1 5 10 15

Asp Gly Tyr Glu Gln Pro Ser Glu Glu Asp Leu Arg Arg Ile Met Ser

20 25 30

Gln Pro Asp Glu Asn Glu Ser Gln Thr Asp Val Ser Phe Arg His Ile

35 40 45

Thr Glu Ile Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys

50 55 60

Gly Leu Pro Ala Phe Thr Lys Ile Pro Gln Glu Asp Gln Ile Thr Leu

65 70 75 80

Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Met Ala Arg Arg

85 90 95

Tyr Asp His Ser Ser Asp Ser Ile Phe Phe Ala Asn Asn Arg Ser Tyr

100 105 110

Thr Arg Asp Ser Tyr Lys Met Ala Gly Met Ala Asp Asn Ile Glu Asp

115 120 125

Leu Leu His Phe Cys Arg Gln Met Phe Ser Met Lys Val Asp Asn Val

130 135 140

Glu Tyr Ala Leu Leu Thr Ala Ile Val Ile Phe Ser Asp Arg Pro Gly

145 150 155 160

Leu Glu Lys Ala Gln Leu Val Glu Ala Ile Gln Ser Tyr Tyr Ile Asp

165 170 175

Thr Leu Arg Ile Tyr Ile Leu Asn Arg His Cys Gly Asp Ser Met Ser

180 185 190

Leu Val Phe Tyr Ala Lys Leu Leu Ser Ile Leu Thr Glu Leu Arg Thr

195 200 205

Leu Gly Asn Gln Asn Ala Glu Met Cys Phe Ser Leu Lys Leu Lys Asn

210 215 220

Arg Lys Leu Pro Lys Phe Leu Glu Glu Ile Trp Asp Val

225 230 235

<210> 19

<211> 240

<212> PRT

<213> 美洲钝眼蜱（Amblyomma americanum）

<400> 19

Pro Gly Val Lys Pro Leu Ser Ser Ser Gln Glu Asp Leu Ile Asn Lys

1 5 10 15

Leu Val Tyr Tyr Gln Gln Glu Phe Glu Ser Pro Ser Glu Glu Asp Met

20 25 30

Lys Lys Thr Thr Pro Phe Pro Leu Gly Asp Ser Glu Glu Asp Asn Gln

35 40 45

Arg Arg Phe Gln His Ile Thr Glu Ile Thr Ile Leu Thr Val Gln Leu

50 55 60

Ile Val Glu Phe Ser Lys Arg Val Pro Gly Phe Asp Thr Leu Ala Arg

65 70 75 80

Glu Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met

85 90 95

Leu Arg Gly Ala Arg Lys Tyr Asp Val Lys Thr Asp Ser Ile Val Phe

100 105 110

Ala Asn Asn Gln Pro Tyr Thr Arg Asp Asn Tyr Arg Ser Ala Ser Val

115 120 125

Gly Asp Ser Ala Asp Ala Leu Phe Arg Phe Cys Arg Lys Met Cys Gln

130 135 140

Leu Arg Val Asp Asn Ala Glu Tyr Ala Leu Leu Thr Ala Ile Val Ile

145 150 155 160

Phe Ser Glu Arg Pro Ser Leu Val Asp Pro His Lys Val Glu Arg Ile

165 170 175

Gln Glu Tyr Tyr Ile Glu Thr Leu Arg Met Tyr Ser Glu Asn His Arg

180 185 190

Pro Pro Gly Lys Asn Tyr Phe Ala Arg Leu Leu Ser Ile Leu Thr Glu

195 200 205

Leu Arg Thr Leu Gly Asn Met Asn Ala Glu Met Cys Phe Ser Leu Lys

210 215 220

Val Gln Asn Lys Lys Leu Pro Pro Phe Leu Ala Glu Ile Trp Asp Ile

225 230 235 240

<210> 20

<211> 1586

<212> DNA

<213> 银液粉虱（Bamecia argentifoli）

<400> 20

gaattcgcgg ccgctcgcaa acttccgtac ctctcacccc ctcgccagga ccccccgcca 60

accagttcac cgtcatctcc tccaatggat actcatcccc catgtcttcg ggcagctacg 120

acccttatag tcccaccaat ggaagaatag ggaaagaaga gctttcgccg gcgaatagtc 180

tgaacgggta caacgtggat agctgcgatg cgtcgcggaa gaagaaggga ggaacgggtc 240

ggcagcagga ggagctgtgt ctcgtctgcg gggaccgcgc ctccggctac cactacaacg 300

ccctcacctg cgaaggctgc aagggcttct tccgtcggag catcaccaag aatgccgtct 360

accagtgtaa atatggaaat aattgtgaaa ttgacatgta catgaggcga aaatgccaag 420

agtgtcgtct caagaagtgt ctcagcgttg gcatgaggcc agaatgtgta gttcccgaat 480

tccagtgtgc tgtgaagcga aaagagaaaa aagcgcaaaa ggacaaagat aaacctaact 540

caacgacgag ttgttctcca gatggaatca aacaagagat agatcctcaa aggctggata 600

cagattcgca gctattgtct gtaaatggag ttaaacccat tactccagag caagaagagc 660

tcatccatag gctagtttat tttcaaaatg aatatgaaca tccatcccca gaggatatca 720

aaaggatagt taatgctgca ccagaagaag aaaatgtagc tgaagaaagg tttaggcata 780

ttacagaaat tacaattctc actgtacagt taattgtgga attttctaag cgattacctg 840

gttttgacaa actaattcgt gaagatcaaa tagctttatt aaaggcatgt agtagtgaag 900

taatgatgtt tagaatggca aggaggtatg atgctgaaac agattcgata ttgtttgcaa 960

ctaaccagcc gtatacgaga gaatcataca ctgtagctgg catgggtgat actgtggagg 1020

atctgctccg attttgtcga catatgtgtg ccatgaaagt cgataacgca gaatatgctc 1080

ttctcactgc cattgtaatt ttttcagaac gaccatctct aagtgaaggc tggaaggttg 1140

agaagattca agaaatttac atagaagcat taaaagcata tgttgaaaat cgaaggaaac 1200

catatgcaac aaccattttt gctaagttac tatctgtttt aactgaacta cgaacattag 1260

ggaatatgaa ttcagaaaca tgcttctcat tgaagctgaa gaatagaaag gtgccatcct 1320

tcctcgagga gatttgggat gttgtttcat aaacagtctt acctcaattc catgttactt 1380

ttcatatttg atttatctca gcaggtggct cagtacttat cctcacatta ctgagctcac 1440

ggtatgctca tacaattata acttgtaata tcatatcggt gatgacaaat ttgttacaat 1500

attctttgtt accttaacac aatgttgatc tcataatgat gtatgaattt ttctgttttt 1560

gcaaaaaaaa aagcggccgc gaattc 1586

<210> 21

<211> 1109

<212> DNA

<213> 黑尾叶蝉（Nephotetix cincticeps）

<400> 21

caggaggagc tctgcctgtt gtgcggagac cgagcgtcgg gataccacta caacgctctc 60

acctgcgaag gatgcaaggg cttctttcgg aggagtatca ccaaaaacgc agtgtaccag 120

tccaaatacg gcaccaattg tgaaatagac atgtatatgc ggcgcaagtg ccaggagtgc 180

cgactcaaga agtgcctcag tgtagggatg aggccagaat gtgtagtacc tgagtatcaa 240

tgtgccgtaa aaaggaaaga gaaaaaagct caaaaggaca aagataaacc tgtctcttca 300

accaatggct cgcctgaaat gagaatagac caggacaacc gttgtgtggt gttgcagagt 360

gaagacaaca ggtacaactc gagtacgccc agtttcggag tcaaacccct cagtccagaa 420

caagaggagc tcatccacag gctcgtctac ttccagaacg agtacgaaca ccctgccgag 480

gaggatctca agcggatcga gaacctcccc tgtgacgacg atgacccgtg tgatgttcgc 540

tacaaacaca ttacggagat cacaatactc acagtccagc tcatcgtgga gtttgcgaaa 600

aaactgcctg gtttcgacaa actactgaga gaggaccaga tcgtgttgct caaggcgtgt 660

tcgagcgagg tgatgatgct gcggatggcg cggaggtacg acgtccagac agactcgatc 720

ctgttcgcca acaaccagcc gtacacgcga gagtcgtaca cgatggcagg cgtgggggaa 780

gtcatcgaag atctgctgcg gttcggccga ctcatgtgct ccatgaaggt ggacaatgcc 840

gagtatgctc tgctcacggc catcgtcatc ttctccgagc ggccgaacct ggcggaagga 900

tggaaggttg agaagatcca ggagatctac ctggaggcgc tcaagtccta cgtggacaac 960

cgagtgaaac ctcgcagtcc gaccatcttc gccaaactgc tctccgttct caccgagctg 1020

cgaacactcg gcaaccagaa ctccgagatg tgcttctcgt taaactacgc aaccgcaaac 1080

atgccaccgt tcctcgaaga aatctggga 1109

<210> 22

<211> 735

<212> DNA

<213> 云杉卷叶蛾（Choristoneura fumiferana）

<400> 22

taccaggacg ggtacgagca gccttctgat gaagatttga agaggattac gcagacgtgg 60

cagcaagcgg acgatgaaaa cgaagagtct gacactccct tccgccagat cacagagatg 120

actatcctca cggtccaact tatcgtggag ttcgcgaagg gattgccagg gttcgccaag 180

atctcgcagc ctgatcaaat tacgctgctt aaggcttgct caagtgaggt aatgatgctc 240

cgagtcgcgc gacgatacga tgcggcctca gacagtgttc tgttcgcgaa caaccaagcg 300

tacactcgcg acaactaccg caaggctggc atggcctacg tcatcgagga tctactgcac 360

ttctgccggt gcatgtactc tatggcgttg gacaacatcc attacgcgct gctcacggct 420

gtcgtcatct tttctgaccg gccagggttg gagcagccgc aactggtgga agaaatccag 480

cggtactacc tgaatacgct ccgcatctat atcctgaacc agctgagcgg gtcggcgcgt 540

tcgtccgtca tatacggcaa gatcctctca atcctctctg agctacgcac gctcggcatg 600

caaaactcca acatgtgcat ctccctcaag ctcaagaaca gaaagctgcc gcctttcctc 660

gaggagatct gggatgtggc ggacatgtcg cacacccaac cgccgcctat cctcgagtcc 720

cccacgaatc tctag 735

<210> 23

<211> 1338

<212> DNA

<213> 黑腹果蝇（Drosophila melanogaster）

<400> 23

tatgagcagc catctgaaga ggatctcagg cgtataatga gtcaacccga tgagaacgag 60

agccaaacgg acgtcagctt tcggcatata accgagataa ccatactcac ggtccagttg 120

attgttgagt ttgctaaagg tctaccagcg tttacaaaga taccccagga ggaccagatc 180

acgttactaa aggcctgctc gtcggaggtg atgatgctgc gtatggcacg acgctatgac 240

cacagctcgg actcaatatt cttcgcgaat aatagatcat atacgcggga ttcttacaaa 300

atggccggaa tggctgataa cattgaagac ctgctgcatt tctgccgcca aatgttctcg 360

atgaaggtgg acaacgtcga atacgcgctt ctcactgcca ttgtgatctt ctcggaccgg 420

ccgggcctgg agaaggccca actagtcgaa gcgatccaga gctactacat cgacacgcta 480

cgcatttata tactcaaccg ccactgcggc gactcaatga gcctcgtctt ctacgcaaag 540

ctgctctcga tcctcaccga gctgcgtacg ctgggcaacc agaacgccga gatgtgtttc 600

tcactaaagc tcaaaaaccg caaactgccc aagttcctcg aggagatctg ggacgttcat 660

gccatcccgc catcggtcca gtcgcacctt cagattaccc aggaggagaa cgagcgtctc 720

gagcgggctg agcgtatgcg ggcatcggtt gggggcgcca ttaccgccgg cattgattgc 780

gactctgcct ccacttcggc ggcggcagcc gcggcccagc atcagcctca gcctcagccc 840

cagccccaac cctcctccct gacccagaac gattcccagc accagacaca gccgcagcta 900

caacctcagc taccacctca gctgcaaggt caactgcaac cccagctcca accacagctt 960

cagacgcaac tccagccaca gattcaacca cagccacagc tccttcccgt ctccgctccc 1020

gtgcccgcct ccgtaaccgc acctggttcc ttgtccgcgg tcagtacgag cagcgaatac 1080

atgggcggaa gtgcggccat aggacccatc acgccggcaa ccaccagcag tatcacggct 1140

gccgttaccg ctagctccac cacatcagcg gtaccgatgg gcaacggagt tggagtcggt 1200

gttggggtgg gcggcaacgt cagcatgtat gcgaacgccc agacggcgat ggccttgatg 1260

ggtgtagccc tgcattcgca ccaagagcag cttatcgggg gagtggcggt taagtcggag 1320

cactcgacga ctgcatag 1338

<210> 24

<211> 960

<212> DNA

<213> 云杉卷叶蛾（Choristoneura fumiferana）

<400> 24

cctgagtgcg tagtacccga gactcagtgc gccatgaagc ggaaagagaa gaaagcacag 60

aaggagaagg acaaactgcc tgtcagcacg acgacggtgg acgaccacat gccgcccatt 120

atgcagtgtg aacctccacc tcctgaagca gcaaggattc acgaagtggt cccaaggttt 180

ctctccgaca agctgttgga gacaaaccgg cagaaaaaca tcccccagtt gacagccaac 240

cagcagttcc ttatcgccag gctcatctgg taccaggacg ggtacgagca gccttctgat 300

gaagatttga agaggattac gcagacgtgg cagcaagcgg acgatgaaaa cgaagagtct 360

gacactccct tccgccagat cacagagatg actatcctca cggtccaact tatcgtggag 420

ttcgcgaagg gattgccagg gttcgccaag atctcgcagc ctgatcaaat tacgctgctt 480

aaggcttgct caagtgaggt aatgatgctc cgagtcgcgc gacgatacga tgcggcctca 540

gacagtgttc tgttcgcgaa caaccaagcg tacactcgcg acaactaccg caaggctggc 600

atggcctacg tcatcgagga tctactgcac ttctgccggt gcatgtactc tatggcgttg 660

gacaacatcc attacgcgct gctcacggct gtcgtcatct tttctgaccg gccagggttg 720

gagcagccgc aactggtgga agaaatccag cggtactacc tgaatacgct ccgcatctat 780

atcctgaacc agctgagcgg gtcggcgcgt tcgtccgtca tatacggcaa gatcctctca 840

atcctctctg agctacgcac gctcggcatg caaaactcca acatgtgcat ctccctcaag 900

ctcaagaaca gaaagctgcc gcctttcctc gaggagatct gggatgtggc ggacatgtcg 960

<210> 25

<211> 969

<212> DNA

<213> 黑腹果蝇（Drosophila melanogaster）

<400> 25

cggccggaat gcgtcgtccc ggagaaccaa tgtgcgatga agcggcgcga aaagaaggcc 60

cagaaggaga aggacaaaat gaccacttcg ccgagctctc agcatggcgg caatggcagc 120

ttggcctctg gtggcggcca agactttgtt aagaaggaga ttcttgacct tatgacatgc 180

gagccgcccc agcatgccac tattccgcta ctacctgatg aaatattggc caagtgtcaa 240

gcgcgcaata taccttcctt aacgtacaat cagttggccg ttatatacaa gttaatttgg 300

taccaggatg gctatgagca gccatctgaa gaggatctca ggcgtataat gagtcaaccc 360

gatgagaacg agagccaaac ggacgtcagc tttcggcata taaccgagat aaccatactc 420

acggtccagt tgattgttga gtttgctaaa ggtctaccag cgtttacaaa gataccccag 480

gaggaccaga tcacgttact aaaggcctgc tcgtcggagg tgatgatgct gcgtatggca 540

cgacgctatg accacagctc ggactcaata ttcttcgcga ataatagatc atatacgcgg 600

gattcttaca aaatggccgg aatggctgat aacattgaag acctgctgca tttctgccgc 660

caaatgttct cgatgaaggt ggacaacgtc gaatacgcgc ttctcactgc cattgtgatc 720

ttctcggacc ggccgggcct ggagaaggcc caactagtcg aagcgatcca gagctactac 780

atcgacacgc tacgcattta tatactcaac cgccactgcg gcgactcaat gagcctcgtc 840

ttctacgcaa agctgctctc gatcctcacc gagctgcgta cgctgggcaa ccagaacgcc 900

gagatgtgtt tctcactaaa gctcaaaaac cgcaaactgc ccaagttcct cgaggagatc 960

tgggacgtt 969

<210> 26

<211> 244

<212> PRT

<213> 云杉卷叶蛾（Choristoneura fumiferana）

<400> 26

Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile

1 5 10 15

Thr Gln Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr

20 25 30

Pro Phe Arg Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile

35 40 45

Val Glu Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro

50 55 60

Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu

65 70 75 80

Arg Val Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser Val Leu Phe Ala

85 90 95

Asn Asn Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala

100 105 110

Tyr Val Ile Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr Ser Met

115 120 125

Ala Leu Asp Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val Ile Phe

130 135 140

Ser Asp Arg Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu Ile Gln

145 150 155 160

Arg Tyr Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser

165 170 175

Gly Ser Ala Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu

180 185 190

Ser Glu Leu Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys Ile Ser

195 200 205

Leu Lys Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp

210 215 220

Asp Val Ala Asp Met Ser His Thr Gln Pro Pro Pro Ile Leu Glu Ser

225 230 235 240

Pro Thr Asn Leu

<210> 27

<211> 445

<212> PRT

<213> 黑腹果蝇（Drosophila melanogaster）

<400> 27

Tyr Glu Gln Pro Ser Glu Glu Asp Leu Arg Arg Ile Met Ser Gln Pro

1 5 10 15

Asp Glu Asn Glu Ser Gln Thr Asp Val Ser Phe Arg His Ile Thr Glu

20 25 30

Ile Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys Gly Leu

35 40 45

Pro Ala Phe Thr Lys Ile Pro Gln Glu Asp Gln Ile Thr Leu Leu Lys

50 55 60

Ala Cys Ser Ser Glu Val Met Met Leu Arg Met Ala Arg Arg Tyr Asp

65 70 75 80

His Ser Ser Asp Ser Ile Phe Phe Ala Asn Asn Arg Ser Tyr Thr Arg

85 90 95

Asp Ser Tyr Lys Met Ala Gly Met Ala Asp Asn Ile Glu Asp Leu Leu

100 105 110

His Phe Cys Arg Gln Met Phe Ser Met Lys Val Asp Asn Val Glu Tyr

115 120 125

Ala Leu Leu Thr Ala Ile Val Ile Phe Ser Asp Arg Pro Gly Leu Glu

130 135 140

Lys Ala Gln Leu Val Glu Ala Ile Gln Ser Tyr Tyr Ile Asp Thr Leu

145 150 155 160

Arg Ile Tyr Ile Leu Asn Arg His Cys Gly Asp Ser Met Ser Leu Val

165 170 175

Phe Tyr Ala Lys Leu Leu Ser Ile Leu Thr Glu Leu Arg Thr Leu Gly

180 185 190

Asn Gln Asn Ala Glu Met Cys Phe Ser Leu Lys Leu Lys Asn Arg Lys

195 200 205

Leu Pro Lys Phe Leu Glu Glu Ile Trp Asp Val His Ala Ile Pro Pro

210 215 220

Ser Val Gln Ser His Leu Gln Ile Thr Gln Glu Glu Asn Glu Arg Leu

225 230 235 240

Glu Arg Ala Glu Arg Met Arg Ala Ser Val Gly Gly Ala Ile Thr Ala

245 250 255

Gly Ile Asp Cys Asp Ser Ala Ser Thr Ser Ala Ala Ala Ala Ala Ala

260 265 270

Gln His Gln Pro Gln Pro Gln Pro Gln Pro Gln Pro Ser Ser Leu Thr

275 280 285

Gln Asn Asp Ser Gln His Gln Thr Gln Pro Gln Leu Gln Pro Gln Leu

290 295 300

Pro Pro Gln Leu Gln Gly Gln Leu Gln Pro Gln Leu Gln Pro Gln Leu

305 310 315 320

Gln Thr Gln Leu Gln Pro Gln Ile Gln Pro Gln Pro Gln Leu Leu Pro

325 330 335

Val Ser Ala Pro Val Pro Ala Ser Val Thr Ala Pro Gly Ser Leu Ser

340 345 350

Ala Val Ser Thr Ser Ser Glu Tyr Met Gly Gly Ser Ala Ala Ile Gly

355 360 365

Pro Ile Thr Pro Ala Thr Thr Ser Ser Ile Thr Ala Ala Val Thr Ala

370 375 380

Ser Ser Thr Thr Ser Ala Val Pro Met Gly Asn Gly Val Gly Val Gly

385 390 395 400

Val Gly Val Gly Gly Asn Val Ser Met Tyr Ala Asn Ala Gln Thr Ala

405 410 415

Met Ala Leu Met Gly Val Ala Leu His Ser His Gln Glu Gln Leu Ile

420 425 430

Gly Gly Val Ala Val Lys Ser Glu His Ser Thr Thr Ala

435 440 445

<210> 28

<211> 320

<212> PRT

<213> 云杉卷叶蛾（Choristoneura fumiferana）

<400> 28

Pro Glu Cys Val Val Pro Glu Thr Gln Cys Ala Met Lys Arg Lys Glu

1 5 10 15

Lys Lys Ala Gln Lys Glu Lys Asp Lys Leu Pro Val Ser Thr Thr Thr

20 25 30

Val Asp Asp His Met Pro Pro Ile Met Gln Cys Glu Pro Pro Pro Pro

35 40 45

Glu Ala Ala Arg Ile His Glu Val Val Pro Arg Phe Leu Ser Asp Lys

50 55 60

Leu Leu Glu Thr Asn Arg Gln Lys Asn Ile Pro Gln Leu Thr Ala Asn

65 70 75 80

Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln Asp Gly Tyr Glu

85 90 95

Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln Thr Trp Gln Gln

100 105 110

Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg Gln Ile Thr

115 120 125

Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys Gly

130 135 140

Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln Ile Thr Leu Leu

145 150 155 160

Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val Ala Arg Arg Tyr

165 170 175

Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn Gln Ala Tyr Thr

180 185 190

Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val Ile Glu Asp Leu

195 200 205

Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp Asn Ile His

210 215 220

Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp Arg Pro Gly Leu

225 230 235 240

Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr Tyr Leu Asn Thr

245 250 255

Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser Ala Arg Ser Ser

260 265 270

Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu Arg Thr Leu

275 280 285

Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys Leu Lys Asn Arg

290 295 300

Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val Ala Asp Met Ser

305 310 315 320

<210> 29

<211> 323

<212> PRT

<213> 黑腹果蝇（Drosophila melanogaster）

<400> 29

Arg Pro Glu Cys Val Val Pro Glu Asn Gln Cys Ala Met Lys Arg Arg

1 5 10 15

Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Met Thr Thr Ser Pro Ser

20 25 30

Ser Gln His Gly Gly Asn Gly Ser Leu Ala Ser Gly Gly Gly Gln Asp

35 40 45

Phe Val Lys Lys Glu Ile Leu Asp Leu Met Thr Cys Glu Pro Pro Gln

50 55 60

His Ala Thr Ile Pro Leu Leu Pro Asp Glu Ile Leu Ala Lys Cys Gln

65 70 75 80

Ala Arg Asn Ile Pro Ser Leu Thr Tyr Asn Gln Leu Ala Val Ile Tyr

85 90 95

Lys Leu Ile Trp Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Glu Glu Asp

100 105 110

Leu Arg Arg Ile Met Ser Gln Pro Asp Glu Asn Glu Ser Gln Thr Asp

115 120 125

Val Ser Phe Arg His Ile Thr Glu Ile Thr Ile Leu Thr Val Gln Leu

130 135 140

Ile Val Glu Phe Ala Lys Gly Leu Pro Ala Phe Thr Lys Ile Pro Gln

145 150 155 160

Glu Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met

165 170 175

Leu Arg Met Ala Arg Arg Tyr Asp His Ser Ser Asp Ser Ile Phe Phe

180 185 190

Ala Asn Asn Arg Ser Tyr Thr Arg Asp Ser Tyr Lys Met Ala Gly Met

195 200 205

Ala Asp Asn Ile Glu Asp Leu Leu His Phe Cys Arg Gln Met Phe Ser

210 215 220

Met Lys Val Asp Asn Val Glu Tyr Ala Leu Leu Thr Ala Ile Val Ile

225 230 235 240

Phe Ser Asp Arg Pro Gly Leu Glu Lys Ala Gln Leu Val Glu Ala Ile

245 250 255

Gln Ser Tyr Tyr Ile Asp Thr Leu Arg Ile Tyr Ile Leu Asn Arg His

260 265 270

Cys Gly Asp Ser Met Ser Leu Val Phe Tyr Ala Lys Leu Leu Ser Ile

275 280 285

Leu Thr Glu Leu Arg Thr Leu Gly Asn Gln Asn Ala Glu Met Cys Phe

290 295 300

Ser Leu Lys Leu Lys Asn Arg Lys Leu Pro Lys Phe Leu Glu Glu Ile

305 310 315 320

Trp Asp Val

<210> 30

<211> 987

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明: 合成多核苷酸

<400> 30

tgtgctatct gtggggaccg ctcctcaggc aaacactatg gggtatacag ttgtgagggc 60

tgcaagggct tcttcaagag gacagtacgc aaagacctga cctacacctg ccgagacaac 120

aaggactgcc tgatcgacaa gagacagcgg aaccggtgtc agtactgccg ctaccagaag 180

tgcctggcca tgggcatgaa gcgggaagct gtgcaggagg agcggcagcg gggcaaggac 240

cggaatgaga acgaggtgga gtccaccagc agtgccaacg aggacatgcc tgtagagaag 300

attctggaag ccgagcttgc tgtcgagccc aagactgaga catacgtgga ggcaaacatg 360

gggctgaacc ccagctcacc aaatgaccct gttaccaaca tctgtcaagc agcagacaag 420

cagctcttca ctcttgtgga gtgggccaag aggatcccac acttttctga gctgccccta 480

gacgaccagg tcatcctgct acgggcaggc tggaacgagc tgctgatcgc ctccttctcc 540

caccgctcca tagctgtgaa agatgggatt ctcctggcca ccggcctgca cgtacaccgg 600

aacagcgctc acagtgctgg ggtgggcgcc atctttgaca gggtgctaac agagctggtg 660

tctaagatgc gtgacatgca gatggacaag acggagctgg gctgcctgcg agccattgtc 720

ctgttcaacc ctgactctaa ggggctctca aaccctgctg aggtggaggc gttgagggag 780

aaggtgtatg cgtcactaga agcgtactgc aaacacaagt accctgagca gccgggcagg 840

tttgccaagc tgctgctccg cctgcctgca ctgcgttcca tcgggctcaa gtgcctggag 900

cacctgttct tcttcaagct catcggggac acgcccatcg acaccttcct catggagatg 960

ctggaggcac cacatcaagc cacctag 987

<210> 31

<211> 789

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明: 合成多核苷酸

<400> 31

aagcgggaag ctgtgcagga ggagcggcag cggggcaagg accggaatga gaacgaggtg 60

gagtccacca gcagtgccaa cgaggacatg cctgtagaga agattctgga agccgagctt 120

gctgtcgagc ccaagactga gacatacgtg gaggcaaaca tggggctgaa ccccagctca 180

ccaaatgacc ctgttaccaa catctgtcaa gcagcagaca agcagctctt cactcttgtg 240

gagtgggcca agaggatccc acacttttct gagctgcccc tagacgacca ggtcatcctg 300

ctacgggcag gctggaacga gctgctgatc gcctccttct cccaccgctc catagctgtg 360

aaagatggga ttctcctggc caccggcctg cacgtacacc ggaacagcgc tcacagtgct 420

ggggtgggcg ccatctttga cagggtgcta acagagctgg tgtctaagat gcgtgacatg 480

cagatggaca agacggagct gggctgcctg cgagccattg tcctgttcaa ccctgactct 540

aaggggctct caaaccctgc tgaggtggag gcgttgaggg agaaggtgta tgcgtcacta 600

gaagcgtact gcaaacacaa gtaccctgag cagccgggca ggtttgccaa gctgctgctc 660

cgcctgcctg cactgcgttc catcgggctc aagtgcctgg agcacctgtt cttcttcaag 720

ctcatcgggg acacgcccat cgacaccttc ctcatggaga tgctggaggc accacatcaa 780

gccacctag 789

<210> 32

<211> 714

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明: 合成多核苷酸

<400> 32

gccaacgagg acatgcctgt agagaagatt ctggaagccg agcttgctgt cgagcccaag 60

actgagacat acgtggaggc aaacatgggg ctgaacccca gctcaccaaa tgaccctgtt 120

accaacatct gtcaagcagc agacaagcag ctcttcactc ttgtggagtg ggccaagagg 180

atcccacact tttctgagct gcccctagac gaccaggtca tcctgctacg ggcaggctgg 240

aacgagctgc tgatcgcctc cttctcccac cgctccatag ctgtgaaaga tgggattctc 300

ctggccaccg gcctgcacgt acaccggaac agcgctcaca gtgctggggt gggcgccatc 360

tttgacaggg tgctaacaga gctggtgtct aagatgcgtg acatgcagat ggacaagacg 420

gagctgggct gcctgcgagc cattgtcctg ttcaaccctg actctaaggg gctctcaaac 480

cctgctgagg tggaggcgtt gagggagaag gtgtatgcgt cactagaagc gtactgcaaa 540

cacaagtacc ctgagcagcc gggcaggttt gccaagctgc tgctccgcct gcctgcactg 600

cgttccatcg ggctcaagtg cctggagcac ctgttcttct tcaagctcat cggggacacg 660

cccatcgaca ccttcctcat ggagatgctg gaggcaccac atcaagccac ctag 714

<210> 33

<211> 536

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明: 合成多核苷酸

<400> 33

ggatcccaca cttttctgag ctgcccctag acgaccaggt catcctgcta cgggcaggct 60

ggaacgagct gctgatcgcc tccttctccc accgctccat agctgtgaaa gatgggattc 120

tcctggccac cggcctgcac gtacaccgga acagcgctca cagtgctggg gtgggcgcca 180

tctttgacag ggtgctaaca gagctggtgt ctaagatgcg tgacatgcag atggacaaga 240

cggagctggg ctgcctgcga gccattgtcc tgttcaaccc tgactctaag gggctctcaa 300

accctgctga ggtggaggcg ttgagggaga aggtgtatgc gtcactagaa gcgtactgca 360

aacacaagta ccctgagcag ccgggcaggt ttgccaagct gctgctccgc ctgcctgcac 420

tgcgttccat cgggctcaag tgcctggagc acctgttctt cttcaagctc atcggggaca 480

cgcccatcga caccttcctc atggagatgc tggaggcacc acatcaagcc acctag 536

<210> 34

<211> 672

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明: 合成多核苷酸

<400> 34

gccaacgagg acatgcctgt agagaagatt ctggaagccg agcttgctgt cgagcccaag 60

actgagacat acgtggaggc aaacatgggg ctgaacccca gctcaccaaa tgaccctgtt 120

accaacatct gtcaagcagc agacaagcag ctcttcactc ttgtggagtg ggccaagagg 180

atcccacact tttctgagct gcccctagac gaccaggtca tcctgctacg ggcaggctgg 240

aacgagctgc tgatcgcctc cttctcccac cgctccatag ctgtgaaaga tgggattctc 300

ctggccaccg gcctgcacgt acaccggaac agcgctcaca gtgctggggt gggcgccatc 360

tttgacaggg tgctaacaga gctggtgtct aagatgcgtg acatgcagat ggacaagacg 420

gagctgggct gcctgcgagc cattgtcctg ttcaaccctg actctaaggg gctctcaaac 480

cctgctgagg tggaggcgtt gagggagaag gtgtatgcgt cactagaagc gtactgcaaa 540

cacaagtacc ctgagcagcc gggcaggttt gccaagctgc tgctccgcct gcctgcactg 600

cgttccatcg ggctcaagtg cctggagcac ctgttcttct tcaagctcat cggggacacg 660

cccatcgaca cc 672

<210> 35

<211> 1123

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明: 合成新多核苷酸序列

<400> 35

tgcgccatct gcggggaccg ctcctcaggc aagcactatg gagtgtacag ctgcgagggg 60

tgcaagggct tcttcaagcg gacggtgcgc aaggacctga cctacacctg ccgcgacaac 120

aaggactgcc tgattgacaa gcggcagcgg aaccggtgcc agtactgccg ctaccagaag 180

tgcctggcca tgggcatgaa gcgggaagcc gtgcaggagg agcggcagcg tggcaaggac 240

cggaacgaga atgaggtgga gtcgaccagc agcgccaacg aggacatgcc ggtggagagg 300

atcctggagg ctgagctggc cgtggagccc aagaccgaga cctacgtgga ggcaaacatg 360

gggctgaacc ccagctcgcc gaacgaccct gtcaccaaca tttgccaagc agccgacaaa 420

cagcttttca ccctggtgga gtgggccaag cggatcccac acttctcaga gctgcccctg 480

gacgaccagg tcatcctgct gcgggcaggc tggaatgagc tgctcatcgc ctccttctcc 540

caccgctcca tcgccgtgaa ggacgggatc ctcctggcca ccgggctgca cgtccaccgg 600

aacagcgccc acagcgcagg ggtgggcgcc atctttgaca gggtgctgac ggagcttgtg 660

tccaagatgc gggacatgca gatggacaag acggagctgg gctgcctgcg cgccatcgtc 720

ctctttaacc ctgactccaa ggggctctcg aacccggccg aggtggaggc gctgagggag 780

aaggtctatg cgtccttgga ggcctactgc aagcacaagt acccagagca gccgggaagg 840

ttcgctaagc tcttgctccg cctgccggct ctgcgctcca tcgggctcaa atgcctggaa 900

catctcttct tcttcaagct catcggggac acacccattg acaccttcct tatggagatg 960

ctggaggcgc cgcaccaaat gacttaggcc tgcgggccca tcctttgtgc ccacccgttc 1020

tggccaccct gcctggacgc cagctgttct tctcagcctg agccctgtcc ctgcccttct 1080

ctgcctggcc tgtttggact ttggggcaca gcctgtcact gct 1123

<210> 36

<211> 925

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明: 合成新多核苷酸序列

<400> 36

aagcgggaag ccgtgcagga ggagcggcag cgtggcaagg accggaacga gaatgaggtg 60

gagtcgacca gcagcgccaa cgaggacatg ccggtggaga ggatcctgga ggctgagctg 120

gccgtggagc ccaagaccga gacctacgtg gaggcaaaca tggggctgaa ccccagctcg 180

ccgaacgacc ctgtcaccaa catttgccaa gcagccgaca aacagctttt caccctggtg 240

gagtgggcca agcggatccc acacttctca gagctgcccc tggacgacca ggtcatcctg 300

ctgcgggcag gctggaatga gctgctcatc gcctccttct cccaccgctc catcgccgtg 360

aaggacggga tcctcctggc caccgggctg cacgtccacc ggaacagcgc ccacagcgca 420

ggggtgggcg ccatctttga cagggtgctg acggagcttg tgtccaagat gcgggacatg 480

cagatggaca agacggagct gggctgcctg cgcgccatcg tcctctttaa ccctgactcc 540

aaggggctct cgaacccggc cgaggtggag gcgctgaggg agaaggtcta tgcgtccttg 600

gaggcctact gcaagcacaa gtacccagag cagccgggaa ggttcgctaa gctcttgctc 660

cgcctgccgg ctctgcgctc catcgggctc aaatgcctgg aacatctctt cttcttcaag 720

ctcatcgggg acacacccat tgacaccttc cttatggaga tgctggaggc gccgcaccaa 780

atgacttagg cctgcgggcc catcctttgt gcccacccgt tctggccacc ctgcctggac 840

gccagctgtt cttctcagcc tgagccctgt ccctgccctt ctctgcctgg cctgtttgga 900

ctttggggca cagcctgtca ctgct 925

<210> 37

<211> 850

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明: 合成新多核苷酸序列

<400> 37

gccaacgagg acatgccggt ggagaggatc ctggaggctg agctggccgt ggagcccaag 60

accgagacct acgtggaggc aaacatgggg ctgaacccca gctcgccgaa cgaccctgtc 120

accaacattt gccaagcagc cgacaaacag cttttcaccc tggtggagtg ggccaagcgg 180

atcccacact tctcagagct gcccctggac gaccaggtca tcctgctgcg ggcaggctgg 240

aatgagctgc tcatcgcctc cttctcccac cgctccatcg ccgtgaagga cgggatcctc 300

ctggccaccg ggctgcacgt ccaccggaac agcgcccaca gcgcaggggt gggcgccatc 360

tttgacaggg tgctgacgga gcttgtgtcc aagatgcggg acatgcagat ggacaagacg 420

gagctgggct gcctgcgcgc catcgtcctc tttaaccctg actccaaggg gctctcgaac 480

ccggccgagg tggaggcgct gagggagaag gtctatgcgt ccttggaggc ctactgcaag 540

cacaagtacc cagagcagcc gggaaggttc gctaagctct tgctccgcct gccggctctg 600

cgctccatcg ggctcaaatg cctggaacat ctcttcttct tcaagctcat cggggacaca 660

cccattgaca ccttccttat ggagatgctg gaggcgccgc accaaatgac ttaggcctgc 720

gggcccatcc tttgtgccca cccgttctgg ccaccctgcc tggacgccag ctgttcttct 780

cagcctgagc cctgtccctg cccttctctg cctggcctgt ttggactttg gggcacagcc 840

tgtcactgct 850

<210> 38

<211> 670

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明: 合成多核苷酸

<400> 38

atcccacact tctcagagct gcccctggac gaccaggtca tcctgctgcg ggcaggctgg 60

aatgagctgc tcatcgcctc cttctcccac cgctccatcg ccgtgaagga cgggatcctc 120

ctggccaccg ggctgcacgt ccaccggaac agcgcccaca gcgcaggggt gggcgccatc 180

tttgacaggg tgctgacgga gcttgtgtcc aagatgcggg acatgcagat ggacaagacg 240

gagctgggct gcctgcgcgc catcgtcctc tttaaccctg actccaaggg gctctcgaac 300

ccggccgagg tggaggcgct gagggagaag gtctatgcgt ccttggaggc ctactgcaag 360

cacaagtacc cagagcagcc gggaaggttc gctaagctct tgctccgcct gccggctctg 420

cgctccatcg ggctcaaatg cctggaacat ctcttcttct tcaagctcat cggggacaca 480

cccattgaca ccttccttat ggagatgctg gaggcgccgc accaaatgac ttaggcctgc 540

gggcccatcc tttgtgccca cccgttctgg ccaccctgcc tggacgccag ctgttcttct 600

cagcctgagc cctgtccctg cccttctctg cctggcctgt ttggactttg gggcacagcc 660

tgtcactgct 670

<210> 39

<211> 672

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明: 合成多核苷酸

<400> 39

gccaacgagg acatgccggt ggagaggatc ctggaggctg agctggccgt ggagcccaag 60

accgagacct acgtggaggc aaacatgggg ctgaacccca gctcgccgaa cgaccctgtc 120

accaacattt gccaagcagc cgacaaacag cttttcaccc tggtggagtg ggccaagcgg 180

atcccacact tctcagagct gcccctggac gaccaggtca tcctgctgcg ggcaggctgg 240

aatgagctgc tcatcgcctc cttctcccac cgctccatcg ccgtgaagga cgggatcctc 300

ctggccaccg ggctgcacgt ccaccggaac agcgcccaca gcgcaggggt gggcgccatc 360

tttgacaggg tgctgacgga gcttgtgtcc aagatgcggg acatgcagat ggacaagacg 420

gagctgggct gcctgcgcgc catcgtcctc tttaaccctg actccaaggg gctctcgaac 480

ccggccgagg tggaggcgct gagggagaag gtctatgcgt ccttggaggc ctactgcaag 540

cacaagtacc cagagcagcc gggaaggttc gctaagctct tgctccgcct gccggctctg 600

cgctccatcg ggctcaaatg cctggaacat ctcttcttct tcaagctcat cggggacaca 660

cccattgaca cc 672

<210> 40

<211> 328

<212> PRT

<213> 人工序列

<220>

<223> 人工序列说明: 合成多肽

<400> 40

Cys Ala Ile Cys Gly Asp Arg Ser Ser Gly Lys His Tyr Gly Val Tyr

1 5 10 15

Ser Cys Glu Gly Cys Lys Gly Phe Phe Lys Arg Thr Val Arg Lys Asp

20 25 30

Leu Thr Tyr Thr Cys Arg Asp Asn Lys Asp Cys Leu Ile Asp Lys Arg

35 40 45

Gln Arg Asn Arg Cys Gln Tyr Cys Arg Tyr Gln Lys Cys Leu Ala Met

50 55 60

Gly Met Lys Arg Glu Ala Val Gln Glu Glu Arg Gln Arg Gly Lys Asp

65 70 75 80

Arg Asn Glu Asn Glu Val Glu Ser Thr Ser Ser Ala Asn Glu Asp Met

85 90 95

Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala Val Glu Pro Lys Thr

100 105 110

Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn Pro Ser Ser Pro Asn

115 120 125

Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr

130 135 140

Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe Ser Glu Leu Pro Leu

145 150 155 160

Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile

165 170 175

Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys Asp Gly Ile Leu Leu

180 185 190

Ala Thr Gly Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val

195 200 205

Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg

210 215 220

Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Val

225 230 235 240

Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn Pro Ala Glu Val Glu

245 250 255

Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu Ala Tyr Cys Lys His

260 265 270

Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu

275 280 285

Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe

290 295 300

Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met Glu Met

305 310 315 320

Leu Glu Ala Pro His Gln Ala Thr

325

<210> 41

<211> 262

<212> PRT

<213> 人工序列

<220>

<223> 人工序列说明: 合成多肽

<400> 41

Lys Arg Glu Ala Val Gln Glu Glu Arg Gln Arg Gly Lys Asp Arg Asn

1 5 10 15

Glu Asn Glu Val Glu Ser Thr Ser Ser Ala Asn Glu Asp Met Pro Val

20 25 30

Glu Lys Ile Leu Glu Ala Glu Leu Ala Val Glu Pro Lys Thr Glu Thr

35 40 45

Tyr Val Glu Ala Asn Met Gly Leu Asn Pro Ser Ser Pro Asn Asp Pro

50 55 60

Val Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr Leu Val

65 70 75 80

Glu Trp Ala Lys Arg Ile Pro His Phe Ser Glu Leu Pro Leu Asp Asp

85 90 95

Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser

100 105 110

Phe Ser His Arg Ser Ile Ala Val Lys Asp Gly Ile Leu Leu Ala Thr

115 120 125

Gly Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala

130 135 140

Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met

145 150 155 160

Gln Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Val Leu Phe

165 170 175

Asn Pro Asp Ser Lys Gly Leu Ser Asn Pro Ala Glu Val Glu Ala Leu

180 185 190

Arg Glu Lys Val Tyr Ala Ser Leu Glu Ala Tyr Cys Lys His Lys Tyr

195 200 205

Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala

210 215 220

Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys

225 230 235 240

Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu

245 250 255

Ala Pro His Gln Ala Thr

260

<210> 42

<211> 237

<212> PRT

<213> 人工序列

<220>

<223> 人工序列说明: 合成多肽

<400> 42

Ala Asn Glu Asp Met Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala

1 5 10 15

Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn

20 25 30

Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp

35 40 45

Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe

50 55 60

Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp

65 70 75 80

Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys

85 90 95

Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala

100 105 110

His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu

115 120 125

Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys

130 135 140

Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn

145 150 155 160

Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu

165 170 175

Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys

180 185 190

Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu

195 200 205

Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr

210 215 220

Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Ala Thr

225 230 235

<210> 43

<211> 177

<212> PRT

<213> 人工序列

<220>

<223> 人工序列说明: 合成多肽

<400> 43

Ile Pro His Phe Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu

1 5 10 15

Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser

20 25 30

Ile Ala Val Lys Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His

35 40 45

Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val

50 55 60

Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr

65 70 75 80

Glu Leu Gly Cys Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys

85 90 95

Gly Leu Ser Asn Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr

100 105 110

Ala Ser Leu Glu Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly

115 120 125

Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly

130 135 140

Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr

145 150 155 160

Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Ala

165 170 175

Thr

<210> 44

<211> 224

<212> PRT

<213> 人工序列

<220>

<223> 人工序列说明: 合成多肽

<400> 44

Ala Asn Glu Asp Met Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala

1 5 10 15

Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn

20 25 30

Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp

35 40 45

Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe

50 55 60

Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp

65 70 75 80

Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys

85 90 95

Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala

100 105 110

His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu

115 120 125

Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys

130 135 140

Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn

145 150 155 160

Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu

165 170 175

Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys

180 185 190

Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu

195 200 205

Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr

210 215 220

<210> 45

<211> 328

<212> PRT

<213> 人工序列

<220>

<223> 人工序列说明: 合成多肽

<400> 45

Cys Ala Ile Cys Gly Asp Arg Ser Ser Gly Lys His Tyr Gly Val Tyr

1 5 10 15

Ser Cys Glu Gly Cys Lys Gly Phe Phe Lys Arg Thr Val Arg Lys Asp

20 25 30

Leu Thr Tyr Thr Cys Arg Asp Asn Lys Asp Cys Leu Ile Asp Lys Arg

35 40 45

Gln Arg Asn Arg Cys Gln Tyr Cys Arg Tyr Gln Lys Cys Leu Ala Met

50 55 60

Gly Met Lys Arg Glu Ala Val Gln Glu Glu Arg Gln Arg Gly Lys Asp

65 70 75 80

Arg Asn Glu Asn Glu Val Glu Ser Thr Ser Ser Ala Asn Glu Asp Met

85 90 95

Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala Val Glu Pro Lys Thr

100 105 110

Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn Pro Ser Ser Pro Asn

115 120 125

Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr

130 135 140

Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe Ser Glu Leu Pro Leu

145 150 155 160

Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile

165 170 175

Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys Asp Gly Ile Leu Leu

180 185 190

Ala Thr Gly Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val

195 200 205

Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg

210 215 220

Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Val

225 230 235 240

Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn Pro Ala Glu Val Glu

245 250 255

Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu Ala Tyr Cys Lys His

260 265 270

Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu

275 280 285

Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe

290 295 300

Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met Glu Met

305 310 315 320

Leu Glu Ala Pro His Gln Met Thr

325

<210> 46

<211> 262

<212> PRT

<213> 人工序列

<220>

<223> 人工序列说明: 合成多肽

<400> 46

Lys Arg Glu Ala Val Gln Glu Glu Arg Gln Arg Gly Lys Asp Arg Asn

1 5 10 15

Glu Asn Glu Val Glu Ser Thr Ser Ser Ala Asn Glu Asp Met Pro Val

20 25 30

Glu Arg Ile Leu Glu Ala Glu Leu Ala Val Glu Pro Lys Thr Glu Thr

35 40 45

Tyr Val Glu Ala Asn Met Gly Leu Asn Pro Ser Ser Pro Asn Asp Pro

50 55 60

Val Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr Leu Val

65 70 75 80

Glu Trp Ala Lys Arg Ile Pro His Phe Ser Glu Leu Pro Leu Asp Asp

85 90 95

Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser

100 105 110

Phe Ser His Arg Ser Ile Ala Val Lys Asp Gly Ile Leu Leu Ala Thr

115 120 125

Gly Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala

130 135 140

Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met

145 150 155 160

Gln Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Val Leu Phe

165 170 175

Asn Pro Asp Ser Lys Gly Leu Ser Asn Pro Ala Glu Val Glu Ala Leu

180 185 190

Arg Glu Lys Val Tyr Ala Ser Leu Glu Ala Tyr Cys Lys His Lys Tyr

195 200 205

Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala

210 215 220

Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys

225 230 235 240

Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu

245 250 255

Ala Pro His Gln Met Thr

260

<210> 47

<211> 237

<212> PRT

<213> 人工序列

<220>

<223> 人工序列说明: 合成多肽

<400> 47

Ala Asn Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala

1 5 10 15

Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn

20 25 30

Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp

35 40 45

Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe

50 55 60

Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp

65 70 75 80

Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys

85 90 95

Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala

100 105 110

His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu

115 120 125

Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys

130 135 140

Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn

145 150 155 160

Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu

165 170 175

Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys

180 185 190

Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu

195 200 205

Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr

210 215 220

Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Met Thr

225 230 235

<210> 48

<211> 177

<212> PRT

<213> 人工序列

<220>

<223> 人工序列说明: 合成多肽

<400> 48

Ile Pro His Phe Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu

1 5 10 15

Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser

20 25 30

Ile Ala Val Lys Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His

35 40 45

Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val

50 55 60

Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr

65 70 75 80

Glu Leu Gly Cys Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys

85 90 95

Gly Leu Ser Asn Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr

100 105 110

Ala Ser Leu Glu Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly

115 120 125

Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly

130 135 140

Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr

145 150 155 160

Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Met

165 170 175

Thr

<210> 49

<211> 224

<212> PRT

<213> 人工序列

<220>

<223> 人工序列说明: 合成多肽

<400> 49

Ala Asn Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala

1 5 10 15

Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn

20 25 30

Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp

35 40 45

Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe

50 55 60

Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp

65 70 75 80

Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys

85 90 95

Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala

100 105 110

His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu

115 120 125

Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys

130 135 140

Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn

145 150 155 160

Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu

165 170 175

Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys

180 185 190

Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu

195 200 205

Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr

210 215 220

<210> 50

<211> 635

<212> DNA

<213> 飞蝗（Locusta migratoria）

<400> 50

tgcatacaga catgcctgtt gaacgcatac ttgaagctga aaaacgagtg gagtgcaaag 60

cagaaaacca agtggaatat gagctggtgg agtgggctaa acacatcccg cacttcacat 120

ccctacctct ggaggaccag gttctcctcc tcagagcagg ttggaatgaa ctgctaattg 180

cagcattttc acatcgatct gtagatgtta aagatggcat agtacttgcc actggtctca 240

cagtgcatcg aaattctgcc catcaagctg gagtcggcac aatatttgac agagttttga 300

cagaactggt agcaaagatg agagaaatga aaatggataa aactgaactt ggctgcttgc 360

gatctgttat tcttttcaat ccagaggtga ggggtttgaa atccgcccag gaagttgaac 420

ttctacgtga aaaagtatat gccgctttgg aagaatatac tagaacaaca catcccgatg 480

aaccaggaag atttgcaaaa cttttgcttc gtctgccttc tttacgttcc ataggcctta 540

agtgtttgga gcatttgttt ttctttcgcc ttattggaga tgttccaatt gatacgttcc 600

tgatggagat gcttgaatca ccttctgatt cataa 635

<210> 51

<211> 687

<212> DNA

<213> 美洲钝眼蜱（Amblyomma americanum）

<400> 51

cctcctgaga tgcctctgga gcgcatactg gaggcagagc tgcgggttga gtcacagacg 60

gggaccctct cggaaagcgc acagcagcag gatccagtga gcagcatctg ccaagctgca 120

gaccgacagc tgcaccagct agttcaatgg gccaagcaca ttccacattt tgaagagctt 180

ccccttgagg accgcatggt gttgctcaag gctggctgga acgagctgct cattgctgct 240

ttctcccacc gttctgttga cgtgcgtgat ggcattgtgc tcgctacagg tcttgtggtg 300

cagcggcata gtgctcatgg ggctggcgtt ggggccatat ttgatagggt tctcactgaa 360

ctggtagcaa agatgcgtga gatgaagatg gaccgcactg agcttggatg cctgcttgct 420

gtggtacttt ttaatcctga ggccaagggg ctgcggacct gcccaagtgg aggccctgag 480

ggagaaagtg tatctgcctt ggaagagcac tgccggcagc agtacccaga ccagcctggg 540

cgctttgcca agctgctgct gcggttgcca gctctgcgca gtattggcct caagtgcctc 600

gaacatctct ttttcttcaa gctcatcggg gacacgccca tcgacaactt tcttctttcc 660

atgctggagg ccccctctga cccctaa 687

<210> 52

<211> 693

<212> DNA

<213> 美洲钝眼蜱（Amblyomma americanum）

<400> 52

tctccggaca tgccactcga acgcattctc gaagccgaga tgcgcgtcga gcagccggca 60

ccgtccgttt tggcgcagac ggccgcatcg ggccgcgacc ccgtcaacag catgtgccag 120

gctgccccgc cacttcacga gctcgtacag tgggcccggc gaattccgca cttcgaagag 180

cttcccatcg aggatcgcac cgcgctgctc aaagccggct ggaacgaact gcttattgcc 240

gccttttcgc accgttctgt ggcggtgcgc gacggcatcg ttctggccac cgggctggtg 300

gtgcagcggc acagcgcaca cggcgcaggc gttggcgaca tcttcgaccg cgtactagcc 360

gagctggtgg ccaagatgcg cgacatgaag atggacaaaa cggagctcgg ctgcctgcgc 420

gccgtggtgc tcttcaatcc agacgccaag ggtctccgaa acgccaccag agtagaggcg 480

ctccgcgaga aggtgtatgc ggcgctggag gagcactgcc gtcggcacca cccggaccaa 540

ccgggtcgct tcggcaagct gctgctgcgg ctgcctgcct tgcgcagcat cgggctcaaa 600

tgcctcgagc atctgttctt cttcaagctc atcggagaca ctcccataga cagcttcctg 660

ctcaacatgc tggaggcacc ggcagacccc tag 693

<210> 53

<211> 801

<212> DNA

<213> 招潮蟹（Celuca pugilator）

<400> 53

tcagacatgc caattgccag catacgggag gcagagctca gcgtggatcc catagatgag 60

cagccgctgg accaaggggt gaggcttcag gttccactcg cacctcctga tagtgaaaag 120

tgtagcttta ctttaccttt tcatcccgtc agtgaagtat cctgtgctaa ccctctgcag 180

gatgtggtga gcaacatatg ccaggcagct gacagacatc tggtgcagct ggtggagtgg 240

gccaagcaca tcccacactt cacagacctt cccatagagg accaagtggt attactcaaa 300

gccgggtgga acgagttgct tattgcctca ttctcacacc gtagcatggg cgtggaggat 360

ggcatcgtgc tggccacagg gctcgtgatc cacagaagta gtgctcacca ggctggagtg 420

ggtgccatat ttgatcgtgt cctctctgag ctggtggcca agatgaagga gatgaagatt 480

gacaagacag agctgggctg ccttcgctcc atcgtcctgt tcaacccaga tgccaaagga 540

ctaaactgcg tcaatgatgt ggagatcttg cgtgagaagg tgtatgctgc cctggaggag 600

tacacacgaa ccacttaccc tgatgaacct ggacgctttg ccaagttgct tctgcgactt 660

cctgcactca ggtctatagg cctgaagtgt cttgagtacc tcttcctgtt taagctgatt 720

ggagacactc ccctggacag ctacttgatg aagatgctcg tagacaaccc aaatacaagc 780

gtcactcccc ccaccagcta g 801

<210> 54

<211> 690

<212> DNA

<213> 黄粉虫（Tenebrio molitor）

<400> 54

gccgagatgc ccctcgacag gataatcgag gcggagaaac ggatagaatg cacacccgct 60

ggtggctctg gtggtgtcgg agagcaacac gacggggtga acaacatctg tcaagccact 120

aacaagcagc tgttccaact ggtgcaatgg gctaagctca tacctcactt tacctcgttg 180

ccgatgtcgg accaggtgct tttattgagg gcaggatgga atgaattgct catcgccgca 240

ttctcgcaca gatctataca ggcgcaggat gccatcgttc tagccacggg gttgacagtt 300

aacaaaacgt cggcgcacgc cgtgggcgtg ggcaacatct acgaccgcgt cctctccgag 360

ctggtgaaca agatgaaaga gatgaagatg gacaagacgg agctgggctg cttgagagcc 420

atcatcctct acaaccccac gtgtcgcggc atcaagtccg tgcaggaagt ggagatgctg 480

cgtgagaaaa tttacggcgt gctggaagag tacaccagga ccacccaccc gaacgagccc 540

ggcaggttcg ccaaactgct tctgcgcctc ccggccctca ggtccatcgg gttgaaatgt 600

tccgaacacc tctttttctt caagctgatc ggtgatgttc caatagacac gttcctgatg 660

gagatgctgg agtctccggc ggacgcttag 690

<210> 55

<211> 681

<212> DNA

<213> 蜜蜂（Apis mellifera）

<400> 55

cattcggaca tgccgatcga gcgtatcctg gaggccgaga agagagtcga atgtaagatg 60

gagcaacagg gaaattacga gaatgcagtg tcgcacattt gcaacgccac gaacaaacag 120

ctgttccagc tggtagcatg ggcgaaacac atcccgcatt ttacctcgtt gccactggag 180

gatcaggtac ttctgctcag ggccggttgg aacgagttgc tgatagcctc cttttcccac 240

cgttccatcg acgtgaagga cggtatcgtg ctggcgacgg ggatcaccgt gcatcggaac 300

tcggcgcagc aggccggcgt gggcacgata ttcgaccgtg tcctctcgga gcttgtctcg 360

aaaatgcgtg aaatgaagat ggacaggaca gagcttggct gtctcagatc tataatactc 420

ttcaatcccg aggttcgagg actgaaatcc atccaggaag tgaccctgct ccgtgagaag 480

atctacggcg ccctggaggg ttattgccgc gtagcttggc ccgacgacgc tggaagattc 540

gcgaaattac ttctacgcct gcccgccatc cgctcgatcg gattaaagtg cctcgagtac 600

ctgttcttct tcaaaatgat cggtgacgta ccgatcgacg attttctcgt ggagatgtta 660

gaatcgcgat cagatcctta g 681

<210> 56

<211> 210

<212> PRT

<213> 飞蝗（Locusta migratoria）

<400> 56

His Thr Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Lys Arg Val

1 5 10 15

Glu Cys Lys Ala Glu Asn Gln Val Glu Tyr Glu Leu Val Glu Trp Ala

20 25 30

Lys His Ile Pro His Phe Thr Ser Leu Pro Leu Glu Asp Gln Val Leu

35 40 45

Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His

50 55 60

Arg Ser Val Asp Val Lys Asp Gly Ile Val Leu Ala Thr Gly Leu Thr

65 70 75 80

Val His Arg Asn Ser Ala His Gln Ala Gly Val Gly Thr Ile Phe Asp

85 90 95

Arg Val Leu Thr Glu Leu Val Ala Lys Met Arg Glu Met Lys Met Asp

100 105 110

Lys Thr Glu Leu Gly Cys Leu Arg Ser Val Ile Leu Phe Asn Pro Glu

115 120 125

Val Arg Gly Leu Lys Ser Ala Gln Glu Val Glu Leu Leu Arg Glu Lys

130 135 140

Val Tyr Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr His Pro Asp Glu

145 150 155 160

Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ser Leu Arg Ser

165 170 175

Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Arg Leu Ile Gly

180 185 190

Asp Val Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser Pro Ser

195 200 205

Asp Ser

210

<210> 57

<211> 228

<212> PRT

<213> 美洲钝眼蜱（Amblyomma americanum）

<400> 57

Pro Pro Glu Met Pro Leu Glu Arg Ile Leu Glu Ala Glu Leu Arg Val

1 5 10 15

Glu Ser Gln Thr Gly Thr Leu Ser Glu Ser Ala Gln Gln Gln Asp Pro

20 25 30

Val Ser Ser Ile Cys Gln Ala Ala Asp Arg Gln Leu His Gln Leu Val

35 40 45

Gln Trp Ala Lys His Ile Pro His Phe Glu Glu Leu Pro Leu Glu Asp

50 55 60

Arg Met Val Leu Leu Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala

65 70 75 80

Phe Ser His Arg Ser Val Asp Val Arg Asp Gly Ile Val Leu Ala Thr

85 90 95

Gly Leu Val Val Gln Arg His Ser Ala His Gly Ala Gly Val Gly Ala

100 105 110

Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ala Lys Met Arg Glu Met

115 120 125

Lys Met Asp Arg Thr Glu Leu Gly Cys Leu Leu Ala Val Val Leu Phe

130 135 140

Asn Pro Glu Ala Lys Gly Leu Arg Thr Cys Pro Ser Gly Gly Pro Glu

145 150 155 160

Gly Glu Ser Val Ser Ala Leu Glu Glu His Cys Arg Gln Gln Tyr Pro

165 170 175

Asp Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu

180 185 190

Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu

195 200 205

Ile Gly Asp Thr Pro Ile Asp Asn Phe Leu Leu Ser Met Leu Glu Ala

210 215 220

Pro Ser Asp Pro

225

<210> 58

<211> 230

<212> PRT

<213> 美洲钝眼蜱（Amblyomma americanum）

<400> 58

Ser Pro Asp Met Pro Leu Glu Arg Ile Leu Glu Ala Glu Met Arg Val

1 5 10 15

Glu Gln Pro Ala Pro Ser Val Leu Ala Gln Thr Ala Ala Ser Gly Arg

20 25 30

Asp Pro Val Asn Ser Met Cys Gln Ala Ala Pro Pro Leu His Glu Leu

35 40 45

Val Gln Trp Ala Arg Arg Ile Pro His Phe Glu Glu Leu Pro Ile Glu

50 55 60

Asp Arg Thr Ala Leu Leu Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala

65 70 75 80

Ala Phe Ser His Arg Ser Val Ala Val Arg Asp Gly Ile Val Leu Ala

85 90 95

Thr Gly Leu Val Val Gln Arg His Ser Ala His Gly Ala Gly Val Gly

100 105 110

Asp Ile Phe Asp Arg Val Leu Ala Glu Leu Val Ala Lys Met Arg Asp

115 120 125

Met Lys Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Val Val Leu

130 135 140

Phe Asn Pro Asp Ala Lys Gly Leu Arg Asn Ala Thr Arg Val Glu Ala

145 150 155 160

Leu Arg Glu Lys Val Tyr Ala Ala Leu Glu Glu His Cys Arg Arg His

165 170 175

His Pro Asp Gln Pro Gly Arg Phe Gly Lys Leu Leu Leu Arg Leu Pro

180 185 190

Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe

195 200 205

Lys Leu Ile Gly Asp Thr Pro Ile Asp Ser Phe Leu Leu Asn Met Leu

210 215 220

Glu Ala Pro Ala Asp Pro

225 230

<210> 59

<211> 266

<212> PRT

<213> 招潮蟹（Celuca pugilator）

<400> 59

Ser Asp Met Pro Ile Ala Ser Ile Arg Glu Ala Glu Leu Ser Val Asp

1 5 10 15

Pro Ile Asp Glu Gln Pro Leu Asp Gln Gly Val Arg Leu Gln Val Pro

20 25 30

Leu Ala Pro Pro Asp Ser Glu Lys Cys Ser Phe Thr Leu Pro Phe His

35 40 45

Pro Val Ser Glu Val Ser Cys Ala Asn Pro Leu Gln Asp Val Val Ser

50 55 60

Asn Ile Cys Gln Ala Ala Asp Arg His Leu Val Gln Leu Val Glu Trp

65 70 75 80

Ala Lys His Ile Pro His Phe Thr Asp Leu Pro Ile Glu Asp Gln Val

85 90 95

Val Leu Leu Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser

100 105 110

His Arg Ser Met Gly Val Glu Asp Gly Ile Val Leu Ala Thr Gly Leu

115 120 125

Val Ile His Arg Ser Ser Ala His Gln Ala Gly Val Gly Ala Ile Phe

130 135 140

Asp Arg Val Leu Ser Glu Leu Val Ala Lys Met Lys Glu Met Lys Ile

145 150 155 160

Asp Lys Thr Glu Leu Gly Cys Leu Arg Ser Ile Val Leu Phe Asn Pro

165 170 175

Asp Ala Lys Gly Leu Asn Cys Val Asn Asp Val Glu Ile Leu Arg Glu

180 185 190

Lys Val Tyr Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr Tyr Pro Asp

195 200 205

Glu Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg

210 215 220

Ser Ile Gly Leu Lys Cys Leu Glu Tyr Leu Phe Leu Phe Lys Leu Ile

225 230 235 240

Gly Asp Thr Pro Leu Asp Ser Tyr Leu Met Lys Met Leu Val Asp Asn

245 250 255

Pro Asn Thr Ser Val Thr Pro Pro Thr Ser

260 265

<210> 60

<211> 229

<212> PRT

<213> 黄粉虫（Tenebrio molitor）

<400> 60

Ala Glu Met Pro Leu Asp Arg Ile Ile Glu Ala Glu Lys Arg Ile Glu

1 5 10 15

Cys Thr Pro Ala Gly Gly Ser Gly Gly Val Gly Glu Gln His Asp Gly

20 25 30

Val Asn Asn Ile Cys Gln Ala Thr Asn Lys Gln Leu Phe Gln Leu Val

35 40 45

Gln Trp Ala Lys Leu Ile Pro His Phe Thr Ser Leu Pro Met Ser Asp

50 55 60

Gln Val Leu Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala

65 70 75 80

Phe Ser His Arg Ser Ile Gln Ala Gln Asp Ala Ile Val Leu Ala Thr

85 90 95

Gly Leu Thr Val Asn Lys Thr Ser Ala His Ala Val Gly Val Gly Asn

100 105 110

Ile Tyr Asp Arg Val Leu Ser Glu Leu Val Asn Lys Met Lys Glu Met

115 120 125

Lys Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Ile Leu Tyr

130 135 140

Asn Pro Thr Cys Arg Gly Ile Lys Ser Val Gln Glu Val Glu Met Leu

145 150 155 160

Arg Glu Lys Ile Tyr Gly Val Leu Glu Glu Tyr Thr Arg Thr Thr His

165 170 175

Pro Asn Glu Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala

180 185 190

Leu Arg Ser Ile Gly Leu Lys Cys Ser Glu His Leu Phe Phe Phe Lys

195 200 205

Leu Ile Gly Asp Val Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu

210 215 220

Ser Pro Ala Asp Ala

225

<210> 61

<211> 226

<212> PRT

<213> 蜜蜂（Apis mellifera）

<400> 61

His Ser Asp Met Pro Ile Glu Arg Ile Leu Glu Ala Glu Lys Arg Val

1 5 10 15

Glu Cys Lys Met Glu Gln Gln Gly Asn Tyr Glu Asn Ala Val Ser His

20 25 30

Ile Cys Asn Ala Thr Asn Lys Gln Leu Phe Gln Leu Val Ala Trp Ala

35 40 45

Lys His Ile Pro His Phe Thr Ser Leu Pro Leu Glu Asp Gln Val Leu

50 55 60

Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His

65 70 75 80

Arg Ser Ile Asp Val Lys Asp Gly Ile Val Leu Ala Thr Gly Ile Thr

85 90 95

Val His Arg Asn Ser Ala Gln Gln Ala Gly Val Gly Thr Ile Phe Asp

100 105 110

Arg Val Leu Ser Glu Leu Val Ser Lys Met Arg Glu Met Lys Met Asp

115 120 125

Arg Thr Glu Leu Gly Cys Leu Arg Ser Ile Ile Leu Phe Asn Pro Glu

130 135 140

Val Arg Gly Leu Lys Ser Ile Gln Glu Val Thr Leu Leu Arg Glu Lys

145 150 155 160

Ile Tyr Gly Ala Leu Glu Gly Tyr Cys Arg Val Ala Trp Pro Asp Asp

165 170 175

Ala Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Ile Arg Ser

180 185 190

Ile Gly Leu Lys Cys Leu Glu Tyr Leu Phe Phe Phe Lys Met Ile Gly

195 200 205

Asp Val Pro Ile Asp Asp Phe Leu Val Glu Met Leu Glu Ser Arg Ser

210 215 220

Asp Pro

225

<210> 62

<211> 714

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 62

gccaacgagg acatgcctgt agagaagatt ctggaagccg agcttgctgt cgagcccaag 60

actgagacat acgtggaggc aaacatgggg ctgaacccca gctcaccaaa tgaccctgtt 120

accaacatct gtcaagcagc agacaagcag ctcttcactc ttgtggagtg ggccaagagg 180

atcccacact tttctgagct gcccctagac gaccaggtca tcctgctacg ggcaggctgg 240

aacgagctgc tgatcgcctc cttctcccac cgctccatag ctgtgaaaga tgggattctc 300

ctggccaccg gcctgcacgt acaccggaac agcgctcaca gtgctggggt gggcgccatc 360

tttgacaggg tgctaacaga gctggtgtct aagatgcgtg acatgcagat ggacaagacg 420

gagctgggct gcctgcgagc cattgtcctg ttcaaccctg actctaaggg gctctcaaac 480

cctgctgagg tggaggcgtt gagggagaag gtgtatgcgt cactagaagc gtactgcaaa 540

cacaagtacc ctgagcagcc gggcaggttt gccaagctgc tgctccgcct gcctgcactg 600

cgttccatcg ggctcaagtg cctggagcac ctgttcttct tcaagctcat cggggacacg 660

cccatcgaca ccttcctcat ggagatgctg gaggcaccac atcaagccac ctag 714

<210> 63

<211> 720

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 63

gcccctgagg agatgcctgt ggacaggatc ctggaggcag agcttgctgt ggagcagaag 60

agtgaccaag gcgttgaggg tcctggggcc accgggggtg gtggcagcag cccaaatgac 120

ccagtgacta acatctgcca ggcagctgac aaacagctgt tcacactcgt tgagtgggca 180

aagaggatcc cgcacttctc ctccctacct ctggacgatc aggtcatact gctgcgggca 240

ggctggaacg agctcctcat tgcgtccttc tcccatcggt ccattgatgt ccgagatggc 300

atcctcctgg ccacgggtct tcatgtgcac agaaactcag cccattccgc aggcgtggga 360

gccatctttg atcgggtgct gacagagcta gtgtccaaaa tgcgtgacat gaggatggac 420

aagacagagc ttggctgcct gcgggcaatc atcatgttta atccagacgc caagggcctc 480

tccaaccctg gagaggtgga gatccttcgg gagaaggtgt acgcctcact ggagacctat 540

tgcaagcaga agtaccctga gcagcagggc cggtttgcca agctgctgtt acgtcttcct 600

gccctccgct ccatcggcct caagtgtctg gagcacctgt tcttcttcaa gctcattggc 660

gacaccccca ttgacacctt cctcatggag atgcttgagg ctccccacca gctagcctga 720

<210> 64

<211> 705

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 64

agccacgaag acatgcccgt ggagaggatt ctagaagccg aacttgctgt ggaaccaaag 60

acagaatcct acggtgacat gaacgtggag aactcaacaa atgaccctgt taccaacata 120

tgccatgctg cagataagca acttttcacc ctcgttgagt gggccaaacg catcccccac 180

ttctcagatc tcaccttgga ggaccaggtc attctactcc gggcagggtg gaatgaactg 240

ctcattgcct ccttctccca ccgctcggtt tccgtccagg atggcatcct gctggccacg 300

ggcctccacg tgcacaggag cagcgctcac agccggggag tcggctccat cttcgacaga 360

gtccttacag agttggtgtc caagatgaaa gacatgcaga tggataagtc agagctgggg 420

tgcctacggg ccatcgtgct gtttaaccca gatgccaagg gtttatccaa cccctctgag 480

gtggagactc ttcgagagaa ggtttatgcc accctggagg cctataccaa gcagaagtat 540

ccggaacagc caggcaggtt tgccaagctt ctgctgcgtc tccctgctct gcgctccatc 600

ggcttgaaat gcctggaaca cctcttcttc ttcaagctca ttggagacac tcccatcgac 660

agcttcctca tggagatgtt ggagacccca ctgcagatca cctga 705

<210> 65

<211> 850

<212> DNA

<213> 智人（Homo sapiens）

<400> 65

gccaacgagg acatgccggt ggagaggatc ctggaggctg agctggccgt ggagcccaag 60

accgagacct acgtggaggc aaacatgggg ctgaacccca gctcgccgaa cgaccctgtc 120

accaacattt gccaagcagc cgacaaacag cttttcaccc tggtggagtg ggccaagcgg 180

atcccacact tctcagagct gcccctggac gaccaggtca tcctgctgcg ggcaggctgg 240

aatgagctgc tcatcgcctc cttctcccac cgctccatcg ccgtgaagga cgggatcctc 300

ctggccaccg ggctgcacgt ccaccggaac agcgcccaca gcgcaggggt gggcgccatc 360

tttgacaggg tgctgacgga gcttgtgtcc aagatgcggg acatgcagat ggacaagacg 420

gagctgggct gcctgcgcgc catcgtcctc tttaaccctg actccaaggg gctctcgaac 480

ccggccgagg tggaggcgct gagggagaag gtctatgcgt ccttggaggc ctactgcaag 540

cacaagtacc cagagcagcc gggaaggttc gctaagctct tgctccgcct gccggctctg 600

cgctccatcg ggctcaaatg cctggaacat ctcttcttct tcaagctcat cggggacaca 660

cccattgaca ccttccttat ggagatgctg gaggcgccgc accaaatgac ttaggcctgc 720

gggcccatcc tttgtgccca cccgttctgg ccaccctgcc tggacgccag ctgttcttct 780

cagcctgagc cctgtccctg cccttctctg cctggcctgt ttggactttg gggcacagcc 840

tgtcactgct 850

<210> 66

<211> 720

<212> DNA

<213> 智人（Homo sapiens）

<400> 66

gcccccgagg agatgcctgt ggacaggatc ctggaggcag agcttgctgt ggaacagaag 60

agtgaccagg gcgttgaggg tcctggggga accgggggta gcggcagcag cccaaatgac 120

cctgtgacta acatctgtca ggcagctgac aaacagctat tcacgcttgt tgagtgggcg 180

aagaggatcc cacacttttc ctccttgcct ctggatgatc aggtcatatt gctgcgggca 240

ggctggaatg aactcctcat tgcctccttt tcacaccgat ccattgatgt tcgagatggc 300

atcctccttg ccacaggtct tcacgtgcac cgcaactcag cccattcagc aggagtagga 360

gccatctttg atcgggtgct gacagagcta gtgtccaaaa tgcgtgacat gaggatggac 420

aagacagagc ttggctgcct gagggcaatc attctgttta atccagatgc caagggcctc 480

tccaacccta gtgaggtgga ggtcctgcgg gagaaagtgt atgcatcact ggagacctac 540

tgcaaacaga agtaccctga gcagcaggga cggtttgcca agctgctgct acgtcttcct 600

gccctccggt ccattggcct taagtgtcta gagcatctgt ttttcttcaa gctcattggt 660

gacaccccca tcgacacctt cctcatggag atgcttgagg ctccccatca actggcctga 720

<210> 67

<211> 705

<212> DNA

<213> 智人（Homo sapiens）

<400> 67

ggtcatgaag acatgcctgt ggagaggatt ctagaagctg aacttgctgt tgaaccaaag 60

acagaatcct atggtgacat gaatatggag aactcgacaa atgaccctgt taccaacata 120

tgtcatgctg ctgacaagca gcttttcacc ctcgttgaat gggccaagcg tattccccac 180

ttctctgacc tcaccttgga ggaccaggtc attttgcttc gggcagggtg gaatgaattg 240

ctgattgcct ctttctccca ccgctcagtt tccgtgcagg atggcatcct tctggccacg 300

ggtttacatg tccaccggag cagtgcccac agtgctgggg tcggctccat ctttgacaga 360

gttctaactg agctggtttc caaaatgaaa gacatgcaga tggacaagtc ggaactggga 420

tgcctgcgag ccattgtact ctttaaccca gatgccaagg gcctgtccaa cccctctgag 480

gtggagactc tgcgagagaa ggtttatgcc acccttgagg cctacaccaa gcagaagtat 540

ccggaacagc caggcaggtt tgccaagctg ctgctgcgcc tcccagctct gcgttccatt 600

ggcttgaaat gcctggagca cctcttcttc ttcaagctca tcggggacac ccccattgac 660

accttcctca tggagatgtt ggagaccccg ctgcagatca cctga 705

<210> 68

<211> 237

<212> PRT

<213> 小家鼠（Mus musculus）

<400> 68

Ala Asn Glu Asp Met Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala

1 5 10 15

Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn

20 25 30

Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp

35 40 45

Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe

50 55 60

Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp

65 70 75 80

Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys

85 90 95

Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala

100 105 110

His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu

115 120 125

Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys

130 135 140

Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn

145 150 155 160

Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu

165 170 175

Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys

180 185 190

Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu

195 200 205

Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr

210 215 220

Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Ala Thr

225 230 235

<210> 69

<211> 239

<212> PRT

<213> 小家鼠（Mus musculus）

<400> 69

Ala Pro Glu Glu Met Pro Val Asp Arg Ile Leu Glu Ala Glu Leu Ala

1 5 10 15

Val Glu Gln Lys Ser Asp Gln Gly Val Glu Gly Pro Gly Ala Thr Gly

20 25 30

Gly Gly Gly Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala

35 40 45

Ala Asp Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro

50 55 60

His Phe Ser Ser Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala

65 70 75 80

Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Asp

85 90 95

Val Arg Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn

100 105 110

Ser Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr

115 120 125

Glu Leu Val Ser Lys Met Arg Asp Met Arg Met Asp Lys Thr Glu Leu

130 135 140

Gly Cys Leu Arg Ala Ile Ile Met Phe Asn Pro Asp Ala Lys Gly Leu

145 150 155 160

Ser Asn Pro Gly Glu Val Glu Ile Leu Arg Glu Lys Val Tyr Ala Ser

165 170 175

Leu Glu Thr Tyr Cys Lys Gln Lys Tyr Pro Glu Gln Gln Gly Arg Phe

180 185 190

Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys

195 200 205

Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile

210 215 220

Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Leu Ala

225 230 235

<210> 70

<211> 234

<212> PRT

<213> 小家鼠（Mus musculus）

<400> 70

Ser His Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala

1 5 10 15

Val Glu Pro Lys Thr Glu Ser Tyr Gly Asp Met Asn Val Glu Asn Ser

20 25 30

Thr Asn Asp Pro Val Thr Asn Ile Cys His Ala Ala Asp Lys Gln Leu

35 40 45

Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe Ser Asp Leu

50 55 60

Thr Leu Glu Asp Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu

65 70 75 80

Leu Ile Ala Ser Phe Ser His Arg Ser Val Ser Val Gln Asp Gly Ile

85 90 95

Leu Leu Ala Thr Gly Leu His Val His Arg Ser Ser Ala His Ser Arg

100 105 110

Gly Val Gly Ser Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys

115 120 125

Met Lys Asp Met Gln Met Asp Lys Ser Glu Leu Gly Cys Leu Arg Ala

130 135 140

Ile Val Leu Phe Asn Pro Asp Ala Lys Gly Leu Ser Asn Pro Ser Glu

145 150 155 160

Val Glu Thr Leu Arg Glu Lys Val Tyr Ala Thr Leu Glu Ala Tyr Thr

165 170 175

Lys Gln Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu

180 185 190

Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu

195 200 205

Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Ser Phe Leu Met

210 215 220

Glu Met Leu Glu Thr Pro Leu Gln Ile Thr

225 230

<210> 71

<211> 237

<212> PRT

<213> 智人（Homo sapiens）

<400> 71

Ala Asn Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala

1 5 10 15

Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn

20 25 30

Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp

35 40 45

Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe

50 55 60

Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp

65 70 75 80

Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys

85 90 95

Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala

100 105 110

His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu

115 120 125

Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys

130 135 140

Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn

145 150 155 160

Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu

165 170 175

Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys

180 185 190

Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu

195 200 205

Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr

210 215 220

Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Met Thr

225 230 235

<210> 72

<211> 239

<212> PRT

<213> 智人（Homo sapiens）

<400> 72

Ala Pro Glu Glu Met Pro Val Asp Arg Ile Leu Glu Ala Glu Leu Ala

1 5 10 15

Val Glu Gln Lys Ser Asp Gln Gly Val Glu Gly Pro Gly Gly Thr Gly

20 25 30

Gly Ser Gly Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala

35 40 45

Ala Asp Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro

50 55 60

His Phe Ser Ser Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala

65 70 75 80

Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Asp

85 90 95

Val Arg Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn

100 105 110

Ser Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr

115 120 125

Glu Leu Val Ser Lys Met Arg Asp Met Arg Met Asp Lys Thr Glu Leu

130 135 140

Gly Cys Leu Arg Ala Ile Ile Leu Phe Asn Pro Asp Ala Lys Gly Leu

145 150 155 160

Ser Asn Pro Ser Glu Val Glu Val Leu Arg Glu Lys Val Tyr Ala Ser

165 170 175

Leu Glu Thr Tyr Cys Lys Gln Lys Tyr Pro Glu Gln Gln Gly Arg Phe

180 185 190

Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys

195 200 205

Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile

210 215 220

Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Leu Ala

225 230 235

<210> 73

<211> 234

<212> PRT

<213> 智人（Homo sapiens）

<400> 73

Gly His Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala

1 5 10 15

Val Glu Pro Lys Thr Glu Ser Tyr Gly Asp Met Asn Met Glu Asn Ser

20 25 30

Thr Asn Asp Pro Val Thr Asn Ile Cys His Ala Ala Asp Lys Gln Leu

35 40 45

Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe Ser Asp Leu

50 55 60

Thr Leu Glu Asp Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu

65 70 75 80

Leu Ile Ala Ser Phe Ser His Arg Ser Val Ser Val Gln Asp Gly Ile

85 90 95

Leu Leu Ala Thr Gly Leu His Val His Arg Ser Ser Ala His Ser Ala

100 105 110

Gly Val Gly Ser Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys

115 120 125

Met Lys Asp Met Gln Met Asp Lys Ser Glu Leu Gly Cys Leu Arg Ala

130 135 140

Ile Val Leu Phe Asn Pro Asp Ala Lys Gly Leu Ser Asn Pro Ser Glu

145 150 155 160

Val Glu Thr Leu Arg Glu Lys Val Tyr Ala Thr Leu Glu Ala Tyr Thr

165 170 175

Lys Gln Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu

180 185 190

Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu

195 200 205

Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met

210 215 220

Glu Met Leu Glu Thr Pro Leu Gln Ile Thr

225 230

<210> 74

<211> 516

<212> DNA

<213> 飞蝗（Locusta migratoria）

<400> 74

atccctacct ctggaggacc aggttctcct cctcagagca ggttggaatg aactgctaat 60

tgcagcattt tcacatcgat ctgtagatgt taaagatggc atagtacttg ccactggtct 120

cacagtgcat cgaaattctg cccatcaagc tggagtcggc acaatatttg acagagtttt 180

gacagaactg gtagcaaaga tgagagaaat gaaaatggat aaaactgaac ttggctgctt 240

gcgatctgtt attcttttca atccagaggt gaggggtttg aaatccgccc aggaagttga 300

acttctacgt gaaaaagtat atgccgcttt ggaagaatat actagaacaa cacatcccga 360

tgaaccagga agatttgcaa aacttttgct tcgtctgcct tctttacgtt ccataggcct 420

taagtgtttg gagcatttgt tttctttcgc cttattggag atgttccaat tgatacgttc 480

ctgatggaga tgcttgaatc accttctgat tcataa 516

<210> 75

<211> 528

<212> DNA

<213> 美洲钝眼蜱（Amblyomma americanum）

<400> 75

attccacatt ttgaagagct tccccttgag gaccgcatgg tgttgctcaa ggctggctgg 60

aacgagctgc tcattgctgc tttctcccac cgttctgttg acgtgcgtga tggcattgtg 120

ctcgctacag gtcttgtggt gcagcggcat agtgctcatg gggctggcgt tggggccata 180

tttgataggg ttctcactga actggtagca aagatgcgtg agatgaagat ggaccgcact 240

gagcttggat gcctgcttgc tgtggtactt tttaatcctg aggccaaggg gctgcggacc 300

tgcccaagtg gaggccctga gggagaaagt gtatctgcct tggaagagca ctgccggcag 360

cagtacccag accagcctgg gcgctttgcc aagctgctgc tgcggttgcc agctctgcgc 420

agtattggcc tcaagtgcct cgaacatctc tttttcttca agctcatcgg ggacacgccc 480

atcgacaact ttcttctttc catgctggag gccccctctg acccctaa 528

<210> 76

<211> 531

<212> DNA

<213> 美洲钝眼蜱（Amblyomma americanum）

<400> 76

attccgcact tcgaagagct tcccatcgag gatcgcaccg cgctgctcaa agccggctgg 60

aacgaactgc ttattgccgc cttttcgcac cgttctgtgg cggtgcgcga cggcatcgtt 120

ctggccaccg ggctggtggt gcagcggcac agcgcacacg gcgcaggcgt tggcgacatc 180

ttcgaccgcg tactagccga gctggtggcc aagatgcgcg acatgaagat ggacaaaacg 240

gagctcggct gcctgcgcgc cgtggtgctc ttcaatccag acgccaaggg tctccgaaac 300

gccaccagag tagaggcgct ccgcgagaag gtgtatgcgg cgctggagga gcactgccgt 360

cggcaccacc cggaccaacc gggtcgcttc ggcaagctgc tgctgcggct gcctgccttg 420

cgcagcatcg ggctcaaatg cctcgagcat ctgttcttct tcaagctcat cggagacact 480

cccatagaca gcttcctgct caacatgctg gaggcaccgg cagaccccta g 531

<210> 77

<211> 552

<212> DNA

<213> 招潮蟹（Celuca pugilator）

<400> 77

atcccacact tcacagacct tcccatagag gaccaagtgg tattactcaa agccgggtgg 60

aacgagttgc ttattgcctc attctcacac cgtagcatgg gcgtggagga tggcatcgtg 120

ctggccacag ggctcgtgat ccacagaagt agtgctcacc aggctggagt gggtgccata 180

tttgatcgtg tcctctctga gctggtggcc aagatgaagg agatgaagat tgacaagaca 240

gagctgggct gccttcgctc catcgtcctg ttcaacccag atgccaaagg actaaactgc 300

gtcaatgatg tggagatctt gcgtgagaag gtgtatgctg ccctggagga gtacacacga 360

accacttacc ctgatgaacc tggacgcttt gccaagttgc ttctgcgact tcctgcactc 420

aggtctatag gcctgaagtg tcttgagtac ctcttcctgt ttaagctgat tggagacact 480

cccctggaca gctacttgat gaagatgctc gtagacaacc caaatacaag cgtcactccc 540

cccaccagct ag 552

<210> 78

<211> 531

<212> DNA

<213> 黄粉虫（Tenebrio molitor）

<400> 78

atacctcact ttacctcgtt gccgatgtcg gaccaggtgc ttttattgag ggcaggatgg 60

aatgaattgc tcatcgccgc attctcgcac agatctatac aggcgcagga tgccatcgtt 120

ctagccacgg ggttgacagt taacaaaacg tcggcgcacg ccgtgggcgt gggcaacatc 180

tacgaccgcg tcctctccga gctggtgaac aagatgaaag agatgaagat ggacaagacg 240

gagctgggct gcttgagagc catcatcctc tacaacccca cgtgtcgcgg catcaagtcc 300

gtgcaggaag tggagatgct gcgtgagaaa atttacggcg tgctggaaga gtacaccagg 360

accacccacc cgaacgagcc cggcaggttc gccaaactgc ttctgcgcct cccggccctc 420

aggtccatcg ggttgaaatg ttccgaacac ctctttttct tcaagctgat cggtgatgtt 480

ccaatagaca cgttcctgat ggagatgctg gagtctccgg cggacgctta g 531

<210> 79

<211> 531

<212> DNA

<213> 蜜蜂（Apis mellifera）

<400> 79

atcccgcatt ttacctcgtt gccactggag gatcaggtac ttctgctcag ggccggttgg 60

aacgagttgc tgatagcctc cttttcccac cgttccatcg acgtgaagga cggtatcgtg 120

ctggcgacgg ggatcaccgt gcatcggaac tcggcgcagc aggccggcgt gggcacgata 180

ttcgaccgtg tcctctcgga gcttgtctcg aaaatgcgtg aaatgaagat ggacaggaca 240

gagcttggct gtctcagatc tataatactc ttcaatcccg aggttcgagg actgaaatcc 300

atccaggaag tgaccctgct ccgtgagaag atctacggcg ccctggaggg ttattgccgc 360

gtagcttggc ccgacgacgc tggaagattc gcgaaattac ttctacgcct gcccgccatc 420

cgctcgatcg gattaaagtg cctcgagtac ctgttcttct tcaaaatgat cggtgacgta 480

ccgatcgacg attttctcgt ggagatgtta gaatcgcgat cagatcctta g 531

<210> 80

<211> 176

<212> PRT

<213> 飞蝗（Locusta migratoria）

<400> 80

Ile Pro His Phe Thr Ser Leu Pro Leu Glu Asp Gln Val Leu Leu Leu

1 5 10 15

Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His Arg Ser

20 25 30

Val Asp Val Lys Asp Gly Ile Val Leu Ala Thr Gly Leu Thr Val His

35 40 45

Arg Asn Ser Ala His Gln Ala Gly Val Gly Thr Ile Phe Asp Arg Val

50 55 60

Leu Thr Glu Leu Val Ala Lys Met Arg Glu Met Lys Met Asp Lys Thr

65 70 75 80

Glu Leu Gly Cys Leu Arg Ser Val Ile Leu Phe Asn Pro Glu Val Arg

85 90 95

Gly Leu Lys Ser Ala Gln Glu Val Glu Leu Leu Arg Glu Lys Val Tyr

100 105 110

Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr His Pro Asp Glu Pro Gly

115 120 125

Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ser Leu Arg Ser Ile Gly

130 135 140

Leu Lys Cys Leu Glu His Leu Phe Phe Phe Arg Leu Ile Gly Asp Val

145 150 155 160

Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser Pro Ser Asp Ser

165 170 175

<210> 81

<211> 175

<212> PRT

<213> 美洲钝眼蜱（Amblyomma americanum）

<400> 81

Ile Pro His Phe Glu Glu Leu Pro Leu Glu Asp Arg Met Val Leu Leu

1 5 10 15

Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His Arg Ser

20 25 30

Val Asp Val Arg Asp Gly Ile Val Leu Ala Thr Gly Leu Val Val Gln

35 40 45

Arg His Ser Ala His Gly Ala Gly Val Gly Ala Ile Phe Asp Arg Val

50 55 60

Leu Thr Glu Leu Val Ala Lys Met Arg Glu Met Lys Met Asp Arg Thr

65 70 75 80

Glu Leu Gly Cys Leu Leu Ala Val Val Leu Phe Asn Pro Glu Ala Lys

85 90 95

Gly Leu Arg Thr Cys Pro Ser Gly Gly Pro Glu Gly Glu Ser Val Ser

100 105 110

Ala Leu Glu Glu His Cys Arg Gln Gln Tyr Pro Asp Gln Pro Gly Arg

115 120 125

Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu

130 135 140

Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro

145 150 155 160

Ile Asp Asn Phe Leu Leu Ser Met Leu Glu Ala Pro Ser Asp Pro

165 170 175

<210> 82

<211> 176

<212> PRT

<213> 美洲钝眼蜱（Amblyomma americanum）

<400> 82

Ile Pro His Phe Glu Glu Leu Pro Ile Glu Asp Arg Thr Ala Leu Leu

1 5 10 15

Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His Arg Ser

20 25 30

Val Ala Val Arg Asp Gly Ile Val Leu Ala Thr Gly Leu Val Val Gln

35 40 45

Arg His Ser Ala His Gly Ala Gly Val Gly Asp Ile Phe Asp Arg Val

50 55 60

Leu Ala Glu Leu Val Ala Lys Met Arg Asp Met Lys Met Asp Lys Thr

65 70 75 80

Glu Leu Gly Cys Leu Arg Ala Val Val Leu Phe Asn Pro Asp Ala Lys

85 90 95

Gly Leu Arg Asn Ala Thr Arg Val Glu Ala Leu Arg Glu Lys Val Tyr

100 105 110

Ala Ala Leu Glu Glu His Cys Arg Arg His His Pro Asp Gln Pro Gly

115 120 125

Arg Phe Gly Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly

130 135 140

Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr

145 150 155 160

Pro Ile Asp Ser Phe Leu Leu Asn Met Leu Glu Ala Pro Ala Asp Pro

165 170 175

<210> 83

<211> 183

<212> PRT

<213> 招潮蟹（Celuca pugilator）

<400> 83

Ile Pro His Phe Thr Asp Leu Pro Ile Glu Asp Gln Val Val Leu Leu

1 5 10 15

Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser

20 25 30

Met Gly Val Glu Asp Gly Ile Val Leu Ala Thr Gly Leu Val Ile His

35 40 45

Arg Ser Ser Ala His Gln Ala Gly Val Gly Ala Ile Phe Asp Arg Val

50 55 60

Leu Ser Glu Leu Val Ala Lys Met Lys Glu Met Lys Ile Asp Lys Thr

65 70 75 80

Glu Leu Gly Cys Leu Arg Ser Ile Val Leu Phe Asn Pro Asp Ala Lys

85 90 95

Gly Leu Asn Cys Val Asn Asp Val Glu Ile Leu Arg Glu Lys Val Tyr

100 105 110

Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr Tyr Pro Asp Glu Pro Gly

115 120 125

Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly

130 135 140

Leu Lys Cys Leu Glu Tyr Leu Phe Leu Phe Lys Leu Ile Gly Asp Thr

145 150 155 160

Pro Leu Asp Ser Tyr Leu Met Lys Met Leu Val Asp Asn Pro Asn Thr

165 170 175

Ser Val Thr Pro Pro Thr Ser

180

<210> 84

<211> 176

<212> PRT

<213> 黄粉虫（Tenebrio molitor）

<400> 84

Ile Pro His Phe Thr Ser Leu Pro Met Ser Asp Gln Val Leu Leu Leu

1 5 10 15

Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His Arg Ser

20 25 30

Ile Gln Ala Gln Asp Ala Ile Val Leu Ala Thr Gly Leu Thr Val Asn

35 40 45

Lys Thr Ser Ala His Ala Val Gly Val Gly Asn Ile Tyr Asp Arg Val

50 55 60

Leu Ser Glu Leu Val Asn Lys Met Lys Glu Met Lys Met Asp Lys Thr

65 70 75 80

Glu Leu Gly Cys Leu Arg Ala Ile Ile Leu Tyr Asn Pro Thr Cys Arg

85 90 95

Gly Ile Lys Ser Val Gln Glu Val Glu Met Leu Arg Glu Lys Ile Tyr

100 105 110

Gly Val Leu Glu Glu Tyr Thr Arg Thr Thr His Pro Asn Glu Pro Gly

115 120 125

Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly

130 135 140

Leu Lys Cys Ser Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Val

145 150 155 160

Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser Pro Ala Asp Ala

165 170 175

<210> 85

<211> 176

<212> PRT

<213> 蜜蜂（Apis mellifera）

<400> 85

Ile Pro His Phe Thr Ser Leu Pro Leu Glu Asp Gln Val Leu Leu Leu

1 5 10 15

Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser

20 25 30

Ile Asp Val Lys Asp Gly Ile Val Leu Ala Thr Gly Ile Thr Val His

35 40 45

Arg Asn Ser Ala Gln Gln Ala Gly Val Gly Thr Ile Phe Asp Arg Val

50 55 60

Leu Ser Glu Leu Val Ser Lys Met Arg Glu Met Lys Met Asp Arg Thr

65 70 75 80

Glu Leu Gly Cys Leu Arg Ser Ile Ile Leu Phe Asn Pro Glu Val Arg

85 90 95

Gly Leu Lys Ser Ile Gln Glu Val Thr Leu Leu Arg Glu Lys Ile Tyr

100 105 110

Gly Ala Leu Glu Gly Tyr Cys Arg Val Ala Trp Pro Asp Asp Ala Gly

115 120 125

Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Ile Arg Ser Ile Gly

130 135 140

Leu Lys Cys Leu Glu Tyr Leu Phe Phe Phe Lys Met Ile Gly Asp Val

145 150 155 160

Pro Ile Asp Asp Phe Leu Val Glu Met Leu Glu Ser Arg Ser Asp Pro

165 170 175

<210> 86

<211> 259

<212> PRT

<213> 云杉卷叶蛾（Choristoneura fumiferana）

<400> 86

Leu Thr Ala Asn Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln

1 5 10 15

Asp Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln

20 25 30

Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe

35 40 45

Arg Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu

50 55 60

Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln

65 70 75 80

Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val

85 90 95

Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn

100 105 110

Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val

115 120 125

Ile Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu

130 135 140

Asp Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp

145 150 155 160

Arg Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr

165 170 175

Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser

180 185 190

Ala Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu

195 200 205

Leu Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys

210 215 220

Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val

225 230 235 240

Ala Asp Met Ser His Thr Gln Pro Pro Pro Ile Leu Glu Ser Pro Thr

245 250 255

Asn Leu Gly

<210> 87

<211> 674

<212> PRT

<213> 人工序列

<220>

<223> 人工序列说明：合成多肽

<400> 87

Met Asp Tyr Lys Asp Asp Asp Asp Lys Glu Met Pro Val Asp Arg Ile

1 5 10 15

Leu Glu Ala Glu Leu Ala Val Glu Gln Lys Ser Asp Gln Gly Val Glu

20 25 30

Gly Pro Gly Gly Thr Gly Gly Ser Gly Ser Ser Pro Asn Asp Pro Val

35 40 45

Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr Leu Val Glu

50 55 60

Trp Ala Lys Arg Ile Pro His Phe Ser Ser Leu Pro Leu Asp Asp Gln

65 70 75 80

Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe

85 90 95

Ser His Arg Ser Ile Asp Val Arg Asp Gly Ile Leu Leu Ala Thr Gly

100 105 110

Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala Ile

115 120 125

Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met Arg

130 135 140

Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Ile Leu Phe Asn

145 150 155 160

Pro Glu Val Arg Gly Leu Lys Ser Ala Gln Glu Val Glu Leu Leu Arg

165 170 175

Glu Lys Val Tyr Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr His Pro

180 185 190

Asp Glu Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ser Leu

195 200 205

Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Arg Leu

210 215 220

Ile Gly Asp Val Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser

225 230 235 240

Pro Ser Asp Ser Gln Ile Ser Tyr Ala Ser Arg Gly Gly Gly Ser Ser

245 250 255

Gly Gly Gly Glu Asp Ala Lys Asn Ile Lys Lys Gly Pro Ala Pro Phe

260 265 270

Tyr Pro Leu Glu Asp Gly Thr Ala Gly Glu Gln Leu His Lys Ala Met

275 280 285

Lys Arg Tyr Ala Leu Val Pro Gly Thr Ile Ala Phe Thr Asp Ala His

290 295 300

Ile Glu Val Asn Ile Thr Tyr Ala Glu Tyr Phe Glu Met Ser Val Arg

305 310 315 320

Leu Ala Glu Ala Met Lys Arg Tyr Gly Leu Asn Thr Asn His Arg Ile

325 330 335

Val Val Cys Ser Glu Asn Ser Leu Gln Phe Phe Met Pro Val Leu Gly

340 345 350

Ala Leu Phe Ile Gly Val Ala Val Ala Pro Ala Asn Asp Ile Tyr Asn

355 360 365

Glu Arg Glu Leu Leu Asn Ser Met Asn Ile Ser Gln Pro Thr Val Val

370 375 380

Phe Val Ser Lys Lys Gly Leu Gln Lys Ile Leu Asn Val Gln Lys Lys

385 390 395 400

Leu Pro Ile Ile Gln Lys Ile Ile Ile Met Asp Ser Lys Thr Asp Tyr

405 410 415

Gln Gly Phe Gln Ser Met Tyr Thr Phe Val Thr Ser His Leu Pro Pro

420 425 430

Gly Phe Asn Glu Tyr Asp Phe Val Pro Glu Ser Phe Asp Arg Asp Lys

435 440 445

Thr Ile Ala Leu Ile Met Asn Ser Ser Gly Ser Thr Gly Leu Pro Lys

450 455 460

Gly Val Ala Leu Pro His Arg Thr Ala Cys Val Arg Phe Ser His Ala

465 470 475 480

Arg Asp Pro Ile Phe Gly Asn Gln Ile Ile Pro Asp Thr Ala Ile Leu

485 490 495

Ser Val Val Pro Phe His His Gly Phe Gly Met Phe Thr Thr Leu Gly

500 505 510

Tyr Leu Ile Cys Gly Phe Arg Val Val Leu Met Tyr Arg Phe Glu Glu

515 520 525

Glu Leu Phe Leu Arg Ser Leu Gln Asp Tyr Lys Ile Gln Ser Ala Leu

530 535 540

Leu Val Pro Thr Leu Phe Ser Phe Phe Ala Lys Ser Thr Leu Ile Asp

545 550 555 560

Lys Tyr Asp Leu Ser Asn Leu His Glu Ile Ala Ser Gly Gly Ala Pro

565 570 575

Leu Ser Lys Glu Val Gly Glu Ala Val Ala Lys Arg Phe His Leu Pro

580 585 590

Gly Ile Arg Gln Gly Tyr Gly Leu Thr Glu Thr Thr Ser Ala Ile Leu

595 600 605

Ile Thr Pro Glu Gly Asp Asp Lys Pro Gly Ala Val Gly Lys Val Val

610 615 620

Pro Phe Phe Glu Ala Lys Val Val Asp Leu Asp Thr Gly Lys Thr Leu

625 630 635 640

Gly Val Asn Gln Arg Gly Glu Leu Cys Val Arg Gly Pro Met Ile Met

645 650 655

Ser Gly Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp Lys

660 665 670

Asp Gly

<210> 88

<211> 463

<212> PRT

<213> 人工序列

<220>

<223> 人工序列说明：合成多肽

<400> 88

Gln Val Ala Pro Ala Glu Leu Glu Ser Ile Leu Leu Gln His Pro Asn

1 5 10 15

Ile Phe Asp Ala Gly Val Ala Gly Leu Pro Asp Asp Asp Ala Gly Glu

20 25 30

Leu Pro Ala Ala Val Val Val Leu Glu His Gly Lys Thr Met Thr Glu

35 40 45

Lys Glu Ile Val Asp Tyr Val Ala Ser Gln Val Thr Thr Ala Lys Lys

50 55 60

Leu Arg Gly Gly Val Val Phe Val Asp Glu Val Pro Lys Gly Leu Thr

65 70 75 80

Gly Lys Leu Asp Ala Arg Lys Ile Arg Glu Ile Leu Ile Lys Ala Lys

85 90 95

Lys Gly Gly Lys Ser Lys Leu Gly Gly Gly Ser Ser Gly Gly Gly Gln

100 105 110

Ile Ser Tyr Ala Ser Arg Gly Arg Pro Glu Cys Val Val Pro Glu Thr

115 120 125

Gln Cys Ala Met Lys Arg Lys Glu Lys Lys Ala Gln Lys Glu Lys Asp

130 135 140

Lys Leu Pro Val Ser Thr Thr Thr Val Asp Asp His Met Pro Pro Ile

145 150 155 160

Met Gln Cys Glu Pro Pro Pro Pro Glu Ala Ala Arg Ile His Glu Val

165 170 175

Val Pro Arg Phe Leu Ser Asp Lys Leu Leu Val Thr Asn Arg Gln Lys

180 185 190

Asn Ile Pro Gln Leu Thr Ala Asn Gln Gln Phe Leu Ile Ala Arg Leu

195 200 205

Ile Trp Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys

210 215 220

Arg Ile Thr Gln Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser

225 230 235 240

Asp Thr Pro Phe Arg Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln

245 250 255

Leu Ile Val Glu Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser

260 265 270

Gln Pro Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met

275 280 285

Met Leu Arg Val Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser Ile Leu

290 295 300

Phe Ala Asn Asn Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly

305 310 315 320

Met Ala Glu Val Ile Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr

325 330 335

Ser Met Ala Leu Asp Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val

340 345 350

Ile Phe Ser Asp Arg Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu

355 360 365

Ile Gln Arg Tyr Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln

370 375 380

Leu Ser Gly Ser Ala Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser

385 390 395 400

Ile Leu Ser Glu Leu Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys

405 410 415

Ile Ser Leu Lys Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu

420 425 430

Ile Trp Asp Val Ala Asp Met Ser His Thr Gln Pro Pro Pro Ile Leu

435 440 445

Glu Ser Pro Thr Asn Leu Tyr Pro Tyr Asp Val Pro Asp Tyr Ala

450 455 460

<210> 89

<211> 675

<212> PRT

<213> 人工序列

<220>

<223> 人工序列说明：合成多肽

<400> 89

Trp Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg

1 5 10 15

Ile Thr Gln Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp

20 25 30

Thr Pro Phe Arg Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu

35 40 45

Ile Val Glu Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln

50 55 60

Pro Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met

65 70 75 80

Leu Arg Val Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser Ile Leu Phe

85 90 95

Ala Asn Asn Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met

100 105 110

Ala Glu Val Ile Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr Ser

115 120 125

Met Ala Leu Asp Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val Ile

130 135 140

Phe Ser Asp Arg Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu Ile

145 150 155 160

Gln Arg Tyr Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu

165 170 175

Ser Gly Ser Ala Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile

180 185 190

Leu Ser Glu Leu Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys Ile

195 200 205

Ser Leu Lys Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile

210 215 220

Trp Asp Val Ala Asp Met Ser His Thr Gln Pro Pro Pro Ile Leu Glu

225 230 235 240

Ser Pro Thr Asn Leu Gln Ile Ser Tyr Ala Ser Arg Gly Gly Gly Ser

245 250 255

Ser Gly Gly Gly Glu Asp Ala Lys Asn Ile Lys Lys Gly Pro Ala Pro

260 265 270

Phe Tyr Pro Leu Glu Asp Gly Thr Ala Gly Glu Gln Leu His Lys Ala

275 280 285

Met Lys Arg Tyr Ala Leu Val Pro Gly Thr Ile Ala Phe Thr Asp Ala

290 295 300

His Ile Glu Val Asn Ile Thr Tyr Ala Glu Tyr Phe Glu Met Ser Val

305 310 315 320

Arg Leu Ala Glu Ala Met Lys Arg Tyr Gly Leu Asn Thr Asn His Arg

325 330 335

Ile Val Val Cys Ser Glu Asn Ser Leu Gln Phe Phe Met Pro Val Leu

340 345 350

Gly Ala Leu Phe Ile Gly Val Ala Val Ala Pro Ala Asn Asp Ile Tyr

355 360 365

Asn Glu Arg Glu Leu Leu Asn Ser Met Asn Ile Ser Gln Pro Thr Val

370 375 380

Val Phe Val Ser Lys Lys Gly Leu Gln Lys Ile Leu Asn Val Gln Lys

385 390 395 400

Lys Leu Pro Ile Ile Gln Lys Ile Ile Ile Met Asp Ser Lys Thr Asp

405 410 415

Tyr Gln Gly Phe Gln Ser Met Tyr Thr Phe Val Thr Ser His Leu Pro

420 425 430

Pro Gly Phe Asn Glu Tyr Asp Phe Val Pro Glu Ser Phe Asp Arg Asp

435 440 445

Lys Thr Ile Ala Leu Ile Met Asn Ser Ser Gly Ser Thr Gly Leu Pro

450 455 460

Lys Gly Val Ala Leu Pro His Arg Thr Ala Cys Val Arg Phe Ser His

465 470 475 480

Ala Arg Asp Pro Ile Phe Gly Asn Gln Ile Ile Pro Asp Thr Ala Ile

485 490 495

Leu Ser Val Val Pro Phe His His Gly Phe Gly Met Phe Thr Thr Leu

500 505 510

Gly Tyr Leu Ile Cys Gly Phe Arg Val Val Leu Met Tyr Arg Phe Glu

515 520 525

Glu Glu Leu Phe Leu Arg Ser Leu Gln Asp Tyr Lys Ile Gln Ser Ala

530 535 540

Leu Leu Val Pro Thr Leu Phe Ser Phe Phe Ala Lys Ser Thr Leu Ile

545 550 555 560

Asp Lys Tyr Asp Leu Ser Asn Leu His Glu Ile Ala Ser Gly Gly Ala

565 570 575

Pro Leu Ser Lys Glu Val Gly Glu Ala Val Ala Lys Arg Phe His Leu

580 585 590

Pro Gly Ile Arg Gln Gly Tyr Gly Leu Thr Glu Thr Thr Ser Ala Ile

595 600 605

Leu Ile Thr Pro Glu Gly Asp Asp Lys Pro Gly Ala Val Gly Lys Val

610 615 620

Val Pro Phe Phe Glu Ala Lys Val Val Asp Leu Asp Thr Gly Lys Thr

625 630 635 640

Leu Gly Val Asn Gln Arg Gly Glu Leu Cys Val Arg Gly Pro Met Ile

645 650 655

Met Ser Gly Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp

660 665 670

Lys Asp Gly

675

<210> 90

<211> 412

<212> PRT

<213> 人工序列

<220>

<223> 人工序列说明：合成多肽

<400> 90

Met Ser Gly Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp

1 5 10 15

Lys Asp Gly Trp Leu His Ser Gly Asp Ile Ala Tyr Trp Asp Glu Asp

20 25 30

Glu His Phe Phe Ile Val Asp Arg Leu Lys Ser Leu Ile Lys Tyr Lys

35 40 45

Gly Tyr Gln Val Ala Pro Ala Glu Leu Glu Ser Ile Leu Leu Gln His

50 55 60

Pro Asn Ile Phe Asp Ala Gly Val Ala Gly Leu Pro Asp Asp Asp Ala

65 70 75 80

Gly Glu Leu Pro Ala Ala Val Val Val Leu Glu His Gly Lys Thr Met

85 90 95

Thr Glu Lys Glu Ile Val Asp Tyr Val Ala Ser Gln Val Thr Thr Ala

100 105 110

Lys Lys Leu Arg Gly Gly Val Val Phe Val Asp Glu Val Pro Lys Gly

115 120 125

Leu Thr Gly Lys Leu Asp Ala Arg Lys Ile Arg Glu Ile Leu Ile Lys

130 135 140

Ala Lys Lys Gly Gly Lys Ser Lys Leu Gly Gly Gly Ser Ser Gly Gly

145 150 155 160

Gly Gln Ile Ser Tyr Ala Ser Arg Gly Glu Met Pro Val Asp Arg Ile

165 170 175

Leu Glu Ala Glu Leu Ala Val Glu Gln Lys Ser Asp Gln Gly Val Glu

180 185 190

Gly Pro Gly Gly Thr Gly Gly Ser Gly Ser Ser Pro Asn Asp Pro Val

195 200 205

Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr Leu Val Glu

210 215 220

Trp Ala Lys Arg Ile Pro His Phe Ser Ser Leu Pro Leu Asp Asp Gln

225 230 235 240

Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe

245 250 255

Ser His Arg Ser Ile Asp Val Arg Asp Gly Ile Leu Leu Ala Thr Gly

260 265 270

Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala Ile

275 280 285

Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met Arg

290 295 300

Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Ile Leu Phe Asn

305 310 315 320

Pro Glu Val Arg Gly Leu Lys Ser Ala Gln Glu Val Glu Leu Leu Arg

325 330 335

Glu Lys Val Tyr Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr His Pro

340 345 350

Asp Glu Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ser Leu

355 360 365

Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Arg Leu

370 375 380

Ile Gly Asp Val Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser

385 390 395 400

Pro Ser Asp Ser Asp Tyr Lys Asp Asp Asp Asp Lys

405 410

<210> 91

<211> 1189

<212> PRT

<213> 人工序列

<220>

<223> 人工序列说明：合成多肽

<400> 91

Met Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Gln Trp Tyr Glu Leu

1 5 10 15

Gln Gln Leu Asp Ser Lys Phe Leu Glu Gln Val His Gln Leu Tyr Asp

20 25 30

Asp Ser Phe Pro Met Glu Ile Arg Gln Tyr Leu Ala Gln Trp Leu Glu

35 40 45

Lys Gln Asp Trp Glu His Ala Ala Asn Asp Val Ser Phe Ala Thr Ile

50 55 60

Arg Phe His Asp Leu Leu Ser Gln Leu Asp Asp Gln Tyr Ser Arg Phe

65 70 75 80

Ser Leu Glu Asn Asn Phe Leu Leu Gln His Asn Ile Arg Lys Ser Lys

85 90 95

Arg Asn Leu Gln Asp Asn Phe Gln Glu Asp Pro Ile Gln Met Ser Met

100 105 110

Ile Ile Tyr Ser Cys Leu Lys Glu Glu Arg Lys Ile Leu Glu Asn Ala

115 120 125

Gln Arg Phe Asn Gln Ala Gln Ser Gly Asn Ile Gln Ser Thr Val Met

130 135 140

Leu Asp Lys Gln Lys Glu Leu Asp Ser Lys Val Arg Asn Val Lys Asp

145 150 155 160

Lys Val Met Cys Ile Glu His Glu Ile Lys Ser Leu Glu Asp Leu Gln

165 170 175

Asp Glu Tyr Asp Phe Lys Cys Lys Thr Leu Gln Asn Arg Glu His Glu

180 185 190

Thr Asn Gly Val Ala Lys Ser Asp Gln Lys Gln Glu Gln Leu Leu Leu

195 200 205

Lys Lys Met Tyr Leu Met Leu Asp Asn Lys Arg Lys Glu Val Val His

210 215 220

Lys Ile Ile Glu Leu Leu Asn Val Thr Glu Leu Thr Gln Asn Ala Leu

225 230 235 240

Ile Asn Asp Glu Leu Val Glu Trp Lys Arg Arg Gln Gln Ser Ala Cys

245 250 255

Ile Gly Gly Pro Pro Asn Ala Cys Leu Asp Gln Leu Gln Asn Trp Phe

260 265 270

Thr Ile Val Ala Glu Ser Leu Gln Gln Val Arg Gln Gln Leu Lys Lys

275 280 285

Leu Glu Glu Leu Glu Gln Lys Tyr Thr Tyr Glu His Asp Pro Ile Thr

290 295 300

Lys Asn Lys Gln Val Leu Trp Asp Arg Thr Phe Ser Leu Phe Gln Gln

305 310 315 320

Leu Ile Gln Ser Ser Phe Val Val Glu Arg Gln Pro Cys Met Pro Thr

325 330 335

His Pro Gln Arg Pro Leu Val Leu Lys Thr Gly Val Gln Phe Thr Val

340 345 350

Lys Leu Arg Leu Leu Val Lys Leu Gln Glu Leu Asn Tyr Asn Leu Lys

355 360 365

Val Lys Val Leu Phe Asp Lys Asp Val Asn Glu Arg Asn Thr Val Lys

370 375 380

Gly Phe Arg Lys Phe Asn Ile Leu Gly Thr His Thr Lys Val Met Asn

385 390 395 400

Met Glu Glu Ser Thr Asn Gly Ser Leu Ala Ala Glu Phe Arg His Leu

405 410 415

Gln Leu Lys Glu Gln Lys Asn Ala Gly Thr Arg Thr Asn Glu Gly Pro

420 425 430

Leu Ile Val Thr Glu Glu Leu His Ser Leu Ser Phe Glu Thr Gln Leu

435 440 445

Cys Gln Pro Gly Leu Val Ile Asp Leu Glu Thr Thr Ser Leu Pro Val

450 455 460

Val Val Ile Ser Asn Val Ser Gln Leu Pro Ser Gly Trp Ala Ser Ile

465 470 475 480

Leu Trp Tyr Asn Met Leu Val Ala Glu Pro Arg Asn Leu Ser Phe Phe

485 490 495

Leu Thr Pro Pro Cys Ala Arg Trp Ala Gln Leu Ser Glu Val Leu Ser

500 505 510

Trp Gln Phe Ser Ser Val Thr Lys Arg Gly Leu Asn Val Asp Gln Leu

515 520 525

Asn Met Leu Gly Glu Lys Leu Leu Gly Pro Asn Ala Ser Pro Asp Gly

530 535 540

Leu Ile Pro Trp Thr Arg Phe Cys Lys Glu Asn Ile Asn Asp Lys Asn

545 550 555 560

Phe Pro Phe Trp Leu Trp Ile Glu Ser Ile Leu Glu Leu Ile Lys Lys

565 570 575

His Leu Leu Pro Leu Trp Asn Asp Gly Cys Ile Met Gly Phe Ile Ser

580 585 590

Lys Glu Arg Glu Arg Ala Leu Leu Lys Asp Gln Gln Pro Gly Thr Phe

595 600 605

Leu Leu Arg Phe Ser Glu Ser Ser Arg Glu Gly Ala Ile Thr Phe Thr

610 615 620

Trp Val Glu Arg Ser Gln Asn Gly Gly Glu Pro Asp Phe His Ala Val

625 630 635 640

Glu Pro Tyr Thr Lys Lys Glu Leu Ser Ala Val Thr Phe Pro Asp Ile

645 650 655

Ile Arg Asn Tyr Lys Val Met Ala Ala Glu Asn Ile Pro Glu Asn Pro

660 665 670

Leu Lys Tyr Leu Tyr Pro Asn Ile Asp Lys Asp His Ala Phe Gly Lys

675 680 685

Tyr Tyr Ser Arg Pro Lys Glu Ala Pro Glu Pro Met Glu Leu Asp Gly

690 695 700

Pro Lys Gly Thr Gly Tyr Ile Lys Thr Glu Leu Ile Ser Val Ser Glu

705 710 715 720

Val His Pro Ser Arg Leu Gln Thr Thr Asp Asn Leu Leu Pro Met Ser

725 730 735

Pro Glu Glu Phe Asp Glu Val Ser Arg Ile Val Gly Ser Val Glu Phe

740 745 750

Asp Ser Met Met Asn Thr Val Gln Ile Ser Tyr Ala Ser Arg Gly Gly

755 760 765

Gly Ser Ser Gly Gly Gly Glu Asp Ala Lys Asn Ile Lys Lys Gly Pro

770 775 780

Ala Pro Phe Tyr Pro Leu Glu Asp Gly Thr Ala Gly Glu Gln Leu His

785 790 795 800

Lys Ala Met Lys Arg Tyr Ala Leu Val Pro Gly Thr Ile Ala Phe Thr

805 810 815

Asp Ala His Ile Glu Val Asn Ile Thr Tyr Ala Glu Tyr Phe Glu Met

820 825 830

Ser Val Arg Leu Ala Glu Ala Met Lys Arg Tyr Gly Leu Asn Thr Asn

835 840 845

His Arg Ile Val Val Cys Ser Glu Asn Ser Leu Gln Phe Phe Met Pro

850 855 860

Val Leu Gly Ala Leu Phe Ile Gly Val Ala Val Ala Pro Ala Asn Asp

865 870 875 880

Ile Tyr Asn Glu Arg Glu Leu Leu Asn Ser Met Asn Ile Ser Gln Pro

885 890 895

Thr Val Val Phe Val Ser Lys Lys Gly Leu Gln Lys Ile Leu Asn Val

900 905 910

Gln Lys Lys Leu Pro Ile Ile Gln Lys Ile Ile Ile Met Asp Ser Lys

915 920 925

Thr Asp Tyr Gln Gly Phe Gln Ser Met Tyr Thr Phe Val Thr Ser His

930 935 940

Leu Pro Pro Gly Phe Asn Glu Tyr Asp Phe Val Pro Glu Ser Phe Asp

945 950 955 960

Arg Asp Lys Thr Ile Ala Leu Ile Met Asn Ser Ser Gly Ser Thr Gly

965 970 975

Leu Pro Lys Gly Val Ala Leu Pro His Arg Thr Ala Cys Val Arg Phe

980 985 990

Ser His Ala Arg Asp Pro Ile Phe Gly Asn Gln Ile Ile Pro Asp Thr

995 1000 1005

Ala Ile Leu Ser Val Val Pro Phe His His Gly Phe Gly Met Phe

1010 1015 1020

Thr Thr Leu Gly Tyr Leu Ile Cys Gly Phe Arg Val Val Leu Met

1025 1030 1035

Tyr Arg Phe Glu Glu Glu Leu Phe Leu Arg Ser Leu Gln Asp Tyr

1040 1045 1050

Lys Ile Gln Ser Ala Leu Leu Val Pro Thr Leu Phe Ser Phe Phe

1055 1060 1065

Ala Lys Ser Thr Leu Ile Asp Lys Tyr Asp Leu Ser Asn Leu His

1070 1075 1080

Glu Ile Ala Ser Gly Gly Ala Pro Leu Ser Lys Glu Val Gly Glu

1085 1090 1095

Ala Val Ala Lys Arg Phe His Leu Pro Gly Ile Arg Gln Gly Tyr

1100 1105 1110

Gly Leu Thr Glu Thr Thr Ser Ala Ile Leu Ile Thr Pro Glu Gly

1115 1120 1125

Asp Asp Lys Pro Gly Ala Val Gly Lys Val Val Pro Phe Phe Glu

1130 1135 1140

Ala Lys Val Val Asp Leu Asp Thr Gly Lys Thr Leu Gly Val Asn

1145 1150 1155

Gln Arg Gly Glu Leu Cys Val Arg Gly Pro Met Ile Met Ser Gly

1160 1165 1170

Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp Lys Asp

1175 1180 1185

Gly

<210> 92

<211> 926

<212> PRT

<213> 人工序列

<220>

<223> 人工序列说明：合成多肽

<400> 92

Met Ser Gly Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp

1 5 10 15

Lys Asp Gly Trp Leu His Ser Gly Asp Ile Ala Tyr Trp Asp Glu Asp

20 25 30

Glu His Phe Phe Ile Val Asp Arg Leu Lys Ser Leu Ile Lys Tyr Lys

35 40 45

Gly Tyr Gln Val Ala Pro Ala Glu Leu Glu Ser Ile Leu Leu Gln His

50 55 60

Pro Asn Ile Phe Asp Ala Gly Val Ala Gly Leu Pro Asp Asp Asp Ala

65 70 75 80

Gly Glu Leu Pro Ala Ala Val Val Val Leu Glu His Gly Lys Thr Met

85 90 95

Thr Glu Lys Glu Ile Val Asp Tyr Val Ala Ser Gln Val Thr Thr Ala

100 105 110

Lys Lys Leu Arg Gly Gly Val Val Phe Val Asp Glu Val Pro Lys Gly

115 120 125

Leu Thr Gly Lys Leu Asp Ala Arg Lys Ile Arg Glu Ile Leu Ile Lys

130 135 140

Ala Lys Lys Gly Gly Lys Ser Lys Leu Gly Gly Gly Ser Ser Gly Gly

145 150 155 160

Gly Gln Ile Ser Tyr Ala Ser Arg Gly Ser Gln Trp Tyr Glu Leu Gln

165 170 175

Gln Leu Asp Ser Lys Phe Leu Glu Gln Val His Gln Leu Tyr Asp Asp

180 185 190

Ser Phe Pro Met Glu Ile Arg Gln Tyr Leu Ala Gln Trp Leu Glu Lys

195 200 205

Gln Asp Trp Glu His Ala Ala Asn Asp Val Ser Phe Ala Thr Ile Arg

210 215 220

Phe His Asp Leu Leu Ser Gln Leu Asp Asp Gln Tyr Ser Arg Phe Ser

225 230 235 240

Leu Glu Asn Asn Phe Leu Leu Gln His Asn Ile Arg Lys Ser Lys Arg

245 250 255

Asn Leu Gln Asp Asn Phe Gln Glu Asp Pro Ile Gln Met Ser Met Ile

260 265 270

Ile Tyr Ser Cys Leu Lys Glu Glu Arg Lys Ile Leu Glu Asn Ala Gln

275 280 285

Arg Phe Asn Gln Ala Gln Ser Gly Asn Ile Gln Ser Thr Val Met Leu

290 295 300

Asp Lys Gln Lys Glu Leu Asp Ser Lys Val Arg Asn Val Lys Asp Lys

305 310 315 320

Val Met Cys Ile Glu His Glu Ile Lys Ser Leu Glu Asp Leu Gln Asp

325 330 335

Glu Tyr Asp Phe Lys Cys Lys Thr Leu Gln Asn Arg Glu His Glu Thr

340 345 350

Asn Gly Val Ala Lys Ser Asp Gln Lys Gln Glu Gln Leu Leu Leu Lys

355 360 365

Lys Met Tyr Leu Met Leu Asp Asn Lys Arg Lys Glu Val Val His Lys

370 375 380

Ile Ile Glu Leu Leu Asn Val Thr Glu Leu Thr Gln Asn Ala Leu Ile

385 390 395 400

Asn Asp Glu Leu Val Glu Trp Lys Arg Arg Gln Gln Ser Ala Cys Ile

405 410 415

Gly Gly Pro Pro Asn Ala Cys Leu Asp Gln Leu Gln Asn Trp Phe Thr

420 425 430

Ile Val Ala Glu Ser Leu Gln Gln Val Arg Gln Gln Leu Lys Lys Leu

435 440 445

Glu Glu Leu Glu Gln Lys Tyr Thr Tyr Glu His Asp Pro Ile Thr Lys

450 455 460

Asn Lys Gln Val Leu Trp Asp Arg Thr Phe Ser Leu Phe Gln Gln Leu

465 470 475 480

Ile Gln Ser Ser Phe Val Val Glu Arg Gln Pro Cys Met Pro Thr His

485 490 495

Pro Gln Arg Pro Leu Val Leu Lys Thr Gly Val Gln Phe Thr Val Lys

500 505 510

Leu Arg Leu Leu Val Lys Leu Gln Glu Leu Asn Tyr Asn Leu Lys Val

515 520 525

Lys Val Leu Phe Asp Lys Asp Val Asn Glu Arg Asn Thr Val Lys Gly

530 535 540

Phe Arg Lys Phe Asn Ile Leu Gly Thr His Thr Lys Val Met Asn Met

545 550 555 560

Glu Glu Ser Thr Asn Gly Ser Leu Ala Ala Glu Phe Arg His Leu Gln

565 570 575

Leu Lys Glu Gln Lys Asn Ala Gly Thr Arg Thr Asn Glu Gly Pro Leu

580 585 590

Ile Val Thr Glu Glu Leu His Ser Leu Ser Phe Glu Thr Gln Leu Cys

595 600 605

Gln Pro Gly Leu Val Ile Asp Leu Glu Thr Thr Ser Leu Pro Val Val

610 615 620

Val Ile Ser Asn Val Ser Gln Leu Pro Ser Gly Trp Ala Ser Ile Leu

625 630 635 640

Trp Tyr Asn Met Leu Val Ala Glu Pro Arg Asn Leu Ser Phe Phe Leu

645 650 655

Thr Pro Pro Cys Ala Arg Trp Ala Gln Leu Ser Glu Val Leu Ser Trp

660 665 670

Gln Phe Ser Ser Val Thr Lys Arg Gly Leu Asn Val Asp Gln Leu Asn

675 680 685

Met Leu Gly Glu Lys Leu Leu Gly Pro Asn Ala Ser Pro Asp Gly Leu

690 695 700

Ile Pro Trp Thr Arg Phe Cys Lys Glu Asn Ile Asn Asp Lys Asn Phe

705 710 715 720

Pro Phe Trp Leu Trp Ile Glu Ser Ile Leu Glu Leu Ile Lys Lys His

725 730 735

Leu Leu Pro Leu Trp Asn Asp Gly Cys Ile Met Gly Phe Ile Ser Lys

740 745 750

Glu Arg Glu Arg Ala Leu Leu Lys Asp Gln Gln Pro Gly Thr Phe Leu

755 760 765

Leu Arg Phe Ser Glu Ser Ser Arg Glu Gly Ala Ile Thr Phe Thr Trp

770 775 780

Val Glu Arg Ser Gln Asn Gly Gly Glu Pro Asp Phe His Ala Val Glu

785 790 795 800

Pro Tyr Thr Lys Lys Glu Leu Ser Ala Val Thr Phe Pro Asp Ile Ile

805 810 815

Arg Asn Tyr Lys Val Met Ala Ala Glu Asn Ile Pro Glu Asn Pro Leu

820 825 830

Lys Tyr Leu Tyr Pro Asn Ile Asp Lys Asp His Ala Phe Gly Lys Tyr

835 840 845

Tyr Ser Arg Pro Lys Glu Ala Pro Glu Pro Met Glu Leu Asp Gly Pro

850 855 860

Lys Gly Thr Gly Tyr Ile Lys Thr Glu Leu Ile Ser Val Ser Glu Val

865 870 875 880

His Pro Ser Arg Leu Gln Thr Thr Asp Asn Leu Leu Pro Met Ser Pro

885 890 895

Glu Glu Phe Asp Glu Val Ser Arg Ile Val Gly Ser Val Glu Phe Asp

900 905 910

Ser Met Met Asn Thr Val Asp Tyr Lys Asp Asp Asp Asp Lys

915 920 925

<210> 93

<211> 335

<212> PRT

<213> 人工序列

<220>

<223> 人工序列说明：合成多肽

<400> 93

Arg Pro Glu Cys Val Val Pro Glu Thr Gln Cys Ala Met Lys Arg Lys

1 5 10 15

Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Leu Pro Val Ser Thr Thr

20 25 30

Thr Val Asp Asp His Met Pro Pro Ile Met Gln Cys Glu Pro Pro Pro

35 40 45

Pro Glu Ala Ala Arg Ile His Glu Val Val Pro Arg Phe Leu Ser Asp

50 55 60

Lys Leu Leu Val Thr Asn Arg Gln Lys Asn Ile Pro Gln Leu Thr Ala

65 70 75 80

Asn Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln Asp Gly Tyr

85 90 95

Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln Thr Trp Gln

100 105 110

Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg Gln Ile

115 120 125

Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys

130 135 140

Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln Ile Thr Leu

145 150 155 160

Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val Ala Arg Arg

165 170 175

Tyr Asp Ala Ala Ser Asp Ser Ile Leu Phe Ala Asn Asn Gln Ala Tyr

180 185 190

Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Glu Val Ile Glu Asp

195 200 205

Leu Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp Asn Ile

210 215 220

His Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp Arg Pro Gly

225 230 235 240

Leu Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr Tyr Leu Asn

245 250 255

Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser Ala Arg Ser

260 265 270

Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu Arg Thr

275 280 285

Leu Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys Leu Lys Asn

290 295 300

Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val Ala Asp Met

305 310 315 320

Ser His Thr Gln Pro Pro Pro Ile Leu Glu Ser Pro Thr Asn Leu

325 330 335

<210> 94

<211> 235

<212> PRT

<213> 人工序列

<220>

<223> 人工序列说明：合成多肽

<400> 94

Glu Met Pro Val Asp Arg Ile Leu Glu Ala Glu Leu Ala Val Glu Gln

1 5 10 15

Lys Ser Asp Gln Gly Val Glu Gly Pro Gly Gly Thr Gly Gly Ser Gly

20 25 30

Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp Lys

35 40 45

Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe Ser

50 55 60

Ser Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp Asn

65 70 75 80

Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Asp Val Arg Asp

85 90 95

Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala His

100 105 110

Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu Val

115 120 125

Ser Lys Met Arg Asp Met Arg Met Asp Lys Thr Glu Leu Gly Cys Leu

130 135 140

Arg Ala Ile Ile Leu Phe Asn Pro Glu Val Arg Gly Leu Lys Ser Ala

145 150 155 160

Gln Glu Val Glu Leu Leu Arg Glu Lys Val Tyr Ala Ala Leu Glu Glu

165 170 175

Tyr Thr Arg Thr Thr His Pro Asp Glu Pro Gly Arg Phe Ala Lys Leu

180 185 190

Leu Leu Arg Leu Pro Ser Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu

195 200 205

His Leu Phe Phe Phe Arg Leu Ile Gly Asp Val Pro Ile Asp Thr Phe

210 215 220

Leu Met Glu Met Leu Glu Ser Pro Ser Asp Ser

225 230 235

Claims

1.两种多肽，其包含第一非天然存在的多肽和第二非天然存在的多肽，所述第一非天然存在的多肽包含核受体蛋白的片段或结构域，且所述第二非天然存在的多肽包含核受体蛋白的不同片段或结构域，其中第一多肽能够结合激活配体，其中第二多肽能够在激活配体存在下与第一多肽缔合，其中第一和第二多肽中的每一个还包含异源氨基酸或多肽序列，使得激活配体诱导的第一和第二多肽的缔合导致激活的功能、生物或细胞信号转导状态。

2.如权利要求1所述的第一和第二多肽，其中一个或两个核受体蛋白质片段或结构域包含节肢动物核受体氨基酸序列。

3.如权利要求1或2所述的第一和第二多肽，其中一个或两个核受体蛋白质片段或结构域包含H组核受体氨基酸序列。

4.如权利要求1-3中任一项所述的第一和第二多肽，其中所述第一多肽的核受体氨基酸序列包含蜕皮激素受体(EcR)配体结构结构域、多肽片段、或其取代突变体。

5.如权利要求1-4中任一项所述的第一和第二多肽，其中所述第二多肽核受体蛋白质片段或结构域包含哺乳动物核受体氨基酸序列。

6.如权利要求5所述的第一和第二多肽，其中所述哺乳动物核受体蛋白质片段或结构域包含RXR核受体多肽片段，或其取代突变体。

7.如权利要求1-6中任一项所述的第一和第二多肽，其中所述第二多肽核受体蛋白质片段或结构域包含无脊椎动物和哺乳动物核受体氨基酸序列的嵌合体，或其取代突变体。

8.如权利要求7所述的第一和第二多肽，其中所述第二多肽核受体蛋白质片段或结构域包含无脊椎动物USP(RXR同源物)和哺乳动物RXR核受体氨基酸序列的嵌合体，或其取代突变体。

9.一种配体诱导型多肽耦合(LIPC)系统，其包含：

a)第一非天然产生的多肽，其包含节肢动物核受体蛋白质的片段或结构域，和

b)第二非天然产生的多肽，其包含节肢动物和/或哺乳动物核受体蛋白质的片段或结构域，

其中所述第一和第二多肽包含其他能够在与激活配体接触之后产生激活的功能性、生物或细胞信号转导条件的异源序列。

10.如权利要求9所述的LIPC系统，其中一个或两个核受体蛋白质片段或结构域包含H组核受体氨基酸序列。

11.如权利要求9或10所述的LIPC系统，其中所述第一多肽包含蜕皮激素受体(EcR)配体结合结构域，多肽片段或其取代突变体。

12.如权利要求9-11中任一项所述的LIPC系统，其中所述第二多肽包含哺乳动物核受体氨基酸序列。

13.如权利要求12所述的LIPC系统，其中所述第二多肽包含RXR核受体多肽片段，或其取代突变体。

14.如权利要求9-13中任一项所述的LIPC系统，其中所述第二多肽包含无脊椎动物和哺乳动物核受体氨基酸序列的嵌合体，或其取代突变体。

15.如权利要求14所述的LIPC系统，其中所述第二多肽包含无脊椎动物USP(RXR同系物)和哺乳动物RXR核受体氨基酸序列的嵌合体，或其取代突变体。

16.如权利要求1-8中任一项所述的第一和第二多肽，或如权利要求9-15中任一项所述的LIPC系统，其中所述核受体蛋白质片段中的至少一种衍生自选自下组的蜕皮激素受体多肽：云杉卷叶蛾(Choristoneura fumiferana)EcR(“CfEcR”)LBD、黄粉虫(Tenebriomolitor)EcR(“TmEcR”)LBD、烟草天蛾(Manduca sexta)EcR(“MsEcR”)LBD、绿棉铃虫(Heliothies virescens)EcR(“HvEcR”)LBD、摇蚊(Chironomus tentans)(“CfEcR”)LBD、家蚕蛾(Bombyx mori)EcR(“BmEcR”)LBD、黑腹果蝇(Drosophila melanogaster)EcR(“DmEcR”)LBD、埃及伊蚊(Aedes aegypti)EcR(“AaEcR”)LBD、绿蝇(Lucilia capitata)EcR(“LcEcR”)LBD、铜绿蝇(Lucilia cuprina)EcR(“LucEcR”)LBD、地中海果蝇(Ceratitiscapitata)EcR(“CcEcR”)LBD、飞蝗(Locusta migratoria)EcR(“LmEcR”)LBD、紫堇瘤蚜(Myzus persicae)EcR(“MpEcR”)LBD、招潮蟹(Celuca pugilator)EcR(“CpEcR”)LBD、银液粉虱(Bamecia argentifoli)EcR(BaEcR)LBD、黑尾叶蝉(Nephotetix cincticeps)EcR(NcEcR)LBD、和美洲钝眼蜱(Amblyomma americanum)EcR(“AmaEcR”)LBD。

17.如权利要求1-8中任一项所述的第一和第二多肽，或如权利要求9-15中任一项所述的LIPC系统，其中所述核受体蛋白质片段中的至少一种衍生自由包含SEQ ID NO：1(CfEcR-DEF)、SEQ ID NO：2(CfEcR-CDEF)、SEQ ID NO：3(DmEcR-DEF)、SEQ ID NO：4(TmEcR-DEF)、SEQ ID NO：5(AmaEcR-DEF)的核酸序列的多核苷酸所编码的蜕皮激素受体多肽，或编码与其基本相同的功能变体的多核苷酸。

18.如权利要求16-17所述的第一和第二多肽或LIPC系统，其中所述蜕皮激素受体多肽中的至少一种包含SEQ ID NO：6(CfEcR-DEF)，SEQ ID NO：7(DmEcR-DEF)，SEQ ID NO：8(CfEcR-CDEF)，SEQ ID NO：9(TmEcR-DEF)，SEQ ID NO：10(AmaEcR-DEF)的多肽序列，或与其基本相同的多肽序列。

19.如权利要求16-18中任一项所述的第一和第二多肽或LIPC系统，其中所述蜕皮激素受体多肽序列包含相对于相应的野生型蜕皮激素受体多肽的约或至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或取代突变。

20.如权利要求16-19中任一项所述的第一和第二多肽或LIPC系统，其中所述蜕皮激素受体多肽由包含导致氨基酸残基取代的密码子突变的多核苷酸编码，其中该氨基酸残基位于等同于或类似于以下的位置：a)SEQ ID NO：17的氨基酸残基20、21、48、51、52、55、58、59、61、62、92、93、95、96、107、109、110、120、123、125、175、218、234或238，b)SEQ ID NO：17的氨基酸残基95和110，c)SEQ ID NO：17的氨基酸残基218和219，d)SEQ ID NO：17的氨基酸残基107和175，e)SEQ ID NO：17的氨基酸残基127和175，f)SEQ ID NO：17的氨基酸残基107和127，g)SEQ ID NO：17的氨基酸残基107、127和175，h)SEQ ID NO：17的氨基酸残基52、107和175，i)SEQ ID NO：17的氨基酸残基96、107和175，j)SEQ ID NO：17的氨基酸残基107、110和175，k)SEQ ID NO：18的氨基酸残基107、121、213或217，或1)SEQ ID NO：19的氨基酸残基91或105。

21.如权利要求16-20中任一项所述的第一和第二多肽或LIPC系统，其中所述取代突变选自下组：a)SEQ ID NO：17的E20A，Q21A，F48A，I51A，T52A，T52V，T52I，T52L，T55A，T58A，V59A，L61A，I62A，M92A，M93A，R95A，V96A，V96T，V96D，V96M，V107I，F109A，A110P，A110S，A110M，A110L，Y120A，A123F，M125A，R175E，M218A，C219A，L223A，L230A，L234A，W238A，R95A/A110P，M218A/C219A/R175E，V107I/R175E，V107I/Y127E，V107I/Y127E/R175E，T52V/V107I/R175E，V96A/V107I/R175E，T52A/V107I/R175E，V96T/V107I/R175E或V107I/A110P/R75E取代突变，b)SEQ ID NO：18的A107P，G121R，G121L，N213A，C217A或C217S取代突变，以及c)SEQID NO：19的G91A或A105P取代突变。

22.如权利要求16-21中任一项所述的第一和第二多肽或LIPC系统，其中所述类视黄醇X受体多肽包含选自下组的多肽：脊椎动物类维生素X受体多肽，无脊椎动物类维生素X受体多肽(USP)和包含来自脊椎动物和无脊椎动物RXR的多肽片段的嵌合类视黄醇X多肽。

23.如权利要求22所述的第一和第二多肽或LIPC系统，其中所述嵌合类视黄醇X受体多肽包含至少两种不同的类视黄醇X受体多肽片段，其选自脊椎动物类视黄醇X受体多肽片段，无脊椎动物类视黄醇X受体多肽片段，和非双翅目/非鳞翅目无脊椎动物物种类视黄醇X受体多肽片段。

24.如权利要求23所述的第一和第二多肽或LIPC系统，其中所述嵌合类视黄醇X受体多肽包含类视黄酸X受体多肽，其包含至少一种类视黄醇X受体多肽片段，其选自EF结构域螺旋1，EF结构域螺旋2，EF结构域螺旋3，EF结构域螺旋4，EF结构域螺旋5，EF结构域螺旋6，EF结构域螺旋7，EF结构域螺旋8，EF结构域螺旋9，EF结构域螺旋10，EF结构域螺旋11，EF结构域螺旋12，F结构域和EF结构域β-折叠，其中类视黄醇X受体多肽片段来自不同物种的类视黄醇X受体多肽或与第二类视黄醇X受体多肽片段不同的同种型类视黄醇X受体多肽。

25.如权利要求22所述的第一和第二多肽或LIPC系统，其中所述嵌合类视黄醇X受体多肽由包含下述核酸序列的多核苷酸编码：a)SEQ ID NO：11，b)SEQ ID NO：12的核苷酸1-348和SEQ ID NO：13的核苷酸268-630，c)SEQ ID NO：12的核苷酸1-408和SEQ ID NO：13的核苷酸337-630，d)SEQ ID NO：12的核苷酸1465和SEQ ID NO：13的核苷酸403-630，e)SEQ IDNO：12的核苷酸1-555和SEQ ID NO：13的核苷酸490-630，f)SEQ ID NO：12的核苷酸1-624和SEQ ID NO：13的核苷酸547-630，g)SEQ ID NO：12的核苷酸1-645和SEQ ID NO：13的核苷酸601-630，和h)SEQ ID NO：12的核苷酸1-717，SEQ ID NO：13的核苷酸613-630，或编码与其基本相同的功能变体的多核苷酸。

26.如权利要求22所述的第一和第二多肽或LIPC系统，其中所述嵌合类视黄醇X多肽包含下述多肽序列：a)SEQ ID NO：14，b)SEQ ID NO：15的氨基酸1-116和SEQ ID NO：16的氨基酸90-210，c)SEQ ID NO：15的氨基酸1-136和SEQ ID NO：16的氨基酸113-210，d)SEQ IDNO：15的氨基酸1-155和SEQ ID NO：16的氨基酸135-210，e)SEQ ID NO：15的氨基酸1-185和SEQ ID NO：16的氨基酸164-210，f)SEQ ID NO：15的氨基酸1-208和SEQ ID NO：16的氨基酸183-210，g)SEQ ID NO：15的氨基酸1-215和SEQ ID NO：16的氨基酸201-210，以及h)SEQ IDNO：15的氨基酸1-239，SEQ ID NO：16的氨基酸205-210，或与其基本相同的多肽序列。

27.如权利要求1-26中任一项所述的第一和第二多肽或LIPC系统，其中一个或两个其他异源序列包含跨膜结构域。

28.如权利要求27所述的第一和第二多肽或LIPC系统，其中至少一个所述跨膜结构域是单通I型跨膜结构域。

29.一种分离的多核苷酸，其包含编码权利要求1-28中任一项所述的第一或第二多肽的多核苷酸序列。

30.包含编码权利要求1-28中任一项所述的第一多肽的核苷酸序列的第一多核苷酸和包含编码权利要求1-28中任一项所述的第二多肽的核苷酸序列的第二多核苷酸。

31.一种包含权利要求29或30所述的多核苷酸之一的载体。

32.一种包含权利要求29或30所述的多核苷酸的两者的载体。

33.如权利要求31或32所述的载体，其中所述载体是表达载体。

34.一种宿主细胞，其包含权利要求31-33中任一项所述的载体。

35.如权利要求34所述的宿主细胞，所述宿主细胞是哺乳动物T细胞。

36.如权利要求34所述的宿主细胞，所述宿主细胞是人T细胞。

37.一种诱导细胞信号转导的方法，包括将权利要求1-28中任一项所述的第一和第二多肽或LIPC系统，权利要求29或30所述的多核苷酸，或权利要求31-33中任一项所述的载体引入宿主细胞中，并用激活配体接触所述宿主细胞。

38.如权利要求1-28中任一项所述的第一和第二多肽或LIPC系统，如权利要求29或30所述的多核苷酸，如权利要求31-33中任一项所述的载体，或如权利要求34-36中任一项所述的方法，其中所述激活配体是

c)下式的化合物：

其中：

E是含叔碳的(C₄-C₆)烷基或含叔碳的氰基(C₃-C₅)烷基；R¹是H、Me、Et、i-Pr、F、甲酰基、CF₃、CHF₂、CHCl₂、CH₂F、CH₂Cl、CH₂OH、CH₂OMe、CH₂CN、CN、C≡CH、1-丙炔基、2-丙炔基、乙烯基、OH、OMe、OEt、环丙基、CF₂CF₃、CH＝CHCN、烯丙基、叠氮基、SCN、或SCHF₂；

39.如权利要求1-28中任一项所述的第一和第二多肽或LIPC系统，如权利要求29或30所述的多核苷酸，如权利要求31-33中任一项所述的载体，或如权利要求34-36中任一项所述的方法，其中所述激活配体是下式的化合物：

或者

其中，R¹、R²、R³和R⁴是：a)H，(C₁-C₆)烷基；(C₁-C₆)卤代烷基；(C₁-C₆)氰基烷基；(C₁-C₆)羟基烷基；(C₁-C₄)烷氧基(C₁-C₆)烷基；任选地被卤素、氰基、羟基或(C₁-C₄)烷基取代的(C₂-C₆)烯基；任选地被卤素、氰基、羟基或(C₁-C₄)烷基取代的(C₂-C₆)炔基；任选地被卤素、氰基、羟基或(C₁-C₄)烷基取代的(C₃-C₅)环烷基；或b)未取代或取代的苄基，其中取代基独立地是1至5H、卤素、硝基、氰基、羟基、(C₁-C₆)烷基、或(C₁-C₆)烷氧基；并且

R⁵是H；OH；F；Cl；或(C₁-C₆)烷氧基；

前提是：当R¹、R²、R³、和R⁴是异丙基时，R⁵不是羟基；

当R⁴以及R¹、R²、和R³之一都是甲基时，R⁵不是H或羟基；

当R¹、R²、R³、和R⁴都是甲基时，R⁵不是羟基；

40.如权利要求1-28中任一项所述的第一和第二多肽或LIPC系统，如权利要求29或30所述的多核苷酸，如权利要求31-33中任一项所述的载体，或如权利要求34-36中任一项所述的方法，其中所述激活配体是下式的化合物：

其中X和X′独立地是O或S；

Y是：

R³是H、甲基、乙基、正丙基、异丙基、或氰基；

R⁴、R⁷和R⁸独立地是：H、(C₁-C₄)烷基、(C₁-C₄)烷氧基、(C₂-C₄)烯基、卤素(F，Cl，Br，I)、(C₁-C₄)卤代烷基、羟基、氨基、氰基、或硝基；并且

R⁵和R⁶独立地是：H、(C₁-C₄)烷基、(C₂-C₄)烯基、(C₃-C₄)烯基烷基、卤素(F，Cl，Br，I)、C₁-C₄卤代烷基、(C₁-C₄)烷氧基、羟基、氨基、氰基、硝基，或一起以(-OCHR⁹CHR¹⁰O-)型连接和与它们所接合的苯基碳形成环；其中R⁹和R¹⁰独立地是：H、卤素、(C₁-C₃)烷基、(C₂-C₃)烯基、(C₁-C₃)烷氧基(C₁-C₃)烷基、苯甲酰基氧基(C₁-C₃)烷基、羟基(C₁-C₃)烷基、卤代(C₁-C₃)烷基、甲酰基、甲酰基(C₁-C₃)烷基、氰基、氰基(C₁-C₃)烷基、羧基、羧基(C₁-C₃)烷基、(C₁-C₃)烷氧基羰基(C₁-C₃)烷基、(C₁-C₃)烷基羰基(C₁-C₃)烷基、(C₁-C₃)烷酰氧基(C₁-C₃)烷基、氨基(C₁-C₃)烷基、(C₁-C₃)烷基氨基(C₁-C₃)烷基(-(CH₂)_nR^cR^e)、肟(-CH＝NOH)、肟(C₁-C₃)烷基、(C₁-C₃)链肟(-C＝NOR^d)、链肟(C₁-C₃)烷基、(C₁-C₃)甲酰胺基(-C(O)NR^eR^f)、(C₁-C₃)甲酰胺基(C₁-C₃)烷基、(C₁-C₃)脲氨基(-C＝NNHC(O)NR^eR^f)、脲氨基(C₁-C₃)烷基、氨基羰氧基(-OC(O)NHR^g)、氨基羰氧基(C₁-C₃)烷基、五氟苯氧基羰基、五氟苯氧基羰基(C₁-C₃)烷基、对-甲苯磺酰氧基(C₁-C₃)烷基、芳基磺酰氧基(C₁-C₃)烷基、(C₁-C₃)硫代(C₁-C₃)烷基、(C₁-C₃)烷基亚砜基(C₁-C₃)烷基、(C₁-C₃)烷基磺酰基(C₁-C₃)烷基、或(C₁-C₅)三取代-甲硅烷氧基(C₁-C₃)烷基(-(CH₂)_nSiOR^dR^eR^g)；其中n＝1-3，R^c和R^d表示所示长度的直链或支链烃链，R^e，R^f表示H或所示长度的直链或支链烃链，R^g表示任选地被卤素或(C₁-C₃)烷基取代的(C₁-C₃)烷基或芳基，并且R^c、R^d、R^e、R^f、和R^g互相独立；

前提是：

i)当R⁹和R¹⁰都是H时，或

iii)当R⁵和R⁶不一起形成(-OCHR⁹CHR¹⁰O-)型连接时，

41.一种测量配体诱导的细胞信号转导的方法，包括：

a)将权利要求1-28中任一项所述的第一和第二多肽或LIPC系统，权利要求29或30所述的多核苷酸，或权利要求31-33中任一项所述的载体引入宿主细胞中；

b)用激活配体接触所述宿主细胞；并且，

c)对配体诱导的生物活性或多肽寡聚化的绝对或相对量进行定量。