CN107430128A - 配体诱导型多肽耦合器系统 - Google Patents

配体诱导型多肽耦合器系统 Download PDF

Info

Publication number
CN107430128A
CN107430128A CN201680020980.9A CN201680020980A CN107430128A CN 107430128 A CN107430128 A CN 107430128A CN 201680020980 A CN201680020980 A CN 201680020980A CN 107430128 A CN107430128 A CN 107430128A
Authority
CN
China
Prior art keywords
seq
polypeptide
amino acid
alkyl
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201680020980.9A
Other languages
English (en)
Inventor
D·P·贝德纳利克
C·C·里德
V·库雷拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Pittsburgh
Original Assignee
University of Pittsburgh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Pittsburgh filed Critical University of Pittsburgh
Publication of CN107430128A publication Critical patent/CN107430128A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6845Methods of identifying protein-protein interactions in protein mixtures
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • C07K14/01DNA viruses
    • C07K14/03Herpetoviridae, e.g. pseudorabies virus
    • C07K14/035Herpes simplex virus I or II
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43563Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70567Nuclear receptors, e.g. retinoic acid receptor [RAR], RXR, nuclear orphan receptors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • C07K2319/71Fusion polypeptide containing domain for protein-protein interaction containing domain for transcriptional activaation, e.g. VP16
    • C07K2319/715Fusion polypeptide containing domain for protein-protein interaction containing domain for transcriptional activaation, e.g. VP16 containing a domain for ligand dependent transcriptional activation, e.g. containing a steroid receptor domain

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Toxicology (AREA)
  • Virology (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)
  • Cell Biology (AREA)
  • Hematology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Food Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • Pathology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Insects & Arthropods (AREA)
  • High Energy & Nuclear Physics (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及新型配体诱导型多肽耦合系统和调节细胞信号转导通路以及其他胞内和胞外蛋白质‑蛋白质相互作用的方法。

Description

配体诱导型多肽耦合器系统
序列表
本申请包含以ASCII格式电子提交的序列表,并通过引用全文纳入本文。2016年3月24日创建的所述ASCII拷贝命名为0100-0013WO1_SL.txt,大小为192,837字节。
技术领域
本发明的领域是细胞和分子生物学。具体地,本发明的领域是细胞信号传导及其遗传工程改造或修饰的方法。更具体地,本发明涉及新的基于核受体的配体诱导型多肽耦合器以及在宿主细胞中调节蛋白质-蛋白质相互作用的方法。
背景技术
在遗传工程改造和医学领域中,精确控制并调整细胞信号传导通路是有价值并长期寻求的用于研究、操纵和控制发育和其他生理过程(例如,病理状态)的工具。已知信号传导通路调节多种细胞过程和功能,包括增殖、分化和凋亡。可通过多种机制来调节信号转导通路,如翻译后修饰(例如,磷酸化、泛素化等)和蛋白质-蛋白质相互作用。一种激活或调节信号传导通路的常用机制是通过蛋白质-蛋白质相互作用来形成多蛋白质复合物(例如,二聚体、三聚体和寡聚体)。这种复合物可包括相同蛋白的多个拷贝(同源-复合物)或不同蛋白质的拷贝(异源-复合物)。在一些情况下,蛋白质-蛋白质相互作用的诱导和复合物的形成由配体与一种或多种成员蛋白质(例如,受体分子)的结合触发。虽然已经发现并表征了多种这样的细胞信号传导通路,仍然需要能够使用药学上可接受的且可用的激活配体以快速、高效和可靠的方式靶向和操纵这些通路。
与细胞信号传导途径的调节系统的相对稀缺相反,已经开发并采用了通过诱导跨转录因子之间的蛋白质-蛋白质相互作用来调节基因表达的方法。为了触发基因表达,使得其产生作为蛋白质合成中的第一步所必需的RNA,转录激活子必须接近控制基因转录的启动子。通常,转录激活物本身与具有至少一个DNA结合结构域的蛋白质结合,所述结合结构域与存在于基因启动子区域中的DNA结合位点结合。因此,为了发生基因表达,必须将包含DNA结合结构域和位于距离DNA结合结构域适当距离的激活结构域的蛋白质置于基因的启动子区域中的正确位置。
诱导蛋白质-蛋白质相互作用的一种方法依赖于免疫抑制分子如FK506、雷帕霉素和环孢菌素A,其可以结合亲免素、FKBP12、亲环素等。已经设计了一般策略,通过将FK506放置在两个蛋白质的每一个上或通过将FK506置于另一个蛋白上并将环孢素A置于另一个上来将任何两个蛋白质在一起。然后可以使用FK506(FK1012)的合成同二聚体或由FK506-环孢菌素(FKCsA)融合产生的化合物诱导这些分子的二聚化(Spencer等,1993,Science 262:1019-24;Belshaw等,1996 Proc Natl Acad Sci USA 93:4604-7)。与FKBP12融合的Gal4DNA结合结构域和与亲环蛋白融合的VP16激活剂结构域和FKCA化合物用于显示在含有Gal4结合位点的启动子控制下的报告基因的异二聚化和激活。不幸的是,该系统包括可能具有不想要的副作用并因此限制其于各种哺乳动物的应用的免疫抑制剂。
高等真核转录激活系统如类固醇激素受体系统也被用于调节基因表达。类固醇激素受体是核受体超家族的成员,并在脊椎动物和无脊椎动物细胞中发现。不幸的是,使用激活受体以调节基因表达的甾族化合物,特别是在植物和哺乳动物中,受限于它们参与这些生物体中许多其它天然生物学途径。为了克服这些困难,已经使用昆虫蜕皮激素受体(EcR)开发了替代系统。
昆虫中的生长、蜕皮和发育受蜕皮类固醇激素(蜕皮激素)和保幼激素(Dhadialla等,1998,Annu.Rev.Entomol.43:545-569)的调节。蜕皮激素在昆虫中的分子靶标至少包括蜕皮激素受体(EcR)和超气门蛋白(USP)。EcR是核甾体受体超家族成员,表现为特征DNA和配体结合域,以及激活域(Koelle等,1991,Cell,67:59-77)。EcR素受体对许多甾体化合物有响应,例如松甾酮A和莫瑞甾酮A(muristerone A)。还描述了具有蜕皮甾酮激动剂活性的非甾体化合物,包括商业上可得到的杀虫剂虫酰肼和甲氧虫酰肼(参见国际专利申请PCT/EP96/00686和美国专利5,530,028,其各自通过引用全文纳入本文)。两种类似物在其他生物体中都具有卓越的安全性。
昆虫蜕皮激素受体(EcR)与超气门蛋白(USP)(其是哺乳动物类视黄醇X受体(RXR)的昆虫同源物)异二聚化,通过其配体结合结构域结合蜕皮甾醇激素,并且还结合蜕皮激素受体响应元件以激活蜕皮激素反应基因的转录(Riddiford等,2000)。
EcR具有5个模块域,A/B(转活),C(DNA结合,异源二聚化),D(铰链,异源二聚化),E(配体结合,异源二聚化和转活)和F(转活)结构域。这些结构域中的一些,例如A/B、C和E在与其他蛋白融合后保留功能。EcR是核受体超家族的成员,并分为亚类1,H组(本文称为“H组核受体”)。每个组的成员在E(配体结合)结构域中具有40-60%的氨基酸相同性(Laudet等,核受体亚类的统一命名系统(A Unified Nomenclature System for the NuclearReceptor Subfamily),1999;Cell 97:161-163)。除了蜕皮激素受体外,该核受体亚类1,H组的其他成员包括:普遍存在受体(UR),孤儿受体1(OR-1),类固醇激素核受体1(NER-1),RXR相互作用蛋白-15(RIP-15),肝x受体β(LXRβ),类固醇激素受体样蛋白(RLD-1),肝x受体(LXR),肝x受体α(LXRα),法尼酯x受体(FXR),受体相互作用蛋白14(RIP-14)和法尼醇受体(HRR-1)。
在哺乳动物细胞中,已经证明昆虫蜕皮激素受体(EcR)可以与哺乳动物类视黄醇X受体(RXR)异二聚化,并且可用于以配体依赖的方式调节靶基因的表达。然而,这种表达系统组分的使用尚未被考虑、证明或应用于调节蛋白质-蛋白质相互作用或用于例如调节、控制、诱导或抑制细胞外和细胞内信号转导通路和蛋白质-蛋白关联。
虽然已经开发了其他基因表达系统,但仍然需要通过调节蛋白质-蛋白质相互作用来允许在植物和动物中精确调节细胞信号传导途径的系统。
通过引用,将本文引用的各种发表物的全部内容纳入本文。
发明内容
在一些实施方式中,本发明包含两种多肽,其包含第一非天然存在的多肽和第二非天然存在的多肽,该第一非天然存在的多肽包含核受体蛋白的片段或结构域,该第二非天然存在的多肽包含核受体蛋白的不同片段或结构域,其中第一多肽能够结合激活配体,其中第二多肽能够在激活配体存在下与第一多肽缔合,其中第一和第二多肽中的每一个还包含异源氨基酸或多肽序列,使得激活配体诱导的第一和第二多肽的缔合(association)导致激活的功能、生物或细胞信号转导状态。
在本发明的某些实施方式中,一个或两个核受体蛋白质片段或结构域包含节肢动物核受体氨基酸序列。
在本发明的一些实施方式中,一个或两个核受体蛋白质片段或结构域包含H组核受体氨基酸序列。
在本发明的某些实施方式中,第一多肽的核受体氨基酸序列包含蜕皮激素受体(EcR)配体结合结构域,其多肽片段或取代突变体。
在本发明的一些实施方式中,第二多肽核受体蛋白质片段或结构域包含哺乳动物核受体氨基酸序列。
在本发明的某些实施方式中,哺乳动物核受体蛋白质片段或结构域包含RXR核受体多肽片段或其取代突变体。
在本发明的一些实施方式中,第二多肽核受体蛋白质片段或结构域包含无脊椎动物和哺乳动物核受体氨基酸序列的嵌合体或其取代突变体。
在本发明的某些实施方式中,第二多肽核受体蛋白质片段或结构域包含无脊椎动物USP(RXR同源物)和哺乳动物RXR核受体氨基酸序列的嵌合体或其取代突变体。
在一些实施方式中,本发明包括配体诱导型多肽耦合(LIPC)系统,其包含:a)包含节肢动物核受体蛋白的片段或结构域的第一非天然存在的多肽,和b)包含节肢动物和/或哺乳动物核受体蛋白质的片段或结构域的第二非天然存在的多肽,其中第一和第二多肽包含能够在与激活配体接触后产生激活的功能、生物或细胞信号转导状况的其它异源序列。
在本发明的一些实施方式中,LIPC的一个或两个核受体蛋白质片段或结构域包含H组核受体氨基酸序列。
在本发明的某些实施方式中,LIPC的第一多肽包含蜕皮激素受体(EcR)配体结合结构域,多肽片段或其取代突变体。
在本发明的一些实施方式中,LIPC的第二多肽包含哺乳动物核受体氨基酸序列。
在本发明的某些实施方式中,LIPC的第二多肽包含RXR核受体多肽片段或其取代突变体。
在本发明的一些实施方式中,LIPC的第二多肽包含无脊椎动物和哺乳动物核受体氨基酸序列的嵌合体或其取代突变体。
在本发明的某些实施方式中,LIPC的第二多肽包含无脊椎动物USP(RXR同系物)和哺乳动物RXR核受体氨基酸序列的嵌合体或其取代突变体。
在本发明的一些实施方式中,包括LIPC的本发明的第一和第二多肽的核受体蛋白质片段衍生自选自下组的蜕皮激素受体多肽:云杉卷叶蛾(Choristoneura fumiferana)EcR(“CfEcR”)LBD、黄粉虫(Tenebrio molitor)EcR(“TmEcR”)LBD、烟草天蛾(Manducasexta)EcR(“MsEcR”)LBD、绿棉铃虫(Heliothies virescens)EcR(“HvEcR”)LBD、摇蚊(Chironomus tentans)(“CfEcR”)LBD、家蚕蛾(Bombyx mori)EcR(“BmEcR”)LBD、黑腹果蝇(Drosophila melanogaster)EcR(“DmEcR”)LBD、埃及伊蚊(Aedes aegypti)EcR(“AaEcR”)LBD、绿蝇(Lucilia capitata)EcR(“LcEcR”)LBD、铜绿蝇(Lucilia cuprina)EcR(“LucEcR”)LBD、地中海果蝇(Ceratitis capitata)EcR(“CcEcR”)LBD、飞蝗(Locustamigratoria)EcR(“LmEcR”)LBD、紫堇瘤蚜(Myzus persicae)EcR(“MpEcR”)LBD、招潮蟹(Celuca pugilator)EcR(“CpEcR”)LBD、银液粉虱(Bamecia argentifoli)EcR(BaEcR)LBD、黑尾叶蝉(Nephotetix cincticeps)EcR(NcEcR)LBD、和美洲钝眼蜱(Amblyommaamericanum)EcR(“AmaEcR”)LBD。
在本发明的某些实施方式中,包括LIPC的本发明的第一和第二多肽的核受体蛋白质片段衍生自由包含SEQ ID NO:1(CfEcR-DEF)、SEQ ID NO:2(CfEcR-CDEF)、SEQ ID NO:3(DmEcR-DEF)、SEQ ID NO:4(TmEcR-DEF)SEQ ID NO:5(AmaEcR-DEF)的核酸序列的多核苷酸所编码的蜕皮激素受体多肽,或编码与其基本相同的功能变体的多核苷酸。
在本发明的某些实施方式中,蜕皮激素受体多肽中的至少一种包含SEQ ID NO:6(CfEcR-DEF),SEQ ID NO:7(DmEcR-DEF),SEQ ID NO:8(CfEcR-CDEF),SEQ ID NO:9(TmEcR-DEF),SEQ ID NO:10(AmaEcR-DEF)的多肽序列,或与其基本相同的多肽序列。
在本发明的某些实施方式中,蜕皮激素受体多肽序列包含约或至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或相对于相应的野生型蜕皮激素受体多肽的取代突变。
在本发明的某些实施方式中,蜕皮激素受体多肽由包含导致氨基酸残基取代的密码子突变的多核苷酸编码,其中该氨基酸残基位于等同于或类似于以下的位置:a)SEQ IDNO:17的氨基酸残基20、21、48、51、52、55、58、59、61、62、92、93、95、96、107、109、110、120、123、125、175、218、234或238,b)SEQ ID NO:17的氨基酸残基95和110,c)SEQ ID NO:17的氨基酸残基218和219,d)SEQ ID NO:17的氨基酸残基107和175,e)SEQ ID NO:17的氨基酸残基127和175,f)SEQ ID NO:17的氨基酸残基107和127,g)SEQ ID NO:17的氨基酸残基107、127和175,h)SEQ ID NO:17的氨基酸残基52、107和175,i)SEQ ID NO:17的氨基酸残基96、107和175,j)SEQ ID NO:17的氨基酸残基107、110和175,k)SEQ ID NO:18的氨基酸残基107、121、213或217,或1)SEQ ID NO:19的氨基酸残基91或105。
在本发明的某些实施方式中,蜕皮激素受体多肽的取代突变选自下组:a)SEQ IDNO:17的E20A,Q21A,F48A,I51A,T52A,T52V,T52I,T52L,T55A,T58A,V59A,L61A,I62A,M92A,M93A,R95A,V96A,V96T,V96D,V96M,V107I,F109A,A110P,A110S,A110M,A110L,Y120A,A123F,M125A,R175E,M218A,C219A,L223A,L230A,L234A,W238A,R95A/A110P,M218A/C219A/R175E,V107I/R175E,V107I/Y127E,V107I/Y127E/R175E,T52V/V107I/R175E,V96A/V107I/R175E,T52A/V107I/R175E,V96T/V107I/R175E或V107I/A110P/R75E取代突变,b)SEQ IDNO:18的A107P,G121R,G121L,N213A,C217A或C217S取代突变,以及c)SEQ ID NO:19的G91A或A105P取代突变。
在本发明的一些实施方式中,类视黄醇X受体多肽包含选自下组的多肽:脊椎动物类维生素X受体多肽,无脊椎动物类维生素X受体多肽(USP)和包含来自脊椎动物和无脊椎动物RXR的多肽片段的嵌合类视黄醇X多肽。
在本发明的某些实施方式中,嵌合类视黄醇X受体多肽包含至少两种不同的类视黄醇X受体多肽片段,其选自脊椎动物类视黄醇X受体多肽片段,无脊椎动物类视黄醇X受体多肽片段,和非双翅目/非鳞翅目无脊椎动物物种类视黄醇X受体多肽片段。
在本发明的一些实施方式中,嵌合类视黄醇X受体多肽包含类视黄酸X受体多肽,其包含至少一种类视黄醇X受体多肽片段,其选自EF结构域螺旋1,EF结构域螺旋2,EF结构域螺旋3,EF结构域螺旋4,EF结构域螺旋5,EF结构域螺旋6,EF结构域螺旋7,EF结构域螺旋8,EF结构域螺旋9,EF结构域螺旋10,EF结构域螺旋11,EF结构域螺旋12,F结构域和EF结构域β-折叠,其中类视黄醇X受体多肽片段来自不同物种的类视黄醇X受体多肽或与第二类视黄醇X受体多肽片段不同的同种型类视黄醇X受体多肽。
在本发明的某些实施方式中,嵌合类视黄醇X受体多肽由包含下述核酸序列的多核苷酸编码:a)SEQ ID NO:11,b)SEQ ID NO:12的核苷酸1-348和SEQ ID NO:13的核苷酸268-630,c)SEQ ID NO:12的核苷酸1-408和SEQ ID NO:13的核苷酸337-630,d)SEQ ID NO:12的核苷酸1465和SEQ ID NO:13的核苷酸403-630,e)SEQ ID NO:12的核苷酸1-555和SEQID NO:13的核苷酸490-630,f)SEQ ID NO:12的核苷酸1-624和SEQ ID NO:13的核苷酸547-630,g)SEQ ID NO:12的核苷酸1-645和SEQ ID NO:13的核苷酸601-630,和h)SEQ ID NO:12的核苷酸1-717,SEQ ID NO:13的核苷酸613-630,或编码与其基本相同的功能变体的多核苷酸。
在本发明的一些实施方式中,嵌合类视黄醇X多肽包含以下的多肽序列:a)SEQ IDNO:14,b)SEQ ID NO:15的氨基酸1-116和SEQ ID NO:16的氨基酸90-210,c)SEQ ID NO:15的氨基酸1-136和SEQ ID NO:16的氨基酸113-210,d)SEQ ID NO:15的氨基酸1-155和SEQID NO:16的氨基酸135-210,e)SEQ ID NO:15的氨基酸1-185和SEQ ID NO:16的氨基酸164-210,f)SEQ ID NO:15的氨基酸1-208和SEQ ID NO:16的氨基酸183-210,g)SEQ ID NO:15的氨基酸1-215和SEQ ID NO:16的氨基酸201-210,以及h)SEQ ID NO:15的氨基酸1-239,SEQID NO:16的氨基酸205-210,或与其基本相同的多肽序列。
在本发明的某些实施方式中,第一和第二多肽或LIPC系统的一个或两个其它异源序列包含跨膜结构域。
在本发明的某些实施方式中,第一和第二多肽或LIPC系统的至少一个跨膜结构域是单次I型跨膜。
在本发明的某些实施方式中,LIPC组分与异源多肽融合,所述异源多肽在配体诱导的二聚化时导致或产生细胞死亡或无反应;这样的系统可以被称为“自杀”或“杀死”开关。
在一些实施方式中,本发明包括分离的多核苷酸,其包含编码本文所述的第一或第二多肽的多核苷酸序列。
在某些实施方式中,本发明包括包含编码第一多肽的核苷酸序列的第一多核苷酸和包含编码本文所述的第二多肽的核苷酸序列的第二多核苷酸。
在一些实施方式中,本发明包括包含上述多核苷酸中的任一种的载体。在某些实施方式中,本发明包含同时包含本文所述的第一和第二多核苷酸的载体。在一些实施方式中,本发明的载体是表达载体。
在某些实施方式中,本发明包括包含上述任一载体的宿主细胞。在一些实施方式中,宿主细胞是哺乳动物T细胞。在某些实施方式中,宿主细胞是人类T细胞。
在一些实施方式中,本发明包括诱导细胞信号转导的方法,包括引入本文所述的第一和第二多肽,LIPC系统,多核苷酸和/或任何载体并使宿主细胞与激活配体接触。
在本发明的某些实施方式中,本文所述的第一和第二多肽,LIPC系统,多核苷酸,载体和/或方法的激活配体是:
a)下式的化合物:
其中:
E是含叔碳的(C4-C6)烷基或含叔碳的氰基(C3-C5)烷基;R1是H、Me、Et、i-Pr、F、甲酰基、CF3、CHF2、CHCl2、CH2F、CH2Cl、CH2OH、CH2OMe、CH2CN、CN、C≡CH、1-丙炔基、2-丙炔基、乙烯基、OH、OMe、OEt、环丙基、CF2CF3、CH=CHCN、烯丙基、叠氮基、SCN、或SCHF2
R2是H、Me、Et、n-Pr、i-Pr、甲酰基、CF3、CHF2、CHCl2、CH2F、CH2Cl、CH2OH、CH2OMe、CH2CN、CN、C≡CH、1-丙炔基、2-丙炔基、乙烯基、Ac、F、Cl、OH、OMe、OEt、O-n-Pr、OAc、NMe2、NEt2、SMe、Set、SOCF3、OCF2CF2H、COEt、环丙基、CF2CF3、CH=CHCN、烯丙基、叠氮基、OCF3、OCHF2、O-i-Pr、SCN、SCHF2、SOMe、NH-CN,或与R3以及R2和R3接合的苯基碳连接以形成亚乙基二氧基,与苯基碳相邻的氧形成二氢呋喃环,或与苯基碳相邻的氧形成二氢吡喃环;
R3是H、Et,或与R2以及R2和R3接合的苯基碳连接以形成亚乙基二氧基,与苯基碳相邻的氧形成二氢呋喃环,或与苯基碳相邻的氧形成二氢吡喃环;
R4、R5、和R6独立地是H、Me、Et、F、Cl、Br、甲酰基、CF3、CHF2、CHCl2、CH2F、CH2Cl、CH2OH、CN、C≡CH、1-丙炔基、2-丙炔基、乙烯基、OMe、OEt、SMe、或Set;或
b)蜕皮激素、20-羟基蜕皮激素、松甾酮A、莫瑞甾酮A、氧甾醇、22(R)羟基胆甾醇、24(S)羟基胆甾醇、25-环氧胆固醇、T0901317、5-α-6-α-环氧胆固醇-3-硫酸盐、7-酮胆固醇-3-硫酸盐、金合欢醇、胆酸、1,1-二膦酸酯、或保幼激素III。
在本发明的某些实施方式中,本文所述的第一和第二多肽,LIPC系统,多核苷酸,载体和/或方法的激活配体是具有下式的化合物:
或者
其中R1、R2、R3和R4是:a)H,(C1-C6)烷基;(C1-C6)卤代烷基;(C1-C6)氰基烷基;(C1-C6)羟基烷基;(C1-C4)烷氧基(C1-C6)烷基;任选地被卤素、氰基、羟基或(C1-C4)烷基取代的(C2-C6)烯基;任选地被卤素、氰基、羟基或(C1-C4)烷基取代的(C2-C6)炔基;任选地被卤素、氰基、羟基或(C1-C4)烷基取代的(C3-C5)环烷基;或b)未取代或取代的苄基,其中取代基独立地是1至5H、卤素、硝基、氰基、羟基、(C1-C6)烷基、或(C1-C6)烷氧基;并且
R5是H;OH;F;Cl;或(C1-C6)烷氧基;
前提是:当R1、R2、R3、和R4是异丙基时,R5不是羟基;
当R5是H、羟基、甲氧基或氟时,R1、R2、R3、和R4中的至少一个不是H;
当R1、R2、R3、和R4中仅一个是甲基,并且R5是H或羟基时,其余的R1、R2、R3、和R4不是H;
当R4以及R1、R2、和R3之一都是甲基时,R5不是H或羟基;
当R1、R2、R3、和R4都是甲基时,R5不是羟基;
当R1、R2、和R3都是H并且R5是羟基时,R4不是乙基、正丙基、正丁基、烯丙基、或苄基。
在本发明的某些实施方式中,本文所述的第一和第二多肽,LIPC系统,多核苷酸,载体和/或方法的激活配体是具有下式的化合物:
其中X和X′独立地是O或S;
Y是:
(a)取代或未取代的苯基,其中取代基独立地是1-5H、(C1-C4)烷基、(C1-C4)烷氧基、(C2-C4)烯基、卤素(F,Cl,Br,I)、(C1-C4)卤代烷基、羟基、氨基、氰基、或硝基;或
(b)取代或未取代的2-吡啶基、3-吡啶基、或4-吡啶基,其中取代基独立地是1-4H、(C1-C4)烷基、(C1-C4)烷氧基、(C2-C4)烯基、卤素(F,Cl,Br,I)、(C1-C4)卤代烷基、羟基、氨基、氰基、或硝基;
R1和R2独立地是:H;氰基;氰基取代或未取代的(C1-C7)支链或直链烷基;氰基取代或未取代的(C2-C7)支链或直链烯基;氰基取代或未取代的(C3-C7)支链或直链烯基烷基;或R1和R2的价态一起形成(C1-C7)氰基取代或未取代的亚烷基(RaRbC=)其中Ra和Rb中非取代碳的总和为0-6;
R3是H、甲基、乙基、正丙基、异丙基、或氰基;
R4、R7、和R8独立地是:H、(C1-C4)烷基、(C1-C4)烷氧基、(C2-C4)烯基、卤素(F,Cl,Br,I)、(C1-C4)卤代烷基、羟基、氨基、氰基、或硝基;并且
R5和R6独立地是:H、(C1-C4)烷基、(C2-C4)烯基、(C3-C4)烯基烷基、卤素(F,Cl,Br,I)、C1-C4卤代烷基、(C1-C4)烷氧基、羟基、氨基、氰基、硝基,或一起以(-OCHR9CHR10O-)型连接和与它们所接合的苯基碳形成环;其中R9和R10独立地是:H、卤素、(C1-C3)烷基、(C2-C3)烯基、(C1-C3)烷氧基(C1-C3)烷基、苯甲酰基氧基(C1-C3)烷基、羟基(C1-C3)烷基、卤代(C1-C3)烷基、甲酰基、甲酰基(C1-C3)烷基、氰基、氰基(C1-C3)烷基、羧基、羧基(C1-C3)烷基、(C1-C3)烷氧基羰基(C1-C3)烷基、(C1-C3)烷基羰基(C1-C3)烷基、(C1-C3)烷酰氧基(C1-C3)烷基、氨基(C1-C3)烷基、(C1-C3)烷基氨基(C1-C3)烷基(-(CH2)nRcRe)、肟(-CH=NOH)、肟(C1-C3)烷基、(C1-C3)链肟(alkoximo)(-C=NORd)、链肟(C1-C3)烷基、(C1-C3)甲酰胺基(-C(O)NReRf)、(C1-C3)甲酰胺基(C1-C3)烷基、(C1-C3)脲氨基(-C=NNHC(O)NReRf)、脲氨基(C1-C3)烷基、氨基羰氧基(-OC(O)NHRg)、氨基羰氧基(C1-C3)烷基、五氟苯氧基羰基、五氟苯氧基羰基(C1-C3)烷基、对-甲苯磺酰氧基(C1-C3)烷基、芳基磺酰氧基(C1-C3)烷基、(C1-C3)硫代(C1-C3)烷基、(C1-C3)烷基亚砜基(C1-C3)烷基、(C1-C3)烷基磺酰基(C1-C3)烷基、或(C1-C5)三取代-甲硅烷氧基(C1-C3)烷基(-(CH2)nSiORdReRg);其中n=1-3,Rc和Rd表示所示长度的直链或支链烃链,Re,Rf表示H或所示长度的直链或支链烃链,Rg表示任选地被卤素或(C1-C3)烷基取代的(C1-C3)烷基或芳基,并且Rc、Rd、Re、Rf、和Rg互相独立;
前提是:
i)当R9和R10都是H时,或
ii)当R9或R10是卤素、(C1-C3)烷基、(C1-C3)烷氧基(C1-C3)烷基、或苯甲酰氧基(C1-C3)烷基时,或
iii)当R5和R6不一起形成(-OCHR9CHR10O-)型连接时,
基团R1或R2的任一或两者的碳原子的数量,排除氰基取代的那些,超过4,并且基团R1、R2、和R3的总和的碳原子的数量,排除氰基取代的那些,是10、11或12。
附图简要说明
当考虑附图及相应详细描述时,可以更完整地理解本发明。附图所示实施方式仅仅是举例说明发明,不应考虑为将发明限制于所示实施方式。其他实施方式和配置可提供其他有用的实施方式。
图1:示出使用EcR和RXR组件的示例性转录开关的配置和操作模式的示意图。
图2:配体诱导型多肽耦合器(LIPC)组分的概念的示意图。在激活配体的存在下,EcR和RXR组分缔合,导致融合组分(例如,信号传导分子,信号传导结构域,互补蛋白质片段和蛋白质亚基)的缔合。
图3:示出配体诱导型多肽耦合器(LIPC)系统的示意图,其中细胞内EcR和RXR组分通过跨膜结构域融合到细胞外组分(例如,信号传导分子或结构域)。在配体存在下,EcR和RXR组分缔合,导致细胞外融合组分的缔合。
图4A和4B:示出配体诱导型多肽耦合器(LIPC)系统的示意图,其中细胞外EcR和RXR组分通过跨膜结构域融合到细胞内组分(例如,信号传导分子或结构域)(图4A)。在配体存在下,EcR和RXR组分缔合,导致细胞内融合组分的缔合。示出配体诱导型多肽耦合器(LIPC)系统的示意图,其中细胞内EcR和RXR组分系连至膜并且融合到细胞内组分(例如,信号传导分子或结构域)(图4B)。在配体存在下,EcR和RXR组分缔合,导致细胞内融合组分的缔合。
图5:示出配体诱导型多肽耦合器(LIPC)系统的示意图,其中EcR或RXR组分系连至膜,而另一种互补成分在胞质中游离。在配体存在下,膜系连的EcR或RXR组分与胞质EcR或RXR组分缔合,导致融合组分(例如,信号传导分子或结构域)的缔合。
图6:分裂荧光素酶(fLuc)配体诱导型多肽耦合器(LIPC)系统的示意图。只有在配体的存在下,EcR和RXR组分缔合,促进分裂fLuc的缔合和随后的活性。
图7:证明本文所述的配体诱导型多肽耦合器(LIPC)仅在激活配体存在下驱动分裂fLuc信号的数据。
图8:用于构建如本文所述的配体诱导型多肽耦合器(LIPC)系统的示例性构建体的示意图。
图9:使用Veledimex配体的RxR_Nluc+Cluc_EcR和EcR_Nluc+Cluc_RxR的配体剂量反应曲线。
图10:使用Veledimex配体的RxR_Nluc+Cluc_EcR和EcR_Nluc+Cluc_RxR的配体剂量反应曲线。
图11:通过Veledimex配体诱导EcR二聚化。
图12:通过Veledimex配体诱导EcR二聚化。
具体实施方式
本文提供的发明使用EcR-RXR转录开关系统的组件(参见例如PCT公开号WO 2001/070816,WO 2002/066612,WO 2002/066613,WO 2002/066614,WO2002/066615,WO 2003/027266,WO 2003/027289和WO 2005/108617,其各自通过引用纳入本文),其可以在宿主细胞中表达或由宿主细胞表达以控制、调节或调整融合蛋白组分的缔合。蛋白质-蛋白质相互作用的一个作用是启动细胞信号转导过程,例如通过激活胞质和/或细胞外信号传导结构域或通过受体-配体结合相互作用恢复片段化或分裂的蛋白质功能。因此,这种天然存在的系统可以通过在EcR和RXR组分(存在EcR配体)之间诱导形成“桥”驱动两个不活跃的信号传导结构域的缔合而被人为地调节,其中后一个组分已被并入(即,融合)信号传导结构域多肽。
在某些实施方式中,本文描述了与通过配体诱导的多肽耦合选择性激活细胞信号传导结构域有关的系统和方法。所述系统和方法提供配体诱导的多肽耦合系统,其允许诱导蛋白质-蛋白质相互作用(例如,调节,控制,调控)和(“根据需要”)激活信号传导结构域或失活/抑制信号传导结构域。
因此,本文公开的是使用基因转录开关系统的蛋白质组分(在宿主细胞表达)用于诱导彼此物理缔合(通过激活配体)以形成其他相关蛋白或结构域的复合物(即,诱导蛋白质-蛋白质相互作用)的系统和方法。配体诱导的蛋白质缔合可以例如引发功能,例如在激活配体存在下激活胞质和/或细胞外信号传导结构域。因此,在激活配体的存在下,通常通过EcR和USP/RXR组分之间的“桥”将它们桥连在一起可以激活通常无活性的两个信号传导结构域。
术语“一种”或“一个”当与“包含”在权利要求和说明书中联用时,可表示“一个”,但也与“一个或多个”,“至少一个”和“一个或多于一个”的意思一致。
使用术语“例如”及其相应缩写“例”(无论是否斜体)表示特定术语仅是代表性的示例(即,试样、样品、说明、模型等)并且本发明的实施方式比并不旨在限于所引用或参考的具体实施例,除非另有明确说明。
当在本文中用于提及基因或多肽组分(除非另有说明)时,正斜线字符(“/”)是词“和/或”的缩写。例如,除非另有说明,术语“USP/RXR”表示可以具有USP和RXR多肽或其片段(例如,嵌合多肽),或仅USP多肽组分或其片段(例如,结构域)的混合物,或仅RXR组分或其残基(例如,结构域)。
如本说明书和权利要求中所使用的,词语“包含”(和任何形式的包含,例如“含有”和“含”),“具有”(以及任何形式的具有,例如“有”和“拥有”),“包括”(以及任何形式的“包括”,例如“囊括”和“括入”)或“含有”(以及任何形式的含有,例如“含”和“包含”)都是纳入性或开放性的,并不排除额外的未提到的元素或方法步骤。考虑本说明书中所讨论的任何实施方式可以用任何本发明的方法、系统、宿主细胞、表达载体或组合物实现,反之亦然。此外,本发明的系统、宿主细胞、表达载体和/或组合物可用于实现本发明的方法。
本文所用的“合成”是指通过人类施为的化学过程形成的化合物,而不是天然来源的化合物。
“分离的”是指从其天然环境中去除核酸、肽或多肽。“纯化的”是指给定的核酸,无论是从自然界(包括基因组DNA和mRNA)还是合成的(包括cDNA)中被除去和/或在实验室条件下扩增的核酸,肽或多肽已经增加了纯度,其中“纯度”是相对术语,而不是“绝对纯度”。然而,应当理解,核酸、肽和多肽可以用稀释剂或佐剂配制,并且仍然出于实际目的被分离。例如,当用于引入细胞时,核酸通常与可接受的运载体或稀释剂混合。
“核酸”是由称为核苷酸的共价连接的亚基组成的聚合物。核酸包括多核糖核酸(RNA)和多脱氧核糖核酸(DNA),它们都可以是单链或双链的。DNA包括但不限于cDNA、基因组DNA、质粒DNA、合成DNA和半合成DNA。DNA可以是线性的、圆形的或超螺旋的。
“核酸分子”是指核糖核苷(腺苷、鸟苷、尿苷或胞苷;“RNA分子”)或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷或脱氧胞苷;“DNA分子”)的磷酸酯聚合形式,或其采用单链形式或双链螺旋的任何磷酸酯类似物,如硫代磷酸酯和硫酯。双链DNA-DNA、DNA-RNA和RNA-RNA螺旋是可能的。术语核酸分子且特别是DNA或RNA分子,仅仅指分子的一级和二级结构,不限于任何特定三级形式。因此,该术语包含特别是在线状或环状DNA分子(如限制性片段)、质粒、和染色体等中发现的双链DNA。当讨论特定双链DNA分子的结构时,本文可以按常规惯例描述序列,仅沿非转录的DNA链(即具有mRNA互补序列的链)以5′到3′方向显示序列。“重组DNA分子”是经过分子生物学操作的DNA分子。
用于多核苷酸序列的术语“片段”将理解为表示相对于参照核酸长度减少的核苷酸序列,在所述共有部分包含与参照核酸相同的核苷酸序列。就本发明而言,这种核酸片段可合适地包含在其作为组分的更大多核苷酸中。这样的片段包含,或者由以下组成:长度为至少6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、105、110、120、125、130、135、140、145、150、200、300、400、500、600、700、800、900、1000、1250、1500、2000、2500、3000、3500、4000、4500、5000或6000个本发明的核酸的连续核苷酸的寡核苷酸。在某些实施方式中,这样的片段可包含长度范围为6至6,000个核苷酸的任何整数的寡核苷酸,或由其组成。在某些实施方式中,这样的片段可以是长度上可以被3整除的任何整数(例如,使得多核苷酸编码全部或部分多肽开放阅读框)。在某些实施方式中,这些部分多肽片段可以是任何整数长度(例如,使得多核苷酸可以用作PCR引物或其他可杂交的片段或用于产生合成或限制性片段长度多核苷酸)。
本文使用的“分离核酸片段”是单或双链的RNA或DNA聚合物,可选包含合成、非天然或改变的核苷酸碱基。DNA聚合物形式的经分离核酸片段可包含一个或多个区段的cDNA、基因组DNA或合成DNA。
“基因”是指编码多肽的核苷酸的组合,并且包括cDNA和基因组DNA核酸。“基因”也指表达特定蛋白或多肽的核酸片段,包含所述编码序列之前(5′非编码序列)和之后(3′非编码序列)的调节序列。“天然基因”指自然存在且具有自身调控序列的基因。“嵌合基因”指作为非天然基因的任何基因,包含未天然一起发现的调节和/或编码序列。因此,嵌合基因可能包含获自不同来源的调节序列和编码序列,或获自相同来源但是与天然发现方式不同排列的调节序列和编码序列。嵌合基因可能包含获自不同来源的编码序列和/或获自不同来源的调节序列。“内源基因”指在生物体基因组中天然定位的天然基因。“外来”基因或“异源”基因指在宿主生物体或细胞内正常未发现,但是通过基因转移引入宿主生物体或细胞的基因。外来基因可包含但不限于插入到非天然生物体的天然基因或嵌合基因。“转基因”是已被引入宿主生物体或细胞基因组的外来或异源基因。“异源性DNA”指不是天然定位到所述细胞或细胞基因组的染色体位点的DNA。在一些实施方式中,异源DNA包含对细胞外来的基因。
本文所用的“多核苷酸”或“寡核苷酸”是指任何长度的核苷酸(核糖核苷酸或脱氧核糖核苷酸)的聚合形式。该术语仅指该分子的一级结构。因此,该术语包括双链和单链DNA,三链DNA以及双链和单链RNA。其还包括例如通过甲基化和/或通过加帽和未修饰形式的多核苷酸进行修饰。该术语还旨在包括含非天然存在或合成核苷酸以及核苷酸类似物的分子。在某些实施方式中,寡核苷酸可与基因组DNA分子、cDNA分子、质粒DNA或mRNA分子杂交。寡核苷酸能用例如32P核苷酸或共价偶联标记如生物素的核苷酸来标记。在一些实施方式中,标记的寡核苷酸可用作探针以检测核酸的存在。寡核苷酸(二者之一或都可以被标记)能用作PCR引物以克隆全长或核酸片段,或检测核酸的出现。也可以使用寡核苷酸与DNA分子形成三螺旋。在某些实施方式中,合成制备寡核苷酸,例如,在核酸合成仪上。因此,寡核苷酸能用非天然产生的磷酸酯类似物键例如硫酯键等制备。
当核酸和/或核酸序列从共同的祖先核酸或核酸序列天然或人工衍生时,它们是“同源的”。当编码DNA从共同的祖先核酸或核酸序列天然或人工衍生时,蛋白质和/或蛋白质序列是同源的。同源分子可以称为同源物。例如,如本文所述的任何天然存在的蛋白质可以通过任何可用的诱变方法进行修饰。当表达时,该诱变的核酸编码与由原始核酸编码的蛋白质同源的多肽。同源性通常从两个或多个核酸或蛋白质(或其序列)之间的序列相同性推导。用于建立同源性的序列之间的相同性的确切百分比随着所涉及的核酸和蛋白质而变化,但通常使用少至25%的序列相同性来建立同源性。更高水平的序列相同性,例如,30%,40%,50%,60%,70%,80%,90%,95%或99%或更高,也可用于建立同源性。用于确定序列相同性百分比的方法(例如,使用默认参数的BLASTP和BLASTN)在本文中描述并且通常是可用的。
DNA“编码序列”是双链DNA序列,当被置于适当调节序列的控制下时,其在体外或体内转录并翻译为细胞中的多肽。“合适的调控序列”指位于编码序列上游(5’非编码序列)、之内或下游(3’非编码序列)的核苷酸序列,其影响相关编码序列的转录、RNA加工或稳定性、或翻译。调控序列可包含启动子、翻译前导序列、内含子、聚腺苷酸识别序列、RNA加工位点、效应物结合位点和茎环结构。编码序列的边界由5’(氨基)末端的起始密码子和3’(羧基)末端的翻译终止密码子确定。编码序列可包括但不限于,原核序列、来自mRNA的cDNA、基因组DNA序列和合成DNA序列。如果所述编码序列意在用于真核细胞中的表达,聚腺苷酸化信号和转录终止序列常位于该编码序列的3’。
“开放阅读框”缩写为ORF,指包含翻译起始信号或起始密码子如ATG或AUG和终止密码子并且能潜在翻译成多肽序列的某一核酸序列(DNA、cDNA或RNA)长度。
“同源重组”指将外源DNA序列插入另一个DNA分子中,例如将载体插入染色体中。在一些实施方式中,所述载体靶向用于同源重组的特定染色体位点。对特异性同源重组而言,所述载体会包含足够长的与染色体序列同源区域以使载体与染色体互补结合并纳入其中。更长的同源区域和更高的序列相似性程度可以增加同源重组的效率。
“载体”或“表达载体”指用于克隆和/或转移核酸到宿主细胞的任何形态。载体可以是连接另一DNA区段的复制子,以实现所连接区段的复制。“复制子”是在细胞中用作DNA自主复制单位的任何遗传元件(例如质粒、噬菌体、粘粒、染色体、病毒)。术语“载体”包含体外、离体或体内引入核酸到细胞的病毒和非病毒手段。
术语“质粒”指通常载有不是细胞中心代谢部分的基因的染色体外元件,且可以呈环状双链DNA分子的形式。这些元件可以是自主复制序列、基因整合序列、噬菌体或核苷酸序列、线性、环状或超螺旋的单链或双链DNA或RNA,源自任何来源,其中大量核苷酸序列已连接或重组入能够将选定基因产物的启动子片段和DNA序列与合适的3’未翻译序列引入细胞的独特结构。
载体可以通过本领域已知的方式引入所需的宿主细胞,例如转染、电穿孔、显微注射、转导、细胞融合、DEAE右旋糖苷、磷酸钙沉淀、脂质转染(溶酶体融合)、利用基因枪、或DNA载体转运子(参见例如,Wu等,1992,J.Biol.Chem.267:963-967;Wu和Wu,1988,J.Biol.Chem.263:14621-14624;和Hartmut等,1990年3月15日提交的加拿大专利申请号2,012,311,其各自全部内容通过引用并入本文)。
还可能在体内引入作为裸DNA质粒的载体(参见例如,美国专利5,693,622、5,589,466和5,580,859,其各自通过引用全文纳入本文)。还可以使用受体介导的DNA递送方法(参见例如,Curel等,1992,Hum.Gene Ther 3:147-154;和Wu和Wu,1987,J.Biol.Chem 262:4429-4432,其各自的全部内容通过引用纳入本文)。
术语“转染”指细胞摄入外源或异源RNA或DNA。当这种RNA或DNA引入到细胞内时,细胞被外源或异源RNA或DNA“转染”。当转染的RNA或DNA影响表型改变时,细胞被外源或异源RNA或DNA“转化”。转化RNA或DNA能整合(共价连接)到构成所述细胞基因组的染色体DNA中。
“转化”指将核酸片段转移到宿主生物的基因组中,产生遗传上稳定的遗传。包含转化核酸片段的宿主生物称为“转基因”或“重组”或“转化”生物。
术语“选择标记”指能基于标记基因效果来选择的鉴定因子,通常是抗生素或化学抗性基因,所述效果即耐受抗生素、耐受除草剂、比色标记物、酶、荧光标记物等,其中所述效果用于追踪感兴趣核酸的遗传和/或鉴定遗传所述感兴趣核酸的细胞或生物。本领域已知和使用的可选择标记基因的实例包括但不限于:对氨苄青霉素,链霉素,庆大霉素,卡那霉素,潮霉素,双丙二酸除草剂,磺酰胺等提供抗性的基因;以及用作表型标记的基因,例如花青素调节基因,异戊烷转移酶基因等。
术语“报道基因”指编码能基于报道基因效果分辨的鉴定因子的核酸,其中所述效果用于追踪感兴趣核酸的遗传,鉴定遗传有感兴趣核酸的细胞或生物,和/或测量基因表达诱导或转录。本领域已知和使用的报告基因的实例包括但不限于:荧光素酶(Luc),绿色荧光蛋白(GFP),氯霉素乙酰转移酶(CAT),β-半乳糖苷酶(LacZ),β-葡糖苷酸酶(Gus)等。选择标记基因也可视作报道基因。
本文所用的“可操作地连接”是指DNA区段与另一DNA区段的物理和/或功能连接,以允许该区段以其预期的方式起作用。当编码基因产物的DNA序列与调节序列(例如启动子,增强子和/或沉默子)以允许调节DNA序列的转录的方式直接或间接连接时,其与调控序列可操作地连接。例如,当DNA序列相对于启动子的转录起始位点在正确的阅读框架中,当连接到启动子的转录起始位点下游的启动子并允许转录延伸进行通过DNA序列时,DNA序列可操作地连接到启动子上。当增强子或沉默子以分别增加或减少DNA序列转录的方式连接到DNA序列时,其与编码基因产物的DNA序列可操作地连接。增强子和沉默子可以位于DNA序列的编码区的上游、下游或包埋其中。如果信号序列被表达为参与多肽分泌的前蛋白,则信号序列的DNA可操作地连接到编码多肽的DNA。术语“盒”、“表达盒”和“基因表达盒”指能够(例如,特定限制位点或者通过同源重组)插入核酸或多核苷酸的DNA区段。该DNA区段可包括编码感兴趣多肽的多核苷酸,并且盒和限制位点可设计成能够确保所述盒插入适当阅读框进行转录和翻译。“转化盒”指包含编码感兴趣多肽的多核苷酸并具有除有利于特定宿主细胞转化的多核苷酸之外元件的载体。本发明的盒、表达盒、基因表达盒和转化盒也可以包含使宿主细胞中编码感兴趣多肽的多核苷酸表达增强的元件。这些元件包括但不限于:启动子、最小启动子、增强子、响应元件、终止子序列、聚腺苷酸化序列等。“调节区”指调节第二核酸序列表达的核酸序列。调节区可以包含天然负责特定核酸表达的序列(同源区域),或可以包含负责表达不同蛋白质或甚至合成蛋白质的不同起源序列(异源区域)。特别地,所述序列能是原核、真核或病毒基因序列,或以特定或非特定方式和诱导或非诱导方式刺激或抑制基因转录的衍生序列。调节区包含复制起点、RNA剪接位点、启动子、增强子、转录终止序列和指导多肽到靶标细胞中分泌通路的信号序列。来自“异源来源”的调节区指与所表达核酸不是天然相关的调节区。异源调节区中包括来自不同物种的调节区,来自不同基因的调节区,杂交调控序列和自然界中不存在的调控序列。
“肽”在本文中用于指在链中连接的含有两个或更多个氨基酸残基的化合物。“多肽”是由共价连接的氨基酸残基组成的聚合物。氨基酸具有以下一般结构:
基于侧链R将氨基酸分为七组:(1)脂肪族侧链,(2)含有羟基(OH)基团的侧链,(3)含有硫原子的侧链,(4)含有酸性或酰胺基团的侧链,(5)含有碱性基团的侧链,(6)含有芳环的侧链,和(7)脯氨酸,侧链与氨基稠合的亚氨基酸。
“蛋白质”包括多肽。“分离的多肽”或“分离的蛋白质”指基本不含与其天然状态正常相关的那些化合物(例如其它蛋白质或多肽、核酸、糖、脂质)的多肽或蛋白质。“分离的”并不意味着排除有其它化合物的人工或合成混合物或者出现杂质,所述杂质不干扰生物功能并且可以是例如归因于不完全纯化、加入稳定剂或复合入药学上可接受制剂。
本文所用的“取代突变体多肽”或“取代突变体”是指包含约或至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或更多个用相对于野生型或天然存在的多肽不同的氨基酸取代的野生型或天然存在的氨基酸,或由其组成的多肽。与野生型或天然存在的多肽相比,取代突变体多肽可以仅包含一个(1)氨基酸取代,并且可以称为“点突变体”或“单点突变体”多肽。
当取代突变体多肽包含一个(1)或更多个野生型或天然存在的氨基酸的取代或由其组成时,该取代可以包含或由等量的野生型或天然存在的氨基为取代而删除的酸,即被两个非野生型或非天然存在的氨基酸取代的两个野生型或天然存在的氨基酸,或为取代缺失的非等价数量的野生型氨基酸,例如用一个非野生型氨基酸(取代+缺失突变)取代的两个野生型氨基酸,或被三个非野生型氨基酸取代的两个野生型氨基酸(取代+插入突变)。取代突变体可以使用缩写术语系统描述以指示在参照多肽序列内取代的氨基酸残基和数目和新取代的氨基酸残基。例如,其中多肽的第二十(20)个氨基酸残基被取代的取代突变体可以缩写为“x20z”,其中“x”是待替代的母体,正常存在或天然存在的氨基酸,“20”是多肽中引用的氨基酸残基位置或数字,“z”是新取代的氨基酸。因此,互换缩写成“E20A”或“Glu20Ala”的取代突变体指示包含多肽位置20处丙氨酸残基(本领域通常缩写成“A”或“Ala”)取代谷氨酸(本领域通常缩写成“E”或“Glu”)的突变体。
“片段”当与多肽相关地使用时,是指其氨基酸序列短于参考多肽的氨基酸序列的多肽,并且其包含或组成在参考多肽的整个部分上,相同的氨基酸序列(除非另有明确说明,例如“与...有95%相同的片段”)。合适时,这些片段可以包含在其作为一部分的更大多肽中。本发明的多肽的这样的片段可包含长度为至少4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、105、110、120、125、130、135、140、145、150、200、300、400、500、600、700、800、900、1000、1250、1500、2000、2500、3000、3500、4000、4500、或5000个氨基酸残基的聚合物,或由其组成。在某些实施方式中,这样的片段可以包含长度范围为例如4至5,000的任何整数个残基的氨基酸聚合物(即肽,多肽)或者由其组成。
当与多肽相关地使用时,“截断”或“截短”是与参考多肽(例如,可能由氨基酸残基的删除或酶加工产生)相比氨基酸序列较短的多肽片段(在N-末端,C-末端或者N-和C-末端)。
多肽或蛋白质的“变体”是衍生自或不同于相似多肽或蛋白质但是保留原始或参考多肽或蛋白质的至少一种生物学特性的任何类似物、片段、截短、衍生物或突变体。多肽或蛋白质的不同变体可以天然存在。这些变体可以是天然存在的等位基因变异,其特征在于编码蛋白质的结构基因的核苷酸序列的差异,或者可能涉及差异剪接或翻译后修饰,或者可以人工(例如遗传,合成,重组)工程改造变体。技术人员能生成有单个或多个氨基酸取代、删除、加入或替换的变体。这些变体可以包括:(a)其中一个或多个氨基酸残基被保守或非保守氨基酸取代的变体,(b)其中一个或多个氨基酸加入到多肽或蛋白质中的变体,(c)其中一个或多个氨基酸包括取代基团的变体,和/或(d)其中多肽或蛋白质与另一多肽融合的变体。获得这些变体的技术包括遗传学(抑制、删除、突变等)、化学和酶学技术,所述技术为本领域普通技术人员已知。本文公开的蛋白质的“功能变体”或“功能片段”保留参考蛋白质的功能的至少一部分。例如,蛋白质的“功能变体”或“功能片段”可以保留至少约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%或约100%的比较的参考蛋白的生物活性或功能。此外,蛋白质的“功能变体”或“功能片段”可以,例如,包含每100个连续的氨基酸残基具有至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个保守氨基酸取代的参考蛋白质的氨基酸序列或由其组成。术语“保守氨基酸取代”或“保守突变”是指由具有共同性质(例如,疏水性,亲水性,离子电荷,碱性,酸性,极性,非极性等)的一个氨基酸替代另一个氨基酸。定义各个氨基酸之间共同特性的功能方法是分析同源生物体的相应蛋白质之间氨基酸变化的归一化频率(Schulz,G.E.和Schirmer,R.H.,《蛋白质结构原理》(Principles of Protein Structure),Springer-Verlag,纽约(1979),其通过引用全文纳入本文)。根据这样的分析,可以定义多组氨基酸,其中一组中的氨基酸彼此优先交换,并且因此在其对整个蛋白质结构的影响中彼此最相似(Schulz,G.E.和Schirmer,R.H.,同上)。保守突变的实例包括上述亚组中的氨基酸的氨基酸取代,例如用赖氨酸取代精氨酸,反之亦然,从而可以保持正电荷;用谷氨酸取代天冬氨酸,反之亦然,从而可以保持负电荷;用丝氨酸取代苏氨酸,从而可以保持游离的-OH;和用谷氨酰胺取代天冬酰胺,从而可以保持游离的-NH2。在某些情况下,优选保守氨基酸取代不干扰或抑制功能变体的生物活性。在一些情况下,保守氨基酸取代可以增强功能变体的生物活性,从而与母体分子相比,功能变体的生物活性增加。在其他情况下,保守取代可能需要干扰、消除或减少至少一种或多种生物活性。
或者或另外,功能变体可以包含具有至少一个非保守氨基酸取代的参考蛋白质的氨基酸序列或由其组成。“非保守突变”涉及不同组之间的氨基酸取代(即,其中原始和取代的AA具有不同的化学性质,例如涉及疏水性、亲水性、离子电荷、极性、非极性、酸性、碱性等的性质差异)。非保守取代的几个例子是,用赖氨酸(碱性)取代色氨酸(非极性)或谷氨酸(酸性),用天冬氨酸(酸性)取代酪氨酸(极性)或组氨酸(碱性),或者用苯丙氨酸(非极性)取代精氨酸(碱性)或丝氨酸(极性)等。在某些情况下,优选非保守氨基酸取代不干扰或抑制功能变体的生物活性。在一些情况下,非保守氨基酸取代可以增强功能变体的生物活性,从而与母体分子相比,功能变体的生物活性增加。在其他情况下,非保守取代可能需要干扰、消除或减少至少一种或多种生物活性。
“异源蛋白”是指在细胞中不天然产生的蛋白质。“成熟蛋白质”是指翻译后加工的多肽,即,已经除去存在于主要翻译产物中的任何前体肽或前肽。“前体”蛋白质是指mRNA翻译的主要产物,即仍然存在前体肽和前肽。前体肽和前肽可以是但不限于信号肽或细胞内定位信号。
术语“信号肽”是指分泌的成熟蛋白之前的氨基末端多肽。信号肽被切割并因此不存在于成熟蛋白质中。信号肽具有引导和转位分泌的蛋白质跨细胞膜的功能。信号肽也称为信号蛋白。
待在细胞表面上表达的蛋白质的编码序列的开始处包含“信号序列”。该序列编码成熟多肽的N末端的信号肽,其指导宿主细胞易位多肽。术语“易位信号序列”也可以用于指这种类型的信号序列。可以发现易位信号序列与真核生物和原核生物天然的多种蛋白质相关,并且在两种类型的生物体中通常是功能性的。
术语“同源性”指两个多核苷酸或两个多肽部分之间的相同性百分比。一个分子与另一个分子的序列之间的对应关系可以通过本领域已知的技术来确定。例如,可以通过比对序列信息并使用容易得到的计算机程序来直接比较两个多肽分子之间的序列信息来确定同源性。或者,测定同源性可以通过多核苷酸在允许同源区域间形成稳定双链体的条件下杂交,然后用单链特异性核酸酶消化并确定已消化片段的大小。
因此,其所有语法形式的术语“序列相似性”是指可能共享或可能不共享共同进化起源的蛋白质的核酸或氨基酸序列之间的相同性、同源性或对应性的程度(参见Reeck等,1987,Cell 50:667,其全部内容通过引用纳入本文)。在某些实施方式中,当至少约50%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约97%、至少约98%、至少约99%的核苷酸在DNA或氨基酸序列的限定长度上匹配时,两个DNA序列是“基本上同源的”或“基本上相似的”。基本上同源的序列可以通过使用序列数据库中可用的标准软件或在例如本领域普通技术人员所理解的严格条件下的Southern杂交实验中比较序列来鉴定。例如,严格的杂交条件可包括将任意靶,“探针”或检测试剂DNA在约45℃下杂交以6×氯化钠/柠檬酸钠(SSC)中过滤结合的DNA,随后通过在约50-65℃下在0.2×SSC,0.1%SDS中洗涤一次或多次),然后在约68℃下的0.1×SSC,0.2%SDS中洗涤一次或多次,或者由其组成;或者在本领域技术人员已知的其他严格杂交条件下(参见,例如,Ausubel,F.M.等编,1989《分子生物学实验指南》(Current Protocols in Molecular Biology),格林出版联合公司和约翰威立父子出版公司(Green publishing associates,Inc.,and John Wiley&SonsInc.),纽约,第6.3.1-6.3.6和2.10.3页)。本发明也包括编码这种多肽的多核苷酸。
在两个核酸序列或多肽的氨基酸序列的情况中,术语“相同”或“序列相同性”是指两个序列中的残基在相对于指定的比较窗的最大对应度下比对时相同。如本文所用的“比较窗”是指至少约10个,至少约20个,至少约50个,至少约100个,至少约200个,至少约300个,至少约500个,或至少约1000个残基的区段,其中序列可以与两个序列最佳比对后相同数目的连续位置的参考序列进行比较。比对序列的比较方法是本领域熟知的。用于比较的序列最佳比对可以通过Smith和Waterman(1981)Adv.Appl.Math.2:482的局部同源性算法进行,通过引用全文纳入本文;通过Needleman和Wunsch(1970)J.Mol.Biol.48:443的比对算法,通过引用全文纳入本文;通过Pearson和Lipman(1988)Proc.Nat.Acad.SciU.S.A.85:2444的相似性搜索法,通过引用全文纳入本文;通过计算机执行这些算法(包括,但不限于,加利福尼亚州芒廷维尤的智慧遗传公司(Intelligenetics,Mountain View,Calif.)的PC/Gene程序中的CLUSTAL,威斯康星遗传学软件包中的GAP、BESTFIT、FASTA和TFASTA,遗传学计算组(GCG),美国威斯康星州麦迪逊的科学路575号(575 Science Dr.,Madison,WI));CLUSTAL详细描述于Higgins和Sharp(1988)Gene 73:237-244以及Higgins和Sharp(1989)CABIOS 5:151-153;Corpet等,(1988)Nucleic Acids Res.16:10881-10890;Huang等,(1992)Computer Applications in the Biosciences8:155-165;和Pearson等,(1994)Methods in Molecular Biology 24:307-331,其各自全部内容通过引用纳入本文。除了基于计算机软件的对准外,还可以通过手动检查和手动比对进行比对。
在一类实施方式中,使用默认参数,多肽与参考多肽或其片段70%,至少70%,75%,至少75%,80%,至少80%,85%,至少85%,90%,至少90%,95%,至少95%,97%,至少97%,98%,至少98%,99%,或至少99%或100%相同(例如,通过BLASTP或CLUSTAL或其他比对软件测量)。类似地,核酸也可以参考起始核酸来描述,例如,它们可以是与参考核酸或其片段50%,至少50%,60%,至少60%,70%,至少70%,75%75%,80%,至少80%,85%,至少85%,90%,至少90%,95%,至少95%,97%,至少97%,98%,至少98%,99%,至少99%或100%相同(例如,通过BLASTN或CLUSTAL或使用默认参数的其他比对软件测量)。当一个分子被认为与较大分子具有一定百分比的序列相同性时,这意味着当两个分子是最佳比对时,较小分子中所述百分比的残基根据两个分子最佳比对的顺序在较大分子中找到匹配残基,并且根据较小分子的长度计算“%”(百分比)相同性。
术语“基本相同”适用于核酸或氨基酸序列,表示核酸或氨基酸序列包含与参考序列相比具有70%,至少70%,75%,至少75%,80%,至少80%,85%,至少85%,90%,至少90%,95%,至少95%,97%,至少97%,98%,至少98%,99%,或至少99%或100%的序列,或由其组成。如上所述,序列相同性可以例如使用本领域普通技术人员公知和常规使用的程序来计算。例如,BLASTN程序(对核苷酸序列而言)采用的默认值如下:字长(W)1,期望值(E)10,M=5,N=-4,以及比较两条链。就氨基酸序列而言,BLASTP程序使用默认参数,字长(W)3、期望值(E)10、使用BLOSUM62评分矩阵(参见Henikoff和Henikoff(1992)Proc NatlAcad Sci USA 89:10915(1989),其全部内容通过引用纳入本文)。序列相同性百分比通过在比较窗口中对比两种最佳比对序列而测定,其中比较窗口中多核苷酸序列的部分与参考序列(不含添加或缺失)相比可包含添加或缺失(即缺口)以最佳比对所述两种序列。该百分比如下计算:通过测定两种序列中出现相同核酸碱基或氨基酸残基的位置数产生匹配位置数,将该匹配位置数除以比较窗口中位置的总数,得到的结果乘以100产生序列相同性百分比。优选地,基本相同性存在于长度至少约10个、至少约20个、至少约50个、至少约100个、至少约200个、至少约300个、至少约500个、或至少约1000个残疾的序列的区域中。在最优选的实施方式中,序列在编码区的整个长度上基本相同。
本文公开的蛋白质(包括其功能部分及功能变体)可以包含合成氨基酸代替一种或多种天然存在的氨基酸。这样的合成氨基酸是本领域已知的,并且包括,例如但不限于氨基环己烷羧酸,正亮氨酸,α-氨基正癸酸,高丝氨酸,S-乙酰氨基甲基-半胱氨酸,反式-3-和反式-4-羟基苯丙氨酸,4-氨基苯丙氨酸,4-硝基苯丙氨酸,4-氯苯丙氨酸,4-羧基苯丙氨酸,β-苯基丝氨酸,β-羟基苯丙氨酸,苯基甘氨酸,α-萘基丙氨酸,环己基丙氨酸,环己基甘氨酸,二氢吲哚-2-羧酸,1,2,3,4-四氢异喹啉-3-羧酸,氨基马来酸,氨基马来酸单酰胺,N′-苄基-N′-甲基-赖氨酸,N′,N′-二苄基-赖氨酸,6-羟基赖氨酸,鸟氨酸,α-氨基环戊烷羧酸,α-氨基环己烷羧酸,α-氨基环庚烷羧酸,α-(2-氨基-2-降冰片烷)-羧酸,α,γ-二氨基丁酸,α,β-二氨基丙酸,高苯丙氨酸和α-叔丁基甘氨酸。
术语“基本上纯化的”是指核酸序列、多肽、蛋白质或其它化合物,基本上是不含,即不含超过约50%,不含超过约70%,不含超过约90%的,与该核酸、多肽、蛋白质或其他化合物天然相关的多核苷酸、蛋白质、多肽和其他分子。
可以使用本领域技术人员已知的方法化学合成的寡核苷酸构建块组装“合成基因”。将这些构建单元连接并退火以形成基因区段,然后将其酶促组装以构建整个基因。关于DNA序列的“化学合成”指体外组装的组分核苷酸。DNA的人工化学合成可以使用完善的过程完成。本领域技术人员想到如果密码子使用偏向于其表达的宿主细胞或生物体所偏爱的密码子,则增强基因表达的可能性。优选密码子的确定可以基于对从序列信息可得的宿主细胞衍生的基因的调查。
当针对多肽、核苷酸或其片段使用时,本文所用的术语“杂合体”是指多肽,多核苷酸或其片段,其氨基酸和/或核苷酸序列天然不存在。例如,两种异源蛋白质或多肽的融合蛋白或编码融合多肽的cDNA。
“配体诱导型多肽耦合器”在本文中可与“LIPC”互换使用,即“LIPC”可指“耦合器”(单数)或“耦合器”(复数)。如此,LIPC是指系统和该系统的多肽组分,其通过将核受体多肽组分并入融合蛋白(例如,使用的H组核受体和EcR受体多肽组分(例如,EcR多肽片段或结构域))中,以小分子配体依赖的方式在一起(“耦合”,即,寡聚化,二聚化);包括如本文所述的EcR配体结合多肽和核受体USP和/或RXR核受体多肽组分(例如,多肽片段或其结构域)。
激活配体的给予和LIPC组分的配置可用于调节二聚化和多肽偶联激活的时间和位置。LIPC依赖于由非宿主天然的基因编码,并且由异源序列编码的蛋白质因子。用于控制宿主系统中多肽组分的空间和时间关联的LIPC可以衍生自外来来源,例如细菌、酵母、植物、昆虫、或病毒。因此,LIPC核受体多肽组分通过提供控制LIPC组分“融合”(即,被工程化为融合蛋白)的多肽或蛋白质的缔合(例如,二聚化,寡聚化)的机制,在宿主中赋予效用。
也被称为“基因开关”或“转录开关”的“遗传开关”用于控制基因表达,并被人工设计用于故意调节转基因。基因开关通常编码可以调节其活性的反式激活物或反式抑制剂,以及用于控制感兴趣的基因的反式激活物反应性或反式抑制剂敏感的启动子。这些因子可以分别是配体反应性的,含有DNA结合结构域,配体结合结构域和转录激活结构域或抑制结构域的嵌合蛋白。这些包括例如基于四环素-感觉反式激活剂和反式抑制剂的抗生素应答开关,哺乳动物或昆虫类固醇受体衍生的反式激活剂和雷帕霉素诱导的反式激活剂。其他遗传开关利用可被物理线索或信号故意激活的内源性转录因子,其瞬时激活被宿主细胞所耐受。这种系统的实例包括利用例如通过热或电离辐射激活的转录因子的基因开关。参见例如,Auslander,S.和Fussenegger,M.(2012).《生物技术趋势》(Trends inBiotechnology)(电子版)第1-14页;Vilaboa N,Boellmann F,Voellmy R(2011)用于故意调节转基因表达的基因开关:系统开发和使用的最新进展(Gene Switches forDeliberate Regulation of Transgene Expression:Recent Advances in SystemDevelopment and Uses).J Genet Syndr Gene Ther2:107,其全部内容通过引用纳入本文。
在一个实施方式中,遗传开关包括以下组分:1)在不存在激活剂配体的情况下,形成不稳定和非生产性异二聚体的共激活伴侣(CAP)和配体诱导型转录因子(LTF);2)激活剂配体:分子(例如,蜕皮激素类似物或其他非类固醇小分子);和3)诱导型启动子(例如,结合LTF的定制启动子)。在一个实施方式中,仅当小分子激活剂配体与开关组分(CAP和LTF)结合从而从诱导型启动子激活基因转录并最终导致所需蛋白质的表达时,遗传开关才允许转导基因的表达。遗传开关的时间、位置和浓度可以用激活剂配体以剂量依赖的方式调节。在某些实施方式中,由申请人开发的基于EcR的遗传开关的组件(例如,以商标使用)作为组成部分用于产生本发明的配体诱导型多肽耦合器(参见例如,PCT公开号WO2001/070816,WO 2002/066612,WO 2002/066613,WO 2002/066614,WO 2002/066615,WO2003/027266,WO2003/027289和WO 2005/108617,各自通过引用全文纳入本文)。
在本发明中,使用基于EcR的“遗传开关”的组分来产生本文公开内容所描述和设想的“配体诱导型多肽耦合器”。“蜕皮激素受体”和“EcR”在本文中可互换使用,是指分为亚类1,H组(本文称为“H组核受体”)的节肢动物核受体超家族成员。每个组的成员在E(配体结合)结构域中具有40-60%的氨基酸相同性(Laudet等,核受体亚类的统一命名系统(AUnified Nomenclature System for the Nuclear Receptor Subfamily),1999;Cell 97:161-163,其通过引用全文纳入本文)。除了蜕皮激素受体外,该核受体亚类1,H组的其他成员包括:普遍存在受体(UR),孤儿受体1(OR-1),类固醇激素核受体1(NER-1),RXR相互作用蛋白-15(RIP-15),肝x受体β(LXRβ),类固醇激素受体样蛋白(RLD-1),肝x受体(LXR),肝x受体α(LXRα),法尼酯x受体(FXR),受体相互作用蛋白14(RIP-14)和法尼醇受体(HRR-1)。EcR蛋白的特征在于特征DNA和配体结合结构域(LBD)和激活结构域(Koelle等,1991,Cell,67:59-77,其全部内容通过引用纳入本文)。EcR受体对多种甾族和非甾族化合物,即激活配体有反应。
“类视黄醇X受体”和“RXR”在本文中可互换使用,指核激素受体家族,特别是类固醇和甲状腺激素受体超家族的成员。脊椎动物RXR包括至少三个不同的基因(RXRα,β和γ),其通过差异启动子使用和选择性剪接产生大量的蛋白质产物。RXR的无脊椎动物类似物(例如,超气门蛋白(USP))被发现在广泛的物种中,并被设想用于本发明。
本文所用的“激活配体”是指能够结合核类固醇受体超家族成员(例如,EcR和RXR)并通过诱导核受体组分的缔合而激活成员的化合物(例如,二聚化,寡聚化或蛋白质-蛋白质相互作用)。以下提供本发明的示例性激活配体。
当涉及本文所用的无活性多肽、结构域、信号分子、蛋白质或多肽片段、或多肽的蛋白质亚基时,术语“无活性”或“失活的”是指当前不产生全部或基本上全部一种或更多其固有的生物功能或活性的蛋白质或多肽。在一些实施方式中,通过与另一种蛋白质或多肽的缔合,即蛋白质-蛋白质相互作用而使无活性或失活的蛋白质或多肽被激活。这种激活可以例如,通过由第一核受体配体结合蛋白质片段与第二核受体蛋白质片段的结合诱导的寡聚而发生,其中第一和第二核受体片段是两个分开的,较大的第一和第二异源多肽,其中第一和第二异源多肽在配体诱导的寡聚化时从生物无活性变为生物活性状态。
本文所用术语“T细胞”或“T淋巴细胞”是一种类型的淋巴细胞,其在细胞介导的免疫中起核心作用通过细胞表面上的T细胞受体(TCR)的存在,它们可以区别于其它淋巴细胞,例如B细胞和天然杀伤细胞(NK细胞)。
本文所用的“抗体”是指单克隆或多克隆抗体。本文所用的术语“单克隆抗体”是指结合相同表位的抗体(例如,如由B细胞的单克隆产生的抗体)。相比之下,“多克隆抗体”是指结合相同抗原的不同表位的抗体群(例如,如由不同B细胞的异源混合物产生的抗体)。
本发明的配体诱导型多肽耦合器(LIPC)
本文描述的是配体诱导型多肽耦合器(LIPC),其利用一对相互作用的核受体蛋白质对LIPC(即,核受体)组分工程改造以产生融合蛋白以将分离的蛋白质或结构域结合并诱导分离的蛋白质或结构域(例如,分离的,生物无活性的多肽单体,如通常需要二聚化以形成活性信号传导复合物的受体酪氨酸激酶多肽(RTK))的缔合(例如,二聚化,寡聚化)的能力。在某些实施方式中,本发明的开关系统是基于蜕皮激素受体(EcR)的系统。基于蜕皮激素受体的配体诱导型多肽耦合器相对于“亲本”非核受体(LIPC)多肽组分或结构域是异二聚或同二聚的。另一方面,应当理解,功能性核受体(例如,EcR复合物)通常是指含有两个或多个类固醇受体家族成员的异二聚蛋白质复合物。例如,从各种昆虫获得的蜕皮激素受体蛋白,以及超气门蛋白(USP)蛋白质或者USP,类视黄醇X受体(RXR)蛋白的脊椎动物同源物(参见例如,Yao等,(1993)Nature 366,476-479和Yao等,(1992)Cell 71,63-72,其各自通过引用全文纳入本文)。
本发明可以包括两个或更多个表达盒;编码与分离的多肽或结构域(例如,信号分子,信号结构域,互补蛋白质片段,蛋白质亚基以及天然或工程改造的部分或截短的蛋白质)融合的EcR和USP/RXR组分。在激活配体的存在下,含EcR的多肽与含有USP/RXR的多肽的相互作用使连接的(融合)蛋白或结构域紧密接近,使得它们缔合(蛋白质-蛋白质相互作用),参见例如,图2-6。
蜕皮激素受体复合物一般包含作为核受体超家族成员的蛋白质,其中所有成员的特征通常是出现氨基末端反式激活结构域、DNA结合域(“DBD”)和由铰链区分开的配体结合域(“LBD”)。核受体超家族成员的特征也是出现四个或五个结构域:A/B、C、D、E和一些成员中的F(参见美国专利4,981,784和Evans,Science 240:889(1988),各自通过引用全文纳入本文)。“A/B”结构域对应反式激活结构域,“C”对应DNA结合域,“D”对应铰链区和“E”对应配体结合域。家族的一些成员在LBD羧基末端也有另一个反式激活结构域,对应“F”。
这些结构域可以是来自不同核受体蛋白的天然(即天然存在),修饰或嵌合体(即,异源融合蛋白)结构域。因为EcR、USP和RXR的结构域本质上是模块化的,因此可以互换LBD、DBD和反式激活结构域。
在某些实施方式中,利用双翅目(果蝇(Drosophila melanogaster))或鳞翅目昆虫(云杉卷叶蛾(Choristoneura fumiferana))超气门蛋白(USP)作为LIPC系统的一部分。在某些实施方式中,利用脊椎动物或哺乳动物类视黄醇X受体(RXR)(参见例如,国际公开号WO/2001/070816,其全部内容通过引用纳入本文)作为LIPC系统的一部分。在某些实施方式中,飞蝗(Locusta migratoria)的超气门蛋白(“LmUSP”)和美洲钝眼蜱(Amblyommaamericanum)的RXR同源物1和RXR同源物2(分别为“AmaRXR1”和“AmaRXR2”)的RXR同源物1和RXR同源物2及其非双翅目、非鳞翅目同源物,包括但不限于:招潮蟹(Celuca pugilator)RXR同源物(“CpRXR”),黄粉虫(Tenebrio molitor)RXR同源物(“TmRXR”),蜜蜂(Apismellifera)RXR同源物(“AmRXR”),和桃蚜(Myzus persicae)RXR同源物(“MpRXR”),所有这些在本文中统称为无脊椎动物RXR(并且其功能类似于脊椎动物类视黄醇X受体(RXR))被用作LIPC系统的一部分。
EcR组分
本发明提供了待用于本文所述的配体诱导型多肽耦合器系统中的蜕皮激素受体(EcR)多肽组分,例如,EcR配体结合结构域(LBD)。可以在本发明中使用的示例性EcR组分描述于,例如,国际PCT公开号WO 2001/070816,WO 2002/066612,WO 2002/066613,WO 2002/066614,WO 2002/066615,WO2003/027266,WO 2003/027289,WO 2005/108617和WO 2009/114201,其各自通过引用全文纳入本文。
在某些实施方式中,LIPC EcR组分是EcR配体结合结构域(LBD),或相关的类固醇/甲状腺激素核受体家族成员LBD,其类似物,组合,修饰或片段。在一些实施方式中,LIPCLBD来自截短的EcR多肽或EcR LBD。其截短或取代突变可以通过本领域中使用的任何方法进行,包括但不限于限制性内切酶消化/删除,PCR介导的寡核苷酸定向删除,化学诱变,DNA链断裂等。
LIPC EcR多肽组分可以是无脊椎动物EcR,例如,选自节肢动物纲。在一些实施方式中,LIPC EcR多肽组分(或其片段)选自鳞翅目EcR、双翅目EcR、直翅目EcR、同翅目EcR和半翅目EcR。在特定实施方式中,EcR来自云杉卷叶蛾(Choristoneura fumiferana)EcR(“CfEcR”),黄粉虫(Tenebrio molitor)EcR(“TmEcR”),天蛾(Manduca sexta)EcR(“MsEcR”),绿棉夜蛾(Heliothies virescens)EcR(“HvEcR”),摇蚊(Chironomus tentans)EcR(“CfEcR”),家蚕蛾(Bombyx mori)EcR(“BmEcR”),果蝇(Drosophila melanogaster)EcR(“DmEcR”),埃及斑蚊(Aedes aegypti)EcR(“AaEcR”),绿头苍蝇(Lucilia capitata)EcR(“LcEcR”),铜绿蝇(Lucilia cuprina)EcR(“LucEcR”),地中海果实蝇(Ceratitiscapitata)EcR(“CcEcR”),飞蝗(Locusta migratoria)EcR(“LmEcR”),桃蚜(Myzuspersicae)EcR(“MpEcR”),招潮蟹(Celuca pugilator)EcR(“CpEcR”),美洲钝眼蜱(Amblyomma americanurn)EcR(“AmaEcR”),银液粉虱(Bamecia argentifoli)EcR(“BaEcR”,SEQ ID NO:20)或黑尾叶蝉(Nephotetix cincticeps)EcR(“NcEcR”,SEQ ID NO:21)。在一个实施方式中,LIPC LBD(或其片段)来自云杉卷叶蛾(Choristoneurafumiferana)EcR(“CfEcR”)或果蝇(Drosophila melanogaster)EcR(“DmEcR”)。
在具体实施方式中,LIPC LBD来自截短的EcR多肽。在一些实施方式中,LIPC EcR多肽截短导致至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、240、245、250、255、260或265个氨基酸的缺失。优选地,LIPC EcR多肽截短导致至少一部分多肽结构域的缺失。更优选地,LIPC EcR多肽截短导致至少整个多肽结构域的缺失。在一个具体实施方式中,LIPC EcR多肽截短导致至少A/B-结构域、C-结构域、D-结构域、F-结构域、A/B/C-结构域、A/B/1/2-C-结构域、A/B/C/D-结构域、A/B/C/D/F-结构域、A/B/F-结构域、A/B/C/F-结构域、部分E结构域或部分F结构域的缺失。也可进行一些完整和/或部分结构域缺失的组合。
在一些实施方式中,LIPC蜕皮激素受体多肽组分或其片段由包含SEQ ID NO:22(CfEcR-EF),SEQ ID NO:23(DmEcR-EF),SEQ ID NO:23 SEQ ID NO:24(CfEcR-DE),或SEQID NO:25(DmEcR-DE)的核酸序列或其片段的多核苷酸编码。
在一些实施方式中,LIPC蜕皮激素受体多肽组分或其片段由包含SEQ ID NO:1(CfEcR-DEF),SEQ ID NO:2(CfEcR-CDEF),SEQ ID NO:3(DmEcR-DEF),SEQ ID NO:4(TmEcR-DEF),或SEQ ID NO:5(AmaEcR-DEF)的核酸序列或其片段的多核苷酸编码。
在某些实施方式中,LIPC蜕皮激素受体多肽组分包含SEQ ID NO:26(CfEcR-EF),SEQ ID NO:27(DmEcR-EF),SEQ ID NO:28(CfEcR-DE),或SEQ ID NO:29(DmEcR-DE)的核酸序列或其片段。在一些实施方式中,LIPC蜕皮激素受体多肽组分包含SEQ ID NO:6(CfEcR-DEF),SEQ ID NO:8(CfEcR-CDEF),SEQ ID NO:7(DmEcR-DEF),SEQ ID NO:9(TmEcR-DEF),或SEQ ID NO:10(AmaEcR-DEF)的氨基酸序列或其片段。
此外,已经鉴定了参与配体结合到H组核受体配体结合结构域(例如,EcR配体结合结构域)的氨基酸残基,其影响基于蜕皮激素受体的诱导型基因表达(“基因开关”)系统中的配体灵敏度和基因表达诱导的量级(参见例如,国际公开号WO 02/066612,其全部内容通过引用纳入本文)。这些取代突变体核受体多肽及其在LIPC系统中的用途可以在宿主细胞和生物体中提供改善的配体诱导(“激活”)的多肽耦合,其中配体灵敏度和配体诱导的寡聚化幅度的调节(调整,控制)可根据需要选择,具体取决于应用。如下文进一步描述的,包含取代突变的H组核受体(本文称为“取代突变体”)可用于本发明的配体诱导型多肽耦合器(LIPC)。
用于本发明的LIPC蜕皮激素受体(EcR)多肽组分(包括EcR配体结合结构域(LBD))可来自无脊椎动物EcR,例如,选自节肢动物EcR。在某些实施方式中,LIPC EcR多肽组分选自鳞翅目EcR、双翅目EcR、直翅目EcR、同翅目EcR和半翅目EcR。在某些实施方式中,用于本发明的EcR配体结合结构域选自云杉卷叶蛾(Choristoneura fumiferana)EcR(“CfEcR”),黄粉虫(Tenebrio molitor)EcR(“TmEcR”),天蛾(Manduca sexta)EcR(“MsEcR”),绿棉夜蛾(Heliothies virescens)EcR(“HvEcR”),摇蚊(Chironomus tentans)EcR(“CfEcR”),家蚕蛾(Bombyx mori)EcR(“BmEcR”),果蝇(Drosophila melanogaster)EcR(“DmEcR”),埃及斑蚊(Aedes aegypti)EcR(“AaEcR”),绿头苍蝇(Lucilia capitata)EcR(“LcEcR”),铜绿蝇(Lucilia cuprina)EcR(“LucEcR”),地中海果实蝇(Ceratitis capitata)EcR(“CcEcR”),飞蝗(Locusta migratoria)EcR(“LmEcR”),桃蚜(Myzus persicae)EcR(“MpEcR”),招潮蟹(Celuca pugilator)EcR(“CpEcR”),美洲钝眼蜱(Amblyomma americanurn)EcR(“AmaEcR”),银液粉虱(Bamecia argentifoli)EcR(“BaEcR”)或黑尾叶蝉(Nephotetixcincticeps)EcR(“NcEcR”)。在一些实施方式中,LIPC多肽组分来自CfEcR、DmEcR或AmaEcR。
在本发明的某些实施方式中,LIPC H组核受体多肽组分由包含导致取代的密码子突变,或由其组成的多核苷酸编码,其中该取代位于:a)SEQ ID NO:17的氨基酸残基20、21、48、51、52、55、58、59、61、62、92、93、95、96、107、109、110、120、123、125、175、218、234或238,b)SEQ ID NO:17的氨基酸残基95和110,c)SEQ ID NO:17的氨基酸残基218和219,d)SEQ IDNO:17的氨基酸残基107和175,e)SEQ ID NO:17的氨基酸残基127和175,f)SEQ ID NO:17的氨基酸残基107和127,g)SEQ ID NO:17的氨基酸残基107、127和175,h)SEQ ID NO:17的氨基酸残基52、107和175,i)SEQ ID NO:17的氨基酸残基96、107和175,j)SEQ ID NO:17的氨基酸残基107、110和175,k)SEQ ID NO:18的氨基酸残基107、121、213或217,或1)SEQ IDNO:19的氨基酸残基91或105。在某些实施方式中,H组核受体陪配体结合域来自蜕皮激素受体。在某些实施方式中,包含取代突变的LIPC EcR多肽组分可包含约或至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或更多个用相对于野生型或天然存在的EcR受体配体结合结构域多肽不同的氨基酸取代的野生型或天然存在的氨基酸,或由其组成。
在另一个实施方式中,H组LIPC核受体配体多肽组分由包含导致取代的密码子突变的,或由其组成的多核苷酸编码,该取代是:a)与SEQ ID NO:17的氨基酸残基20、21、48、51、55、58、59、61、62、92、93、95、109、120、125、218、219、223、230、234或238相当或类似的位置处的丙氨酸残基,b)与SEQ ID NO:17的氨基酸残基52相当或类似的位置处的丙氨酸,缬氨酸,异亮氨酸或亮氨酸残基,c)与SEQ ID NO:17的氨基酸残基96相当或类似的位置处的丙氨酸,苏氨酸,天冬氨酸或甲硫氨酸残基,d)与SEQ ID NO:17的氨基酸残基110相当或类似的位置处的脯氨酸,丝氨酸,甲硫氨酸或亮氨酸残基,e)与SEQ ID NO:17的氨基酸残基123相当或类似位置处的苯丙氨酸残基,f)与SEQ ID NO:17的氨基酸残基95相当或类似的位置处的丙氨酸残基,和与SEQ ID NO:17的氨基酸残基110相当或类似的位置处的脯氨酸残基,g)与SEQ ID NO:17的氨基酸残基218和219相当或类似的位置处的丙氨酸残基,h)与SEQ ID NO:17的氨基酸残基107相当或类似的位置处的异亮氨酸残基,i)与SEQ ID NO:17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基,i)与SEQ ID NO:17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO:17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基,k)与SEQ ID NO:17的氨基酸残基127和175相当或类似的位置处的谷氨酰胺残基,1)与SEQ ID NO:17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO:17的氨基酸残基127相当或类似的位置处的谷氨酰胺残基,m)与SEQ IDNO:17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO:17的氨基酸残基127和175相当或类似的位置处的谷氨酰胺残基,n)与SEQ ID NO:17的氨基酸残基相当或类似的位置处的缬氨酸,与SEQ ID NO:17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO:17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基,o)与SEQ ID NO:17的氨基酸残基96相当或类似的位置处的丙氨酸残基,与SEQ ID NO:17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO:17的氨基酸残基相当或类似的位置处的谷氨酰胺残基,p)与SEQ ID NO:17的氨基酸残基52相当或类似的位置处的丙氨酸残基,与SEQ ID NO:17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQID NO:17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基,q)与SEQ ID NO:17的氨基酸残基96相当或类似的位置处的苏氨酸残基,与SEQ ID NO:17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO:17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基,r)与SEQ ID NO:17的氨基酸残基107相当或类似的位置处的异亮氨酸残基,与SEQ ID NO:17的氨基酸残基110相当或类似的位置处的脯氨酸残基和与SEQ ID NO:17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基,s)与SEQ ID NO:18的氨基酸残基107相当或类似的位置处的脯氨酸,t)与SEQ ID NO:18的氨基酸残基121相当或类似的位置处的精氨酸或亮氨酸,u)与SEQ ID NO:18的氨基酸残基213相当或类似的位置处的丙氨酸,v)与SEQ ID NO:18的氨基酸残基217相当或类似的位置处的丙氨酸或丝氨酸,w)与SEQ IDNO:19的氨基酸残基91相当或类似的位置处的丙氨酸,或x)与SEQ ID NO:19的氨基酸残基105相当或类似的位置处的脯氨酸。在某些实施方式中,LIPC H组核受体多肽组分来自蜕皮激素受体。
在另一个实施方式中,具有取代突变的LIPC H组核受体多肽组分是蜕皮激素受体配体结合结构域,其包括包含由导致取代突变的密码子突变或由其组成的多核苷酸编码的取代突变,或由其组成,该取代突变选自下组:a)SEQ ID NO:17的E20A,Q21A,F48A,I51A,T52A,T52V,T52I,T52L,T55A,T58A,V59A,L61A,I62A,M92A,M93A,R95A,V96A,V96T,V96D,V96M,V107I,F109A,A110P,A110S,A110M,A110L,Y120A,A123F,M125A,R175E,M218A,C219A,L223A,L230A,L234A,W238A,R95A/A110P,M218A/C219A/R175E,V107I/R175E,V107I/Y127E,V107I/Y127E/R175E,T52V/V107I/R175E,V96A/V107I/R175E,T52A/V107I/R175E,V96T/V107I/R175E或V107I/A110P/R75E取代突变,b)SEQ ID NO:18的A107P,G121R,G121L,N213A,C217A或C217S取代突变,以及c)SEQ ID NO:19的G91A或A105P取代突变。
在其它实施方式中,具有取代突变的LIPC H组核受体多肽组分是包含取代突变或由其组成的蜕皮激素受体配体结合结构域多肽,该取代突变由在包括小于500mM盐和至少37℃的杂交步骤,以及在2XSSPE中至少63℃的洗涤步骤的杂交条件下与包含导致选自下组的取代突变的密码子突变的多核苷酸杂交的多核苷酸编码:a)SEQ ID NO:17的T58A、A110P、A110L、A110S或A110M,b)SEQ ID NO:18的A107P,和c)和SEQ ID NO:19的A105P。在某些实施方式中,杂交条件包括针对杂交步骤的小于200mM盐和至少37℃。在另一优选的实施方式中,杂交条件包括针对杂交和洗涤步骤的2×SSPE和63℃。在另一个实施方式中,蜕皮激素受体配体结合结构域缺乏或表现出减少的类固醇结合活性,例如20-羟基蜕皮激素结合活性,松甾酮A结合活性,或莫瑞甾酮A结合活性。
在某些实施方式中,LIPC H组核受体多肽组分具有与以下相当或类似的位置处的取代突变:a)SEQ ID NO:17的氨基酸残基20、21、48、51、52、55、58、59、61、62、92、93、95、96、107、109、110、120、123、125、175、218、234或238,b)SEQ ID NO:17的氨基酸残基95和110,c)SEQ ID NO:17的氨基酸残基218和219,d)SEQ ID NO:17的氨基酸残基107和175,e)SEQ IDNO:17的氨基酸残基127和175,f)SEQ ID NO:17的氨基酸残基107和127,g)SEQ ID NO:17的氨基酸残基107、127和175,h)SEQ ID NO:17的氨基酸残基52、107和175,i)SEQ ID NO:17的氨基酸残基96、107和175,j)SEQ ID NO:17的氨基酸残基107、110和175,k)SEQ ID NO:18的氨基酸残基107、121、213或217,或1)SEQ ID NO:19的氨基酸残基91或105。在某些实施方式中,LIPC H组核受体多肽组分来自蜕皮激素受体。
在一些实施方式中,LIPC H组核受体配体多肽组分具有以下取代:a)与SEQ IDNO:17的氨基酸残基20、21、48、51、55、58、59、61、62、92、93、95、109、120、125、218、219、223、230、234或238相当或类似的位置处的丙氨酸残基,b)与SEQ ID NO:17的氨基酸残基52相当或类似的位置处的丙氨酸,缬氨酸,异亮氨酸或亮氨酸残基,c)与SEQ ID NO:17的氨基酸残基96相当或类似的位置处的丙氨酸,苏氨酸,天冬氨酸或甲硫氨酸残基,d)与SEQ ID NO:17的氨基酸残基110相当或类似的位置处的脯氨酸,丝氨酸,甲硫氨酸或亮氨酸残基,e)与SEQID NO:17的氨基酸残基123相当或类似位置处的苯丙氨酸残基,f)与SEQ ID NO:17的氨基酸残基95相当或类似的位置处的丙氨酸残基,和与SEQ ID NO:17的氨基酸残基110相当或类似的位置处的脯氨酸残基,g)与SEQ ID NO:17的氨基酸残基218和219相当或类似的位置处的丙氨酸残基,h)与SEQ ID NO:17的氨基酸残基107相当或类似的位置处的异亮氨酸残基,i)与SEQ ID NO:17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基,j)与SEQ IDNO:17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO:17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基,k)与SEQ ID NO:17的氨基酸残基127和175相当或类似的位置处的谷氨酰胺残基,1)与SEQ ID NO:17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO:17的氨基酸残基127相当或类似的位置处的谷氨酰胺残基,m)与SEQ ID NO:17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQID NO:17的氨基酸残基127和175相当或类似的位置处的谷氨酰胺残基,n)与SEQ ID NO:17的氨基酸残基相当或类似的位置处的缬氨酸,与SEQ ID NO:17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO:17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基,o)与SEQ ID NO:17的氨基酸残基96相当或类似的位置处的丙氨酸残基,与SEQID NO:17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO:17的氨基酸残基相当或类似的位置处的谷氨酰胺残基,p)与SEQ ID NO:17的氨基酸残基52相当或类似的位置处的丙氨酸残基,与SEQ ID NO:17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO:17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基,q)与SEQ ID NO:17的氨基酸残基96相当或类似的位置处的苏氨酸残基,与SEQ ID NO:17的氨基酸残基107相当或类似的位置处的异亮氨酸残基和与SEQ ID NO:17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基,r)与SEQ ID NO:17的氨基酸残基107相当或类似的位置处的异亮氨酸残基,与SEQ ID N:17的氨基酸残基110相当或类似的位置处的脯氨酸残基和与SEQ ID NO:17的氨基酸残基175相当或类似的位置处的谷氨酰胺残基,s)与SEQ ID NO:18的氨基酸残基107相当或类似的位置处的脯氨酸,t)与SEQ ID NO:18的氨基酸残基121相当或类似的位置处的精氨酸或亮氨酸,u)与SEQ ID NO:18的氨基酸残基213相当或类似的位置处的丙氨酸,v)与SEQ ID NO:18的氨基酸残基217相当或类似的位置处的丙氨酸或丝氨酸,w)与SEQ ID NO:19的氨基酸残基91相当或类似的位置处的丙氨酸,或x)与SEQ IDNO:19的氨基酸残基105相当或类似的位置处的脯氨酸。在某些实施方式中,LIPC H组核受体多肽组分来自蜕皮激素受体。
在另一个实施方式中,具有取代突变的LIPC H组核受体多肽组分是包含取代突变的蜕皮激素受体配体结合结构域多肽,其中该取代突变选自下组:a)SEQ ID NO:17的E20A,Q21A,F48A,I51A,T52A,T52V,T52I,T52L,T55A,T58A,V59A,L61A,I62A,M92A,M93A,R95A,V96A,V96T,V96D,V96M,V107I,F109A,A110P,A110S,A110M,A110L,Y120A,A123F,M125A,R175E,M218A,C219A,L223A,L230A,L234A,W238A,R95A/A110P,M218A/C219A/R175E,V107I/R175E,V107I/Y127E,V107I/Y127E/R175E,T52V/V107I/R175E,V96A/V107I/R175E,T52A/V107I/R175E,V96T/V107I/R175E或V107I/A110P/R75E取代突变,b)SEQ ID NO:18的A107P,G121R,G121L,N213A,C217A或C217S取代突变,以及c)SEQ ID NO:19的G91A或A105P取代突变。
在某些实施方式中,本发明的LIPC蛋白质中使用的EcR多肽组分(氨基酸序列)包含一个或多个选自表1所示的一组取代的取代突变,或由其组成。
表1:可用于LIPC系统的EcR多肽取代突变。
RXR组分
本发明提供了待用于本文所述的配体诱导型多肽耦合器(LIPC)的特定RXR组分,包括RXR配体结合结构域(LBD)。可以在本发明中使用的示例性RXR组分包括,例如,国际PCT公开号WO 2001/070816,WO 2002/066612,WO 2002/066613,WO 2002/066614,WO 2002/066615,WO 2003/027266,WO2003/027289,WO 2005/108617和WO 2009/114201中所述的那些,其各自通过引用全文纳入本文。
在某些实施方式中,LIPC RXR组分是小家鼠(Mus musculus)RXR(MmRXR)或智人(Homo sapiens)RXR(HsRXR)。LIPC RXR组分可以是RXRα,RXRβ或RXRγ同种型或其片段。
在一些实施方式中,RXR LIPC组件是截短的RXR。LIPC RXR多肽截短可包含至少1、2、3、4、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、240、245、250、255、260或265个氨基酸的缺失,或由其组成。在某些实施方式中,LIPC RXR多肽截短包含至少部分多肽结构域的缺失或由其组成。在一些实施方式中,LIPC RXR多肽截短包含至少整个多肽结构域的缺失或由其组成。在一个具体实施方式中,LIPC EcR多肽截短包含至少A/B-结构域缺失、C-结构域缺失、D-结构域缺失、E-结构域缺失、F-结构域缺失、A/B/C-结构域缺失、A/B/1/2-C-结构域缺失、A/B/C/D-结构域缺失、A/B/C/D/F-结构域缺失、A/B/F-结构域、和A/B/C/F-结构域缺失,或由其组成。也可进行一些完整和/或部分结构域缺失的组合。
在某些实施方式中,LIPC RXR多肽组分由包含选自下组的核酸序列,或由其组成的多核苷酸编码:SEQ ID NO:30,SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,和SEQ ID NO:39,或其片段。
在另一个实施方式中,LIPC RXR组分包含选自下组的多肽序列,或由其组成:SEQID NO:40,SEQ ID NO:41,SEQ ID NO:42,SEQ ID NO:43,SEQ ID NO:44,SEQ ID NO:45,SEQID NO:46,SEQ ID NO:47,SEQ ID NO:48,和SEQ ID NO:49,或其片段。
在某些实施方式中,本发明的LIPC包括嵌合RXR多肽,其包含选自下组的至少两种多肽片段:1)脊椎动物物种RXR多肽片段;2)无脊椎动物物种RXR多肽片段;和3)非双翅目/非鳞翅目无脊椎动物物种RXR多肽片段。本发明的LIPC嵌合RXR多肽组分可以包含两种不同的动物物种RXR多肽片段,或由其组成,或者当动物物种相同时,两个或多个多肽片段可以来自动物物种RXR多肽片段的两个或多个不同同种型。
在一些实施方式中,脊椎动物物种LIPC RXR多肽片段包含小家鼠(Mus musculus)RXR(MmRXR)或智人(Homo sapiens)RXR(HsRXR)或其片段,或由其组成。LIPC RXR多肽组分可以包含RXRα,RXRβ或RXRγ同种型或其片段,或由其组成。
在一些实施方式中,脊椎动物物种LIPC RXR多肽片段来自由多核苷酸编码的脊椎动物物种RXR,该多核苷酸包含SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66和SEQ ID NO:67或其片段的核酸序列,或其组成。在另一个实施方式中,脊椎动物物种LIPC RXR多肽片段来自脊椎动物物种RXR,其包含选自SEQ ID NO:68、SEQ IDNO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72和SEQ ID NO:73或其片段的核酸序列,或其组成。
在另一个实施方式中,LIPC无脊椎动物物种RXR多肽片段来自飞蝗(Locustamigratoria)超气门多肽(LmUSP)、美洲钝眼蜱(Amblyomma americanum)RXR同源物1(AmaRXR1)、美洲钝眼蜱(Amblyomma americanum)RXR同源物2(AmaRXR2)、招潮蟹(Celucapugilator)RXR同源物(CpRXR)、黄粉虫(Tenebrio molitor)RXR同源物(TmRXR)、蜜蜂(Apismellifera)RXR同源物(AmRXR)、和桃蚜(Myzus persicae)RXR同源物(MpRXR)。
在某些实施方式中,LIPC无脊椎动物物种RXR多肽片段来自由多核苷酸编码的无脊椎动物物种RXR多肽,该多核苷酸包含SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQID NO:53、SEQ ID NO:54或SEQ ID NO:55或其片段的核酸序列,或其组成。在另一个实施方式中,LIPC无脊椎动物物种RXR多肽片段来自无脊椎动物物种RXR多肽,其包含SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:59、SEQ ID NO:60或SEQ ID NO:61或其片段的氨基酸序列,或其组成。
在某些实施方式中,LIPC无脊椎动物物种RXR多肽片段来自非双翅目/非鳞翅目无脊椎动物物种RXR同源物。
在一些实施方式中,LIPC嵌合RXR组分包含至少一个脊椎动物种RXR多肽片段和一个无脊椎动物种RXR多肽片段,或由其组成。
在另一个实施方式中,LIPC嵌合RXR组分包含至少一个脊椎动物种RXR多肽片段和一个非双翅目/非鳞翅目无脊椎动物种RXR同源物多肽片段,或由其组成。
在另一个实施方式中,LIPC嵌合RXR组分包含至少一个无脊椎动物种RXR多肽片段和一个非双翅目/非鳞翅目无脊椎动物种RXR同源物多肽片段,或由其组成。
在另一个实施方式中,LIPC嵌合RXR组分包含至少一个脊椎动物种RXR多肽片段和一个不同脊椎动物种RXR多肽片段,或由其组成。
在另一个实施方式中,LIPC嵌合RXR组分包含至少一个无脊椎动物种RXR多肽片段和一个不同无脊椎动物种RXR多肽片段,或由其组成。
在另一个实施方式中,LIPC嵌合RXR组分包含至少一个非双翅目/非鳞翅目无脊椎动物种RXR多肽片段和一个不同的非双翅目/非鳞翅目无脊椎动物种RXR多肽片段,或由其组成。
在某些实施方式中,LIPC嵌合RXR组分具有包含至少一个多肽片段的RXR区域,所述多肽片段选自EF结构域螺旋1,EF结构域螺旋2,EF结构域螺旋3,EF结构域螺旋4,EF结构域螺旋5,EF结构域螺旋6,EF结构域螺旋7,EF结构域螺旋8,和EF结构域螺旋9,EF结构域螺旋10,EF结构域螺旋11,EF结构域螺旋12,F结构域,和/或EF结构域β折叠片,其中两个或多个结构域中的至少一个来自不同物种RXR(例如,人RXR多肽片段和鼠RXR多肽片段)。
在另一个实施方式中,LIPC嵌合RXR组分的第一多肽片段包含第一物种RXR的螺旋1-6,螺旋1-7,螺旋1-8,螺旋1-9,螺旋1-10,螺旋1-11,或螺旋1-12,或由其组成,并且嵌合LIPC RXR组分的第二多肽片段包含第二物种RXR的螺旋7-12,螺旋8-12,螺旋9-12,螺旋10-12,螺旋11-12,螺旋12,或F结构域,或由其组成。
在另一个实施方式中,LIPC嵌合RXR组分的第一多肽片段包含第一物种RXR的螺旋1-6或由其组成,并且LIPC嵌合RXR组分的第二多肽片段包含第二物种RXR的螺旋7-12。
在另一个实施方式中,LIPC嵌合RXR组分的第一多肽片段包含第一物种RXR的螺旋1-7或由其组成,并且LIPC嵌合RXR组分的第二多肽片段包含第二物种RXR的螺旋8-12或由其组成。
在另一个实施方式中,LIPC嵌合RXR组分的第一多肽片段包含第一物种RXR的螺旋1-8或由其组成,并且LIPC嵌合RXR组分的第二多肽片段包含第二物种RXR的螺旋9-12或由其组成。
在另一个实施方式中,LIPC嵌合RXR组分的第一多肽片段包含第一物种RXR的螺旋1-9或由其组成,并且LIPC嵌合RXR组分的第二多肽片段包含第二物种RXR的螺旋10-12或由其组成。
在另一个实施方式中,LIPC嵌合RXR组分的第一多肽片段包含第一物种RXR的螺旋1-10或由其组成,并且LIPC嵌合RXR组分的第二多肽片段包含第二物种RXR的螺旋11-12或由其组成。
在另一个实施方式中,LIPC嵌合RXR组分的第一多肽片段包含第一物种RXR的螺旋1-11或由其组成,并且LIPC嵌合RXR组分的第二多肽片段包含第二物种RXR的螺旋12或由其组成。
在另一个实施方式中,LIPC嵌合RXR组分的第一多肽片段包含第一物种RXR的螺旋1-12或由其组成,并且LIPC嵌合RXR组分的第二多肽片段包含第二物种RXR的F结构域或由其组成。
在另一个实施方式中,LIPC RXR组件包含截短的嵌合RXR或由截短的嵌合RXR组成。嵌合RXR截短可包括至少1、2、3、4、5、6、8、10、13、14、15、16、17、18、19、20、21、22、25、26、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、或240个氨基酸的缺失。在某些实施方式中,嵌合RXR截短导致至少部分多肽结构域的缺失。在其他实施方式中,嵌合RXR截短导致至少整个多肽结构域的缺失。在另一个实施方式中,嵌合RXR截短导致至少部分E-结构域,完整E-结构域,部分F域,完整F结构域,EF结构域螺旋1,EF结构域螺旋2,EF域螺旋3,EF结构域螺旋4,EF结构域螺旋5,EF结构域螺旋6,EF结构域螺旋7,EF结构域螺旋8和EF结构域螺旋9,EF域螺旋10,EF结构域螺旋11,EF结构域螺旋12和/或EF结构域β折叠片的缺失。也可进行几种部分和/或完整结构域缺失的组合。
在某些实施方式中,LIPC截短的嵌合RXR组分由多核苷酸编码,该多核苷酸包含SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78或SEQ ID NO:79或其片段的核酸序列,或由其组成。在另一个实施方式中,LIPC截短的嵌合RXR组分包含SEQ ID NO:80、SEQ ID NO:81、SEQ ID NO:82、SEQ ID NO:83、SEQ ID NO:84或SEQ ID NO:85或其片段的核酸序列,或由其组成。
在另一个实施方式中,LIPC嵌合RXR组分由包含下述核酸序列,或由其组成的多核苷酸编码:a)SEQ ID NO:11,b)SEQ ID NO:12的核苷酸1-348和SEQ ID NO:13的核苷酸268-630,c)SEQ ID NO:12的核苷酸1-408和SEQ ID NO:13的核苷酸337-630,d)SEQ ID NO:12的核苷酸1和SEQ ID NO:13的核苷酸403-630,e)SEQ ID NO:12的核苷酸1-555和SEQ ID NO:13的核苷酸490-630,f)SEQ ID NO:12的核苷酸1-624和SEQ ID NO:13的核苷酸547-630,g)SEQ ID NO:12的核苷酸1-645和SEQ ID NO:13的核苷酸601-630,和h)SEQ ID NO:12的核苷酸1-717,和/或SEQ ID NO:13的核苷酸613-630,或其片段。
在另一个优选实施方式中,LIPC嵌合RXR组分包含以下氨基酸序列,或由其组成:a)SEQ ID NO:14,b)SEQ ID NO:15的氨基酸1-116和SEQ ID NO:16的氨基酸90-210,c)SEQID NO:15的氨基酸1-136和SEQ ID NO:16的氨基酸113-210,d)SEQ ID NO:15的氨基酸1-155和SEQ ID NO:16的氨基酸135-210,e)SEQ ID NO:15的氨基酸1-185和SEQ ID NO:16的氨基酸164-210,f)SEQ ID NO:15的氨基酸1-208和SEQ ID NO:16的氨基酸183-210,g)SEQID NO:15的氨基酸1-215和SEQ ID NO:16的氨基酸201-210,和/或h)SEQ ID NO:15的氨基酸1-239或SEQ ID NO:16的氨基酸205-210,或其片段。
EcR和/或RXR多肽组分
在某些实施方式中,在本发明的LIPC中使用的EcR和/或USP/RXR多肽包含至少一种或多种选自以下任意一个或多个国际公开所述的取代突变的EcR和/或RXR取代突变体或由其组成:WO 2001/070816,WO2002/066612,WO 2002/066613,WO 2002/066614,WO 2002/066615,WO2003/027266,WO 2003/027289,和WO 2005/108617,其各自通过引用全文纳入本文。
本发明的基因表达盒
本发明的一个实施方式包括配体诱导型多肽耦合器(LIPC)系统,其包含:a)能够在包含编码第一融合蛋白(多肽)的多核苷酸的宿主细胞中表达的第一表达盒,其包含i)核受体多肽或其片段;和ii)第一无活性信号传导结构域;和b)能够在宿主细胞中表达的第二表达盒,其包含编码第二,分离的融合蛋白(多肽)的多核苷酸序列,其包含i)第二核受体多肽或其片段;和ii)第二无活性信号传导结构域;其中所述第一和第二无活性信号传导结构域在两种融合蛋白彼此缔合时被激活。
本发明的另一个实施方式包括配体诱导型多肽耦合器(LIPC)系统,其包含:a)能够在包含编码第一融合蛋白(多肽)的多核苷酸的宿主细胞中表达的第一表达盒,其包含i)节肢动物核受体多肽或其片段;和ii)第一无活性信号传导结构域;和b)能够在宿主细胞中表达的第二表达盒,其包含编码第二,分离的融合蛋白(多肽)的多核苷酸序列,其包含i)第二非节肢动物核受体多肽或其片段;和ii)第二无活性信号传导结构域;其中所述第一和第二无活性信号传导结构域在两种融合蛋白彼此缔合时被激活。在另一个实施方式中,非节肢动物核受体包含非双翅目/非鳞翅目核受体多肽或其片段。在另一个实施方式中,非节肢动物核受体包含哺乳动物核受体多肽或其片段。在另一个实施方式中,非节肢动物核受体包含人核受体多肽或其片段。在另一个实施方式中,非节肢动物核受体包含鼠核受体多肽或其片段。在另一个实施方式中,非节肢动物核受体包含嵌合核受体多肽或其片段,其中所述嵌合体包含来自两种或更多种不同物种的多肽组分。
本发明的一个实施方式包括配体诱导型多肽耦合器(LIPC)系统,其包含:a)能够在包含编码第一融合蛋白(多肽)的多核苷酸的宿主细胞中表达的第一表达盒,其包含i)蜕皮激素受体(EcR)多肽或其片段;和ii)第一无活性信号传导结构域;和b)能够在宿主细胞中表达的第二表达盒,其包含编码第二,分离的融合蛋白(多肽)的多核苷酸序列,其包含i)类视黄醇X受体多肽或其片段;和ii)第二无活性信号传导结构域;其中所述第一和第二无活性信号传导结构域在两种融合蛋白彼此缔合时被激活。
如本文所述,当与EcR配体结合结构域和RXR配体结合结构域组合时,任选地用于如下所述的发明中的配体提供了用于外部时间调节(激活或撤回激活)信号传导结构域的手段,即通过停止给予配体或与配体接触。配体与LIPC EcR和RXR多肽组分的结合使得能够产生LIPC融合蛋白的蛋白质-蛋白质相互作用以及在某些实施方式中激活信号传导结构域。在一些实施方式中,改变一个或多个LIPC结构域产生杂合LIPC。在某些实施方式中,杂合基因和所得杂合蛋白质在所选择的宿主细胞或生物体中针对所需活性和配体的互补结合优化。
无活性信号传导结构域
本发明的实施方式包括配体诱导型多肽耦合器系统,其允许无活性结构域(例如,信号传导分子,信号传导结构域,互补蛋白质片段,蛋白质亚基以及天然的或工程改造的部分或截短的蛋白质)通过蛋白质-蛋白质相互作用或缔合来定制激活(例如,剂量调节的,诱导型)。
在某些实施方式中,其活性待调节的信号传导蛋白和/或多肽结构域是相对于宿主细胞的同源蛋白质或其片段。在其它实施方式中,其活性待调节的信号传导蛋白和/或多肽结构域是相对于宿主细胞的异源蛋白质或其片段。
本发明的实施方式包括编码涉及疾病、病症、功能障碍、遗传缺陷、药物发现目标和蛋白质组学分析和应用等的多肽或信号传导结构域的信号传导蛋白和多肽结构域的组合物和用途。
已经在广泛的生物体中鉴定了需要缔合(例如二聚化或寡聚化)或蛋白质-蛋白质相互作用的许多细胞信号传导多肽和结构域(例如,信号传导蛋白),并可用于本发明。这些信号传导分子中的许多参与在大量生物体中保守的信号传导途径。
例如,用单个跨膜结构域锚定在膜中的许多细胞表面受体主要通过内源(即天然存在的)配体诱导的二聚化或寡聚化来激活。通常,这些分子本身不缔合,而是通过与内源胞外配体的相互作用而聚集在一起(或者靠近其结合伴侣)。与内源性天然存在的细胞信号蛋白激活相反,本发明提供了一种小分子配体诱导型多肽耦合器系统,以调节(即,开启,关闭,增加或减少)活性,即通过小分子核受体激活配体的“按需”给药(或撤回给药)二聚化或寡聚化细胞信号传导蛋白和结构域。对于利用蛋白质二聚化或寡聚化用于激活的各种分子和途径的综述,参见例如,Klemm等,Annu.Rev.Immunol.16:569-92(1998),其全部内容通过引用纳入本文。
在某些实施方式中,设想以下来自细胞表面受体的信号传导分子和/或结构域,细胞内信号传导蛋白及其相关途径成员作为本发明的第一和/或第二无活性信号传导结构域,信号传导分子,互补蛋白质片段,蛋白质亚基,或天然或工程改造的部分或截短的蛋白质用于本发明:
受体酪氨酸激酶(RTK)受体及其相关的通路成员,包括RTK I类(EGF受体家族)(ErbB家族),RTK II类(胰岛素受体家族),RTK III类(PDGF受体家族),RTK IV类(FGF受体家族),RTK V类(VEGF受体家族),RTK VI类(HGF受体家族),RTK VII类(Trk受体家族),RTKVIII类(Eph受体家族),RTK IX类(AXL受体家族),RTK X类(LTK受体家族),RTK XI类(TIE受体家族),RTK XII类(ROR受体家族),RTK类XIII(DDR受体家族),RTK XIV类(RET受体家族),RTK XV类(KLG家族),RTK XVI类(RYK受体家族),和RTK XVII类(MuSK受体家族)。
细胞因子受体及其相关的途径成员,包括I型细胞因子受体(例如,1型白介素受体,红细胞生成素受体,GM-CSF受体,G-CSF受体,生长激素受体,催乳素受体,制瘤素M受体和白血病抑制因子受体),II型细胞因子受体(例如,II型白介素受体,干扰素-α/β受体和干扰素-γ受体),免疫球蛋白超家族的成员(例如,白介素-1受体,CSF1,C-kit受体和白介素-18受体)。肿瘤坏死因子受体家族(例如,CD27,CD30,CD40,CD120和淋巴毒素β受体)。趋化因子受体(例如,白介素-8受体,CCR1,CXCR4,MCAF受体,和NAP-2受体)。TGF-β受体(例如,TGFβ受体1和TGFβ受体2)。抗原受体信号传导受体(例如,B细胞和T细胞抗原受体)。
设想与本发明一起使用的其他信号传导蛋白和/或结构域包括但不限于萤火虫荧光素酶(fLuc),信号转导和转录激活因子(STAT)蛋白,NF-κB蛋白,抗体(包括抗体片段),转录因子,核受体,包括核激素受体,14-3-3蛋白,G蛋白偶联受体,G蛋白,驱动蛋白,磷酸丙糖异构酶(TIM),醇脱氢酶,因子XI,因子XIII,Toll样受体,纤维蛋白原,Bcl-2家族成员,Smad家族成员等。
在某些实施方式中,本发明的无活性信号传导结构域具有跨膜结构域。在一些实施方式中,跨膜结构域是单通跨膜结构域。在某些实施方式中,单通跨膜结构域是单通I型跨膜结构域。在其它实施方式中,跨膜结构域是多通跨膜结构域。在某些实施方式中,跨膜结构域具有亲水性α螺旋基序。
激活配体
可用于本发明的可接受的激活配体是调节开关系统的信号传导结构域的蛋白质-蛋白质相互作用的任何一种,其中配体的存在导致无活性信号传导结构域的激活。这些配体包括国际PCT公开号WO 2002/066612,WO 2002/066614,WO 2003/105849,WO 2004/072254,WO 2004/005478,WO 2004/078924,WO2005/017126,WO 2008/153801,WO 2009/114201,WO 2013/036758,WO2014/144380和美国专利号6258603和8748125中公开的那些,其各自的全部内容通过引用纳入本文。
示例性配体包括但不限于:松甾酮,莫瑞甾酮A,9-顺式-视黄酸,视黄酸的合成类似物,N,N′-酰基肼,例如美国专利号6013836、5117057、5530028和537872中公开的那些,其各自的全部内容通过引用纳入本文;二苯甲酰基烷基氰基肼,例如欧洲申请号461809中公开的那些,其全部内容通过引用纳入本文;N-烷基-N,N′-二芳酰基肼,例如美国专利号5225443中公开的那些,其全部内容通过引用纳入本文;N-酰基-N-烷基羰基肼,例如欧洲申请号234994中公开的那些,其全部内容通过引用纳入本文;N-芳酰基-N-烷基-N′-芳酰基肼,例如美国专利号4985461中所述的那些,其全部内容通过引用纳入本文,以及其它类似的材料,包括3,5-二叔丁基-4-羟基-N-异丁基-苯甲酰胺,8-O-乙酰基海胆等。
在某些实施方式中,用于本发明的方法的配体是下式的化合物:
其中E是含叔碳的(C4-C6)烷基或含叔碳的氰基(C3-C5)烷基;R1是H、Me、Et、i-Pr、F、甲酰基、CF3、CHF2、CHCl2、CH2F、CH2Cl、CH2OH、CH2OMe、CH2CN、CN、C≡CH、1-丙炔基、2-丙炔基、乙烯基、OH、OMe、OEt、环丙基、CF2CF3、CH=CHCN、烯丙基、叠氮基、SCN、或SCHF2
R2是H、Me、Et、n-Pr、i-Pr、甲酰基、CF3、CHF2、CHCl2、CH2F、CH2Cl、CH2OH、CH2OMe、CH2CN、CN、C≡CH、1-丙炔基、2-丙炔基、乙烯基、Ac、F、Cl、OH、OMe、OEt、O-n-Pr、OAc、NMe2、NEt2、SMe、Set、SOCF3、OCF2CF2H、COEt、环丙基、CF2CF3、CH=CHCN、烯丙基、叠氮基、OCF3、OCHF2、O-i-Pr、SCN、SCHF2、SOMe、NH-CN,或与R3以及R2和R3接合的苯基碳连接以形成亚乙基二氧基,与苯基碳相邻的氧形成二氢呋喃环,或与苯基碳相邻的氧形成二氢吡喃环;
R3是H、Et,或与R3以及R2和R3接合的苯基碳连接以形成亚乙基二氧基,与苯基碳相邻的氧形成二氢呋喃环,或与苯基碳相邻的氧形成二氢吡喃环;R4、R5、和R6独立地是H、Me、Et、F、Cl、Br、甲酰基、CF3、CHF2、CHCl2、CH2F、CH2Cl、CH2OH、CN、C≡CH、1-丙炔基、2-丙炔基、乙烯基、OMe、OEt、SMe、或Set。
在一些实施方式中,用于本发明的方法的配体是下式的化合物:
或者
其中,R1、R2、R3和R4是:
a)H,(C1-C6)烷基;(C1-C6)卤代烷基;(C1-C6)氰基烷基;(C1-C6)羟基烷基;(C1-C4)烷氧基(C1-C6)烷基;任选地被卤素、氰基、羟基或(C1-C4)烷基取代的(C2-C6)烯基;任选地被卤素、氰基、羟基或(C1-C4)烷基取代的(C2-C6)炔基;任选地被卤素、氰基、羟基或(C1-C4)烷基取代的(C3-C5)环烷基;任选地被卤素、氰基或(C1-C4)烷基取代的环氧乙烷基;或
b)未取代或取代的苄基,其中取代基独立地是1至5H、卤素、硝基、氰基、羟基、(C1-C6)烷基、或(C1-C6)烷氧基;并且R5是H;OH;F;Cl;或(C1-C6)烷氧基。
在一些实施方式中,当R1、R2、R3、和R4为H时,R5不是H或羟基。
在某些实施方式中,R1、R2、R3、和R4中的至少一个不是H。在另一个实施方式中,R1、R2、R3、和R4中的至少两个不是H。在另一个实施方式中,R1、R2、R3、和R4中至少三个不是H。在另一个实施方式中,R1、R2、R3、和R4各自不是H。
在一些实施方式中,当R1、R2、R3、和R4为H时,R5不是甲氧基,当R1、R2、R3、和R4为异丙基时,R5不是羟基,并且当R1、R2、和R3为H并R5为羟基,R4不是甲基或乙基。
在具体实施方式中,R1、R2、R3、和R4是:a)H、(C1-C6)烷基;(C1-C6)卤代烷基;(C1-C6)氰基烷基;(C1-C6)羟基烷基;(C1-C4)烷氧基(C1-C6)烷基;(C2-C6)烯基;(C2-C6)炔基;任选地被卤素、氰基或(C1-C4)烷基取代的环氧乙烷基;或b)未取代的或取代的苄基,其中取代基独立地是1至5H、卤素、氰基或(C1-C6)烷基;并且R5是H、OH、F、Cl、或(C1-C6)烷氧基。
在其它具体实施方式中,R1、R2、R3、和R4是H,(C1-C6)烷基;(C2-C6)烯基;(C2-C6)炔基;2′-乙基环氧乙烷基或苄基;R5是H;OH;或F。
在具体实施方式中,当R1、R2、R3、和R4为异丙基时,R5不是羟基;当R5是H、羟基、甲氧基或氟时,R1、R2、R3、和R4中的至少一个不是H;当R1、R2、R3、和R4中只有一个是甲基,且R5是H或羟基时,其余的R1、R2、R3、和R4不是H;当R4以及R1、R2、和R3中的一个为甲基时,则R5既不是H也不是羟基;当R1、R2、R3、和R4都是甲基时,R5不是羟基;当R1、R2和R3全部为H且R5为羟基时,R4不是乙基、正丙基、正丁基、烯丙基或苄基。
本发明的某些实施方式包括使用以下甾体配体:20-羟基蜕皮激素,2-甲基醚;20-羟基蜕皮激素,3-甲基醚;20-羟基蜕皮激素,14-甲基醚;20-羟基蜕皮激素,2,22-二甲基醚;20-羟基睾酮,3,22-二甲基醚;20-羟基蜕皮激素,14,22-二甲基醚;20-羟基睾酮,22,25-二甲基醚;20-羟基睾酮,2,3,14,22-四甲基醚;20-羟基睾酮,22-H-丙基醚;20-羟基蜕皮激素,22-正丁基醚;20-羟基蜕皮激素,22-烯丙基醚;20-羟基睾酮,22-苄基醚;20-羟基蜕皮激素,22-(28R,S)-2′-乙基环氧乙烷基醚;松甾酮A,2-甲基醚;松甾酮A,14-甲基醚;松甾酮A,22-甲基醚;松甾酮A,2,22-二甲基醚;松甾酮A,3,22-二甲基醚;松甾酮A,14,22-二甲基醚;海南陆均松甾酮(dacryhanansterone),22-甲基醚。
本发明的其他实施方式包括使用以下类固醇配体:25,26-二氢硬化甾醇A,(旌节花甾酮C(Δ25(26))),施达雄酮(shidasterone)(旌节花甾酮D),旌节花甾酮C,22-脱氧-20-羟基蜕皮激素(紫杉烷酮),松甾酮A,多孔菌甾酮B,22-脱氢-20-羟基蜕皮激素,松甾酮A22-甲基醚,20-羟基蜕皮激素,蕨甾酮,(25R)-牛膝甾酮,(25S)-牛膝甾酮,24(28)-脱氢罗汉松甾酮A,24-表-罗汉松甾酮A,罗汉松甾酮A,20-羟基蜕皮激素-22-甲基醚,20-羟基蜕皮激素-25-甲基醚,阿卜它甾酮,22,23-二-表-吉迪甾酮(geradiasterone),20,26-二羟基蜕皮激素(罗汉松甾酮C),24-表-阿卜它甾酮,吉迪甾酮,29-诺西酮,筋骨草甾酮B,24(28)[Z]-脱氢紫苋甾酮B,紫苋甾酮A,罗汉松甾酮C,鹿草甾酮C,20-羟基蜕皮激素-22,25-二甲基醚,20-羟基蜕皮激素-22-乙基醚,卡斯甾酮(carthamosterone),24(25)-脱氢前杯苋甾酮,乐泽斯酮,杯苋甾酮,20-羟基蜕皮激素-22-烯丙基醚,24(28)[Z]-脱氢-29-羟基罗汉松甾酮C,20-羟基蜕皮激素-22-乙酸酯,维甾酮(viticosterone)E(20-羟基蜕皮激素25-乙酸酯),20-羟基蜕皮激素-22-正丙基醚,24-羟基杯苋甾酮,20-羟基蜕皮激素-22-正丁基醚,松甾酮A 22-半琥珀酸酯,22-乙酰乙酰基-20-羟基蜕皮激素,20-羟基蜕皮激素-22-苄基醚,卡尼甾酮(canescensterone),20-羟基蜕皮激素-22-半琥珀酸酯,牛膝甾酮-26-半琥珀酸酯,20-羟基蜕皮激素-22-苯甲酸酯,20-羟基蜕皮激素-22-β-D-吡喃葡萄糖苷,20-羟基蜕皮激素-25-β-D-吡喃葡萄糖苷,石竹皂甙(sileneoside)A(20-羟基蜕皮激素-22α-半乳糖苷),3-脱氧-1β,20-二羟基蜕皮激素(3-脱氧七羟基胆甾烯酮(integristerone)A),2-脱氧七羟基胆甾烯酮A,1-表-七羟基胆甾烯酮A,七羟基胆甾烯酮A,石竹皂甙C(七羟基胆甾烯酮A22α-半乳糖苷),2,22-二脱氧-20-羟基蜕皮激素,2-脱氧-20-羟基蜕皮激素,2-脱氧-20-羟基蜕皮激素-3-乙酸酯,2-脱氧-20,26-二羟基蜕皮激素,2-脱氧-20-羟基蜕皮激素-22-乙酸酯,2-脱氧-20-羟基蜕皮激素-3,22-二乙酸酯,2-脱氧-20-羟基蜕皮激素-22-苯甲酸酯,松甾酮A 2-半琥珀酸酯,20-羟基蜕皮激素-2-甲基醚,20-羟基蜕皮激素-2-乙酸酯,20-羟基蜕皮激素-2-半琥珀酸酯,20-羟基蜕皮激素-2-β-D-吡喃葡萄糖苷,2-丹酰-20-羟基蜕皮激素,20-羟基睾酮-2,22-二甲基醚,松甾酮A 3B-D-木吡喃糖苷(limnantheoside B),20-羟基蜕皮激素-3-甲基醚,20-羟基蜕皮激素-3-乙酸酯,20-羟基蜕皮激素-3β-D-木吡喃糖苷(limnantheoside A),20-羟基蜕皮激素-3-β-D-吡喃葡糖苷,石竹皂甙D(20-羟基蜕皮激素-3α-半乳糖苷),20-羟基蜕皮激素3β-D-吡喃葡萄糖基-[1-3]-β-D-木吡喃糖苷(limnantheoside C),20-羟基蜕皮激素-3,2,2-二甲基醚,杯苋甾酮-3-乙酸酯,2-脱氢-3-表-20-羟基蜕皮激素,3-表-20-羟基蜕皮激素(冠甾酮(coronatasterone)),鹿根甾酮D,3-脱氢-20-羟基蜕皮激素,5β-羟基-25,26-二脱氢松甾酮A,5β-羟基旌节花甾酮C,25-脱氧埃克甾酮B,埃克甾酮B,25-氟埃克甾酮B,5β-羟基阿卜它甾酮,26-羟基埃克甾酮B,29-正森告甾酮,森告甾酮,6β-羟基-20-羟基蜕皮激素,6α-羟基-20-羟基蜕皮激素,20-羟基蜕皮激素-6-肟,松甾酮A 6-羧基甲基肟,20-羟基蜕皮激素-6-羧基甲基肟,筋骨草甾酮C,鹿根甾酮B,莫瑞甾酮A,阿琼甾酮B,阿琼甾酮A,土克甾酮-2-乙酸酯,杜松酮(漏芦甾酮),土克甾酮,阿琼甾酮C,25-羟基阿琼甾酮B,25-羟基阿琼甾酮A,藜酮(paxillosterone),土克甾酮-22,2-二乙酸酯,土克甾酮-22-乙酸酯,土克甾酮-1α-乙酸酯,土克甾酮-2,11α-二乙酸酯,土克甾酮-11α-丙酸酯,土克甾酮-11α-丁酸酯,土克甾酮-11α-己酸酯,土克甾酮-11α-癸酸酯,土克甾酮-11α-月桂酸酯,土克甾酮-11α-肉豆蔻酸酯,土克甾酮-11α-花生四烯酸,22-脱氢-12β-羟基正森告甾酮,22-脱氢-12β-羟基杯苋甾酮,22-脱氢-12β-羟基森告甾酮,14-脱氧(14α-H)-20-羟基蜕皮激素,20-羟基蜕皮激素-14-甲基醚,14α-全羟基-20-羟基蜕皮激素,20-羟基蜕皮激素14,22-二甲基醚,20-羟基蜕皮激素-2,3,14,22-四甲基醚,(20S)-22-脱氧-20,21-二羟基蜕皮激素,22,25-二脱氧蜕皮激素,(22S)-20-(2,2′-二甲基呋喃基)蜕皮激素,(22R)-20-(2,2′-二甲基呋喃基)蜕皮激素,22-脱氧蜕皮激素,25-脱氧蜕皮激素,22-脱氢蜕皮激素,蜕皮激素,22-表蜕皮激素,24-甲基蜕皮激素(20-脱氧罗汉松甾酮A),蜕皮激素-22-半琥珀酸酯,25-脱氧蜕皮激素-22-β-D-吡喃葡萄糖苷,蜕皮激素-22-肉豆蔻酸酯,22-脱氢-20-异蜕皮激素,20-异蜕皮激素,20-异22-表蜕皮激素,2-脱氧蜕皮激素,石竹皂甙E(2-脱氧蜕皮激素3β-葡萄糖苷;槲皮苷A),2-脱氧蜕皮激素-22-乙酸酯,2-脱氧蜕皮激素-3,22-二乙酸酯,2-脱氧蜕皮激素-22-β-D-吡喃葡萄糖苷,2-脱氧蜕皮激素25-β-D-吡喃葡萄糖苷,2-脱氧-21-羟基蜕皮激素,3-表-22-异蜕皮激素,3-脱氢-2-脱氧蜕皮激素(石竹皂甙),3-脱氢蜕皮激素,3-脱氢-2-脱氧蜕皮激素-22-乙酸酯,蜕皮激素-6-羧基甲基肟,蜕皮激素-2,3-缩丙酮,14-表-20-羟基蜕皮激素-2,3-缩丙酮,20-羟基蜕皮激素-20,22-缩丙酮,14-表-20-羟基蜕皮激素-2,3,20,22-二缩丙酮,藜酮-20,22-对羟基亚苄基缩醛,后甾酮,(20S)-二氢后甾酮,(20S)二氢后甾酮,后甾酮-20-丹酰肼,(20S)-二氢后甾酮-2,3,20-三苯甲酸酯,(20R)-二氢后甾酮-2,3,20-三苯甲酸酯,(20R)-二氢后甾酮-2,3-缩丙酮,(20S)-二氢后甾酮-2,3-缩丙酮,(5α-H)-二氢红苋甾酮,2,14,22,25-四脱氧-5α-蜕皮激素,5α-酮二醇,蚕固醇(bombycosterol),2α,3α,22S,25-四羟基-5α-胆甾烷-6-酮,(5α-H)-2-脱氧-21-羟基蜕皮激素,栗甾酮,24-表-栗甾酮,(5αα-H)-2-脱氧七羟基胆甾烯酮A,(5α-H)-22-脱氧七羟基胆甾烯酮A,(5α-H)-20-羟基蜕皮激素,24,25-二脱氢山梨糖苷酮(dacryhanansterone),25,26-二脱氢山梨糖苷酮,5-脱氧卡拉达酮(kaladasterone)(山梨糖苷酮),(14α-H)-14-脱氧-25-羟基山梨糖苷酮,25-羟基山梨糖苷酮,红苋甾酮,(5β-H)-二氢红苋甾酮,二氢红苋甾酮-17β-乙酸酯,斯迪甾酮(sidisterone),20-羟基蜕皮激素-2,3,22-三乙酸酯,14-脱氧(14β-H)-20-羟基蜕皮激素,14-表-20-羟基蜕皮激素,9α,20-二羟基蜕皮激素,马可甾酮(malacosterone),2-脱氧埃克甾酮B-3-β-D-吡喃葡萄糖苷,筋骨草内酯,香茅素B,2β,3β,6α-三羟基-5β-胆甾醇,2β,3β,6β-三羟基-5β-胆甾醇,14-脱氢施达雄酮,旌节花甾酮B,2β,3β,9α,20R,22R,25-六羟基-5β-胆固醇-7,14-二烯-6-酮,卡拉达酮,(14β-H)-14-脱氧-25-羟基山梨糖苷酮,4-脱氢-20-羟基蜕皮激素,14-甲基-12-烯-施达雄酮,14-甲基-12-烯-15,20-二羟基蜕皮激素,罗汉松甾酮B,2β,3β,20R,22R-四羟基-25-氟-5β-胆固醇-8,14-二烯-6-酮(25-氟罗汉松甾酮B),卡龙酮,14-脱氧-14,18-环-20-羟基蜕皮激素,9α,14α-环氧-20-羟基蜕皮激素,9βα,14β-环氧-20-羟基蜕皮激素,9α,14α-环氧-20-羟基蜕皮激素2,3,20,22-二缩丙酮,28-同芸苔素内酯,异-同芸苔素内酯。
在一些实施方式中,用于本发明的方法的配体是下通式的化合物:
其中X和X′独立地是O或S;
Y是:
(a)取代或未取代的苯基,其中取代基独立地是1-5H、(C1-C4)烷基、(C1-C4)烷氧基、(C2-C4)烯基、卤素(F,Cl,Br,I)、(C1-C4)卤代烷基、羟基、氨基、氰基、或硝基;或
(b)取代或未取代的2-吡啶基、3-吡啶基、或4-吡啶基,其中取代基独立地是1-4H、(C1-C4)烷基、(C1-C4)烷氧基、(C2-C4)烯基、卤素(F,Cl,Br,I)、(C1-C4)卤代烷基、羟基、氨基、氰基、或硝基;R1和R2独立地是:H;氰基;氰基取代或未取代的(C1-C7)支链或直链烷基;氰基取代或未取代的(C2-C7)支链或直链烯基;氰基取代或未取代的(C3-C7)支链或直链烯基烷基;或R1和R2的化合价一起形成(C1-C7)氰基取代或未取代的亚烷基(RaRbC≡),其中Ra和Rb中的无取代基碳之和为0-6;R3是H、甲基、乙基、正丙基、异丙基或氰基;R4、R7、和R8独立地为:H,(C1-C4)烷基,(C1-C4)烷氧基,(C2-C4)烯基,卤素(F,Cl,Br,I),(C1-C4)卤代烷基,羟基,氨基,氰基或硝基;并且R5和R6独立地为:H,(C1-C4)烷基,(C2-C4)烯基,(C3-C4)烯基烷基,卤素(F,Cl,Br,I),(C1-C4)卤代烷基,(C1-C4)烷氧基,羟基,氨基,氰基,硝基或一起作为(-OCHR9CHR10O-)型的键与它们所连接的苯基碳形成环;其中R9和R10独立地为:H,卤素,(C1-C3)烷基,(C2-C3)烯基,(C1-C3)烷氧基(C1-C3)烷基,苯甲酸基(C1-C3)烷基,羟基(C1-C3)烷基,卤代(C1-C3)烷基,甲酰基,甲酰基(C1-C3)烷基,氰基,氰基(C1-C3)烷基,羧基,羧基(C1-C3)烷基,(C1-C3)烷氧基羰基(C1-C3)烷基,(C1-C3)烷基羰基(C1-C3)烷基,(C1-C3)烷酰基氧基(C1-C3)烷基,氨基(C1-C3)烷基,(C1-C3)烷基氨基(C1-C3)烷基(-(CH2)nRcRe),肟基(-CH=NOH),肟基(C1-C3)烷基,(C1-C3)烷肟基(-C=NORd),烷肟基(C1-C3)烷基,(C1-C3)酰胺基(-C(O)NReRf),(C1-C3)酰胺基(C1-C3)烷基,(C1-C3)脲氨基(-C=NNHC(O)NReRf),脲氨基(C1-C3)烷基,氨基羰基氧基(-OC(O)NHRg),氨基羰基氧基(C1-C3)烷基,五氟苯氧基羰基,五氟苯氧基羰基(C1-C3)烷基,对甲苯磺酰基氧基(C1-C3)烷基,芳基磺酰基氧基(C1-C3)烷基,(C1-C3)硫代(C1-C3)烷基,(C1-C3)烷基砜(C1-C3)烷基,(C1-C3)烷基磺酰基(C1-C3)烷基,或(C1-C5)三取代-甲硅烷氧基(C1-C3)烷基(-(CH2)nSiORdReRg);其中n=1-3,Rc和Rd代表指定长度的直链或支链烃链,Re、Rf代表H或指定长度的直链或支链烃链,Rg代表(C1-C3)烷基或任选被卤素或(C1-C3)烷基取代的芳基,并且Rc,Rd,Re,Rf和Rg彼此独立;
前提是:
i)当R9和R10都是H时,或
ii)当R9或R10是卤素、(C1-C3)烷基、(C1-C3)烷氧基(C1-C3)烷基、或苯甲酰氧基(C1-C3)烷基时,或
iii)当R5和R6不一起形成(-OCHR9CHR10O-)型连接时,
基团R1或R2的任一或两者的碳原子的数量,排除氰基取代的那些,超过4,并且基团R1、R2、和R3的总和的碳原子的数量,排除氰基取代的那些,是10、11或12。
本发明的多核苷酸
本发明的新型基于蜕皮激素受体/类视黄醇X受体的配体诱导型多肽耦合器系统可以包含具有编码包含EcR核受体多肽组分和无活性信号传导结构域或RXR核受体多肽组分和无活性信号传导结构域的杂合多肽的多核苷酸序列的表达盒。这些表达盒,它们包含的多核苷酸,及其编码的杂合多肽可用作基于EcR/RXR的配体诱导型多肽耦合器系统的组分,以调节宿主细胞内信号传导结构域的活性。
因此,本发明提供编码具有EcR核受体多肽组分和物活性信号传导结构域和/或RXR核受体多肽组分和无活性信号传导结构域的杂合多肽的分离的多核苷酸。编码本发明的EcR和/或RXR核受体多肽组分的分离的多核苷酸包括但不限于上述多核苷酸序列,包括本文所述的野生型,截短和含取代突变的EcR多肽和/或本文所述的野生型,截短和嵌合RXR多肽,包括其组合。
此外,本发明的分离的多核苷酸可以具有编码信号传导结构域的多核苷酸序列,包括本文所述的那些。这些信号传导结构域的多核苷酸序列可以通过本领域普通技术人员已知的可公开获得的数据库容易地获得。这样的数据库包括但不限于GenBank(ncbi.nlm.nih.gov/genbank),UniProt(uniprot.org)等。
本发明的多肽
本发明的新型基于蜕皮激素受体/类视黄醇X受体的配体诱导型多肽耦合器系统可以包含具有多核苷酸的表达盒,所述多核苷酸编码包含EcR多肽和/或无活性信号传导结构域或RXR多肽和无活性信号传导结构域的杂合多肽。这些表达盒,它们包含的多核苷酸,及其编码的杂合多肽可用作基于EcR/RXR的配体诱导型多肽耦合器系统的组分,以调节宿主细胞内信号传导结构域的活性。
因此,本发明还涉及具有本发明的EcR多肽和无活性信号传导结构域(例如,信号传导分子,信号传导结构域,互补蛋白质片段,蛋白质亚基以及天然或工程改造的部分或截短的蛋白质)和/或RXR多肽和无活性信号结构域(例如,信号传导分子,信号传导结构域,互补蛋白质片段,蛋白质亚基以及天然或工程改造的部分或截短的蛋白质)的分离的杂合多肽。本发明的分离的多肽的EcR和/或RXR结构域可以包括但不限于本文所述的多肽序列,包括本文所述的野生型,截短的,功能性片段和含有取代突变的EcR配体结合结构域,/或本文所述的野生型,截短的,功能片段,和嵌合RXR多肽,包括其组合。
此外,本发明的分离的杂合多肽可以具有信号传导结构域(例如,信号传导分子,信号传导结构域,互补蛋白质片段,蛋白质亚基,天然的或工程改造的部分或截短的蛋白质),包括本文所述的那些。这种信号传导结构域的氨基酸序列可以通过本领域普通技术人员已知的可公开获得的数据库容易获得。这样的数据库包括但不限于GenBank(ncbi.nlm.nih.gov/genbank),UniProt(uniprot.org)等。
本发明的表达载体
本发明的新型基于蜕皮激素受体/类视黄醇X受体的配体诱导型多肽耦合器系统包含含有多核苷酸的表达盒,该多核苷酸编码包含EcR配体结合域和无活性信号传导结构域的杂合多肽(例如,信号传导分子,互补蛋白质片段,蛋白质亚基,和天然或工程改造的部分或截短的蛋白质)和/或RXR多肽和无活性信号传导结构域(例如,信号传导分子,信号传导结构域,互补蛋白质片段,蛋白质亚基,以及天然的或工程改造的部分或截短的蛋白质)。这些表达盒,它们包含的多核苷酸及其编码的杂合多肽可以使用任何合适的表达载体在宿主细胞中表达。合适的表达载体是本领域普通技术人员所熟知的,并且鉴于所需宿主细胞,本领域普通技术人员可容易确定表达载体和最佳表达条件的选择。可用于本发明的示例性表达载体包括但不限于上述表达载体。
宿主细胞
如上所述,本发明的配体诱导型多肽耦合器系统可用于调节宿主细胞内的蛋白质-蛋白质相互作用,即缔合。转基因宿主细胞中的调节可用于调节各种感兴趣蛋白质。因此,本发明提供了包含根据本发明的配体诱导型多肽耦合器系统的分离的宿主细胞。本发明还提供了分离的宿主细胞,其包含配体诱导型多肽耦合器系统,其包含一种或多种根据本发明的表达盒。本发明还提供了包含多核苷酸或多肽的分离的宿主细胞。分离的宿主细胞可以是原核或真核宿主细胞。
在某些实施方式中,分离的宿主细胞是原核宿主细胞或真核宿主细胞。在另一个具体实施方式中,分离的宿主细胞是无脊椎动物宿主细胞或脊椎动物宿主细胞。这样的宿主细胞可以选自细菌细胞,真菌细胞,酵母细胞,线虫细胞,昆虫细胞,鱼细胞,植物细胞,禽细胞,动物细胞和哺乳动物细胞。更具体地,宿主细胞是酵母细胞,线虫细胞,昆虫细胞,植物细胞,斑马鱼细胞,鸡细胞,仓鼠细胞,小鼠细胞,大鼠细胞,兔细胞,猫细胞,狗细胞,牛细胞,山羊细胞,牛细胞,猪细胞,马细胞,绵羊细胞,猿猴细胞,猴细胞,黑猩猩细胞或人细胞。宿主细胞的示例包括但不限于,真菌或酵母物种,例如曲霉属,木霉属,酵母属,毕赤酵母,假丝酵母属,汉逊酵母属,或细菌物种,如集胞藻属,聚球藻属,沙门氏菌属,芽孢杆菌属,不动杆菌属,红球菌属,链霉菌属,埃希氏杆菌属,假单胞菌属,甲基单胞菌属,甲基杆菌属,产碱杆菌属,集胞藻属,鱼腥藻属,硫杆菌属,甲烷杆菌属和克雷伯氏菌属,动物和哺乳动物宿主细胞。
在某些实施方式中,宿主细胞是选自酵母属、毕赤酵母和假丝酵母属宿主细胞的酵母细胞。在一个具体实施方式中,宿主细胞是秀丽隐杆线虫(Caenorhabditis elegans)细胞。在另一个具体实施方式中,宿主细胞是仓鼠细胞。在另一个实施方式中,宿主细胞是鼠细胞。在另一个实施方式中,宿主细胞是猴细胞。在另一个具体实施方式中,宿主细胞是人细胞。
在另一个实施方式中,宿主细胞是选自仓鼠细胞,小鼠细胞,大鼠细胞,兔细胞,猫细胞,狗细胞,牛细胞,山羊细胞,牛细胞,猪细胞,马细胞,绵羊细胞,猴细胞,黑猩猩细胞和人细胞的哺乳动物细胞。在某些实施方式中,宿主细胞是永生化细胞,免疫细胞或T细胞。
宿主细胞的转化为本领域熟知,并可利用多种方法实现,所述方法包括但不限于电穿孔、病毒感染、质粒/载体转染、非病毒载体介导转染、粒子轰击等。所需基因产物的表达涉及在适当条件下培养所述经转化的宿主细胞并诱导所述转化基因的表达。原核和真核细胞的培养条件和基因表达操作方案是本领域熟知的。收集细胞、根据基因产物特定方案分离所述基因产物。
此外,可以选择调节插入的多核苷酸的表达的宿主细胞,或以所需的特定方式修饰和加工多肽产物。
本发明还涉及包含根据本发明的分离的宿主细胞的非人生物体。在某些实施方式中,非人生物体选自细菌,真菌,酵母,动物和哺乳动物。在一些实施方式中,非人生物体是酵母,小鼠,大鼠,兔,猫,狗,牛,山羊,猪,马,绵羊,猴或黑猩猩。
在某些实施方式中,非人生物体是选自酵母属,毕赤酵母和假丝酵母属的酵母。在另一个实施方式中,非人生物体是小家鼠。
调节翻译后活性的方法
申请人的发明包括将LIPC纳入多肽(产生异源多肽)以调节宿主细胞中信号传导结构域的活性的方法。具体地,申请人的发明提供了通过将LIPC组分纳入激活或抑制在宿主细胞中表达的多肽的信号,并使宿主细胞与配体接触的方法以诱导或抑制信号传导蛋白和途径的激活,以产生信号转导激活或抑制。
在一个实施方式中,细胞信号转导通过LIPC诱导的信号结构域(例如,信号传导分子,信号传导结构域,互补蛋白质片段,蛋白质亚基,以及天然或工程改造的部分或截短的蛋白质)的二聚化或寡聚化来激活。
在另一个实施方式中,通过LIPC诱导抑制性多肽对细胞信号转导(激活)途径多肽的二聚化来抑制细胞信号转导。在一个实施方式中,单独的LIPC的组分(例如,EcR或RxR/USP多肽)是抑制性多肽。
在一个实施方式中,LIPC多肽用于调节(即,激活或抑制)胞内蛋白质-蛋白质相互作用。在另一个实施方式中,LIPC多肽用于调节(即,激活或抑制)胞外蛋白质-蛋白质相互作用。在另一个实施方式中,LIPC多肽用于调节(即,激活或抑制)跨膜蛋白-蛋白质相互作用。
用于通过宿主细胞中的LIPC表达和调节活性的感兴趣基因和蛋白质可以是内源基因或异源基因。所需基因或蛋白质的核酸或氨基酸序列信息可以位于许多公共接入数据库之一,例如GenBank,EMBL,Swiss-Prot和PIR,或在许多生物学相关杂志出版物中。因此,本领域普通技术人员可获得几乎所有已知基因和蛋白质的核酸序列和/或氨基酸序列信息。然后可以使用这样的信息来构建用于在本文所述的申请人的方法中使用的表达盒内表达感兴趣蛋白质(例如,信号传导结构域)的所需构建体。
使用申请人的方法在宿主细胞中表达的感兴趣基因和蛋白质的示例包括但不限于,酶,报告基因,结构蛋白,跨膜受体,核受体,编码参与疾病、病症、功能障碍、遗传缺陷的多肽或信号传导结构域的基因,抗体,药物发现、蛋白质组学分析和应用的靶标等。
在本发明的配体诱导型多肽耦合器(LIPC)可用于并纳入生物细胞信号转导系统的控制或影响的许多不同方式中,一个一般的示例是用本发明的LIPC组分取代任何其他配体诱导型二聚化或多聚化系统(如利用FK506或雷帕霉素的那些)。
本发明的配体诱导型多肽耦合器(LIPC)可以使用并纳入生物细胞信号转导系统的控制中的具体示例是,用于产生诱导型细胞“杀死开关”或“自杀开关”;如已经提出用于破坏遗传修饰的T细胞(例如,嵌合抗原受体(CAR)T细胞)。
上述参考系统的一些示例在以下内容中综述和描述:
公开号WO2015157252(PCT/US2015/024671)“使用抗-CD19嵌合抗原受体治疗癌症”;
公开号WO2011146862(PCT/US2011/037381)“诱导选择性细胞凋亡的方法”;
公开号WO2014164348(PCT/US2014/022004)“修饰的胱天蛋白酶(caspase)及其用途”;
公开号WO2014151960(PCT/US2014/026734)“用于控制T细胞增殖的方法”;
公开号WO2014127261(PCT/US2014/016527)“嵌合抗原受体及其使用方法”;
Auslander等,″从基因开关到哺乳动物设计细胞:现在和未来预期(From geneswitches to mammalian designer cells:Present and future prospects″,Trends inBiotechnology),第31卷,第3期,第155-168页(2013);
Chakravarti等,″基于细胞的癌症免疫治疗的合成生物学(Synthetic biologyin cell-based cancer immunotherapy)″,Trends in Biotechnology,第33卷,第8期,第449-461页(2015);
Ciceri等,″在针对白血病的家族造血干细胞移植后输入自杀基因工程改造的供体淋巴细胞(TK007试验):非随机I-II期研究(Infusion of suicide-gene-engineereddonor lymphocytes after family haploidentical haemopoietic stem-celltransplantation for leukaemia(the TK007 trial):A non-randomised phase I-IIstudy)″,Lancet Oncol.10,489-500(2009);Medline doi:10.1016/S1470-2045(09)70074-9;
Wu等,″通过小分子门选的嵌合受体远程控制治疗性T细胞(Remote control oftherapeutic T cells through a small molecule-gated chimeric receptor)″,10.1126/science.aab4077(2015);
Vilaboa等,″用于故意调控转基因表达的基因开关:系统开发和使用的最新进展(Gene switches for deliberate regulation of transgene rxpression:Recentadvances in system development and uses)″,J Genet Syndr Gene Ther2:107.doi:10.4172/2157-7412.1000107;
Stieger等,″使用四环四可调节系统的体内调节(In vivo regulation usingtetracycline-regulatable systems)″,Adv Drug Deliv Rev 61:527-541(2009);
上述参考文献各自通过引用纳入本文。
实施例1-LIPC激活的荧光素酶
申请人的遗传开关技术在激活配体的存在下驱动转录。配体结合GAL4-EcR融合蛋白的EcR配体结合结构域部分,其募集RXR-VP16组分(参见例如,图1)。发明人已经确定EcR和RXR结构域(例如在系统中使用的那些)可以作为配体诱导型多肽耦合器,驱动与EcR和RXR结构域融合的其它蛋白质的缔合。
配体诱导型多肽耦合器的作用与转录基因开关不同。使用LIPC系统,蛋白质-蛋白质相互作用是受控制的,而不是基因表达。激活水平可以通过小分子配体给予的浓度和量控制,以剂量依赖的方式调节。
如本文所述,分裂萤火虫荧光素酶系统已被用于证实配体诱导型EcR-RXR融合蛋白缔合。该系统代表了使用蛋白质开关组件的新方法。这种开关与基因转录激活开关有着根本的不同,它们是针对控制蛋白质表达的。控制蛋白质-蛋白质的相互作用,即缔合,需要仔细和特异性的工程改造,因为待缔合的分子(如二聚化或寡聚化)必须在缔合时具有一些差异功能,并且在非-配体条件下各自具有有限的,或非天然的亲和性。
方法和分析方法
已经设想并设计了一系列EcR和RXR融合(一些具有分裂萤火虫荧光素酶(fLuc))蛋白(参见图2-6)。已经使用分裂荧光素酶系统来研究其他细胞系统中的蛋白质-蛋白质相互作用(参见例如,Luker等,Proc.Natl.Acad.Sci.U.S.A.101(33):12288-93(2004),Paulmurugan和Gambhir,Anal.Chem.75(5):1295-302(2005),Fujikawa和Kato,Plant J.52(1):185-95(2007),和Leng等,PLos One8(4):e62230(2013),其各自全部内容通过引用纳入本文)。分裂荧光素酶系统具有优于分裂GFP系统的优点,因为组分在缔合时不共价结合,允许解离速率分析。
将fLuc蛋白质分成两片,彼此之间没有固有亲和性(使其无活性,直到与融合的蛋白质元件紧密缔合)用作测试蛋白质-蛋白质缔合的系统。HEK293细胞如下所示用融合到EcR和RXR结构域的分裂fLuc转染:
转染
在转染前一天,将10,000个细胞(293T细胞)接种到含有100μl没有抗生素的生长培养基(含10%胎牛血清的达氏修正伊氏培养基)的96孔板的每个孔中。成对的质粒,具有Cluc_EcR的RxR_Nluc和具有Cluc_RxR的EcR_Nluc(参见图8;图8所示构建体的氨基酸序列分别以SEQ ID NO:87-92提供,SEQ ID NO:91和92分别对应于EcR和RXR氨基序列,用于图8的构建体),根据制造商的说明书用2000转染。简言之,将个体质粒DNA(0.2μg)和0.5μl的Lipofectamine在25.0μl的I还原血清培养基中稀释,并在室温下孵育5分钟,两倍体积用于共转染。将稀释的质粒DNA与稀释的2000组合,并在室温下孵育20分钟。向96孔板的每个孔中加入50μl2000复合物。将细胞在37℃下在5%CO2培养箱中孵育24小时,然后加入激活配体Veledimex。
生物发光试验
转染后24小时(24小时),将96孔板的各孔的细胞培养基用100nM Veledimex激活配体和二甲亚砜-DMSO(阴性对照)置换。在含10%胎牛血清的达氏修正伊氏培养基中将每个组分稀释千倍,并在37℃下,5%CO2培养箱中孵育6小时。将ONE-GloTM萤光素酶测定缓冲液与含有5′-氟荧光素(荧光素类似物)的ONE-GloTM荧光素酶测定底物合并。该试剂在重建后冷冻并储存在-20℃直至使用。将萤光素酶ONE-GloTM荧光素酶底物在水浴中解冻至室温。将96孔板从培养箱中取出并在室温下平衡约1小时,在加入底物之前,将板底部用孔微板铝密封带覆盖。将100μl的ONE-GloTM荧光素酶试剂缓冲液加入到96孔板的每个孔中。在室温下孵育3分钟以确保完全细胞裂解,将96孔板置于GloMaxTM96微孔板发光计中以测量每孔的生物发光。
在没有激活配体的情况下,仅观察到背景信号。在添加激活配体后检测到fLuc信号(图7;RXR-EcR配体-和+,最右边)。加入激活配体后6小时进行fLuc测定。包括使用STAT1,一种使用相同的分裂fLuc系统显示同二聚化的蛋白质(参见例如,Luker等,(2004))的构建体用于阳性对照(参见表2)。阳性对照的信号似乎不受激活配体的影响(图7;阳性对照,STAT1配体-和+)。作为阴性对照,eGFP和单独激活配体(仅载剂)样品仅给出背景读数(图7;eGFP,配体-,和配体+)。应该注意的是,在这次运行中,配体+孔的细胞计数略低于其他孔(图7;配体+*)。数据对平均背景归一化,并以相对光单位报告。标准fLuc作为附加对照运行。
添加激活配体后,使用EcR和RXR LIPC系统产生清晰的fLuc信号。在不存在配体的情况下,仅观察到背景(参见图7)。
表2:分裂荧光素酶系统的实验设置
只有在已经暴露于激活配体的互补载体对中才能观察到阳性信号,促进EcR和RXR成分的缔合并恢复fLuc活性。配体剂量反应曲线如图9和图10所示。这项工作用于说明EcR和RXR驱动配体诱导型多肽耦合的能力,即配体介导的缔合或寡聚化,其可以在翻译后水平上控制蛋白质-蛋白质相互作用和缔合。
通过Veledimex配体的EcR二聚化诱导结果显示在图11和图12中。
本系统生成的数据可以用于预示正在进行的其他系统的分子设计。这种系统的其他用途包括但不限于,通过蛋白质-蛋白质相互作用激活的信号传导结构域(例如,信号传导分子,信号传导结构域,互补蛋白质片段,蛋白质亚基,以及天然的或工程改造的部分或截短的蛋白质)的筛选。
根据用细胞内分裂fLuc报告物的实验和结果,将进行LIPC系统的新设计。将测试EcR、RXR和分裂fLuc元件的其他配置以证明其他配对。所有这些信息可用于通知生成蛋白质的比较模型,从而为未来设计提供指导。目前的分裂fLuc载体也将在其他重要细胞类型中进行测试,以保持一致的活性。由于蛋白质在本实施例中组成型表达,当给予激活配体时,二聚化事件应该是快速的。相反,考虑到fLuc半对彼此没有亲和性并且没有共价相互作用,该系统也可用于检测除去激活配体后的解离速率动力学。信号出现和衰变实验均设想并正在进行。
此外,正在寻求其他LIPC设计。一些设计类似于上述fLuc系统的设计,其区别在于,例如,参与相互作用的分子可以是单通I型跨膜蛋白。初始设计和实验将是使用细胞内定位的EcR和RXR与位于细胞外的融合蛋白的至少部分(参见图3)。然而,还可以根据实际的测定读数来设计和测试几种其他配置。其他设计包括但不限于,具有与EcR和RXR融合的跨膜结构域的分子,其中ECR和RXR定位在细胞外,并且融合蛋白位于细胞内(参见图4)。另一个配置是EcR和RXR组分融合到跨膜结构域,而EcR、RXR和融合的信号传导结构域都位于细胞内(参见图5)。注意,除了fLuc之外,其他信号传导结构域可以用于上述各种配置。
进一步的研究将包括实验以理解结合速率和解离速率,驱动期望的激活效应所需的最佳表达水平,以及减少(如果需要)潜在背景(例如,不存在配体的情况下,未结伴蛋白质的生物学效应)。
实施例2-配体诱导的核受体组分二聚化
进行实验以测试在加入配体时是否可以诱导核受体结构域(即EcR和RxR多肽)同二聚化(图11和12)。使用STAT1作为对照多肽,因为据报道其自身二聚化不依赖配体添加。图中的缩写如下:
“EcR”是蜕皮激素受体;
“EcR-EcR”是指“EcR_Nluc+Cluc_EcR”,其是分裂成两半的荧光素酶多肽,使得EcR多肽与荧光素酶多肽片段的N末端融合(EcR_Nluc),并且另一个荧光素酶片段具有融合到其C末端的EcR多肽(Cluc_EcR);从而在EcR同二聚化时激活荧光素酶(产生生物发光);
“RxR”是类视黄醇X受体;
“空白”表示没有添加载体;
“eGFP”是增强的GFP(用作阴性对照);
“RxR_EcR”是指“EcR_Nluc+Cluc_RXR”,其是分裂成两半的荧光素酶多肽,使得EcR多肽与荧光素酶多肽片段的N末端融合(EcR_Nluc),并且另一个荧光素酶片段具有与其C末端融合的RxR多肽(Cluc_RxR);从而在EcR同二聚化时激活荧光素酶(产生生物发光);
结果(图11和12)表明EcR结构域可以在配体添加时诱导同二聚化。然而,生物发光信号的差异较低,这可能是由于EcR结构域之间的低亲和性。基于生物发光输出,配体添加时存在显著的EcR结构域同二聚化。相反,令人惊讶的是,RxR结构域被观察到不依赖配体的同二聚化。此外,通过由配体诱导的RxR和EcR结构域的异二聚化观察到最强的信号(生物发光)。因此,这些结果表明通过由配体诱导的异二聚化,RxR和EcR结构域之间的较强相互作用。实际上,尽管每个结构域的同二聚化有更有限的亲和性,但是意外地观察到并发现RxR结构域的配体非依赖性同二聚化。
除非另外定义,否则,本文中所使用的所有技术和科学术语都具有本发明领域普通技术人员通常所理解的同样含义。
本文所引用的所有文献以法律允许的最大程度引入以供参考。这些文献的讨论内容仅仅是为了总结其作者的主张。并不承认任何文献(或任何文献的一部分)是相关现有技术。申请人保留攻击任何引用文献的准确性和相关性的权利。
附录I-序列
序列表
<110> 英特瑞克斯顿股份有限公司(INTREXON CORPORATION)
<120> 配体诱导型多肽耦合器系统
<130> 0100-0013WO1
<140>
<141>
<150> 62/140,380
<151> 2015-03-30
<160> 94
<170> PatentIn version 3.5
<210> 1
<211> 1054
<212> DNA
<213> 云杉卷叶蛾(Choristoneura fumiferana)
<400> 1
cctgagtgcg tagtacccga gactcagtgc gccatgaagc ggaaagagaa gaaagcacag 60
aaggagaagg acaaactgcc tgtcagcacg acgacggtgg acgaccacat gccgcccatt 120
atgcagtgtg aacctccacc tcctgaagca gcaaggattc acgaagtggt cccaaggttt 180
ctctccgaca agctgttgga gacaaaccgg cagaaaaaca tcccccagtt gacagccaac 240
cagcagttcc ttatcgccag gctcatctgg taccaggacg ggtacgagca gccttctgat 300
gaagatttga agaggattac gcagacgtgg cagcaagcgg acgatgaaaa cgaagagtct 360
gacactccct tccgccagat cacagagatg actatcctca cggtccaact tatcgtggag 420
ttcgcgaagg gattgccagg gttcgccaag atctcgcagc ctgatcaaat tacgctgctt 480
aaggcttgct caagtgaggt aatgatgctc cgagtcgcgc gacgatacga tgcggcctca 540
gacagtgttc tgttcgcgaa caaccaagcg tacactcgcg acaactaccg caaggctggc 600
atggcctacg tcatcgagga tctactgcac ttctgccggt gcatgtactc tatggcgttg 660
gacaacatcc attacgcgct gctcacggct gtcgtcatct tttctgaccg gccagggttg 720
gagcagccgc aactggtgga agaaatccag cggtactacc tgaatacgct ccgcatctat 780
atcctgaacc agctgagcgg gtcggcgcgt tcgtccgtca tatacggcaa gatcctctca 840
atcctctctg agctacgcac gctcggcatg caaaactcca acatgtgcat ctccctcaag 900
ctcaagaaca gaaagctgcc gcctttcctc gaggagatct gggatgtggc ggacatgtcg 960
cacacccaac cgccgcctat cctcgagtcc cccacgaatc tctagcccct gcgcgcacgc 1020
atcgccgatg ccgcgtccgg ccgcgctgct ctga 1054
<210> 2
<211> 1288
<212> DNA
<213> 云杉卷叶蛾(Choristoneura fumiferana)
<400> 2
aagggccctg cgccccgtca gcaagaggaa ctgtgtctgg tatgcgggga cagagcctcc 60
ggataccact acaatgcgct cacgtgtgaa gggtgtaaag ggttcttcag acggagtgtt 120
accaaaaatg cggtttatat ttgtaaattc ggtcacgctt gcgaaatgga catgtacatg 180
cgacggaaat gccaggagtg ccgcctgaag aagtgcttag ctgtaggcat gaggcctgag 240
tgcgtagtac ccgagactca gtgcgccatg aagcggaaag agaagaaagc acagaaggag 300
aaggacaaac tgcctgtcag cacgacgacg gtggacgacc acatgccgcc cattatgcag 360
tgtgaacctc cacctcctga agcagcaagg attcacgaag tggtcccaag gtttctctcc 420
gacaagctgt tggagacaaa ccggcagaaa aacatccccc agttgacagc caaccagcag 480
ttccttatcg ccaggctcat ctggtaccag gacgggtacg agcagccttc tgatgaagat 540
ttgaagagga ttacgcagac gtggcagcaa gcggacgatg aaaacgaaga gtctgacact 600
cccttccgcc agatcacaga gatgactatc ctcacggtcc aacttatcgt ggagttcgcg 660
aagggattgc cagggttcgc caagatctcg cagcctgatc aaattacgct gcttaaggct 720
tgctcaagtg aggtaatgat gctccgagtc gcgcgacgat acgatgcggc ctcagacagt 780
gttctgttcg cgaacaacca agcgtacact cgcgacaact accgcaaggc tggcatggcc 840
tacgtcatcg aggatctact gcacttctgc cggtgcatgt actctatggc gttggacaac 900
atccattacg cgctgctcac ggctgtcgtc atcttttctg accggccagg gttggagcag 960
ccgcaactgg tggaagaaat ccagcggtac tacctgaata cgctccgcat ctatatcctg 1020
aaccagctga gcgggtcggc gcgttcgtcc gtcatatacg gcaagatcct ctcaatcctc 1080
tctgagctac gcacgctcgg catgcaaaac tccaacatgt gcatctccct caagctcaag 1140
aacagaaagc tgccgccttt cctcgaggag atctgggatg tggcggacat gtcgcacacc 1200
caaccgccgc ctatcctcga gtcccccacg aatctctagc ccctgcgcgc acgcatcgcc 1260
gatgccgcgt ccggccgcgc tgctctga 1288
<210> 3
<211> 1650
<212> DNA
<213> 黑腹果蝇(Drosophila melanogaster)
<400> 3
cggccggaat gcgtcgtccc ggagaaccaa tgtgcgatga agcggcgcga aaagaaggcc 60
cagaaggaga aggacaaaat gaccacttcg ccgagctctc agcatggcgg caatggcagc 120
ttggcctctg gtggcggcca agactttgtt aagaaggaga ttcttgacct tatgacatgc 180
gagccgcccc agcatgccac tattccgcta ctacctgatg aaatattggc caagtgtcaa 240
gcgcgcaata taccttcctt aacgtacaat cagttggccg ttatatacaa gttaatttgg 300
taccaggatg gctatgagca gccatctgaa gaggatctca ggcgtataat gagtcaaccc 360
gatgagaacg agagccaaac ggacgtcagc tttcggcata taaccgagat aaccatactc 420
acggtccagt tgattgttga gtttgctaaa ggtctaccag cgtttacaaa gataccccag 480
gaggaccaga tcacgttact aaaggcctgc tcgtcggagg tgatgatgct gcgtatggca 540
cgacgctatg accacagctc ggactcaata ttcttcgcga ataatagatc atatacgcgg 600
gattcttaca aaatggccgg aatggctgat aacattgaag acctgctgca tttctgccgc 660
caaatgttct cgatgaaggt ggacaacgtc gaatacgcgc ttctcactgc cattgtgatc 720
ttctcggacc ggccgggcct ggagaaggcc caactagtcg aagcgatcca gagctactac 780
atcgacacgc tacgcattta tatactcaac cgccactgcg gcgactcaat gagcctcgtc 840
ttctacgcaa agctgctctc gatcctcacc gagctgcgta cgctgggcaa ccagaacgcc 900
gagatgtgtt tctcactaaa gctcaaaaac cgcaaactgc ccaagttcct cgaggagatc 960
tgggacgttc atgccatccc gccatcggtc cagtcgcacc ttcagattac ccaggaggag 1020
aacgagcgtc tcgagcgggc tgagcgtatg cgggcatcgg ttgggggcgc cattaccgcc 1080
ggcattgatt gcgactctgc ctccacttcg gcggcggcag ccgcggccca gcatcagcct 1140
cagcctcagc cccagcccca accctcctcc ctgacccaga acgattccca gcaccagaca 1200
cagccgcagc tacaacctca gctaccacct cagctgcaag gtcaactgca accccagctc 1260
caaccacagc ttcagacgca actccagcca cagattcaac cacagccaca gctccttccc 1320
gtctccgctc ccgtgcccgc ctccgtaacc gcacctggtt ccttgtccgc ggtcagtacg 1380
agcagcgaat acatgggcgg aagtgcggcc ataggaccca tcacgccggc aaccaccagc 1440
agtatcacgg ctgccgttac cgctagctcc accacatcag cggtaccgat gggcaacgga 1500
gttggagtcg gtgttggggt gggcggcaac gtcagcatgt atgcgaacgc ccagacggcg 1560
atggccttga tgggtgtagc cctgcattcg caccaagagc agcttatcgg gggagtggcg 1620
gttaagtcgg agcactcgac gactgcatag 1650
<210> 4
<211> 894
<212> DNA
<213> 黄粉虫(Tenebrio molitor)
<400> 4
aggccggaat gtgtggtacc ggaagtacag tgtgctgtta agagaaaaga gaagaaagcc 60
caaaaggaaa aagataaacc aaacagcact actaacggct caccagacgt catcaaaatt 120
gaaccagaat tgtcagattc agaaaaaaca ttgactaacg gacgcaatag gatatcacca 180
gagcaagagg agctcatact catacatcga ttggtttatt tccaaaacga atatgaacat 240
ccgtctgaag aagacgttaa acggattatc aatcagccga tagatggtga agatcagtgt 300
gagatacggt ttaggcatac cacggaaatt acgatcctga ctgtgcagct gatcgtggag 360
tttgccaagc ggttaccagg cttcgataag ctcctgcagg aagatcaaat tgctctcttg 420
aaggcatgtt caagcgaagt gatgatgttc aggatggccc gacgttacga cgtccagtcg 480
gattccatcc tcttcgtaaa caaccagcct tatccgaggg acagttacaa tttggccggt 540
atgggggaaa ccatcgaaga tctcttgcat ttttgcagaa ctatgtactc catgaaggtg 600
gataatgccg aatatgcttt actaacagcc atcgttattt tctcagagcg accgtcgttg 660
atagaaggct ggaaggtgga gaagatccaa gaaatctatt tagaggcatt gcgggcgtac 720
gtcgacaacc gaagaagccc aagccggggc acaatattcg cgaaactcct gtcagtacta 780
actgaattgc ggacgttagg caaccaaaat tcagagatgt gcatctcgtt gaaattgaaa 840
aacaaaaagt taccgccgtt cctggacgaa atctgggacg tcgacttaaa agca 894
<210> 5
<211> 948
<212> DNA
<213> 美洲钝眼蜱(Amblyomma americanum)
<400> 5
cggccggaat gtgtggtgcc ggagtaccag tgtgccatca agcgggagtc taagaagcac 60
cagaaggacc ggccaaacag cacaacgcgg gaaagtccct cggcgctgat ggcgccatct 120
tctgtgggtg gcgtgagccc caccagccag cccatgggtg gcggaggcag ctccctgggc 180
agcagcaatc acgaggagga taagaagcca gtggtgctca gcccaggagt caagcccctc 240
tcttcatctc aggaggacct catcaacaag ctagtctact accagcagga gtttgagtcg 300
ccttctgagg aagacatgaa gaaaaccacg cccttccccc tgggagacag tgaggaagac 360
aaccagcggc gattccagca cattactgag atcaccatcc tgacagtgca gctcattgtg 420
gagttctcca agcgggtccc tggctttgac acgctggcac gagaagacca gattactttg 480
ctgaaggcct gctccagtga agtgatgatg ctgagaggtg cccggaaata tgatgtgaag 540
acagattcta tagtgtttgc caataaccag ccgtacacga gggacaacta ccgcagtgcc 600
agtgtggggg actctgcaga tgccctgttc cgcttctgcc gcaagatgtg tcagctgaga 660
gtagacaacg ctgaatacgc actcctgacg gccattgtaa ttttctctga acggccatca 720
ctggtggacc cgcacaaggt ggagcgcatc caggagtact acattgagac cctgcgcatg 780
tactccgaga accaccggcc cccaggcaag aactactttg cccggctgct gtccatcttg 840
acagagctgc gcaccttggg caacatgaac gccgaaatgt gcttctcgct caaggtgcag 900
aacaagaagc tgccaccgtt cctggctgag atttgggaca tccaagag 948
<210> 6
<211> 334
<212> PRT
<213> 云杉卷叶蛾(Choristoneura fumiferana)
<400> 6
Pro Glu Cys Val Val Pro Glu Thr Gln Cys Ala Met Lys Arg Lys Glu
1 5 10 15
Lys Lys Ala Gln Lys Glu Lys Asp Lys Leu Pro Val Ser Thr Thr Thr
20 25 30
Val Asp Asp His Met Pro Pro Ile Met Gln Cys Glu Pro Pro Pro Pro
35 40 45
Glu Ala Ala Arg Ile His Glu Val Val Pro Arg Phe Leu Ser Asp Lys
50 55 60
Leu Leu Glu Thr Asn Arg Gln Lys Asn Ile Pro Gln Leu Thr Ala Asn
65 70 75 80
Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln Asp Gly Tyr Glu
85 90 95
Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln Thr Trp Gln Gln
100 105 110
Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg Gln Ile Thr
115 120 125
Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys Gly
130 135 140
Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln Ile Thr Leu Leu
145 150 155 160
Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val Ala Arg Arg Tyr
165 170 175
Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn Gln Ala Tyr Thr
180 185 190
Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val Ile Glu Asp Leu
195 200 205
Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp Asn Ile His
210 215 220
Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp Arg Pro Gly Leu
225 230 235 240
Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr Tyr Leu Asn Thr
245 250 255
Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser Ala Arg Ser Ser
260 265 270
Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu Arg Thr Leu
275 280 285
Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys Leu Lys Asn Arg
290 295 300
Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val Ala Asp Met Ser
305 310 315 320
His Thr Gln Pro Pro Pro Ile Leu Glu Ser Pro Thr Asn Leu
325 330
<210> 7
<211> 549
<212> PRT
<213> 黑腹果蝇(Drosophila melanogaster)
<400> 7
Arg Pro Glu Cys Val Val Pro Glu Asn Gln Cys Ala Met Lys Arg Arg
1 5 10 15
Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Met Thr Thr Ser Pro Ser
20 25 30
Ser Gln His Gly Gly Asn Gly Ser Leu Ala Ser Gly Gly Gly Gln Asp
35 40 45
Phe Val Lys Lys Glu Ile Leu Asp Leu Met Thr Cys Glu Pro Pro Gln
50 55 60
His Ala Thr Ile Pro Leu Leu Pro Asp Glu Ile Leu Ala Lys Cys Gln
65 70 75 80
Ala Arg Asn Ile Pro Ser Leu Thr Tyr Asn Gln Leu Ala Val Ile Tyr
85 90 95
Lys Leu Ile Trp Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Glu Glu Asp
100 105 110
Leu Arg Arg Ile Met Ser Gln Pro Asp Glu Asn Glu Ser Gln Thr Asp
115 120 125
Val Ser Phe Arg His Ile Thr Glu Ile Thr Ile Leu Thr Val Gln Leu
130 135 140
Ile Val Glu Phe Ala Lys Gly Leu Pro Ala Phe Thr Lys Ile Pro Gln
145 150 155 160
Glu Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met
165 170 175
Leu Arg Met Ala Arg Arg Tyr Asp His Ser Ser Asp Ser Ile Phe Phe
180 185 190
Ala Asn Asn Arg Ser Tyr Thr Arg Asp Ser Tyr Lys Met Ala Gly Met
195 200 205
Ala Asp Asn Ile Glu Asp Leu Leu His Phe Cys Arg Gln Met Phe Ser
210 215 220
Met Lys Val Asp Asn Val Glu Tyr Ala Leu Leu Thr Ala Ile Val Ile
225 230 235 240
Phe Ser Asp Arg Pro Gly Leu Glu Lys Ala Gln Leu Val Glu Ala Ile
245 250 255
Gln Ser Tyr Tyr Ile Asp Thr Leu Arg Ile Tyr Ile Leu Asn Arg His
260 265 270
Cys Gly Asp Ser Met Ser Leu Val Phe Tyr Ala Lys Leu Leu Ser Ile
275 280 285
Leu Thr Glu Leu Arg Thr Leu Gly Asn Gln Asn Ala Glu Met Cys Phe
290 295 300
Ser Leu Lys Leu Lys Asn Arg Lys Leu Pro Lys Phe Leu Glu Glu Ile
305 310 315 320
Trp Asp Val His Ala Ile Pro Pro Ser Val Gln Ser His Leu Gln Ile
325 330 335
Thr Gln Glu Glu Asn Glu Arg Leu Glu Arg Ala Glu Arg Met Arg Ala
340 345 350
Ser Val Gly Gly Ala Ile Thr Ala Gly Ile Asp Cys Asp Ser Ala Ser
355 360 365
Thr Ser Ala Ala Ala Ala Ala Ala Gln His Gln Pro Gln Pro Gln Pro
370 375 380
Gln Pro Gln Pro Ser Ser Leu Thr Gln Asn Asp Ser Gln His Gln Thr
385 390 395 400
Gln Pro Gln Leu Gln Pro Gln Leu Pro Pro Gln Leu Gln Gly Gln Leu
405 410 415
Gln Pro Gln Leu Gln Pro Gln Leu Gln Thr Gln Leu Gln Pro Gln Ile
420 425 430
Gln Pro Gln Pro Gln Leu Leu Pro Val Ser Ala Pro Val Pro Ala Ser
435 440 445
Val Thr Ala Pro Gly Ser Leu Ser Ala Val Ser Thr Ser Ser Glu Tyr
450 455 460
Met Gly Gly Ser Ala Ala Ile Gly Pro Ile Thr Pro Ala Thr Thr Ser
465 470 475 480
Ser Ile Thr Ala Ala Val Thr Ala Ser Ser Thr Thr Ser Ala Val Pro
485 490 495
Met Gly Asn Gly Val Gly Val Gly Val Gly Val Gly Gly Asn Val Ser
500 505 510
Met Tyr Ala Asn Ala Gln Thr Ala Met Ala Leu Met Gly Val Ala Leu
515 520 525
His Ser His Gln Glu Gln Leu Ile Gly Gly Val Ala Val Lys Ser Glu
530 535 540
His Ser Thr Thr Ala
545
<210> 8
<211> 401
<212> PRT
<213> 云杉卷叶蛾(Choristoneura fumiferana)
<400> 8
Cys Leu Val Cys Gly Asp Arg Ala Ser Gly Tyr His Tyr Asn Ala Leu
1 5 10 15
Thr Cys Glu Gly Cys Lys Gly Phe Phe Arg Arg Ser Val Thr Lys Asn
20 25 30
Ala Val Tyr Ile Cys Lys Phe Gly His Ala Cys Glu Met Asp Met Tyr
35 40 45
Met Arg Arg Lys Cys Gln Glu Cys Arg Leu Lys Lys Cys Leu Ala Val
50 55 60
Gly Met Arg Pro Glu Cys Val Val Pro Glu Thr Gln Cys Ala Met Lys
65 70 75 80
Arg Lys Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Leu Pro Val Ser
85 90 95
Thr Thr Thr Val Asp Asp His Met Pro Pro Ile Met Gln Cys Glu Pro
100 105 110
Pro Pro Pro Glu Ala Ala Arg Ile His Glu Val Val Pro Arg Phe Leu
115 120 125
Ser Asp Lys Leu Leu Glu Thr Asn Arg Gln Lys Asn Ile Pro Gln Leu
130 135 140
Thr Ala Asn Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln Asp
145 150 155 160
Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln Thr
165 170 175
Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg
180 185 190
Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe
195 200 205
Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln Ile
210 215 220
Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val Ala
225 230 235 240
Arg Arg Tyr Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn Gln
245 250 255
Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val Ile
260 265 270
Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp
275 280 285
Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp Arg
290 295 300
Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr Tyr
305 310 315 320
Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser Ala
325 330 335
Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu
340 345 350
Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys Leu
355 360 365
Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val Ala
370 375 380
Asp Met Ser His Thr Gln Pro Pro Pro Ile Leu Glu Ser Pro Thr Asn
385 390 395 400
Leu
<210> 9
<211> 298
<212> PRT
<213> 黄粉虫(Tenebrio molitor)
<400> 9
Arg Pro Glu Cys Val Val Pro Glu Val Gln Cys Ala Val Lys Arg Lys
1 5 10 15
Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Pro Asn Ser Thr Thr Asn
20 25 30
Gly Ser Pro Asp Val Ile Lys Ile Glu Pro Glu Leu Ser Asp Ser Glu
35 40 45
Lys Thr Leu Thr Asn Gly Arg Asn Arg Ile Ser Pro Glu Gln Glu Glu
50 55 60
Leu Ile Leu Ile His Arg Leu Val Tyr Phe Gln Asn Glu Tyr Glu His
65 70 75 80
Pro Ser Glu Glu Asp Val Lys Arg Ile Ile Asn Gln Pro Ile Asp Gly
85 90 95
Glu Asp Gln Cys Glu Ile Arg Phe Arg His Thr Thr Glu Ile Thr Ile
100 105 110
Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys Arg Leu Pro Gly Phe
115 120 125
Asp Lys Leu Leu Gln Glu Asp Gln Ile Ala Leu Leu Lys Ala Cys Ser
130 135 140
Ser Glu Val Met Met Phe Arg Met Ala Arg Arg Tyr Asp Val Gln Ser
145 150 155 160
Asp Ser Ile Leu Phe Val Asn Asn Gln Pro Tyr Pro Arg Asp Ser Tyr
165 170 175
Asn Leu Ala Gly Met Gly Glu Thr Ile Glu Asp Leu Leu His Phe Cys
180 185 190
Arg Thr Met Tyr Ser Met Lys Val Asp Asn Ala Glu Tyr Ala Leu Leu
195 200 205
Thr Ala Ile Val Ile Phe Ser Glu Arg Pro Ser Leu Ile Glu Gly Trp
210 215 220
Lys Val Glu Lys Ile Gln Glu Ile Tyr Leu Glu Ala Leu Arg Ala Tyr
225 230 235 240
Val Asp Asn Arg Arg Ser Pro Ser Arg Gly Thr Ile Phe Ala Lys Leu
245 250 255
Leu Ser Val Leu Thr Glu Leu Arg Thr Leu Gly Asn Gln Asn Ser Glu
260 265 270
Met Cys Ile Ser Leu Lys Leu Lys Asn Lys Lys Leu Pro Pro Phe Leu
275 280 285
Asp Glu Ile Trp Asp Val Asp Leu Lys Ala
290 295
<210> 10
<211> 316
<212> PRT
<213> 美洲钝眼蜱(Amblyomma americanum)
<400> 10
Arg Pro Glu Cys Val Val Pro Glu Tyr Gln Cys Ala Ile Lys Arg Glu
1 5 10 15
Ser Lys Lys His Gln Lys Asp Arg Pro Asn Ser Thr Thr Arg Glu Ser
20 25 30
Pro Ser Ala Leu Met Ala Pro Ser Ser Val Gly Gly Val Ser Pro Thr
35 40 45
Ser Gln Pro Met Gly Gly Gly Gly Ser Ser Leu Gly Ser Ser Asn His
50 55 60
Glu Glu Asp Lys Lys Pro Val Val Leu Ser Pro Gly Val Lys Pro Leu
65 70 75 80
Ser Ser Ser Gln Glu Asp Leu Ile Asn Lys Leu Val Tyr Tyr Gln Gln
85 90 95
Glu Phe Glu Ser Pro Ser Glu Glu Asp Met Lys Lys Thr Thr Pro Phe
100 105 110
Pro Leu Gly Asp Ser Glu Glu Asp Asn Gln Arg Arg Phe Gln His Ile
115 120 125
Thr Glu Ile Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ser Lys
130 135 140
Arg Val Pro Gly Phe Asp Thr Leu Ala Arg Glu Asp Gln Ile Thr Leu
145 150 155 160
Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Gly Ala Arg Lys
165 170 175
Tyr Asp Val Lys Thr Asp Ser Ile Val Phe Ala Asn Asn Gln Pro Tyr
180 185 190
Thr Arg Asp Asn Tyr Arg Ser Ala Ser Val Gly Asp Ser Ala Asp Ala
195 200 205
Leu Phe Arg Phe Cys Arg Lys Met Cys Gln Leu Arg Val Asp Asn Ala
210 215 220
Glu Tyr Ala Leu Leu Thr Ala Ile Val Ile Phe Ser Glu Arg Pro Ser
225 230 235 240
Leu Val Asp Pro His Lys Val Glu Arg Ile Gln Glu Tyr Tyr Ile Glu
245 250 255
Thr Leu Arg Met Tyr Ser Glu Asn His Arg Pro Pro Gly Lys Asn Tyr
260 265 270
Phe Ala Arg Leu Leu Ser Ile Leu Thr Glu Leu Arg Thr Leu Gly Asn
275 280 285
Met Asn Ala Glu Met Cys Phe Ser Leu Lys Val Gln Asn Lys Lys Leu
290 295 300
Pro Pro Phe Leu Ala Glu Ile Trp Asp Ile Gln Glu
305 310 315
<210> 11
<211> 711
<212> DNA
<213> 人工序列
<220>
<223> 人工序列说明: 合成嵌合RXR配体结合结构域
<400> 11
gccaacgagg acatgcctgt agagaagatt ctggaagccg agcttgctgt cgagcccaag 60
actgagacat acgtggaggc aaacatgggg ctgaacccca gctcaccaaa tgaccctgtt 120
accaacatct gtcaagcagc agacaagcag ctcttcactc ttgtggagtg ggccaagagg 180
atcccacact tttctgagct gcccctagac gaccaggtca tcctgctacg ggcaggctgg 240
aacgagctgc tgatcgcctc cttctcccac cgctccatag ctgtgaaaga tgggattctc 300
ctggccaccg gcctgcacgt acaccggaac agcgctcaca gtgctggggt gggcgccatc 360
tttgacaggg tgctaacaga gctggtgtct aagatgcgtg acatgcagat ggacaagact 420
gaacttggct gcttgcgatc tgttattctt ttcaatccag aggtgagggg tttgaaatcc 480
gcccaggaag ttgaacttct acgtgaaaaa gtatatgccg ctttggaaga atatactaga 540
acaacacatc ccgatgaacc aggaagattt gcaaaacttt tgcttcgtct gccttcttta 600
cgttccatag gccttaagtg tttggagcat ttgtttttct ttcgccttat tggagatgtt 660
ccaattgata cgttcctgat ggagatgctt gaatcacctt ctgattcata a 711
<210> 12
<211> 720
<212> DNA
<213> 智人(Homo sapiens)
<400> 12
gcccccgagg agatgcctgt ggacaggatc ctggaggcag agcttgctgt ggaacagaag 60
agtgaccagg gcgttgaggg tcctggggga accgggggta gcggcagcag cccaaatgac 120
cctgtgacta acatctgtca ggcagctgac aaacagctat tcacgcttgt tgagtgggcg 180
aagaggatcc cacacttttc ctccttgcct ctggatgatc aggtcatatt gctgcgggca 240
ggctggaatg aactcctcat tgcctccttt tcacaccgat ccattgatgt tcgagatggc 300
atcctccttg ccacaggtct tcacgtgcac cgcaactcag cccattcagc aggagtagga 360
gccatctttg atcgggtgct gacagagcta gtgtccaaaa tgcgtgacat gaggatggac 420
aagacagagc ttggctgcct gagggcaatc attctgttta atccagatgc caagggcctc 480
tccaacccta gtgaggtgga ggtcctgcgg gagaaagtgt atgcatcact ggagacctac 540
tgcaaacaga agtaccctga gcagcaggga cggtttgcca agctgctgct acgtcttcct 600
gccctccggt ccattggcct taagtgtcta gagcatctgt ttttcttcaa gctcattggt 660
gacaccccca tcgacacctt cctcatggag atgcttgagg ctccccatca actggcctga 720
<210> 13
<211> 635
<212> DNA
<213> 飞蝗(Locusta migratoria)
<400> 13
tgcatacaga catgcctgtt gaacgcatac ttgaagctga aaaacgagtg gagtgcaaag 60
cagaaaacca agtggaatat gagctggtgg agtgggctaa acacatcccg cacttcacat 120
ccctacctct ggaggaccag gttctcctcc tcagagcagg ttggaatgaa ctgctaattg 180
cagcattttc acatcgatct gtagatgtta aagatggcat agtacttgcc actggtctca 240
cagtgcatcg aaattctgcc catcaagctg gagtcggcac aatatttgac agagttttga 300
cagaactggt agcaaagatg agagaaatga aaatggataa aactgaactt ggctgcttgc 360
gatctgttat tcttttcaat ccagaggtga ggggtttgaa atccgcccag gaagttgaac 420
ttctacgtga aaaagtatat gccgctttgg aagaatatac tagaacaaca catcccgatg 480
aaccaggaag atttgcaaaa cttttgcttc gtctgccttc tttacgttcc ataggcctta 540
agtgtttgga gcatttgttt ttctttcgcc ttattggaga tgttccaatt gatacgttcc 600
tgatggagat gcttgaatca ccttctgatt cataa 635
<210> 14
<211> 236
<212> PRT
<213> 人工序列
<220>
<223> 人工序列说明: 合成嵌合RXR配体结合结构域
<400> 14
Ala Asn Glu Asp Met Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala
1 5 10 15
Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn
20 25 30
Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp
35 40 45
Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe
50 55 60
Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp
65 70 75 80
Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys
85 90 95
Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala
100 105 110
His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu
115 120 125
Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys
130 135 140
Leu Arg Ser Val Ile Leu Phe Asn Pro Glu Val Arg Gly Leu Lys Ser
145 150 155 160
Ala Gln Glu Val Glu Leu Leu Arg Glu Lys Val Tyr Ala Ala Leu Glu
165 170 175
Glu Tyr Thr Arg Thr Thr His Pro Asp Glu Pro Gly Arg Phe Ala Lys
180 185 190
Leu Leu Leu Arg Leu Pro Ser Leu Arg Ser Ile Gly Leu Lys Cys Leu
195 200 205
Glu His Leu Phe Phe Phe Arg Leu Ile Gly Asp Val Pro Ile Asp Thr
210 215 220
Phe Leu Met Glu Met Leu Glu Ser Pro Ser Asp Ser
225 230 235
<210> 15
<211> 239
<212> PRT
<213> 智人(Homo sapiens)
<400> 15
Ala Pro Glu Glu Met Pro Val Asp Arg Ile Leu Glu Ala Glu Leu Ala
1 5 10 15
Val Glu Gln Lys Ser Asp Gln Gly Val Glu Gly Pro Gly Gly Thr Gly
20 25 30
Gly Ser Gly Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala
35 40 45
Ala Asp Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro
50 55 60
His Phe Ser Ser Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala
65 70 75 80
Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Asp
85 90 95
Val Arg Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn
100 105 110
Ser Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr
115 120 125
Glu Leu Val Ser Lys Met Arg Asp Met Arg Met Asp Lys Thr Glu Leu
130 135 140
Gly Cys Leu Arg Ala Ile Ile Leu Phe Asn Pro Asp Ala Lys Gly Leu
145 150 155 160
Ser Asn Pro Ser Glu Val Glu Val Leu Arg Glu Lys Val Tyr Ala Ser
165 170 175
Leu Glu Thr Tyr Cys Lys Gln Lys Tyr Pro Glu Gln Gln Gly Arg Phe
180 185 190
Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys
195 200 205
Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile
210 215 220
Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Leu Ala
225 230 235
<210> 16
<211> 210
<212> PRT
<213> 飞蝗(Locusta migratoria)
<400> 16
His Thr Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Lys Arg Val
1 5 10 15
Glu Cys Lys Ala Glu Asn Gln Val Glu Tyr Glu Leu Val Glu Trp Ala
20 25 30
Lys His Ile Pro His Phe Thr Ser Leu Pro Leu Glu Asp Gln Val Leu
35 40 45
Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His
50 55 60
Arg Ser Val Asp Val Lys Asp Gly Ile Val Leu Ala Thr Gly Leu Thr
65 70 75 80
Val His Arg Asn Ser Ala His Gln Ala Gly Val Gly Thr Ile Phe Asp
85 90 95
Arg Val Leu Thr Glu Leu Val Ala Lys Met Arg Glu Met Lys Met Asp
100 105 110
Lys Thr Glu Leu Gly Cys Leu Arg Ser Val Ile Leu Phe Asn Pro Glu
115 120 125
Val Arg Gly Leu Lys Ser Ala Gln Glu Val Glu Leu Leu Arg Glu Lys
130 135 140
Val Tyr Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr His Pro Asp Glu
145 150 155 160
Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ser Leu Arg Ser
165 170 175
Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Arg Leu Ile Gly
180 185 190
Asp Val Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser Pro Ser
195 200 205
Asp Ser
210
<210> 17
<211> 240
<212> PRT
<213> 云杉卷叶蛾(Choristoneura fumiferana)
<400> 17
Leu Thr Ala Asn Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln
1 5 10 15
Asp Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln
20 25 30
Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe
35 40 45
Arg Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu
50 55 60
Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln
65 70 75 80
Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val
85 90 95
Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn
100 105 110
Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val
115 120 125
Ile Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu
130 135 140
Asp Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp
145 150 155 160
Arg Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr
165 170 175
Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser
180 185 190
Ala Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu
195 200 205
Leu Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys
210 215 220
Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val
225 230 235 240
<210> 18
<211> 237
<212> PRT
<213> 黑腹果蝇(Drosophila melanogaster)
<400> 18
Leu Thr Tyr Asn Gln Leu Ala Val Ile Tyr Lys Leu Ile Trp Tyr Gln
1 5 10 15
Asp Gly Tyr Glu Gln Pro Ser Glu Glu Asp Leu Arg Arg Ile Met Ser
20 25 30
Gln Pro Asp Glu Asn Glu Ser Gln Thr Asp Val Ser Phe Arg His Ile
35 40 45
Thr Glu Ile Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys
50 55 60
Gly Leu Pro Ala Phe Thr Lys Ile Pro Gln Glu Asp Gln Ile Thr Leu
65 70 75 80
Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Met Ala Arg Arg
85 90 95
Tyr Asp His Ser Ser Asp Ser Ile Phe Phe Ala Asn Asn Arg Ser Tyr
100 105 110
Thr Arg Asp Ser Tyr Lys Met Ala Gly Met Ala Asp Asn Ile Glu Asp
115 120 125
Leu Leu His Phe Cys Arg Gln Met Phe Ser Met Lys Val Asp Asn Val
130 135 140
Glu Tyr Ala Leu Leu Thr Ala Ile Val Ile Phe Ser Asp Arg Pro Gly
145 150 155 160
Leu Glu Lys Ala Gln Leu Val Glu Ala Ile Gln Ser Tyr Tyr Ile Asp
165 170 175
Thr Leu Arg Ile Tyr Ile Leu Asn Arg His Cys Gly Asp Ser Met Ser
180 185 190
Leu Val Phe Tyr Ala Lys Leu Leu Ser Ile Leu Thr Glu Leu Arg Thr
195 200 205
Leu Gly Asn Gln Asn Ala Glu Met Cys Phe Ser Leu Lys Leu Lys Asn
210 215 220
Arg Lys Leu Pro Lys Phe Leu Glu Glu Ile Trp Asp Val
225 230 235
<210> 19
<211> 240
<212> PRT
<213> 美洲钝眼蜱(Amblyomma americanum)
<400> 19
Pro Gly Val Lys Pro Leu Ser Ser Ser Gln Glu Asp Leu Ile Asn Lys
1 5 10 15
Leu Val Tyr Tyr Gln Gln Glu Phe Glu Ser Pro Ser Glu Glu Asp Met
20 25 30
Lys Lys Thr Thr Pro Phe Pro Leu Gly Asp Ser Glu Glu Asp Asn Gln
35 40 45
Arg Arg Phe Gln His Ile Thr Glu Ile Thr Ile Leu Thr Val Gln Leu
50 55 60
Ile Val Glu Phe Ser Lys Arg Val Pro Gly Phe Asp Thr Leu Ala Arg
65 70 75 80
Glu Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met
85 90 95
Leu Arg Gly Ala Arg Lys Tyr Asp Val Lys Thr Asp Ser Ile Val Phe
100 105 110
Ala Asn Asn Gln Pro Tyr Thr Arg Asp Asn Tyr Arg Ser Ala Ser Val
115 120 125
Gly Asp Ser Ala Asp Ala Leu Phe Arg Phe Cys Arg Lys Met Cys Gln
130 135 140
Leu Arg Val Asp Asn Ala Glu Tyr Ala Leu Leu Thr Ala Ile Val Ile
145 150 155 160
Phe Ser Glu Arg Pro Ser Leu Val Asp Pro His Lys Val Glu Arg Ile
165 170 175
Gln Glu Tyr Tyr Ile Glu Thr Leu Arg Met Tyr Ser Glu Asn His Arg
180 185 190
Pro Pro Gly Lys Asn Tyr Phe Ala Arg Leu Leu Ser Ile Leu Thr Glu
195 200 205
Leu Arg Thr Leu Gly Asn Met Asn Ala Glu Met Cys Phe Ser Leu Lys
210 215 220
Val Gln Asn Lys Lys Leu Pro Pro Phe Leu Ala Glu Ile Trp Asp Ile
225 230 235 240
<210> 20
<211> 1586
<212> DNA
<213> 银液粉虱(Bamecia argentifoli)
<400> 20
gaattcgcgg ccgctcgcaa acttccgtac ctctcacccc ctcgccagga ccccccgcca 60
accagttcac cgtcatctcc tccaatggat actcatcccc catgtcttcg ggcagctacg 120
acccttatag tcccaccaat ggaagaatag ggaaagaaga gctttcgccg gcgaatagtc 180
tgaacgggta caacgtggat agctgcgatg cgtcgcggaa gaagaaggga ggaacgggtc 240
ggcagcagga ggagctgtgt ctcgtctgcg gggaccgcgc ctccggctac cactacaacg 300
ccctcacctg cgaaggctgc aagggcttct tccgtcggag catcaccaag aatgccgtct 360
accagtgtaa atatggaaat aattgtgaaa ttgacatgta catgaggcga aaatgccaag 420
agtgtcgtct caagaagtgt ctcagcgttg gcatgaggcc agaatgtgta gttcccgaat 480
tccagtgtgc tgtgaagcga aaagagaaaa aagcgcaaaa ggacaaagat aaacctaact 540
caacgacgag ttgttctcca gatggaatca aacaagagat agatcctcaa aggctggata 600
cagattcgca gctattgtct gtaaatggag ttaaacccat tactccagag caagaagagc 660
tcatccatag gctagtttat tttcaaaatg aatatgaaca tccatcccca gaggatatca 720
aaaggatagt taatgctgca ccagaagaag aaaatgtagc tgaagaaagg tttaggcata 780
ttacagaaat tacaattctc actgtacagt taattgtgga attttctaag cgattacctg 840
gttttgacaa actaattcgt gaagatcaaa tagctttatt aaaggcatgt agtagtgaag 900
taatgatgtt tagaatggca aggaggtatg atgctgaaac agattcgata ttgtttgcaa 960
ctaaccagcc gtatacgaga gaatcataca ctgtagctgg catgggtgat actgtggagg 1020
atctgctccg attttgtcga catatgtgtg ccatgaaagt cgataacgca gaatatgctc 1080
ttctcactgc cattgtaatt ttttcagaac gaccatctct aagtgaaggc tggaaggttg 1140
agaagattca agaaatttac atagaagcat taaaagcata tgttgaaaat cgaaggaaac 1200
catatgcaac aaccattttt gctaagttac tatctgtttt aactgaacta cgaacattag 1260
ggaatatgaa ttcagaaaca tgcttctcat tgaagctgaa gaatagaaag gtgccatcct 1320
tcctcgagga gatttgggat gttgtttcat aaacagtctt acctcaattc catgttactt 1380
ttcatatttg atttatctca gcaggtggct cagtacttat cctcacatta ctgagctcac 1440
ggtatgctca tacaattata acttgtaata tcatatcggt gatgacaaat ttgttacaat 1500
attctttgtt accttaacac aatgttgatc tcataatgat gtatgaattt ttctgttttt 1560
gcaaaaaaaa aagcggccgc gaattc 1586
<210> 21
<211> 1109
<212> DNA
<213> 黑尾叶蝉(Nephotetix cincticeps)
<400> 21
caggaggagc tctgcctgtt gtgcggagac cgagcgtcgg gataccacta caacgctctc 60
acctgcgaag gatgcaaggg cttctttcgg aggagtatca ccaaaaacgc agtgtaccag 120
tccaaatacg gcaccaattg tgaaatagac atgtatatgc ggcgcaagtg ccaggagtgc 180
cgactcaaga agtgcctcag tgtagggatg aggccagaat gtgtagtacc tgagtatcaa 240
tgtgccgtaa aaaggaaaga gaaaaaagct caaaaggaca aagataaacc tgtctcttca 300
accaatggct cgcctgaaat gagaatagac caggacaacc gttgtgtggt gttgcagagt 360
gaagacaaca ggtacaactc gagtacgccc agtttcggag tcaaacccct cagtccagaa 420
caagaggagc tcatccacag gctcgtctac ttccagaacg agtacgaaca ccctgccgag 480
gaggatctca agcggatcga gaacctcccc tgtgacgacg atgacccgtg tgatgttcgc 540
tacaaacaca ttacggagat cacaatactc acagtccagc tcatcgtgga gtttgcgaaa 600
aaactgcctg gtttcgacaa actactgaga gaggaccaga tcgtgttgct caaggcgtgt 660
tcgagcgagg tgatgatgct gcggatggcg cggaggtacg acgtccagac agactcgatc 720
ctgttcgcca acaaccagcc gtacacgcga gagtcgtaca cgatggcagg cgtgggggaa 780
gtcatcgaag atctgctgcg gttcggccga ctcatgtgct ccatgaaggt ggacaatgcc 840
gagtatgctc tgctcacggc catcgtcatc ttctccgagc ggccgaacct ggcggaagga 900
tggaaggttg agaagatcca ggagatctac ctggaggcgc tcaagtccta cgtggacaac 960
cgagtgaaac ctcgcagtcc gaccatcttc gccaaactgc tctccgttct caccgagctg 1020
cgaacactcg gcaaccagaa ctccgagatg tgcttctcgt taaactacgc aaccgcaaac 1080
atgccaccgt tcctcgaaga aatctggga 1109
<210> 22
<211> 735
<212> DNA
<213> 云杉卷叶蛾(Choristoneura fumiferana)
<400> 22
taccaggacg ggtacgagca gccttctgat gaagatttga agaggattac gcagacgtgg 60
cagcaagcgg acgatgaaaa cgaagagtct gacactccct tccgccagat cacagagatg 120
actatcctca cggtccaact tatcgtggag ttcgcgaagg gattgccagg gttcgccaag 180
atctcgcagc ctgatcaaat tacgctgctt aaggcttgct caagtgaggt aatgatgctc 240
cgagtcgcgc gacgatacga tgcggcctca gacagtgttc tgttcgcgaa caaccaagcg 300
tacactcgcg acaactaccg caaggctggc atggcctacg tcatcgagga tctactgcac 360
ttctgccggt gcatgtactc tatggcgttg gacaacatcc attacgcgct gctcacggct 420
gtcgtcatct tttctgaccg gccagggttg gagcagccgc aactggtgga agaaatccag 480
cggtactacc tgaatacgct ccgcatctat atcctgaacc agctgagcgg gtcggcgcgt 540
tcgtccgtca tatacggcaa gatcctctca atcctctctg agctacgcac gctcggcatg 600
caaaactcca acatgtgcat ctccctcaag ctcaagaaca gaaagctgcc gcctttcctc 660
gaggagatct gggatgtggc ggacatgtcg cacacccaac cgccgcctat cctcgagtcc 720
cccacgaatc tctag 735
<210> 23
<211> 1338
<212> DNA
<213> 黑腹果蝇(Drosophila melanogaster)
<400> 23
tatgagcagc catctgaaga ggatctcagg cgtataatga gtcaacccga tgagaacgag 60
agccaaacgg acgtcagctt tcggcatata accgagataa ccatactcac ggtccagttg 120
attgttgagt ttgctaaagg tctaccagcg tttacaaaga taccccagga ggaccagatc 180
acgttactaa aggcctgctc gtcggaggtg atgatgctgc gtatggcacg acgctatgac 240
cacagctcgg actcaatatt cttcgcgaat aatagatcat atacgcggga ttcttacaaa 300
atggccggaa tggctgataa cattgaagac ctgctgcatt tctgccgcca aatgttctcg 360
atgaaggtgg acaacgtcga atacgcgctt ctcactgcca ttgtgatctt ctcggaccgg 420
ccgggcctgg agaaggccca actagtcgaa gcgatccaga gctactacat cgacacgcta 480
cgcatttata tactcaaccg ccactgcggc gactcaatga gcctcgtctt ctacgcaaag 540
ctgctctcga tcctcaccga gctgcgtacg ctgggcaacc agaacgccga gatgtgtttc 600
tcactaaagc tcaaaaaccg caaactgccc aagttcctcg aggagatctg ggacgttcat 660
gccatcccgc catcggtcca gtcgcacctt cagattaccc aggaggagaa cgagcgtctc 720
gagcgggctg agcgtatgcg ggcatcggtt gggggcgcca ttaccgccgg cattgattgc 780
gactctgcct ccacttcggc ggcggcagcc gcggcccagc atcagcctca gcctcagccc 840
cagccccaac cctcctccct gacccagaac gattcccagc accagacaca gccgcagcta 900
caacctcagc taccacctca gctgcaaggt caactgcaac cccagctcca accacagctt 960
cagacgcaac tccagccaca gattcaacca cagccacagc tccttcccgt ctccgctccc 1020
gtgcccgcct ccgtaaccgc acctggttcc ttgtccgcgg tcagtacgag cagcgaatac 1080
atgggcggaa gtgcggccat aggacccatc acgccggcaa ccaccagcag tatcacggct 1140
gccgttaccg ctagctccac cacatcagcg gtaccgatgg gcaacggagt tggagtcggt 1200
gttggggtgg gcggcaacgt cagcatgtat gcgaacgccc agacggcgat ggccttgatg 1260
ggtgtagccc tgcattcgca ccaagagcag cttatcgggg gagtggcggt taagtcggag 1320
cactcgacga ctgcatag 1338
<210> 24
<211> 960
<212> DNA
<213> 云杉卷叶蛾(Choristoneura fumiferana)
<400> 24
cctgagtgcg tagtacccga gactcagtgc gccatgaagc ggaaagagaa gaaagcacag 60
aaggagaagg acaaactgcc tgtcagcacg acgacggtgg acgaccacat gccgcccatt 120
atgcagtgtg aacctccacc tcctgaagca gcaaggattc acgaagtggt cccaaggttt 180
ctctccgaca agctgttgga gacaaaccgg cagaaaaaca tcccccagtt gacagccaac 240
cagcagttcc ttatcgccag gctcatctgg taccaggacg ggtacgagca gccttctgat 300
gaagatttga agaggattac gcagacgtgg cagcaagcgg acgatgaaaa cgaagagtct 360
gacactccct tccgccagat cacagagatg actatcctca cggtccaact tatcgtggag 420
ttcgcgaagg gattgccagg gttcgccaag atctcgcagc ctgatcaaat tacgctgctt 480
aaggcttgct caagtgaggt aatgatgctc cgagtcgcgc gacgatacga tgcggcctca 540
gacagtgttc tgttcgcgaa caaccaagcg tacactcgcg acaactaccg caaggctggc 600
atggcctacg tcatcgagga tctactgcac ttctgccggt gcatgtactc tatggcgttg 660
gacaacatcc attacgcgct gctcacggct gtcgtcatct tttctgaccg gccagggttg 720
gagcagccgc aactggtgga agaaatccag cggtactacc tgaatacgct ccgcatctat 780
atcctgaacc agctgagcgg gtcggcgcgt tcgtccgtca tatacggcaa gatcctctca 840
atcctctctg agctacgcac gctcggcatg caaaactcca acatgtgcat ctccctcaag 900
ctcaagaaca gaaagctgcc gcctttcctc gaggagatct gggatgtggc ggacatgtcg 960
<210> 25
<211> 969
<212> DNA
<213> 黑腹果蝇(Drosophila melanogaster)
<400> 25
cggccggaat gcgtcgtccc ggagaaccaa tgtgcgatga agcggcgcga aaagaaggcc 60
cagaaggaga aggacaaaat gaccacttcg ccgagctctc agcatggcgg caatggcagc 120
ttggcctctg gtggcggcca agactttgtt aagaaggaga ttcttgacct tatgacatgc 180
gagccgcccc agcatgccac tattccgcta ctacctgatg aaatattggc caagtgtcaa 240
gcgcgcaata taccttcctt aacgtacaat cagttggccg ttatatacaa gttaatttgg 300
taccaggatg gctatgagca gccatctgaa gaggatctca ggcgtataat gagtcaaccc 360
gatgagaacg agagccaaac ggacgtcagc tttcggcata taaccgagat aaccatactc 420
acggtccagt tgattgttga gtttgctaaa ggtctaccag cgtttacaaa gataccccag 480
gaggaccaga tcacgttact aaaggcctgc tcgtcggagg tgatgatgct gcgtatggca 540
cgacgctatg accacagctc ggactcaata ttcttcgcga ataatagatc atatacgcgg 600
gattcttaca aaatggccgg aatggctgat aacattgaag acctgctgca tttctgccgc 660
caaatgttct cgatgaaggt ggacaacgtc gaatacgcgc ttctcactgc cattgtgatc 720
ttctcggacc ggccgggcct ggagaaggcc caactagtcg aagcgatcca gagctactac 780
atcgacacgc tacgcattta tatactcaac cgccactgcg gcgactcaat gagcctcgtc 840
ttctacgcaa agctgctctc gatcctcacc gagctgcgta cgctgggcaa ccagaacgcc 900
gagatgtgtt tctcactaaa gctcaaaaac cgcaaactgc ccaagttcct cgaggagatc 960
tgggacgtt 969
<210> 26
<211> 244
<212> PRT
<213> 云杉卷叶蛾(Choristoneura fumiferana)
<400> 26
Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile
1 5 10 15
Thr Gln Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr
20 25 30
Pro Phe Arg Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile
35 40 45
Val Glu Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro
50 55 60
Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu
65 70 75 80
Arg Val Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser Val Leu Phe Ala
85 90 95
Asn Asn Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala
100 105 110
Tyr Val Ile Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr Ser Met
115 120 125
Ala Leu Asp Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val Ile Phe
130 135 140
Ser Asp Arg Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu Ile Gln
145 150 155 160
Arg Tyr Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser
165 170 175
Gly Ser Ala Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu
180 185 190
Ser Glu Leu Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys Ile Ser
195 200 205
Leu Lys Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp
210 215 220
Asp Val Ala Asp Met Ser His Thr Gln Pro Pro Pro Ile Leu Glu Ser
225 230 235 240
Pro Thr Asn Leu
<210> 27
<211> 445
<212> PRT
<213> 黑腹果蝇(Drosophila melanogaster)
<400> 27
Tyr Glu Gln Pro Ser Glu Glu Asp Leu Arg Arg Ile Met Ser Gln Pro
1 5 10 15
Asp Glu Asn Glu Ser Gln Thr Asp Val Ser Phe Arg His Ile Thr Glu
20 25 30
Ile Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys Gly Leu
35 40 45
Pro Ala Phe Thr Lys Ile Pro Gln Glu Asp Gln Ile Thr Leu Leu Lys
50 55 60
Ala Cys Ser Ser Glu Val Met Met Leu Arg Met Ala Arg Arg Tyr Asp
65 70 75 80
His Ser Ser Asp Ser Ile Phe Phe Ala Asn Asn Arg Ser Tyr Thr Arg
85 90 95
Asp Ser Tyr Lys Met Ala Gly Met Ala Asp Asn Ile Glu Asp Leu Leu
100 105 110
His Phe Cys Arg Gln Met Phe Ser Met Lys Val Asp Asn Val Glu Tyr
115 120 125
Ala Leu Leu Thr Ala Ile Val Ile Phe Ser Asp Arg Pro Gly Leu Glu
130 135 140
Lys Ala Gln Leu Val Glu Ala Ile Gln Ser Tyr Tyr Ile Asp Thr Leu
145 150 155 160
Arg Ile Tyr Ile Leu Asn Arg His Cys Gly Asp Ser Met Ser Leu Val
165 170 175
Phe Tyr Ala Lys Leu Leu Ser Ile Leu Thr Glu Leu Arg Thr Leu Gly
180 185 190
Asn Gln Asn Ala Glu Met Cys Phe Ser Leu Lys Leu Lys Asn Arg Lys
195 200 205
Leu Pro Lys Phe Leu Glu Glu Ile Trp Asp Val His Ala Ile Pro Pro
210 215 220
Ser Val Gln Ser His Leu Gln Ile Thr Gln Glu Glu Asn Glu Arg Leu
225 230 235 240
Glu Arg Ala Glu Arg Met Arg Ala Ser Val Gly Gly Ala Ile Thr Ala
245 250 255
Gly Ile Asp Cys Asp Ser Ala Ser Thr Ser Ala Ala Ala Ala Ala Ala
260 265 270
Gln His Gln Pro Gln Pro Gln Pro Gln Pro Gln Pro Ser Ser Leu Thr
275 280 285
Gln Asn Asp Ser Gln His Gln Thr Gln Pro Gln Leu Gln Pro Gln Leu
290 295 300
Pro Pro Gln Leu Gln Gly Gln Leu Gln Pro Gln Leu Gln Pro Gln Leu
305 310 315 320
Gln Thr Gln Leu Gln Pro Gln Ile Gln Pro Gln Pro Gln Leu Leu Pro
325 330 335
Val Ser Ala Pro Val Pro Ala Ser Val Thr Ala Pro Gly Ser Leu Ser
340 345 350
Ala Val Ser Thr Ser Ser Glu Tyr Met Gly Gly Ser Ala Ala Ile Gly
355 360 365
Pro Ile Thr Pro Ala Thr Thr Ser Ser Ile Thr Ala Ala Val Thr Ala
370 375 380
Ser Ser Thr Thr Ser Ala Val Pro Met Gly Asn Gly Val Gly Val Gly
385 390 395 400
Val Gly Val Gly Gly Asn Val Ser Met Tyr Ala Asn Ala Gln Thr Ala
405 410 415
Met Ala Leu Met Gly Val Ala Leu His Ser His Gln Glu Gln Leu Ile
420 425 430
Gly Gly Val Ala Val Lys Ser Glu His Ser Thr Thr Ala
435 440 445
<210> 28
<211> 320
<212> PRT
<213> 云杉卷叶蛾(Choristoneura fumiferana)
<400> 28
Pro Glu Cys Val Val Pro Glu Thr Gln Cys Ala Met Lys Arg Lys Glu
1 5 10 15
Lys Lys Ala Gln Lys Glu Lys Asp Lys Leu Pro Val Ser Thr Thr Thr
20 25 30
Val Asp Asp His Met Pro Pro Ile Met Gln Cys Glu Pro Pro Pro Pro
35 40 45
Glu Ala Ala Arg Ile His Glu Val Val Pro Arg Phe Leu Ser Asp Lys
50 55 60
Leu Leu Glu Thr Asn Arg Gln Lys Asn Ile Pro Gln Leu Thr Ala Asn
65 70 75 80
Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln Asp Gly Tyr Glu
85 90 95
Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln Thr Trp Gln Gln
100 105 110
Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg Gln Ile Thr
115 120 125
Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys Gly
130 135 140
Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln Ile Thr Leu Leu
145 150 155 160
Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val Ala Arg Arg Tyr
165 170 175
Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn Gln Ala Tyr Thr
180 185 190
Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val Ile Glu Asp Leu
195 200 205
Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp Asn Ile His
210 215 220
Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp Arg Pro Gly Leu
225 230 235 240
Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr Tyr Leu Asn Thr
245 250 255
Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser Ala Arg Ser Ser
260 265 270
Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu Arg Thr Leu
275 280 285
Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys Leu Lys Asn Arg
290 295 300
Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val Ala Asp Met Ser
305 310 315 320
<210> 29
<211> 323
<212> PRT
<213> 黑腹果蝇(Drosophila melanogaster)
<400> 29
Arg Pro Glu Cys Val Val Pro Glu Asn Gln Cys Ala Met Lys Arg Arg
1 5 10 15
Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Met Thr Thr Ser Pro Ser
20 25 30
Ser Gln His Gly Gly Asn Gly Ser Leu Ala Ser Gly Gly Gly Gln Asp
35 40 45
Phe Val Lys Lys Glu Ile Leu Asp Leu Met Thr Cys Glu Pro Pro Gln
50 55 60
His Ala Thr Ile Pro Leu Leu Pro Asp Glu Ile Leu Ala Lys Cys Gln
65 70 75 80
Ala Arg Asn Ile Pro Ser Leu Thr Tyr Asn Gln Leu Ala Val Ile Tyr
85 90 95
Lys Leu Ile Trp Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Glu Glu Asp
100 105 110
Leu Arg Arg Ile Met Ser Gln Pro Asp Glu Asn Glu Ser Gln Thr Asp
115 120 125
Val Ser Phe Arg His Ile Thr Glu Ile Thr Ile Leu Thr Val Gln Leu
130 135 140
Ile Val Glu Phe Ala Lys Gly Leu Pro Ala Phe Thr Lys Ile Pro Gln
145 150 155 160
Glu Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met
165 170 175
Leu Arg Met Ala Arg Arg Tyr Asp His Ser Ser Asp Ser Ile Phe Phe
180 185 190
Ala Asn Asn Arg Ser Tyr Thr Arg Asp Ser Tyr Lys Met Ala Gly Met
195 200 205
Ala Asp Asn Ile Glu Asp Leu Leu His Phe Cys Arg Gln Met Phe Ser
210 215 220
Met Lys Val Asp Asn Val Glu Tyr Ala Leu Leu Thr Ala Ile Val Ile
225 230 235 240
Phe Ser Asp Arg Pro Gly Leu Glu Lys Ala Gln Leu Val Glu Ala Ile
245 250 255
Gln Ser Tyr Tyr Ile Asp Thr Leu Arg Ile Tyr Ile Leu Asn Arg His
260 265 270
Cys Gly Asp Ser Met Ser Leu Val Phe Tyr Ala Lys Leu Leu Ser Ile
275 280 285
Leu Thr Glu Leu Arg Thr Leu Gly Asn Gln Asn Ala Glu Met Cys Phe
290 295 300
Ser Leu Lys Leu Lys Asn Arg Lys Leu Pro Lys Phe Leu Glu Glu Ile
305 310 315 320
Trp Asp Val
<210> 30
<211> 987
<212> DNA
<213> 人工序列
<220>
<223> 人工序列说明: 合成多核苷酸
<400> 30
tgtgctatct gtggggaccg ctcctcaggc aaacactatg gggtatacag ttgtgagggc 60
tgcaagggct tcttcaagag gacagtacgc aaagacctga cctacacctg ccgagacaac 120
aaggactgcc tgatcgacaa gagacagcgg aaccggtgtc agtactgccg ctaccagaag 180
tgcctggcca tgggcatgaa gcgggaagct gtgcaggagg agcggcagcg gggcaaggac 240
cggaatgaga acgaggtgga gtccaccagc agtgccaacg aggacatgcc tgtagagaag 300
attctggaag ccgagcttgc tgtcgagccc aagactgaga catacgtgga ggcaaacatg 360
gggctgaacc ccagctcacc aaatgaccct gttaccaaca tctgtcaagc agcagacaag 420
cagctcttca ctcttgtgga gtgggccaag aggatcccac acttttctga gctgccccta 480
gacgaccagg tcatcctgct acgggcaggc tggaacgagc tgctgatcgc ctccttctcc 540
caccgctcca tagctgtgaa agatgggatt ctcctggcca ccggcctgca cgtacaccgg 600
aacagcgctc acagtgctgg ggtgggcgcc atctttgaca gggtgctaac agagctggtg 660
tctaagatgc gtgacatgca gatggacaag acggagctgg gctgcctgcg agccattgtc 720
ctgttcaacc ctgactctaa ggggctctca aaccctgctg aggtggaggc gttgagggag 780
aaggtgtatg cgtcactaga agcgtactgc aaacacaagt accctgagca gccgggcagg 840
tttgccaagc tgctgctccg cctgcctgca ctgcgttcca tcgggctcaa gtgcctggag 900
cacctgttct tcttcaagct catcggggac acgcccatcg acaccttcct catggagatg 960
ctggaggcac cacatcaagc cacctag 987
<210> 31
<211> 789
<212> DNA
<213> 人工序列
<220>
<223> 人工序列说明: 合成多核苷酸
<400> 31
aagcgggaag ctgtgcagga ggagcggcag cggggcaagg accggaatga gaacgaggtg 60
gagtccacca gcagtgccaa cgaggacatg cctgtagaga agattctgga agccgagctt 120
gctgtcgagc ccaagactga gacatacgtg gaggcaaaca tggggctgaa ccccagctca 180
ccaaatgacc ctgttaccaa catctgtcaa gcagcagaca agcagctctt cactcttgtg 240
gagtgggcca agaggatccc acacttttct gagctgcccc tagacgacca ggtcatcctg 300
ctacgggcag gctggaacga gctgctgatc gcctccttct cccaccgctc catagctgtg 360
aaagatggga ttctcctggc caccggcctg cacgtacacc ggaacagcgc tcacagtgct 420
ggggtgggcg ccatctttga cagggtgcta acagagctgg tgtctaagat gcgtgacatg 480
cagatggaca agacggagct gggctgcctg cgagccattg tcctgttcaa ccctgactct 540
aaggggctct caaaccctgc tgaggtggag gcgttgaggg agaaggtgta tgcgtcacta 600
gaagcgtact gcaaacacaa gtaccctgag cagccgggca ggtttgccaa gctgctgctc 660
cgcctgcctg cactgcgttc catcgggctc aagtgcctgg agcacctgtt cttcttcaag 720
ctcatcgggg acacgcccat cgacaccttc ctcatggaga tgctggaggc accacatcaa 780
gccacctag 789
<210> 32
<211> 714
<212> DNA
<213> 人工序列
<220>
<223> 人工序列说明: 合成多核苷酸
<400> 32
gccaacgagg acatgcctgt agagaagatt ctggaagccg agcttgctgt cgagcccaag 60
actgagacat acgtggaggc aaacatgggg ctgaacccca gctcaccaaa tgaccctgtt 120
accaacatct gtcaagcagc agacaagcag ctcttcactc ttgtggagtg ggccaagagg 180
atcccacact tttctgagct gcccctagac gaccaggtca tcctgctacg ggcaggctgg 240
aacgagctgc tgatcgcctc cttctcccac cgctccatag ctgtgaaaga tgggattctc 300
ctggccaccg gcctgcacgt acaccggaac agcgctcaca gtgctggggt gggcgccatc 360
tttgacaggg tgctaacaga gctggtgtct aagatgcgtg acatgcagat ggacaagacg 420
gagctgggct gcctgcgagc cattgtcctg ttcaaccctg actctaaggg gctctcaaac 480
cctgctgagg tggaggcgtt gagggagaag gtgtatgcgt cactagaagc gtactgcaaa 540
cacaagtacc ctgagcagcc gggcaggttt gccaagctgc tgctccgcct gcctgcactg 600
cgttccatcg ggctcaagtg cctggagcac ctgttcttct tcaagctcat cggggacacg 660
cccatcgaca ccttcctcat ggagatgctg gaggcaccac atcaagccac ctag 714
<210> 33
<211> 536
<212> DNA
<213> 人工序列
<220>
<223> 人工序列说明: 合成多核苷酸
<400> 33
ggatcccaca cttttctgag ctgcccctag acgaccaggt catcctgcta cgggcaggct 60
ggaacgagct gctgatcgcc tccttctccc accgctccat agctgtgaaa gatgggattc 120
tcctggccac cggcctgcac gtacaccgga acagcgctca cagtgctggg gtgggcgcca 180
tctttgacag ggtgctaaca gagctggtgt ctaagatgcg tgacatgcag atggacaaga 240
cggagctggg ctgcctgcga gccattgtcc tgttcaaccc tgactctaag gggctctcaa 300
accctgctga ggtggaggcg ttgagggaga aggtgtatgc gtcactagaa gcgtactgca 360
aacacaagta ccctgagcag ccgggcaggt ttgccaagct gctgctccgc ctgcctgcac 420
tgcgttccat cgggctcaag tgcctggagc acctgttctt cttcaagctc atcggggaca 480
cgcccatcga caccttcctc atggagatgc tggaggcacc acatcaagcc acctag 536
<210> 34
<211> 672
<212> DNA
<213> 人工序列
<220>
<223> 人工序列说明: 合成多核苷酸
<400> 34
gccaacgagg acatgcctgt agagaagatt ctggaagccg agcttgctgt cgagcccaag 60
actgagacat acgtggaggc aaacatgggg ctgaacccca gctcaccaaa tgaccctgtt 120
accaacatct gtcaagcagc agacaagcag ctcttcactc ttgtggagtg ggccaagagg 180
atcccacact tttctgagct gcccctagac gaccaggtca tcctgctacg ggcaggctgg 240
aacgagctgc tgatcgcctc cttctcccac cgctccatag ctgtgaaaga tgggattctc 300
ctggccaccg gcctgcacgt acaccggaac agcgctcaca gtgctggggt gggcgccatc 360
tttgacaggg tgctaacaga gctggtgtct aagatgcgtg acatgcagat ggacaagacg 420
gagctgggct gcctgcgagc cattgtcctg ttcaaccctg actctaaggg gctctcaaac 480
cctgctgagg tggaggcgtt gagggagaag gtgtatgcgt cactagaagc gtactgcaaa 540
cacaagtacc ctgagcagcc gggcaggttt gccaagctgc tgctccgcct gcctgcactg 600
cgttccatcg ggctcaagtg cctggagcac ctgttcttct tcaagctcat cggggacacg 660
cccatcgaca cc 672
<210> 35
<211> 1123
<212> DNA
<213> 人工序列
<220>
<223> 人工序列说明: 合成新多核苷酸序列
<400> 35
tgcgccatct gcggggaccg ctcctcaggc aagcactatg gagtgtacag ctgcgagggg 60
tgcaagggct tcttcaagcg gacggtgcgc aaggacctga cctacacctg ccgcgacaac 120
aaggactgcc tgattgacaa gcggcagcgg aaccggtgcc agtactgccg ctaccagaag 180
tgcctggcca tgggcatgaa gcgggaagcc gtgcaggagg agcggcagcg tggcaaggac 240
cggaacgaga atgaggtgga gtcgaccagc agcgccaacg aggacatgcc ggtggagagg 300
atcctggagg ctgagctggc cgtggagccc aagaccgaga cctacgtgga ggcaaacatg 360
gggctgaacc ccagctcgcc gaacgaccct gtcaccaaca tttgccaagc agccgacaaa 420
cagcttttca ccctggtgga gtgggccaag cggatcccac acttctcaga gctgcccctg 480
gacgaccagg tcatcctgct gcgggcaggc tggaatgagc tgctcatcgc ctccttctcc 540
caccgctcca tcgccgtgaa ggacgggatc ctcctggcca ccgggctgca cgtccaccgg 600
aacagcgccc acagcgcagg ggtgggcgcc atctttgaca gggtgctgac ggagcttgtg 660
tccaagatgc gggacatgca gatggacaag acggagctgg gctgcctgcg cgccatcgtc 720
ctctttaacc ctgactccaa ggggctctcg aacccggccg aggtggaggc gctgagggag 780
aaggtctatg cgtccttgga ggcctactgc aagcacaagt acccagagca gccgggaagg 840
ttcgctaagc tcttgctccg cctgccggct ctgcgctcca tcgggctcaa atgcctggaa 900
catctcttct tcttcaagct catcggggac acacccattg acaccttcct tatggagatg 960
ctggaggcgc cgcaccaaat gacttaggcc tgcgggccca tcctttgtgc ccacccgttc 1020
tggccaccct gcctggacgc cagctgttct tctcagcctg agccctgtcc ctgcccttct 1080
ctgcctggcc tgtttggact ttggggcaca gcctgtcact gct 1123
<210> 36
<211> 925
<212> DNA
<213> 人工序列
<220>
<223> 人工序列说明: 合成新多核苷酸序列
<400> 36
aagcgggaag ccgtgcagga ggagcggcag cgtggcaagg accggaacga gaatgaggtg 60
gagtcgacca gcagcgccaa cgaggacatg ccggtggaga ggatcctgga ggctgagctg 120
gccgtggagc ccaagaccga gacctacgtg gaggcaaaca tggggctgaa ccccagctcg 180
ccgaacgacc ctgtcaccaa catttgccaa gcagccgaca aacagctttt caccctggtg 240
gagtgggcca agcggatccc acacttctca gagctgcccc tggacgacca ggtcatcctg 300
ctgcgggcag gctggaatga gctgctcatc gcctccttct cccaccgctc catcgccgtg 360
aaggacggga tcctcctggc caccgggctg cacgtccacc ggaacagcgc ccacagcgca 420
ggggtgggcg ccatctttga cagggtgctg acggagcttg tgtccaagat gcgggacatg 480
cagatggaca agacggagct gggctgcctg cgcgccatcg tcctctttaa ccctgactcc 540
aaggggctct cgaacccggc cgaggtggag gcgctgaggg agaaggtcta tgcgtccttg 600
gaggcctact gcaagcacaa gtacccagag cagccgggaa ggttcgctaa gctcttgctc 660
cgcctgccgg ctctgcgctc catcgggctc aaatgcctgg aacatctctt cttcttcaag 720
ctcatcgggg acacacccat tgacaccttc cttatggaga tgctggaggc gccgcaccaa 780
atgacttagg cctgcgggcc catcctttgt gcccacccgt tctggccacc ctgcctggac 840
gccagctgtt cttctcagcc tgagccctgt ccctgccctt ctctgcctgg cctgtttgga 900
ctttggggca cagcctgtca ctgct 925
<210> 37
<211> 850
<212> DNA
<213> 人工序列
<220>
<223> 人工序列说明: 合成新多核苷酸序列
<400> 37
gccaacgagg acatgccggt ggagaggatc ctggaggctg agctggccgt ggagcccaag 60
accgagacct acgtggaggc aaacatgggg ctgaacccca gctcgccgaa cgaccctgtc 120
accaacattt gccaagcagc cgacaaacag cttttcaccc tggtggagtg ggccaagcgg 180
atcccacact tctcagagct gcccctggac gaccaggtca tcctgctgcg ggcaggctgg 240
aatgagctgc tcatcgcctc cttctcccac cgctccatcg ccgtgaagga cgggatcctc 300
ctggccaccg ggctgcacgt ccaccggaac agcgcccaca gcgcaggggt gggcgccatc 360
tttgacaggg tgctgacgga gcttgtgtcc aagatgcggg acatgcagat ggacaagacg 420
gagctgggct gcctgcgcgc catcgtcctc tttaaccctg actccaaggg gctctcgaac 480
ccggccgagg tggaggcgct gagggagaag gtctatgcgt ccttggaggc ctactgcaag 540
cacaagtacc cagagcagcc gggaaggttc gctaagctct tgctccgcct gccggctctg 600
cgctccatcg ggctcaaatg cctggaacat ctcttcttct tcaagctcat cggggacaca 660
cccattgaca ccttccttat ggagatgctg gaggcgccgc accaaatgac ttaggcctgc 720
gggcccatcc tttgtgccca cccgttctgg ccaccctgcc tggacgccag ctgttcttct 780
cagcctgagc cctgtccctg cccttctctg cctggcctgt ttggactttg gggcacagcc 840
tgtcactgct 850
<210> 38
<211> 670
<212> DNA
<213> 人工序列
<220>
<223> 人工序列说明: 合成多核苷酸
<400> 38
atcccacact tctcagagct gcccctggac gaccaggtca tcctgctgcg ggcaggctgg 60
aatgagctgc tcatcgcctc cttctcccac cgctccatcg ccgtgaagga cgggatcctc 120
ctggccaccg ggctgcacgt ccaccggaac agcgcccaca gcgcaggggt gggcgccatc 180
tttgacaggg tgctgacgga gcttgtgtcc aagatgcggg acatgcagat ggacaagacg 240
gagctgggct gcctgcgcgc catcgtcctc tttaaccctg actccaaggg gctctcgaac 300
ccggccgagg tggaggcgct gagggagaag gtctatgcgt ccttggaggc ctactgcaag 360
cacaagtacc cagagcagcc gggaaggttc gctaagctct tgctccgcct gccggctctg 420
cgctccatcg ggctcaaatg cctggaacat ctcttcttct tcaagctcat cggggacaca 480
cccattgaca ccttccttat ggagatgctg gaggcgccgc accaaatgac ttaggcctgc 540
gggcccatcc tttgtgccca cccgttctgg ccaccctgcc tggacgccag ctgttcttct 600
cagcctgagc cctgtccctg cccttctctg cctggcctgt ttggactttg gggcacagcc 660
tgtcactgct 670
<210> 39
<211> 672
<212> DNA
<213> 人工序列
<220>
<223> 人工序列说明: 合成多核苷酸
<400> 39
gccaacgagg acatgccggt ggagaggatc ctggaggctg agctggccgt ggagcccaag 60
accgagacct acgtggaggc aaacatgggg ctgaacccca gctcgccgaa cgaccctgtc 120
accaacattt gccaagcagc cgacaaacag cttttcaccc tggtggagtg ggccaagcgg 180
atcccacact tctcagagct gcccctggac gaccaggtca tcctgctgcg ggcaggctgg 240
aatgagctgc tcatcgcctc cttctcccac cgctccatcg ccgtgaagga cgggatcctc 300
ctggccaccg ggctgcacgt ccaccggaac agcgcccaca gcgcaggggt gggcgccatc 360
tttgacaggg tgctgacgga gcttgtgtcc aagatgcggg acatgcagat ggacaagacg 420
gagctgggct gcctgcgcgc catcgtcctc tttaaccctg actccaaggg gctctcgaac 480
ccggccgagg tggaggcgct gagggagaag gtctatgcgt ccttggaggc ctactgcaag 540
cacaagtacc cagagcagcc gggaaggttc gctaagctct tgctccgcct gccggctctg 600
cgctccatcg ggctcaaatg cctggaacat ctcttcttct tcaagctcat cggggacaca 660
cccattgaca cc 672
<210> 40
<211> 328
<212> PRT
<213> 人工序列
<220>
<223> 人工序列说明: 合成多肽
<400> 40
Cys Ala Ile Cys Gly Asp Arg Ser Ser Gly Lys His Tyr Gly Val Tyr
1 5 10 15
Ser Cys Glu Gly Cys Lys Gly Phe Phe Lys Arg Thr Val Arg Lys Asp
20 25 30
Leu Thr Tyr Thr Cys Arg Asp Asn Lys Asp Cys Leu Ile Asp Lys Arg
35 40 45
Gln Arg Asn Arg Cys Gln Tyr Cys Arg Tyr Gln Lys Cys Leu Ala Met
50 55 60
Gly Met Lys Arg Glu Ala Val Gln Glu Glu Arg Gln Arg Gly Lys Asp
65 70 75 80
Arg Asn Glu Asn Glu Val Glu Ser Thr Ser Ser Ala Asn Glu Asp Met
85 90 95
Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala Val Glu Pro Lys Thr
100 105 110
Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn Pro Ser Ser Pro Asn
115 120 125
Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr
130 135 140
Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe Ser Glu Leu Pro Leu
145 150 155 160
Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile
165 170 175
Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys Asp Gly Ile Leu Leu
180 185 190
Ala Thr Gly Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val
195 200 205
Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg
210 215 220
Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Val
225 230 235 240
Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn Pro Ala Glu Val Glu
245 250 255
Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu Ala Tyr Cys Lys His
260 265 270
Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu
275 280 285
Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe
290 295 300
Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met Glu Met
305 310 315 320
Leu Glu Ala Pro His Gln Ala Thr
325
<210> 41
<211> 262
<212> PRT
<213> 人工序列
<220>
<223> 人工序列说明: 合成多肽
<400> 41
Lys Arg Glu Ala Val Gln Glu Glu Arg Gln Arg Gly Lys Asp Arg Asn
1 5 10 15
Glu Asn Glu Val Glu Ser Thr Ser Ser Ala Asn Glu Asp Met Pro Val
20 25 30
Glu Lys Ile Leu Glu Ala Glu Leu Ala Val Glu Pro Lys Thr Glu Thr
35 40 45
Tyr Val Glu Ala Asn Met Gly Leu Asn Pro Ser Ser Pro Asn Asp Pro
50 55 60
Val Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr Leu Val
65 70 75 80
Glu Trp Ala Lys Arg Ile Pro His Phe Ser Glu Leu Pro Leu Asp Asp
85 90 95
Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser
100 105 110
Phe Ser His Arg Ser Ile Ala Val Lys Asp Gly Ile Leu Leu Ala Thr
115 120 125
Gly Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala
130 135 140
Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met
145 150 155 160
Gln Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Val Leu Phe
165 170 175
Asn Pro Asp Ser Lys Gly Leu Ser Asn Pro Ala Glu Val Glu Ala Leu
180 185 190
Arg Glu Lys Val Tyr Ala Ser Leu Glu Ala Tyr Cys Lys His Lys Tyr
195 200 205
Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala
210 215 220
Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys
225 230 235 240
Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu
245 250 255
Ala Pro His Gln Ala Thr
260
<210> 42
<211> 237
<212> PRT
<213> 人工序列
<220>
<223> 人工序列说明: 合成多肽
<400> 42
Ala Asn Glu Asp Met Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala
1 5 10 15
Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn
20 25 30
Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp
35 40 45
Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe
50 55 60
Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp
65 70 75 80
Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys
85 90 95
Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala
100 105 110
His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu
115 120 125
Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys
130 135 140
Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn
145 150 155 160
Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu
165 170 175
Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys
180 185 190
Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu
195 200 205
Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr
210 215 220
Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Ala Thr
225 230 235
<210> 43
<211> 177
<212> PRT
<213> 人工序列
<220>
<223> 人工序列说明: 合成多肽
<400> 43
Ile Pro His Phe Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu
1 5 10 15
Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser
20 25 30
Ile Ala Val Lys Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His
35 40 45
Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val
50 55 60
Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr
65 70 75 80
Glu Leu Gly Cys Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys
85 90 95
Gly Leu Ser Asn Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr
100 105 110
Ala Ser Leu Glu Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly
115 120 125
Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly
130 135 140
Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr
145 150 155 160
Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Ala
165 170 175
Thr
<210> 44
<211> 224
<212> PRT
<213> 人工序列
<220>
<223> 人工序列说明: 合成多肽
<400> 44
Ala Asn Glu Asp Met Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala
1 5 10 15
Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn
20 25 30
Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp
35 40 45
Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe
50 55 60
Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp
65 70 75 80
Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys
85 90 95
Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala
100 105 110
His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu
115 120 125
Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys
130 135 140
Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn
145 150 155 160
Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu
165 170 175
Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys
180 185 190
Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu
195 200 205
Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr
210 215 220
<210> 45
<211> 328
<212> PRT
<213> 人工序列
<220>
<223> 人工序列说明: 合成多肽
<400> 45
Cys Ala Ile Cys Gly Asp Arg Ser Ser Gly Lys His Tyr Gly Val Tyr
1 5 10 15
Ser Cys Glu Gly Cys Lys Gly Phe Phe Lys Arg Thr Val Arg Lys Asp
20 25 30
Leu Thr Tyr Thr Cys Arg Asp Asn Lys Asp Cys Leu Ile Asp Lys Arg
35 40 45
Gln Arg Asn Arg Cys Gln Tyr Cys Arg Tyr Gln Lys Cys Leu Ala Met
50 55 60
Gly Met Lys Arg Glu Ala Val Gln Glu Glu Arg Gln Arg Gly Lys Asp
65 70 75 80
Arg Asn Glu Asn Glu Val Glu Ser Thr Ser Ser Ala Asn Glu Asp Met
85 90 95
Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala Val Glu Pro Lys Thr
100 105 110
Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn Pro Ser Ser Pro Asn
115 120 125
Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr
130 135 140
Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe Ser Glu Leu Pro Leu
145 150 155 160
Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile
165 170 175
Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys Asp Gly Ile Leu Leu
180 185 190
Ala Thr Gly Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val
195 200 205
Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg
210 215 220
Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Val
225 230 235 240
Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn Pro Ala Glu Val Glu
245 250 255
Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu Ala Tyr Cys Lys His
260 265 270
Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu
275 280 285
Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe
290 295 300
Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met Glu Met
305 310 315 320
Leu Glu Ala Pro His Gln Met Thr
325
<210> 46
<211> 262
<212> PRT
<213> 人工序列
<220>
<223> 人工序列说明: 合成多肽
<400> 46
Lys Arg Glu Ala Val Gln Glu Glu Arg Gln Arg Gly Lys Asp Arg Asn
1 5 10 15
Glu Asn Glu Val Glu Ser Thr Ser Ser Ala Asn Glu Asp Met Pro Val
20 25 30
Glu Arg Ile Leu Glu Ala Glu Leu Ala Val Glu Pro Lys Thr Glu Thr
35 40 45
Tyr Val Glu Ala Asn Met Gly Leu Asn Pro Ser Ser Pro Asn Asp Pro
50 55 60
Val Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr Leu Val
65 70 75 80
Glu Trp Ala Lys Arg Ile Pro His Phe Ser Glu Leu Pro Leu Asp Asp
85 90 95
Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser
100 105 110
Phe Ser His Arg Ser Ile Ala Val Lys Asp Gly Ile Leu Leu Ala Thr
115 120 125
Gly Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala
130 135 140
Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met
145 150 155 160
Gln Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Val Leu Phe
165 170 175
Asn Pro Asp Ser Lys Gly Leu Ser Asn Pro Ala Glu Val Glu Ala Leu
180 185 190
Arg Glu Lys Val Tyr Ala Ser Leu Glu Ala Tyr Cys Lys His Lys Tyr
195 200 205
Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala
210 215 220
Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys
225 230 235 240
Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu
245 250 255
Ala Pro His Gln Met Thr
260
<210> 47
<211> 237
<212> PRT
<213> 人工序列
<220>
<223> 人工序列说明: 合成多肽
<400> 47
Ala Asn Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala
1 5 10 15
Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn
20 25 30
Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp
35 40 45
Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe
50 55 60
Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp
65 70 75 80
Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys
85 90 95
Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala
100 105 110
His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu
115 120 125
Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys
130 135 140
Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn
145 150 155 160
Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu
165 170 175
Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys
180 185 190
Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu
195 200 205
Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr
210 215 220
Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Met Thr
225 230 235
<210> 48
<211> 177
<212> PRT
<213> 人工序列
<220>
<223> 人工序列说明: 合成多肽
<400> 48
Ile Pro His Phe Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu
1 5 10 15
Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser
20 25 30
Ile Ala Val Lys Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His
35 40 45
Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val
50 55 60
Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr
65 70 75 80
Glu Leu Gly Cys Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys
85 90 95
Gly Leu Ser Asn Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr
100 105 110
Ala Ser Leu Glu Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly
115 120 125
Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly
130 135 140
Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr
145 150 155 160
Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Met
165 170 175
Thr
<210> 49
<211> 224
<212> PRT
<213> 人工序列
<220>
<223> 人工序列说明: 合成多肽
<400> 49
Ala Asn Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala
1 5 10 15
Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn
20 25 30
Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp
35 40 45
Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe
50 55 60
Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp
65 70 75 80
Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys
85 90 95
Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala
100 105 110
His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu
115 120 125
Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys
130 135 140
Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn
145 150 155 160
Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu
165 170 175
Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys
180 185 190
Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu
195 200 205
Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr
210 215 220
<210> 50
<211> 635
<212> DNA
<213> 飞蝗(Locusta migratoria)
<400> 50
tgcatacaga catgcctgtt gaacgcatac ttgaagctga aaaacgagtg gagtgcaaag 60
cagaaaacca agtggaatat gagctggtgg agtgggctaa acacatcccg cacttcacat 120
ccctacctct ggaggaccag gttctcctcc tcagagcagg ttggaatgaa ctgctaattg 180
cagcattttc acatcgatct gtagatgtta aagatggcat agtacttgcc actggtctca 240
cagtgcatcg aaattctgcc catcaagctg gagtcggcac aatatttgac agagttttga 300
cagaactggt agcaaagatg agagaaatga aaatggataa aactgaactt ggctgcttgc 360
gatctgttat tcttttcaat ccagaggtga ggggtttgaa atccgcccag gaagttgaac 420
ttctacgtga aaaagtatat gccgctttgg aagaatatac tagaacaaca catcccgatg 480
aaccaggaag atttgcaaaa cttttgcttc gtctgccttc tttacgttcc ataggcctta 540
agtgtttgga gcatttgttt ttctttcgcc ttattggaga tgttccaatt gatacgttcc 600
tgatggagat gcttgaatca ccttctgatt cataa 635
<210> 51
<211> 687
<212> DNA
<213> 美洲钝眼蜱(Amblyomma americanum)
<400> 51
cctcctgaga tgcctctgga gcgcatactg gaggcagagc tgcgggttga gtcacagacg 60
gggaccctct cggaaagcgc acagcagcag gatccagtga gcagcatctg ccaagctgca 120
gaccgacagc tgcaccagct agttcaatgg gccaagcaca ttccacattt tgaagagctt 180
ccccttgagg accgcatggt gttgctcaag gctggctgga acgagctgct cattgctgct 240
ttctcccacc gttctgttga cgtgcgtgat ggcattgtgc tcgctacagg tcttgtggtg 300
cagcggcata gtgctcatgg ggctggcgtt ggggccatat ttgatagggt tctcactgaa 360
ctggtagcaa agatgcgtga gatgaagatg gaccgcactg agcttggatg cctgcttgct 420
gtggtacttt ttaatcctga ggccaagggg ctgcggacct gcccaagtgg aggccctgag 480
ggagaaagtg tatctgcctt ggaagagcac tgccggcagc agtacccaga ccagcctggg 540
cgctttgcca agctgctgct gcggttgcca gctctgcgca gtattggcct caagtgcctc 600
gaacatctct ttttcttcaa gctcatcggg gacacgccca tcgacaactt tcttctttcc 660
atgctggagg ccccctctga cccctaa 687
<210> 52
<211> 693
<212> DNA
<213> 美洲钝眼蜱(Amblyomma americanum)
<400> 52
tctccggaca tgccactcga acgcattctc gaagccgaga tgcgcgtcga gcagccggca 60
ccgtccgttt tggcgcagac ggccgcatcg ggccgcgacc ccgtcaacag catgtgccag 120
gctgccccgc cacttcacga gctcgtacag tgggcccggc gaattccgca cttcgaagag 180
cttcccatcg aggatcgcac cgcgctgctc aaagccggct ggaacgaact gcttattgcc 240
gccttttcgc accgttctgt ggcggtgcgc gacggcatcg ttctggccac cgggctggtg 300
gtgcagcggc acagcgcaca cggcgcaggc gttggcgaca tcttcgaccg cgtactagcc 360
gagctggtgg ccaagatgcg cgacatgaag atggacaaaa cggagctcgg ctgcctgcgc 420
gccgtggtgc tcttcaatcc agacgccaag ggtctccgaa acgccaccag agtagaggcg 480
ctccgcgaga aggtgtatgc ggcgctggag gagcactgcc gtcggcacca cccggaccaa 540
ccgggtcgct tcggcaagct gctgctgcgg ctgcctgcct tgcgcagcat cgggctcaaa 600
tgcctcgagc atctgttctt cttcaagctc atcggagaca ctcccataga cagcttcctg 660
ctcaacatgc tggaggcacc ggcagacccc tag 693
<210> 53
<211> 801
<212> DNA
<213> 招潮蟹(Celuca pugilator)
<400> 53
tcagacatgc caattgccag catacgggag gcagagctca gcgtggatcc catagatgag 60
cagccgctgg accaaggggt gaggcttcag gttccactcg cacctcctga tagtgaaaag 120
tgtagcttta ctttaccttt tcatcccgtc agtgaagtat cctgtgctaa ccctctgcag 180
gatgtggtga gcaacatatg ccaggcagct gacagacatc tggtgcagct ggtggagtgg 240
gccaagcaca tcccacactt cacagacctt cccatagagg accaagtggt attactcaaa 300
gccgggtgga acgagttgct tattgcctca ttctcacacc gtagcatggg cgtggaggat 360
ggcatcgtgc tggccacagg gctcgtgatc cacagaagta gtgctcacca ggctggagtg 420
ggtgccatat ttgatcgtgt cctctctgag ctggtggcca agatgaagga gatgaagatt 480
gacaagacag agctgggctg ccttcgctcc atcgtcctgt tcaacccaga tgccaaagga 540
ctaaactgcg tcaatgatgt ggagatcttg cgtgagaagg tgtatgctgc cctggaggag 600
tacacacgaa ccacttaccc tgatgaacct ggacgctttg ccaagttgct tctgcgactt 660
cctgcactca ggtctatagg cctgaagtgt cttgagtacc tcttcctgtt taagctgatt 720
ggagacactc ccctggacag ctacttgatg aagatgctcg tagacaaccc aaatacaagc 780
gtcactcccc ccaccagcta g 801
<210> 54
<211> 690
<212> DNA
<213> 黄粉虫(Tenebrio molitor)
<400> 54
gccgagatgc ccctcgacag gataatcgag gcggagaaac ggatagaatg cacacccgct 60
ggtggctctg gtggtgtcgg agagcaacac gacggggtga acaacatctg tcaagccact 120
aacaagcagc tgttccaact ggtgcaatgg gctaagctca tacctcactt tacctcgttg 180
ccgatgtcgg accaggtgct tttattgagg gcaggatgga atgaattgct catcgccgca 240
ttctcgcaca gatctataca ggcgcaggat gccatcgttc tagccacggg gttgacagtt 300
aacaaaacgt cggcgcacgc cgtgggcgtg ggcaacatct acgaccgcgt cctctccgag 360
ctggtgaaca agatgaaaga gatgaagatg gacaagacgg agctgggctg cttgagagcc 420
atcatcctct acaaccccac gtgtcgcggc atcaagtccg tgcaggaagt ggagatgctg 480
cgtgagaaaa tttacggcgt gctggaagag tacaccagga ccacccaccc gaacgagccc 540
ggcaggttcg ccaaactgct tctgcgcctc ccggccctca ggtccatcgg gttgaaatgt 600
tccgaacacc tctttttctt caagctgatc ggtgatgttc caatagacac gttcctgatg 660
gagatgctgg agtctccggc ggacgcttag 690
<210> 55
<211> 681
<212> DNA
<213> 蜜蜂(Apis mellifera)
<400> 55
cattcggaca tgccgatcga gcgtatcctg gaggccgaga agagagtcga atgtaagatg 60
gagcaacagg gaaattacga gaatgcagtg tcgcacattt gcaacgccac gaacaaacag 120
ctgttccagc tggtagcatg ggcgaaacac atcccgcatt ttacctcgtt gccactggag 180
gatcaggtac ttctgctcag ggccggttgg aacgagttgc tgatagcctc cttttcccac 240
cgttccatcg acgtgaagga cggtatcgtg ctggcgacgg ggatcaccgt gcatcggaac 300
tcggcgcagc aggccggcgt gggcacgata ttcgaccgtg tcctctcgga gcttgtctcg 360
aaaatgcgtg aaatgaagat ggacaggaca gagcttggct gtctcagatc tataatactc 420
ttcaatcccg aggttcgagg actgaaatcc atccaggaag tgaccctgct ccgtgagaag 480
atctacggcg ccctggaggg ttattgccgc gtagcttggc ccgacgacgc tggaagattc 540
gcgaaattac ttctacgcct gcccgccatc cgctcgatcg gattaaagtg cctcgagtac 600
ctgttcttct tcaaaatgat cggtgacgta ccgatcgacg attttctcgt ggagatgtta 660
gaatcgcgat cagatcctta g 681
<210> 56
<211> 210
<212> PRT
<213> 飞蝗(Locusta migratoria)
<400> 56
His Thr Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Lys Arg Val
1 5 10 15
Glu Cys Lys Ala Glu Asn Gln Val Glu Tyr Glu Leu Val Glu Trp Ala
20 25 30
Lys His Ile Pro His Phe Thr Ser Leu Pro Leu Glu Asp Gln Val Leu
35 40 45
Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His
50 55 60
Arg Ser Val Asp Val Lys Asp Gly Ile Val Leu Ala Thr Gly Leu Thr
65 70 75 80
Val His Arg Asn Ser Ala His Gln Ala Gly Val Gly Thr Ile Phe Asp
85 90 95
Arg Val Leu Thr Glu Leu Val Ala Lys Met Arg Glu Met Lys Met Asp
100 105 110
Lys Thr Glu Leu Gly Cys Leu Arg Ser Val Ile Leu Phe Asn Pro Glu
115 120 125
Val Arg Gly Leu Lys Ser Ala Gln Glu Val Glu Leu Leu Arg Glu Lys
130 135 140
Val Tyr Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr His Pro Asp Glu
145 150 155 160
Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ser Leu Arg Ser
165 170 175
Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Arg Leu Ile Gly
180 185 190
Asp Val Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser Pro Ser
195 200 205
Asp Ser
210
<210> 57
<211> 228
<212> PRT
<213> 美洲钝眼蜱(Amblyomma americanum)
<400> 57
Pro Pro Glu Met Pro Leu Glu Arg Ile Leu Glu Ala Glu Leu Arg Val
1 5 10 15
Glu Ser Gln Thr Gly Thr Leu Ser Glu Ser Ala Gln Gln Gln Asp Pro
20 25 30
Val Ser Ser Ile Cys Gln Ala Ala Asp Arg Gln Leu His Gln Leu Val
35 40 45
Gln Trp Ala Lys His Ile Pro His Phe Glu Glu Leu Pro Leu Glu Asp
50 55 60
Arg Met Val Leu Leu Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala
65 70 75 80
Phe Ser His Arg Ser Val Asp Val Arg Asp Gly Ile Val Leu Ala Thr
85 90 95
Gly Leu Val Val Gln Arg His Ser Ala His Gly Ala Gly Val Gly Ala
100 105 110
Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ala Lys Met Arg Glu Met
115 120 125
Lys Met Asp Arg Thr Glu Leu Gly Cys Leu Leu Ala Val Val Leu Phe
130 135 140
Asn Pro Glu Ala Lys Gly Leu Arg Thr Cys Pro Ser Gly Gly Pro Glu
145 150 155 160
Gly Glu Ser Val Ser Ala Leu Glu Glu His Cys Arg Gln Gln Tyr Pro
165 170 175
Asp Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu
180 185 190
Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu
195 200 205
Ile Gly Asp Thr Pro Ile Asp Asn Phe Leu Leu Ser Met Leu Glu Ala
210 215 220
Pro Ser Asp Pro
225
<210> 58
<211> 230
<212> PRT
<213> 美洲钝眼蜱(Amblyomma americanum)
<400> 58
Ser Pro Asp Met Pro Leu Glu Arg Ile Leu Glu Ala Glu Met Arg Val
1 5 10 15
Glu Gln Pro Ala Pro Ser Val Leu Ala Gln Thr Ala Ala Ser Gly Arg
20 25 30
Asp Pro Val Asn Ser Met Cys Gln Ala Ala Pro Pro Leu His Glu Leu
35 40 45
Val Gln Trp Ala Arg Arg Ile Pro His Phe Glu Glu Leu Pro Ile Glu
50 55 60
Asp Arg Thr Ala Leu Leu Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala
65 70 75 80
Ala Phe Ser His Arg Ser Val Ala Val Arg Asp Gly Ile Val Leu Ala
85 90 95
Thr Gly Leu Val Val Gln Arg His Ser Ala His Gly Ala Gly Val Gly
100 105 110
Asp Ile Phe Asp Arg Val Leu Ala Glu Leu Val Ala Lys Met Arg Asp
115 120 125
Met Lys Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Val Val Leu
130 135 140
Phe Asn Pro Asp Ala Lys Gly Leu Arg Asn Ala Thr Arg Val Glu Ala
145 150 155 160
Leu Arg Glu Lys Val Tyr Ala Ala Leu Glu Glu His Cys Arg Arg His
165 170 175
His Pro Asp Gln Pro Gly Arg Phe Gly Lys Leu Leu Leu Arg Leu Pro
180 185 190
Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe
195 200 205
Lys Leu Ile Gly Asp Thr Pro Ile Asp Ser Phe Leu Leu Asn Met Leu
210 215 220
Glu Ala Pro Ala Asp Pro
225 230
<210> 59
<211> 266
<212> PRT
<213> 招潮蟹(Celuca pugilator)
<400> 59
Ser Asp Met Pro Ile Ala Ser Ile Arg Glu Ala Glu Leu Ser Val Asp
1 5 10 15
Pro Ile Asp Glu Gln Pro Leu Asp Gln Gly Val Arg Leu Gln Val Pro
20 25 30
Leu Ala Pro Pro Asp Ser Glu Lys Cys Ser Phe Thr Leu Pro Phe His
35 40 45
Pro Val Ser Glu Val Ser Cys Ala Asn Pro Leu Gln Asp Val Val Ser
50 55 60
Asn Ile Cys Gln Ala Ala Asp Arg His Leu Val Gln Leu Val Glu Trp
65 70 75 80
Ala Lys His Ile Pro His Phe Thr Asp Leu Pro Ile Glu Asp Gln Val
85 90 95
Val Leu Leu Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser
100 105 110
His Arg Ser Met Gly Val Glu Asp Gly Ile Val Leu Ala Thr Gly Leu
115 120 125
Val Ile His Arg Ser Ser Ala His Gln Ala Gly Val Gly Ala Ile Phe
130 135 140
Asp Arg Val Leu Ser Glu Leu Val Ala Lys Met Lys Glu Met Lys Ile
145 150 155 160
Asp Lys Thr Glu Leu Gly Cys Leu Arg Ser Ile Val Leu Phe Asn Pro
165 170 175
Asp Ala Lys Gly Leu Asn Cys Val Asn Asp Val Glu Ile Leu Arg Glu
180 185 190
Lys Val Tyr Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr Tyr Pro Asp
195 200 205
Glu Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg
210 215 220
Ser Ile Gly Leu Lys Cys Leu Glu Tyr Leu Phe Leu Phe Lys Leu Ile
225 230 235 240
Gly Asp Thr Pro Leu Asp Ser Tyr Leu Met Lys Met Leu Val Asp Asn
245 250 255
Pro Asn Thr Ser Val Thr Pro Pro Thr Ser
260 265
<210> 60
<211> 229
<212> PRT
<213> 黄粉虫(Tenebrio molitor)
<400> 60
Ala Glu Met Pro Leu Asp Arg Ile Ile Glu Ala Glu Lys Arg Ile Glu
1 5 10 15
Cys Thr Pro Ala Gly Gly Ser Gly Gly Val Gly Glu Gln His Asp Gly
20 25 30
Val Asn Asn Ile Cys Gln Ala Thr Asn Lys Gln Leu Phe Gln Leu Val
35 40 45
Gln Trp Ala Lys Leu Ile Pro His Phe Thr Ser Leu Pro Met Ser Asp
50 55 60
Gln Val Leu Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala
65 70 75 80
Phe Ser His Arg Ser Ile Gln Ala Gln Asp Ala Ile Val Leu Ala Thr
85 90 95
Gly Leu Thr Val Asn Lys Thr Ser Ala His Ala Val Gly Val Gly Asn
100 105 110
Ile Tyr Asp Arg Val Leu Ser Glu Leu Val Asn Lys Met Lys Glu Met
115 120 125
Lys Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Ile Leu Tyr
130 135 140
Asn Pro Thr Cys Arg Gly Ile Lys Ser Val Gln Glu Val Glu Met Leu
145 150 155 160
Arg Glu Lys Ile Tyr Gly Val Leu Glu Glu Tyr Thr Arg Thr Thr His
165 170 175
Pro Asn Glu Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala
180 185 190
Leu Arg Ser Ile Gly Leu Lys Cys Ser Glu His Leu Phe Phe Phe Lys
195 200 205
Leu Ile Gly Asp Val Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu
210 215 220
Ser Pro Ala Asp Ala
225
<210> 61
<211> 226
<212> PRT
<213> 蜜蜂(Apis mellifera)
<400> 61
His Ser Asp Met Pro Ile Glu Arg Ile Leu Glu Ala Glu Lys Arg Val
1 5 10 15
Glu Cys Lys Met Glu Gln Gln Gly Asn Tyr Glu Asn Ala Val Ser His
20 25 30
Ile Cys Asn Ala Thr Asn Lys Gln Leu Phe Gln Leu Val Ala Trp Ala
35 40 45
Lys His Ile Pro His Phe Thr Ser Leu Pro Leu Glu Asp Gln Val Leu
50 55 60
Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His
65 70 75 80
Arg Ser Ile Asp Val Lys Asp Gly Ile Val Leu Ala Thr Gly Ile Thr
85 90 95
Val His Arg Asn Ser Ala Gln Gln Ala Gly Val Gly Thr Ile Phe Asp
100 105 110
Arg Val Leu Ser Glu Leu Val Ser Lys Met Arg Glu Met Lys Met Asp
115 120 125
Arg Thr Glu Leu Gly Cys Leu Arg Ser Ile Ile Leu Phe Asn Pro Glu
130 135 140
Val Arg Gly Leu Lys Ser Ile Gln Glu Val Thr Leu Leu Arg Glu Lys
145 150 155 160
Ile Tyr Gly Ala Leu Glu Gly Tyr Cys Arg Val Ala Trp Pro Asp Asp
165 170 175
Ala Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Ile Arg Ser
180 185 190
Ile Gly Leu Lys Cys Leu Glu Tyr Leu Phe Phe Phe Lys Met Ile Gly
195 200 205
Asp Val Pro Ile Asp Asp Phe Leu Val Glu Met Leu Glu Ser Arg Ser
210 215 220
Asp Pro
225
<210> 62
<211> 714
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 62
gccaacgagg acatgcctgt agagaagatt ctggaagccg agcttgctgt cgagcccaag 60
actgagacat acgtggaggc aaacatgggg ctgaacccca gctcaccaaa tgaccctgtt 120
accaacatct gtcaagcagc agacaagcag ctcttcactc ttgtggagtg ggccaagagg 180
atcccacact tttctgagct gcccctagac gaccaggtca tcctgctacg ggcaggctgg 240
aacgagctgc tgatcgcctc cttctcccac cgctccatag ctgtgaaaga tgggattctc 300
ctggccaccg gcctgcacgt acaccggaac agcgctcaca gtgctggggt gggcgccatc 360
tttgacaggg tgctaacaga gctggtgtct aagatgcgtg acatgcagat ggacaagacg 420
gagctgggct gcctgcgagc cattgtcctg ttcaaccctg actctaaggg gctctcaaac 480
cctgctgagg tggaggcgtt gagggagaag gtgtatgcgt cactagaagc gtactgcaaa 540
cacaagtacc ctgagcagcc gggcaggttt gccaagctgc tgctccgcct gcctgcactg 600
cgttccatcg ggctcaagtg cctggagcac ctgttcttct tcaagctcat cggggacacg 660
cccatcgaca ccttcctcat ggagatgctg gaggcaccac atcaagccac ctag 714
<210> 63
<211> 720
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 63
gcccctgagg agatgcctgt ggacaggatc ctggaggcag agcttgctgt ggagcagaag 60
agtgaccaag gcgttgaggg tcctggggcc accgggggtg gtggcagcag cccaaatgac 120
ccagtgacta acatctgcca ggcagctgac aaacagctgt tcacactcgt tgagtgggca 180
aagaggatcc cgcacttctc ctccctacct ctggacgatc aggtcatact gctgcgggca 240
ggctggaacg agctcctcat tgcgtccttc tcccatcggt ccattgatgt ccgagatggc 300
atcctcctgg ccacgggtct tcatgtgcac agaaactcag cccattccgc aggcgtggga 360
gccatctttg atcgggtgct gacagagcta gtgtccaaaa tgcgtgacat gaggatggac 420
aagacagagc ttggctgcct gcgggcaatc atcatgttta atccagacgc caagggcctc 480
tccaaccctg gagaggtgga gatccttcgg gagaaggtgt acgcctcact ggagacctat 540
tgcaagcaga agtaccctga gcagcagggc cggtttgcca agctgctgtt acgtcttcct 600
gccctccgct ccatcggcct caagtgtctg gagcacctgt tcttcttcaa gctcattggc 660
gacaccccca ttgacacctt cctcatggag atgcttgagg ctccccacca gctagcctga 720
<210> 64
<211> 705
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 64
agccacgaag acatgcccgt ggagaggatt ctagaagccg aacttgctgt ggaaccaaag 60
acagaatcct acggtgacat gaacgtggag aactcaacaa atgaccctgt taccaacata 120
tgccatgctg cagataagca acttttcacc ctcgttgagt gggccaaacg catcccccac 180
ttctcagatc tcaccttgga ggaccaggtc attctactcc gggcagggtg gaatgaactg 240
ctcattgcct ccttctccca ccgctcggtt tccgtccagg atggcatcct gctggccacg 300
ggcctccacg tgcacaggag cagcgctcac agccggggag tcggctccat cttcgacaga 360
gtccttacag agttggtgtc caagatgaaa gacatgcaga tggataagtc agagctgggg 420
tgcctacggg ccatcgtgct gtttaaccca gatgccaagg gtttatccaa cccctctgag 480
gtggagactc ttcgagagaa ggtttatgcc accctggagg cctataccaa gcagaagtat 540
ccggaacagc caggcaggtt tgccaagctt ctgctgcgtc tccctgctct gcgctccatc 600
ggcttgaaat gcctggaaca cctcttcttc ttcaagctca ttggagacac tcccatcgac 660
agcttcctca tggagatgtt ggagacccca ctgcagatca cctga 705
<210> 65
<211> 850
<212> DNA
<213> 智人(Homo sapiens)
<400> 65
gccaacgagg acatgccggt ggagaggatc ctggaggctg agctggccgt ggagcccaag 60
accgagacct acgtggaggc aaacatgggg ctgaacccca gctcgccgaa cgaccctgtc 120
accaacattt gccaagcagc cgacaaacag cttttcaccc tggtggagtg ggccaagcgg 180
atcccacact tctcagagct gcccctggac gaccaggtca tcctgctgcg ggcaggctgg 240
aatgagctgc tcatcgcctc cttctcccac cgctccatcg ccgtgaagga cgggatcctc 300
ctggccaccg ggctgcacgt ccaccggaac agcgcccaca gcgcaggggt gggcgccatc 360
tttgacaggg tgctgacgga gcttgtgtcc aagatgcggg acatgcagat ggacaagacg 420
gagctgggct gcctgcgcgc catcgtcctc tttaaccctg actccaaggg gctctcgaac 480
ccggccgagg tggaggcgct gagggagaag gtctatgcgt ccttggaggc ctactgcaag 540
cacaagtacc cagagcagcc gggaaggttc gctaagctct tgctccgcct gccggctctg 600
cgctccatcg ggctcaaatg cctggaacat ctcttcttct tcaagctcat cggggacaca 660
cccattgaca ccttccttat ggagatgctg gaggcgccgc accaaatgac ttaggcctgc 720
gggcccatcc tttgtgccca cccgttctgg ccaccctgcc tggacgccag ctgttcttct 780
cagcctgagc cctgtccctg cccttctctg cctggcctgt ttggactttg gggcacagcc 840
tgtcactgct 850
<210> 66
<211> 720
<212> DNA
<213> 智人(Homo sapiens)
<400> 66
gcccccgagg agatgcctgt ggacaggatc ctggaggcag agcttgctgt ggaacagaag 60
agtgaccagg gcgttgaggg tcctggggga accgggggta gcggcagcag cccaaatgac 120
cctgtgacta acatctgtca ggcagctgac aaacagctat tcacgcttgt tgagtgggcg 180
aagaggatcc cacacttttc ctccttgcct ctggatgatc aggtcatatt gctgcgggca 240
ggctggaatg aactcctcat tgcctccttt tcacaccgat ccattgatgt tcgagatggc 300
atcctccttg ccacaggtct tcacgtgcac cgcaactcag cccattcagc aggagtagga 360
gccatctttg atcgggtgct gacagagcta gtgtccaaaa tgcgtgacat gaggatggac 420
aagacagagc ttggctgcct gagggcaatc attctgttta atccagatgc caagggcctc 480
tccaacccta gtgaggtgga ggtcctgcgg gagaaagtgt atgcatcact ggagacctac 540
tgcaaacaga agtaccctga gcagcaggga cggtttgcca agctgctgct acgtcttcct 600
gccctccggt ccattggcct taagtgtcta gagcatctgt ttttcttcaa gctcattggt 660
gacaccccca tcgacacctt cctcatggag atgcttgagg ctccccatca actggcctga 720
<210> 67
<211> 705
<212> DNA
<213> 智人(Homo sapiens)
<400> 67
ggtcatgaag acatgcctgt ggagaggatt ctagaagctg aacttgctgt tgaaccaaag 60
acagaatcct atggtgacat gaatatggag aactcgacaa atgaccctgt taccaacata 120
tgtcatgctg ctgacaagca gcttttcacc ctcgttgaat gggccaagcg tattccccac 180
ttctctgacc tcaccttgga ggaccaggtc attttgcttc gggcagggtg gaatgaattg 240
ctgattgcct ctttctccca ccgctcagtt tccgtgcagg atggcatcct tctggccacg 300
ggtttacatg tccaccggag cagtgcccac agtgctgggg tcggctccat ctttgacaga 360
gttctaactg agctggtttc caaaatgaaa gacatgcaga tggacaagtc ggaactggga 420
tgcctgcgag ccattgtact ctttaaccca gatgccaagg gcctgtccaa cccctctgag 480
gtggagactc tgcgagagaa ggtttatgcc acccttgagg cctacaccaa gcagaagtat 540
ccggaacagc caggcaggtt tgccaagctg ctgctgcgcc tcccagctct gcgttccatt 600
ggcttgaaat gcctggagca cctcttcttc ttcaagctca tcggggacac ccccattgac 660
accttcctca tggagatgtt ggagaccccg ctgcagatca cctga 705
<210> 68
<211> 237
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 68
Ala Asn Glu Asp Met Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala
1 5 10 15
Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn
20 25 30
Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp
35 40 45
Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe
50 55 60
Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp
65 70 75 80
Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys
85 90 95
Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala
100 105 110
His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu
115 120 125
Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys
130 135 140
Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn
145 150 155 160
Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu
165 170 175
Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys
180 185 190
Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu
195 200 205
Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr
210 215 220
Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Ala Thr
225 230 235
<210> 69
<211> 239
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 69
Ala Pro Glu Glu Met Pro Val Asp Arg Ile Leu Glu Ala Glu Leu Ala
1 5 10 15
Val Glu Gln Lys Ser Asp Gln Gly Val Glu Gly Pro Gly Ala Thr Gly
20 25 30
Gly Gly Gly Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala
35 40 45
Ala Asp Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro
50 55 60
His Phe Ser Ser Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala
65 70 75 80
Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Asp
85 90 95
Val Arg Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn
100 105 110
Ser Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr
115 120 125
Glu Leu Val Ser Lys Met Arg Asp Met Arg Met Asp Lys Thr Glu Leu
130 135 140
Gly Cys Leu Arg Ala Ile Ile Met Phe Asn Pro Asp Ala Lys Gly Leu
145 150 155 160
Ser Asn Pro Gly Glu Val Glu Ile Leu Arg Glu Lys Val Tyr Ala Ser
165 170 175
Leu Glu Thr Tyr Cys Lys Gln Lys Tyr Pro Glu Gln Gln Gly Arg Phe
180 185 190
Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys
195 200 205
Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile
210 215 220
Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Leu Ala
225 230 235
<210> 70
<211> 234
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 70
Ser His Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala
1 5 10 15
Val Glu Pro Lys Thr Glu Ser Tyr Gly Asp Met Asn Val Glu Asn Ser
20 25 30
Thr Asn Asp Pro Val Thr Asn Ile Cys His Ala Ala Asp Lys Gln Leu
35 40 45
Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe Ser Asp Leu
50 55 60
Thr Leu Glu Asp Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu
65 70 75 80
Leu Ile Ala Ser Phe Ser His Arg Ser Val Ser Val Gln Asp Gly Ile
85 90 95
Leu Leu Ala Thr Gly Leu His Val His Arg Ser Ser Ala His Ser Arg
100 105 110
Gly Val Gly Ser Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys
115 120 125
Met Lys Asp Met Gln Met Asp Lys Ser Glu Leu Gly Cys Leu Arg Ala
130 135 140
Ile Val Leu Phe Asn Pro Asp Ala Lys Gly Leu Ser Asn Pro Ser Glu
145 150 155 160
Val Glu Thr Leu Arg Glu Lys Val Tyr Ala Thr Leu Glu Ala Tyr Thr
165 170 175
Lys Gln Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu
180 185 190
Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu
195 200 205
Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Ser Phe Leu Met
210 215 220
Glu Met Leu Glu Thr Pro Leu Gln Ile Thr
225 230
<210> 71
<211> 237
<212> PRT
<213> 智人(Homo sapiens)
<400> 71
Ala Asn Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala
1 5 10 15
Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn
20 25 30
Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp
35 40 45
Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe
50 55 60
Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp
65 70 75 80
Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys
85 90 95
Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala
100 105 110
His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu
115 120 125
Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys
130 135 140
Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn
145 150 155 160
Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu
165 170 175
Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys
180 185 190
Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu
195 200 205
Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr
210 215 220
Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Met Thr
225 230 235
<210> 72
<211> 239
<212> PRT
<213> 智人(Homo sapiens)
<400> 72
Ala Pro Glu Glu Met Pro Val Asp Arg Ile Leu Glu Ala Glu Leu Ala
1 5 10 15
Val Glu Gln Lys Ser Asp Gln Gly Val Glu Gly Pro Gly Gly Thr Gly
20 25 30
Gly Ser Gly Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala
35 40 45
Ala Asp Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro
50 55 60
His Phe Ser Ser Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala
65 70 75 80
Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Asp
85 90 95
Val Arg Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn
100 105 110
Ser Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr
115 120 125
Glu Leu Val Ser Lys Met Arg Asp Met Arg Met Asp Lys Thr Glu Leu
130 135 140
Gly Cys Leu Arg Ala Ile Ile Leu Phe Asn Pro Asp Ala Lys Gly Leu
145 150 155 160
Ser Asn Pro Ser Glu Val Glu Val Leu Arg Glu Lys Val Tyr Ala Ser
165 170 175
Leu Glu Thr Tyr Cys Lys Gln Lys Tyr Pro Glu Gln Gln Gly Arg Phe
180 185 190
Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys
195 200 205
Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile
210 215 220
Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Leu Ala
225 230 235
<210> 73
<211> 234
<212> PRT
<213> 智人(Homo sapiens)
<400> 73
Gly His Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala
1 5 10 15
Val Glu Pro Lys Thr Glu Ser Tyr Gly Asp Met Asn Met Glu Asn Ser
20 25 30
Thr Asn Asp Pro Val Thr Asn Ile Cys His Ala Ala Asp Lys Gln Leu
35 40 45
Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe Ser Asp Leu
50 55 60
Thr Leu Glu Asp Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu
65 70 75 80
Leu Ile Ala Ser Phe Ser His Arg Ser Val Ser Val Gln Asp Gly Ile
85 90 95
Leu Leu Ala Thr Gly Leu His Val His Arg Ser Ser Ala His Ser Ala
100 105 110
Gly Val Gly Ser Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys
115 120 125
Met Lys Asp Met Gln Met Asp Lys Ser Glu Leu Gly Cys Leu Arg Ala
130 135 140
Ile Val Leu Phe Asn Pro Asp Ala Lys Gly Leu Ser Asn Pro Ser Glu
145 150 155 160
Val Glu Thr Leu Arg Glu Lys Val Tyr Ala Thr Leu Glu Ala Tyr Thr
165 170 175
Lys Gln Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu
180 185 190
Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu
195 200 205
Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met
210 215 220
Glu Met Leu Glu Thr Pro Leu Gln Ile Thr
225 230
<210> 74
<211> 516
<212> DNA
<213> 飞蝗(Locusta migratoria)
<400> 74
atccctacct ctggaggacc aggttctcct cctcagagca ggttggaatg aactgctaat 60
tgcagcattt tcacatcgat ctgtagatgt taaagatggc atagtacttg ccactggtct 120
cacagtgcat cgaaattctg cccatcaagc tggagtcggc acaatatttg acagagtttt 180
gacagaactg gtagcaaaga tgagagaaat gaaaatggat aaaactgaac ttggctgctt 240
gcgatctgtt attcttttca atccagaggt gaggggtttg aaatccgccc aggaagttga 300
acttctacgt gaaaaagtat atgccgcttt ggaagaatat actagaacaa cacatcccga 360
tgaaccagga agatttgcaa aacttttgct tcgtctgcct tctttacgtt ccataggcct 420
taagtgtttg gagcatttgt tttctttcgc cttattggag atgttccaat tgatacgttc 480
ctgatggaga tgcttgaatc accttctgat tcataa 516
<210> 75
<211> 528
<212> DNA
<213> 美洲钝眼蜱(Amblyomma americanum)
<400> 75
attccacatt ttgaagagct tccccttgag gaccgcatgg tgttgctcaa ggctggctgg 60
aacgagctgc tcattgctgc tttctcccac cgttctgttg acgtgcgtga tggcattgtg 120
ctcgctacag gtcttgtggt gcagcggcat agtgctcatg gggctggcgt tggggccata 180
tttgataggg ttctcactga actggtagca aagatgcgtg agatgaagat ggaccgcact 240
gagcttggat gcctgcttgc tgtggtactt tttaatcctg aggccaaggg gctgcggacc 300
tgcccaagtg gaggccctga gggagaaagt gtatctgcct tggaagagca ctgccggcag 360
cagtacccag accagcctgg gcgctttgcc aagctgctgc tgcggttgcc agctctgcgc 420
agtattggcc tcaagtgcct cgaacatctc tttttcttca agctcatcgg ggacacgccc 480
atcgacaact ttcttctttc catgctggag gccccctctg acccctaa 528
<210> 76
<211> 531
<212> DNA
<213> 美洲钝眼蜱(Amblyomma americanum)
<400> 76
attccgcact tcgaagagct tcccatcgag gatcgcaccg cgctgctcaa agccggctgg 60
aacgaactgc ttattgccgc cttttcgcac cgttctgtgg cggtgcgcga cggcatcgtt 120
ctggccaccg ggctggtggt gcagcggcac agcgcacacg gcgcaggcgt tggcgacatc 180
ttcgaccgcg tactagccga gctggtggcc aagatgcgcg acatgaagat ggacaaaacg 240
gagctcggct gcctgcgcgc cgtggtgctc ttcaatccag acgccaaggg tctccgaaac 300
gccaccagag tagaggcgct ccgcgagaag gtgtatgcgg cgctggagga gcactgccgt 360
cggcaccacc cggaccaacc gggtcgcttc ggcaagctgc tgctgcggct gcctgccttg 420
cgcagcatcg ggctcaaatg cctcgagcat ctgttcttct tcaagctcat cggagacact 480
cccatagaca gcttcctgct caacatgctg gaggcaccgg cagaccccta g 531
<210> 77
<211> 552
<212> DNA
<213> 招潮蟹(Celuca pugilator)
<400> 77
atcccacact tcacagacct tcccatagag gaccaagtgg tattactcaa agccgggtgg 60
aacgagttgc ttattgcctc attctcacac cgtagcatgg gcgtggagga tggcatcgtg 120
ctggccacag ggctcgtgat ccacagaagt agtgctcacc aggctggagt gggtgccata 180
tttgatcgtg tcctctctga gctggtggcc aagatgaagg agatgaagat tgacaagaca 240
gagctgggct gccttcgctc catcgtcctg ttcaacccag atgccaaagg actaaactgc 300
gtcaatgatg tggagatctt gcgtgagaag gtgtatgctg ccctggagga gtacacacga 360
accacttacc ctgatgaacc tggacgcttt gccaagttgc ttctgcgact tcctgcactc 420
aggtctatag gcctgaagtg tcttgagtac ctcttcctgt ttaagctgat tggagacact 480
cccctggaca gctacttgat gaagatgctc gtagacaacc caaatacaag cgtcactccc 540
cccaccagct ag 552
<210> 78
<211> 531
<212> DNA
<213> 黄粉虫(Tenebrio molitor)
<400> 78
atacctcact ttacctcgtt gccgatgtcg gaccaggtgc ttttattgag ggcaggatgg 60
aatgaattgc tcatcgccgc attctcgcac agatctatac aggcgcagga tgccatcgtt 120
ctagccacgg ggttgacagt taacaaaacg tcggcgcacg ccgtgggcgt gggcaacatc 180
tacgaccgcg tcctctccga gctggtgaac aagatgaaag agatgaagat ggacaagacg 240
gagctgggct gcttgagagc catcatcctc tacaacccca cgtgtcgcgg catcaagtcc 300
gtgcaggaag tggagatgct gcgtgagaaa atttacggcg tgctggaaga gtacaccagg 360
accacccacc cgaacgagcc cggcaggttc gccaaactgc ttctgcgcct cccggccctc 420
aggtccatcg ggttgaaatg ttccgaacac ctctttttct tcaagctgat cggtgatgtt 480
ccaatagaca cgttcctgat ggagatgctg gagtctccgg cggacgctta g 531
<210> 79
<211> 531
<212> DNA
<213> 蜜蜂(Apis mellifera)
<400> 79
atcccgcatt ttacctcgtt gccactggag gatcaggtac ttctgctcag ggccggttgg 60
aacgagttgc tgatagcctc cttttcccac cgttccatcg acgtgaagga cggtatcgtg 120
ctggcgacgg ggatcaccgt gcatcggaac tcggcgcagc aggccggcgt gggcacgata 180
ttcgaccgtg tcctctcgga gcttgtctcg aaaatgcgtg aaatgaagat ggacaggaca 240
gagcttggct gtctcagatc tataatactc ttcaatcccg aggttcgagg actgaaatcc 300
atccaggaag tgaccctgct ccgtgagaag atctacggcg ccctggaggg ttattgccgc 360
gtagcttggc ccgacgacgc tggaagattc gcgaaattac ttctacgcct gcccgccatc 420
cgctcgatcg gattaaagtg cctcgagtac ctgttcttct tcaaaatgat cggtgacgta 480
ccgatcgacg attttctcgt ggagatgtta gaatcgcgat cagatcctta g 531
<210> 80
<211> 176
<212> PRT
<213> 飞蝗(Locusta migratoria)
<400> 80
Ile Pro His Phe Thr Ser Leu Pro Leu Glu Asp Gln Val Leu Leu Leu
1 5 10 15
Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His Arg Ser
20 25 30
Val Asp Val Lys Asp Gly Ile Val Leu Ala Thr Gly Leu Thr Val His
35 40 45
Arg Asn Ser Ala His Gln Ala Gly Val Gly Thr Ile Phe Asp Arg Val
50 55 60
Leu Thr Glu Leu Val Ala Lys Met Arg Glu Met Lys Met Asp Lys Thr
65 70 75 80
Glu Leu Gly Cys Leu Arg Ser Val Ile Leu Phe Asn Pro Glu Val Arg
85 90 95
Gly Leu Lys Ser Ala Gln Glu Val Glu Leu Leu Arg Glu Lys Val Tyr
100 105 110
Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr His Pro Asp Glu Pro Gly
115 120 125
Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ser Leu Arg Ser Ile Gly
130 135 140
Leu Lys Cys Leu Glu His Leu Phe Phe Phe Arg Leu Ile Gly Asp Val
145 150 155 160
Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser Pro Ser Asp Ser
165 170 175
<210> 81
<211> 175
<212> PRT
<213> 美洲钝眼蜱(Amblyomma americanum)
<400> 81
Ile Pro His Phe Glu Glu Leu Pro Leu Glu Asp Arg Met Val Leu Leu
1 5 10 15
Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His Arg Ser
20 25 30
Val Asp Val Arg Asp Gly Ile Val Leu Ala Thr Gly Leu Val Val Gln
35 40 45
Arg His Ser Ala His Gly Ala Gly Val Gly Ala Ile Phe Asp Arg Val
50 55 60
Leu Thr Glu Leu Val Ala Lys Met Arg Glu Met Lys Met Asp Arg Thr
65 70 75 80
Glu Leu Gly Cys Leu Leu Ala Val Val Leu Phe Asn Pro Glu Ala Lys
85 90 95
Gly Leu Arg Thr Cys Pro Ser Gly Gly Pro Glu Gly Glu Ser Val Ser
100 105 110
Ala Leu Glu Glu His Cys Arg Gln Gln Tyr Pro Asp Gln Pro Gly Arg
115 120 125
Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu
130 135 140
Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro
145 150 155 160
Ile Asp Asn Phe Leu Leu Ser Met Leu Glu Ala Pro Ser Asp Pro
165 170 175
<210> 82
<211> 176
<212> PRT
<213> 美洲钝眼蜱(Amblyomma americanum)
<400> 82
Ile Pro His Phe Glu Glu Leu Pro Ile Glu Asp Arg Thr Ala Leu Leu
1 5 10 15
Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His Arg Ser
20 25 30
Val Ala Val Arg Asp Gly Ile Val Leu Ala Thr Gly Leu Val Val Gln
35 40 45
Arg His Ser Ala His Gly Ala Gly Val Gly Asp Ile Phe Asp Arg Val
50 55 60
Leu Ala Glu Leu Val Ala Lys Met Arg Asp Met Lys Met Asp Lys Thr
65 70 75 80
Glu Leu Gly Cys Leu Arg Ala Val Val Leu Phe Asn Pro Asp Ala Lys
85 90 95
Gly Leu Arg Asn Ala Thr Arg Val Glu Ala Leu Arg Glu Lys Val Tyr
100 105 110
Ala Ala Leu Glu Glu His Cys Arg Arg His His Pro Asp Gln Pro Gly
115 120 125
Arg Phe Gly Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly
130 135 140
Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr
145 150 155 160
Pro Ile Asp Ser Phe Leu Leu Asn Met Leu Glu Ala Pro Ala Asp Pro
165 170 175
<210> 83
<211> 183
<212> PRT
<213> 招潮蟹(Celuca pugilator)
<400> 83
Ile Pro His Phe Thr Asp Leu Pro Ile Glu Asp Gln Val Val Leu Leu
1 5 10 15
Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser
20 25 30
Met Gly Val Glu Asp Gly Ile Val Leu Ala Thr Gly Leu Val Ile His
35 40 45
Arg Ser Ser Ala His Gln Ala Gly Val Gly Ala Ile Phe Asp Arg Val
50 55 60
Leu Ser Glu Leu Val Ala Lys Met Lys Glu Met Lys Ile Asp Lys Thr
65 70 75 80
Glu Leu Gly Cys Leu Arg Ser Ile Val Leu Phe Asn Pro Asp Ala Lys
85 90 95
Gly Leu Asn Cys Val Asn Asp Val Glu Ile Leu Arg Glu Lys Val Tyr
100 105 110
Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr Tyr Pro Asp Glu Pro Gly
115 120 125
Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly
130 135 140
Leu Lys Cys Leu Glu Tyr Leu Phe Leu Phe Lys Leu Ile Gly Asp Thr
145 150 155 160
Pro Leu Asp Ser Tyr Leu Met Lys Met Leu Val Asp Asn Pro Asn Thr
165 170 175
Ser Val Thr Pro Pro Thr Ser
180
<210> 84
<211> 176
<212> PRT
<213> 黄粉虫(Tenebrio molitor)
<400> 84
Ile Pro His Phe Thr Ser Leu Pro Met Ser Asp Gln Val Leu Leu Leu
1 5 10 15
Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His Arg Ser
20 25 30
Ile Gln Ala Gln Asp Ala Ile Val Leu Ala Thr Gly Leu Thr Val Asn
35 40 45
Lys Thr Ser Ala His Ala Val Gly Val Gly Asn Ile Tyr Asp Arg Val
50 55 60
Leu Ser Glu Leu Val Asn Lys Met Lys Glu Met Lys Met Asp Lys Thr
65 70 75 80
Glu Leu Gly Cys Leu Arg Ala Ile Ile Leu Tyr Asn Pro Thr Cys Arg
85 90 95
Gly Ile Lys Ser Val Gln Glu Val Glu Met Leu Arg Glu Lys Ile Tyr
100 105 110
Gly Val Leu Glu Glu Tyr Thr Arg Thr Thr His Pro Asn Glu Pro Gly
115 120 125
Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly
130 135 140
Leu Lys Cys Ser Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Val
145 150 155 160
Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser Pro Ala Asp Ala
165 170 175
<210> 85
<211> 176
<212> PRT
<213> 蜜蜂(Apis mellifera)
<400> 85
Ile Pro His Phe Thr Ser Leu Pro Leu Glu Asp Gln Val Leu Leu Leu
1 5 10 15
Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser
20 25 30
Ile Asp Val Lys Asp Gly Ile Val Leu Ala Thr Gly Ile Thr Val His
35 40 45
Arg Asn Ser Ala Gln Gln Ala Gly Val Gly Thr Ile Phe Asp Arg Val
50 55 60
Leu Ser Glu Leu Val Ser Lys Met Arg Glu Met Lys Met Asp Arg Thr
65 70 75 80
Glu Leu Gly Cys Leu Arg Ser Ile Ile Leu Phe Asn Pro Glu Val Arg
85 90 95
Gly Leu Lys Ser Ile Gln Glu Val Thr Leu Leu Arg Glu Lys Ile Tyr
100 105 110
Gly Ala Leu Glu Gly Tyr Cys Arg Val Ala Trp Pro Asp Asp Ala Gly
115 120 125
Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Ile Arg Ser Ile Gly
130 135 140
Leu Lys Cys Leu Glu Tyr Leu Phe Phe Phe Lys Met Ile Gly Asp Val
145 150 155 160
Pro Ile Asp Asp Phe Leu Val Glu Met Leu Glu Ser Arg Ser Asp Pro
165 170 175
<210> 86
<211> 259
<212> PRT
<213> 云杉卷叶蛾(Choristoneura fumiferana)
<400> 86
Leu Thr Ala Asn Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln
1 5 10 15
Asp Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln
20 25 30
Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe
35 40 45
Arg Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu
50 55 60
Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln
65 70 75 80
Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val
85 90 95
Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn
100 105 110
Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val
115 120 125
Ile Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu
130 135 140
Asp Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp
145 150 155 160
Arg Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr
165 170 175
Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser
180 185 190
Ala Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu
195 200 205
Leu Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys
210 215 220
Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val
225 230 235 240
Ala Asp Met Ser His Thr Gln Pro Pro Pro Ile Leu Glu Ser Pro Thr
245 250 255
Asn Leu Gly
<210> 87
<211> 674
<212> PRT
<213> 人工序列
<220>
<223> 人工序列说明:合成多肽
<400> 87
Met Asp Tyr Lys Asp Asp Asp Asp Lys Glu Met Pro Val Asp Arg Ile
1 5 10 15
Leu Glu Ala Glu Leu Ala Val Glu Gln Lys Ser Asp Gln Gly Val Glu
20 25 30
Gly Pro Gly Gly Thr Gly Gly Ser Gly Ser Ser Pro Asn Asp Pro Val
35 40 45
Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr Leu Val Glu
50 55 60
Trp Ala Lys Arg Ile Pro His Phe Ser Ser Leu Pro Leu Asp Asp Gln
65 70 75 80
Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe
85 90 95
Ser His Arg Ser Ile Asp Val Arg Asp Gly Ile Leu Leu Ala Thr Gly
100 105 110
Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala Ile
115 120 125
Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met Arg
130 135 140
Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Ile Leu Phe Asn
145 150 155 160
Pro Glu Val Arg Gly Leu Lys Ser Ala Gln Glu Val Glu Leu Leu Arg
165 170 175
Glu Lys Val Tyr Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr His Pro
180 185 190
Asp Glu Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ser Leu
195 200 205
Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Arg Leu
210 215 220
Ile Gly Asp Val Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser
225 230 235 240
Pro Ser Asp Ser Gln Ile Ser Tyr Ala Ser Arg Gly Gly Gly Ser Ser
245 250 255
Gly Gly Gly Glu Asp Ala Lys Asn Ile Lys Lys Gly Pro Ala Pro Phe
260 265 270
Tyr Pro Leu Glu Asp Gly Thr Ala Gly Glu Gln Leu His Lys Ala Met
275 280 285
Lys Arg Tyr Ala Leu Val Pro Gly Thr Ile Ala Phe Thr Asp Ala His
290 295 300
Ile Glu Val Asn Ile Thr Tyr Ala Glu Tyr Phe Glu Met Ser Val Arg
305 310 315 320
Leu Ala Glu Ala Met Lys Arg Tyr Gly Leu Asn Thr Asn His Arg Ile
325 330 335
Val Val Cys Ser Glu Asn Ser Leu Gln Phe Phe Met Pro Val Leu Gly
340 345 350
Ala Leu Phe Ile Gly Val Ala Val Ala Pro Ala Asn Asp Ile Tyr Asn
355 360 365
Glu Arg Glu Leu Leu Asn Ser Met Asn Ile Ser Gln Pro Thr Val Val
370 375 380
Phe Val Ser Lys Lys Gly Leu Gln Lys Ile Leu Asn Val Gln Lys Lys
385 390 395 400
Leu Pro Ile Ile Gln Lys Ile Ile Ile Met Asp Ser Lys Thr Asp Tyr
405 410 415
Gln Gly Phe Gln Ser Met Tyr Thr Phe Val Thr Ser His Leu Pro Pro
420 425 430
Gly Phe Asn Glu Tyr Asp Phe Val Pro Glu Ser Phe Asp Arg Asp Lys
435 440 445
Thr Ile Ala Leu Ile Met Asn Ser Ser Gly Ser Thr Gly Leu Pro Lys
450 455 460
Gly Val Ala Leu Pro His Arg Thr Ala Cys Val Arg Phe Ser His Ala
465 470 475 480
Arg Asp Pro Ile Phe Gly Asn Gln Ile Ile Pro Asp Thr Ala Ile Leu
485 490 495
Ser Val Val Pro Phe His His Gly Phe Gly Met Phe Thr Thr Leu Gly
500 505 510
Tyr Leu Ile Cys Gly Phe Arg Val Val Leu Met Tyr Arg Phe Glu Glu
515 520 525
Glu Leu Phe Leu Arg Ser Leu Gln Asp Tyr Lys Ile Gln Ser Ala Leu
530 535 540
Leu Val Pro Thr Leu Phe Ser Phe Phe Ala Lys Ser Thr Leu Ile Asp
545 550 555 560
Lys Tyr Asp Leu Ser Asn Leu His Glu Ile Ala Ser Gly Gly Ala Pro
565 570 575
Leu Ser Lys Glu Val Gly Glu Ala Val Ala Lys Arg Phe His Leu Pro
580 585 590
Gly Ile Arg Gln Gly Tyr Gly Leu Thr Glu Thr Thr Ser Ala Ile Leu
595 600 605
Ile Thr Pro Glu Gly Asp Asp Lys Pro Gly Ala Val Gly Lys Val Val
610 615 620
Pro Phe Phe Glu Ala Lys Val Val Asp Leu Asp Thr Gly Lys Thr Leu
625 630 635 640
Gly Val Asn Gln Arg Gly Glu Leu Cys Val Arg Gly Pro Met Ile Met
645 650 655
Ser Gly Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp Lys
660 665 670
Asp Gly
<210> 88
<211> 463
<212> PRT
<213> 人工序列
<220>
<223> 人工序列说明:合成多肽
<400> 88
Gln Val Ala Pro Ala Glu Leu Glu Ser Ile Leu Leu Gln His Pro Asn
1 5 10 15
Ile Phe Asp Ala Gly Val Ala Gly Leu Pro Asp Asp Asp Ala Gly Glu
20 25 30
Leu Pro Ala Ala Val Val Val Leu Glu His Gly Lys Thr Met Thr Glu
35 40 45
Lys Glu Ile Val Asp Tyr Val Ala Ser Gln Val Thr Thr Ala Lys Lys
50 55 60
Leu Arg Gly Gly Val Val Phe Val Asp Glu Val Pro Lys Gly Leu Thr
65 70 75 80
Gly Lys Leu Asp Ala Arg Lys Ile Arg Glu Ile Leu Ile Lys Ala Lys
85 90 95
Lys Gly Gly Lys Ser Lys Leu Gly Gly Gly Ser Ser Gly Gly Gly Gln
100 105 110
Ile Ser Tyr Ala Ser Arg Gly Arg Pro Glu Cys Val Val Pro Glu Thr
115 120 125
Gln Cys Ala Met Lys Arg Lys Glu Lys Lys Ala Gln Lys Glu Lys Asp
130 135 140
Lys Leu Pro Val Ser Thr Thr Thr Val Asp Asp His Met Pro Pro Ile
145 150 155 160
Met Gln Cys Glu Pro Pro Pro Pro Glu Ala Ala Arg Ile His Glu Val
165 170 175
Val Pro Arg Phe Leu Ser Asp Lys Leu Leu Val Thr Asn Arg Gln Lys
180 185 190
Asn Ile Pro Gln Leu Thr Ala Asn Gln Gln Phe Leu Ile Ala Arg Leu
195 200 205
Ile Trp Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys
210 215 220
Arg Ile Thr Gln Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser
225 230 235 240
Asp Thr Pro Phe Arg Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln
245 250 255
Leu Ile Val Glu Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser
260 265 270
Gln Pro Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met
275 280 285
Met Leu Arg Val Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser Ile Leu
290 295 300
Phe Ala Asn Asn Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly
305 310 315 320
Met Ala Glu Val Ile Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr
325 330 335
Ser Met Ala Leu Asp Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val
340 345 350
Ile Phe Ser Asp Arg Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu
355 360 365
Ile Gln Arg Tyr Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln
370 375 380
Leu Ser Gly Ser Ala Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser
385 390 395 400
Ile Leu Ser Glu Leu Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys
405 410 415
Ile Ser Leu Lys Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu
420 425 430
Ile Trp Asp Val Ala Asp Met Ser His Thr Gln Pro Pro Pro Ile Leu
435 440 445
Glu Ser Pro Thr Asn Leu Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
450 455 460
<210> 89
<211> 675
<212> PRT
<213> 人工序列
<220>
<223> 人工序列说明:合成多肽
<400> 89
Trp Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg
1 5 10 15
Ile Thr Gln Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp
20 25 30
Thr Pro Phe Arg Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu
35 40 45
Ile Val Glu Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln
50 55 60
Pro Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met
65 70 75 80
Leu Arg Val Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser Ile Leu Phe
85 90 95
Ala Asn Asn Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met
100 105 110
Ala Glu Val Ile Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr Ser
115 120 125
Met Ala Leu Asp Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val Ile
130 135 140
Phe Ser Asp Arg Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu Ile
145 150 155 160
Gln Arg Tyr Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu
165 170 175
Ser Gly Ser Ala Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile
180 185 190
Leu Ser Glu Leu Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys Ile
195 200 205
Ser Leu Lys Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile
210 215 220
Trp Asp Val Ala Asp Met Ser His Thr Gln Pro Pro Pro Ile Leu Glu
225 230 235 240
Ser Pro Thr Asn Leu Gln Ile Ser Tyr Ala Ser Arg Gly Gly Gly Ser
245 250 255
Ser Gly Gly Gly Glu Asp Ala Lys Asn Ile Lys Lys Gly Pro Ala Pro
260 265 270
Phe Tyr Pro Leu Glu Asp Gly Thr Ala Gly Glu Gln Leu His Lys Ala
275 280 285
Met Lys Arg Tyr Ala Leu Val Pro Gly Thr Ile Ala Phe Thr Asp Ala
290 295 300
His Ile Glu Val Asn Ile Thr Tyr Ala Glu Tyr Phe Glu Met Ser Val
305 310 315 320
Arg Leu Ala Glu Ala Met Lys Arg Tyr Gly Leu Asn Thr Asn His Arg
325 330 335
Ile Val Val Cys Ser Glu Asn Ser Leu Gln Phe Phe Met Pro Val Leu
340 345 350
Gly Ala Leu Phe Ile Gly Val Ala Val Ala Pro Ala Asn Asp Ile Tyr
355 360 365
Asn Glu Arg Glu Leu Leu Asn Ser Met Asn Ile Ser Gln Pro Thr Val
370 375 380
Val Phe Val Ser Lys Lys Gly Leu Gln Lys Ile Leu Asn Val Gln Lys
385 390 395 400
Lys Leu Pro Ile Ile Gln Lys Ile Ile Ile Met Asp Ser Lys Thr Asp
405 410 415
Tyr Gln Gly Phe Gln Ser Met Tyr Thr Phe Val Thr Ser His Leu Pro
420 425 430
Pro Gly Phe Asn Glu Tyr Asp Phe Val Pro Glu Ser Phe Asp Arg Asp
435 440 445
Lys Thr Ile Ala Leu Ile Met Asn Ser Ser Gly Ser Thr Gly Leu Pro
450 455 460
Lys Gly Val Ala Leu Pro His Arg Thr Ala Cys Val Arg Phe Ser His
465 470 475 480
Ala Arg Asp Pro Ile Phe Gly Asn Gln Ile Ile Pro Asp Thr Ala Ile
485 490 495
Leu Ser Val Val Pro Phe His His Gly Phe Gly Met Phe Thr Thr Leu
500 505 510
Gly Tyr Leu Ile Cys Gly Phe Arg Val Val Leu Met Tyr Arg Phe Glu
515 520 525
Glu Glu Leu Phe Leu Arg Ser Leu Gln Asp Tyr Lys Ile Gln Ser Ala
530 535 540
Leu Leu Val Pro Thr Leu Phe Ser Phe Phe Ala Lys Ser Thr Leu Ile
545 550 555 560
Asp Lys Tyr Asp Leu Ser Asn Leu His Glu Ile Ala Ser Gly Gly Ala
565 570 575
Pro Leu Ser Lys Glu Val Gly Glu Ala Val Ala Lys Arg Phe His Leu
580 585 590
Pro Gly Ile Arg Gln Gly Tyr Gly Leu Thr Glu Thr Thr Ser Ala Ile
595 600 605
Leu Ile Thr Pro Glu Gly Asp Asp Lys Pro Gly Ala Val Gly Lys Val
610 615 620
Val Pro Phe Phe Glu Ala Lys Val Val Asp Leu Asp Thr Gly Lys Thr
625 630 635 640
Leu Gly Val Asn Gln Arg Gly Glu Leu Cys Val Arg Gly Pro Met Ile
645 650 655
Met Ser Gly Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp
660 665 670
Lys Asp Gly
675
<210> 90
<211> 412
<212> PRT
<213> 人工序列
<220>
<223> 人工序列说明:合成多肽
<400> 90
Met Ser Gly Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp
1 5 10 15
Lys Asp Gly Trp Leu His Ser Gly Asp Ile Ala Tyr Trp Asp Glu Asp
20 25 30
Glu His Phe Phe Ile Val Asp Arg Leu Lys Ser Leu Ile Lys Tyr Lys
35 40 45
Gly Tyr Gln Val Ala Pro Ala Glu Leu Glu Ser Ile Leu Leu Gln His
50 55 60
Pro Asn Ile Phe Asp Ala Gly Val Ala Gly Leu Pro Asp Asp Asp Ala
65 70 75 80
Gly Glu Leu Pro Ala Ala Val Val Val Leu Glu His Gly Lys Thr Met
85 90 95
Thr Glu Lys Glu Ile Val Asp Tyr Val Ala Ser Gln Val Thr Thr Ala
100 105 110
Lys Lys Leu Arg Gly Gly Val Val Phe Val Asp Glu Val Pro Lys Gly
115 120 125
Leu Thr Gly Lys Leu Asp Ala Arg Lys Ile Arg Glu Ile Leu Ile Lys
130 135 140
Ala Lys Lys Gly Gly Lys Ser Lys Leu Gly Gly Gly Ser Ser Gly Gly
145 150 155 160
Gly Gln Ile Ser Tyr Ala Ser Arg Gly Glu Met Pro Val Asp Arg Ile
165 170 175
Leu Glu Ala Glu Leu Ala Val Glu Gln Lys Ser Asp Gln Gly Val Glu
180 185 190
Gly Pro Gly Gly Thr Gly Gly Ser Gly Ser Ser Pro Asn Asp Pro Val
195 200 205
Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr Leu Val Glu
210 215 220
Trp Ala Lys Arg Ile Pro His Phe Ser Ser Leu Pro Leu Asp Asp Gln
225 230 235 240
Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe
245 250 255
Ser His Arg Ser Ile Asp Val Arg Asp Gly Ile Leu Leu Ala Thr Gly
260 265 270
Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala Ile
275 280 285
Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met Arg
290 295 300
Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Ile Leu Phe Asn
305 310 315 320
Pro Glu Val Arg Gly Leu Lys Ser Ala Gln Glu Val Glu Leu Leu Arg
325 330 335
Glu Lys Val Tyr Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr His Pro
340 345 350
Asp Glu Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ser Leu
355 360 365
Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Arg Leu
370 375 380
Ile Gly Asp Val Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser
385 390 395 400
Pro Ser Asp Ser Asp Tyr Lys Asp Asp Asp Asp Lys
405 410
<210> 91
<211> 1189
<212> PRT
<213> 人工序列
<220>
<223> 人工序列说明:合成多肽
<400> 91
Met Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Gln Trp Tyr Glu Leu
1 5 10 15
Gln Gln Leu Asp Ser Lys Phe Leu Glu Gln Val His Gln Leu Tyr Asp
20 25 30
Asp Ser Phe Pro Met Glu Ile Arg Gln Tyr Leu Ala Gln Trp Leu Glu
35 40 45
Lys Gln Asp Trp Glu His Ala Ala Asn Asp Val Ser Phe Ala Thr Ile
50 55 60
Arg Phe His Asp Leu Leu Ser Gln Leu Asp Asp Gln Tyr Ser Arg Phe
65 70 75 80
Ser Leu Glu Asn Asn Phe Leu Leu Gln His Asn Ile Arg Lys Ser Lys
85 90 95
Arg Asn Leu Gln Asp Asn Phe Gln Glu Asp Pro Ile Gln Met Ser Met
100 105 110
Ile Ile Tyr Ser Cys Leu Lys Glu Glu Arg Lys Ile Leu Glu Asn Ala
115 120 125
Gln Arg Phe Asn Gln Ala Gln Ser Gly Asn Ile Gln Ser Thr Val Met
130 135 140
Leu Asp Lys Gln Lys Glu Leu Asp Ser Lys Val Arg Asn Val Lys Asp
145 150 155 160
Lys Val Met Cys Ile Glu His Glu Ile Lys Ser Leu Glu Asp Leu Gln
165 170 175
Asp Glu Tyr Asp Phe Lys Cys Lys Thr Leu Gln Asn Arg Glu His Glu
180 185 190
Thr Asn Gly Val Ala Lys Ser Asp Gln Lys Gln Glu Gln Leu Leu Leu
195 200 205
Lys Lys Met Tyr Leu Met Leu Asp Asn Lys Arg Lys Glu Val Val His
210 215 220
Lys Ile Ile Glu Leu Leu Asn Val Thr Glu Leu Thr Gln Asn Ala Leu
225 230 235 240
Ile Asn Asp Glu Leu Val Glu Trp Lys Arg Arg Gln Gln Ser Ala Cys
245 250 255
Ile Gly Gly Pro Pro Asn Ala Cys Leu Asp Gln Leu Gln Asn Trp Phe
260 265 270
Thr Ile Val Ala Glu Ser Leu Gln Gln Val Arg Gln Gln Leu Lys Lys
275 280 285
Leu Glu Glu Leu Glu Gln Lys Tyr Thr Tyr Glu His Asp Pro Ile Thr
290 295 300
Lys Asn Lys Gln Val Leu Trp Asp Arg Thr Phe Ser Leu Phe Gln Gln
305 310 315 320
Leu Ile Gln Ser Ser Phe Val Val Glu Arg Gln Pro Cys Met Pro Thr
325 330 335
His Pro Gln Arg Pro Leu Val Leu Lys Thr Gly Val Gln Phe Thr Val
340 345 350
Lys Leu Arg Leu Leu Val Lys Leu Gln Glu Leu Asn Tyr Asn Leu Lys
355 360 365
Val Lys Val Leu Phe Asp Lys Asp Val Asn Glu Arg Asn Thr Val Lys
370 375 380
Gly Phe Arg Lys Phe Asn Ile Leu Gly Thr His Thr Lys Val Met Asn
385 390 395 400
Met Glu Glu Ser Thr Asn Gly Ser Leu Ala Ala Glu Phe Arg His Leu
405 410 415
Gln Leu Lys Glu Gln Lys Asn Ala Gly Thr Arg Thr Asn Glu Gly Pro
420 425 430
Leu Ile Val Thr Glu Glu Leu His Ser Leu Ser Phe Glu Thr Gln Leu
435 440 445
Cys Gln Pro Gly Leu Val Ile Asp Leu Glu Thr Thr Ser Leu Pro Val
450 455 460
Val Val Ile Ser Asn Val Ser Gln Leu Pro Ser Gly Trp Ala Ser Ile
465 470 475 480
Leu Trp Tyr Asn Met Leu Val Ala Glu Pro Arg Asn Leu Ser Phe Phe
485 490 495
Leu Thr Pro Pro Cys Ala Arg Trp Ala Gln Leu Ser Glu Val Leu Ser
500 505 510
Trp Gln Phe Ser Ser Val Thr Lys Arg Gly Leu Asn Val Asp Gln Leu
515 520 525
Asn Met Leu Gly Glu Lys Leu Leu Gly Pro Asn Ala Ser Pro Asp Gly
530 535 540
Leu Ile Pro Trp Thr Arg Phe Cys Lys Glu Asn Ile Asn Asp Lys Asn
545 550 555 560
Phe Pro Phe Trp Leu Trp Ile Glu Ser Ile Leu Glu Leu Ile Lys Lys
565 570 575
His Leu Leu Pro Leu Trp Asn Asp Gly Cys Ile Met Gly Phe Ile Ser
580 585 590
Lys Glu Arg Glu Arg Ala Leu Leu Lys Asp Gln Gln Pro Gly Thr Phe
595 600 605
Leu Leu Arg Phe Ser Glu Ser Ser Arg Glu Gly Ala Ile Thr Phe Thr
610 615 620
Trp Val Glu Arg Ser Gln Asn Gly Gly Glu Pro Asp Phe His Ala Val
625 630 635 640
Glu Pro Tyr Thr Lys Lys Glu Leu Ser Ala Val Thr Phe Pro Asp Ile
645 650 655
Ile Arg Asn Tyr Lys Val Met Ala Ala Glu Asn Ile Pro Glu Asn Pro
660 665 670
Leu Lys Tyr Leu Tyr Pro Asn Ile Asp Lys Asp His Ala Phe Gly Lys
675 680 685
Tyr Tyr Ser Arg Pro Lys Glu Ala Pro Glu Pro Met Glu Leu Asp Gly
690 695 700
Pro Lys Gly Thr Gly Tyr Ile Lys Thr Glu Leu Ile Ser Val Ser Glu
705 710 715 720
Val His Pro Ser Arg Leu Gln Thr Thr Asp Asn Leu Leu Pro Met Ser
725 730 735
Pro Glu Glu Phe Asp Glu Val Ser Arg Ile Val Gly Ser Val Glu Phe
740 745 750
Asp Ser Met Met Asn Thr Val Gln Ile Ser Tyr Ala Ser Arg Gly Gly
755 760 765
Gly Ser Ser Gly Gly Gly Glu Asp Ala Lys Asn Ile Lys Lys Gly Pro
770 775 780
Ala Pro Phe Tyr Pro Leu Glu Asp Gly Thr Ala Gly Glu Gln Leu His
785 790 795 800
Lys Ala Met Lys Arg Tyr Ala Leu Val Pro Gly Thr Ile Ala Phe Thr
805 810 815
Asp Ala His Ile Glu Val Asn Ile Thr Tyr Ala Glu Tyr Phe Glu Met
820 825 830
Ser Val Arg Leu Ala Glu Ala Met Lys Arg Tyr Gly Leu Asn Thr Asn
835 840 845
His Arg Ile Val Val Cys Ser Glu Asn Ser Leu Gln Phe Phe Met Pro
850 855 860
Val Leu Gly Ala Leu Phe Ile Gly Val Ala Val Ala Pro Ala Asn Asp
865 870 875 880
Ile Tyr Asn Glu Arg Glu Leu Leu Asn Ser Met Asn Ile Ser Gln Pro
885 890 895
Thr Val Val Phe Val Ser Lys Lys Gly Leu Gln Lys Ile Leu Asn Val
900 905 910
Gln Lys Lys Leu Pro Ile Ile Gln Lys Ile Ile Ile Met Asp Ser Lys
915 920 925
Thr Asp Tyr Gln Gly Phe Gln Ser Met Tyr Thr Phe Val Thr Ser His
930 935 940
Leu Pro Pro Gly Phe Asn Glu Tyr Asp Phe Val Pro Glu Ser Phe Asp
945 950 955 960
Arg Asp Lys Thr Ile Ala Leu Ile Met Asn Ser Ser Gly Ser Thr Gly
965 970 975
Leu Pro Lys Gly Val Ala Leu Pro His Arg Thr Ala Cys Val Arg Phe
980 985 990
Ser His Ala Arg Asp Pro Ile Phe Gly Asn Gln Ile Ile Pro Asp Thr
995 1000 1005
Ala Ile Leu Ser Val Val Pro Phe His His Gly Phe Gly Met Phe
1010 1015 1020
Thr Thr Leu Gly Tyr Leu Ile Cys Gly Phe Arg Val Val Leu Met
1025 1030 1035
Tyr Arg Phe Glu Glu Glu Leu Phe Leu Arg Ser Leu Gln Asp Tyr
1040 1045 1050
Lys Ile Gln Ser Ala Leu Leu Val Pro Thr Leu Phe Ser Phe Phe
1055 1060 1065
Ala Lys Ser Thr Leu Ile Asp Lys Tyr Asp Leu Ser Asn Leu His
1070 1075 1080
Glu Ile Ala Ser Gly Gly Ala Pro Leu Ser Lys Glu Val Gly Glu
1085 1090 1095
Ala Val Ala Lys Arg Phe His Leu Pro Gly Ile Arg Gln Gly Tyr
1100 1105 1110
Gly Leu Thr Glu Thr Thr Ser Ala Ile Leu Ile Thr Pro Glu Gly
1115 1120 1125
Asp Asp Lys Pro Gly Ala Val Gly Lys Val Val Pro Phe Phe Glu
1130 1135 1140
Ala Lys Val Val Asp Leu Asp Thr Gly Lys Thr Leu Gly Val Asn
1145 1150 1155
Gln Arg Gly Glu Leu Cys Val Arg Gly Pro Met Ile Met Ser Gly
1160 1165 1170
Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp Lys Asp
1175 1180 1185
Gly
<210> 92
<211> 926
<212> PRT
<213> 人工序列
<220>
<223> 人工序列说明:合成多肽
<400> 92
Met Ser Gly Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp
1 5 10 15
Lys Asp Gly Trp Leu His Ser Gly Asp Ile Ala Tyr Trp Asp Glu Asp
20 25 30
Glu His Phe Phe Ile Val Asp Arg Leu Lys Ser Leu Ile Lys Tyr Lys
35 40 45
Gly Tyr Gln Val Ala Pro Ala Glu Leu Glu Ser Ile Leu Leu Gln His
50 55 60
Pro Asn Ile Phe Asp Ala Gly Val Ala Gly Leu Pro Asp Asp Asp Ala
65 70 75 80
Gly Glu Leu Pro Ala Ala Val Val Val Leu Glu His Gly Lys Thr Met
85 90 95
Thr Glu Lys Glu Ile Val Asp Tyr Val Ala Ser Gln Val Thr Thr Ala
100 105 110
Lys Lys Leu Arg Gly Gly Val Val Phe Val Asp Glu Val Pro Lys Gly
115 120 125
Leu Thr Gly Lys Leu Asp Ala Arg Lys Ile Arg Glu Ile Leu Ile Lys
130 135 140
Ala Lys Lys Gly Gly Lys Ser Lys Leu Gly Gly Gly Ser Ser Gly Gly
145 150 155 160
Gly Gln Ile Ser Tyr Ala Ser Arg Gly Ser Gln Trp Tyr Glu Leu Gln
165 170 175
Gln Leu Asp Ser Lys Phe Leu Glu Gln Val His Gln Leu Tyr Asp Asp
180 185 190
Ser Phe Pro Met Glu Ile Arg Gln Tyr Leu Ala Gln Trp Leu Glu Lys
195 200 205
Gln Asp Trp Glu His Ala Ala Asn Asp Val Ser Phe Ala Thr Ile Arg
210 215 220
Phe His Asp Leu Leu Ser Gln Leu Asp Asp Gln Tyr Ser Arg Phe Ser
225 230 235 240
Leu Glu Asn Asn Phe Leu Leu Gln His Asn Ile Arg Lys Ser Lys Arg
245 250 255
Asn Leu Gln Asp Asn Phe Gln Glu Asp Pro Ile Gln Met Ser Met Ile
260 265 270
Ile Tyr Ser Cys Leu Lys Glu Glu Arg Lys Ile Leu Glu Asn Ala Gln
275 280 285
Arg Phe Asn Gln Ala Gln Ser Gly Asn Ile Gln Ser Thr Val Met Leu
290 295 300
Asp Lys Gln Lys Glu Leu Asp Ser Lys Val Arg Asn Val Lys Asp Lys
305 310 315 320
Val Met Cys Ile Glu His Glu Ile Lys Ser Leu Glu Asp Leu Gln Asp
325 330 335
Glu Tyr Asp Phe Lys Cys Lys Thr Leu Gln Asn Arg Glu His Glu Thr
340 345 350
Asn Gly Val Ala Lys Ser Asp Gln Lys Gln Glu Gln Leu Leu Leu Lys
355 360 365
Lys Met Tyr Leu Met Leu Asp Asn Lys Arg Lys Glu Val Val His Lys
370 375 380
Ile Ile Glu Leu Leu Asn Val Thr Glu Leu Thr Gln Asn Ala Leu Ile
385 390 395 400
Asn Asp Glu Leu Val Glu Trp Lys Arg Arg Gln Gln Ser Ala Cys Ile
405 410 415
Gly Gly Pro Pro Asn Ala Cys Leu Asp Gln Leu Gln Asn Trp Phe Thr
420 425 430
Ile Val Ala Glu Ser Leu Gln Gln Val Arg Gln Gln Leu Lys Lys Leu
435 440 445
Glu Glu Leu Glu Gln Lys Tyr Thr Tyr Glu His Asp Pro Ile Thr Lys
450 455 460
Asn Lys Gln Val Leu Trp Asp Arg Thr Phe Ser Leu Phe Gln Gln Leu
465 470 475 480
Ile Gln Ser Ser Phe Val Val Glu Arg Gln Pro Cys Met Pro Thr His
485 490 495
Pro Gln Arg Pro Leu Val Leu Lys Thr Gly Val Gln Phe Thr Val Lys
500 505 510
Leu Arg Leu Leu Val Lys Leu Gln Glu Leu Asn Tyr Asn Leu Lys Val
515 520 525
Lys Val Leu Phe Asp Lys Asp Val Asn Glu Arg Asn Thr Val Lys Gly
530 535 540
Phe Arg Lys Phe Asn Ile Leu Gly Thr His Thr Lys Val Met Asn Met
545 550 555 560
Glu Glu Ser Thr Asn Gly Ser Leu Ala Ala Glu Phe Arg His Leu Gln
565 570 575
Leu Lys Glu Gln Lys Asn Ala Gly Thr Arg Thr Asn Glu Gly Pro Leu
580 585 590
Ile Val Thr Glu Glu Leu His Ser Leu Ser Phe Glu Thr Gln Leu Cys
595 600 605
Gln Pro Gly Leu Val Ile Asp Leu Glu Thr Thr Ser Leu Pro Val Val
610 615 620
Val Ile Ser Asn Val Ser Gln Leu Pro Ser Gly Trp Ala Ser Ile Leu
625 630 635 640
Trp Tyr Asn Met Leu Val Ala Glu Pro Arg Asn Leu Ser Phe Phe Leu
645 650 655
Thr Pro Pro Cys Ala Arg Trp Ala Gln Leu Ser Glu Val Leu Ser Trp
660 665 670
Gln Phe Ser Ser Val Thr Lys Arg Gly Leu Asn Val Asp Gln Leu Asn
675 680 685
Met Leu Gly Glu Lys Leu Leu Gly Pro Asn Ala Ser Pro Asp Gly Leu
690 695 700
Ile Pro Trp Thr Arg Phe Cys Lys Glu Asn Ile Asn Asp Lys Asn Phe
705 710 715 720
Pro Phe Trp Leu Trp Ile Glu Ser Ile Leu Glu Leu Ile Lys Lys His
725 730 735
Leu Leu Pro Leu Trp Asn Asp Gly Cys Ile Met Gly Phe Ile Ser Lys
740 745 750
Glu Arg Glu Arg Ala Leu Leu Lys Asp Gln Gln Pro Gly Thr Phe Leu
755 760 765
Leu Arg Phe Ser Glu Ser Ser Arg Glu Gly Ala Ile Thr Phe Thr Trp
770 775 780
Val Glu Arg Ser Gln Asn Gly Gly Glu Pro Asp Phe His Ala Val Glu
785 790 795 800
Pro Tyr Thr Lys Lys Glu Leu Ser Ala Val Thr Phe Pro Asp Ile Ile
805 810 815
Arg Asn Tyr Lys Val Met Ala Ala Glu Asn Ile Pro Glu Asn Pro Leu
820 825 830
Lys Tyr Leu Tyr Pro Asn Ile Asp Lys Asp His Ala Phe Gly Lys Tyr
835 840 845
Tyr Ser Arg Pro Lys Glu Ala Pro Glu Pro Met Glu Leu Asp Gly Pro
850 855 860
Lys Gly Thr Gly Tyr Ile Lys Thr Glu Leu Ile Ser Val Ser Glu Val
865 870 875 880
His Pro Ser Arg Leu Gln Thr Thr Asp Asn Leu Leu Pro Met Ser Pro
885 890 895
Glu Glu Phe Asp Glu Val Ser Arg Ile Val Gly Ser Val Glu Phe Asp
900 905 910
Ser Met Met Asn Thr Val Asp Tyr Lys Asp Asp Asp Asp Lys
915 920 925
<210> 93
<211> 335
<212> PRT
<213> 人工序列
<220>
<223> 人工序列说明:合成多肽
<400> 93
Arg Pro Glu Cys Val Val Pro Glu Thr Gln Cys Ala Met Lys Arg Lys
1 5 10 15
Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Leu Pro Val Ser Thr Thr
20 25 30
Thr Val Asp Asp His Met Pro Pro Ile Met Gln Cys Glu Pro Pro Pro
35 40 45
Pro Glu Ala Ala Arg Ile His Glu Val Val Pro Arg Phe Leu Ser Asp
50 55 60
Lys Leu Leu Val Thr Asn Arg Gln Lys Asn Ile Pro Gln Leu Thr Ala
65 70 75 80
Asn Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln Asp Gly Tyr
85 90 95
Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln Thr Trp Gln
100 105 110
Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg Gln Ile
115 120 125
Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys
130 135 140
Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln Ile Thr Leu
145 150 155 160
Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val Ala Arg Arg
165 170 175
Tyr Asp Ala Ala Ser Asp Ser Ile Leu Phe Ala Asn Asn Gln Ala Tyr
180 185 190
Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Glu Val Ile Glu Asp
195 200 205
Leu Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp Asn Ile
210 215 220
His Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp Arg Pro Gly
225 230 235 240
Leu Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr Tyr Leu Asn
245 250 255
Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser Ala Arg Ser
260 265 270
Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu Arg Thr
275 280 285
Leu Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys Leu Lys Asn
290 295 300
Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val Ala Asp Met
305 310 315 320
Ser His Thr Gln Pro Pro Pro Ile Leu Glu Ser Pro Thr Asn Leu
325 330 335
<210> 94
<211> 235
<212> PRT
<213> 人工序列
<220>
<223> 人工序列说明:合成多肽
<400> 94
Glu Met Pro Val Asp Arg Ile Leu Glu Ala Glu Leu Ala Val Glu Gln
1 5 10 15
Lys Ser Asp Gln Gly Val Glu Gly Pro Gly Gly Thr Gly Gly Ser Gly
20 25 30
Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp Lys
35 40 45
Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe Ser
50 55 60
Ser Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp Asn
65 70 75 80
Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Asp Val Arg Asp
85 90 95
Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala His
100 105 110
Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu Val
115 120 125
Ser Lys Met Arg Asp Met Arg Met Asp Lys Thr Glu Leu Gly Cys Leu
130 135 140
Arg Ala Ile Ile Leu Phe Asn Pro Glu Val Arg Gly Leu Lys Ser Ala
145 150 155 160
Gln Glu Val Glu Leu Leu Arg Glu Lys Val Tyr Ala Ala Leu Glu Glu
165 170 175
Tyr Thr Arg Thr Thr His Pro Asp Glu Pro Gly Arg Phe Ala Lys Leu
180 185 190
Leu Leu Arg Leu Pro Ser Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu
195 200 205
His Leu Phe Phe Phe Arg Leu Ile Gly Asp Val Pro Ile Asp Thr Phe
210 215 220
Leu Met Glu Met Leu Glu Ser Pro Ser Asp Ser
225 230 235

Claims (41)

1.两种多肽,其包含第一非天然存在的多肽和第二非天然存在的多肽,所述第一非天然存在的多肽包含核受体蛋白的片段或结构域,且所述第二非天然存在的多肽包含核受体蛋白的不同片段或结构域,其中第一多肽能够结合激活配体,其中第二多肽能够在激活配体存在下与第一多肽缔合,其中第一和第二多肽中的每一个还包含异源氨基酸或多肽序列,使得激活配体诱导的第一和第二多肽的缔合导致激活的功能、生物或细胞信号转导状态。
2.如权利要求1所述的第一和第二多肽,其中一个或两个核受体蛋白质片段或结构域包含节肢动物核受体氨基酸序列。
3.如权利要求1或2所述的第一和第二多肽,其中一个或两个核受体蛋白质片段或结构域包含H组核受体氨基酸序列。
4.如权利要求1-3中任一项所述的第一和第二多肽,其中所述第一多肽的核受体氨基酸序列包含蜕皮激素受体(EcR)配体结构结构域、多肽片段、或其取代突变体。
5.如权利要求1-4中任一项所述的第一和第二多肽,其中所述第二多肽核受体蛋白质片段或结构域包含哺乳动物核受体氨基酸序列。
6.如权利要求5所述的第一和第二多肽,其中所述哺乳动物核受体蛋白质片段或结构域包含RXR核受体多肽片段,或其取代突变体。
7.如权利要求1-6中任一项所述的第一和第二多肽,其中所述第二多肽核受体蛋白质片段或结构域包含无脊椎动物和哺乳动物核受体氨基酸序列的嵌合体,或其取代突变体。
8.如权利要求7所述的第一和第二多肽,其中所述第二多肽核受体蛋白质片段或结构域包含无脊椎动物USP(RXR同源物)和哺乳动物RXR核受体氨基酸序列的嵌合体,或其取代突变体。
9.一种配体诱导型多肽耦合(LIPC)系统,其包含:
a)第一非天然产生的多肽,其包含节肢动物核受体蛋白质的片段或结构域,和
b)第二非天然产生的多肽,其包含节肢动物和/或哺乳动物核受体蛋白质的片段或结构域,
其中所述第一和第二多肽包含其他能够在与激活配体接触之后产生激活的功能性、生物或细胞信号转导条件的异源序列。
10.如权利要求9所述的LIPC系统,其中一个或两个核受体蛋白质片段或结构域包含H组核受体氨基酸序列。
11.如权利要求9或10所述的LIPC系统,其中所述第一多肽包含蜕皮激素受体(EcR)配体结合结构域,多肽片段或其取代突变体。
12.如权利要求9-11中任一项所述的LIPC系统,其中所述第二多肽包含哺乳动物核受体氨基酸序列。
13.如权利要求12所述的LIPC系统,其中所述第二多肽包含RXR核受体多肽片段,或其取代突变体。
14.如权利要求9-13中任一项所述的LIPC系统,其中所述第二多肽包含无脊椎动物和哺乳动物核受体氨基酸序列的嵌合体,或其取代突变体。
15.如权利要求14所述的LIPC系统,其中所述第二多肽包含无脊椎动物USP(RXR同系物)和哺乳动物RXR核受体氨基酸序列的嵌合体,或其取代突变体。
16.如权利要求1-8中任一项所述的第一和第二多肽,或如权利要求9-15中任一项所述的LIPC系统,其中所述核受体蛋白质片段中的至少一种衍生自选自下组的蜕皮激素受体多肽:云杉卷叶蛾(Choristoneura fumiferana)EcR(“CfEcR”)LBD、黄粉虫(Tenebriomolitor)EcR(“TmEcR”)LBD、烟草天蛾(Manduca sexta)EcR(“MsEcR”)LBD、绿棉铃虫(Heliothies virescens)EcR(“HvEcR”)LBD、摇蚊(Chironomus tentans)(“CfEcR”)LBD、家蚕蛾(Bombyx mori)EcR(“BmEcR”)LBD、黑腹果蝇(Drosophila melanogaster)EcR(“DmEcR”)LBD、埃及伊蚊(Aedes aegypti)EcR(“AaEcR”)LBD、绿蝇(Lucilia capitata)EcR(“LcEcR”)LBD、铜绿蝇(Lucilia cuprina)EcR(“LucEcR”)LBD、地中海果蝇(Ceratitiscapitata)EcR(“CcEcR”)LBD、飞蝗(Locusta migratoria)EcR(“LmEcR”)LBD、紫堇瘤蚜(Myzus persicae)EcR(“MpEcR”)LBD、招潮蟹(Celuca pugilator)EcR(“CpEcR”)LBD、银液粉虱(Bamecia argentifoli)EcR(BaEcR)LBD、黑尾叶蝉(Nephotetix cincticeps)EcR(NcEcR)LBD、和美洲钝眼蜱(Amblyomma americanum)EcR(“AmaEcR”)LBD。
17.如权利要求1-8中任一项所述的第一和第二多肽,或如权利要求9-15中任一项所述的LIPC系统,其中所述核受体蛋白质片段中的至少一种衍生自由包含SEQ ID NO:1(CfEcR-DEF)、SEQ ID NO:2(CfEcR-CDEF)、SEQ ID NO:3(DmEcR-DEF)、SEQ ID NO:4(TmEcR-DEF)、SEQ ID NO:5(AmaEcR-DEF)的核酸序列的多核苷酸所编码的蜕皮激素受体多肽,或编码与其基本相同的功能变体的多核苷酸。
18.如权利要求16-17所述的第一和第二多肽或LIPC系统,其中所述蜕皮激素受体多肽中的至少一种包含SEQ ID NO:6(CfEcR-DEF),SEQ ID NO:7(DmEcR-DEF),SEQ ID NO:8(CfEcR-CDEF),SEQ ID NO:9(TmEcR-DEF),SEQ ID NO:10(AmaEcR-DEF)的多肽序列,或与其基本相同的多肽序列。
19.如权利要求16-18中任一项所述的第一和第二多肽或LIPC系统,其中所述蜕皮激素受体多肽序列包含相对于相应的野生型蜕皮激素受体多肽的约或至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或取代突变。
20.如权利要求16-19中任一项所述的第一和第二多肽或LIPC系统,其中所述蜕皮激素受体多肽由包含导致氨基酸残基取代的密码子突变的多核苷酸编码,其中该氨基酸残基位于等同于或类似于以下的位置:a)SEQ ID NO:17的氨基酸残基20、21、48、51、52、55、58、59、61、62、92、93、95、96、107、109、110、120、123、125、175、218、234或238,b)SEQ ID NO:17的氨基酸残基95和110,c)SEQ ID NO:17的氨基酸残基218和219,d)SEQ ID NO:17的氨基酸残基107和175,e)SEQ ID NO:17的氨基酸残基127和175,f)SEQ ID NO:17的氨基酸残基107和127,g)SEQ ID NO:17的氨基酸残基107、127和175,h)SEQ ID NO:17的氨基酸残基52、107和175,i)SEQ ID NO:17的氨基酸残基96、107和175,j)SEQ ID NO:17的氨基酸残基107、110和175,k)SEQ ID NO:18的氨基酸残基107、121、213或217,或1)SEQ ID NO:19的氨基酸残基91或105。
21.如权利要求16-20中任一项所述的第一和第二多肽或LIPC系统,其中所述取代突变选自下组:a)SEQ ID NO:17的E20A,Q21A,F48A,I51A,T52A,T52V,T52I,T52L,T55A,T58A,V59A,L61A,I62A,M92A,M93A,R95A,V96A,V96T,V96D,V96M,V107I,F109A,A110P,A110S,A110M,A110L,Y120A,A123F,M125A,R175E,M218A,C219A,L223A,L230A,L234A,W238A,R95A/A110P,M218A/C219A/R175E,V107I/R175E,V107I/Y127E,V107I/Y127E/R175E,T52V/V107I/R175E,V96A/V107I/R175E,T52A/V107I/R175E,V96T/V107I/R175E或V107I/A110P/R75E取代突变,b)SEQ ID NO:18的A107P,G121R,G121L,N213A,C217A或C217S取代突变,以及c)SEQID NO:19的G91A或A105P取代突变。
22.如权利要求16-21中任一项所述的第一和第二多肽或LIPC系统,其中所述类视黄醇X受体多肽包含选自下组的多肽:脊椎动物类维生素X受体多肽,无脊椎动物类维生素X受体多肽(USP)和包含来自脊椎动物和无脊椎动物RXR的多肽片段的嵌合类视黄醇X多肽。
23.如权利要求22所述的第一和第二多肽或LIPC系统,其中所述嵌合类视黄醇X受体多肽包含至少两种不同的类视黄醇X受体多肽片段,其选自脊椎动物类视黄醇X受体多肽片段,无脊椎动物类视黄醇X受体多肽片段,和非双翅目/非鳞翅目无脊椎动物物种类视黄醇X受体多肽片段。
24.如权利要求23所述的第一和第二多肽或LIPC系统,其中所述嵌合类视黄醇X受体多肽包含类视黄酸X受体多肽,其包含至少一种类视黄醇X受体多肽片段,其选自EF结构域螺旋1,EF结构域螺旋2,EF结构域螺旋3,EF结构域螺旋4,EF结构域螺旋5,EF结构域螺旋6,EF结构域螺旋7,EF结构域螺旋8,EF结构域螺旋9,EF结构域螺旋10,EF结构域螺旋11,EF结构域螺旋12,F结构域和EF结构域β-折叠,其中类视黄醇X受体多肽片段来自不同物种的类视黄醇X受体多肽或与第二类视黄醇X受体多肽片段不同的同种型类视黄醇X受体多肽。
25.如权利要求22所述的第一和第二多肽或LIPC系统,其中所述嵌合类视黄醇X受体多肽由包含下述核酸序列的多核苷酸编码:a)SEQ ID NO:11,b)SEQ ID NO:12的核苷酸1-348和SEQ ID NO:13的核苷酸268-630,c)SEQ ID NO:12的核苷酸1-408和SEQ ID NO:13的核苷酸337-630,d)SEQ ID NO:12的核苷酸1465和SEQ ID NO:13的核苷酸403-630,e)SEQ IDNO:12的核苷酸1-555和SEQ ID NO:13的核苷酸490-630,f)SEQ ID NO:12的核苷酸1-624和SEQ ID NO:13的核苷酸547-630,g)SEQ ID NO:12的核苷酸1-645和SEQ ID NO:13的核苷酸601-630,和h)SEQ ID NO:12的核苷酸1-717,SEQ ID NO:13的核苷酸613-630,或编码与其基本相同的功能变体的多核苷酸。
26.如权利要求22所述的第一和第二多肽或LIPC系统,其中所述嵌合类视黄醇X多肽包含下述多肽序列:a)SEQ ID NO:14,b)SEQ ID NO:15的氨基酸1-116和SEQ ID NO:16的氨基酸90-210,c)SEQ ID NO:15的氨基酸1-136和SEQ ID NO:16的氨基酸113-210,d)SEQ IDNO:15的氨基酸1-155和SEQ ID NO:16的氨基酸135-210,e)SEQ ID NO:15的氨基酸1-185和SEQ ID NO:16的氨基酸164-210,f)SEQ ID NO:15的氨基酸1-208和SEQ ID NO:16的氨基酸183-210,g)SEQ ID NO:15的氨基酸1-215和SEQ ID NO:16的氨基酸201-210,以及h)SEQ IDNO:15的氨基酸1-239,SEQ ID NO:16的氨基酸205-210,或与其基本相同的多肽序列。
27.如权利要求1-26中任一项所述的第一和第二多肽或LIPC系统,其中一个或两个其他异源序列包含跨膜结构域。
28.如权利要求27所述的第一和第二多肽或LIPC系统,其中至少一个所述跨膜结构域是单通I型跨膜结构域。
29.一种分离的多核苷酸,其包含编码权利要求1-28中任一项所述的第一或第二多肽的多核苷酸序列。
30.包含编码权利要求1-28中任一项所述的第一多肽的核苷酸序列的第一多核苷酸和包含编码权利要求1-28中任一项所述的第二多肽的核苷酸序列的第二多核苷酸。
31.一种包含权利要求29或30所述的多核苷酸之一的载体。
32.一种包含权利要求29或30所述的多核苷酸的两者的载体。
33.如权利要求31或32所述的载体,其中所述载体是表达载体。
34.一种宿主细胞,其包含权利要求31-33中任一项所述的载体。
35.如权利要求34所述的宿主细胞,所述宿主细胞是哺乳动物T细胞。
36.如权利要求34所述的宿主细胞,所述宿主细胞是人T细胞。
37.一种诱导细胞信号转导的方法,包括将权利要求1-28中任一项所述的第一和第二多肽或LIPC系统,权利要求29或30所述的多核苷酸,或权利要求31-33中任一项所述的载体引入宿主细胞中,并用激活配体接触所述宿主细胞。
38.如权利要求1-28中任一项所述的第一和第二多肽或LIPC系统,如权利要求29或30所述的多核苷酸,如权利要求31-33中任一项所述的载体,或如权利要求34-36中任一项所述的方法,其中所述激活配体是
c)下式的化合物:
其中:
E是含叔碳的(C4-C6)烷基或含叔碳的氰基(C3-C5)烷基;R1是H、Me、Et、i-Pr、F、甲酰基、CF3、CHF2、CHCl2、CH2F、CH2Cl、CH2OH、CH2OMe、CH2CN、CN、C≡CH、1-丙炔基、2-丙炔基、乙烯基、OH、OMe、OEt、环丙基、CF2CF3、CH=CHCN、烯丙基、叠氮基、SCN、或SCHF2
R2是H、Me、Et、n-Pr、i-Pr、甲酰基、CF3、CHF2、CHCl2、CH2F、CH2Cl、CH2OH、CH2OMe、CH2CN、CN、C≡CH、1-丙炔基、2-丙炔基、乙烯基、Ac、F、Cl、OH、OMe、OEt、O-n-Pr、OAc、NMe2、NEt2、SMe、Set、SOCF3、OCF2CF2H、COEt、环丙基、CF2CF3、CH=CHCN、烯丙基、叠氮基、OCF3、OCHF2、O-i-Pr、SCN、SCHF2、SOMe、NH-CN,或与R3以及R2和R3接合的苯基碳连接以形成亚乙基二氧基,与苯基碳相邻的氧形成二氢呋喃环,或与苯基碳相邻的氧形成二氢吡喃环;
R3是H、Et,或与R2以及R2和R3接合的苯基碳连接以形成亚乙基二氧基,与苯基碳相邻的氧形成二氢呋喃环,或与苯基碳相邻的氧形成二氢吡喃环;
R4、R5、和R6独立地是H、Me、Et、F、Cl、Br、甲酰基、CF3、CHF2、CHCl2、CH2F、CH2Cl、CH2OH、CN、C≡CH、1-丙炔基、2-丙炔基、乙烯基、OMe、OEt、SMe、或Set;或
b)蜕皮激素、20-羟基蜕皮激素、松甾酮A、莫瑞甾酮A、氧甾醇、22(R)羟基胆甾醇、24(S)羟基胆甾醇、25-环氧胆固醇、T0901317、5-α-6-α-环氧胆固醇-3-硫酸盐、7-酮胆固醇-3-硫酸盐、金合欢醇、胆酸、1,1-二膦酸酯、或保幼激素III。
39.如权利要求1-28中任一项所述的第一和第二多肽或LIPC系统,如权利要求29或30所述的多核苷酸,如权利要求31-33中任一项所述的载体,或如权利要求34-36中任一项所述的方法,其中所述激活配体是下式的化合物:
或者
其中,R1、R2、R3和R4是:a)H,(C1-C6)烷基;(C1-C6)卤代烷基;(C1-C6)氰基烷基;(C1-C6)羟基烷基;(C1-C4)烷氧基(C1-C6)烷基;任选地被卤素、氰基、羟基或(C1-C4)烷基取代的(C2-C6)烯基;任选地被卤素、氰基、羟基或(C1-C4)烷基取代的(C2-C6)炔基;任选地被卤素、氰基、羟基或(C1-C4)烷基取代的(C3-C5)环烷基;或b)未取代或取代的苄基,其中取代基独立地是1至5H、卤素、硝基、氰基、羟基、(C1-C6)烷基、或(C1-C6)烷氧基;并且
R5是H;OH;F;Cl;或(C1-C6)烷氧基;
前提是:当R1、R2、R3、和R4是异丙基时,R5不是羟基;
当R5是H、羟基、甲氧基或氟时,R1、R2、R3、和R4中的至少一个不是H;
当R1、R2、R3、和R4中仅一个是甲基,并且R5是H或羟基时,其余的R1、R2、R3、和R4不是H;
当R4以及R1、R2、和R3之一都是甲基时,R5不是H或羟基;
当R1、R2、R3、和R4都是甲基时,R5不是羟基;
当R1、R2、和R3都是H并且R5是羟基时,R4不是乙基、正丙基、正丁基、烯丙基、或苄基。
40.如权利要求1-28中任一项所述的第一和第二多肽或LIPC系统,如权利要求29或30所述的多核苷酸,如权利要求31-33中任一项所述的载体,或如权利要求34-36中任一项所述的方法,其中所述激活配体是下式的化合物:
其中X和X′独立地是O或S;
Y是:
(a)取代或未取代的苯基,其中取代基独立地是1-5H、(C1-C4)烷基、(C1-C4)烷氧基、(C2-C4)烯基、卤素(F,Cl,Br,I)、(C1-C4)卤代烷基、羟基、氨基、氰基、或硝基;或
(b)取代或未取代的2-吡啶基、3-吡啶基、或4-吡啶基,其中取代基独立地是1-4H、(C1-C4)烷基、(C1-C4)烷氧基、(C2-C4)烯基、卤素(F,Cl,Br,I)、(C1-C4)卤代烷基、羟基、氨基、氰基、或硝基;
R1和R2独立地是:H;氰基;氰基取代或未取代的(C1-C7)支链或直链烷基;氰基取代或未取代的(C2-C7)支链或直链烯基;氰基取代或未取代的(C3-C7)支链或直链烯基烷基;或R1和R2的价态一起形成(C1-C7)氰基取代或未取代的亚烷基(RaRbC=)其中Ra和Rb中非取代碳的总和为0-6;
R3是H、甲基、乙基、正丙基、异丙基、或氰基;
R4、R7和R8独立地是:H、(C1-C4)烷基、(C1-C4)烷氧基、(C2-C4)烯基、卤素(F,Cl,Br,I)、(C1-C4)卤代烷基、羟基、氨基、氰基、或硝基;并且
R5和R6独立地是:H、(C1-C4)烷基、(C2-C4)烯基、(C3-C4)烯基烷基、卤素(F,Cl,Br,I)、C1-C4卤代烷基、(C1-C4)烷氧基、羟基、氨基、氰基、硝基,或一起以(-OCHR9CHR10O-)型连接和与它们所接合的苯基碳形成环;其中R9和R10独立地是:H、卤素、(C1-C3)烷基、(C2-C3)烯基、(C1-C3)烷氧基(C1-C3)烷基、苯甲酰基氧基(C1-C3)烷基、羟基(C1-C3)烷基、卤代(C1-C3)烷基、甲酰基、甲酰基(C1-C3)烷基、氰基、氰基(C1-C3)烷基、羧基、羧基(C1-C3)烷基、(C1-C3)烷氧基羰基(C1-C3)烷基、(C1-C3)烷基羰基(C1-C3)烷基、(C1-C3)烷酰氧基(C1-C3)烷基、氨基(C1-C3)烷基、(C1-C3)烷基氨基(C1-C3)烷基(-(CH2)nRcRe)、肟(-CH=NOH)、肟(C1-C3)烷基、(C1-C3)链肟(-C=NORd)、链肟(C1-C3)烷基、(C1-C3)甲酰胺基(-C(O)NReRf)、(C1-C3)甲酰胺基(C1-C3)烷基、(C1-C3)脲氨基(-C=NNHC(O)NReRf)、脲氨基(C1-C3)烷基、氨基羰氧基(-OC(O)NHRg)、氨基羰氧基(C1-C3)烷基、五氟苯氧基羰基、五氟苯氧基羰基(C1-C3)烷基、对-甲苯磺酰氧基(C1-C3)烷基、芳基磺酰氧基(C1-C3)烷基、(C1-C3)硫代(C1-C3)烷基、(C1-C3)烷基亚砜基(C1-C3)烷基、(C1-C3)烷基磺酰基(C1-C3)烷基、或(C1-C5)三取代-甲硅烷氧基(C1-C3)烷基(-(CH2)nSiORdReRg);其中n=1-3,Rc和Rd表示所示长度的直链或支链烃链,Re,Rf表示H或所示长度的直链或支链烃链,Rg表示任选地被卤素或(C1-C3)烷基取代的(C1-C3)烷基或芳基,并且Rc、Rd、Re、Rf、和Rg互相独立;
前提是:
i)当R9和R10都是H时,或
ii)当R9或R10是卤素、(C1-C3)烷基、(C1-C3)烷氧基(C1-C3)烷基、或苯甲酰氧基(C1-C3)烷基时,或
iii)当R5和R6不一起形成(-OCHR9CHR10O-)型连接时,
基团R1或R2的任一或两者的碳原子的数量,排除氰基取代的那些,超过4,并且基团R1、R2、和R3的总和的碳原子的数量,排除氰基取代的那些,是10、11或12。
41.一种测量配体诱导的细胞信号转导的方法,包括:
a)将权利要求1-28中任一项所述的第一和第二多肽或LIPC系统,权利要求29或30所述的多核苷酸,或权利要求31-33中任一项所述的载体引入宿主细胞中;
b)用激活配体接触所述宿主细胞;并且,
c)对配体诱导的生物活性或多肽寡聚化的绝对或相对量进行定量。
CN201680020980.9A 2015-03-30 2016-03-29 配体诱导型多肽耦合器系统 Pending CN107430128A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562140380P 2015-03-30 2015-03-30
US62/140,380 2015-03-30
PCT/US2016/024690 WO2016160791A1 (en) 2015-03-30 2016-03-29 Ligand inducible polypeptide coupler system

Publications (1)

Publication Number Publication Date
CN107430128A true CN107430128A (zh) 2017-12-01

Family

ID=57005332

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680020980.9A Pending CN107430128A (zh) 2015-03-30 2016-03-29 配体诱导型多肽耦合器系统

Country Status (14)

Country Link
US (1) US20180348231A1 (zh)
EP (1) EP3278110A4 (zh)
JP (1) JP2018511602A (zh)
KR (1) KR20180012247A (zh)
CN (1) CN107430128A (zh)
AU (1) AU2016243464A1 (zh)
CA (1) CA2979724A1 (zh)
HK (1) HK1248811A1 (zh)
IL (1) IL254340A0 (zh)
MX (1) MX2017012455A (zh)
PH (1) PH12017501763A1 (zh)
RU (1) RU2017131505A (zh)
SG (1) SG11201707652WA (zh)
WO (1) WO2016160791A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JOP20180027A1 (ar) * 2017-03-28 2019-01-30 Cell Design Labs Inc بوليبيبتيدات مخلطة و طرق لتغيير موضع الغشاء فيها
JP6990369B2 (ja) * 2017-05-19 2022-02-03 国立大学法人 熊本大学 遺伝性腎疾患アルポート症候群治療薬に係る評価系

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000007038A2 (en) * 1998-07-30 2000-02-10 Universite De Montreal Protein fragment complementation assays
WO2002066614A2 (en) * 2001-02-20 2002-08-29 Rheogene Holdings, Inc. Chimeric retinoid x receptors and their use in a novel ecdysone receptor-based inducible gene expression system
CN1422334A (zh) * 2000-03-22 2003-06-04 罗姆和哈斯公司 新的基于蜕皮激素受体的可诱导的基因表达系统
WO2003090515A2 (en) * 2002-03-25 2003-11-06 Applera Corporation Systems and methods for detection of nuclear receptor function using reporter enzyme mutant complementation
US20040102367A1 (en) * 2001-02-23 2004-05-27 Gage Fred H Gene expression system based on chimeric receptors

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10234372A (ja) * 1997-02-27 1998-09-08 Boehringer Mannheim Corp キメラ受容体を有する細胞とその作成方法、並びに その利用

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000007038A2 (en) * 1998-07-30 2000-02-10 Universite De Montreal Protein fragment complementation assays
CN1422334A (zh) * 2000-03-22 2003-06-04 罗姆和哈斯公司 新的基于蜕皮激素受体的可诱导的基因表达系统
WO2002066614A2 (en) * 2001-02-20 2002-08-29 Rheogene Holdings, Inc. Chimeric retinoid x receptors and their use in a novel ecdysone receptor-based inducible gene expression system
US20040102367A1 (en) * 2001-02-23 2004-05-27 Gage Fred H Gene expression system based on chimeric receptors
WO2003090515A2 (en) * 2002-03-25 2003-11-06 Applera Corporation Systems and methods for detection of nuclear receptor function using reporter enzyme mutant complementation

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KATHRYN E. LUKER ET AL: "Kinetics of regulated protein–protein interactions revealed with firefly luciferase complementation imaging in cells and living animals", 《PNAS》 *
R.DE WILDE, ET AL.: "Cloning and functional analysis of the ecdysteroid receptor complex in the opossum shrimp Neomysis integer(Leach, 1814)", 《AQUATIC TOXICOLOGY》 *

Also Published As

Publication number Publication date
EP3278110A1 (en) 2018-02-07
WO2016160791A1 (en) 2016-10-06
KR20180012247A (ko) 2018-02-05
US20180348231A1 (en) 2018-12-06
RU2017131505A3 (zh) 2019-09-19
CA2979724A1 (en) 2016-10-06
SG11201707652WA (en) 2017-10-30
HK1248811A1 (zh) 2018-10-19
PH12017501763A1 (en) 2018-04-23
EP3278110A4 (en) 2018-08-29
IL254340A0 (en) 2017-11-30
RU2017131505A (ru) 2019-05-06
AU2016243464A1 (en) 2017-09-28
MX2017012455A (es) 2018-06-27
JP2018511602A (ja) 2018-04-26

Similar Documents

Publication Publication Date Title
Zhu et al. The competence factor βFtz-F1 potentiates ecdysone receptor activity via recruiting a p160/SRC coactivator
CA2438119C (en) Chimeric retinoid x receptors and their use in a novel ecdysone receptor-based inducible gene expression system
Arbeitman et al. Molecular chaperones activate the Drosophila ecdysone receptor, an RXR heterodimer
CA2441444C (en) Novel ecdysone receptor/invertebrate retinoid x receptor-based inducible gene expression system
CN103370319B (zh) 新型腔肠素底物及其使用方法
CN102776218B (zh) 突变受体以及它们在基于核受体的诱导型基因表达系统中的应用
CA2445796C (en) Novel substitution mutant receptors and their use in a nuclear receptor-based inducible gene expression system
Chaves et al. Functional evolution of the photolyase/cryptochrome protein family: importance of the C terminus of mammalian CRY1 for circadian core oscillator performance
Xu et al. Activation of transcription through the ligand‐binding pocket of the orphan nuclear receptor ultraspiracle
Slimko et al. Codon optimization of Caenorhabditis elegans GluCl ion channel genes for mammalian cells dramatically improves expression levels
US20160326219A1 (en) Optically activated receptors
JP2022516572A (ja) 合成分子フィードバック回路及びその使用方法
JP2022517331A (ja) ケージドデグロンベースの分子フィードバック回路及びその使用方法
Schräder et al. RXR-dependent and RXR-independent transactivation by retinoic acid receptors
CN107430128A (zh) 配体诱导型多肽耦合器系统
Bitra et al. Interaction of proteins involved in ecdysone and juvenile hormone signal transduction
JPH06510206A (ja) 新規ヘテロダイマー核レセプタータンパク質、それをコードする遺伝子、およびその使用
JP2009011316A (ja) 蛍光タンパク質およびその使用方法
Yamashita et al. A large‐scale expression strategy for multimeric extracellular protein complexes using Drosophila S2 cells and its application to the recombinant expression of heterodimeric ligand‐binding domains of taste receptor
CN109790539A (zh) Hspa5基因的启动子
CN101180543B (zh) 使用烟碱乙酰胆碱受体亚单位的新检测方法
Straub et al. The SPIRE1 actin nucleator coordinates actin/myosin functions in the regulation of mitochondrial motility
CN107840875B (zh) 菜蛾盘绒茧蜂神经肽Cv-sNPF和其受体以及在提高小菜蛾体内海藻糖含量中的应用
US20210247384A1 (en) Biosensors for detecting arrestin signaling
Ntini et al. Second order regulator Collier directly controls intercalary-specific segment polarity gene expression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20171201