CN101384621A

CN101384621A - 产生受体和配体同种型的方法

Info

Publication number: CN101384621A
Application number: CNA2006800499899A
Authority: CN
Inventors: P·金; H·M·谢泼德; C·戈尔曼; J·张
Original assignee: Receptor Biologix Inc
Current assignee: Receptor Biologix Inc
Priority date: 2005-11-10
Filing date: 2006-10-31
Publication date: 2009-03-11
Also published as: NO20082580L; WO2007064437A2; WO2007064437A3; AU2006320858A1; BRPI0618449A2; US20070166788A1; JP2009515521A; KR20080082628A; EP1945662A2; CA2628959A1; RU2008123518A

Abstract

提供了产生细胞表面受体(CSR)和配体同种型的方法。具体地，提供了具有用于分泌、加工和细胞内运输的前体序列的同种型融合物。编码所述融合物的核酸分子在宿主细胞中表达并且在细胞培养基中产生所编码的和部分或完全加工的编码的CSR或配体同种型。所得的多肽任选包括用于其检测和/或纯化的表位标记。

Description

产生受体和配体同种型的方法

相关申请

本申请要求2005年11月10日申请的标题为“METHODS FORPRODUCTION OF RECEPTOR AND LIGAND ISOFORMS，”、发明人为Pei Jin、H.Michael Shepard、Cornelia Gorman和Juan Zhang的美国临时申请序号60/736,134的优先权。

本申请还涉及美国申请序号(律师案卷号17118-041001/2822)(其在本申请的相同日提交)标题为“METHODS FOR PRODUCTION OFRECEPTOR AND LIGAND ISOFORMS，”，发明人为Pei Jin、H.MichaelShepard、Cornelia Gorman和Juan Zhang，该申请也要求美国临时申请序号60/736,134的优先权。

本申请还涉及2004年5月14日申请的美国临时申请序号10/846,113，和对应的国际PCT申请号WO 05/016966，其在2月24日公布，标题为“INTRONFUSION PROTEINS，AND METHODS OF IDENTIFYINGAND USING SAME.”。该申请也涉及2005年5月13日提交的美国申请序号11/129,740，和对应的国际PCT申请号US2005/17051，其在2005年5月13日提交，标题为“CELL SURFACE RECEPTOR ISOFORMS ANDMETHODS OF IDENTIFYING AND USING THE SAME.”。本申请还涉及2005年5月4日提交的美国临时申请序号60/678,076，标题为“ISOFORMS OF RECEPTOR FOR ADVANCED GLYCATIONENDPRODUCTS(RAGE)AND METHODS OF IDENTIFYING AND USINGSAME”。本申请还涉及美国申请号(律师案卷号17118-045001/2824)和国际申请号(律师案卷号17118-045W01/2824PC)，标题为“HEPATOCYTEGROWTHFACTOR INTRON FUSION PROTEINS，”(与本申请同日提交)，它们各自要求2005年11月10日提交的美国临时申请号60/735,609的优先权。

将上述申请、临时申请和国际申请的每个的主题以及本公开中提到的任何申请的引入本文作为参考。

发明领域

提供了产生细胞表面受体(CSR)和配体同种型的方法。具体地，提供了含有用于分泌、加工和细胞内运输的前体序列的同种型融合物。编码该融合物的核酸分子在宿主细胞中表达并且在细胞培养基中产生所编码的和部分或完全加工的CSR或配体同种型。所得的多肽任选包括用于其检测和/或纯化的表位标记。

背景

细胞信号途径涉及分子的网络，其包括多肽和小分子，它们相互作用以传递细胞外、细胞间和细胞内信号。此类途径像接力一样相互作用，将信号从途径的一个成员传递到另一成员。该途径的一个成员的活性的调节可以通过信号转导途径传递，导致其他途径成员活性的调节和此类信号转导结果的调节，如影响细胞或生物的表型和对信号的应答。疾病和病症可以涉及信号转导途径的错误调节或者调节的改变。药物开发的目标是靶定此类错误调节的途径以在信号转导途径中恢复更正常的调节。

受体酪氨酸激酶(RTK)是涉及许多信号转导途径的多肽。RTK在多种细胞过程中起作用，所述细胞过程包括细胞分裂、增殖、分化、迁移和代谢。RTK可以被配体活化。此类活化又激活信号转导途径中的事件，如通过引发自分泌或旁分泌细胞信号途径，例如，第二信使的激活，其导致特异生物学效应。RTK的配体特异结合到同族受体。

RTK与多种疾病相关，所述疾病包括癌症，如乳腺癌和结直肠癌、胃癌、神经胶质瘤和中胚层来源的肿瘤。已经在几种癌症中注意到RTK的失调。例如，乳腺癌可以与p185-HER2的扩大的表达有关。RTK还与眼的疾病，包括糖尿病性视网膜病变和黄斑变性有关。RTK还与涉及血管发生(包括生理的和肿瘤血管形成)的调节途径有关。RTK还与细胞增殖、迁移和存活的调节有关。

人表皮生长因子受体2基因(HER-2；也称作ErbB2)编码受体酪氨酸激酶，其与癌基因相关。HER-2具有4.5Kb的主要mRNA转录物，其编码约185kDa的多肽(p185HER2)。P185HER2含有细胞外结构域、跨膜结构域和具有酪氨酸激酶活性的细胞内结构域。几种多肽形式从HER-2基因产生并且包括通过蛋白酶解加工产生的多肽和从选择性剪接的RNA产生的形式。Herstatins和其片段是HER-2结合蛋白，由HER-2基因编码。Herstatins(也称作p68HER-2)由编码p185-HER2受体的基因的选择性剪接的变体编码。例如，一种herstatin在胎儿肾和肝中发生，并且相对于膜定位的受体包括C末端的79个氨基酸的内含子编码的插入片段(见美国专利号6,414,130和美国公布的申请号20040022785)。已经鉴定了几种herstatin变体(见，例如，美国专利号6,414,130；美国公布的申请号20040022785，美国申请序号09/234,208；美国申请序号09/506,079；公布的国际申请号WO0044403和WO0161356)。Herstatins缺少表皮生长因子(EGF)同源性结构域并且含有p185-HER2的细胞外结构域的部分，通常为前340个氨基酸。Herstatins含有人表皮生长因子受体的亚结构域I和II、HER-2细胞外结构域和内含子编码的C-末端结构域。所得的herstatin多肽通常含有419个氨基酸(来自亚结构域I和II的340个氨基酸，加上来自内含子8的79个氨基酸)。Herstatin蛋白质缺少细胞外结构域IV，以及跨膜结构域和激酶结构域。

相比，正作用的EGFR配体，如表皮生长因子和转化生长因子α具有此类结构域。此外，herstatin的结合不激活该受体。Herstatin可以抑制受体酪氨酸激酶的EGF家族成员以及胰岛素样生长因子-1(IGF-1)受体和其他受体。Herstatin阻止形成磷酸根转移和受体活化所需的生产性受体二聚体(同二聚体和异二聚体)。备选地或额外地，herstatin可以与配体竞争结合到受体末端(见，美国专利号6,414,130；美国公布的申请号20040022785，美国申请序号09/234,208；美国申请序号09/506,079；公布的国际申请号WO0044403和WO0161356)。

肿瘤坏死因子家族受体(TNFR)是涉及信号转导和调节的受体家族的另一实例。TNF配体和受体家族调节多种信号转导途径，包括涉及细胞分化、活化和存活的那些途径。TNFR含有细胞外结构域，包括配体结合结构域、跨膜结构域和参与信号转导的细胞内结构域。此外，TNFR通常是三聚体蛋白质，其在细胞表面三聚化。TNFR在炎性疾病、中枢神经系统疾病、自身免疫病、呼吸道高反应性状况如哮喘、类风湿性关节炎和炎性肠病中起作用。TNFR在感染性疾病，如病毒感染中也起作用。

TNF家族受体(TNFR)在胞外结构域中显示出同源性。这些受体的一些启动细胞凋亡，一些启动细胞增殖，一些启动两种活性。通过该家族的信号转导需要通过三聚体配体对受体的群集和随后蛋白质与受体的胞质区的结合。TNFR家族含有具有同源的80个氨基酸胞质结构域的亚家族。该结构域称作死亡结构域(DD)，之所以这样命名是因为含有该结构域的蛋白质参与细胞凋亡。TNFR家族成员之间的不同通过不同基因编码的两种TNFR示例。TNFR1(55kDa)发出启动细胞凋亡和活化转录因子NFκB的信号。TNFR2(75kDa)也发挥诱导NFκB的信号活化的功能但是不启动细胞凋亡。TNFR1含有DD；TNFR2不含有DD。

在一些情况中，改变的分子的积累可以引起病理状况和疾病。在其他情况中，疾病或状况可以导致改变的分子代谢和导致特定分子以改变的形式和/或量积累。一个实例是蛋白质和脂类作为糖化产物积累。称作渐进性糖化终极产物(AGE)的产物是在醛糖存在下蛋白质和脂类的非酶促糖化和氧化的结果。最初早期产物作为可逆的希夫碱和阿马道里(Amadori)形成。分子重排导致不可逆修饰形成AGE。AGE在人中的正常老化过程中积累。AGE积累可以在特定疾病和状况中加速。

AGE的积累通过它们与细胞结合蛋白的相互作用影响细胞和组织代谢和信号转导。一种此类结合蛋白是渐进性糖化终极产物的受体(RAGE)。RAGE与AGE的相互作用涉及细胞氧化应激应答的诱导，包括RAS-MAP激酶途径和NF-κB活化。

RAGE还结合其他分子，包括小分子和蛋白质。S100A12(也称作EN-RAGE、p6和钙粒蛋白C)是钙结合蛋白，其可以作为RAGE的配体。RAGE还可以与β折叠纤维物质相互作用，所述物质包括淀粉状蛋白β-肽、Aβ、支链淀粉、血清淀粉状蛋白A和朊病毒来源的肽。两性蛋白(Amphoterin)是肝素结合的神经突长出促进蛋白，也是RAGE的配体。这些配体相互作用的每一种可以影响信号转导途径。这些配体与RAGE的结合导致受体依赖的信号传递介导的细胞活化，从而介导或参与多种疾病过程。这些疾病过程包括糖尿病并发症、淀粉状蛋白病、炎性/免疫病症和肿瘤。

因为它们涉及多种疾病和状况，所以细胞表面受体(CSR)如RTK、RAGE和TNFR和它们的配体是治疗介入的靶标。目的治疗蛋白包括细胞表面受体(CSR)的同种型，和CSR配体的同种型，它们调节涉及多种疾病和状况的CSR的活性，所述疾病和状况包括癌症、血管发生，和涉及不希望的细胞增殖和炎症反应的其他疾病(见，例如，共同待决的美国申请序号10/846,113和对应的国际PCT公布的申请号WO 05/016966；美国申请序号11/129,740和对应的国际PCT公布的申请号WO 05/113596；美国临时申请号60/678,076和对应的美国申请号11/429,090和国际申请号PCTUS2006/17786；和美国临时申请号60/735,609和对应的美国申请号(律师案卷号17118-045001/2824)和国际申请号(律师案卷号17118-045WO1/2824PC)。这些治疗蛋白靶定涉及信号转导途径的调节中的失调和/或改变的疾病和病症。

为了允许有效使用此类治疗分子，重要的是优化生产方法。尽管此类分子是已知的和可得到的，但是需要大量生产用于其广泛的分发和使用。因此，在本文的目的中，一个目的是提供产生此类治疗同种型以及编码治疗分子与改善其分泌、表达和/或纯化的多肽的融合物的核酸分子的方法。

概述

提供了用于产生CSR和配体的治疗同种型和编码治疗同种型的融合物的方法和产品，其提高了分泌、表达和/或纯化。同种型可以额外包括额外的功能部分，如多聚化结构域，包括Fc结构域。

本文提供了受体酪氨酸激酶(RTK)同种型的多肽(包括内含子融合蛋白)，所述同种型有效连接到足够实现RTK同种型的分泌和/或运输的异源前体序列。本文提供的用于有效连接的RTK同种型包括含有内源信号序列的同种型和不含有内源信号序列的同种型。

本文提供了RTK同种型多肽，其有效连接到组织纤溶酶原激活物(tPA)前体序列(tPA前/原序列)，或者tPA前/原序列的足够实现RTK同种型分泌的部分。包括有效连接到具有SEQ ID NO:2中给出的氨基酸序列的tPA前/原序列的RTK同种型多肽，或其等位基因变体。

本文提供了有效连接到tPA前/原序列的RTK同种型多肽，其包括任一种RTK，所述RTK是VEGFR、FGFR、PDGFR、MET、EPH、TIE、DDR或HER多肽的同种型，包括DDR1、EphA1、EphA2、EphB1、EphB4、EGFR、HER2、ErbB3、FGFR-1、FGFR-2、FGFR-4、MET、RON、CSF1R、KIT、PDGFR-A、PDGFR-B、TEK、Tie-1、VEGFR-1、VEGFR-2或VEGFR-3的同种型。

本文提供了具有SEQ ID NO:140、142、143、145、147、149、150、152、153、155、157、159、161-168、170、172、174、176、178、180、181、183、185、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、217、219、221、223、225、227、229-231、233、245、247-251、253、255、257、259、261、263-270、274-280、282、284、286、288、289-303的任一个中给出的氨基酸序列的RTK同种型或者其活性部分，所述RTK同种型或者其活性部分有效连接到tPA前/原序列的全部或足够实现该同种型分泌的部分。

本文提供了通过接头，包括限制酶接头有效连接到tPA前/原序列的RTK同种型，包括内含子融合蛋白。包括RTK同种型的多肽，其中限制酶接头结合在同种型和tPA前/原序列的全部或部分之间以实现同种型的分泌。还包括RTK同种型的多肽，其任选包括促进多肽的纯化和/或检测的标记。该标记可以连接在限制酶接头和用于实现多肽分泌的tPA前/原序列的全部或部分之间。备选地，所述标记可以连接在限制酶接头和同种型之间。标记可以是myc标记或多聚His标记。

本文提供了有效连接tPA前/原序列的全部或部分的VEGFR-1、FGFR-2、FGFR-4、TEK、RON或MET的同种型多肽，该多肽含有限制酶接头和任选地myc标记。tPA同种型融合物，包括tPA内含子融合蛋白融合物具有SEQ ID NO:32、34、36、40、42、46或48任一个中给出的氨基酸序列。

本文提供了有效连接到tPA前/原序列的全部或部分的HER2的同种型多肽，包括内含子融合蛋白，所述同种型多肽含有限制酶接头和任选地多聚His标记。tPA-HER2同种型具有SEQ ID NO:38中给出的氨基酸序列。

本文提供了渐进性糖化终极产物(RAGE)同种型受体的多肽，包括内含子融合蛋白，其有效连接到足够实现RAGE同种型的分泌和/或运输的异源前体序列。本文提供的用于有效连接的RAGE同种型包括含有内源信号序列的那些同种型和不含有内源信号序列的同种型。

本文提供了RAGE同种型多肽，其有效连接到组织纤溶酶原激活物(tPA)前体序列(tPA前/原序列)，或者tPA前/原序列的足够实现RAGE同种型分泌的部分。包括有效连接到具有SEQ ID NO:2中给出的氨基酸序列的tPA前/原序列的RAGE同种型多肽或其等位基因变体。

本文提供了具有SEQ ID NO:235、237、239、241、243的任一个中给出的氨基酸序列的RAGE同种型或其活性部分，所述同种型或其活性部分有效连接到足够实现该同种型分泌的tPA前/原序列的全部或部分。

本文提供了通过接头、包括限制酶接头有效连接到tPA前/原序列的RAGE同种型，包括内含子融合蛋白。包括RAGE同种型内含子融合蛋白的多肽，其中限制酶接头连接在同种型和实现该同种型分泌的tPA前/原序列的全部或部分之间。还包括RTK同种型的多肽，其任选包括促进多肽纯化和/或检测的标记。该标记可以连接在限制酶接头和实现该多肽分泌的tPA前/原序列的全部或部分之间。标记可以是myc标记。

本文提供了RAGE的同种型多肽，其有效连接到tPA前/原序列的全部或部分，含有限制酶接头以及任选地myc标记。tPA-RAGE同种型具有SEQ ID NO:44中给出的氨基酸序列。

本文提供了肿瘤坏死因子受体(TNFR)同种型的多肽，包括内含子融合蛋白，所述多肽有效连接到足够实现TNFR同种型的分泌和/或运输的异源前体序列。本文提供的用于有效连接的TNFR同种型包括含有内源信号序列的那些和不含有内源信号序列的那些。

本文提供了TNFR同种型多肽，其有效连接到组织纤溶酶原激活物(tPA)前体序列(tPA前/原序列)，或tPA前/原序列的足够实现TNFR同种型分泌的部分。包括有效连接到具有SEQ ID NO:2中给出的氨基酸序列的tPA前/原序列的TNFR同种型多肽或其等位基因变体。

本文提供了有效连接到tPA前/原序列的TNFR同种型多肽，包括TNFR1或TNFR2的同种型。

本文提供了具有SEQ ID NO:272的任一个中给出的氨基酸序列的TNFR2同种型或其活性部分，其有效连接到足够实现该同种型分泌的tPA前/原序列的全部或部分。

本文提供了TNFR同种型多肽，包括内含子融合蛋白，其通过接头，包括限制酶接头有效连接到tPA前/原序列。包括TNFR同种型多肽，其中限制酶接头连接在同种型和实现该同种型分泌的tPA前/原序列的全部或部分之间。还包括TNFR同种型多肽，其任选包括方便多肽纯化和/或检测的标记。该标记可以连接在限制酶接头和实现该多肽分泌的tPA前/原序列的全部或部分之间。标记可以是myc标记。

本文提供了肝细胞生长因子(HGF)同种型的多肽，包括内含子融合蛋白，其有效连接到足够实现HGF同种型分泌和/或运输的异源前体序列。本文提供的用于有效连接的HGF同种型包括含有内源信号序列的那些和不含有内源信号序列的那些。

本文提供了HGF同种型多肽，其有效连接到组织纤溶酶原激活物(tPA)前体序列(tPA前/原序列)，或足够实现HGF同种型分泌的tPA前/原序列的部分。包括有效连接到具有SEQ ID NO:2中给出的氨基酸序列的tPA前/原序列的HGF同种型多肽或其等位基因变体。

本文提供了具有SEQ ID NO:350、352或354的任一个中给出的氨基酸序列的HGF同种型或其活性部分，其有效连接到足够实现该同种型分泌的tPA前/原序列的全部或部分。

本文提供了HGF同种型多肽，包括内含子融合蛋白，其通过接头，包括限制酶接头有效连接到tPA前/原序列。包括HGF同种型多肽，其中限制酶接头连接在同种型和实现该同种型分泌的tPA前/原序列的全部或部分之间。还包括HGF同种型多肽，其任选包括方便多肽纯化和/或检测的标记。该标记可以连接在限制酶接头和实现该多肽分泌的tPA前/原序列的全部或部分之间。标记可以是myc标记。

还包括多肽，其是本文提供的任一种多肽同种型的等位基因变体、物种变体或与所述同种型具有至少80％、85％、90％、95％、96％、97％、98％、99％，或更高序列同一性的变体并且与本文提供的多肽同种型相比保留活性。

本文提供了DNA构建体，其含有编码有效连接到异源前体序列的CSR同种型(包括RTK、TNFR或RAGE的同种型)的核酸分子。其中包括tPA前/原序列同种型多肽融合物的核酸。本文提供了具有SEQ ID NOS.31、33、35、37、39、41、43、45或47中给出的核酸序列的核酸分子，和其等位基因变体。

本文提供了含有所述核酸分子的载体。载体包括哺乳动物载体。哺乳动物载体包括pDrive载体、pCI载体或pcDNA 3.1载体。载体还可以包括腺病毒载体、腺伴随病毒载体、EBV、SV40、巨细胞病毒载体、痘苗病毒载体、疱疹病毒载体、逆转录病毒载体、慢病毒载体，或者人工染色体。载体可以是保持附加型或者整合到它们所导入的细胞的染色体中的那些载体。

还提供了含有本文所述的载体的细胞。细胞包括哺乳动物细胞。哺乳动物细胞包括小鼠、大鼠、人、猴子、鸡、或者仓鼠细胞，包括CHO、Balb/3T3、HeLa、MT2、小鼠NS0和其他骨髓瘤细胞系、杂交瘤和异杂交瘤(heterohybridoma)细胞系、淋巴细胞、成纤维细胞、Sp2/0、COS、NIH3T3、HEK293、293T、S93S、2B8、HKB或EBNA-1细胞。

本文提供了通过培养本文所述的任一种细胞以实现同种型分泌而产生同种型的方法。可以进一步从细胞培养物纯化分泌的同种型。分泌的同种型表达的表位标记可以方便蛋白质纯化。本文还提供了用外切蛋白酶，包括纤溶酶样外切蛋白酶处理分泌的同种型的方法。

本文提供了产生同种型的方法，其包括将DNA构建体导入细胞中以实现同种型从细胞的分泌。示例性DNA构建体包括本文描述的编码有效连接到异源前体序列如tPA前/原序列的同种型多肽的构建体。可以将DNA构建体导入哺乳动物细胞中，包括小鼠、大鼠、人、猴子、鸡或者仓鼠细胞，包括CHO、Balb/3T3、HeLa、MT2、小鼠NS0和其他骨髓瘤细胞系、杂交瘤和异杂交瘤细胞系、淋巴细胞、成纤维细胞、Sp2/0、COS、NIH3T3、HEK293、293T、S93S、2B8、HKB或EBNA-1细胞。通过转染、电穿孔，或者核显微注射导入DNA构建体。将DNA构建体导入细胞的示例性方法包括使用磷酸钙、阳离子脂类试剂或者聚阳离子。阳离子脂类化合物的实例包括，但不限于:Lipofectin(Life Technologies，Inc.，Burlington，Ont.)(阳离子脂类N-[1-(2，3-二油基氧基)丙基]-N，N，N-三甲基氯化铵(DOTMA)和二油酰基-磷脂酰-乙醇胺(DOPE)的1:1(w/w)制剂)；LipofectAMINE(LifeTechnologies，Burlington，Ont.，见美国专利号5,334,761)(聚阳离子脂类2，3-二油基氧基-N-[2(精胺-酰胺基)乙基]-N，N-二甲基-1-三氟乙酸丙铵(DOSPA)和二油酰基-磷脂酰-乙醇胺(DOPE)的3:1(w/w)制剂)、LipofectAMINE PLUS(Life Technologies，Burlington，Ont.见美国专利号5,334,761和5,736,392；也见美国专利号6,051,429)(LipofectAmine andPlus试剂)，LipofectAMINE 2000(Life Technologies，Burlington，Ont.；也见国际PCT申请号WO 00/27795)。本文还提供了从细胞培养物纯化同种型的方法。通过表达同种型的表位标记可以方便纯化。本文还提供了用外切蛋白酶，包括纤溶酶样外切蛋白酶处理分泌的同种型的方法。

本文提供了细胞表面受体或配体同种型、包括内含子融合蛋白同种型的多肽，其缺少内源前体序列并且还在其N-末端含有额外的氨基酸。该多肽缺少的内源前体序列可以是信号序列或者可以是信号序列和一个额外的氨基酸。示例性同种型包括CSR的同种型，包括RTK、TNFR或RAGE受体的同种型。同种型还可以包括配体同种型，如HGF同种型。本文作为缺少前体序列的多肽提供的同种型具有SEQ ID NO:140、142、143、145、147、149、150、152、153、155、157、159、161-168、170、172、174、176、178、180、181、183、185、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、217、219、221、223、225、227、229-231、233、235、237、239、241、243、245、247-251、253、255、257、259、261、263-270、272、274-280、282、284、286、288、289-303、350、352或354任一个中给出的氨基酸序列，或者其活性部分。在本文提供的同种型多肽的N-末端包括的一个或多个额外的氨基酸可以包括限制酶接头序列、tPA的原序列的部分，或者表位标记。可以在同种型多肽的N-末端包括的序列包括GAR、SR、LE，或者其组合，包括GARSR或GARLE。还提供了含有所述多肽同种型的药物组合物，所述同种型在它们的N-末端含有一个或多个额外的氨基酸。

本文提供了通过施用本文所述的任一种药物组合物治疗疾病或状况的方法。治疗的疾病或状况包括炎性疾病、癌症、血管发生介导的疾病，或超增生疾病。示例性疾病包括，但不限于，眼疾病、动脉粥样硬化、糖尿病、类风湿性关节炎、血管瘤、伤口愈合、阿尔茨海默氏病、克雅氏病、亨廷顿舞蹈症、平滑肌增生相关的疾病、多发性硬化、心血管疾病和肾病。

癌症的实例是癌、淋巴瘤、胚细胞瘤、肉瘤、白血病、淋巴样恶性肿瘤、鳞状细胞癌、肺癌，包括小细胞肺癌、非小细胞肺癌、肺的腺癌和肺的鳞状癌、腹膜的癌、肝细胞癌、胃肠癌、胰腺癌、成胶质细胞瘤、宫颈癌、卵巢癌、肝癌、膀胱癌、肝细胞瘤、乳腺癌、结肠癌、直肠癌、结直肠癌、子宫内膜/子宫癌、唾液腺癌、肾脏或肾癌、前列腺癌、女阴癌、甲状腺癌、肝癌、肛门癌、阴茎癌和头颈癌。

详述

提纲

A.定义

B.细胞表面受体和配体同种型

1.细胞表面受体同种型

2.配体同种型

3.同种型的等位基因变体和物种变体和突变

C.同种型融合蛋白的产生

1.分泌

2.纯化和/或检测

D.同种型融合物

1.示例性tPA分泌序列

2.tPA-内含子融合蛋白和其他CSR融合物

a.FGFR-2tPA-内含子融合蛋白融合物

b.FGFR-4-tPA内含子融合蛋白融合物

c.VEGFR-1-tPA内含子融合蛋白融合物

d.tPA-MET内含子融合蛋白融合物

e.tPA-RON内含子融合蛋白融合物

f.tPA-HER2内含子融合蛋白融合物

g.tPA-RAGE内含子融合蛋白融合物

h.tPA-TEK内含子融合蛋白融合物

E.产生编码同种型融合多肽的核酸的方法

1.合成的基因和多肽

2.克隆和分离同种型和同种型融合物的方法

3.产生和克隆内含子融合蛋白融合物的方法

4.表达系统

a.原核表达

b.酵母

c.昆虫细胞

d.哺乳动物细胞

e.植物

5.转染和转化方法

6.生产和纯化

7.合成的同种型

8.多聚体的形成

a.肽接头

b.多肽多聚化结构域

i.免疫球蛋白结构域

(A)FC结构域

(B)突起-到-腔(即隆突和孔)

ii.亮氨酸拉链

(A)FOS和JUN

(B)GCN4

iii.其他多聚化结构域R/PKA-AD/AKAP

F.评估同种型活性的测定法

1.激酶测定法

2.复合体形成

3.配体结合

4.受体结合

5.细胞增殖测定法

6.促运动测定法

7.细胞凋亡测定法

8.细胞疾病模型测定法

9.凋亡模型

G.CSR和配体同种型和CSR和配体同种型组合物的制备、配制和施用

H.CSR和配体同种型的体内表达和基因疗法

1.核酸的递送

a.载体-附加型和整合

b.人工染色体和其他非病毒载体递送方法

c.脂质体和其他包裹形式和含有核酸的细胞的施用

2.体外和先体外后体内递送

3.全身、局部和表面递送

I.使用CSR同种型的示例性治疗和研究

1.血管发生相关的状况

2.血管发生相关的动脉粥样硬化

3.血管发生相关的糖尿病

a.血管疾病

b.牙周病

4.额外的血管发生相关的治疗

5.癌症

6.阿尔茨海默氏病

7.平滑肌增生相关的疾病和状况

8.炎性疾病

9.心血管疾病

10.肾疾病

J.组合疗法

K.实施例

A.定义

除非另外定义，本文使用的所有技术和科学术语具有与本发明所述领域的技术人员通常理解的相同的含义。除非指出相反，将本文完整公开中提及的所有专利、专利申请、公布的申请和公布、GENBANK序列、网站和其他公布的材料都完整引入本文作为参考。在本文的术语有多种定义的情况下，以该部分中的定义为准。当参考URL或者其他此类标识符或者地址时，将理解此类标识符可以改变并且在因特网上的具体信息可以来来往往，但是等同信息是已知的并且可以容易地获取，如通过搜索因特网和/或合适的数据库。对其的参考证明了此类信息的可得性和公共传播。

如本文所用，细胞表面受体(CSR)是在细胞表面表达的蛋白质，并且通常包括跨膜结构域和将其锚定到细胞表面的其他部分。作为受体，它结合到介导或参与细胞表面受体活性如信号转导或配体内化的配体。细胞表面受体包括，但不限于，单个跨膜受体和G蛋白偶联的受体。受体酪氨酸激酶，如生长因子受体也属于此类细胞表面受体。

如本文所用，受体酪氨酸激酶(RTK)指蛋白质，通常糖蛋白，其是生长因子受体家族蛋白质的成员。生长因子受体通常涉及细胞过程，包括细胞生长、细胞分裂、分化、代谢和细胞迁移。RTK也已知涉及细胞增殖、分化和细胞命运的决定，以及肿瘤生长。RTK具有保守的结构域结构，包括细胞外结构域、跨膜结构域和细胞内酪氨酸激酶结构域。通常，胞外结构域结合到多肽生长因子或者细胞膜结合的分子或其他配体。酪氨酸激酶结构域涉及受体的正和负调节。

将受体酪氨酸激酶基于它们的胞外结构域中序列基序的结构排列分成家族。结构基序包括但不限于，免疫球蛋白、纤连蛋白、钙黏着蛋白、表皮生长因子和三环重复的区域重复。通过结构基序分类已经鉴定了16个以上的PTK家族，每个具有保守的酪氨酸激酶结构域。RTK的实例包括但不限于，产生红细胞生成素的肝细胞(EPH)受体、表皮生长因子(EGF)受体、成纤维细胞生长因子(EGF)受体、血小板衍生生长因子(PDGF)受体、血管内皮生长因子(VEGF)受体、细胞黏着RTK(CAK)、Tie/Tek受体、胰岛素样生长因子(IGF)受体，和胰岛素受体相关的(IRR)受体。编码RTK的示例性基因包括，但不限于，ErbB2、ErbB3、DDR1、DDR2、EGFR、EphA1、EphA8、FGFR-2、FGFR-4、Flt1(fms-相关的酪氨酸激酶1受体；也称作VEGFR-1)、FLK1(也称作VEGFR-2)MET、PDGFRA、PDGFRB和TEK(也称作TIE-2)。

RTK的二聚化激活受体的催化性酪氨酸激酶结构域和酪氨酸自磷酸化。激酶结构域中的自磷酸化保持酪氨酸激酶结构域处于活化态。该蛋白质的其他区域中的自磷酸化影响受体与其他细胞蛋白质的相互作用。在一些RTK中，配体与细胞外结构域的结合导致受体的二聚化。在一些RTK中，受体可以在不存在配体的情况下二聚化。通过受体过表达也可以增加二聚化。

如本文所用的，肿瘤坏死因子受体(TNFR)指受体家族成员，所述受体具有如在TNFR1和TNFR2中发现的特征性重复的细胞外富含半胱氨酸的基序。TNFR也具有可变细胞外结构域，其在TNFR家族的成员之间不同。TNFR受体家族包括但不限于，TNFR1、TNFR2、TNFRrp、低亲和性神经生长因子受体、Fas抗原、CD40、CD27、CD30、4-1BB、OX40、DR3、DR4、DR5，和疱疹病毒进入介体(HVEM)。TNFR的配体包括TNF-α、淋巴毒素、神经生长因子、Fas配体、CD40配体、CD27配体、CD30配体、4-1BB配体、OX40配体、APO3配体、TRAIL、LIGHT和BTLA。TNFR包括细胞外结构域，包括配体结合结构域、跨膜结构域和参与信号转导的细胞内结构域。TNFR通常是三聚体蛋白质，其在细胞表面三聚化。

如本文所用的，配体是结合到一种或多种受体的细胞外物质，通常多肽。配体可以是可溶的或可以是跨膜蛋白质。对于本文的目的，配体结合到受体并通过该受体诱导信号转导。

如本文所用的，信号转导指一系列顺序的事件，如配体被跨膜受体结合引起的蛋白质磷酸化，其通过一系列中间分子转移信号，直到最终的调节分子如转录因子应答该信号而被修饰。信号转导引发的应答包括特定基因的活化。基因活化导致进一步的效应，因为基因作为蛋白质表达，它们的许多是酶、转录因子或者代谢活性的其他调节子，其介导配体-受体相互作用的任意一种或多种生物活性。

如本文所用的，同种型指与全长野生型(优势)形式的同族蛋白质相比具有改变的多肽结构的蛋白质，所述改变是由于核酸序列的差异和与对应的蛋白质相比，所编码的同种型的多肽的差异。对于本文的目的，同种型包括细胞表面受体(CSR)的同种型和CSR配体的同种型。通常，本文提供的同种型缺少足够改变活性(如蛋白质的优势形式的酶促活性)或者蛋白质结构的结构域或其部分(或者包括插入或两者)。本文对具有改变的活性的同种型的参考指由于与蛋白质的全长或优势形式相比，同种型的不同的结构或序列引起的活性的改变。对于同种型，活性的改变指特定同种型和优势或野生型之间活性的不同。活性的改变包括活性的增强或减弱。在一个实施方案中，活性的改变是活性的降低；降低可以是与受体的野生型和/或优势形式相比为降低至少0.1、0.5、1、2、3、4、5或10倍。典型地，活性降低5、10、20、50、100或1000倍或更多。例如，配体可以结合到受体并且启动或参与信号转导。

如本文所用，配体同种型指与配体的野生型或优势形式的多肽相比，缺少结构域或一部分结构域或者在结构域中具有破坏(如通过插入一个或多个氨基酸)的配体。通常，此类同种型由编码同族配体的基因的选择性剪接的变体编码。本文提供的配体同种型包括可以结合受体但是不启动信号转导或启动降低水平的信号转导的那些同种型。此类配体同种型作为配体拮抗剂，以及与野生型配体相比作为激动剂具有降低的活性。配体同种型通常缺少结构域或其部分，其足够改变配体的野生型全长和/或优势形式的活性，和/或调节它的受体的活性，或者缺少结构特征，如结构域。此类配体同种型也包括插入和重排。配体同种型包括与对应的野生型配体相比显示出改变的活性的配体同种型；例如，同种型可以包括配体结构域中的改变，从而它不能诱导受体的二聚化。在这种实例中，同种型可以与全长野生型配体竞争结合它的受体，但是减小或抑制受体的信号传导。通常，与配体的野生型和/或优势形式相比，同种型中活性改变至少0.1、0.5、1、2、3、4、5或10倍。通常，活性改变至少2、5、10、20、50、100或1000倍或以上。在一个实施方案中，与配体的优势形式相比，配体同种型的活性的改变是活性的降低。

如本文所用，细胞表面受体(CSR)同种型，如受体酪氨酸激酶的同种型，指与受体的野生型和/或优势形式相比缺少足够改变或调节活性的结构域或其部分，或者缺少结构特征如结构域的受体。CSR同种型可以包括具有与受体相比改变的一种或多种生物活性的同种型；例如，同种型可以包括p185-HER2的细胞外结构域的改变，同种型从受体的正作用的调节多肽改变为该受体的负作用的调节多肽，例如，从受体结构域改变为配体。通常，与受体的野生型和/或优势形式相比，同种型中活性改变至少0.1、0.5、1、2、3、4、5或10倍。通常，活性改变至少2、5、10、20、50、100或1000倍或以上。在一个实施方案中，活性的改变是活性的降低。

如本文所用的，对调节细胞表面受体活性的参考是指CSR或者配体同种型以某种方式与受体相互作用，从而活性，如但不限于，配体结合、二聚化和/或其他信号转导相关的活性发生改变。

如本文所用的，对具有改变的活性的CSR同种型或配体同种型的参考表示由于CSR或配体同种型与同族受体或配体相比不同的结构或序列引起的活性改变。

如本文所用的，内含子融合蛋白指缺少一个或多个结构域或者一个或多个结构域的部分的同种型。此外，内含子融合蛋白由核酸分子编码，所述核酸分子含有有效连接到外显子密码子的一个或多个密码子(与蛋白质的优势或野生型相比)，包括终止密码子。内含子部分可以是终止密码子，导致内含子融合蛋白在外显子内含子接头处结束。内含子融合蛋白的活性通常与优势形式不同，通常是由于截短、缺失和/或插入内含子氨基酸残基。此类活性包括与受体相互作用的改变，或者间接改变，其由于与共刺激受体或配体、受体配体或辅因子或受体活性的其他调节子相互作用的不同而发生。从细胞或组织分离的内含子融合蛋白或者具有从细胞或组织分离的此类多肽的序列的内含子融合蛋白是“天然的”。不天然存在而是合成或通过将分子连接到内含子制备的那些被称作“合成的”或“重组的”或“组合的”。内含子融合蛋白包括缺少一个或多个结构域或一个或多个结构域的部分的CSR同种型或配体同种型，导致由于与内含子融合蛋白和其受体或配体的相互作用或其他相互作用的改变引起同族受体或配体活性的改变。通常，此类同种型与CSR或配体基因编码的野生型或优势形式相比是缩短的。然而，它们可以包括外显子部分中的插入或其他修饰，并且可以与优势形式大小相同或更大。然而，每种由包括内含子编码部分的至少一个密码子(包括终止密码子)的核酸分子编码，导致CSR或配体同种型在外显子末端的截短或者导致添加内含子编码的1、2、3、4、5、8、10、15、20、25、30、35、40、45、50、55、60、65、70、75或更多个氨基酸。

内含子融合蛋白可以由选择性剪接的RNA编码和/或可以合成产生，如通过鉴定潜在剪接位点在计算机芯片上(in silico)鉴定RNA分子，然后通过重组方法产生此类分子。通常，由于编码内含子融合蛋白的RNA中存在一个或多个终止密码子，内含子融合蛋白被缩短了，所述终止密码子不存在于编码对应的多肽的野生型或优势形式的RNA的对应序列中。如果内含子包括与外显子部分符合读框的可读框，那么外显子编码的部分可以插入多肽中。氨基酸和/或终止密码子的加入导致内含子融合蛋白，其大小和序列与野生型或优势形式的多肽不同。

用于本文目的的内含子融合蛋白包括天然的、组合的和合成的内含子融合蛋白。天然内含子融合蛋白指选择性剪接的RNA分子编码的多肽，其含有内含子编码的一个或多个氨基酸，所述氨基酸连接到基因的一个或多个外显子编码的多肽的一个或多个部分。可以分离选择性剪接的mRNA或者可以通过将剪接供体和受体位点连接在一个基因中合成制备。天然内含子融合蛋白含有一个或多个氨基酸或在外显子-内含子接头处被截短，因为内含子含有终止密码子作为第一个密码子。天然内含子融合蛋白通常在细胞和/或组织中发生。通过鉴定剪接供体和受体位点和鉴定可能的编码的剪接变体，可以例如，基于基因编码的序列合成产生内含子融合蛋白。组合内含子融合蛋白指与野生型或优势形式的多肽相比缩短的多肽。通常，缩短从多肽除去一个或多个结构域或其部分，使得活性被改变。组合内含子融合蛋白通常模拟天然内含子融合蛋白，因为在来自相同基因或来自相关基因家族中基因的天然内含子融合蛋白中缺失了一个或多个结构域或其部分。不天然存在而是通过将分子连接到内含子使得所得构建体调节CSR活性而合成或制备的那些组合内含子融合蛋白是“合成的”。

如本文所用，关于内含子融合蛋白或CSR或配体同种型天然的是指任何蛋白质、多肽或肽或其片段(由于存在合适的剪接受体/供体位点)，其在动物的基因组内编码和/或在动物中产生或生成或者可以从基因产生。天然内含子融合蛋白包括等位基因变体和物种变体。可以在翻译后修饰内含子融合蛋白。

如本文所用的，外显子指含有核苷酸序列的核酸分子，所述核苷酸序列被转录成RNA并且在剪接和其他RNA加工后以成熟形式的RNA，如mRNA(信使RNA)代表。mRNA含有有效连接的一个或多个外显子。外显子可以编码多肽或多肽的部分。外显子还可以含有非翻译的序列，例如，翻译调节序列。外显子序列通常是保守的并且在基因家族成员中显示出同源性。

如本文所用，内含子指核苷酸序列，其被转录成RNA并且通常通过剪接从RNA中去除以产生成熟形式的RNA，例如，mRNA。通常，内含子的核苷酸序列不掺入到成熟RNA中，内含子序列或其部分也通常不翻译和掺入到多肽中。剪接信号序列如剪接供体和受体通常被细胞的剪接机器用于从RNA除去内含子。值得注意的是在一个剪接变体中的内含子在另一变体中可以是外显子(即，存在于剪接的转录物中)。所以，编码内含子融合蛋白的经剪接的mRNA包括外显子和内含子。

如本文所用，剪接指RNA的成熟过程，其中mRNA的内含子被去除并且外显子有效连接以产生信使RNA(mRNA)。

如本文所用，选择性剪接指从基因产生多个mRNA的过程。选择性剪接可以包括有效连接少于基因的所有外显子和/或有效连接一个或多个备选外显子，所述备选外显子不存在于来自基因的所有转录物中。

如本文所用，外显子缺失指选择性RNA剪接事件，其产生与编码野生型或优势形式的多肽的RNA分子相比缺少至少一个外显子的核酸分子。具有缺失的外显子的RNA分子可以通过此类选择性剪接或任何其他方法，如缺失外显子的体外方法产生。

如本文所用，外显子插入指选择性RNA剪接事件，其产生核酸分子，该核酸分子含有通常不存在于编码野生型或优势形式多肽的RNA分子中的至少一个外显子。可以通过此类选择性剪接或任何其他方法，如加入或插入外显子的体外方法来产生具有插入的外显子的RNA分子。

如本文所用，外显子延伸指选择性RNA剪接事件，其产生含有至少一个外显子的核酸分子，所述外显子的长度(外显子中含有的核酸数目)大于编码野生型或优势形式多肽的RNA分子中对应的外显子的长度。可以通过此类选择性剪接或任何其他方法，如延伸外显子的体外方法产生具有延伸的外显子的RNA分子。在一些情况中，如本文所述，通过外显子延伸产生的mRNA编码内含子融合蛋白。

如本文所用，外显子截短指选择性RNA剪接事件，其产生核酸分子，该核酸分子含有一个或多个外显子的截短或缩短，使得一个或多个外显子的长度(核苷酸数目)短于编码野生型或优势形式多肽的RNA分子中对应的外显子的长度。可以通过此类选择性剪接或任何其他方法，如截短外显子的体外方法产生具有截短的外显子的RNA分子。

如本文所用的内含子保留指选择性RNA剪接事件，其产生核酸分子，该核酸分子含有有效连接到一个或多个外显子的内含子或其部分。可以通过此类选择性剪接或任何其他方法，如产生保留的外显子的RNA分子的体外方法产生保留内含子或其部分的RNA分子。在一些情况中，如本文所述，通过内含子保留产生的mRNA分子编码内含子融合蛋白。

如本文所用，基因(也称作基因序列)指转录成RNA(内含子和外显子)的核苷酸序列，包括编码至少一个多肽的核苷酸序列。基因包括调节RNA的转录和加工的核苷酸序列。基因还包括核苷酸的调节序列，如启动子和增强子，和翻译调节序列。

如本文所用，剪接位点指基因内的一个或多个核苷酸，其参与内含子的去除和/或外显子的连接。剪接位点包括剪接受体位点和剪接供体位点。

如本文所用，可读框指编码功能多肽或其部分(通常至少约50个氨基酸)的核苷酸序列。可读框可以编码全长多肽或其部分。当终止密码子在内含子内并且该内含子的全部或部分在转录的mRNA中时，可以通过有效连接一个或多个外显子或外显子和内含子产生可读框。

如本文所用，多肽指共价连接的两个或多个氨基酸。术语“多肽”和“蛋白质”可互换使用。

如本文所用，关于核酸分子或蛋白质的截短或缩短指核苷酸或氨基酸序列，其与野生型或优势形式的蛋白质或核酸分子相比小于全长。

如本文所用，参考基因指可以用于对基因内的内含子和外显子作图的基因。参考基因可以是基因组DNA或其部分，其可以与例如经表达的基因序列比较，以对基因内的内含子和外显子作图。参考基因还可以是编码野生型或优势形式多肽的基因。

如本文所用，蛋白质或基因的家族或相关家族分别指一组蛋白质或基因，它们相互具有同源性和/或结构相似性和/或功能相似性。

如本文所用，早熟终止密码子是序列的可读框中发生的终止密码子，该终止密码子在用于产生或生成全长形式的蛋白质，如野生型或优势形式的多肽的终止密码子之前。早熟终止密码子的发生可以是例如由于选择性剪接和成熟的结果。

如本文所用，表达的基因序列指从基因转录或预测将被转录的任一核苷酸序列。表达的基因序列包括，但不限于，cDNA、EST、和表达序列的计算机芯片预测，例如，基于剪接位点预测和剪接序列的计算机芯片生成。

如本文所用，表达序列标签(EST)是从表达的基因序列产生的核苷酸序列。通过使用mRNA群体产生cDNA来产生EST。例如，通过从存在于mRNA上的多聚A尾巴引发产生cDNA分子。也可以通过随机引发，使用引发在mRNA内部合成cDNA的一种或多种寡核苷酸产生cDNA分子。将所产生的cDNA分子测序并通常将序列保存在数据库中。EST数据库的实例是在ncbi.nlm.nih.gov/dbEST在线发现的dbEST。通常为每个EST序列分配唯一的标识符和信息如核苷酸序列、长度、在其中表达的组织类型，和与该标识符有关的其他有关数据。

如本文所用，关于本文提供的同种型的同族受体指由与该具体同种型相关的基因编码的受体。通常，同族受体也是特定细胞或组织中的优势形式。例如，herstatin由编码p185-HER2(ErbB2受体)的前mRNA的剪接变体编码。从而，p185-HER2是herstatin的同族受体。

如本文所用，关于本文提供的同种型的同族配体是指与具体同种型相同基因编码的配体。通常，同族配体也是特定细胞或组织的优势形式。

如本文所用，野生型，例如，野生型多肽是指基因编码的多肽。通常，野生型指基因(或从其衍生的RNA或蛋白质)，其没有改变功能或结构的突变或其他修饰；野生型包括物种中和物种之间的等位基因变异。

如本文所用，优势形式，例如，优势形式的多肽指多肽，其是从基因产生的主要多肽。“优势形式”在来源与来源之间不同。例如，不同的细胞或组织类型可以产生不同形式的多肽，例如，通过选择性剪接和/或通过选择性蛋白质加工。在每种细胞类型或组织类型中，不同的多肽可以是“优势形式”。

如本文所用，结构域指多肽链的部分(通常，三个或多个，通常5个或7个或更多氨基酸的序列)，其可以在由一个或多个结构基序(例如，通过环区域连接的α螺旋和/或β链的组合)组成的蛋白质内独立折叠的结构和/或通过功能活性，如激酶活性而被识别。蛋白质可以具有一个或一个以上的不同结构域。例如，通过其中的序列与相关家族成员的同源性，如限定细胞外结构域的基序同源性来鉴定、定义或区分结构域。在另一实例中，结构域可以通过它的功能，如酶活性，例如，激酶活性，通过与生物分子相互作用的能力，如DNA结合、配体结合和二聚化来区分。结构域可以独立地显示出生物功能或活性，使得独立地或与另一分子融合的结构域可以执行活性，如蛋白酶解活性或配体结合。结构域可以是来自多肽的氨基酸的线性序列或者氨基酸的非线性序列。许多多肽含有多个结构域。例如，受体酪氨酸激酶通常包括细胞外结构域、跨膜结构域和细胞内酪氨酸激酶结构域。

如本文所用，缺少整个或部分结构域的多肽指与同源多肽相比缺失结构域的一个或多个氨基酸或全部氨基酸的多肽。缺少整个或部分结构域的多肽中缺失的氨基酸不必在同源多肽的结构域内是相邻氨基酸。缺少整个或部分结构域的多肽与同族多肽的活性相比可以显示出该多肽活性的丧失或降低，或者多肽结构的丧失。

例如，如果同族蛋白质具有跨膜结构域，那么缺少整个或部分跨膜结构域的同种型多肽可以缺失对应于同族多肽中相同氨基酸位置的氨基酸的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多氨基酸。

如本文所用，含有结构域的多肽指相对于同族蛋白质的对应结构域含有完整结构域的多肽。关于同族多肽内特定结构域的定义确定完整结构域。例如，包含结构域的同种型指含有对应于如同族蛋白质中发现的完整结构域的结构域的同种型。如果同族蛋白质例如含有氨基酸位置400-420之间的21个氨基酸的跨膜结构域，那么受体同种型可以包含这种跨膜结构域，其含有与同族蛋白质的21个氨基酸的结构域有实质同一性的21个氨基酸的跨膜结构域。实质同一性指与同族蛋白质的结构域相比含有等位基因变异和保守替代的结构域。实质同一的结构域与同族蛋白质的结构域相比不具有氨基酸的缺失、非保守替代或插入。

此类结构域是本领域技术人员已知的，他们可以鉴定此类结构域。通常通过与特定蛋白质中结构域的结构和/或序列同源性鉴定结构域(例如，弗林蛋白酶结构域、Ig样结构域)。对于本文的示例，提供了定义，但是可以理解本领域技术人员将通过名称识别特定结构域。如果需要，可以用合适的软件鉴定结构域。此外，对本文结构域的氨基酸位置的参考仅仅用于示例的目的。因为相互作用是动态的，所以所提到的氨基酸位置用于参考和示例。所提到的位置反映了相差2、3、4、5个或更多氨基酸的基因座范围。在等位基因变体和物种变体中也存在变异。本领域技术人员能够通过视觉比较或者其他比较，包括容易得到的算法和软件鉴定对应的序列。

如本文所用，细胞外结构域是发生在受体表面上并且包括配体结合位点的细胞表面受体的部分。在一个实例中，受体L结构域(RLD)(也称作EGFR样结构域)，如HER2中的受体L结构域是包括配体结合位点的结构域的实例。每个L结构域含有单链右手β螺旋，其可以与第二个L结构域结合形成三维bilobal结构，该结构围绕足够大小的中央空间以容纳配体分子。

如本文所用，弗林蛋白酶结构域是本领域技术人员公知的结构域并且是富含半胱氨酸的区域。弗林蛋白酶是1型跨膜丝氨酸蛋白酶。弗林蛋白酶结构域可以作为弗林蛋白酶蛋白酶切割位点发挥功能。

如本文所用，Sema结构域是本领域技术人员公知的结构域并且是受体识别和结合分子。Sema结构域的特征是一组保守的半胱氨酸残基，其形成四个二硫键以稳定该结构。Sema结构域折叠是β螺旋桨拓扑结构的变型，具有辐射状围绕中心轴的七个叶片。每个叶片含有四链的反平行的β折叠。Sema结构域使用“环和钩”系统闭合第一个和最后一个叶片之间的圆。通过提供七个(C-末端)叶片的最外链，用闭合所述圆的N-末端β链顺序构造叶片。通过N-末端的延伸，提供叶片6的外边上的额外的第5个β链进一步稳定β螺旋桨。

如本文所用，丛蛋白结构域是本领域技术人员公知的并且含有富含半胱氨酸的重复。丛蛋白是作为复合体与膜结合的脑信号蛋白相互作用的受体。丛蛋白含有与c-met(扩散因子诱导的运动的受体)同源的三个结构域，但是它们缺少c-met的内在酪氨酸激酶活性。在细胞内，不变的精氨酸鉴定与鸟苷三磷酸酶激活蛋白具有同源性的丛蛋白结构域。蛋白质可以含有一个或一个以上的丛蛋白结构域。如本文所述，MET受体含有单个丛蛋白结构域。

如本文所用，Ig样结构域是本领域技术人员已知的并且是含有β链折叠的结构域，形成通过疏水相互作用稳定的两个β片层的紧密折叠结构并且通过链内二硫键夹在一起。Ig结构域的β片层中的链数目不同并且通常分成四种类型:Ig样V型、Ig样C1型、Ig样C2型、和I-set。在一个实例中，Ig样C型结构域含有作为四链加三链排列的七个β链，从而四个β链形成一个β片层，三个β链形成第二个β片层。在另一实例中，Ig样V型结构域含有9个β链，其作为四个β链加上五个β链排列(Janeway C.A.et al.(eds):Immunobiology-the immune system in health and disease，5thedn.New York，Garland Publishing，2001.)。此外，一些Ig样结构域不能被分到上述组之一并且有时被简称为Ig-样。

如本文所用，免疫球蛋白超家族是含有免疫球蛋白样结构域的蛋白质的异基因组。免疫球蛋白超家族的蛋白质包括参与免疫系统的蛋白质，如免疫球蛋白和T细胞受体、参与神经系统和其他组织中细胞-细胞识别的蛋白质，和其他蛋白质。

如本文所用，纤连蛋白III型(FN3)结构域是本领域技术人员公知的结构域并且含有保守的β夹层折叠，一个β片层含有四条链，另一个片层含有三条链。FN3结构域和Ig样结构域的折叠结构在拓扑学上非常相似，只是FN3结构域缺少保守的二硫键。编码FN3结构域的多肽部分的特征也是含有Arg-Gly-Asp(RGD)的一段短的氨基酸序列，其介导与细胞黏着分子的相互作用以调节血栓形成、炎症和肿瘤转移。

如本文所用，IPT/TIG结构域是本领域技术人员公知的结构域并且具有免疫球蛋白折叠样结构域。蛋白质含有一个或一个以上的IPT/TIG结构域。IPT/TIG结构域在丛蛋白、转录因子中和受体蛋白(如本文所述的细胞表面受体MET和RON)的细胞外区域中发现，其似乎调节细胞增殖和细胞粘附(Johnson CA et al，Journal of Medical Genetics，40:311-319，(2003))。

如本文所用，EGF结构域是本领域技术人员公知的结构域并且含有涉及许多保守半胱氨酸残基的重复模式，其对于蛋白质的三维结构是重要的，并且因此对于它被受体和其他分子的识别是重要的。如本文所述的EGF结构域含有参与形成二硫键的六个半胱氨酸残基。EGF结构域形成两条链的β片层，接着是到C末端短的两条链片层的环。保守半胱氨酸之间的亚结构域长度不同。EGF结构域的重复通常在膜结合的蛋白质的细胞外结构域中，如本文所述的TEK中发现。EGF结构域的变型是层粘连蛋白(Lam)EGF结构域，其如本文所述，具有8个而不是6个保守的半胱氨酸，因此比一般的EGF模块更长并且含有EGF样区域C末端的另一个二硫键。

如本文所用，跨膜结构域跨越锚定受体的质膜并且通常包括疏水残基。

如本文所用，胞质结构域是参与信号转导并且在跨膜细胞表面受体的胞质部分中发生的结构域。在一个实例中，胞质结构域可以包括蛋白激酶(PK)结构域。PK结构域是本领域技术人员公知的并且是含有保守的催化核心的结构域。认识到该保守催化核心在该结构域的最N-末端中赖氨酸残基附近具有富含甘氨酸的一段残基，已经表明这段残基参与ATP结合，并且在催化结构域的中心部分具有天冬氨酸残基，其对于该酶的催化活性是重要的。通常，取决于受体结构域的底物特异性，PK结构域可以是丝氨酸/苏氨酸蛋白激酶或酪氨酸蛋白激酶结构域，例如，含有酪氨酸激酶结构域的蛋白质在酪氨酸激酶上磷酸化底物蛋白，而例如，含有丝氨酸/苏氨酸蛋白激酶结构域的蛋白质在丝氨酸或苏氨酸残基上磷酸化底物蛋白。

如本文所用，激酶是能够磷酸化分子，通常生物分子，包括大分子和小分子的蛋白质。例如，分子可以是小分子，或蛋白质。磷酸化包括自身磷酸化。一些激酶具有组成型激酶活性。其他激酶需要活化。例如，参与信号转导的许多激酶是磷酸化的。磷酸化激活它们对途径中另一生物分子的激酶活性。一些激酶受到蛋白质结构和/或与另一分子相互作用的改变的调节。例如，蛋白质的复合或分子与激酶的结合可以活化或抑制激酶活性。

如本文所用，指定的指选择分子或其部分作为参考或比较点。例如，可以选择结构域作为指定的结构域，用于构建在所选结构域中被修饰的多肽。在另一实例中，可以选择内含子作为指定的内含子用于鉴定包括或排除所选内含子的RNA转录物。

如本文所用，关于多肽的产生是指表达并回收所表达的蛋白质(或者可回收或可分离的表达的蛋白质)。可以影响蛋白质产生的因素包括所选的表达系统和宿主细胞、细胞培养条件、宿主细胞对蛋白质的分泌，和为了纯化目的检测蛋白质的能力。通过评估蛋白质例如向细胞培养基的分泌来监测蛋白质的产生。

如本文所用，“提高的生产量”指与对照蛋白质多肽的生产量相比，多肽的生产量增加。例如，将同种型融合蛋白的生产量与不是融合蛋白或含有不同融合的对应的同种型比较。例如，可以将含有tPA前/原序列的同种型的生产量与含有它的内源信号序列的同种型比较。通常，蛋白质的生产量可以提高大于、约或至少1、1.5、2、3、4、5、6、7、8、9、10倍或以上。通常，蛋白质的生产量与不是同种型融合物或不含有相同融合物的对应同种型相比可以提高5、10、20、30、40、50倍或以上。

如本文所用，分泌指蛋白质借以转运到外部细胞环境中，或者对于革兰氏阴性细菌的情况，借以转运到周质空间的过程。通常，分泌通过细胞中的分泌途径发生，例如，在真核细胞中，这涉及内质网和高尔基体。

如本文所用，“前体序列”或“前体肽”或“前体多肽”指氨基酸序列，其被加工并且在多肽的末端，通常氨基酸末端发生，然后被加工或切割。前体序列包括实现连接的多肽的分泌和/或运输的氨基酸序列。前体序列可以包括一个或多个功能部分。例如，它可以包括前序列(或信号多肽)和/或原序列。多肽向成熟多体的加工导致从多肽切割前体序列。前体序列当包括前序列和原序列时也被称作前/原序列。

如本文所用，“前序列”、“信号序列”、“信号肽”、“前导序列”或“前导肽”指在新生多肽的氨基末端的氨基酸序列，其将蛋白质靶向分泌途径并且一旦定位在内质网膜中就被从新生链切除。

如本文所用，原序列指编码前肽的序列，所述前肽当连接到多肽时可以显示出不同的调节功能，包括但不限于，促进成熟多肽的正确折叠和形成二硫键，当前肽切割时促进多肽的活化，和/或作为识别位点。通常，原序列在分泌前在细胞内被切除，尽管它可以在细胞外被外切蛋白酶切割。在一些实例中，原序列被自催化切割，而在其他实例中，另一多肽蛋白酶切割原序列。

如本文所用，同源的指来自不同物质的分子，如核酸分子或多肽，其相互对应并且相互同一或非常相似(即，同源物)。

如本文所用，异源的指在活性或序列中独特的分子，如核酸或多肽。异源分子可以来自单独的遗传来源或物种。对于本文的目的，不管其来源，异源分子是不同于CSR或配体同种型或其等位基因变体的蛋白质或多肽。从而，CSR或配体同种型异源的分子包括含有不来自CSR或配体同种型、不是其内源或不与其同源的序列的任何分子。本文的目的异源分子的实例包括来自相同或不同物种的不同多肽的分泌信号、标记，如融合标记或标记物，或者不与CSR同种型或配体同源和序列不与CSR同种型或配体的序列相同的任何其他分子的全部或部分。异源分子可以与目的核酸或多肽序列融合用于产生融合或嵌合分子。

如本文所用，异源分泌信号指来自相同或不同物种的多肽的信号序列，该信号序列的序列与CSR或配体同种型的信号序列不同。异源信号序列可以用于它所来源的宿主细胞中或者它可以用于宿主细胞中，其中该宿主细胞与该信号序列来源的细胞不同。

如本文所用，内源前体序列或内源信号序列指与多肽的全部或部分结合的天然存在的信号序列。在表3和表4中提供了基于它们的对应的同族受体和配体信号序列的多种CSR和配体同种型的示例性信号序列的近似位置。然而，信号肽的C-末端边界可以通常在信号肽C-末端边界的任一边有不超过约5个氨基酸的不同。可以用本领域技术人员可得到的和已知的算法鉴定信号序列和预测它们的切割位点(见，例如，Chou et al.，(2001)，Proteins 42:136；McGeoch et al.，(1985)Virus Res.3:271；von Heijne et al.，(1986)Nucleic Acids Res.14:4683)。

如本文所用，组织纤溶酶原激活物(WA)指具有纤维蛋白溶解活性并且通常具有5个结构域(指、生长因子、三环域(kringle)-1、三环域-2，和蛋白酶结构域)结构的外部(组织型)纤溶酶原激活物。哺乳动物t-PA包括来自任一动物，包括人的t-PA。其他物种包括，但不限于，兔、大鼠、猪、非人灵长类、马、鼠、狗、猫、牛和羊tPA。编码包括来自人和非人物种的前体多肽的tPA的核酸是本领域已知的。

如本文所用，tPA前体序列指氨基酸残基序列，其包括来自tPA的前序列和原序列(即，是前/原序列，见，例如，美国专利6,693,181和美国专利4,766,075)。该多肽通常与tPA结合并且用于指导tPA从细胞的分泌。tPA的示例性前体序列在SEQ ID NO:2中给出并且由SEQ ID NO:1中给出的核酸序列编码。前体序列包括信号序列(氨基酸1-23)和原序列(氨基酸24-35)。原序列包括两个蛋白酶切割位点:一个在残基32之后，另一个在残基35之后。前体序列的示例性物种变体在SEQ ID NO:52-59的任一个中给出；示例性核酸和氨基酸等位基因变体在SEQ ID NO:5和6中给出。

如本文所用，tPA前体序列的全部或部分指tPA前体序列的任何连续的氨基酸部分，其足够指导tPA从细胞的加工和/或分泌。前体序列的全部或部分可以包括如SEQ ID NO:2中给出和SEQ ID NO:1编码的野生型或优势tPA前体序列、SEQ ID NO:6中给出的其等位基因变体，或者SEQ IDNO:52-59中给出的物种变体的全部或部分。例如，对于SEQ ID NO:2中给出的示例性tPA前体序列，tPA前体序列的部分可以包括SEQ ID NO:2中给出的氨基酸1-23、或者氨基酸24-35、24-32或氨基酸33-35，或者氨基酸1-35的任何其他连续序列。

如本文所用，如关于同种型的活性部分，多肽的活性部分指多肽的具有活性的部分。

如本文所用，蛋白质的纯化指分离蛋白质，如从匀浆分离蛋白质的过程，所述匀浆可以含有细胞和组织组分，包括DNA、细胞膜和其他蛋白质。可以通过本领域技术人员已知的多种方法的任一种纯化蛋白质，例如，根据它们的等电点通过将它们穿过pH梯度凝胶或离子交换柱，根据它们的大小或者分子量通过大小排阻层析或者通过SDS-PAGE(十二烷基硫酸钠-聚丙烯酰胺凝胶电泳)分析，或者根据它们的疏水性。其他纯化技术包括，但不限于，沉淀或亲和层析，包括免疫亲和层析，和其他技术和方法，包括这些方法任一种的组合。此外，通过在分子上包括标记，如用于亲和层析的组氨酸标记或者用于鉴定的可检测标记可以方便纯化。

如本文所用，检测包括允许显示(通过眼睛或仪器)蛋白质的方法。可以使用蛋白质特异的抗体显示蛋白质。也可以通过将蛋白质与标记(包括表位标记或标记物)融合来方便蛋白质的检测。

如本文所用，“标记”指氨基酸序列，其通常加到多肽的N-或C-末端。包括融合到多肽的标记可以方便多肽纯化和/或检测。

如本文所用，表位标记包括氨基酸的序列，其具有足够的残基以提供抗体可以针对的表位，然而足够短使得它不干扰它与之融合的多肽的活性。合适的标记多肽通常具有至少6个氨基酸残基并且通常在约8到50个氨基酸残基之间。

如本文所用，标记物指可检测的化合物或成分，其直接或间接缀合到同种型以便产生经标记的同种型。标记物自身可以被检测(例如，放射性同位素标记物或荧光标记物)，或者对于酶标记物的情况，可以催化底物化合物组成的化学改变，其然后可被检测。标记物的非限制性实例包括荧光部分、绿色荧光蛋白，或者萤光素酶。

如本文所用，融合标记的多肽指含有融合到标记多肽的同种型多肽的嵌合多肽。

如本文所用，表达指基因编码的信息借以转化成细胞中存在和运行的结构的过程。表达的基因包括可以转录成mRNA然后翻译成蛋白质的那些基因和被转录成RNA但是不翻译成蛋白质(例如，转移RNA和核糖体RNA)的那些基因。对于本文的目的，被表达的蛋白质可以保留在细胞内，如在细胞质中，或者可以从细胞分泌。

如本文所用，融合构建体指核酸序列，其含有来自一个核酸分子的编码序列和来自另一核酸分子的编码序列，其中这些编码序列处于相同的读框中使得当融合构建体在宿主细胞中被转录和翻译时，产生的蛋白质含有所述两个蛋白质。两个分子可以在构建体中相邻或者通过接头多肽分开，所述接头多肽含有1、2、3或更多氨基酸，但是通常小于10、9、8、7、6个氨基酸。融合构建体编码的蛋白质产物被称作融合多肽。

如本文所用，限制酶接头是被一种或多种限制酶识别的核苷酸序列编码的接头。

如本文所用，同种型融合蛋白或同种型融合多肽指核酸分子编码的多肽，所述核酸分子含有来自同种型的编码序列(有或没有内含子序列)，和编码另一多肽如前体序列或表位标记的编码序列。核酸有效连接使得当同种型融合构建体被转录和翻译时，产生同种型融合多肽，其中同种型多肽直接连接或通过接头连接到另一个肽。同种型多肽通常在N或C-末端或两端连接到一个或多个其他肽。

如本文所用，等位基因变体或等位基因变异指与群体中参考形式的基因不同的基因编码(即，等位基因编码)的多肽。通常，参考形式的基因编码来自群体的多肽的野生型和/或优势形式或者物种的单个参考成员。通常，等位基因变体与来自相同物种的野生型和/或优势形式具有至少80％、90％、95％或更大的氨基酸同一性。

如本文所用，物种变体指物种之间和之中相同多肽的变体。通常，种间等位基因变体与另一物种的野生型和/或优势形式有至少约60％、70％、80％、85％、90％或95％同一性或更大的同一性，包括与野生型和/或优势形式的多肽有96％、97％、98％、99％或更大的同一性。

如本文所用，修饰指多肽的氨基酸序列的修饰或核酸分子中核苷酸序列的修饰并且分别包括氨基酸和核苷酸的缺失、插入和置换。

如本文所用，调节指分子如蛋白质活性的改变。示例性活性包括，但不限于，诸如信号转导和蛋白质磷酸化的活性。调节可以包括活性的升高(即，活性的上调)、活性的降低(即，下调或抑制)或活性的任何其他改变(如周期性、频率、持续时间和动力学的改变)。调节可以依赖于环境并且通常将调节与指定状态相比较，所述指定状态为如野生型蛋白质、组成型状态的蛋白质或者指定的细胞类型或条件下表达的蛋白质。

如本文所用，抑制指活性如生物活性相对于未抑制的活性降低。

如本文所用，治疗蛋白指用于治疗状况、疾病或病症的蛋白质。

如本文所用，治疗指减轻或有益地改变状况、病症或疾病或其他适应症的症状的任何方式。

如本文所用，同族受体(如CSR)或其配体介导的疾病或病症指任何疾病，其中同族受体或配体发挥作用，从而它的活性的调节将实现该疾病或该疾病症状的治疗。配体的同族受体的实例是本文提供的任一种，包括任何CSR，如RTK、RAGE或TNF受体，或者配体，如HGF。同族受体或配体(如本文提供的同种型的同族受体或配体)发挥作用的示例性疾病或病症包括但不限于，血管发生相关的疾病和状况，包括眼疾病、动脉粥样硬化、癌症和血管损伤；神经变性疾病，包括阿尔茨海默氏病；炎性疾病和状况，包括动脉粥样硬化和类风湿性关节炎；与细胞增殖相关的疾病和状况，包括癌症，和平滑肌细胞相关的状况；和多种自身免疫疾病。

如本文所用，治疗效果指受试者的治疗产生的效果，其通常改善或减轻疾病或状况的症状或者治愈疾病或状况。治疗有效量指组合物、分子或化合物的量，其在施用于受试者后产生治疗效果。

如本文所用，术语“受试者”指动物，包括哺乳动物，如人类。

如本文所用，患者指人类受试者。

如本文所用，活性指生物分子，如多肽的功能或改变或相互作用。此类活性的示例(但不限于)是:复合体形成、二聚化、多聚化、受体相关的激酶活性或其他酶促或催化活性、受体相关的蛋白酶活性、磷酸化、去磷酸化、自身磷酸化、与其他分子形成复合体的能力、配体结合、催化或酶促活性、活化，包括自身活化和其他多肽的活化，抑制或调节另一分子的功能，刺激或抑制信号转导和/或细胞应答，如细胞增殖、迁移、分化和生长、降解、膜定位、膜结合，和肿瘤发生。可以通过本文所述的测定法或本领域技术人员已知的任何合适的测定法评估活性，所述测定法包括，但不限于，体外测定法，包括基于细胞的测定法，体内测定法，包括特定疾病的动物模型中的测定法。生物活性指在体内显示的活性。对于本文的目的，生物活性指本文提供的多肽显示的任何活性。

如本文所用，血管发生疾病(或者血管发生相关的疾病)是其中血管发生的平衡被改变或者其定时被改变的疾病。血管发生疾病包括其中发生血管发生改变，如不希望的血管化的疾病。此类疾病包括，但不限于，细胞增殖疾病，包括癌症、糖尿病性视网膜病变和其他糖尿病并发症，炎性疾病，子宫内膜异位症和其他疾病，其中过度的血管化是该疾病过程的一部分，包括上面提到的那些。

如本文所用，复合体形成指两个或多个分子，如两个蛋白质分子相互作用形成复合体。相互作用可以通过非共价键和/或共价键，并且包括，但不限于，疏水和静电相互作用、范德华力和氢键。通常，蛋白质-蛋白质相互作用涉及疏水相互作用和氢键。复合体形成可以受到环境条件如温度、pH、离子强度和压力，以及蛋白质浓度的影响。

如本文所用，二聚化指相同类型的两个分子，如受体的两个分子相互作用。二聚化包括同二聚化，其中两个相同的分子相互作用。二聚化还包括两个不同分子的异二聚化，如受体的两个亚基和两个不同受体分子的二聚化。通常，二聚化涉及两个分子，它们通过每个分子中所含的二聚化结构域的相互作用而进行相互作用。

如本文所用，配体拮抗剂指CSR或配体同种型的活性，其拮抗配体与CSR相互作用产生的活性。

如本文所用，计算机芯片上(in silico)指使用计算机进行的研究和实验。计算机芯片上方法包括，但不限于，分子建模研究、生物分子对接实验，和分子结构和/或过程，如分子相互作用的虚拟表示。

如本文所用，生物样品指从活的或病毒来源或大分子和生物分子的其他来源得到的任何样品，并且包括受试者的任何细胞类型或组织，可以从所述细胞类型或组织得到核酸或蛋白质或其他大分子。生物样品可以是直接从生物来源得到的样品或被处理的样品。例如，被扩增的分离的核酸组成生物样品。生物样品包括，但不限于，体液，如血液、血浆、血清、脑脊液、滑液、尿液和汗液、来自动物和植物的组织和器官样品和从其得到经处理的样品。还包括土壤和水样品和其他环境样品、病毒、细菌、真菌、藻类、原生动物和其组分。

如本文所用，术语“核酸”指单链和/或双链多核苷酸，如脱氧核糖核酸(DNA)、和核糖核酸(RNA)以及RNA或DNA的类似物或衍生物。术语“核酸”还包括核酸的类似物，如肽核酸(PNA)、硫代磷酸酯DNA，和其他此类类似物和其衍生物或组合。核酸可以指多核苷酸，如脱氧核糖核酸(DNA)和核糖核酸(RNA)。该术语还包括作为等同物的从核苷酸类似物制备的RNA或DNA的衍生物、变体和类似物，单链(有义或反义)和双链多核苷酸。脱氧核糖核苷酸包括脱氧腺苷、脱氧胞苷、脱氧鸟苷和脱氧胸苷。对于RNA，尿嘧啶碱基是尿苷。

如本文所用，“编码核酸分子”指指导特定蛋白质或肽的表达的核酸分子。核酸序列包括转录成RNA的DNA链序列和翻译成蛋白质或肽的RNA序列。核酸分子包括全长核酸序列以及从全长成熟多肽(如缺少前体序列的全长多肽)衍生的非全长序列。对于本文的目的，核酸序列还包括天然序列的简并密码子或者可以导入以提供特定宿主中的密码子优选的序列。

如本文所用，术语“多核苷酸”指含有至少两个连接的核苷酸或核苷酸衍生物的寡聚体或多聚体，包括脱氧核糖核酸(DNA)、核糖核酸(RNA)，和DNA或RNA衍生物，所述衍生物含有例如核苷酸类似物或不同于磷酸二酯键的“主链”键，例如，磷酸三酯键、亚磷酰胺键、硫代磷酸酯键、硫酯键，或者肽键(肽核酸)。术语“寡核苷酸”也在本文中与“多核苷酸”基本上同义地使用，尽管本领域技术人员认识到寡核苷酸，例如，PCR引物通常小于约50到100个核苷酸长度。

多核苷酸可以包括核苷酸类似物，包括例如，质量修饰的核苷酸，其允许多核苷酸的质量区分；含有可检测标记物，如荧光、放射性、发光或化学发光标记物的核苷酸，其允许多核苷酸的检测；或者含有反应基如生物素或硫羟基的核苷酸，其方便多核苷酸固定到固相支持体。多核苷酸还可以含有一个或多个主链键，其可以被选择性切割，例如被化学、酶促或光解切割。例如，多核苷酸可以包括一个或多个脱氧核糖核苷酸，接着是一个或多个核糖核苷酸，其可以接着是一个或多个脱氧核糖核苷酸，如可以在核糖核苷酸序列通过碱基水解切割的序列。多核苷酸还可以含有相对抗切割的一个或多个键，例如，嵌合寡核苷酸引物，其可以包括通过肽核酸键连接的核苷酸和3’末端的至少一个核苷酸，其通过磷酸二酯键或其他合适的键连接，并且能够被聚合酶延伸。使用公知的方法制备肽核酸序列(见，例如，Weiler et al.Nucleic acids Res.25:2792-2799(1997))。

如本文所用，在合成序列和合成基因的上下文中，合成的指通过重组方法和/或通过化学合成方法产生的核酸分子。

如本文所用，寡核苷酸指聚合物，其包括DNA、RNA、核酸类似物，如PNA，和其组合。对于本文的目的，引物和探针是单链寡核苷酸或者部分单链寡核苷酸。

如本文所用，引物指含有两个或多个(通常多于三个)脱氧核糖核苷酸或者核糖核苷酸的寡核苷酸，可以从其启动引物延伸产物的合成。有助于合成的实验条件包括存在核苷三磷酸和用于聚合和延伸的试剂，如DNA聚合酶，和合适的缓冲液、温度和pH。

如本文所用，通过使用重组DNA方法通过重组手段产生指使用分子生物学的公知方法表达克隆的DNA编码的蛋白质。

如本文所用，关于分子，如核酸分子、寡核苷酸、多肽或抗体的“分离的”指出该分子已经被人的手从它在天然环境中被发现的分子改变。例如，重组宿主细胞产生和/或重组宿主细胞中所含的分子被认为是“分离的”。同样，已经从天然来源或重组宿主细胞被部分或基本上纯化或通过合成方法产生的分子被认为是“分离的”。取决于预期的应用，分离的分子可以以任何形式存在，如存在于动物、细胞或其提取物中；脱水的、存在于蒸汽、溶液或者悬浮液中；或者固定在固相支持体上。

如本文所用，术语“载体”指核酸分子，其能够运输其连接的另一核酸分子。例如，载体指病毒表达系统、自主的自身复制环状DNA(质粒)，并且包括表达质粒和非表达质粒。一种类型的质粒也可以是附加体，即，能够在染色体外复制的核酸。载体包括能够自主复制和/或表达它们连接的核酸的那些载体。能够指导它们有效连接的基因表达的载体在本文中称作“表达载体”。通常，表达载体通常为“质粒”的形式，质粒通常是环状双链DNA环，其在它们的载体形式中不结合到染色体。“质粒”和“载体”可互换使用，因为质粒是最常用的载体形式。其他形式的表达载体包括发挥等同功能并且随后在本领域迄今变得已知的那些载体。当将重组微生物或细胞描述为容纳“表达载体”时，这包括染色体外环状DNA和已经掺入到宿主染色体中的DNA。当载体被宿主细胞保持时，载体可以在有丝分裂期间作为自主结构被细胞稳定复制，或者载体可以掺入到宿主的基因组内。

如本文所用，报道基因构建体是核酸分子，其包括编码有效连接到转录控制序列的报道子的核酸。报道基因的转录受到这些序列的控制。至少一种或多种这些控制序列的活性直接或间接受到另一分子，如细胞表面蛋白、参与细胞内信号转导的蛋白质或小分子的调节。转录控制序列包括启动子和其他调节区，如增强子序列，其调节启动子的活性，或者调节RNA聚合酶的活性或效率的控制序列。此类序列在本文中总称为转录控制元件或序列。此外，构建体可以包括改变所得mRNA的翻译，从而改变报道基因产物的量的核苷酸序列。

如本文所用，“报道子”或“报道子部分”指允许目的分子的检测的任何部分，如细胞表达的蛋白质，或者生物颗粒。典型的报道子部分包括例如，荧光蛋白，如红色、蓝色和绿色荧光蛋白(见，例如，美国专利号6,232,107，其提供了来自Renilla物种和其他物种的GFP)、来自大肠杆菌的lacZ基因、碱性磷酸酶、氯霉素乙酰转移酶(CAT)和其他此类公知的基因。对于在细胞中表达，在本文中称作“报道基因”的编码报道子部分的核酸可以作为与目的蛋白的融合蛋白或者在目的启动子的控制下表达。

如本文所用，短语“有效连接”关于核酸序列指核酸分子或其区段共价连接到单链或双链形式的一段核酸，如DNA或RNA。所述区段不必是连续的，而是两个或多个组分并列使得所述组分处于允许它们以它们的预期方式发挥功能的关系中。例如，RNA的区段(外显子)可以通过剪接有效连接以形成单个RNA分子。在另一实例中，DNA区段可以有效连接，从而在一个区段上的控制或调节序列允许其他区段的表达或复制或其他此类控制。从而，对于有效连接到报道子或任何其他多核苷酸的调节区，或者有效连接到调节区的报道子或任何多核苷酸的情况，多核苷酸/报道子的表达受到调节区的影响或控制(例如，调节或改变，如增加的或减小的)。对于基因表达，核苷酸序列和调节序列以这样的方式连接以控制或允许基因表达(当合适的分子信号，如转录激活蛋白结合到调节序列时)。异源核酸(如DNA)与调节和效应核苷酸序列(如启动子、增强子、转录和翻译终止位点，和其他信号序列)的有效连接指此类DNA和此类核苷酸序列之间的关系。例如，异源DNA与启动子的有效连接指DNA和启动子之间的物理关系使得RNA聚合酶从所述启动子启动对此类DNA的转录，所述RNA聚合酶特异识别、结合并转录读框中的所述DNA。

如本文所用，术语“有效连接”关于多肽中的氨基酸指氨基酸的共价连接(直接或间接)。例如，当用于短语“有效连接到编码细胞表面受体的基因的内含子编码的至少一个氨基酸的细胞表面受体的至少一个结构域”的上下文中时，指来自细胞表面受体结构域的氨基酸共价结合到来自细胞表面受体基因的内含子编码的氨基酸。此类连接通常是通过肽键直接连接，也可以间接实现，如通过接头或者非肽连接。所以，含有有效连接到编码细胞表面受体的基因的内含子编码的至少一个核酸的细胞表面受体的至少一个结构域的多肽可以是内含子融合蛋白。它含有不在优势形式的受体中发现的一个或多个氨基酸，但是，含有编码优势形式的基因的内含子编码的部分。这些一个或多个氨基酸由编码细胞表面受体的基因的内含子序列编码。当内含子序列被剪接或者符合读框地共价结合到编码细胞表面受体的结构域的外显子序列时，可以产生编码此类多肽的核酸。核酸分子的翻译产生多肽，其中内含子序列的氨基酸共价结合到细胞表面受体的结构域。它们还可以合成产生，通过将含有外显子的部分连接到含有内含子的部分可以实现合成产生，包括嵌合的内含子融合蛋白，其中外显子由与内含子部分不同的细胞表面受体同种型的基因编码。

如本文所用，短语“从核酸产生”涉及产生多肽，如同种型和内含子融合蛋白时，包括从核酸序列向氨基酸序列的翻译字面地产生多肽分子和产生多肽的氨基酸序列。

如本文所用，启动子区指基因的DNA部分，其控制它有效连接的DNA的转录。启动子区包括DNA的特定序列，其对于RNA聚合酶识别、结合和转录起始是足够的。该部分启动子区被称作启动子。此外，启动子区包括调节RNA聚合酶的该识别、结合和转录起始活性的序列。这些序列可以是顺式作用的或者可以应答反式作用因子。取决于调节性质，启动子可以是组成型或受到调节的。

如本文所用，调节区指顺式作用核苷酸序列，其积极或消极地影响有效连接的基因的表达。调节区包括赋予基因的可诱导的(即，需要物质或刺激物来增加转录)表达的核苷酸序列。当诱导物存在或浓度增加时，基因表达可以增加。调节区也包括赋予基因表达的抑制的序列(即，物质或刺激物降低转录)。当阻抑物存在或浓度增加时，基因表达可以降低。已知调节区影响、调节或控制许多体内生物活性，包括细胞增殖、细胞生长和死亡、细胞分化和免疫调节。调节区通常结合到一个或多个反式作用蛋白，其导致基因的增加的或减小的转录。

基因调节区的特定实例是启动子和增强子。启动子是位于转录或翻译起始位点周围，通常位于翻译起始位点5’的序列。启动子通常位于翻译起始位点1Kb内，但是可以位于更远处，例如，2Kb、3Kb、4Kb、5Kb或以上，高达并包括10Kb。已知增强子当位于基因的5’或3’时，或当位于外显子或内含子中或部分时影响基因表达。增强子也可以在基因很远处，例如在约3Kb、5Kb、7Kb、10Kb、15Kb或更远处的距离发挥功能。

调节区除了启动子区外，也包括促进翻译的序列、内含子的剪接信号、基因的正确读框的维持以允许mRNA的框内翻译，和终止密码子、前导序列和融合配偶体序列、用于产生多基因的内部核糖体结合位点(IRES)元件，或者多顺反子信息、用于提供目的基因的转录的正确的多聚腺苷酸化的多腺苷酸化信号和终止密码子，并且可以任选包括在表达载体中。

如本文所用，在本文出现的多种氨基酸序列中发生的“氨基酸”根据它们公知的三字母或单字母缩写鉴定(见表1)。在多种DNA片段中存在的核苷酸用本领域常用的标准单字母命名标明。

如本文所用，“氨基酸残基”指当多肽在其肽键被化学消化(水解)时形成的氨基酸。本文描述的氨基酸通常为“L”异构形式。“D”异构形式中的残基可以取代任一L-氨基酸残基，只要所述多肽保留所希望的功能性质。NH2指在多肽的氨基末端存在的游离氨基。COOH指在多肽的羧基末端存在的游离羧基。与J.Biol.Chem.，243:3552-59(1969)中所述和37C.F.R..§§.1.821-1.822采取的标准多肽命名法保持一致，在表1中显示了氨基酸残基缩写:

表1-对应表

通过结构式在本文给出的氨基酸残基的所有序列都具有氨基末端到羧基末端的常规方向中的从左到右的方向。此外，将短语“氨基酸残基”定义为包括对应表中所列氨基酸的修饰的、非天然的和非常规的氨基酸。此外，应该指出在氨基酸残基序列开始或结束时的破折号指出与一个或多个氨基酸残基组成的另一序列或与氨基末端基团如NH₂或与羧基末端基团如COOH形成的肽键。

在肽或蛋白质中，氨基酸的合适的保守替代是本领域技术人员已知的并且通常可以进行所述保守替代而不改变所得分子的生物活性。本领域技术人员认识到通常，在多肽的非必需区域中的单个氨基酸替代基本上不改变生物活性(见，例如，Watson et al.Molecular Biology of the Gene，第四版，1987，The Benjamin/Cummings Pub.co.，p.224)。

可以根据如下表2中给出的进行此类替代:

表2:

原始残基	保守替代
原始残基	保守替代	Ala(A)	Gly；Ser
Arg(R)	Lys	Ala(A)	Gly；Ser
Arg(R)	Lys	Asn(N)	Gln；His
Cys(C)	Ser	Asn(N)	Gln；His
Cys(C)	Ser	Gln(Q)	Asn
Glu(E)	Asp	Gln(Q)	Asn
Glu(E)	Asp	Gly(G)	Ala；Pro
His(H)	Asn；Gln	Gly(G)	Ala；Pro
His(H)	Asn；Gln	Ile(I)	Leu；Val
Leu(L)	Ile；Val	Ile(I)	Leu；Val

原始残基	保守替代
原始残基	保守替代	Lys(K)	Arg；Gln；Glu
Met(M)	Leu；Tyr；Ile	Lys(K)	Arg；Gln；Glu
Met(M)	Leu；Tyr；Ile	Phe(F)	Met；Leu；Tyr
Ser(S)	Thr	Phe(F)	Met；Leu；Tyr
Ser(S)	Thr	Thr(T)	Ser
Trp(W)	Tyr	Thr(T)	Ser
Trp(W)	Tyr	Tyr(Y)	Trp；Phe
Val(V)	Ile；Leu	Tyr(Y)	Trp；Phe

其他替代也是允许的并且可以根据经验或者根据其他已知的保守或非保守替代确定。

如本文所用，两个蛋白质或核酸之间的“相似性”指蛋白质的氨基酸序列或核酸的核苷酸序列之间的相关性。相似性可以基于残基的序列或其中所含残基的同一性和/或同源性程度。用于评估蛋白质或核酸之间相似性程度的方法是本领域技术人员已知的。例如，在评估序列相似性的方法中，将两个氨基酸或核苷酸序列以在序列之间产生最大水平的同一性的方式比对。“同一性”指氨基酸或核苷酸序列不变的程度。氨基酸序列和在一定程度上核苷酸序列的比对也可以考虑氨基酸(或核苷酸)中保守差异和/或频繁替代。保守差异是保留有关残基的理化性质的那些差异。比对可以是全局的(在序列的全长上所比较的序列的比对并且包括所有残基)或局部的(一部分序列的比对，其包括仅仅最相似的一个或多个区域)。

如本文所用，术语“同源性”和“同一性”可互换使用，但是蛋白质的同源性可以包括保守氨基酸改变。通常，为了鉴定对应的位置，比对氨基酸的序列使得得到最高位的匹配(见例如，Computational Molecular Biology，Lesk，A.M.，ed.，Oxford University Press，New York，1988；Biocomputing:Informatics and Genome Projects，Smith，D.W.，ed.，Academic Press，New York，1993；Computer Analysis of Sequence Data，Part I，Griffin，A.M.，and Griffin，H.G.，eds.，Humana Press，New Jersey，1994；Sequence Analysis in Molecular Biology，von Heinje，G.，AcademicPress，1987；and Sequence Analysis Primer，Gribskov，M.and Devereux，J.，eds.，M Stockton Press，New York，1991；Carrillo et al.(1988)SIAM JApplied Math 48:1073)。

如本文所用，“序列同一性”指测试和参考多肽或多核苷酸之间比较中相同氨基酸(或者核苷酸碱基)的数目。同源多肽指同一或同源氨基酸残基的预定数目。同源性包括保守氨基酸替代以及同一残基。序列同一性可以通过标准比对算法程序，使用每个供应商建立的默认空位罚分来确定。同源核酸分子指同一或同源核苷酸的预定数目。同源性包括不改变编码的氨基酸(即，“沉默替代”)以及同一残基的替代。基本上同源的核酸分子通常在中等严格性或高严格性条件下杂交，所述杂交都沿着核酸的长度或者沿着目的全长核酸分子全长的至少约70％、80％或90％。还设想这样的核酸分子，其含有代替杂交核酸分子中密码子的简并密码子。(对于蛋白质同源性的确定，可以比对保守氨基酸以及同一氨基酸；在该情况中，同一性百分比和同源性百分比不同)。任何两个核酸分子是否具有至少60％、70％、80％、85％、90％、95％、96％、97％、98％或99％“同一性”的核苷酸序列(或者任何两个多肽具有氨基酸序列)可以用已知的计算机算法，如Pearson et al.Proc.Natl.Acad.Sci.USA 85:2444(1988)中“FASTA”程序用默认参数来确定(其他程序包括GCG程序包(Devereux，J.，et al.，Nucleic Acids Research 12(I):387(1984))，BLASTP，BLASTN，FASTA(Altschul，S.F.，et al.，J Molec.Biol.215:403(1990)；Guide to Huge Computers，Martin J.Bishop，ed.，Academic Press，San Diego(1994)，和Carrillo et al.SIAM J Applied Math 48:1073(1988))。例如，可以用国家生物技术信息中心(National Center for Biotechnology Information)数据库的BLAST函数确定同一性。其他商业的或可公开获得的程序包括DNAStar“MegAlign”程序(Madison，WI)和University of WisconsinGenetics Computer Group(UWG)“Gap”程序(Madison WI))。蛋白质和/或核酸分子的百分比同源性可以例如通过使用GAP计算机程序(例如，Needleman et al.J.Mol.Biol.48:443(1970)，Smith和Waterman改进(Adv.Appl.Math.2:482(1981))通过比较序列信息来确定。简言之，GAP程序将相似性定义为相似的比对符号(例如，核苷酸或氨基酸)的数目除以两个序列的较短者中符号总数。GAP程序的默认参数可以包括:(1)一元比较矩阵(含有同一性的值为1，非同一性的值为0)和Gribskov et al.Nucl.Acids Res.14:6745(1986)的加权比较矩阵，如Schwartz和Dayhoff，eds.，Atlas of Protein Sequence and Structure，National Biomedical ResearchFoundation，pp.353-358(1979)所述；(2)每个空位的罚分为3.0，每个空位中每个符号的额外罚分0.10；和(3)对于末端空位无罚分。因此，如本文所用，术语“同一性”代表测试和参考多肽或多核苷酸之间的比较。在一个非限制性实例中，“至少90％同一”指相对于参考多肽从90％到100％的百分比同一性。在90％或以上水平的同一性表明假定用于示例目的，比较长度为100个氨基酸的测试和参考多核苷酸，那么测试多肽中不超过10％(即，100个中10个)的氨基酸与参考多肽的氨基酸不同。可以在测试和参考多核苷酸之间进行相似的比较。此类不同可以表示为在氨基酸序列的整个长度上随机分布的点突变或者它们可以在高达可允许的最大值的不同长度的一个或多个位置中聚类，例如，10/100个氨基酸差异(约90％同一性)。可以将差异定义为核酸或氨基酸替代、插入或缺失。在高于约85-90％的同源性或同一性水平上，结果将独立于程序和空位参数设置；此类高水平的同一性可以容易地评估，通常不依赖于软件。

如本文所用，比对的序列指使用同源性(相似性和/或同一性)比对核苷酸或氨基酸序列中对应的位置。通常，比对50％或更高同一性相关的两个或多个序列。序列的比对集合指两个或多个序列，其在对应位置比对并且可以包括与基因组DNA序列比对的衍生自RNA的比对序列，如EST和其他cDNA。

如本文所用，“引物”指核酸分子，其作为在合适条件下(例如，在四种不同的核苷三磷酸和聚合试剂，如DNA聚合酶，RNA聚合酶或者逆转录酶存在下)在合适的缓冲液和合适温度下模板指导的DNA合成的起始点。将理解某些核酸分子可以作为“探针”和作为“引物”。然而，引物具有用于延伸的3’羟基。引物可以用于多种方法中，包括例如，聚合酶链式反应(PCR)、逆转录酶(RT)-PCR、RNA PCR、LCR、多重PCR、锅柄(panhandle)PCR、捕获PCR、表达PCR、3’和5’RACE、原位PCR、连接介导的PCR和其他扩增方案。

如本文所用，“引物对”指一组引物，其包括与待扩增(例如，通过PCR)序列的5’杂交的5’(上游)引物和与待扩增序列的3’末端的互补序列杂交的3’(下游)引物。

如本文所用，“特异杂交”指核酸分子(例如，寡核苷酸)与靶核酸分子通过互补碱基配对退火。本领域技术人员熟悉影响特异杂交的体外和体内参数，如特定分子的长度和组成。与体外杂交尤其相关的参数还包括退火和洗涤温度、缓冲液组成和盐浓度。用于去除在高严格条件下非特异结合的核酸分子的示例性洗涤条件是0.1 x SSPE，0.1％ SDS，65℃，在中等严格条件下的示例性洗涤条件是0.2 x SSPE，0.1％ SDS，50℃。等同严格条件是本领域已知的。技术人员容易调节这些参数以实现核酸分子与适合具体应用的靶核酸分子的特异杂交。

B.细胞表面受体和配体同种型

本文提供了与另一核酸融合的编码细胞表面受体(CSR)同种型或配体同种型的核酸，所述另一核酸改变CSR同种型的生产量，如通过改变CSR或配体同种型的分泌、表达和/或纯化。同种型融合产生与不与另一核酸序列融合的同种型相比具有提高的分泌和表达的多肽。本文还提供了含有编码如本文提供的同种型的核酸的表达载体，和含有此类载体的细胞。

本文示例的同种型代表优势或野生型基因的变体，其可以通过选择性剪接或者重组或合成(例如，计算机芯片上和/或化学合成)方法产生。同种型在相关申请(共同待决的美国申请序号10/846,113和对应的国际PCT申请号WO 05/016966，美国申请序号11/129,740，美国临时申请号60/678,076，和美国申请号(律师卷号17118-045P01/P2824)中描述，其与所有此类文件一样被完整引入本文作为参考)。通常，从选择性剪接的RNA产生的同种型不是基因编码的多肽的优势形式。在一些情况中，同种型可以是组织特异性的或者发育阶段特异性的多肽或疾病特异性的(例如，可以从组织到组织或阶段到阶段或在患病状态与非患病状态相比以不同水平表达，或者可以仅仅在组织中、在疾病过程或进展的阶段或期间表达)。可以编码同种型的选择性剪接的RNA形式包括，但不限于，外显子缺失、外显子保留、外显子延伸、外显子截短、和内含子保留选择性剪接的RNA。通常，通过内含子修饰产生本文提供的同种型。

通过编码核酸分子的选择性剪接产生的同种型包括内含子融合蛋白，其中与编码野生型或优势形式的同种型的mRNA转录物相比，来自一个或多个内含子的一个或多个密码子(包括终止密码子)被保留。一个或多个内含子密码子的保留可以产生编码与野生型或优势形式的同种型相比缩短的同种型的转录物。保留的内含子序列可以在转录物中导入终止密码子，从而提前终止所编码的多肽。保留的内含子序列也可以在同种型多肽中导入额外的氨基酸，如在转录物中插入一个或多个密码子，使得一个或多个氨基酸被插入到同种型的结构域中。内含子保留包括在编码同种型的转录物中包括全长或部分内含子序列。所保留的内含子序列可以将具有密码子的核苷酸序列符合读框地导入周围的外显子中或者它可以向转录物中导入移码。

1.细胞表面受体同种型

为细胞表面受体同种型的同种型可以连接到信号序列或者连接到如本文所述的前体序列或者可以通过表达核酸构建体产生，所述构建体编码有效连接到前体或信号序列的同种型。CSR同种型可以含有新的结构域和/或与野生型和/或优势形式的受体相比显示出新的或不同的生物功能。例如，内含子编码的氨基酸可以向同种型中导入新的结构域或其部分。可以被改变的生物活性包括，但不限于，蛋白质-蛋白质相互作用，如二聚化、多聚化和复合体形成，对配体的特异性和/或亲和性、细胞定位和再定位、膜锚定、酶活性，如激酶活性、对调节分子的应答，所述调节分子包括调节蛋白、辅因子和其他信号分子，如信号转导途径中的信号分子。通常，同种型中的生物活性与野生型和/或优势形式的受体相比改变至少0.1、0.5、1、2、3、4、5或10倍。通常，生物活性改变10、20、50、100或1000倍或以上。例如，同种型的生物活性可以降低。

CSR同种型还可以调节野生型和/或优势形式的受体的活性。例如，CSR同种型可以与CSR同种型直接或间接相互作用并且调节该受体的生物活性。可以被改变的生物活性包括，但不限于，蛋白质-蛋白质相互作用，如二聚化、多聚化和复合体形成，对配体的特异性和/或亲和性、细胞定位和再定位、膜锚定、酶活性，如激酶活性、对调节分子的应答，所述调节分子包括调节蛋白、辅因子和其他信号分子，如信号转导途径中的信号分子。

CSR同种型可以与细胞表面受体直接或间接相互作用以引起或参与生物效应，如通过调节细胞表面受体的生物活性。CSR同种型还可以独立于细胞表面受体相互作用以引起生物效应，如通过启动或抑制信号转导途径。例如，CSR同种型可以启动信号转达途径并且增强或促进细胞生长。在另一实例中，CSR同种型可以作为配体与细胞表面受体相互作用，引起生物学效应，如通过抑制信号转导途径，所述途径可以阻碍或抑制细胞生长。因此，本文提供的同种型可以作为细胞表面受体配体发挥功能，因为它们与靶定的受体相互作用，所述作用方式与同族配体与受体相互作用并改变受体活性的方式相同。同种型可以作为配体结合，但是不必结合到配体结合位点并且用于阻断受体二聚化。它们作为配体是因为它们与受体相互作用。CSR同种型还可以通过结合到受体的配体和/或通过阻止受体活性，如二聚化而发挥作用。

例如，CSR同种型可以与CSR竞争配体结合。CSR同种型当结合到受体时，可以是负效应配体，其导致受体功能的抑制。还可能的是一些CSR同种型结合同族受体，导致受体的活化。CSR同种型可以作为CSR的竞争性抑制剂，例如，通过与CSR同种型复合并改变CSR与其他CSR多聚化(例如，二聚化或三聚化)的能力。CSR同种型可以在与信号转导途径中的其他多肽和辅因子的相互作用中与CSR竞争。本文提供的细胞表面同种型和同种型家族包括，但不限于，受体酪氨酸激酶的同种型(在本文中也称作RTK同种型)和其他家族CSR的同种型，如TNF和其他G-蛋白偶联受体。在一个实例中，CSR同种型是可溶性多肽。例如，CSR同种型缺少至少部分或全部的跨膜结构域。可溶性同种型可以调节野生型或优势形式受体的生物活性(见例如，Kendall et al.(1993)PNAS 90:10705，Werner etal.(1992)Molec.Cell Biol.12:82，Heaney et al.(1995)PNAS 92:2365，Fukunaga et al.(1990)PNAS 87:8702，Wypych et al.(1995)Blood 85:66-73，Barron et al.(1994)Gene147:263，Cheng et al.(1994)Science 263:1759，Dastot et al.(1996)PNAS 93:10723，Abramovich et al.(1994)FEBSLett 338:295，Diamant et al.(1997)FEBS Lett 412:379，Ku et al.(1996)Blood88:4124，Heaney ML和Golde DW(1998)，J Leukocyte Biol.64:135-146)。

示例性CSR同种型(包括受体酪氨酸激酶(RTK)或肿瘤坏死因子受体(TNFR)或RAGE同种型)包括本文提供的和本领域技术人员已知的CSR内含子融合蛋白，包括共同待决的美国申请序号10/846,113和对应的国际PCT申请号WO 05/016966，美国申请序号11/129,740，美国临时申请号60/678,076，和美国申请号(律师卷号17118-045P01/P2824)中所述的任一种。

通常，CSR内含子融合蛋白由通过编码同族细胞表面受体的基因的选择性剪接产生的核酸分子编码。通常，CSR同种型多肽含有细胞表面受体的至少一个结构域，其在外显子末端被截短或者连接到编码同族细胞表面受体的基因的内含子编码的至少一个氨基酸。CSR包括所有细胞表面受体，如受体酪氨酸激酶(RTK)、TNFR，和RAGE受体。

RTK的实例包括但不限于，产生红细胞生成素的肝细胞(EPH)受体(也称作肝配蛋白受体)、表皮生长因子(EGF)受体、成纤维细胞生长因子(FGF)受体、血小板衍生生长因子(PDGF)受体、血管内皮生长因子(VEGF)受体、细胞黏着RTK(CAK)、TIE/Tek受体、肝细胞生长因子(HGF)受体(称作MET)、网柄菌凝素结构域受体(DDR)、胰岛素生长因子(IGF)受体、胰岛素受体相关(IRR)的受体和其他，如Tyro3/Ax1。TNFR的实例包括，但不限于，TNFR1、TNFR2、TNFRrp、低亲和力神经生长因子受体、Fas抗原、CD40、CD27、CD30、4-1BB、OX40、DR3、DR4、DR5和疱疹病毒进入介导物(HVEM)。编码RTK或TNFR的示例性基因包括表3中所列的任一种，包括，但不限于，ErbB2、ErbB3、DDR1、DDR2、EGFR、EphA 1、EphA 2、EphA 3、EphA 4、EphA 5、EphA 6、EphA 7、EphA 8、EphB1、EphB2、EphB3、EphB4、EphB5、EphB6、FGFR-1、FGFR-2、FGFR-3、FGFR-4、Flt1(也称作VEGFR-1)、VEGFR-2、VEGFR-3(也称作VEGFRC)、MET、RON、PDGFR-A、PDGFR-B、CSFIR、Flt3、KIT、TIE-1、TEK(也称作TIE-2)、HER-2、RAGE、TNFR2，和编码上面提到和没有给出的RTK和TNFR的基因。表3提供了示例性CSR内含子融合蛋白的非限制性实例，包括示例性多肽序列和编码核酸序列的SEQ IDNOS。通常，本领域技术人员可以确定与同种型的同族全长受体相比，存在或不存在同种型的结构基序，包括前体或信号序列或其他蛋白质结构域。例如，可以进行同种型与全长同族受体的比对以确定存在或不存在已知对于同族受体存在的信号序列和/或其他结构域。使用此类比对，在表3中列出了示例性CSR同种型的信号序列中所含的氨基酸残基。在另一实例中，可以测试同种型的活性，如分泌或配体结合，以确定结构域的活性与全长同族受体相比是否改变或消除和/或结构是否改变。CSR同种型，如下面表3中描述的那些可以用于融合蛋白中提高CSR同种型的生产量(例如，通过分泌)。

表3:示例性CSR内含子融合蛋白

基因	ID#	AA长度	信号序列	SEQ IDNO:(核酸)	SEQ IDNO:(氨基酸)
基因	ID#	AA长度	信号序列	SEQ IDNO:(核酸)	SEQ IDNO:(氨基酸)	DDR1	SR005A11	286	1-18	139	140
DDR1	SR005A10	243	1-18	141	142	DDR1	SR005A11	286	1-18	139	140
DDR1	SR005A10	243	1-18	141	142	DDR1.h		444	1-18	n/a	143
EphA1	SR004G03	474	1-23	144	145	DDR1.h		444	1-18	n/a	143

基因	ID#	AA长度	信号序列	SEQ IDNO:(核酸)	SEQ IDNO:(氨基酸)
基因	ID#	AA长度	信号序列	SEQ IDNO:(核酸)	SEQ IDNO:(氨基酸)	EphA1	SR004G07	311	1-23	146	147
EphA1	SR004H03	490	1-23	148	149	EphA1	SR004G07	311	1-23	146	147
EphA1	SR004H03	490	1-23	148	149	EphA1.b		166		n/a	150
EphA2	SR016E12	497	1-24	151	152	EphA1.b		166		n/a	150
EphA2	SR016E12	497	1-24	151	152	EphA8.b		495	1-30	n/a	153
EphB1	SR005D06	242	1-17	154	155	EphA8.b		495	1-30	n/a	153
EphB1	SR005D06	242	1-17	154	155	EphB4	SR012C08	306	1-15	156	157
EphB4	SR012D11	516	1-15	158	159	EphB4	SR012C08	306	1-15	156	157
EphB4	SR012D11	516	1-15	158	159	EphB4	SR012E11	414	1-15	160	161
EGFR.a		405	1-24	n/a	162	EphB4	SR012E11	414	1-15	160	161
EGFR.a		405	1-24	n/a	162	ErbB2	herstatin	419	1-22	n/a	289
ErbB2.1.d		680	1-24	n/a	163	ErbB2	herstatin	419	1-22	n/a	289
ErbB2.1.d		680	1-24	n/a	163	ErbB2.1.e		633	1-22	n/a	164
ErbB2.1.f		575	1-22	n/a	165	ErbB2.1.e		633	1-22	n/a	164
ErbB2.1.f		575	1-22	n/a	165	ErbB2.a		90	1-22	n/a	166
ErbB2.c31		419	1-22	n/a	167	ErbB2.a		90	1-22	n/a	166
ErbB2.c31		419	1-22	n/a	167	ErbB3.d31		331	1-19	n/a	168
FGFR-1	SR00IE12	228	1-21	169	170	ErbB3.d31		331	1-19	n/a	168
FGFR-1	SR00IE12	228	1-21	169	170	FGFR-1	SR022C02	320	1-21	171	172
FGFR-2	SR022C10	266	1-21	173	174	FGFR-1	SR022C02	320	1-21	171	172
FGFR-2	SR022C10	266	1-21	173	174	FGFR-2	SR022C11	317	1-21	175	176
FGFR-2	SR022D04	281	1-21	177	178	FGFR-2	SR022C11	317	1-21	175	176
FGFR-2	SR022D04	281	1-21	177	178	FGFR-2	SR022D06	396	1-21	179	180
FGFR-2.b31		366	1-21	n/a	181	FGFR-2	SR022D06	396	1-21	179	180

基因	ID#	AA长度	信号序列	SEQ IDNO:(核酸)	SEQ IDNO:(氨基酸)
基因	ID#	AA长度	信号序列	SEQ IDNO:(核酸)	SEQ IDNO:(氨基酸)	FGFR-4	SR002A11	72	1-24	182	183
FGFR-4	SR002A10	446	1-24	184	185	FGFR-4	SR002A11	72	1-24	182	183
FGFR-4	SR002A10	446	1-24	184	185	FGFR-4.d31		209		n/a	186
MET	SR020C10	413	1-24	187	188	FGFR-4.d31		209		n/a	186
MET	SR020C10	413	1-24	187	188	MET	SR020C12	468	1-24	189	190
MET	SR020D04	518	1-24	191	192	MET	SR020C12	468	1-24	189	190
MET	SR020D04	518	1-24	191	192	MET	SR020D07	596	1-24	193	194
MET	SR020D11	408	1-24	195	196	MET	SR020D07	596	1-24	193	194
MET	SR020D11	408	1-24	195	196	MET	SR020E11	621	1-24	197	198
MET	SR020F08	664	1-24	199	200	MET	SR020E11	621	1-24	197	198
MET	SR020F08	664	1-24	199	200	MET	SR020F11	719	1-24	201	202
MET	SR020F12	697	1-24	203	204	MET	SR020F11	719	1-24	201	202
MET	SR020F12	697	1-24	203	204	MET	SR020G03	691	1-24	205	206
MET	SR020G07	661	1-24	207	208	MET	SR020G03	691	1-24	205	206
MET	SR020G07	661	1-24	207	208	MET	SR020H03	755	1-24	209	210
MET	SR020H06	823	1-24	211	212	MET	SR020H03	755	1-24	209	210
MET	SR020H06	823	1-24	211	212	MET	SR020H07	877	1-24	213	214
MET	SR020H08	764	1-24	215	216	MET	SR020H07	877	1-24	213	214
MET	SR020H08	764	1-24	215	216	MET34		934	1-24		217
RON	SR004C11	495	1-24	218	219	MET34		934	1-24		217
RON	SR004C11	495	1-24	218	219	RON	SR014C01	541	1-24	220	221
RON	SR014C09	908	1-24	222	223	RON	SR014C01	541	1-24	220	221
RON	SR014C09	908	1-24	222	223	RON	SR014E12	647	1-24	224	225
CSFIR	SR005A06	306	1-19	226	227	RON	SR014E12	647	1-24	224	225

基因	ID#	AA长度	信号序列	SEQ IDNO:(核酸)	SEQ IDNO:(氨基酸)
基因	ID#	AA长度	信号序列	SEQ IDNO:(核酸)	SEQ IDNO:(氨基酸)	KIT	SR002H01	413	1-22	228	229
PDGFR-A.b31		217	1-23	n/a	230	KIT	SR002H01	413	1-22	228	229
PDGFR-A.b31		217	1-23	n/a	230	PDGFR-A.c34		218	1-23	n/a	231
PDGFR-B	SR007C09	336	1-32	232	233	PDGFR-A.c34		218	1-23	n/a	231
PDGFR-B	SR007C09	336	1-32	232	233	RAGE	SR021A05	146	1-22	234	235
RAGE	SR021C02	266	1-22	236	237	RAGE	SR021A05	146	1-22	234	235
RAGE	SR021C02	266	1-22	236	237	RAGE	SR021C06	387	1-22	238	239
RAGE	SR021C08	173	1-22	240	241	RAGE	SR021C06	387	1-22	238	239
RAGE	SR021C08	173	1-22	240	241	RAGE	SR021F06	172	1-22	242	243
TEK	SR007G02	367	1-18	244	245	RAGE	SR021F06	172	1-22	242	243
TEK	SR007G02	367	1-18	244	245	TEK	SR007H03	468	1-18	246	247
TEKc		864	1-18	n/a	248	TEK	SR007H03	468	1-18	246	247
TEKc		864	1-18	n/a	248	TEKc31		798		n/a	249
TEKc34		821	1-18	n/a	250	TEKc31		798		n/a	249
TEKc34		821	1-18	n/a	250	Tie-1		786	1-21	n/a	251
Tie-1	SR006A04	251	1-21	252	253	Tie-1		786	1-21	n/a	251
Tie-1	SR006A04	251	1-21	252	253	Tie-1	SR006B07	379	1-21	254	255
Tie-1	SR006B06	161	1-21	256	257	Tie-1	SR006B07	379	1-21	254	255
Tie-1	SR006B06	161	1-21	256	257	Tie-1	SR006B12	414	1-21	258	259
Tie-1	SR006B10	317	1-21	260	261	Tie-1	SR006B12	414	1-21	258	259
Tie-1	SR006B10	317	1-21	260	261	Tie-1	SR016G03	751	1-21	262	263
Tie-1		838	1-21	n/a	264	Tie-1	SR016G03	751	1-21	262	263
Tie-1		838	1-21	n/a	264	Tie-1		632	1-21	n/a	265
Tie-1		533	1-21	n/a	266	Tie-1		632	1-21	n/a	265

基因	ID#	AA长度	信号序列	SEQ IDNO:(核酸)	SEQ IDNO:(氨基酸)
基因	ID#	AA长度	信号序列	SEQ IDNO:(核酸)	SEQ IDNO:(氨基酸)	Tie-1		428	1-21	n/a	267
Tie-1		344	1-21	n/a	268	Tie-1		428	1-21	n/a	267
Tie-1		344	1-21	n/a	268	Tie-1		255	1-21	n/a	269
Tie-1		197	1-21	n/a	270	Tie-1		255	1-21	n/a	269
Tie-1		197	1-21	n/a	270	TNFR2(TNFRIB)	SR003H02	155	1-22	271	272
VEGFR-1	SR004C05	174	1-26	273	274	TNFR2(TNFRIB)	SR003H02	155	1-22	271	272
VEGFR-1	SR004C05	174	1-26	273	274	VEGFR-1(FLTI.c31)		479	1-26	n/a	275
VEGFR-1(FLTI.c32)		523	1-26	n/a	276	VEGFR-1(FLTI.c31)		479	1-26	n/a	275
VEGFR-1(FLTI.c32)		523	1-26	n/a	276	VEGFR-1(FLTI.c33)		436	1-26	n/a	277
VEGFR-1(FLT1.c34)		365	1-26	n/a	278	VEGFR-1(FLTI.c33)		436	1-26	n/a	277
VEGFR-1(FLT1.c34)		365	1-26	n/a	278	VEGFR-1(FLT1.c)	SR018C02	541	1-26	n/a	279
VEGFR-1(FLT1.d31)		687	1-26	n/a	280	VEGFR-1(FLT1.c)	SR018C02	541	1-26	n/a	279
VEGFR-1(FLT1.d31)		687	1-26	n/a	280	VEGFR-2	SR015F01	712	1-19	281	282
VEGFR-3	SR015G09	765	1-22	283	284	VEGFR-2	SR015F01	712	1-19	281	282
VEGFR-3	SR015G09	765	1-22	283	284	VEGFR-3	SR007E10	227	1-22	285	286
VEGFR-3	SR007F05	295	1-22	287	288	VEGFR-3	SR007E10	227	1-22	285	286

2.配体同种型

配体同种型是通常与受体(如CSR)相互作用的配体的同种型。配体同种型与野生型和/或优势形式的配体相比可以含有新的结构域和/或功能。配体同种型多肽序列中的缺失、破坏和/或插入与野生型和/或优势形式的配体相比足够改变活性或者与野生型和/或优势形式的配体相比改变结构，如通过去除一个或多个结构域或通过加入结构域或其部分，如基因中的内含子编码的结构域。与野生型和/或优势形式的配体相比，配体同种型的一种或多种活性可以改变。改变的活性包括与一种或多种受体的改变的相互作用和/或此类相互作用导致的信号转导的改变。例如，通过此类改变的活性，配体同种型可以作为野生型配体活性的拮抗剂，如通过竞争性抑制与它的受体的结合。

通常，配体的活性(如受体相互作用)或通过配体的活性发生的过程(例如，信号转导)与野生型和/或优势形式的配体相比改变至少0.1、0.5、1、2、3、4、5或10倍。通常，活性改变10、20、50、100或1000倍或以上。例如，与野生型和/或优势形式的配体相比，同种型可以显示出活性的降低。与野生型和/或优势形式的配体相比，同种型也可以显示出增加的活性。通常，具有几种活性或功能的配体的配体同种型将缺少一种或多种此类活性或功能。例如，一些配体结合到受体，导致级联事件，如信号转导。配体同种型可以结合到受体，但是不能启动事件级联或者在较低的程度上启动事件级联。

示例性配体同种型是生长因子配体同种型。其示例是肝细胞生长因子(HGF)同种型。在一个实例中，HGF同种型的细胞表面相互作用，包括受体相互作用改变。例如，同种型对一种或多种受体，如MET受体的结合亲和力降低。在另一实例中，同种型显示出对一种或多种受体的增加的亲和力。配体同种型，如HGF同种型可以显示出对其他细胞表面分子改变的结合。在一个实例中，同种型对糖胺聚糖(GAG)如肝素或硫酸肝素的结合改变。在另一实例中，同种型对涉及血管发生的其他细胞表面蛋白的结合改变，所述其他细胞表面蛋白为如内皮ATP合酶、angiomotin、αvβ3整联蛋白、膜联蛋白II，和/或任一种或多种生长因子受体，如MET、FGFR或VEGFR。HGF同种型可以在信号转导的一个或多个方面改变。与野生型或优势形式的HGF相比，同种型在一种或多种生物活性的调节中可以改变，所述调节包括诱导、增加、抑制和阻止对受体的细胞应答。可以被HGF同种型改变的细胞应答的实例包括，但不限于，促有丝分裂的、运动因子的、形态发生的和血管发生应答的诱导，和/或信号分子，如参与信号转导途径的信号分子的诱导。

配体同种型，如HGF同种型，也可以调节另一种多肽的活性。受调节的多肽可以是野生型或优势形式的配体，如HGF，或者可以是野生型或优势形式的另一生长因子，如FGF-2或VEGF。例如，HGF同种型也可以调节另一HGF、FGF-2或VEGF同种型，如在疾病或状况中表达的同种型。此类HGF同种型可以通过阻止或抑制野生型或优势形式的生长因子配体/受体对的一种或多种活性而作为负作用配体。负作用配体不必结合或影响受体的配体结合结构域，也不必影响受体的配体结合。

在一个实例中，HGF同种型与另一生长因子配体竞争结合到细胞表面蛋白，该细胞表面蛋白是介导受体二聚化和/或生长因子的血管发生应答必需的。例如，HGF同种型可以与另一生长因子配体竞争结合到肝素或GAG，从而阻止它的受体的配体介导的信号转导所需的二聚体配体的形成。在另一实例中，HGF同种型与另一HGF形式竞争受体结合。此类同种型从而可以结合受体并减少结合到其他HGF多肽的可利用的配体量。结合并竞争HGF的一种或多种受体的HGF同种型可以包括这样的HGF同种型，其不参与信号转导或者与同族HGF相比参与信号转导的能力降低。

示例性配体同种型(包括HGF内含子融合蛋白同种型)包括本文提供的和本领域技术人员已知的配体同种型，包括2005年11月10日提交的美国临时专利申请序号60/735,609和对应的美国申请号(律师卷号17118-045001/2824)和与之同一天申请的国际申请号(律师卷号17118-045WO1/2824PC)中所述的任一种同种型。通常，配体同种型由通过编码配体的基因的选择性剪接产生的核酸分子编码。通常，配体内含子融合蛋白同种型多肽含有连接到编码配体的基因的内含子编码的至少一个氨基酸的配体的至少一个结构域或者通过导入终止密码子的选择性剪接在外显子末端截短，所述终止密码子在剪接时作为内含子中的第一个密码子存在。

表4提供了示例性配体内含子融合蛋白同种型的非限制性实例，包括示例性多肽序列和编码核酸序列的SEQ ID NOS。本领域技术人员可以确定与同种型的同族的全长配体相比，同种型的结构基序的存在或不存在，包括前体或信号序列或其他蛋白质结构域。例如，可以进行同种型与全长同族配体的比对以确定存在或不存在已知存在于同族配体中的信号序列和/或其他结构域。使用此类比对，在表4中列出了示例性配体同种型的信号序列中所含的氨基酸残基。在另一实例中，可以测试同种型的活性，如分泌或受体结合，以确定结构域的活性与全长同族配体相比是否降低和/或消除和/或结构是否改变。如表4中列出的那些配体同种型可以用于融合蛋白中提高配体同种型的产量，如通过分泌。

表4:示例性配体内含子融合蛋白同种型

基因	IFP_ID	AA长度	信号序列	SEQ IDNO:(核酸)	SEQ IDNO:(氨基酸)
基因	IFP_ID	AA长度	信号序列	SEQ IDNO:(核酸)	SEQ IDNO:(氨基酸)	HGF	SR023A02	467	1-31	349	350
HGF	SR023A08	472	1-31	351	352	HGF	SR023A02	467	1-31	349	350
HGF	SR023A08	472	1-31	351	352	HGF	SR023E09	514	1-31	353	354

3.同种型的等位基因变体和物种变体和突变

可以发生或可以产生或鉴定CSR或配体同种型序列的等位基因变体，其与特定CSR或配体同种型有一个或多个氨基酸不同。此类变异包括单个种群中或物种之间等位基因中的变异。

变异包括发生在种群成员中的等位基因变异和发生在物种之间和物种中的物种变异。变异也包括在动物中发生或合成产生的突变。例如，同种型可以来自基因的不同等位基因；每个等位基因可以与另一个等位基因有一个或多个氨基酸差异。此类等位基因可以具有保守和/或非保守氨基酸差异。变异还包括从不同受试者，如个体受试者或动物模型或其他动物产生或鉴定的同种型。氨基酸改变可以导致同种型活性的调节。在一些情况中，氨基酸差异可以是“沉默的”，对活性没有或基本上没有可检测到的影响。也可以通过诱变产生同种型的变体。此类诱变可以是随机或定向的。例如，可以产生等位基因变体同种型，其改变氨基酸序列或潜在的糖基化位点以实现同种型糖基化(包括备选糖基化)的改变，如在同种型中位点上糖基化的增加或抑制。

等位基因同种型和其他变体同种型在序列上可以与同种型有至少90％同一性。通常，来自相同物种的变体同种型与同种型有至少95％、96％、97％、98％、99％同一性，通常等位基因变体与同种型有98％、99％、99.5％同一性。相同蛋白质的物种间和物质中的变异可以为60％、70％、80％、85％、90％、95％、96％、97％、98％、99％和更大。示例性非限制性多肽序列，包括本文提供的同种型的一种或多种等位基因变体在SEQID NO:290-303、429-459或462中给出。CSR或配体同种型的等位基因变体可以包括在本文提供的融合蛋白中并且由本文提供的核酸构建体编码和其表达方法以提高CSR或配体同种型的产量，如通过分泌。

C.同种型融合蛋白的生产

许多治疗蛋白通过合适的原核或真核宿主中重组基因表达产生。这些蛋白质在细胞中产生并从其分离。对于其他的，表达的蛋白质产物在分泌到培养基后分离，或者对于革兰氏阴性细菌的情况，分泌到内部和外部细胞膜之间的周质中后分离。然而，对于许多蛋白质的纯化，分泌率限制了蛋白质产物的总产量。多肽的生产量可以受到多肽的分泌、表达和纯化的影响。

在原核和真核生物中，分泌的蛋白质向分泌途径的进入受到多肽链的N-末端的特定信号肽的指导，所述信号肽在分泌期间被切除。信号肽主要是疏水的，该特征在将新生肽导向膜以将分泌蛋白质经过原核生物的内膜或者真核生物的内质网(ER)膜转移中是重要的。由于原核生物和真核生物信号肽序列中的相似性，信号序列一般适于靶定不同的同源和异源蛋白质的分泌。然而，分泌是多步骤过程，涉及细胞分泌器中的几个元件和信号肽中的特定序列元件(见，例如，Miller et al.，(1998)J.Biol.Chem.273:11409)。因此，取决于所用的具体宿主细胞，不同的信号肽在它们指导分泌的效率中不同。类似地，不同的信号肽在它们指导异源蛋白质的分泌效率中不同。从而，为了蛋白质的有效分泌，必须通过经验确定蛋白质、信号序列和宿主细胞的相容性。

提供了用于制备CSR同种型和/或配体同种型，包括内含子融合蛋白的方法和产品。通过编码多肽的核酸分子的表达产生这些CSR同种型和/或配体同种型，所述多肽连接到导致多肽同种型的提高的产量的序列。本文提供了同种型，其直接或间接融合到任何一种或多种用于改善多肽的分泌和/或纯化的前体序列、标记(包括表位标记)、荧光部分或其他标记。

1.分泌

在宿主细胞中表达的重组多肽在三种区室之一中积累:细胞质、细菌周质，或细胞外培养基。蛋白质向细胞外培养基的有效分泌由于几种原因提供了更容易纯化所述多肽的手段。首先，通常有更少的污染性蛋白质，其简化了纯化方法。而且，细胞外生产不需要膜破坏以回收靶蛋白，并且因此避免了细胞内蛋白酶对重组多肽的蛋白酶解。最后，假定核酸正确融合到信号序列，那么特定信号肽酶、内切蛋白酶或外切蛋白酶切割前体序列后，分泌的多肽的N-末端氨基酸残基可以与天然基因产物相同。

多肽在核糖体上合成后，分泌需要蛋白质以共翻译转运经内质网(ER)转运。许多多肽作为含有前和/或原序列的前蛋白质原或原蛋白质合成。在哺乳动物细胞中，前序列(也称作信号序列)被信号识别颗粒(SRP)的54kDa蛋白质识别，认为SRP将新生链保持转运感受态构象直到它接触ER。SRP由7S RNA和6种不同的多肽组成。哺乳动物SRP的7S RNA和54kDa信号序列结合蛋白(SRP54)与大肠杆菌的4.5S RNA和P48蛋白(Ffh)显示出强烈相似性，大肠杆菌的4.5S RNA和P48蛋白在细菌中形成信号识别颗粒。通常，发生多肽经ER的转运，而它仍然在核糖体上被翻译和合成。在ER膜上，新生蛋白质插入到穿过ER膜的蛋白质通道中。多肽一旦被转运，信号序列从多肽上被切割下来。一些多肽也含有一个或多个原序列，其可以具有不同的功能，如帮助活性多肽的折叠，从而作为分子内蛋白伴侣发挥作用，尽管原序列也可以显示出其他调节功能。当折叠完成时，原序列被内切蛋白酶或外切蛋白酶切除，因为通常原序列对于成熟多肽的活性或稳定性不是必须的。ER也含有其他驻留蛋白伴侣，其也促进多肽蛋白质的折叠。

一旦折叠，蛋白质就被修饰，如通过糖基化修饰，运输到高尔基体用于包装到小泡中，并通过胞吐作用从细胞分泌。多肽的分泌可以组成性发生，其是所有细胞中的默认途径，从而去往质膜的运输小泡在稳定流中离开高尔基体外侧网络用于多肽的胞吐。在一些细胞，如神经细胞或内分泌细胞中，多肽的分泌可以例如受到分选或保留信号的存在的调节，所述信号将多肽靶向分泌小泡用于应答不同类型的刺激而在以后释放。

原核细胞没有细胞器，如ER，但是它们具有结合到质膜的核糖体，其合成分泌的蛋白质用于分泌到革兰氏阴性细菌的质膜和细胞壁之间的空间(周质空间)。此类分泌的蛋白质具有与真核生物分泌的蛋白质相似的N-末端肽序列，所述肽序列在分泌后被切除。通常，分泌的多肽在细胞质中作为早熟多肽合成并在从细胞质运输到周质的过程中在信号肽切割时被转化为成熟多肽。尽管一些分泌的蛋白质可以从周质空间泄漏到培养基中，但是大肠杆菌通常不在细胞外分泌蛋白质。相反，多肽从周质向细胞外培养基的移动需要外膜破坏。除了存在前体序列之外，许多方法已经用于促进多肽从大肠杆菌的细胞外分泌，包括但不限于，溶血素或OmpF融合、kil或tolA的共表达、使用L型细胞、细胞壁减少或细胞壁缺乏的细胞，和/或共表达细菌释放蛋白(BRP)(见例如，Choi et al.，(2004)ApplMicrobiol Biotechnol，64:625)。

通常，多肽的信号肽由三个区域组成:在信号肽的N-末端的含有带正电荷氨基酸残基的氨基末端区(n-区)、多于7-8个疏水氨基酸残基的中间疏水核心(h区)，和包括信号肽切割位点并且为通常极性更高的区域的羧基末端区(c-区)。在真核生物中，n-区的特征电荷由N-末端氨基酸的游离氨基提供，而在原核生物中，N-末端氨基酸被甲酰基化并且需要具有带正电荷侧链的氨基酸。此外，真核生物h区主要是Leu，存在一定的Val、Ala、Phe和Ile，而原核生物h区主要是大概相等比例的Leu和Ala。信号肽从成熟蛋白质的切割在c-区的特定位点发生并且切割特异性位于信号序列的最后的残基。在c-区的-1和-3位的小的和中性氨基酸(通常Ala)赋予加工特异性。除了稍微不同的序列偏爱外，真核生物信号肽比革兰氏阴性信号肽稍短，并且比革兰氏阳性信号明显更短。

已经用多种方法预测哪个N-末端序列可以执行信号肽的功能。例如，广泛使用的算法在Nielsen et al.，(1997)Prot.Eng.10:1中描述。该算法预测哪些序列可以作为信号肽，具有合理的准确性程度。然而，它不预测哪些序列将最有效地发挥功能。此类方法也仅仅能够部分预测信号肽和成熟蛋白质之间接点的切割位点；例如，Nielsen等人的方法仅在89％的原核生物信号序列中正确地预测信号肽的切割位点。实际上，一些信号肽酶尽管按照-3，-1规则偏向于含有共有序列的区域，但是似乎识别未知的三维基序而不是切割位点周围的特定氨基酸序列(Dev和Ray(1990)J BioenergBiomembr 22:271)。

蛋白质分泌效率取决于宿主株系、信号肽和待分泌的蛋白质类型而不同。因此，在为给定重组蛋白质选择合适的信号序列以保证它的成功分泌中没有一般的规则。例如，尽管信号肽中存在相似性，但是每个具有独特的序列。因此，可能在不同的信号肽中发现的多种序列与宿主细胞分泌器以不同的方式相互作用。此外，编码信号肽的序列也通常与成熟蛋白质内的下游序列相互作用。例如，在真核生物中，在成功剪接的成熟蛋白质的前5个氨基酸中偏向于氨基酸Ala、Asp/Glu和Ser/Thr。接近成熟蛋白质的N-末端的带电残基可以不利地影响分泌(称作“电荷阻断”效应，见例如，Johansson et al.，(1993)Mol Gen Genet.239:256)。

因此，用于优化多肽的分泌和表达的信号序列的选择很大程度上是经验性的，因为信号序列在它们促进蛋白质易位的能力中有很大不同，并且通常取决于待表达的多肽。信号序列功能差异的基本原因涉及异源和同源分泌信号之间功效的不同。例如，因为许多蛋白质在生理条件下被调节，所以不希望使用天然内源调节信号，包括信号序列，用于在同源宿主系统中分泌和过表达多肽。在另一实例中，外来信号序列(例如，哺乳动物信号序列)不总是如在异源宿主细胞(例如，昆虫细胞中)那样有效。从而，通常但不总是必须将外来多肽的内源信号序列用来自宿主表达细胞物种的信号序列代替。

也可以通过经验确定使用宿主细胞表达同种型融合物。通常，使用该宿主细胞，其中信号肽与宿主细胞相容。功能信号肽促进多肽的细胞外分泌，接着信号肽从该多肽切除。特异内切蛋白酶允许信号肽被切割以便得到真实的靶序列。重要的是，信号肽被切割的位置可以根据诸如表达重组多肽中使用的宿主细胞的类型等因素而变，这部分是由于存在最适内切蛋白酶。从而，在一些情况中，在具体宿主细胞中使用具体的信号肽可以导致分泌具有不同的N-末端氨基酸的多肽混合物，其是由于信号肽在一个以上的位点被切割引起的。

通常，待使用的信号序列的考虑取决于将用于表达的宿主细胞，尽管一些信号序列与异源宿主相容。例如，对于不识别和处理天然内含子融合蛋白同种型多肽的原核宿主细胞，原核信号序列，如，但不限于，碱性磷酸酶、青霉素酶、或者热稳定的肠毒素II前导序列可以代替内源内含子融合蛋白信号序列或者可以有效连接到不含有功能信号序列的内含子融合蛋白。在另一实例中，对于酵母分泌，酵母转化酶、α因子，或者酸性磷酸酶信号序列可以代替天然内含子融合蛋白同种型信号序列或者可以融合到不含有信号序列的内含子融合蛋白。可以通过使用昆虫信号序列，如但不限于gp67或者蜜蜂蜂毒素代替或提供内含子融合蛋白同种型的信号序列来促进昆虫细胞中同种型多肽的分泌和表达。此外，可以用植物来源的信号序列代替或提供用于在植物中分泌内含子融合蛋白同种型的信号序列。在哺乳动物细胞表达中，尽管内源信号序列如果是有功能的那么是令人满意的，但是其他哺乳动物信号序列，如组织纤溶酶原激活物信号序列可以尤其优良(尤其如果希望分泌同种型)。

在一些实例中，异源信号序列足够并且通常希望用于在宿主细胞中分泌内含子融合蛋白同种型，包括CSR或者配体内含子融合蛋白。对使用交叉宿主分泌信号的考虑包括1)信号序列赋予不同来源(即，原核生物或真核生物)的核酸的分泌；2)信号序列的功能性延伸到其最初宿主之外；和3)多肽的表达和分泌导致可觉察量的功能产物。例如，人生长激素(hGH)信号序列可以促进重组蛋白(包括内含子融合蛋白)在细菌、昆虫和哺乳动物宿主表达系统中的分泌和表达。在另一实例中，人血清白蛋白(hHSA)信号序列可以代替内源信号序列和/或可以为内含子融合蛋白同种型提供功能信号序列以促进同种型多肽在酵母、昆虫和哺乳动物细胞中的表达和分泌。此外，来自组织纤溶酶原激活物的信号序列可以用于介导多肽(包括CSR和配体内含子融合蛋白同种型)在昆虫和哺乳动物细胞中的分泌。示例性信号序列可以包括原核和真核生物信号序列，包括来自植物、细菌、酵母、昆虫的信号序列和哺乳动物信号序列。

示例性多肽前体序列可以包括信号序列并且任选可以包括原序列。原序列编码的前导前肽的组成通常很短并且含有用于被蛋白酶切割的特异切割位点。通常，前肽序列的切割在分泌之前在细胞内发生，如被内切蛋白酶切割，尽管一些多肽如apo Al和肾素原被完整分泌并且被细胞外蛋白酶或外切蛋白酶切割。在一些实例中，原序列被内切蛋白酶和细胞外蛋白酶都切割。例如，组织纤溶酶原激活物(tPA)的原序列在分泌前被细胞中的弗林蛋白酶切割，随后在分泌到细胞外之后被纤溶酶样蛋白酶切割。通常，参与前肽加工的内切蛋白酶如具有KEX或者弗林蛋白酶型活性的那些内切蛋白酶在二碱性残基到三和四碱性信号后切割。尽管切割需求存在许多例外，但是通常前肽切割位点的特征是在-4位的碱性残基。在功能上，前肽序列是多样的并且可以发挥功能以保持多肽的构象，当除去前肽时提供多肽的激活，和/或提供识别位点。其他原序列，如组织纤溶酶原激活物中的原序列不发挥明显的功能并且可以作为进化残余物保留(Berg et al.，(1991)Biochem Biophys Res Comm，179:1289)。示例性前序列在表5中列出。

表5:前序列的实例

前序列	氨基酸序列	SEQIDNO
前序列	氨基酸序列	SEQIDNO	细菌的
来自胡萝卜软腐欧文氏菌(Erwinia carotovora)的PelB(果胶酸裂合酶B)	MKYLLPTAAAGLLLLAAQPAMA	60	细菌的
来自胡萝卜软腐欧文氏菌(Erwinia carotovora)的PelB(果胶酸裂合酶B)	MKYLLPTAAAGLLLLAAQPAMA	60		OmpA(外膜蛋白A)	MKKTAIAIAVALAGFATVAQA	61
StII(耐热肠毒素II)	MKKNIAFLLASMFVFSIATNAYA	62		OmpA(外膜蛋白A)	MKKTAIAIAVALAGFATVAQA	61
StII(耐热肠毒素II)	MKKNIAFLLASMFVFSIATNAYA	62		来自芽孢杆菌(Bacillussp.)的木聚糖内切酶	MFKFKKKFLVGLTAAFMSISMFSATASA	63
PhoA(碱性磷酸酶)	MKSTIALALLPLLFTPVTKA	64		来自芽孢杆菌(Bacillussp.)的木聚糖内切酶	MFKFKKKFLVGLTAAFMSISMFSATASA	63
PhoA(碱性磷酸酶)	MKSTIALALLPLLFTPVTKA	64		OmpF(外膜蛋白F	MMKRNILAVIVPALLVAGTANA	65
PhoE(外膜孔蛋白E)	MKKSTLALVVMGIVASASVQA	66		OmpF(外膜蛋白F	MMKRNILAVIVPALLVAGTANA	65
PhoE(外膜孔蛋白E)	MKKSTLALVVMGIVASASVQA	66		MaIE(麦芽糖结合蛋白)	MKIKTGARILALSALTTMMFSASALA	67
OmpC(外膜蛋白C)	MKVKVLSLLVPALLVAGAANA	68		MaIE(麦芽糖结合蛋白)	MKIKTGARILALSALTTMMFSASALA	67
OmpC(外膜蛋白C)	MKVKVLSLLVPALLVAGAANA	68		Lpp(胞壁质脂蛋白)	MKATKLVLGAVILGSTLLAG	69
脂蛋白(来自粘质沙雷菌(S.marcesens))	MNRTKLVLGAVILGSHSAG	70		Lpp(胞壁质脂蛋白)	MKATKLVLGAVILGSTLLAG	69

前序列	氨基酸序列	SEQIDNO
前序列	氨基酸序列	SEQIDNO		LamB(λ受体蛋白)	MMITLRKLPLAVAVAAGVMSAQAMA	71
OmpT(蛋白酶VII)	MRAKLLGIVLTTPIAISSFA	72		LamB(λ受体蛋白)	MMITLRKLPLAVAVAAGVMSAQAMA	71
OmpT(蛋白酶VII)	MRAKLLGIVLTTPIAISSFA	72		LTB(不耐热肠毒素亚基B)	MNKVKCYVLFTALLSSLYAHG	73
RbsB(核糖体结合蛋白)	MNMKKLATLVSAVALSATVSANAMA	74		LTB(不耐热肠毒素亚基B)	MNKVKCYVLFTALLSSLYAHG	73
RbsB(核糖体结合蛋白)	MNMKKLATLVSAVALSATVSANAMA	74		不耐热毒素亚基A	MKNITFIFFILLASPLYA	75
β-内酰胺酶(来自金黄色葡萄球菌(S.Aureus))	MKKLIFLIVIALVLSACNSNSSHA	76		不耐热毒素亚基A	MKNITFIFFILLASPLYA	75
β-内酰胺酶(来自金黄色葡萄球菌(S.Aureus))	MKKLIFLIVIALVLSACNSNSSHA	76		葡萄球菌A蛋白	MKKKNIYSII2KLGVGIASVTLGTLLISGGVTPAANA	77
青霉素酶	MSIQHFRVALIPFFAAFCLPVFA	78		葡萄球菌A蛋白	MKKKNIYSII2KLGVGIASVTLGTLLISGGVTPAANA	77
青霉素酶	MSIQHFRVALIPFFAAFCLPVFA	78		溶血素	MMKKTITLLTALLPLASAV	79
噬菌体fd基因III	MKKLLFAIPLVVPFYSHS	80		溶血素	MMKKTITLLTALLPLASAV	79
噬菌体fd基因III	MKKLLFAIPLVVPFYSHS	80	酵母
α-交配因子	MRFPSIFTAVLFAASSALA	81	酵母
α-交配因子	MRFPSIFTAVLFAASSALA	81		PHO1(酸性磷酸酶)	MFLQNLFLGFLAVVCANA	82
乳酸克鲁维酵母(K.lactis)杀伤毒素	MLVSDSSVDGGERRSS	83		PHO1(酸性磷酸酶)	MFLQNLFLGFLAVVCANA	82
乳酸克鲁维酵母(K.lactis)杀伤毒素	MLVSDSSVDGGERRSS	83		转化酶	MLLQAFLFLLAGFAAKIS	84

	前序列	氨基酸序列	SEQIDNO
	前序列	氨基酸序列	SEQIDNO		A
植物					A
植物				PR1b(胞外致病相关蛋白，烟草(Nichotianatabacum))	MGFFLFSQMPSFFLVSTLLLFLIISHSSHA	85
昆虫				PR1b(胞外致病相关蛋白，烟草(Nichotianatabacum))	MGFFLFSQMPSFFLVSTLLLFLIISHSSHA	85
昆虫				gp67	MLLVNQSHQGFNKEHTSKMVSAIVLYVLLAAAAHSAFAAG	86
	蜜蜂蜂毒素	MKFLVNVALVFMVVYISYIYA	87	gp67	MLLVNQSHQGFNKEHTSKMVSAIVLYVLLAAAAHSAFAAG	86
	蜜蜂蜂毒素	MKFLVNVALVFMVVYISYIYA	87	EGT(蜕皮甾类UDP-葡萄糖转移酶)	MTILCWLALLSTLTAVNA	88
哺乳动物				EGT(蜕皮甾类UDP-葡萄糖转移酶)	MTILCWLALLSTLTAVNA	88
哺乳动物				tPA(组织纤溶酶原激活物)前序列	MDAMKRGLCCVLLLCGAVFVSPS	89
	tPA前/原序列	MDAMKRGLCCVLLLCGAVFVSPSQEIHARFRRGAR	2	tPA(组织纤溶酶原激活物)前序列	MDAMKRGLCCVLLLCGAVFVSPS	89
	tPA前/原序列	MDAMKRGLCCVLLLCGAVFVSPSQEIHARFRRGAR	2	pap(人胎盘碱性磷酸酶)	MLLLLLLLGLRLQLSLG	90
	hGH(人生长激素)	MATGSRTSLLLAFGLLCLPWLQEGSA	91	pap(人胎盘碱性磷酸酶)	MLLLLLLLGLRLQLSLG	90
	hGH(人生长激素)	MATGSRTSLLLAFGLLCLPWLQEGSA	91	hHSA(人血清白蛋白)	MKWVTFISLLFLFSSAYS	92
	人前列腺酸性磷酸酶	MRAAPLLLARAASLSLGF	93	hHSA(人血清白蛋白)	MKWVTFISLLFLFSSAYS	92

	前序列	氨基酸序列	SEQIDNO
	前序列	氨基酸序列	SEQIDNO			LFLLFFWLDRSVLA

2.纯化和/或检测

通常需要纯化多肽来以可觉察的量产生多肽用于研究和治疗用途。多肽纯化中的考虑因素包括减小纯化的制备物中污染物质的存在。在纯化期间发生的污染物质的来源可以包括起始样品中的其他多肽、核酸、糖类、脂类或任何其他物质。此外，多肽最佳地在纯化后保留生物活性。

通常，多肽的纯化依赖于其他多肽或潜在污染物质之间的内在相似性和不同。例如，用多肽相似性从其他非多肽污染物纯化多肽。相比，多肽中的差异，如大小、形状、电荷、疏水性、溶解度或生物活性的不同用于从其他多肽纯化多肽。纯化技术的实例包括但不限于，免疫亲和层析、亲和层析、蛋白质沉淀、离子交换层析、疏水相互作用层析，和大小排阻层析。

将“标记”附着到多肽可以方便重组多肽纯化和/或检测。编码多肽标记的核酸可以直接融合到核酸的其羧基或氨基末端编码末端以产生经标记的多肽。通常，特定标记的编码序列可以与核酸分子的编码序列(如编码同种型，如内含子融合蛋白同种型的编码序列)在框内剪接以产生嵌合多肽，其中当表达时，该标记融合到同种型多肽。所述标记可以用于检测和/或有效纯化多肽而不需要知道多肽或针对该多肽的抗体或者其他此类试剂的性质。一些标记可以编码表位，其可以通过特异抗体纯化或检测。通过它们的性质，表位可以简化所希望的多肽的纯化。例如，表位可以通过为结合到结合基质如柱子或珠子、用亲和配体固定提供已知的表位而方便多肽的亲和纯化。通过将溶液，如细胞培养基穿过亲和柱(其中柱基质对标记具有高亲和力)，可以以一步方法纯化在其羧基或氨基末端含有标记的多肽。

标记可以包括明确的肽(例如，多聚-His、Flag表位或c-myc表位或HA-标记)或小蛋白质(细菌GST、MBP、硫氧还蛋白、b-半乳糖苷酶或者VSV-糖蛋白)的短片段。在一个实例中，标记可以包括产生寡聚-标记的多个多肽。例如，可以制备寡聚组氨酸(多聚-His)标记，其由一串组氨酸残基，如1、2、3、4、5、6、7、8、9、10或更多组氨酸残基组成。在一个实施方案中，可以使用标记特异性抗体监测融合多肽的表达，允许研究多肽而不用产生针对该多肽的新的特异性抗体。表位标记可以用于定位活细胞中的基因产物，鉴定细胞中相关蛋白或追踪融合蛋白的移动。在另一实施方案中，许多标记具有它们自身的结合特征，其可以用于纯化目的。例如，多聚-His融合蛋白可以结合到镍-琼脂糖(Nickel-Sepharose)或镍-HRP。GST-融合蛋白可以结合到谷胱甘肽琼脂糖(Sepharose)。GST融合标记在细菌宿主细胞表达系统中尤其有效，因为GST同种型通常不在细菌中发现，并且从而没有来自内源细菌蛋白质对结合谷胱甘肽纯化树脂的竞争。在另一实例中，可以使用泛蛋白标记或SUMO标记，其除了方便纯化外，也作为促进多肽的正确折叠的蛋白伴侣。

标记也可以是标记物，如发光或荧光蛋白和/或可被检测用于多肽的定位和/或纯化的任何其他蛋白质或酶。在一方面，同种型融合可以包括有效连接到核酸同种型(包括CSR或配体内含子融合蛋白)的编码发光和/或荧光蛋白的核酸序列。发光和/或荧光多肽方便多肽的检测、纯化和/或细胞定位。在本文考虑多种分子，如发出可检测光的蛋白质，包括萤光素、绿色荧光蛋白和红色荧光蛋白。多种可检测化合物的任一种可以使用，并且可以通过多种已知的成像方法的任一种成像用于检测或纯化多肽，所述成像方法为例如通过使用荧光计、荧光激活细胞分选仪(FACS)，和/或荧光显微术。在表6中列出了示例性融合标记，包括表位标记、荧光部分或用于检测和/或纯化多肽的其他部分。

表6:融合标记的实例

标记	ACC#	序列	SEQ IDNO
标记	ACC#	序列	SEQ IDNO	AU1	DTYRYI	94
AU5		TDFYLK	95	AU1	DTYRYI	94

标记	ACC#	序列	SEQ IDNO
标记	ACC#	序列	SEQ IDNO	白
链球菌G蛋白	P06654	-	116	白
链球菌G蛋白	P06654	-	116	GFP	AAA27721	-	117
Sumo	AAC50996	-	118	GFP	AAA27721	-	117
Sumo	AAC50996	-	118	泛蛋白	P62988	-	119
NusA	P03003	-	120	泛蛋白	P62988	-	119
NusA	P03003	-	120	Streptag		AWRHPQFGG	121
硫氧还蛋白	NP_418228	-	122	Streptag		AWRHPQFGG	121
硫氧还蛋白	NP_418228	-	122	GST	P08515	-	123
FLAG	-	DYKDDDDK	124	GST	P08515	-	123
FLAG	-	DYKDDDDK	124	C蛋白	-	EDQVDPRLIDGK	125
Tag-100	-	EETARFQPGYRS	126	C蛋白	-	EDQVDPRLIDGK	125
Tag-100	-	EETARFQPGYRS	126	T7基因10		DLYDDDDK	127

含有一个或多个融合标记的同种型多肽可以直接用于生物学研究和/或可以直接注射到动物中产生抗体或用于其他体内用途。在这些标记中包括His标记，其相对较小(即小于10个氨基酸)，并且因此比其他较大的标记免疫原性更低。此外，因为它的小的尺寸，His标记可以不必被除去以用于纯化多肽的下游应用。对于其他目的，如治疗用途，和对于使用可以干扰多肽功能的一些较大的融合标记，可以在多肽纯化后通过用酶处理除去融合标记而产生无标记的重组多肽同种型。在一个实例中，泛蛋白(Ub)标记可以融合到同种型序列并且在表达和纯化同种型多肽后，可以用去泛蛋白化酶(DUBs)除去Ub以产生天然多肽。在另一实例中，可以用SUMO蛋白酶从同种型多肽融合物除去SUMO标记。在额外实例中，可以工程化融合多肽以编码位点特异性蛋白酶的识别位点。例如，可以将人鼻病毒(HRV 3C)蛋白酶识别位点LeuGluValLeuPheGln/GlyPro(SEQ ID NO:138)工程化到融合蛋白中位于编码标记的核酸和目的编码核酸之间。一旦融合多肽结合到亲和基质，就可以将含有标记(例如，但不限于His标记、S-标记、硫氧还蛋白、GST、NusA或任何其他融合标记)和HRV 3C蛋白酶识别位点的融合多肽与HRV 3C蛋白酶温育以释放所述多肽。其他蛋白酶识别位点，包括但不限于，凝血酶(R/X或K/X；SEQ ID NO:133)，肠激酶(DDDDK/；SEQ ID NO:134)，TEV-蛋白酶(ENLYFQ/G；SEQ ID NO:135)，因子Xa(I(D或E)GR/；SEQ ID NO:136)，Genease I(HYE或HYD；SEQID NO:137)或本领域技术人员已知的任何其他蛋白酶识别位点可以被工程化到含有标记的融合多肽中用于被位点特异性蛋白酶识别和释放无标记的多肽。在一些情况中，可以将蛋白酶识别位点工程化为与纯化标记相邻，接着是融合标记和目的多肽之间的接头。

D.同种型融合物

本文提供了编码内含子融合蛋白融合多肽(包括CSR和配体同种型)的核酸序列，其用于产生内含子融合蛋白同种型和编码的蛋白质。DNA融合构建体可以包括编码信号的核酸和其他加工序列以及标记和其他部分，它们方便表达和生产和/或纯化。编码同种型融合物的融合构建体可以在细胞内加工并且也可以在细胞外加工。

为了产生构建体，编码内含子融合蛋白的核酸，如编码SEQ ID NO:140、142、143、145、147、149、150、152、153、155、157、159、161、162、163、164、165、166、167、168、170、172、174、176、178、180、181、183、185、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、217、219、221、223、225、227、229、230、231、233、235、237、239、241、243、245、247、248、249、250、251、253、255、257、259、261、263、264、265、266、267、268、269、270、272、274-280、282、284、286、288、289、350、352、354的任一个中给出的序列的全部或部分的核酸，或其等位基因变体，可以融合到编码编码同源或异源前体序列的核酸，所述前体序列代替和/或提供功能性分泌、加工和/或运输序列。示例性编码的前体序列在SEQ ID NO:2或60-93任一个中给出。在一个实例中，含有天然或内源前体序列，如同族受体或配体的信号序列的内含子融合蛋白同种型可以将其前体序列用异源或同源前体序列补充或代替以指导同种型多肽的分泌和产生。在另一实例中，可以为不含有同族受体或配体的前体序列的内含子融合蛋白同种型提供异源或同源前体序列，所述异源或同源前体序列融合到同种型序列，以提高同种型多肽的分泌和生产量。典型地，通常(在其天然形式)含有信号序列的同种型在含有异源前体序列的融合多肽中不包括该序列。前体序列通常通过定位在将从宿主细胞分泌的重组蛋白的N-末端而被利用。核酸前体序列可以以这样的方式结合或连接到含有CSR或配体同种型的编码区的核酸，使得前体序列编码区位于同种型编码区的上游(即5’)并且与同种型编码区处于相同的读框中以提供同种型融合物。

编码多肽接头的核酸序列可以用于融合蛋白中以将前体序列连接到配体或CSR同种型。连接可以是直接的或者通过接头连接。这种多肽接头通常含有约2或2到约60或60个氨基酸残基，例如，约5到40，或约10到30，2到6，7或8个氨基酸残基。接头可以用于例如减轻位阻或者赋予性质，例如，改变的溶解度或者指导或参与运输。接头还可以用于引入限制酶序列，其用于方便核酸序列的直接连接以产生融合蛋白。此类限制酶接头在本文中描述并且是本领域已知的。所选接头的长度取决于几种因素，如所包括的接头的用途。

此类编码的多肽接头可以用于赋予有利的性质。例如，接头部分可以是柔性间隔区氨基酸序列，如单链抗体中使用的柔性间隔区氨基酸序列。已知的接头部分的实例包括，但不限于，肽，如(GlymSer)n和(SermGly)n，其中n为1到6，包括1到4和2到4，m为1到6，包括1到4，和2到4，酶可切割的接头、用于运输的接头等等。

同种型融合物可以在宿主细胞，如真核细胞中表达以提供融合多肽，该融合多肽含有前体序列，该前体序列在其羧基末端连接到配体或CSR同种型的氨基末端。融合多肽可以从宿主细胞分泌。通常，前体序列在分泌过程期间从融合多肽切除，导致在细胞外环境中或者在一些情况在，在周质空间中积累分泌的同种型。

任选地，为融合核酸的内含子融合蛋白也可以包括与另一个或多个核酸序列(如编码SEQ ID NO:94-127任一个给出的标记的核酸序列)有效连接，所述核酸序列方便同种型多肽的纯化和/或检测。在其他实施方案中，CSR或配体内含子融合蛋白的核酸序列可以含有内源信号序列并且可以包括与编码一个或多个融合标记的核酸序列的融合。许多前体序列，包括信号序列和原序列，和/或融合标记序列已经被鉴定并且是本领域已知的，如但不限于，本文提供和描述的那些，并且被考虑与同种型核酸分子结合使用。前体序列可以与同种型基因或cDNA是同源或异源的，或者可以化学合成前体序列。在多数情况中，同种型多肽通过信号肽和/或前肽的存在从宿主细胞的分泌导致从分泌的内含子融合蛋白多肽除去信号肽或前肽。前体序列可以是表达载体的组分，或者它可以是插入到表达载体的同种型核酸序列的部分。

所以，宿主细胞对融合核酸的表达可以提供同种型融合蛋白，其含有额外的氨基酸，所述额外氨基酸不会不利地影响信号肽的分泌功能和/或纯化的同种型蛋白的活性。例如，额外的氨基酸可以包括在融合蛋白中，所述氨基酸隔开信号肽与同种型蛋白质以便在融合蛋白中提供有利的空间构型，其促进分泌过程。可以作为分离子的此类额外氨基酸的数目可以不同，并且通常不超过60个氨基酸。在另一实例中，融合蛋白可以含有限制酶接头序列编码的氨基酸残基。在额外实例中，同种型融合蛋白可以在信号肽和/或表位的氨基酸和同种型蛋白质的氨基酸序列之间的一个或多个接点含有选择性切割位点。此类选择性切割位点可以包含一个或多个氨基酸残基，其提供对选择性酶促、蛋白酶解、化学或其他切割敏感的位点。例如，所述额外的氨基酸可以是被位点特异性蛋白酶切割的识别位点。例如，如果需要没有额外氨基酸的同种型蛋白，那么融合蛋白可以被进一步加工以从其切割同种型蛋白。

1.示例性tPA分泌序列

用于连接到同种型的信号多肽的实例是tPA前体序列，其在真核细胞中可以指导所连接的多肽的分泌和其他运输。

组织纤溶酶原激活物

组织纤溶酶原激活物(tPA)是丝氨酸蛋白酶，其通过将酶原纤溶酶原转化为其活化形式纤溶酶而调节止血。像其他丝氨酸蛋白酶一样，tPA作为无活性的酶原合成和分泌，所述酶原被蛋白酶解过程活化。特别地，tPA的成熟的部分活性单链酶原形式可以通过纤溶酶、组织激肽释放酶或因子Xa催化的在SEQ ID NO:4的Arg-310后的切割被进一步加工成两条链的完全活性形式。tPA通过血块周围区域中的内皮细胞分泌到血液中，所述区域是富含纤维蛋白的区域。tPA调节纤维蛋白溶解，这是由于它对于纤溶酶原向纤溶酶(纤维蛋白凝块的调节物)转化的高度催化活性。纤溶酶也是丝氨酸蛋白酶，其当被tPA切割其酶原形式时转化为催化活性的两条链形式。纤溶酶通过切割多个位置的纤维蛋白网而降解血块的纤维蛋白网络，导致产生循环片段，所述片段被其他蛋白酶或被肾和肝脏清除。

t-PA的前体序列编码包括前序列和原序列的多肽，所述原序列对应于SEQ ID NO:4中给出的全长tPA序列的氨基酸1-35并且在SEQ ID NO:2中示例。tPA的前体序列含有包括氨基酸1-23的信号序列并且也含有包括氨基酸1-35的原序列，所述原序列含有两个切割序列，导致原序列可以包括SEQ ID NO:2或4中给出的示例性tPA前/原序列的氨基酸24-35、24-32和33-35。tPA的信号序列在ER中被共翻译地切割并且在高尔基体中通过在SEQ ID NO:2或4中给出的示例性序列的氨基酸29-32发生的序列RFRR后的弗林蛋白酶加工位点的切割而被去除。tPA原序列的弗林蛋白酶切割保留三个氨基酸的原序列GAR，其如SEQ ID NO:2或4中给出的示例性tPA序列的氨基酸33-35给出。所保留的原序列位点的切割通过纤溶酶样细胞外蛋白酶介导以得到在SEQ ID NO:4中给出的Ser36开始的成熟tPA多肽。培养基中蛋白酶抑制剂如抑酶肽的包括可以防止外肽酶切割从而在tPA的成熟多肽中保留GAR原序列(Berg et al.，(1991)BiochemBiophys Res Comm，179:1289)。

典型地，tPA通过组成型分泌途径分泌，尽管在一些细胞中，tPA以受调节的方式分泌。例如，在内皮细胞中，tPA的受调节的分泌在内皮细胞活化(例如，通过组胺、血小板活化因子或嘌呤核苷酸)后被诱导，并且需要内皮内Ca2+和cAMP信号转导(Knop et al.，(2002)Biochem BiophysActa 1600:162)。在其他细胞中，如神经细胞中，可以诱导tPA分泌的特定刺激包括锻炼、精神紧张、电惊厥疗法和手术(Parmer et al.，(1997)J BiolChem 272:1976)。介导tPA的受调节的分泌的机理需要tPA多肽自身的信号，而tPA的信号序列有效介导tPA的组成型分泌，因为仅仅有效连接到tPA的信号序列的GFP分子在不存在氨甲酰胆碱刺激时组成型分泌(Lochner et al.，(1998)Mol Biol Cell，9:2463)。不存在tPA信号序列时，tPA/GFP杂合蛋白不从细胞分泌。

包括tPA的前/原肽序列的示例性tPA前体序列在SEQ ID NO:2中给出，并且由SEQ ID NO:1中给出的核酸序列编码。tPA的信号序列包括SEQ ID NO:2的氨基酸1-23，并且原序列包括SEQ ID NO:2的氨基酸24-35，而弗林蛋白酶切割的原序列包括氨基酸24-32并且纤溶酶样外切蛋白酶切割的原序列包括氨基酸33-35。tPA前/原序列的等位基因变体也在本文中提供，如SEQ ID NO:6中给出的那些，并且由SEQ ID NO:5中给出的核酸序列编码。此外，考虑哺乳动物和非哺乳动物来源的tPA的前/原序列的内含子人融合蛋白融合物，并且示例性序列在SEQ ID NO:52-59中给出。

本文提供了融合到编码前体序列的核酸序列的核酸分子和构建体，所述核酸分子和构建体编码含有CSR或配体同种型的tPA内含子融合蛋白融合多肽，如内含子融合蛋白。本文提供的此类内含子融合蛋白序列可以显示出内含子融合蛋白多肽的增强的细胞表达和分泌用于提高产量。

2.tPA-内含子融合蛋白和其他CSR融合物

本文提供了编码含有CSR或配体同种型的tPA内含子融合蛋白融合多肽，如内含子融合蛋白的核酸分子和构建体。提供了核酸序列，其编码内含子融合蛋白或其等位基因变体的全部或部分，如编码有效连接到tPA前/原序列的SEQ ID NO:140、142、143、145、147、149、150、152、153、155、157、159、161、162、163、164、165、166、167、168、170、172、174、176、178、180、181、183、185、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、217、219、221、223、225、227、229、230、231、233、235、237、239、241、243、245、247、248、249、250、251、253、255、257、259、261、263、264、265、266、267、268、269、270、272、274-280、282、284、286、288、289、350、352、354的任一个中给出的同种型或其等位基因变体。tPA前/原序列可以包括SEQ ID NO:1中给出的tPA前/原序列并编码SEQ ID NO:2中给出的多肽。在一些实例中，tPA前/原序列可以代替内含子融合蛋白的内源前体序列和/或为内含子融合蛋白多肽的分泌提供最佳的前体序列。

在其他实施方案中，编码内含子融合蛋白或其等位基因变体的全部或部分，如编码SEQ ID NO:140、142、143、145、147、149、150、152、153、155、157、159、161、162、163、164、165、166、167、168、170、172、174、176、178、180、181、183、185、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、217、219、221、223、225、227、229、230、231、233、235、237、239、241、243、245、247、248、249、250、251、253、255、257、259、261、263、264、265、266、267、268、269、270、272、274-280、282、284、286、288、289、350、352、354的任一个给出的同种型或其等位基因变体的核酸可以有效连接到tPA前/原序列的部分，其包括直到tPA前/原序列的弗林蛋白酶切割位点的核酸序列(编码SEQ ID NO:2中给出的示例性tPA前-原序列的氨基酸1-32)，从而排除编码氨基酸GAR的核酸(编码SEQ ID NO:2中给出的示例性tPA前-原序列的氨基酸33-35)。

此外，编码内含子融合蛋白或其等位基因变体的全部或部分，如编码SEQ ID NO:140、142、143、145、147、149、150、152、153、155、157、159、161、162、163、164、165、166、167、168、170、172、174、176、178、180、181、183、185、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、217、219、221、223、225、227、229、230、231、233、235、237、239、241、243、245、247、248、249、250、251、253、255、257、259、261、263、264、265、266、267、268、269、270、272、274-280、282、284、286、288、289、350、352、354的任一个给出的同种型或其等位基因变体的核酸序列可以包括与tPA前/原序列的全部或部分的等位基因变体(如编码SEQ ID NO:5中给出的任何等位基因变体)的有效连接，或者可以包括与哺乳动物和非哺乳动物来源的其他tPA前/原序列的全部或部分(如编码SEQ ID NO:52-59的任一个中给出的tPA前/原序列)的有效连接。本文提供的内含子融合蛋白-tPA前/原融合序列可以显示出内含子融合蛋白多肽的增强的细胞表达和分泌以提高生产量。

在另一实施方案中，编码内含子融合蛋白或其等位基因变体的全部或部分，如编码SEQ ID NO:140、142、143、145、147、149、150、152、153、155、157、159、161、162、163、164、165、166、167、168、170、172、174、176、178、180、181、183、185、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、217、219、221、223、225、227、229、230、231、233、235、237、239、241、243、245、247、248、249、250、251、253、255、257、259、261、263、264、265、266、267、268、269、270、272、274-280、282、284、286、288、289、350、352、354的任一个给出的同种型或其等位基因变体的核酸序列可以包括与仅仅tPA前/原序列的前序列(信号序列)(如编码SEQ ID NO:2中给出的示例性tPA前/原序列的氨基酸1-23的示例性信号序列)的有效连接。本文提供的内含子融合蛋白-tPA前序列融合物可以显示出内含子融合蛋白多肽的增强的细胞表达和分泌以提高生产量。

在额外实施方案中，编码内含子融合蛋白或其等位基因变体的全部或部分，如编码SEQ ID NO:140、142、143、145、147、149、150、152、153、155、157、159、161、162、163、164、165、166、167、168、170、172、174、176、178、180、181、183、185、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、217、219、221、223、225、227、229、230、231、233、235、237、239、241、243、245、247、248、249、250、251、253、255、257、259、261、263、264、265、266、267、268、269、270、272、274-280、282、284、286、288、289、350、352、354的任一个给出的同种型或其等位基因变体的含有同族受体或配体的内源信号序列的核酸序列可以包括与tPA原序列的融合，其中tPA原序列插入在内含子融合蛋白内源信号序列和内含子融合蛋白编码序列之间。在一个实例中，tPA原序列包括编码如SEQ ID NO:2给出的示例性tPA前/原序列的氨基酸24-32的核酸序列。在另一实例中，tPA原-序列包括编码如SEQ ID NO:2给出的示例性tPA前/原序列的氨基酸33-35的核酸序列。在额外实例中，tPA原序列包括编码如SEQ ID NO:2给出的示例性tPA前/原序列的氨基酸24-35的核酸序列。其他tPA原序列可以包括编码如SEQ ID NO:5给出的tPA前/原序列的等位基因变体或SEQ IDNO:52-59任一个中给出的物种变体的氨基酸24-32、33-35或24-35的核酸序列。本文提供的内含子融合蛋白tPA原序列融合物可以显示出内含子融合蛋白多肽的增强的细胞表达和分泌以提高生产量。

此外，编码内含子融合蛋白或t-PA内含子融合蛋白，如内含子融合蛋白-tPA前/原序列融合物、内含子融合蛋白-tPA前序列融合物，和/或内含子融合蛋白-tPA原序列融合物的核酸也可以任选包括方便内含子融合蛋白多肽的纯化和/或检测的一种、两种、三种或多种标记。通常，特定标记的编码序列可以在氨基或羧基末端(有或没有接头区)与编码内含子融合蛋白多肽的核酸分子的编码序列符合读框地剪接。当融合是在序列的氨基末端时，融合标记可以置于内源或异源前体序列之间。在一个实施方案中，编码标记，如c-myc标记、8 X His标记或本领域技术人员已知的任何其他融合标记或者SEQ ID NO:94-127之一给出的标记的核酸可以置于内含子融合蛋白内源信号序列和内含子融合蛋白编码序列之间。在另一实施方案中，融合标记可以置于编码异源前体序列，如tPA前/原序列、前序列或者SEQ ID NO:2中给出的原序列的核酸序列和内含子融合蛋白编码序列之间。在其他实施方案中，融合标记可以直接置于编码内含子融合蛋白融合多肽序列的核酸的羧基末端上。在一些情况中，内含子融合蛋白融合物可以在内源或异源前体序列和融合标记之间含有接头。含有本文提供的一个或多个融合标记的内含子融合蛋白融合物(包括内含子融合蛋白-tPA融合物)可以促进更容易检测和/或纯化内含子融合蛋白多肽用于提高生产量。

a.FGFR-2 tPA-内含子融合蛋白融合物

本文提供了FGFR-2的同种型，其含有t-PA的前/原序列的全部或部分和任选地用于提高FGFR-2内含子融合蛋白多肽的生产量的c-myc融合标记。FGFR-2是成纤维细胞生长因子受体家族成员。FGFR-2的配体包括许多FGF蛋白质，如但不限于，FGF-1(碱性FGF)、FGF-2(酸性FGF)、FGF-4和FGF-7。FGF受体在发育期间的组织重塑以及成年组织中细胞稳态中参与细胞-细胞通信。FGFR-2的过表达或突变已经与过增生疾病有关，所述疾病包括多种人类癌症，包括乳腺、胰腺、结直肠的、膀胱和宫颈恶性肿瘤。FGFR-2同种型，如FGFR-2内含子融合蛋白可以用于治疗其中FGF受到上调的疾病，包括癌症。

FGFR-2蛋白质(GenBank No.NP_000132，如SEQ ID NO:411中给出)的特征是氨基酸1-21之间的信号序列。FGFR-2也含有三个免疫球蛋白样结构域:氨基酸41-125之间的结构域1，氨基酸159-249之间的结构域2，和氨基酸256-360之间的结构域3。FGFR-2也含有氨基酸378-400之间的跨膜结构域和氨基酸481-757之间的蛋白激酶结构域。

示例性FGFR-2同种型包括SEQ ID NO:178和180中给出的FGFR-2同种型。这些示例性FGFR-2同种型与SEQ ID NO:411中给出的同族FGFR-2相比缺少一个或多个结构域或其部分。如SEQ ID NO:180中给出的示例性FGFR-2同种型含有氨基酸1-21的信号肽，和三个免疫球蛋白样结构域:氨基酸41-125之间的结构域1，氨基酸159-249之间的结构域2，和氨基酸256-360之间的结构域3，但是缺少跨膜和蛋白激酶结构域。如SEQ ID NO:178中给出的示例性FGFR-2同种型含有氨基酸1-21的信号肽，氨基酸44-134之间的免疫球蛋白样结构域2和氨基酸141-245之间的结构域3，但是不含有免疫球蛋白样结构域1、跨膜结构域，或者蛋白激酶结构域。

FGFR-2同种型，包括本文的FGFR-2同种型，可以包括FGFR-2同种型多肽中的等位基因变异。例如，FGFR-2同种型可以包括同族FGFR-2的等位基因变体中存在的一个或多个氨基酸差异。在一个实例中，FGFR-2的等位基因变体与SEQ ID NO:411相比含有一个或多个氨基酸改变。例如，在FGFR-2的免疫球蛋白结构域中可以发生一个或多个氨基酸变异。等位基因变体可以包括105位的氨基酸改变，其中例如，Y可以被C代替，或者在162位的氨基酸改变，其中例如，M可以被T代替，或者172位的氨基酸改变，其中例如，A可以被F代替，或者186位(SNP NO:755793)的氨基酸改变，其中例如，M可以被T代替，或者267位的氨基酸改变，其中例如，S可以被P代替，或者276位的氨基酸改变，其中例如，F可以被V代替，或者278位的氨基酸改变，其中例如，C可以被F代替，或者281位的氨基酸改变，其中例如，Y可以被C代替，或者289位的氨基酸改变，其中例如，Q可以被P代替，或者290位的氨基酸改变，其中例如，W可以被C代替，或者315位的氨基酸改变，其中例如，A可以被S代替，或者338位的氨基酸改变，其中例如，G可以被R代替，或者340位的氨基酸改变，其中例如，Y可以被H代替，或者341位的氨基酸改变，其中例如，T可以被P代替，或者342位的氨基酸改变，其中例如，C可以被R、Y、S、F或W代替，或者344位的氨基酸改变，其中例如，A可以被P或G代替，或者347位的氨基酸改变，其中例如，S可以被C代替，或者351位的氨基酸改变，其中例如，S可以被C代替，或者354位的氨基酸改变，其中例如，S可以被C代替。氨基酸改变的其他实例可以在跨膜结构域中发生。等位基因变体可以包括384位的氨基酸改变，其中例如G可以被R代替。额外的氨基酸改变也可以发生在蛋白激酶结构域中。等位基因变体可以包括549位的氨基酸改变，其中例如，N可以被H代替，或者565位的氨基酸改变，其中例如，E可以被G代替，或者641位的氨基酸改变，其中例如，K可以被R代替，或者659位的氨基酸改变，其中例如，K可以被N代替，或者663位的氨基酸改变，其中例如，G可以被E代替，或者678位的氨基酸改变，其中例如，R可以被G代替。等位基因变异也可以发生在第6位，其中例如，R可以被P代替，或者31位，其中例如，T可以被I代替，或者152位，其中例如，R可以被G代替，或者252位，其中例如，S可以被W或L代替，或者253位，其中例如，P可以被S或R代替，或者372位，其中例如，S可以被C代替，或者375位，其中例如，Y可以被C代替。含有上述一个或多个氨基酸改变的示例性FGFR-2等位基因变体在SEQ ID NO:444中给出并且FGFR-2同种型可以包括如SEQ ID NO:444中给出的任何一个或多个等位基因变异。FGFR-2同种型中的等位基因变异可以包括免疫球蛋白结构域中的一个或多个氨基酸改变，如105、162、172、186、267、276、278、281、289、290、315、338、340、341、342、344、347、351或354位的氨基酸改变。额外的等位基因变异可以包括一个或多个氨基酸改变，如6、31、152、252或253位的氨基酸改变。

本文提供的FGFR-2同种型，或其等位基因变体可以包括与tPA的融合，如用tPA前/原序列的全部或部分代替内源信号序列。对于本文提供的如SEQ ID NO:178或180的示例性FGFR-2同种型，FGFR-2同种型的氨基酸1-22，包括含有氨基酸1-21的内源信号序列可以被tPA前/原序列(如SEQ ID NO:2给出的示例性tPA前/原序列并且由如SEQ ID NO:1给出的tPA前/原序列编码)代替。例如，SEQ ID NO:39中给出的示例性tPA-FGFR-2内含子融合蛋白融合物的核酸序列(编码SEQ ID NO:40中给出的多肽)可以包括编码SEQ ID NO:178中给出的FGFR-2同种型的氨基酸23-281的核酸序列，其有效连接到含有tPA前/原序列的序列的5’末端(SEQ ID NO:39的核苷酸1-105)和含有Xho I限制酶接头位点的序列(SEQID NO:39的核苷酸136-141)。任选地，SEQ ID NO:39中给出并且编码SEQID NO:40中给出的多肽的示例性tPA-FGFR-2内含子融合蛋白融合物的序列也可以包括如核苷酸106-135给出的myc表位标记，该标记有效融合在tPA前/原序列和Xho I接头位点之间。在另一实例中，SEQ ID NO:35中给出的编码SEQ ID NO:36中给出的多肽的示例性tPA-FGFR-2内含子融合蛋白融合物的核酸序列可以包括编码SEQ ID NO:180中给出的FGFR-2同种型的氨基酸23-396的核酸序列，该核酸序列有效连接到含有tPA前/原序列的序列的5’末端(SEQ ID NO:35的核苷酸1-105)和含有XhoI限制酶接头位点的序列(SEQ ID NO:35的核苷酸136-141)。任选地，SEQID NO:35中给出的编码SEQ ID NO:36中给出的多肽的示例性tPA-FGFR-2内含子融合蛋白融合物的核酸序列也可以包括如核苷酸106-135给出的myc表位标记，其有效融合在tPA前/原序列和Xho I接头位点之间。

b.FGFR-4-tPA内含子融合蛋白融合物

本文提供了含有tPA的前/原序列的全部或部分和任选地myc融合标记的FGFR-4同种型，用于提高FGFR-4内含子融合蛋白多肽的生产量。FGFR-4是FGF受体酪氨酸激酶家族成员。FGFR-4调节在一些癌细胞中被修饰。例如，在一些腺癌中，FGFR-4与正常成纤维细胞中的表达相比被下调。FGFR-4的备选形式在一些肿瘤细胞中表达。例如，ptd-FGFR-4缺少FGFR-4细胞外结构域的部分但是含有第三个Ig样结构域、跨膜结构域和激酶结构域。该同种型在垂体肿瘤中被发现并且是致瘤的。FGFR-4同种型可以用于治疗其中FGFR-4被失调的疾病和状况。例如，FGFR-4同种型可以用于下调致瘤性FGFR-4同种型，如ptd-FGFR-4。

FGFR-4蛋白质(GenBank No.NP_002002，如SEQ ID NO:413中给出)的特征是氨基酸1-24之间的信号序列。FGFR-4也含有三个免疫球蛋白样结构域:氨基酸35-113之间的结构域1、氨基酸152-242之间的结构域2、和氨基酸249-351之间的结构域3。FGFR-4也含有氨基酸370-386之间的跨膜结构域和氨基酸467-743之间的蛋白激酶结构域。

示例性FGFR-4同种型与如SEQ ID NO:413中给出的同族FGFR-4相比缺少一个或多个结构域或其部分。如SEQ ID NO:185中给出的示例性FGFR-4同种型含有氨基酸1-24之间的信号肽、氨基酸35-113之间的免疫球蛋白样结构域1、氨基酸152-242之间的免疫球蛋白样结构域2，和氨基酸249-351之间的免疫球蛋白样结构域3，但是缺少存在于同族受体(例如，SEQ ID NO:413)中的跨膜和蛋白激酶结构域。

FGFR-4同种型(包括本文提供的FGFR-4同种型)可以包括FGFR-4同种型多肽中的等位基因变异。例如，FGFR-4同种型可以包括存在于同族FGFR-4的等位基因变体中的一个或多个氨基酸差异。在一个实例中，FGFR-4的等位基因变体与SEQ ID NO:413相比含有一个或多个氨基酸改变。例如，一个或多个氨基酸变异可以发生在FGFR-4的免疫球蛋白结构域中。等位基因变体可以包括275位的氨基酸改变(SNP NO:11954456)，其中例如，S可以被R代替，或者297位的氨基酸改变(SNP NO:1057633)，其中例如，D可以被V代替。额外的氨基酸改变可以发生在蛋白激酶结构域中。等位基因变体可以包括616位的氨基酸改变(SNP NO:2301344)，其中例如，R可以被L代替。等位基因变异还可以发生在10位(SNPNO:1966265)，其中例如，V可以被I代替，或者136位(SNP NO:376618)，其中例如，P可以被L代替，或者388位(SNP NO:351855)，其中例如，G可以被R代替。含有上述一个或多个氨基酸改变的示例性FGFR-4等位基因变体在SEQ ID NO:446中给出并且FGFR-4同种型可以包括如SEQID NO:446中给出的任何一个或多个等位基因变异。FGFR-4同种型中的等位基因变异可以包括免疫球蛋白结构域中的一个或多个氨基酸改变，如对应于SEQ ID NO:413的275或297位的氨基酸。FGFR-4同种型的额外的等位基因变体可以包括任何一个或多个氨基酸改变，如对应于SEQ IDNO:413的氨基酸位置10或136的氨基酸。

本文提供的FGFR-4同种型，或者其等位基因变异可以包括与tPA的融合，如用tPA前/原序列的全部或部分代替内源信号序列。对于如SEQ IDNO:185的本文提供的示例性FGFR-4同种型，FGFR-4同种型的氨基酸1-25(包括含有氨基酸1-24的内源信号序列)可以被tPA前/原序列代替，如SEQ ID NO:2中给出并且由如SEQ ID NO:1的tPA前/原序列编码的示例性tPA前/原序列。例如，如SEQ ID NO:41中给出的示例性tPA-FGFR-4内含子融合蛋白融合物的核酸序列(编码SEQ ID NO:42中给出的多肽)可以包括编码SEQ ID NO:185中给出的FGFR-4同种型的氨基酸26-446的核酸序列，其在5’末端有效连接到含有tPA前/原序列的序列(SEQ IDNO:41的核苷酸1-105)和含有Xho I限制酶接头位点的序列(SEQ IDNO:41的核苷酸136-141)。任选地，SEQ ID NO:41中给出的示例性tPA-FGFR-4内含子融合蛋白融合物的序列也可以包括如核苷酸106-135给出的myc表位标记，其有效融合在tPA前/原序列和Xho I接头位点之间。

c.VEGFR-1-tPA内含子融合蛋白融合物

本文提供了含有tPA前/原序列的全部或部分和任选地c-myc融合标记的VEGFR-1同种型，其用于提高VEGFR-1内含子融合蛋白多肽的产量。VEGFR-1(Flt-1，fms-样酪氨酸激酶-1)是酪氨酸激酶的VEGF受体家族成员。VEGFR-1的配体包括VEGF-A和PIGF(胎盘生长因子)。因为VEGFR-1和它的配体对于血管发生是重要的，所以这些蛋白质的失调对于异常血管发生引起的多种疾病具有非常重要的影响，所述疾病如实体瘤的增殖或转移、类风湿性关节炎、糖尿病性视网膜病变、视网膜病变和银屑病。VEGFR-1也与川崎病、具有微血管渗透性过高的系统性脉管炎有关。

如SEQ ID NO:426(GenBank No.NP_002010，SEQ ID NO:426)给出的VEGFR-1多肽的特征是氨基酸1-26之间的信号序列。VEGFR-1多肽也含有四个免疫球蛋白样结构域:氨基酸231-337之间的结构域1、332-427之间的结构域2、氨基酸558-656之间的结构域3、和氨基酸661-749之间的结构域4。VEGFR-1也含有氨基酸764-780之间的跨膜结构域和氨基酸827-1154之间的蛋白激酶结构域。

如SEQ ID NO:279给出的示例性VEGFR-1同种型含有氨基酸1-26之间的信号肽、氨基酸231-337之间和氨基酸332-427之间的两个免疫球蛋白样结构域，但是不含有免疫球蛋白样结构域2和3。示例性VEGFR-1同种型与同族VEGFR-1(例如SEQ ID NO:426)相比也可以缺少一个或多个其他结构域或其部分。例如，示例性VEGFR-1同种型(例如，SEQ IDNO:279)与同族VEGFR-1(例如SEQ ID NO:426)相比缺少跨膜结构域和蛋白激酶结构域。VEGFR-1同种型(包括本文的VEGFR-1同种型)可以包括VEGFR-1多肽中的等位基因变异，如与同族VEGFR-1多肽(例如，SEQ IDNO:426)相比一个或多个氨基酸改变。

在一些实施方案中，将如SEQ ID NO:426中给出的VEGFR-1多肽描述为含有七个Ig样结构域(见例如，Wiesmann et al.(2000)J Mol Med.78:247-260)。这种描述包括不被分类为Ig V-型或Ig C-型的典型结构域分类的Ig样结构域。例如，SEQ ID NO:426中给出的VEGFR-1多肽含有氨基酸1-26之间的信号序列。它还含有七个免疫球蛋白样结构域，包括氨基酸38-129之间的结构域1、149-224之间的结构域2、氨基酸243-329之间的结构域3、氨基酸348-425之间的结构域4、氨基酸439-553之间的结构域5、氨基酸568-643之间的结构域6，和氨基酸673-738之间的结构域7。VEGFR-1也含有氨基酸770-779之间的跨膜结构域和氨基酸827-1154之间的蛋白激酶结构域。所以，基于上面的描述，如SEQ ID NO:279给出的示例性VEGFR-1同种型含有氨基酸1-26之间的信号肽、氨基酸38-129、149-224、243-329和348-425之间的四个免疫球蛋白样结构域。此外，示例性VEGFR-1同种型与同族VEGFR-1(例如SEQ ID NO:426)相比含有氨基酸439-560之间的部分免疫球蛋白结构域，缺少对应于同族VEGFR1的第五个Ig样结构域的氨基酸522到553，并且不含有第六个和第七个Ig样结构域、跨膜结构域和蛋白激酶结构域。

本文提供的VEGFR-1同种型，或者其等位基因变异可以包括与tPA的融合，如用tPA前/原序列的全部或部分代替内源信号序列。对于如SEQID NO:279的本文提供的示例性VEGFR-1同种型，含有VEGFR-1同种型的氨基酸1-26的内源信号序列可以被tPA前/原序列代替，如SEQ IDNO:2中给出并且由如SEQ ID NO:1的tPA前/原序列编码的示例性tPA前/原序列。例如，如SEQ ID NO:31中给出的示例性tPA-VEGFR-1内含子融合蛋白融合物的核酸序列(编码SEQ ID NO:32中给出的多肽)可以包括编码SEQ ID NO:279中给出的VEGFR-1同种型的氨基酸27-541的核酸序列，其在5’末端有效连接到含有tPA前/原序列的序列(SEQ ID NO:31的核苷酸1-105)和含有Xho I限制酶接头位点的序列(SEQ ID NO:31的核苷酸136-141)。任选地，SEQ ID NO:31中给出并且编码SEQ ID NO:32中给出的多肽的示例性tPA-VEGFR-1内含子融合蛋白融合物的序列也可以包括如核苷酸106-135给出的myc表位标记，其有效融合在tPA前/原序列和Xho I接头位点之间。

d.tPA-MET内含子融合蛋白融合

本文提供了含有tPA前/原序列的全部或部分和任选c-myc融合标记的MET同种型，其用于提高MET内含子融合蛋白多肽的产量。MET是肝细胞生长因子(HGF)的RTK，是控制细胞生长、形态发生和能动性的多功能细胞因子。HGF是主要由间充质细胞产生的旁分泌因子，诱导促有丝分裂和形态发生改变，包括快速膜边缘波动、微端丝的形成和增加的细胞能动性。通过MET的信号转导可以增加致瘤性、诱导细胞能动性和增强体外侵入性和体内肿瘤转移。MET信号转导也增加产生蛋白酶和尿激酶，导致细胞外基质/基膜降解，其对于促进肿瘤转移是重要的。

MET是在肝细胞中高水平表达的RTK。MET由两个二硫键连接的亚基组成:50-kDa α亚基和145-kDa β亚基。在完全处理的MET蛋白质中，α亚基是细胞外的，β亚基具有细胞外跨膜的酪氨酸激酶结构域。MET的配体是肝细胞生长因子(HGF)。通过FGF和MET的信号转导刺激肝细胞和上皮细胞中的促有丝分裂活性，包括细胞生长、能动性和侵入。关于其他RTK，这些性质将MET与致癌活性联系起来。除了在癌症中的作用外，还表明Met是疟疾感染发育中的关键因子。需要MET的活化使得肝细胞对疟疾的感染敏感，从而MET是预防该疾病的主要靶标。

MET受体(GenBank No.NP_000236，如SEQ ID NO:414给出)的特征是氨基酸1-24之间的信号序列和氨基酸55-500之间的Sema结构域。除了MET外，Sema结构域也在脑信号蛋白中存在，脑信号蛋白是一个大家族的分泌和跨膜蛋白，它们的一些作为轴突导向期间的驱逐信号发生。在MET中，Sema结构域除了配体结合外还参与受体二聚化。MET蛋白的特征也是氨基酸519-562之间的富含丛蛋白半胱氨酸的重复序列和氨基酸563-655、氨基酸657-739和氨基酸742-836之间的三个IPT/TIG结构域。IPT代表丛蛋白和转录因子共有的免疫球蛋白样折叠。TIG代表转录因子中的免疫球蛋白样结构域(转录因子IG)。MET中的TIG结构域可能在介导细胞外基质和受体信号转导之间的一些相互作用中起作用。MET蛋白的特征还在于氨基酸951-973之间的跨膜结构域和氨基酸1078-1337之间的细胞质蛋白激酶结构域。

本文提供的示例性MET同种型含有MET受体的野生型或优势形式(例如，如SEQ ID NO:414给出)的一个或多个结构域。例如，如SEQ IDNO:214给出的示例性MET受体同种型含有氨基酸1-26之间的信号肽、完整Sema结构域、完整富含丛蛋白半胱氨酸的重复结构域，和三个完整IPT/TIG结构域。此外，本文提供的MET的示例性同种型与如SEQ IDNO:414给出的同族MET受体相比可以缺少一个或多个结构域或其部分。本文提供的示例性MET受体同种型(例如，SEQ ID NO:214)缺少跨膜结构域和蛋白激酶结构域。

MET同种型(包括本文的MET同种型)可以包括MET多肽中的等位基因变异。例如，MET同种型可以包括与SEQ ID NO:414相比存在于同族MET的等位基因变体中的一个或多个氨基酸不同，例如，一个或多个氨基酸改变。例如，一个或多个氨基酸变异可以发生在MET的Sema结构域中。等位基因变体可以包括113位的氨基酸改变，其中例如，K可以被R代替，或者114位，其中例如，D可以被N代替，或者145位，其中例如，V可以被A代替，或者148位，其中例如，H可以被R代替，或者151位，其中例如，T可以被P代替，或者158位，其中例如，V可以被A代替，或者168位，其中例如，E可以被D代替，或者193位，其中例如，I可以被T代替，或者216位，其中例如，V可以被L代替，或者237位，其中例如，V可以被A代替，或者276位，其中例如，T可以被A代替，或者314位，其中例如，F可以被L代替，或者337位，其中例如，L可以被P代替，或者340位，其中例如，D可以被V代替，或者382位，其中例如，N可以被D代替，或者400位，其中例如，R可以被G代替，或者476位，其中例如，H可以被R代替，或者481位，其中例如，L可以被M代替，或者500位，其中例如，D可以被G代替。在另一实例中，一个或多个氨基酸变异可以发生在MET的富含丛蛋白半胱氨酸的重复结构域中。等位基因变体可以包括542位的氨基酸改变，其中例如，H可以被Y代替。在其他实例中，一个或多个氨基酸变异可以发生在MET的IPT/TIG结构域中。等位基因变体可以包括622位的氨基酸改变，其中例如，L可以被S代替，或者720位，其中例如，F可以被S代替，或者729位，其中例如，A可以被T代替。在额外实例中，一个或多个氨基酸变异可以发生在MET的蛋白激酶结构域中。等位基因变体可以包括1094位的氨基酸改变，其中例如，H可以被R代替，或者1100位，其中例如，N可以被Y代替，或者1230位，其中例如，Y可以被C代替，或者1235位，其中例如，Y可以被D代替，或者1250位，其中例如，M可以被T代替。等位基因变体可以包括一个或多个氨基酸改变，如37位，其中例如，V可以被A代替，或者39位，其中例如，M可以被T代替，或者42位，其中例如，Q可以被R代替，或者501位，其中例如，Y可以被H代替，或者511位，其中例如，T可以被A代替。含有上述一个或多个氨基酸改变的示例性MET等位基因变体如SEQ ID NO:447给出。MET同种型可以包括如SEQ ID NO:447给出的一个或多个等位基因变异。等位基因变异可以包括Sema结构域中的一个或多个氨基酸改变，如113、114、145、148、151、158、168、193、216、237、276、314、337、340、382、400、476、481或500位的氨基酸改变。等位基因变异也可以发生在富含丛蛋白半胱氨酸的重复结构域中，如542位。其他等位基因变异也可以发生在IPT/TIG结构域中，如622、720或729位。等位基因变异也可以包括其他氨基酸改变，如37、39、42、501或511位的氨基酸改变。

本文提供的MET同种型，或者其等位基因变体可以包括与tPA的融合，如内源信号序列用tPA的前/原序列的全部或部分替代。对于如SEQ IDNO:214的本文提供的示例性MET同种型，MET同种型的氨基酸1-25(包括含有氨基酸1-24的内源信号序列)可以被tPA前/原序列(如SEQ ID NO:2给出的示例性tPA前/原序列并且由如SEQ ID NO:1的tPA前/原序列编码)代替。例如，如SEQ ID NO:33中给出的示例性tPA-MET内含子融合蛋白融合物的核酸序列(编码SEQ ID NO:34中给出的多肽)可以包括编码如SEQ ID NO:214中给出的MET同种型的氨基酸26-877的核酸序列，其有效连接到含有tPA前/原序列的序列的5’末端(SEQ ID NO:33的核苷酸1-105)，接着是含有Xho I限制酶接头位点的序列(SEQ ID NO:33的核苷酸136-141)。任选地，如SEQ ID NO:33中给出的示例性tPA-MET内含子融合蛋白融合物的序列(编码SEQ ID NO:34中给出的多肽)也可以包括如核苷酸106-135给出的myc表位标记，其有效融合在tPA前/原序列和Xho I接头位点之间。

e.tPA-RON内含子融合蛋白融合物

本文提供了含有tPA的前/原序列的全部或部分的任选地c-myc融合标记的RON同种型(recepteur d’origine nantais；也称作巨噬细胞刺激1受体)，用于提高RON内含子融合蛋白多肽的生产量。RON是RTK的MET亚家族成员。RON的配体是巨噬细胞刺激蛋白(MSP)。RON在上皮来源的细胞中表达。RON在上皮细胞癌(包括肺癌和结肠癌)中起作用。RON和MET在卵巢癌中表达并且被提出赋予对癌细胞的选择性优点，从而促进癌的发展。RON也在某些结直肠癌中过表达。RON基因中的种系突变已经与人肿瘤发生联系起来。RON同种型可以用于调节RON，如通过调节其中RON过表达的疾病和状况中的RON活性。

RON蛋白(GenBank No.NP_002438，如SEQ ID NO:415给出)含有氨基酸1-24之间的信号序列。RON的特征也在于氨基酸58-507之间的Sema结构域，和氨基酸526-568之间的富含丛蛋白半胱氨酸的结构域、(氨基酸569-671、氨基酸684-767和氨基酸770-860之间的)三个IPT/TIG结构域、氨基酸960-982之间的跨膜结构域，和氨基酸1082-1341之间的细胞质蛋白激酶结构域。

示例性RON同种型与如SEQ ID NO:415给出的同族RON相比缺少一个或多个结构域或其部分。例如，如SEQ ID NO:223给出的示例性RON同种型缺少跨膜结构域和蛋白激酶结构域。如SEQ ID NO:223给出的示例性RON同种型含有完整Sema结构域、富含丛蛋白胱氨酸的结构域，和三个IPT/TIG同种型。

RON同种型(包括本文提供的RON同种型)可以包括RON多肽中的等位基因变异。例如，RON同种型可以包括存在于同族RON的等位基因变体中的一个或多个氨基酸差异，例如，与SEQ ID NO:415相比一个或多个氨基酸改变。例如，一个或多个氨基酸变异可以发生在RON的Sema结构域中。等位基因变体可以包括113位的单核苷酸多态性(SNP)(SNP No.3733136)，其中例如，G可以被S代替，或者209位，其中例如，G可以被A代替，或者322位(SNP No.2230593)，其中例如，Q可以被R代替，或者440位(SNP No.2230592)，其中例如，N可以被S代替。氨基酸变异也可以发生在523位(SNP No.2230590)，其中例如，R可以被Q代替，或者946位(SNP No.13078735)，其中例如，V可以被M代替。此外，一个或多个氨基酸变异可以发生在RON的蛋白激酶结构域中。等位基因变体可以包括1195位(SNP No.7433231)的氨基酸改变，其中例如，G可以被S代替，或者1335位(SNP No.1062633)的氨基酸改变，其中例如，R可以被G代替，或者1232位，其中例如，D可以被V代替，或者1254位，其中例如，M可以被T代替。含有如上述的一个或多个氨基酸改变的示例性RON等位基因变体在SEQ ID NO:448中给出并且RON同种型可以包括等位基因变体中的一个或多个氨基酸不同，如SEQ ID NO:448中给出。等位基因变体可以包括SEMA结构域中的一个或多个氨基酸改变，如113、209、322或440位。等位基因变体也可以包括一个或多个氨基酸改变，如523位的氨基酸改变。

本文提供的RON同种型，或者其等位基因变异可以包括与tPA的融合，如内源信号序列用tPA前/原序列的全部或部分替代。对于如SEQ IDNO:223的本文提供的示例性RON同种型，RON同种型的氨基酸1-25(包括含有氨基酸1-24的内源信号序列)可以被tPA前/原序列(如SEQ ID NO:2给出并且由SEQ ID NO:1给出的tPA前/原序列编码的示例性tPA前/原序列)代替。例如，SEQ ID NO:47中给出的示例性tPA-RON内含子融合蛋白融合物的核酸序列(编码SEQ ID NO:48中给出的多肽)可以包括编码SEQ ID NO:223中给出的RON同种型的氨基酸26-908的核酸序列，其有效连接在含有tPA前/原序列的序列的5’末端(SEQ ID NO:47的核苷酸1-105)，接着是含有Xho I限制酶接头位点(SEQ ID NO:47的核苷酸136-141)的序列。任选地，SEQ ID NO:47中给出的示例性tPA-RON内含子融合蛋白融合物的序列(编码SEQ ID NO:48中给出的多肽)也可以包括如核苷酸106-135给出的myc表位标记，其有效融合在tPA前/原序列和Xho I接头位点之间。

f.tPA-HER2内含子融合蛋白融合物

本文提供了HER2同种型，其含有tPA的前/原序列的全部或部分和任选地多聚-His融合标记，用于提高HER2内含子融合蛋白多肽的产量。人表皮生长因子受体2基因(HER2；也称作ErbB2，NEU，NGL)编码受体酪氨酸激酶，其与癌基因有关。HER2具有4.5Kb的主要mRNA转录物，其编码约185kDa(p185HER2)的多肽。HER2是人表皮生长因子受体(HER)家族成员，该家族也包括HER1、HER3和HER4。HER1、HER3和HER4的配体包括HER1自身、转化生长因子-α、双调蛋白、betacellulin、和调蛋白。然而，还没有鉴定HER2的配体，HER2是其他HER家族成员的优选的异二聚化配偶体，从而增强它们对它们的配体的亲和力和增强它们的信号。HER2在25-30％的人乳腺癌和8-11％的人卵巢癌中过表达。

HER2(GenBank # NP_004439，如SEQ ID NO:408给出)像其他HER家族成员一样，是I型RTK。I型RTK含有细胞外结构域、单独的疏水跨膜区段，和细胞质酪氨酸激酶结构域。I型RTK(包括HER2)的细胞外结构域已经被分成四个结构域:I(氨基酸23-217之间)、II(氨基酸218-342之间)、III(氨基酸342-500之间)、和IV(氨基酸501-582之间)。细胞外区域含有四个结构域，它们作为两个结构域的单位的串联重复排列，所述单位由称作EGFR样结构域的～190个氨基酸的L结构域(因为EGF结合的主要决定簇位于EGFR的结构域III中(结构域I和III)和～120个氨基酸的富含半胱氨酸的结构域或者弗林蛋白酶样结构域(结构域II和IV)组成。特别地，HER2的特征是氨基酸1-22之间的信号序列、氨基酸52-173和366-486之间的两个受体L结构域(也称作EGFR样结构域)、氨基酸189-343之间的弗林蛋白酶样结构域、氨基酸633-654之间的跨膜结构域，和氨基酸655-1234之间的细胞内细胞质结构域与氨基酸720-987之间的蛋白激酶结构域。

产生了HER2的一些同种型并且其包括通过蛋白酶解加工产生的多肽和通过从选择性剪接的RNA产生的形式。在HER2同种型中包括称作herstatin的那些。Herstatin和其片段是HER2结合蛋白，由HER2基因编码。Herstatin(也称作p68HER-2)由编码p185-HER2受体的基因的选择性剪接的变体编码，并且保留HER2基因的内含子8部分。例如，一种herstatin在胎儿肾和肝脏中存在，并且相对于膜定位的受体在C-末端包括79个氨基酸的内含子编码的插入片段(见例如，美国专利号6,414,130和美国公布的申请号20040022785)。已经鉴定了一些herstatin变体(见例如，美国专利号6,414,130；美国公布的申请号20040022785，美国申请序号09/234,208；美国申请序号09/506,079；公布的国际申请号WO0044403和WO0161356)。

本文提供的示例性HER2同种型含有野生型或优势形式的HER2同族受体(如SEQ ID NO:408中给出)的一个或多个结构域。例如，本文提供的如SEQ ID NO:289中给出的示例性HER2 herstatin同种型(例如，Dimercept^TM Herstatin)含有HER2的胞外结构域的部分，通常前340个氨基酸。Herstatin含有氨基酸1-22之间的信号肽，和HER2胞外结构域的氨基酸341和419之间的亚结构域I和II和结构域III的部分(称作IIIa结构域)和内含子编码的C-末端结构域。所得的herstatin多肽通常含有419个氨基酸(包括胞外结构域的亚结构域I和II的340个氨基酸，加上来自内含子8的79个氨基酸)。Herstatin蛋白质缺少胞外结构域IV，以及跨膜结构域和激酶结构域。

Herstatin结合到HER2，但是不活化该受体。Herstatin可以抑制EGF家族成员受体酪氨酸激酶以及胰岛素样生长因子-1(IGF-1)受体和其他受体。Herstatin阻止形成生产性受体二聚体(同二聚体和异二聚体)，其是转磷酸作用和受体活化所需的。备选地或额外地，herstatin可以与配体竞争结合到受体末端(见例如，美国专利号6,414,130；美国公布的申请号20040022785，美国申请序号09/234,208；美国申请序号09/506,079；公布的国际申请号WO0044403和WO0161356)。

HER2同种型(包括本文提供的herstatin同种型)可以包括HER2多肽中的等位基因变异。例如，herstatin同种型可以包括同族HER2的等位基因变体中存在的一个或多个氨基酸差异，如与SEQ ID NO:408相比的一个或多个氨基酸改变。例如，一个或多个氨基酸变异可以存在于HER2的受体L结构域中。等位基因变体可以包括452位的氨基酸改变，其中例如，W可以被C代替。其他等位基因变异可以发生在细胞内胞质结构域中，如654位，其中例如，I可以被V代替，或者655位，其中例如，I可以被V代替，或者1170位，其中例如，P可以被A代替。含有如上述的一个或多个氨基酸改变的示例性HER2等位基因变体在SEQ ID NO:442中给出。HER2同种型(包括herstatin)可以包括HER2的任意一种或多种等位基因变异，如SEQ ID NO:442中给出的等位基因变异。

此外，本文提供的herstatin同种型可以包括herstatin多肽的内含子8部分中的等位基因变异，例如，与SEQ ID NO:319相比的一个或多个氨基酸改变。例如，等位基因变体可以包括2位的氨基酸改变，其中例如，T可以被S代替，或者5位，其中例如，L可以被P代替，或者6位，其中例如，P可以被L代替，或者16位，其中例如，L可以被Q代替，或者18位，其中例如，M可以被L或I代替，或者21位，其中例如，G可以被D、A或V代替，或者36位，其中例如，L可以被I代替，或者54位，其中例如，P可以被R代替，或者64位，其中例如，P可以被L代替，或者73位，其中例如，D可以被H或N代替，或者17位，其中例如，R可以被C代替，或者31位，其中例如，R可以被I代替。Herstatin变体也可以包括如上面给出的herstatin的内含子8部分中的任意一个或多个氨基酸变异。可以在herstatin或者其内含子8部分中发生的等位基因变异的总结在表7中给出，SEQ ID NO:以括号指出。含有如上述的任意一个或多个氨基酸改变的示例性内含子8在SEQ ID NO:320-333中给出，在内含子8编码的部分中含有任意一个或多个氨基酸改变的herstatin等位基因变体在SEQ ID NO:290-303中给出。Herstatin同种型可以包括如SEQ IDNO:290-303任一个中给出的任意一个或多个氨基酸变异。

表7:Herstatin变体和其内含子8变体

本文提供的herstatin同种型或者其等位基因变异可以包括与tPA的融合，如用tPA前/原序列的全部或部分替代内源信号序列。对于如SEQ IDNO:289的本文提供的示例性herstatin同种型(也称作Dimercept^TM)，herstatin同种型的氨基酸1-23，包括含有氨基酸1-22的内源信号序列，可以被tPA前/原序列代替(如SEQ ID NO:2给出的示例性tPA前/原序列并且由SEQ ID NO:1给出的tPA前/原序列编码)。例如，SEQ ID NO:37中给出的示例性tPA-herstatin内含子融合蛋白融合物的核酸序列(编码SEQID NO:38中给出的多肽)可以包括编码SEQ ID NO:289中给出的herstatin同种型的氨基酸24-419的核酸序列，其有效连接到含有tPA前/原序列(SEQ ID NO:37的核苷酸1-105)的序列的5’末端，接着是含有Xba I限制酶接头位点的序列(SEQ ID NO:37的核苷酸106-111)。任选地，SEQ IDNO:37中给出的示例性tPA-herstatin内含子融合蛋白融合物的序列(编码SEQ ID NO:38中给出的多肽)也可以包括如核苷酸112-135给出的8X多聚-His表位标记，其有效融合在Xba I接头位点和herstatin的序列之间。

g.tPA-RAGE内含子融合蛋白融合物

本文提供了RAGE的同种型，其含有tPA的前/原序列的全部或部分和任选地c-myc融合标记，用于提高RAGE内含子融合蛋白多肽的产量。RAGE是细胞表面受体，其是免疫球蛋白家族成员。RAGE与多种大分子配体相互作用。例如，大分子的糖化加合物，如通过非酶促糖化产生的糖化蛋白和脂类与RAGE相互作用。这些糖化的加合物(也称作高级糖化终产物(AGES)在正常的老化过程中在细胞和组织中积累。AGE的增强的和/或加速的积累在炎症部位、肾衰竭、血糖过多状况和全身或局部氧化应激状况中发生。积累可以在组织如血管组织中发生。例如，AGE作为AGE-β2-微球蛋白在患有透析相关的淀粉状蛋白病的患者中和糖尿病患者的脉管系统和组织中积累。RAGE可以结合到额外的配体，包括S100/钙粒蛋白、β片层原纤维、淀粉状蛋白β肽、Aβ、支链淀粉、血清淀粉状蛋白A、朊病毒来源的肽和两性蛋白。S100/钙粒蛋白是细胞因子样促炎分子。S100蛋白(S100P)参与钙依赖的调节和其他信号转导途径。S100P形式S100A12和S100B是细胞外的并且可以结合到RAGE。S100P以受限的模式表达，所述模式包括在胎盘和食管上皮细胞中表达。S100P也在癌细胞中表达，所述癌细胞包括乳腺癌、结肠癌、前列腺癌和胰腺腺癌。两性蛋白是约30

kDa的多肽，其在神经系统中表达。它也在转化的细胞如c6神经胶质瘤细胞、HL-60早幼粒细胞、U937幼单核细胞、HT1080纤维肉瘤细胞和B16黑素瘤细胞中表达(Hori et al.(1995)J.Bio.Chem.270:25752-61)。

RAGE多肽(Genbank NP_001127，SEQ ID NO:421)含有许多结构域。它具有位于N末端的信号肽。例如，在如SEQ ID NO:421中给出并且由SEQ ID NO:384编码的示例性全长RAGE多肽中，信号肽位于氨基酸1-22。RAGE含有跨膜结构域。在如SEQ ID NO:421中给出的示例性全长RAGE多肽中，跨膜结构域在氨基酸343和363之间。RAGE也含有来自跨膜结构域的N-末端边上的三个免疫球蛋白样(Ig样)结构域。在如SEQ IDNO:421中给出的示例性全长RAGE多肽中，Ig样结构域位于氨基酸23-116、124-221和227-317。第一个Ig样结构域(SEQ ID NO:421的氨基酸23-116)是可变类型(V类型)的Ig样结构域，而其他两个Ig样结构域的特征与恒定区(C-类型)相似。V型Ig样结构域可以介导与配体如AGE的相互作用(Kislinger et al.(1999(J.Biol.Chem.274:31740-49)。RAGE蛋白的C-末端是细胞内的。在如SEQ ID NO:421中给出的示例性全长RAGE多肽中，C-末端包括氨基酸364-404。C-末端参与RAGE介导的信号转导(Ding et al.(2005)Neuroscience letters 373:67-72)。

本文提供的示例性RAGE同种型缺少RAGE的一个或多个结构域或一个或多个结构域的部分。在本文提供的RAGE同种型中包括如SEQ IDNO:237给出的同种型C02，其由如SEQ ID NO:236给出的核酸序列编码。C02含有266个氨基酸。该同种型包括氨基酸1-22的N-末端信号序列，接着是氨基酸23-116的V型Ig样结构域，和氨基酸124-237的C-型Ig样结构域。它除了对应于SEQ ID NO:421的氨基酸227-230的前四个氨基酸(氨基酸243-246)之外缺少第二个C型Ig样结构域。此外，在C02中包括的第一个C型Ig样结构域含有破坏。插入了额外的16个氨基酸；这16个氨基酸在SEQ ID NO:237的位置142-157。这些氨基酸的插入点对应于SEQ ID NO:421的氨基酸141-142。C02同种型含有该多肽的C-末端的额外20个氨基酸:氨基酸247-266，其不存在于同族RAGE中。

RAGE同种型，包括本文的RAGE同种型，可以包括RAGE多肽中的等位基因变异。例如，RAGE同种型可以包括同族RAGE的等位基因变体中存在的一个或多个氨基酸差异，如与SEQ ID NO:421相比一个或多个氨基酸改变。例如，一个或多个氨基酸变异可以发生在RAGE的Ig样结构域中。等位基因变体可以包括77位的氨基酸改变，其中例如，R被C代替，或者82位的氨基酸改变，其中例如，G被S代替。在另一实例中，一个或多个氨基酸改变可以发生在RAGE的C-末端。等位基因变体可以包括369位的氨基酸改变，其中例如，R可以被Q代替，或者365位，其中例如，R可以被G代替，或者305位，其中例如，H可以被Q代替，或者307位，其中例如，S可以被C代替。含有如上述的一个或多个氨基酸改变的示例性RAGE等位基因变体如SEQ ID NO:453给出。RAGE同种型可以包括SEQ ID NO:453中给出的一个或多个等位基因变异。等位基因变异可以包括Ig样结构域中的一个或多个氨基酸改变，如在77或82位的氨基酸改变。

本文提供的RAGE同种型，或者其等位基因变异，可以包括与tPA的融合，如用tPA前/原序列的全部或部分代替内源信号序列。对于如SEQ IDNO:237的本文提供的示例性RAGE同种型，RAGE同种型的氨基酸1-23(包括含有氨基酸1-22的内源信号序列)可以被tPA前/原序列，如SEQID NO:2的示例性tPA前/原序列(并且由如SEQ ID NO:1给出的tPA前/原序列编码)代替。例如，如SEQ ID NO:43中给出的示例性tPA-RAGE内含子融合蛋白融合物的核酸序列(编码SEQ ID NO:44中给出的多肽)可以包括编码SEQ ID NO:237中给出的RAGE同种型的氨基酸23-266的核酸序列，其有效连接在含有tPA前/原序列(SEQ ID NO:43的核苷酸1-105)的序列的5’末端，接着是含有Xho I限制酶接头位点(SEQ ID NO:43的核苷酸136-141)的序列。任选地，SEQ ID NO:43中给出的示例性tPA-RAGE内含子融合蛋白融合物的序列(编码SEQ ID NO:44中给出的多肽)也可以包括如核苷酸106-135给出的myc表位标记，其有效融合在tPA前/原序列和Xho I接头位点之间。

h.tPA-TEK内含子融合蛋白融合物

本文提供了含有tPA前/原序列的全部或部分和任选地c-myc融合标记的TEK同种型(也称作Tie-2)，用于提高TEK内含子融合蛋白多肽的产量。TEK的已知的配体包括血管生成素(angiopoietin)(Ang)-1和Ang-2。TIERTK(包括Tie-1和TEK)在胚胎脉管系统的发育中起重要作用并且继续在成年人内皮细胞中表达。TEK是几乎仅由血管内皮表达的RTK。TEK的表达对于胚胎脉管系统的发育是重要的。TEK的过表达和/或突变已经与病理性血管发生相关，并且从而与肿瘤生长，以及髓性白血病相关。

TEK蛋白(GenBank No.NP_000450，如SEQ ID NO:423给出)含有氨基酸1-18之间的信号序列。TEK的特征也在于氨基酸219-268之间的层粘连蛋白EGF样结构域、三个纤连蛋白III型结构域(氨基酸444-529、氨基酸543-626和氨基酸639-724之间)、氨基酸748-770之间的跨膜结构域，和氨基酸824-1092之间的细胞质蛋白激酶结构域。

示例性TEK同种型与如SEQ ID NO:423给出的同族TEK相比缺少一个或多个结构域或其部分。例如，示例性TEK同种型(如SEQ ID NO:245中给出)可以缺少跨膜结构域和激酶结构域。TEK同种型也可以含有TEK同族受体的其他结构域。例如，如SEQ ID NO:245中给出的示例性TEK同种型含有氨基酸1-18之间的信号序列、氨基酸219-268之间的层粘连蛋白EGF样结构域，但是缺少所述三个纤连蛋白III型结构域。

TEK同种型(包括本文提供的TEK同种型)可以包括TEK多肽中的等位基因变异。例如，TEK同种型可以包括同族TEK的等位基因变体中存在的一个或多个氨基酸差异，如与SEQ ID NO:423相比的任何一个或多个氨基酸改变。例如，一个或多个氨基酸变异可以发生在TEK的纤连蛋白III型结构域中。等位基因变体可以包括486位的单核苷酸多态性(SNP)(SNP NO:1334811)，其中例如，V可以被I代替，或者695位，其中例如，I可以被T代替，或者724位(SNP No.4631561)，其中例如，A可以被T代替。等位基因变体也可以发生在TEK的蛋白激酶结构域中。等位基因变体可以包括849位的氨基酸改变，其中例如，R可以被W代替。氨基酸变异也可以发生在346位，其中例如，P可以被Q代替。含有上述一个或多个氨基酸改变的示例性TEK等位基因变体如SEQ ID NO:454给出并且TEK同种型可以包括同族TEK的等位基因变体(如SEQ IDNO:454中给出)中存在的一个或多个氨基酸不同。TEK同种型的等位基因变体可以包括纤连蛋白III型结构域中的一个或多个氨基酸改变，如在486或695位的氨基酸改变。TEK同种型的等位基因变体也可以包括一个或多个氨基酸改变(如在346位)。

本文提供的TEK同种型，或者其等位基因变体可以包括与tPA的融合，如用tPA前/原序列的全部或部分代替内源信号序列。对于如SEQ IDNO:245的本文提供的示例性TEK同种型，TEK同种型的氨基酸1-19(包括含有氨基酸1-18的内源信号序列)可以被tPA前/原序列，如SEQ IDNO:2的示例性tPA前/原序列(并且由如SEQ ID NO:1给出的tPA前/原序列编码)代替。例如，如SEQ ID NO:45中给出的示例性tPA-TEK内含子融合蛋白融合物的核酸序列(编码SEQ ID NO:46中给出的多肽)可以包括编码SEQ ID NO:245中给出的TEK同种型的氨基酸20-367的核酸序列，其有效连接在含有tPA前/原序列(SEQ ID NO:45的核苷酸1-105)的序列的5’末端，接着是含有Xho I限制酶接头位点(SEQ ID NO:45的核苷酸136-141)的序列。任选地，SEQ ID NO:45中给出的示例性tPA-TEK内含子融合蛋白融合物的序列(编码SEQ ID NO:46中给出的多肽)也可以包括如核苷酸106-135给出的myc表位标记，其有效融合在tPA前/原序列和Xho I接头位点之间。

E.产生编码同种型融合多肽的核酸的方法

提供了产生同种型融合核酸分子和多肽(包括本文所述的tPA内含子融合蛋白融合物)的示例性方法。此类方法包括核酸分子的体外合成方法，如PCR，合成基因构建和体外连接分离的和/或合成的核酸片段。CSR或配体同种型融合物的核酸分子也可以通过克隆方法分离，包括从细胞分离的RNA和DNA的PCR和通过杂交和/或表达筛选方法筛选核酸分子文库。

使用体外和体内合成方法，可以从CSR或配体同种型核酸分子产生CSR或配体同种型多肽。同种型(包括同种型融合物，如tPA内含子融合蛋白融合物)可以在任何生物中表达，所述生物适于产生施用和治疗所需的需要量和形式的同种型。表达宿主包括原核和真核生物，如大肠杆菌、酵母、植物、昆虫细胞、哺乳动物细胞，包括人细胞系和转基因动物。CSR同种型也可以从表达它们的细胞和生物中分离，包括重组产生同种型的细胞和生物和不用重组手段合成同种型(如通过选择性剪接事件产生的基因组编码的同种型)的细胞和生物。

1.合成基因和多肽

可以通过本领域技术人员已知的方法使用合成基因合成法合成编码CSR或者配体同种型多肽的核酸分子。在此类方法中，同种型的多肽序列被“回译”(back translate)以产生编码同种型的一种或多种核酸分子。然后合成回译的核酸分子作为一种或多种DNA片段，如通过使用自动化DNA合成技术合成。然后有效连接所述片段以形成编码同种型的核酸分子。通过连接编码同种型的核酸分子与额外的核酸分子可以产生同种型融合，所述额外的核酸分子为诸如异源或同源前体序列、表位或融合标记、用于调节转录和翻译的调节序列、载体和编码其他多肽的核酸分子。编码同种型的核酸分子也可以有效连接其他融合标记或标记物如用于示踪的标记物，如放射性标记物和荧光部分。

回译的方法使用遗传密码得到任一目的多肽(如CSR或配体同种型)的核苷酸基因序列。遗传密码是简并的，64个密码子规定20种氨基酸和3个终止密码子。此类简并性允许核酸设计和产生中的灵活性，允许例如，掺入限制性位点以方便连接核酸片段和/或在每个合成的片段内放置独特的标识序列。遗传密码的简并性也允许设计核酸分子来避免不想要的核苷酸序列，包括不想要的限制性位点、剪接供体或受体位点，或对有效翻译潜在有害的其他核苷酸序列。此外，生物有时偏爱特定的密码子选择和/或GC与AT核苷酸的特定比例。从而，遗传密码的简并性允许设计为了在具体生物或几组生物中表达而定制的核酸分子。此外，可以基于序列的优化(或非优化)设计核酸分子用于不同的表达水平。通过选择编码多肽的密码子进行回译。此类方法可以使用遗传密码表和多肽序列手工进行。备选地，可以用计算机程序，包括可公开获得的软件产生回译的核酸序列。

为了合成回译的核酸分子，可以使用本领域可得到的用于核酸合成的任何方法。例如，可以通过标准自动化方法合成对应于编码CSR或配体同种型片段的核苷酸序列的各个寡核苷酸并在退火或杂交反应中混合在一起。合成此类寡核苷酸使得退火导致从所述寡核苷酸自装配基因，该装配使用形成双链体互补序列时形成的重叠的单链突出端(通常约100个核苷酸长度)。使用连接，例如用噬菌体T4 DNA连接酶封闭双链体DNA中的单个核苷酸“切口”。限制性内切核酸酶接头序列可以例如然后用于将合成基因插入到适于蛋白质表达的多种重组DNA载体的任一种中。在另一相似的方法中，通过化学寡核苷酸合成方法制备一系列重叠的寡核苷酸。这些寡核苷酸的退火导致缺口DNA结构。通过诸如DNA聚合酶I的酶催化的DNA合成可以用于填充这些缺口，用连接封闭双链体结构中的任何切口。PCR和/或DNA扩增技术可以用于扩增所形成的线性DNA双链体。

额外的核苷酸序列可以连接到CSR或配体同种型编码核酸分子，从而产生同种型融合，包括含有限制性内切核酸酶位点的接头序列，所述限制性内切核酸酶位点为了将合成的基因克隆到载体，例如蛋白质表达载体或设计用于扩增编码核心蛋白质的DNA序列的载体。此外，指定功能DNA元件的额外核苷酸序列可以有效连接编码同种型的核酸分子。此类序列的实例包括，但不限于，被设计用于促进细胞内蛋白质表达的启动子序列，或被设计用于促进蛋白质分泌的前体序列。可以有效连接到编码同种型的核酸分子的核苷酸序列的其他实例包括促进同种型的纯化和/或检测的序列。例如，融合标记，如表位标记或荧光部分可以融合或连接到同种型。额外的核苷酸序列如指定蛋白质编码区的序列也可以连接到编码同种型的核酸分子。此类区域包括，但不限于，促进同种型向特定靶细胞的摄入，或者增强合成基因的药物动力学的序列。

使用自动化合成多肽合成方法也可以合成CSR同种型。可以以片段合成克隆的和/或计算机芯片上产生的多肽序列并将它们化学连接。备选地，可以将同种型作为单个多肽合成。然后将此类多肽用于本文所述的测定法和治疗施用中。

2.克隆和分离同种型和同种型融合物的方法

可以使用本领域中已知的用于克隆和分离核酸分子的任一种可得到的方法克隆或分离CSR或配体同种型，包括同种型融合物。此类方法包括PCR扩增核酸和筛选文库，包括核酸杂交文库、基于抗体的筛选和基于活性的筛选。

也可以使用文库筛选分离编码同种型的核酸分子。例如，通过与编码CSR同种型或其部分的核酸分子杂交来筛选以cDNA代表表达的RNA转录物的核酸文库。例如，来自CSR基因的内含子序列或其部分可以用于基于与同源序列的杂交来筛选含有内含子保留的分子。表达文库筛选可以用于分离编码CSR同种型的核酸分子。例如，可以用识别特定同种型或同种型的部分的抗体筛选表达文库。可以得到和/或制备特异结合CSR同种型或同种型中所含的区域或肽的抗体。特异结合同种型的抗体可以用于筛选含有编码同种型(如内含子融合蛋白)的核酸分子的表达文库。制备和分离抗体，包括多克隆和单克隆抗体和其片段的方法是本领域公知的。制备和分离重组和合成抗体的方法也是本领域公知的。例如，使用特异结合候选多肽的抗体的抗原结合位点的核苷酸和氨基酸序列信息，此类抗体可以使用固相肽合成构建或者可以重组产生。也可以通过筛选含有可变重链和可变轻链或其抗原结合部分的组合文库得到抗体。制备、分离和使用多克隆、单克隆或非天然抗体的方法例如在Kontermann和Dubel，eds.(2001)“Antibody Engineering”Springer Verlag；Howard和Bethell，eds.(2001)“Basic Methods in Antibody Production and Characterization”CRC Press；和O’Brien and Aitkin，eds.(2001)“Antibody Phage Display”HumanaPress中综述。此类抗体也可以用于筛选同种型多肽的存在，例如，以检测细胞、组织或提取物中CSR同种型的表达。

扩增核酸的方法可以用于分离编码同种型的核酸分子，包括例如，聚合酶链式反应(PCR)方法。含有核酸的材料可以用作分离编码同种型的核酸分子的原料。例如，DNA和mRNA制备物、细胞提取物、组织提取物、流体样品(例如，血液、血清和唾液)、来自健康和/或患病受试者的样品可以用于扩增方法中。核酸文库也可以用作原料的来源。可以设计引物来扩增同种型。例如，可以基于用于产生同种型的表达序列设计引物。可以基于同种型氨基酸序列的回译设计引物。通过扩增产生的核酸分子可以被测序并证实编码同种型。

3.产生和克隆内含子融合蛋白融合物的方法

用于得到并连接DNA序列以提供编码融合蛋白的DNA序列的方法是重组DNA技术领域中公知的。通过多种方法可以产生前体序列的DNA，如编码信号肽的DNA:使用寡核苷酸合成仪合成；从靶标DNA，如从含有前体序列的生物、细胞或载体通过合适的限制酶消化分离；或者可以使用合适的引物通过基因组DNA的PCR从目标来源得到。同样，编码同种型融合蛋白、表位标记或将与同种型融合的其他蛋白质的DNA可以使用寡核苷酸合成仪合成、通过合适的限制酶消化从产生所述蛋白质的亲本细胞的DNA分离，或者从目标来源如细胞、组织、载体或其他目标来源，使用合适的引物通过基因组DNA的PCR得到。额外地，可以将小表位标记，如myc标记、His标记或者其他小表位标记，和/或任何其他额外的DNA序列，如限制酶接头序列或者蛋白酶切割位点序列工程化到PCR引物序列中用于当PCR扩增时掺入到编码另一蛋白质的核酸序列中以掺入到编码融合蛋白的DNA中。

在一个实例中，通过连续多轮的连接DNA靶序列、通过PCR扩增到载体中工程化的重组位点，可以产生内含子融合蛋白融合序列。例如，内含子融合蛋白同种型、融合标记和/或同源或异源前体序列的核酸序列可以使用引物进行PCR扩增，所述引物与靶DNA中的目的区域的相反链杂交并位于所述区域侧翼。已知表达靶DNA分子的细胞或组织或其他来源，或者含有靶DNA分子的序列的载体可以用作PCR扩增事件的起始产物。可以将PCR扩增的产物亚克隆到载体中用于进一步重组操作序列，如以便产生与载体中已经含有的另一核酸序列融合，或者用于表达靶分子。

用于PCR扩增的PCR引物也可以被工程化以促进核酸序列的有效连接。例如，可以将非模板互补的5’延伸加入到引物中以允许PCR产物的多种扩增后操作而不显著影响扩增自身。例如，这些5’延伸可以包括限制位点、启动子序列、表位标记的序列，等等。在一个实例中，为了产生融合序列的目的，可以掺入到引物中的序列包括例如，编码myc表位标记或者其他小表位标记的序列，使得扩增的PCR产物有效含有目的核酸序列与表位标记的融合。

在另一实例中，限制酶位点向引物的掺入可以促进扩增产物向含有相容性限制位点的载体中的亚克隆，如通过提供用于核酸序列连接的粘性末端。多个PCR扩增产物向单个载体的亚克隆可以用作有效连接或融合不同核酸序列的策略。可以掺入到引物序列的限制酶位点的实例可以包括，但不限于，Xho I限制位点(CTCGAG，SEQ ID NO:128)，Nhe I限制位点(GCTAGC，SEQ ID NO:130)，Not I限制位点(GCGGCCGC，SEQ IDNO:131)，EcoR I限制位点(GAATTC，SEQ ID NO:132)，或Xba I限制位点(TCTAGA，SEQ ID NO:129)。将PCR产物亚克隆到载体中的其他方法包括平末端克隆、TA克隆、连接独立的克隆和体内克隆。

引物中有效限制酶位点的产生方便用相容的限制酶消化PCR片段以暴露粘性末端，或者对于一些限制酶位点，暴露平末端，用于随后的亚克隆。在限制酶位点向引物的工程化使得它保持对于限制酶的相容性中有几种因素需要考虑。首先，在PCR引物中工程化的限制位点上游的2-6个额外碱基的加入极大地增加了扩增产物的消化效率。可以用于提供限制酶对限制酶位点的消化的其他方法包括蛋白酶K处理以去除可以封闭DNA的任何热稳定的聚合酶、用Klenow或T4 DNA聚合酶进行末端补齐，和/或加入亚精胺。提高PCR产物的消化效率的备选方法也可以包括扩增后片段的连环化。这通过首先用T4多核苷酸激酶(如果引物还没有被磷酸化)处理提纯的PCR产物来实现。如果使用校准热稳定的聚合酶如Pfu，那么末端可以已经是平端的，或者可以用T4 DNA聚合酶处理扩增的PCR产物以补齐末端(如果使用非校正酶如Taq)。可以用T4 DNA连接酶连接PCR产物。这从片段末端有效除去了限制酶位点并允许有效的消化。

将含有暴露的限制酶位点的PCR产物亚克隆到载体(如用于产生与目的序列的融合)之前，有时必须分辨被消化的PCR产物和那些保持未切割的PCR产物。在此类实例中，可以在PCR前在引物的5’末端加入荧光标记。这允许鉴定消化的产物，因为已经被成功消化的那些产物在消化时将失去荧光标记物。

在一些实例中，使用含有限制位点的扩增PCR产物(用于随后亚克隆到载体中以产生融合序列)可以导致限制酶接头位点掺入融合蛋白产物中。通常，此类接头序列是短的并且不损害多肽的功能，只要所述序列有效连接。

可以以包含核酸分子的载体的形式提供编码同种型融合蛋白的核酸分子。此类载体的一个实例是质粒。许多表达载体是本领域技术人员可得到的和已知的并且可以用于表达CSR或配体同种型，包括同种型融合。表达载体的选择可以受到宿主表达系统的选择的影响。通常，表达载体可以包括转录启动子和任选地增强子、翻译信号、和转录和翻译终止信号。用于稳定转化的表达载体通常具有选择标记，其允许选择和维持所转化的细胞。在一些情况中，复制原点可以用于扩增载体的拷贝数。

4.表达系统

CSR和配体同种型，包括本文提供的天然的和组合的内含子融合蛋白和同种型融合，可以通过本领域中技术人员已知的任一种方法产生，包括体内和体外方法。CSR和配体同种型和融合同种型可以在任一种生物中表达，所述生物适于产生施用和治疗所需的同种型的需要量和形式。通常被工程化以表达异源DNA并且具有分泌途径的任何细胞类型都是合适的。表达宿主包括原核和真核生物，如大肠杆菌、酵母、植物、昆虫细胞和哺乳动物细胞，包括人细胞系和转基因动物。表达宿主可以在它们的蛋白质生产水平以及所表达的蛋白质上存在的翻译后修饰类型中不同。此外，表达宿主的选择通常但不总是依赖于所用的前体序列的选择。例如，许多异源信号序列可以仅在相同物种的宿主细胞中表达(例如，昆虫细胞信号序列在昆虫细胞中最佳地表达)。相比，其他信号序列可以用于异源宿主中，如人血清白蛋白(hHSA)信号序列，其在酵母、昆虫或哺乳动物宿主细胞中良好发挥功能，和组织纤溶酶原激活物前/原序列，其已经被表明在昆虫和哺乳动物细胞中有功能(Tan et al.，(2002)Protein Eng.15:337)。表达宿主的选择可以基于这些和其他因素做出，所述因素为诸如调节和安全考虑、生产成本和纯化的需要和方法。

a.原核生物表达

原核生物，特别是大肠杆菌提供了产生大量蛋白质如本文提供的同种型和同种型融合物的系统。也可以使用其他微生物菌株，如芽孢杆菌，例如枯草芽孢杆菌(Bacillus subtilis)、假单胞菌的多种种类，或者其他细菌菌株。细菌(包括大肠杆菌)的转化是本领域中公知的简单和快速的技术。在此类原核系统中，通常使用质粒载体，其含有来自与宿主相容的物种的复制位点和控制序列。例如，大肠杆菌常用的载体包括pBR322、pUC18、pBAD和它们的衍生物。含有转录起始启动子、任选地操纵基因以及核糖体结合位点序列的常用的原核控制序列包括此类常用的启动子，如β内酰胺酶(青霉素酶)和乳糖(lac)启动子系统、色氨酸(trp)启动子系统、阿拉伯糖启动子、和λ来源的P1启动子和N-基因核糖体结合位点。然而，可以使用与原核生物相容的任何可利用的启动子系统。用于大肠杆菌的表达载体可以含有诱导型启动子。此类启动子可用于诱导高水平的蛋白质表达和表达对宿主细胞显示出一定毒性的蛋白质。诱导型启动子的实例包括lac启动子、trp启动子、杂合的tac启动子，和T7和SP6 RNA启动子和温度调节的λPL启动子。

同种型可以在大肠杆菌的细胞质环境中表达。细胞质是还原性环境并且对于一些分子，这可以导致形成不溶的包含体。还原剂，如二硫苏糖醇和β-巯基乙醇和变性剂，如盐酸胍和尿素可以用于再溶解蛋白。备选方法是在细菌的周质空间中表达CSR或配体同种型，包括同种型融合，周质空间提供了氧化环境和蛋白伴侣样和二硫键异构酶并且可以导致产生可溶性蛋白。通常，前体序列，如但不限于本文所述的用于细菌中的前体序列，包括OmpA、OmpF、PelB或其他前体序列融合(如通过代替内源前体序列)到待表达的蛋白质，所述前体序列将蛋白质导向周质中。然后通过周质内的信号肽酶除去前导肽。靶向周质的前体或前导序列的实例包括来自果胶酸裂合酶基因的PelB前体序列和来自碱性磷酸酶基因的前导序列。在一些情况中，周质表达允许表达的蛋白质泄漏到培养基中。蛋白质的分泌允许从培养上清液快速和简单的纯化。不分泌的蛋白质可以通过渗透性裂解从周质得到。类似于细胞质表达，在一些情况中，蛋白质可以变得可溶并且可以用变性剂和还原剂促进溶解和再折叠。诱导和生长温度也可以影响表达水平和溶解度，通常使用25℃到37℃的温度。典型地，细菌产生非糖基化蛋白质。从而，如果蛋白质需要糖基化来发挥功能，那么可以在从宿主细胞纯化后在体外加入糖基化。

b.酵母

酵母如酿酒酵母(Saccharomyces cerevisae)、栗酒裂殖酵母(Schizosaccharomyces pombe)、解脂耶氏酵母(Yarrowia lipolytica)、乳酸克鲁维酵母(Kluyveromyces lactis)和巴斯德毕赤酵母(Pichia pastoris)是公知的酵母表达宿主，其可以用于产生CSR同种型。用附加型复制载体或者通过同源重组进行稳定的染色体整合可以转化酵母。通常，用诱导型启动子调节基因表达。此类启动子的实例包括GAL1、GAL7和GAL5和金属硫蛋白启动子，如CUP1、AOX1或其他毕赤酵母或其他酵母启动子。其他酵母启动子包括用于合成糖酵解酶的启动子，例如，3-磷酸甘油酸激酶的启动子，或者来自烯醇化酶基因或者从Yepl3得到的Leu2基因的那些启动子。表达载体通常包括选择标记，如用于选择和维持转化的DNA的LEU2、TRP1、HIS3和URA3。用于酵母中的示例性表达载体系统是POT1载体系统(见例如美国专利号4,931,373)，其允许通过在含有葡萄糖的培养基中生长选择转化的细胞。酵母中表达的蛋白质通常是可溶的。与蛋白伴侣如Bip和蛋白质二硫键异构酶的共表达可以提高表达水平和溶解度。此外，在酵母中表达的蛋白质可以使用分泌信号肽融合物导向分泌，所述分泌信号肽融合物为诸如来自酿酒酵母的酵母接合型α因子分泌信号和与酵母细胞表面蛋白如Aga2p接合粘附受体或Arxula adeninivorans葡糖淀粉酶的融合物，或者促进多肽在酵母中分泌的任何其他异源或同源的前体序列。可以将蛋白酶切割位点，如Kex-2蛋白酶工程化以在它们离开分泌途径时从表达的多肽去除融合的序列。酵母也能够在Asn-X-Ser/Thr基序处糖基化。

c.昆虫细胞

昆虫细胞(尤其使用杆状病毒表达)可用于表达多肽，如CSR或配体同种型，包括同种型融合物。昆虫细胞表达高水平的蛋白质并且能够进行高等真核生物使用的多数翻译后修饰。杆状病毒具有限制性宿主范围，其提高了安全性并减小了真核生物表达的调节方面的考虑。典型的表达载体使用启动子如杆状病毒的多角体蛋白启动子用于高水平表达。常用的杆状病毒系统包括杆状病毒如苜蓿银纹夜蛾(Autographa californica)核型多角体病毒(AcNPV)，和家蚕(Bombyx mori)核型多角体病毒(BmNPV)和昆虫细胞系，如来自草地夜蛾(Spodoptera frugiperda)的Sf9、粘虫(Pseudaletiaunipuncta)(A7S)和君主斑蝶(Danaus plexippus)(DpN1)。为了高水平表达，将待表达的分子的核苷酸序列直接融合在病毒的多角体蛋白起始密码子的下游。哺乳动物分泌信号在昆虫细胞中被准确地加工并可以用于将表达的蛋白质分泌到培养基中。例如，哺乳动物组织纤溶酶原激活物前体序列促进昆虫细胞表达和分泌蛋白质。此外，细胞系粘虫(Pseudaletiaunipuncta)(A7S)和君主斑蝶(DpN1)产生具有类似于哺乳动物细胞系统的糖基化模式的蛋白质。

在昆虫细胞中的备选表达系统是使用稳定转化的细胞。细胞系如Schnieder 2(S2)和Kc细胞(黑腹果蝇(Drosophila melanogaster))和C7细胞(白纹伊蚊(Aedes albopictus))可以用于表达。果蝇金属硫蛋白启动子可以用于在用镉或铜进行重金属诱导的存在下诱导高水平表达。通常使用选择标记如新霉素和潮霉素来保持表达载体。

d.哺乳动物细胞

哺乳动物表达系统可以用于表达CSR或配体同种型，包括本文提供的同种型融合物。通过病毒感染，如通过使用腺病毒载体或者通过直接的DNA转移，如通过涉及脂质体、磷酸钙、DEAE-葡聚糖的常规转染方法和通过物理方法，如电穿孔和显微注射，可以将表达构建体转移到哺乳动物细胞中。示例性表达载体包括例如，pCI表达质粒(Promega，SEQ IDNO:50)，或peDNA3.1表达质粒(Invitrogen，SEQ ID NO:51)。哺乳动物细胞的表达载体通常包括mRNA帽位点、TATA盒、翻译起始序列(Kozak共有序列)和多聚腺苷酸化元件。此类载体通常包括用于高水平表达的转录启动子-增强子，例如，SV40启动子-增强子、人巨细胞病毒(CMV)启动子，如hCMV-MIE启动子-增强子，和劳斯肉瘤病毒(RSV)的长末端重复片段，或其他病毒启动子，如来自多瘤、腺病毒II、牛乳头瘤病毒或禽肉瘤病毒的启动子。额外合适的哺乳动物启动子包括β-肌动蛋白启动子-增强子和人金属硫蛋白II启动子。这些启动子-增强子在许多细胞类型中有活性。组织和细胞类型的启动子和增强子区域也可以用于表达。示例性启动子/增强子区包括，但不限于，来自如下基因的那些:弹性蛋白酶I、胰岛素、免疫球蛋白、小鼠乳房肿瘤病毒、白蛋白、甲胎蛋白、α1-抗胰蛋白酶、β珠蛋白、髓鞘碱性蛋白、肌球蛋白轻链2，和促性腺激素释放激素基因控制。选择标记可以用于选择和保持具有表达构建体的细胞。选择标记基因的实例包括，但不限于，潮霉素B磷酸转移酶、腺苷脱氨酶、黄嘌呤-鸟嘌呤磷酸核糖转移酶、氨基葡糖苷磷酸转移酶、二氢叶酸还原酶和胸苷激酶。与细胞表面信号分子如TCR-ζ和Fc_εRI-γ的融合可以指导活性状态的蛋白质在细胞表面的表达。

许多细胞系可用于哺乳动物表达，包括小鼠、大鼠、人、猴、鸡和仓鼠细胞。示例性细胞系包括，但不限于，CHO、Balb/3T3、HeLa、MT2、小鼠NS0(非分泌性)和其他骨髓瘤细胞系、杂交瘤和异杂交瘤细胞系、淋巴细胞、成纤维细胞、Sp2/0、COS、NIH3T3、HEK293、293T、293S、2B8、和HKB细胞。可得到适于无血清培养基的细胞系，其方便从细胞培养基纯化分泌的蛋白质。一个此类实例是无血清的EBNA-1细胞系(Phamet al.，(2003)Biotechnol.Bioeng.84:332-42.)。

e.植物

转基因植物细胞和植物可以用于表达CSR同种型。通常使用DNA转移将表达构建体转移到植物中，如用微粒轰击和PEG介导的转移到原生质体中，和使用农杆菌介导的转化。表达载体可以包括启动子和增强子序列、转录终止元件和翻译控制元件。表达载体和转化技术通常在双子叶植物宿主(如拟南芥和烟草)和单子叶植物宿主(如玉米和稻)之间分开。用于表达的植物启动子的实例包括花椰菜花叶病毒启动子、胭脂氨酸合成酶启动子、核糖二磷酸羧化酶启动子和泛蛋白和UBQ3启动子。选择标记，如潮霉素、磷酸甘露糖异构酶和新霉素磷酸转移酶通常用于方便选择和维持转化的细胞。转化的植物细胞可以以培养物如细胞、团聚体(愈伤组织)保持或者再生成完整植物。转基因植物细胞也可以包括经工程化以产生CSR同种型的藻类(见例如，Mayfield et al.(2003)PNAS 100:438-442)。因为植物具有不同于哺乳动物细胞的糖基化模式，所以这可以影响在这些宿主中产生的CSR同种型的选择。

5.转染和转化方法

使用适于所选宿主细胞的标准技术完成宿主细胞的转化或转染。转染方法是本领域技术人员已知的，例如，磷酸钙和电穿孔，以及使用通过商业途径可获得的促进转染的阳离子脂类试剂，如Lipofectamine^TM、Lipofectamine^TM 2000或

(Invitrogen，Carlsbad CA)。取决于所用的宿主细胞，使用适合此类细胞的标准技术进行转化。钙处理(例如，使用氯化钙)或电穿孔通常用于原核生物或其他含有坚固的细胞壁屏障的细胞。用根癌农杆菌(Agrobacterium tumefaciens)的感染用于转化某些植物细胞。对于没有此类细胞壁的哺乳动物细胞，可以使用磷酸钙沉淀。为植物细胞(见例如，Shaw et al.，(1983)Gene，23:315，WO89/05859)、哺乳动物细胞(见例如，美国专利号4,399,216，Keown et al.，Methods in Enzymolog.，(1990)185:527；Mansour et al.，(1988)Nature 336:348)，或酵母细胞(见例如，Val Solingen et al.，(1977)J Bact(1977)130:946，Hsiao et al.，(1979)Proc.Natl.Acad.Sci.，76:3829)描述了转化的一般方面。其他将DNA导入宿主细胞的方法包括，但不限于，核显微注射、电穿孔、与完整细胞的细菌原生质体融合，或者使用聚阳离子，如1，5-二甲基-1，5-二氮十一亚甲基聚甲溴化物或聚鸟氨酸。

6.生产和纯化

在适合产生融合多肽的条件下培养含有表达载体的细胞，然后回收并纯化所述融合多肽或经切割的成熟重组蛋白(即，有或者没有前体肽序列的表达蛋白)。通常，将被回收的蛋白质是同种型融合多肽(例如，含有与表位标记或其他融合序列的融合物)或同种型(切割前体肽后)，或两者。将显而易见的是，当融合多肽被分泌并且前体肽在加工期间被切割时，将被回收的蛋白质将是同种型蛋白质，或者其修饰形式。在一些情况中，将设计融合多肽使得在前体肽序列和同种型蛋白质之间存在额外的氨基酸，如限制酶接头位点。在这些情况下，前体肽从融合多肽的切割可以产生在N-末端具有额外氨基酸的经修饰的同种型多肽。由于存在限制酶接头序列，可以掺入分泌的多肽的N-末端的额外氨基酸的非限制性实例包括例如，SR或LE。备选地，可以设计融合多肽使得前体肽不被完全加工，使得得到前体多肽的不完全切割。例如，对于tPA前体序列，可以在弗林蛋白酶切割位点或者纤溶酶样切割位点发生不完全切割。当在纤溶酶样切割位点发生不完全切割时，可以产生经修饰的同种型，其具有改变的N-末端，包括例如加入氨基酸GAR。在一些实例中，可以用纤溶酶样蛋白酶处理纯化的同种型，得到在其N-末端不保留GAR序列的多肽。

经修饰的CSR和配体同种型可以在N-末端包括一个或多个额外的氨基酸。这些额外氨基酸可以包括，但不限于，GAR、SR、LE或其组合，如GARSR(SEQ ID NO:563)或GARLE(SEQ ID NO:564)。此外，分泌的多肽在分泌的同种型多肽的N-末端包括标记氨基酸序列以及其他序列。

可以使用本领域公知的多种技术分离同种型融合多肽。本领域技术人员可以容易按照已知的分离多肽和蛋白质的方法以便得到本文提供的分离的多肽或蛋白质之一。这些方法包括，但不限于，免疫层析、HPLC、大小排阻层析、和离子交换层析。离子交换层析的实例包括阴离子和阳离子交换并且包括使用DEAE琼脂糖(Sepharose)、DEAE交联葡聚糖(Sephadex)、CM琼脂糖、SP琼脂糖或本领域技术人员已知的任何其他相似的柱子。同种型融合多肽从细胞培养基或从裂解细胞的分离可以使用针对同种型融合多肽中的表位标记或者针对同种型多肽的抗体来促进，然后通过免疫沉淀方法分离和通过SDS-聚丙烯酰胺凝胶电泳(PAGE)分离。备选地，可以通过多肽特异性抗体与同种型融合多肽的结合和随后抗体与A蛋白或G蛋白琼脂糖柱的结合和从柱子洗脱蛋白质来分离同种型融合物。同种型融合蛋白的纯化也可以包括亲和柱或用将结合所述蛋白质的试剂固定化的柱子，接着是一个或多个柱步骤用于从结合试剂洗脱蛋白质。亲和试剂的实例包括伴刀豆球蛋白A-琼脂糖(agarose)、肝素-toyopearl或Cibacrom蓝3Ga琼脂糖。也可以使用树脂如苯基醚、丁基醚或丙基醚，通过疏水相互作用层析纯化蛋白质。

在一些实例中，可以使用免疫亲和层析纯化同种型融合蛋白。在此类实例中，同种型融合物可以作为与表位标记的融合蛋白表达，所述表位标记为如本文所述，包括但不限于，麦芽糖结合蛋白(MBP)、谷胱甘肽S-转移酶(GST)或硫氧还蛋白(TRX)，或His标记。用于表达和纯化此类融合蛋白的试剂盒可通过商业途径从New England BioLab(Beverly，Mass.)，Pharmacia(Piscataway，N.J.)，Invitrogen和其他公司得到。蛋白质也可以融合到标记并随后使用针对此类表位的特异抗体纯化。在一些实例中，亲和柱或用表位标记结合试剂固定的珠子可以用于纯化同种型融合物。例如，结合试剂可以包括用于与GST表位标记相互作用的谷胱甘肽、固定化的金属亲和试剂，如用于与多聚-His标记相互作用的Cu2+或Ni2+，抗表位抗体，如抗-myc抗体，和/或可以固定到柱子或珠子用于纯化同种型融合蛋白的任何其他试剂。

最后，使用疏水RP-HPLC介质，例如，具有甲基或其他脂肪族侧基的硅胶的一种或多种反相高效液相层析(RP-HPLC)步骤可以用于进一步纯化蛋白质。以多种组合的一些或所有前面的纯化步骤也可以用于提供基本上同质的分离的重组蛋白。

纯化前，可以浓缩含有分泌的CSR或配体同种型多肽(包括内含子融合蛋白)的条件培养基，如使用切向流滤膜或使用搅拌的细胞系统滤器。多种分子量(MW)分离截断值可以用于浓缩方法。例如，可以使用10,000MW的分离截断值。

7.合成的同种型

提供了多种合成形式的同种型。它们包括缀合物，其中同种型或其内含子编码的部分直接或通过接头连接到另一物质，如寻靶试剂，或连接到为CSR或配体同种型提供内含子编码的部分或同种型部分的分子，从而同种型的活性受体调节。其他合成形式包括嵌合体，其中细胞外结构域部分和C-末端部分，如内含子编码的部分来自不同的同种型。还提供了“肽模拟物”同种型，其中肽主链中的一个或多个键被生物等构物或其他键代替，使得所得到的多肽肽模拟物与未修饰的形式相比具有改进的性质，如对蛋白酶的抗性。

同种型缀合物

CSR或配体同种型，包括本文提供的同种型融合物，也可以作为同种型和另一物质之间的缀合物提供。缀合物可以用于靶定到同种型相互作用的受体和/或靶定到另一被靶向的受体用于递送同种型。此类缀合物包括CSR或配体同种型或同种型融合物与被寻靶的物质和/或寻靶物质的连接。可以通过任何合适的方法产物缀合物，包括化学缀合或化学偶联，通常通过存在于或加入组分中的半胱氨酸残基之间的二硫键，或者通过酰胺键或其他合适的键。也考虑离子键或其他键。也可以在同种型融合物内产生同种型与一种或多种寻靶物质的缀合物，通过将编码被寻靶的物质或寻靶物质的DNA(具有或没有接头区)与编码CSR或配体同种型或同种型融合物，如tPA-内含子融合蛋白融合物有效连接可以产生所述缀合物。

可以从CSR和配体同种型或同种型融合缀合物制备药物组合物并且通过施用例如生理学上可接受的赋形剂中的治疗有效量的缀合物实现治疗。同种型缀合物也可以用于体内疗法中，例如，通过递送含有编码作为融合蛋白的CSR或配体同种型缀合物的核酸的载体。

同种型缀合物可以包括一种或多种CSR或配体同种型，其直接或通过接头连接到一种或多种被靶定的物质:(CSR同种型)n，(L)q，和(被靶定的物质)m，其中至少一种同种型直接或通过一个或多个接头(L)连接到至少一种被靶定的物质。此类缀合物也可以用同种型的任一部分产生，所述部分足够结合到靶标，如用于治疗的靶细胞类型。设想在缀合物元件中任何合适的结合和任何数目的元件，其中n和m是大于1的整数，q为0或任何大于1的整数，只要所得的缀合物与被靶定的受体或被靶定的细胞类型相互作用。

被靶定的物质的实例包括药物和其他细胞毒性分子，如在细胞表面或通过细胞表面作用的毒素和在细胞内作用的细胞毒性分子。此类部分的实例包括，放射性核素(放射性原子，其衰变而递送例如电离性α粒子或者β粒子，或者X射线或γ射线)，所述放射性核素当偶联到同种型时可以被靶定。其他实例包括通过与同种型偶联可以被靶定的化学治疗剂。例如，格尔德霉素靶定蛋白体。同种型-格尔德霉素分子可以被导向细胞内蛋白体，降解被靶定的同种型并在蛋白体释放格尔德霉素。其他毒性分子包括毒素，如蓖麻毒蛋白、肥皂草毒蛋白和来自贝类或软体动物门的其他成员的天然产物。与被靶定物质的缀合物的另一实例是例如作为蛋白质融合物与抗体或抗体片段偶联的CSR或配体同种型。例如，同种型(包括同种型融合物，如tPA内含子融合蛋白融合物)可以偶联到抗体的Fc片段，其结合特定细胞表面标记以在嗜中性粒细胞、自然杀伤细胞和巨噬细胞中诱导杀伤性T细胞活性。多种毒素是本领域技术人员公知的。

同种型缀合物也可以含有直接或通过接头连接到一个或多个寻靶物质的一个或多个CSR或配体同种型:(CSR同种型)n，(L)q，和(寻靶物质)m，其中至少一个同种型直接或通过一个或多个接头(L)连接到至少一个寻靶物质。设想缀合物元件中的任何合适的结合和任何数目的元件，其中n和m是大于1的整数，q为0或者大于1的任何整数，只要所得的缀合物与靶标如被靶定的细胞类型相互作用。

寻靶物质包括将CSR或配体同种型靶向靶标如特定组织或细胞类型或器官的任何分子。寻靶物质的实例包括细胞表面抗原、细胞表面受体、细胞表面上或细胞膜内的蛋白质、脂类和糖类部分、在细胞表面上加工的分子、分泌的和其他细胞外分子。可用作寻靶物质的分子包括，但不限于，有机化合物；无机化合物；金属络合物；受体；酶；抗体；蛋白质；核酸；肽核酸；DNA；RNA；多核苷酸；寡核苷酸；寡糖；脂类；脂蛋白；氨基酸；肽；多肽；肽模拟物；糖类；辅因子；药物；前体药物；凝集素；糖；糖蛋白；生物分子；大分子；生物聚合物；聚合物；和其他此类生物材料。可用作寻靶物质的示例性分子包括受体的配体，如蛋白质性质的配体和小分子配体；和抗体和结合蛋白，如结合抗原的蛋白质。

备选地，与特定受体(或几种受体)特异相互作用的CSR或配体同种型是寻靶物质并且它连接到被寻靶的物质，如毒素、药物或核酸分子。核酸分子可以在被靶定的细胞中转录和/或翻译或者它可以是调节性核酸分子。

CSR或配体同种型可以直接连接到被寻靶的物质(或者寻靶物质)或者可以通过接头间接连接。接头包括肽和非肽接头并且可以为了功能性而被选择，如以便减轻或减小被靶定的物质或寻靶物质与同种型接近导致的位阻和/或增加或改变缀合物的性质，如特异性、毒性、溶解性、血清稳定性和/或细胞内可利用性和/或增加CSR同种型和被靶定的物质或寻靶物质之间连接的柔性。接头和缀合方法的实例是本领域已知的(见例如，WO00/04926)。本文提供的同种型也可以用脂质体和直接递送被包裹或捕获的分子的其他此类部分来靶定。

8.多聚体的形成

本文还提供了同种型(包括具有连接的前原序列或其部分的同种型)的多聚体。同种型多聚体可以是共价连接的、非共价连接的或化学连接的多聚体以形成同种型的二聚体、三聚体或更高级别的多聚体。多聚体的多肽成分可以是相同或不同的。通常，本文提供的同种型多聚体的组分是SEQID NO:31-47的任一个中给出的一种或多种同种型融合物，其编码SEQ IDNO:32-48任一个中给出的多肽。在一些实例中，多聚体也可以在经修饰的CSR或配体同种型(例如，在N-末端含有一个或多个额外的氨基酸的CSR或配体同种型)之间形成。这些额外的氨基酸包括，但不限于，GAR、SR、LE或其组合，如GARSR(SEQ ID NO:563)或GARLE(SEQ ID NO:564)。可以用于多聚体的CSR或配体同种型(包括其修饰形式)的示例性多肽和编码核酸序列在SEQ ID NO:139-354的任一个中给出，和其变体。

同种型多肽的多聚体可以通过二聚化，如Fc结构域之间的相互作用形成，或者它们可以共价连接。两个同种型多肽之间的多聚化可以是自发的，或者可以由于两个或多个多肽之间强制连接而发生。在一个实例中，通过同种型多肽上半胱氨酸残基之间形成的二硫键连接多聚体。在额外实例中，通过化学键，如通过使用杂双功能接头在两个多肽之间形成多聚体。

a.肽接头

肽接头可以用于产生多肽多聚体。在一个实例中，肽接头可以融合到第一个多肽的C-末端和第二个多肽的N-末端。该结构可以重复多次使得至少一个、优选2、3、4或更多可溶性多肽通过在它们各自末端的肽接头相互连接。例如，多聚体多肽可以具有序列Z₁-X-Z₂，其中Z₁和Z₂各自是细胞表面多肽同种型的全部或部分的序列并且其中X是肽接头的序列。在一些情况中，Z₁和/或Z₂是同种型多肽的全部或部分。在另一实例中，Z₁和Z₂是相同的或它们是不同的。在另一实例中，多肽具有Z₁-X-Z₂(-X-Z)_n的序列，其中“n”是任何整数，如通常为1或2。通常，肽接头具有足够长度使得所得的多肽是可溶的。肽接头的实例包括甘氨酸丝氨酸多肽，如-Gly-Gly＝、GGGGG(SEQ ID NO:582)、GGGGS(SEQ ID NO:580)或(GGGGS)n、SSSSG(SEQ ID NO:581)或(SSSSG)n。

连接部分描述于例如Huston et al.(1988)PNAS 85:5879-5883，Whitlow et al.(1993)Protein Engineering 6:989-995，和Newton et al.，(1996)Biochemistry。其他合适的肽接头包括美国专利号4,751,180或4,935,233中描述的那些肽接头的任一种，将所述专利引入本文作为参考。使用任何合适的常规技术，编码目的肽接头的多核苷酸可以符合读框地插入在同种型的任何地方或者N-或C-末端或者前原序列之间。

b.多肽多聚化结构域

两个或多个多肽的相互作用可以通过它们与自身能够相互作用以形成稳定结构的任何部分或其他多肽的直接或间接连接来促进。例如，单独编码的多肽链可以通过多聚化结合，其中多肽的多聚化通过多聚化结构域介导。通常，多聚化结构域提供了在第一个嵌合多肽和第二个嵌合多肽之间形成稳定的蛋白质-蛋白质相互作用。嵌合多肽包括，例如，编码同种型多肽的核酸与编码多聚化结构域的核酸的连接(直接或间接)。可以从单独的嵌合多肽的共表达产生同或杂多聚体多肽。第一个和第二个嵌合多肽可以是相同或不同的。

通常，多聚化结构域包括能够形成稳定的蛋白质-蛋白质相互作用的任何结构域。多聚化结构域可以通过免疫球蛋白序列、亮氨酸拉链、疏水区、亲水区或自由硫羟基相互作用，所述自由硫羟基在同或杂多聚体的嵌合分子之间形成分子间二硫键。此外，多聚化结构域可以包括氨基酸序列，其包含与包含孔的氨基酸序列互补的突起(protuberance)，如美国专利申请序号08/399,106中所述。可以工程化这种多聚化区域使得空间相互作用不仅促进稳定相互作用，而且进一步促进从嵌合单体的混合物形成异二聚体而不是同二聚体。通常，通过将来自第一种多肽界面的小的氨基酸侧链用较大的侧链(例如，酪氨酸或色氨酸)置换来构建突起。通过将大的氨基酸侧链用较小的氨基酸侧链(如丙氨酸或苏氨酸)置换，任选在第二种多肽的界面上产生与突起具有相同或相似大小的互补腔。

嵌合同种型多肽(如本文提供的任何同种型多肽)可以在任何地方连接，但是通常通过它的N-或C-末端连接到多聚化结构域的N-或C-末端，以最终当表达时形成嵌合多肽。

所得的嵌合多肽和从其形成的多聚体可以通过任何合适的方法纯化，所述方法如通过在A蛋白或G蛋白柱上的亲和层析。当编码不同嵌合多肽的两种核酸分子被转化到细胞中时，将形成同或异二聚体。可以调节表达的条件以便异二聚体形成比同二聚体形成有利。

i.免疫球蛋白结构域

多聚化结构域包括包含自由硫羟基部分的那些结构域，所述硫羟基部分能够反应以与额外氨基酸序列的多聚化结构域形成分子间二硫键。例如，多聚化结构域可以包括免疫球蛋白分子的部分，如来自IgG1、IgG2、IgG3、IgG4、IgA、IgD、IgM和IgE。通常，这种部分是免疫球蛋白恒定区(Fc)。已经描述了融合蛋白的制备物，所述融合蛋白含有与抗体来源的多肽的多种部分(包括Fc结构域)融合的可溶性CSR细胞外结构域多肽，见例如，Ashkenazi et al.(1991)PNAS 88:10535；Byrn et al.(1990)Nature，344:677；和Hollenbaugh和Aruffo，(1992)”Construction of Immnoglobulin FusionProteins，”in Current Protocols in Immunology，Suppl.4，pp.10.19.1-10.19.11。

抗体结合到特异抗原并且含有通过二硫键共价连接的两个相同的重链和两个相同的轻链。重链和轻链含有结合抗原的可变区，和恒定(C)区。在每条链中，一个结构域(V)取决于分子的抗体特异性具有可变氨基酸序列。另一个结构域(C)具有在相同类别的分子中共同的相当恒定的序列。所述结构域在序列中从氨基末端开始编号。例如，IgG轻链由以V_L-C_L顺序从N-到C-末端连接的两个免疫球蛋白结构域(分别称作轻链可变结构域和轻链恒定结构域)组成。IgG重链由以V_H-C_H1-C_H2-C_H3的顺序从N-到C-末端连接的四个免疫球蛋白结构域组成，所述结构域称作可变重链结构域、恒定重链结构域1、恒定重链结构域2和恒定重链结构域3。所得的抗体分子是四链分子，其中每条重链通过二硫键连接到轻链，两条重链通过二硫键相互连接。重链的连接通过重链的柔性区域(称作铰链区)介导。例如，通过酶促切割可以产生抗体分子的片段。例如，当通过木瓜蛋白酶进行蛋白酶切割时，切割开了重链恒定区(Fc结构域)的二聚体与两个Fab区(即，含有可变区的部分)。

在人类中，有五种抗体同种型，它们基于它们的重链分类，所述同种型被称作:δ、γ、μ、和α和ε，分别得到抗体的IgD、IgG、IgM、IgA和IgE类别。IgA和IgG类别含有亚类IgA1、IgA2、IgG1、IgG2、IgG3和IgG4。免疫球蛋白重链之间的序列差异导致多种同种型，它们在例如C结构域的数目、铰链区的存在和链间二硫键的数目和位置中不同。例如，IgM和IgE重链含有额外的C结构域(C4)，其代替铰链区。IgG、IgD和IgA的Fc区通过它们的Cγ3、Cδ3和Cα3结构域相互配对，而IgM和IgE的Fc区通过它们的Cμ4和Cε4结构域二聚化。IgM和IgA形成多聚体结构，分别具有10个和4个抗原结合位点。

本文提供的免疫球蛋白嵌合多肽包括全长免疫球蛋白多肽。备选地，免疫球蛋白多肽小于全长，如，含有重链、轻链、Fab、Fab2、Fv或Fc。在一个实例中，免疫球蛋白嵌合多肽装配为单体或杂或同多聚体，尤其二聚体或四聚体。不同结构的链或基本单位可以用于装配单体和杂和同多聚体。例如，同种型多肽可以融合到免疫球蛋白分子的全部或部分，包括免疫球蛋白分子的C_H、C_L、V_H或V_L结构域的全部或部分(见例如，美国专利申请5,116,964)。通过用合适的核酸分子转化的哺乳动物可以容易地产生和分泌嵌合同种型多肽。分泌的形式包括其中同种型多肽存在于重链二聚体；轻链单体或二聚体；和重链和轻链杂四聚体的那些形式，其中同种型多肽融合到一个或多个轻链或重链，包括这样的杂四聚体，其中高达并且包括所有四个可变区类似物被替代。在一些实例中，可以将一个或一个以上的核酸融合分子转化到宿主细胞中以产生多聚体，其中该多聚体的同种型部分相同或不同。在一些实例中，存在非同种型多肽轻-重链可变样结构域，从而产生杂双功能抗体。在一些实例中，可以使嵌合多肽融合到缺少铰链二硫键的免疫球蛋白分子的部分，其中两个多肽的非共价或共价相互作用将所述分子结合成同或异二聚体。

(a)Fc结构域

通常，免疫球蛋白部分包括免疫球蛋白多肽的重链，通常重链的恒定结构域。人IgG亚型的重链恒定区的示例性序列是已知的。例如，对于SEQID NO:565中给出的示例性重链恒定区，CH1结构域对应于氨基酸1-98，铰链区对应于氨基酸99-110，CH2结构域对应于氨基酸111-223，CH3结构域对应于氨基酸224-330。

在一个实例中，免疫球蛋白多肽嵌合蛋白可以包括免疫球蛋白多肽的Fc区。通常，这种融合物保留至少功能活性铰链、免疫球蛋白重链恒定区的C_H2和C_H3结构域。例如，IgG1的全长Fc序列包括SEQ ID NO:565中给出的序列的氨基酸99-330。许多Fc结构域是已知的，包括可变Fc结构域，其T细胞活性被减小或去除。进行连接的精确位点不是关键的:具体的位点是公知的并且可以被选择以便优化同种型多肽的生物活性、分泌或结合特征。Fc结构域的示例性序列在SEQ ID NO:566和567中给出。

除了hIgG1 Fc之外，在本文提供的同种型多肽中也可以包括其他Fc区。例如，当通过Fc/FcγR相互作用介导的效应子功能将被减小时，设想与IgG同种型融合，所述IgG同种型不足地募集补体或效应细胞，如IgG2或IgG4的Fc。此外，Fc融合物可以含有免疫球蛋白序列，该序列基本上由属于任一抗体类别的免疫球蛋白基因编码，包括，但不限于IgG(包括人亚类IgG1、IgG2、IgG3或IgG4)、IgA(包括人亚类IgA1和IgA2)、IgD、IgE、和IgM类别的抗体。此外，接头可以用于共价连接Fc到另一多肽以产生Fc嵌合体。

经修饰的Fc结构域也是已知的(关于示例性修饰见，例如美国专利公布号US 2006/0024298；和国际专利公布号WO 2005/063816)。在一些实例中，Fc区是使得它与野生型免疫球蛋白重链的Fc区的效应子功能相比具有改变的(即更多或更少)效应子功能。抗体的Fc区与许多Fc受体和配体相互作用，赋予多种重要的功能能力，称作效应子功能。Fc效应子功能包括，但不限于，Fc受体结合、补体结合，和T细胞耗尽活性(见例如，美国专利号6,136,310)。测定T细胞耗尽活性、Fc效应子功能和抗体稳定性的方法是本领域已知的。例如，IgG分子的Fc区与FcγR相互作用。这些受体在多种免疫细胞中表达，所述细胞包括例如，单核细胞、巨噬细胞、嗜中性粒细胞、树突细胞、嗜酸性粒细胞、肥大细胞、血小板、B细胞、大颗粒淋巴细胞、朗格汉斯细胞、自然杀伤(NK)细胞，和γδT细胞。Fc/FcγR复合体的形成将这些效应细胞募集到结合抗原的位点，通常导致细胞内的信号转导事件和随后重要的免疫应答，如释放炎性介体、B细胞活化、胞吞作用、吞噬作用，和细胞毒性攻击。介导细胞毒性和吞噬效应子功能的能力是抗体借以破坏被靶定细胞的潜在机理。表达FcγR的细胞毒性细胞对靶细胞上结合的抗体的识别和裂解被称作抗体依赖性细胞毒性(ADCC)。多种抗体同种型的其他Fc受体包括FcεRs(IgE)、FcαRs(IgA)和FcμRs(IgM)。

从而，经修饰的Fc结构域可以具有改变的亲和性，包括但不限于，对Fc受体的增加的亲和力或低亲和力或无亲和力。例如，不同的IgG亚类对FcγR具有不同的亲和力，IgG1和IgG3通常比IgG2和IgG4实质上更好地结合受体。此外，不同的FcγR介导不同的效应子功能。FcγR1、FcγRIIa/c和FcγRIIIa是免疫复合体引发的活化的正调节物，其特征是具有细胞内结构域，该结构域具有基于免疫受体酪氨酸的活化基序(ITAM)。然而，FcγRIIb具有基于免疫受体酪氨酸的抑制基序(ITIM)并且因此是抑制性的。从而，改变Fc区对受体的亲和力可以调节Fc结构域诱导的效应子功能。

在一个实例中，使用为了优化结合到某些FcγR以更好地介导效应子功能，如ADCC而被修饰的Fc区。此类经修饰的Fc区可以含有对应于SEQ ID NO:566中给出的示例性Fc序列的G20S、G20A、S23D、S23E、S23N、S23Q、S23T、K30H、K30Y、D33Y、R39Y、E42Y、T44H、V48I、S51E、H52D、E56Y、E56I、E56H、K58E、G65D、E67L、E67H、S82A、S82D、S88T、S108G、S108I、K110T、K110E、K110D、A111D、A114Y、A114L、A114I、I116D、I116E、I116N、I116Q、E117Y、E117A、K118T、K118F、K118A和P180L的任何一个或多个的修饰，或其组合。含有这些突变的经修饰的Fc可以具有对FcR的增强的结合，如活化受体FcγIIIa和/或可以具有对抑制性受体FcγRIIb的减弱的结合(见例如，US2006/0024298)。经修饰而具有对FcR的增强的结合的Fc区可以更有效地促进患者中癌细胞的破坏(甚至当连接同种型多肽时)。抗体破坏肿瘤细胞有许多可能的机理，包括通过阻断所需的生长途径而抗增殖、导致凋亡的细胞内信号转导、受体的增强的下调和/或更新、ADCC、和通过促进适应性免疫应答。

在另一实例中，具有减小或去除与FcγR的结合的替代的多种Fc突变体也是已知的。此类突变蛋白可以用于需要减小或消除Fc介导的效应子功能的情况中。通常存在这样的情况:需要拮抗但不是杀死带有靶抗原的细胞。此类Fc的实例是美国专利号5,457,035中描述的Fc突变蛋白。示例性Fc突变蛋白在SEQ ID NO:568中给出。

在额外实例中，可以利用Fc区，其对FcRn的结合受到修饰，从而改善Fc嵌合多肽的药物动力学。FcRn是新生的FcR，其结合将来自内体的内吞抗体返回到血流中。该过程与由于全长分子的大尺寸引起的肾过滤的排阻相偶联，导致有利的抗体血清半寿期(1到3周)。Fc与FcRn的结合在抗体运输中也起作用。

通常，多肽多聚体是通过将两个相同或不同的同种型多肽与Fc多肽直接或间接连接产生的两个嵌合蛋白的二聚体。在一些实例中，将编码同种型-Fc嵌合蛋白的基因融合物(具有如本文所述的前原序列)插入到合适的表达载体中。所得的Fc嵌合蛋白可以在用重组表达载体转化的宿主细胞中表达，并且允许像抗体分子一样装配，其中在Fc部分之间形成链间二硫键以产生二价多肽。通常，宿主细胞和表达系统是哺乳动物表达系统以允许糖基化而稳定Fc蛋白。也可以使用其他宿主细胞，其中不考虑在该位置的糖基化。

通过在A蛋白或G蛋白柱上的亲和层析可以容易地纯化所得的含有Fc部分的嵌合多肽和从其形成的多聚体。当编码不同的嵌合多肽的两个核酸分子被转化到细胞中时，异二聚体的形成必须通过生物化学方法实现，因为携带Fc结构域的嵌合分子将也作为二硫键连接的同二聚体表达。从而，同二聚体可以在有利于破坏链间二硫键但是不影响链内二硫键的条件下还原。通常，将具有不同细胞外部分的嵌合单体以等摩尔量混合并氧化以形成同二聚体和异二聚体的混合物。通过层析技术分离该混合物的组分。备选地，该类型异二聚体的形成可以通过遗传工程化并表达融合分子使得存在偏倚，所述融合分子含有同种型多肽，接着是hIgG的Fc结构域，接着是c-jun或c-fos亮氨酸拉链(见下文)。因为亮氨酸拉链主要形成异二聚体，所以它们可以用于驱动形成异二聚体(希望时)。也可以将含有Fc区的嵌合多肽工程化以包括具有金属螯合物的标记或其他表位。带标记的结构域可以用于通过金属螯合物层析和/或通过抗体快速纯化，以允许检测蛋白质印迹、免疫沉淀或生物测定中的活性耗尽/阻断。

(b)突起-到-腔(即隆突和孔)

可以将多聚体工程化为在第一个嵌合多肽和第二个嵌合多肽之间含有界面以相对于同寡聚化促进异寡聚化。通常，第一个和第二个嵌合多肽之一或两者的多聚化结构域是修饰的抗体片段使得抗体分子的界面被修饰以方便和/或促进异二聚化。在一些情况中，抗体分子是经修饰的Fc区。从而，修饰包括向第一个Fc多肽导入突起和向第二个Fc多肽中导入腔，使得突起可位于腔中以促进第一个和第二个含有Fc的嵌合多肽的复合。

通常，第一个嵌合多肽和第二个嵌合多肽的稳定相互作用是通过相同或不同的多聚化结构域的界面相互作用，所述结构域含有免疫球蛋白恒定结构域的CH3结构域的足够部分。多种结构和功能数据提示抗体重链结合通过CH3结构域指导。例如，X射线晶体学已经表明Fc区中人IgG1重链的分子间结合包括CH3结构域之间的广泛蛋白质/蛋白质相互作用，而糖基化的CH2结构域通过它们的糖类相互作用(Deisenhofer et al.(1981)Biochem.20:2361)。此外，有两个重链间二硫键，其足够在哺乳动物细胞中的抗体表达期间形成，除非重链被截短以除去CH2和CH3结构域(Kinget al.(1992)Biochem.J.281:317)。从而，重链装配似乎促进二硫键形成而不是反之亦然。CH3结构域的界面的工程化促进形成不同重链的异多聚体并且阻止对应的同多聚体的装配(见，例如，美国专利号5,731,168；国际专利申请WO 98/50431和WO 2005/063816；Ridgway et al.(1996)ProteinEngineering，9:617-621)。

从而，可以在第一个和第二个嵌合同种型多肽(第一个和第二个多肽可以是相同或不同的)的界面之间形成本文提供的多聚体，其中第一个多肽的多聚化结构域含有Fc结构域的CH3界面的至少足够的部分，其已经被修饰而含有突起，并且第二个多肽的多聚化结构域含有Fc结构域的CH3界面的至少足够的部分，其已经被修饰而含有腔。被修饰的CH3界面的全部或足够部分可以来自IgG、IgA、IgD、IgE或IgM免疫球蛋白。为了多种免疫球蛋白分子的CH3结构域的修饰而被靶定的界面残基在美国专利号5,731,168中给出。通常，多聚化结构域是来自IgG抗体如IgG1的CH3结构域的全部或足够的部分。

为了置换和/或修饰以在多肽中产生突起或腔而被靶定的氨基酸通常是界面氨基酸，其与第二个多肽的界面中的一个或多个氨基酸相互作用或接触。被修饰而含有突起氨基酸的第一个多肽包括将天然或最初的氨基酸用具有至少一个侧链的氨基酸置换，后一氨基酸从第一个多肽的界面伸出并且因此可位于第二个多肽的相邻界面中的互补腔中。通常，置换氨基酸是比最初的氨基酸残基具有更大侧链体积的氨基酸。本领域技术人员可以确定和/或评估氨基酸残基的性质以鉴定那些氨基酸残基，其对于产生突起为理想的置换氨基酸。通常，用于形成突起的置换残基是天然存在的氨基酸残基并且包括例如，精氨酸(R)、苯丙氨酸(F)、酪氨酸(Y)或色氨酸(W)。在一些实例中，为置换鉴定的最初的残基是具有小侧链的氨基酸残基，如丙氨酸、天冬酰胺、天冬氨酸、甘氨酸、丝氨酸、苏氨酸或缬氨酸。

经修饰而含有腔的第二个多肽是包括用具有至少一个侧链的氨基酸对天然或最初氨基酸的置换的多肽，所述具有至少一个侧链的氨基酸从第二个多肽的界面凹陷并且能够容纳来自第一个多肽的界面的对应的突起。通常，置换氨基酸是具有比最初的氨基酸残基较小侧链体积的氨基酸。本领域技术人员可以确定和/或评估氨基酸残基的性质以鉴定对于腔的形成为理想的置换残基的那些残基。通常，用于形成腔的置换残基是天然存在的氨基酸并且包括例如，丙氨酸(A)、丝氨酸(S)、苏氨酸(T)和缬氨酸(V)。在一些实例中，为置换鉴定的最初氨基酸是具有大侧链的氨基酸，如酪氨酸、精氨酸、苯丙氨酸或色氨酸。

人IgG1的CH3界面例如涉及位于四条反平行的β链上的每个结构域上的16个残基，其从每个表面埋藏1090

2(见例如，Deisenhofer et al.(1981)Biochemistry，20:2361-2370；Miller et al.，(1990)J Mol.Biol.，216，965-973；Ridgway et al.，(1996)Prot.Engin.，9:617-621；美国专利5,731,168)。CH3结构域修饰以产生突起或腔描述于例如美国专利5,731,168；国际专利申请WO98/50431和WO 2005/063816；和Ridgway et al.，(1996)Prot.Engin.，9:617-621。例如，CH3结构域中的修饰以产生突起或腔可以是对应于SEQ ID NO:565中给出的序列的界面氨基酸Q230、V231、Y232、T233、L234、V246、S247、L248、T249、C250、L251、V252、K253、G254、F255、Y256、K275、T276、T277、P278、V279、L280、D281、G285、S286、F287、F288、L289、Y290、S291、K292、L293、T294和V295的任一氨基酸的置换。在一些实例中，为了产生突起或腔而对CH3结构域的修饰通常靶定位于两个中心的反平行β链的残基。目的是使得如下的风险降低到最小:产生的突起通过伸入到周围的溶剂而被容纳而不是被配偶体CH3结构域中的互补腔容纳。此类修饰的实例包括例如，对应于界面氨基酸T249、L251、P278、F288、Y290和K292的任一个氨基酸的置换。用于修饰CH3结构域界面以产生突起/腔相互作用的氨基酸对的实例包括T249和Y290；和F288和T277的修饰。例如，修饰可以包括T249Y和Y290T；T249W和Y290A；F288A和T277W；F288W和T277S；和Y290T和T249Y。

在一些实例中，可以进行一个以上的界面相互作用。例如，修饰可以包括例如，第一个多肽中的两个或多个修饰以产生突出和第二个多肽中的两个或多个修饰以产生腔。此类修饰的实例包括例如，第一个多肽中T249Y和F288A的修饰和第二个多肽中T277W和Y290T的修饰；第一个多肽中T277W和F288W的修饰和第二个多肽中T277S和Y290A的修饰；或第一个多肽中F288A和Y290A的修饰和第二个多肽中T249W和T277S的修饰。

关于本文所述的其他多聚化结构域，包括任一免疫球蛋白分子或其变体(如Fc结构域或其变体)的全部或部分，含有CH3突出/腔修饰的Fc变体可以结合到同种型多肽任何位置，但通常通过它的N-或C-末端结合到第一个和/或第二个同种型多肽的N-或C-末端以形成嵌合多肽。连接可以是直接的或者通过接头间接连接。而且，嵌合多肽可以是融合蛋白或者可以通过化学键形成，如通过共价或非共价相互作用。通常，通过连接到含有CH3突出修饰的Fc变体的第一个同种型多肽与连接到含有CH3腔修饰的Fc变体的第二个同种型多肽的共表达产生隆突和孔分子。

ii.亮氨酸拉链

用于制备多聚体的另一种方法涉及使用亮氨酸拉链结构域。亮氨酸拉链是促进蛋白质多聚化的肽，在所述蛋白质中发现所述亮氨酸拉链。通常，亮氨酸拉链是用于指含有四到五个亮氨酸残基的重复七残基基序的术语，所述基序作为一些蛋白质中的保守结构域存在。亮氨酸拉链作为短的平行的卷曲螺旋折叠，并且可以负责它们形成结构域的蛋白质的寡聚化。亮氨酸拉链最初在几种DNA结合蛋白中被鉴定(见例如，Landschulz et al.(1988)Science 240:1759)，并且从那以后已经在多种蛋白质中被发现。在已知的亮氨酸拉链中包括二聚化或三聚化的天然存在的肽和其衍生物。含有直接或间接连接到亮氨酸拉链肽的同种型多肽的重组嵌合蛋白可以在合适的宿主细胞中表达，并且形成的多肽聚合物可以从培养上清液中回收。

亮氨酸拉链结构域作为短的平行的卷曲螺旋折叠(O’Shea et al.(1991)Science，254:539)。已经表征了平行的卷曲螺旋的一般结构体系，具有“隆突到孔中”堆积，其首先由Crick在1953年(Acta Crystallogr.，6:689)提出。通过亮氨酸拉链结构域形成的二聚体通过七残基重复序列(称作(abcdefg)n)稳定化(见例如，McLachlan和Stewart(1978)J.Mol.Biol.98:293)，其中残基a和d通常是疏水残基，d为亮氨酸，其在螺旋的相同表面上排列。相反电荷的残基通常在g和e位置发生。从而，在从两个螺旋亮氨酸拉链结构域形成的平行的卷曲螺旋中，通过第一个螺旋的疏水侧链形成的“隆突”堆积到第二个螺旋的侧链之间形成的“孔”中。

位置d的亮氨酸残基对大的疏水稳定化能量有贡献，并且对于二聚体形成是重要的(Krystek et al.(1991)Int.J.Peptide Res.38:229)。疏水稳定化能量为从螺旋单体形成卷曲螺旋提供了主要的驱动力。静电相互作用也促进卷曲螺旋的化学计量和几何形状。

(a)fos和jun

两种核转化蛋白fos和jun显示出亮氨酸拉链结构域，鼠原癌基因c-myc的基因产物也是如此。亮氨酸拉链结构域对于这些蛋白质中的生物活性(DNA结合)是必须的。核癌基因fos和jun的产物含有亮氨酸拉链结构域，其优先形成异二聚体(O’Shea et al.(1989)Science，245:646；Turner和Tijian(1989)Science，243:1689)。例如，已经表明人转录因子c-jun和c-fos的亮氨酸拉链结构域以1:1的化学计量形成稳定的异二聚体(见，例如，Busch和Sassone-Corsi(1990)Trends Genetics，6:36-40；Gentz et al.，(1989)Science，243:1695-1699)。尽管也已经表明形成jun-jun同二聚体，但是它们比jun-fos异二聚体的稳定性低约1000倍。

从而，通常使用jun-fos组合产生本文提供的同种型多肽多聚体。通常，c-jun或c-fos的亮氨酸拉链结构域通过遗传工程化的融合基因符合读框地融合在多肽同种型的C-末端。c-jun或c-fos亮氨酸拉链结构域的示例性序列分别在SEQ ID NO:569和570中给出。在一些实例中，可以修饰亮氨酸拉链的序列，如通过加入半胱氨酸残基以允许形成二硫键，或者通过在C-末端加入酪氨酸残基以方便肽浓度的测量。经修饰的c-jun或c-fos的亮氨酸拉链结构域的示例性序列分别在SEQ ID NO:571和572中给出。此外，同种型多肽与亮氨酸拉链的连接可以是直接的或者可以使用柔性接头结构域，如IgG的铰链区，或者其他小氨基酸多肽接头，如不同长度和组合的甘氨酸、丝氨酸、苏氨酸或丙氨酸。在一些情况中，通过与编码蛋白酶切割位点，如凝血酶切割位点的序列融合，可以实现亮氨酸拉链与所编码多肽的C-末端的分离。此外，嵌合蛋白可以例如通过6Xhis标记标记，以允许通过金属螯合物层析快速纯化和/或通过抗体可利用的表位标记(如myc标记)，以允许在蛋白质印迹、免疫沉淀、或者活性耗尽和/或阻断生物测定法中检测。

(b)GCN4

亮氨酸拉链结构域也在核蛋白中发生，所述核蛋白作为参与酿酒酵母中氮的一般控制(GCN4)代谢的基因家族的转录激活物。GCN4亮氨酸拉链结构域的示例性序列在SEQ ID NO:573中给出。该蛋白质能够二聚化并结合含有GCN4的识别序列的启动子序列，从而在氮缺乏时激活转录。在代表GCN4亮氨酸拉链结构域的合成多肽的a和d残基中的氨基酸替代改变亮氨酸拉链结构域的寡聚化性质。例如，当在a位的所有残基都改变为异亮氨酸时，亮氨酸拉链仍然形成平行的二聚体。除了该改变外，当在d位的所有亮氨酸残基改变为异亮氨酸时，所得的肽在溶液中自发形成三聚体的平行的卷曲螺旋。三聚体和四聚体形式的GCN4亮氨酸拉链结构域的示例性序列分别在SEQ ID NO:574和575中给出。

iii.其他多聚化结构域

其他多聚化结构域是本领域技术人员已知的并且是促进单独产生和表达的两种或多种多肽的蛋白质-蛋白质相互作用的任一多聚化结构域。可以用于在多肽之间或之中提供蛋白质-蛋白质相互作用的其他多聚化结构域的实例包括，但不限于，bamase-barstar模块(见例如，Deyev et al.，(2003)Nat.Biotechnol.21:1486-1492)；特定蛋白质结构域的选择(见例如，Terskikh et al.，(1997)PNAS94:1663-1668和Muller et al.，(1998)FEBSLett.422:259-264)；特定肽基序的选择(见例如，de Kruif et al.，(1996)J.Biol.Chem.271:7630-7634和Muller et al.，(1998)FEBS Lett.432:45-49)；和使用二硫键用于增强稳定性(de Kruif et al.，(1996)J.Biol.Chem.271:7630-7634和Schmiedl et al.，(2000)Protein Eng.13:725-734)。另一类型多聚化结构域的实例是通过不同亚基多肽之间的蛋白质-蛋白质相互作用促进多聚化的实例，如下面对于PKA/AKAP相互作用所述。

R/PKA-AD/AKAP

利用依赖cAMP的蛋白激酶(PKA)(见例如，SEQ ID NO:576或578)和A激酶锚定蛋白(AKAPs，见例如，Rossi et al.，(2006)PNAS103:6841-6846)的锚定结构域(AD)(见例如，SEQ ID NO:577或SEQ IDNO:579)之间的调节(R)亚基之间的蛋白质-蛋白质相互作用也可以产生多聚化多肽。在PKA中发现了两种类型的R亚基(RI和RII)，每种具有α和β同种型。R亚基作为二聚体存在，对于RII，二聚化结构域位于44个氨基末端残基中。AKAP通过它们的AD结构域的相互作用与PKA的R亚基相互作用以调节它的活性。AKAP仅仅结合到二聚体R亚基。例如，对于人RIIα，AD结合到从23个氨基末端残基形成的疏水表面。

F.用于评估同种型活性的测定法

与同族CSR或配体同种型相比含有额外氨基酸的如本文提供的任一种CSR和配体同种型在该同种型的产生和纯化后保持它们的功能。此类经修饰的融合同种型包括，但不限于，由于分泌后不完全加工(如GAR)而在N末端具有额外氨基酸、存在编码的接头序列(如LE或SR)和/或存在表位标记(如c-myc或His-标记)的那些同种型。通常，同种型与全长的野生型或优势形式的同族受体或配体相比显示出结构或一种或多种活性的改变。此外，同种型可以改变(调节)同族受体或配体的活性。所有此类同种型是候选治疗剂。

当同种型显示出活性的不同时，可以用体外和体内测定法监测或筛选同种型。也可以用体外和体内测定法筛选同种型以鉴定或选择调节特定受体或途径活性的那些同种型。此类测定法是本领域技术人员公知的。本领域技术人员可以测试具体纯化的同种型与受体或配体的相互作用和/或可以测试以评估活性或与同族受体或配体相比活性的任何改变。在本文示例了一些此类测定法。

本文提供了示例性体外和体内测定法，其用于评估从融合物产生的经纯化同种型的活性，所述融合物为同种型与前体序列如tPA前/原序列和任选地表位标记的融合物。本文提供的测定法也可以用作同种型活性与野生型或优势形式的同族受体或配体活性的比较。许多测定法可应用于RTK或RTK同种型，但是可以用于评估其他CSR和CSR同种型以及调节CSR活性的其他配体同种型。此外，许多测定法，如用于CSR的激酶活性和细胞增殖活性的测定法是本领域技术人员已知的。用于RTK同种型和RTK的活性的测定法包括，但不限于，激酶测定法、同二聚化和异二聚化测定法、蛋白质:蛋白质相互作用测定法、结构测定法、细胞信号转导测定法和体内表型测定法。测定法也包括使用动物模型，包括疾病模型，其中可以观察和/或测量或评估活性。此类测定法中SCR或配体同种型(如从同种型融合物产生的同种型)的剂量反应曲线可以用于评估生物活性的调节以及测定用于体内施用的同种型的治疗有效量。在下面描述了示例性测定法。

1.激酶测定法

可以直接和间接检测和/或测量激酶活性。例如，抗磷酸酪氨酸的抗体可以用于检测RTK、RTK同种型、RTK:RTK同种型复合体的磷酸化和其他蛋白质和信号分子的磷酸化。例如，可以在RTK的配体存在下测量RTK的酪氨酸激酶活性的激活。可以通过抗-磷酸酪氨酸抗体检测磷酸根转移。可以在RTK同种型存在和不存在下测量和/或检测磷酸根转移，从而测量RTK同种型调节RTK磷酸根转移的能力。简言之，将表达RTK同种型或已经暴露于RTK同种型的细胞用配体处理。将细胞裂解并将蛋白质提取物(完整细胞提取物或分级分离的提取物)装载到聚丙烯酰胺凝胶上，通过电泳分离并转移到膜上，如用于蛋白质印迹。用抗RTK抗体进行的免疫沉淀也可以用于分级分离和分离RTK蛋白质，然后进行凝胶电泳和蛋白质印迹。可以用抗磷酸酪氨酸的抗体探测膜以检测磷酸化以及用抗RTK抗体探测以检测完整RTK蛋白。可以用对照细胞，如不表达RTK同种型的细胞和没有暴露于配体的细胞进行相同的步骤用于比较。

也可以直接测量酪氨酸磷酸化，如通过质谱法测量酪氨酸磷酸化。例如，可以测量RTK同种型对RTK磷酸化状态的影响，如通过用不同浓度的RTK同种型处理完整细胞并测量对RTK活化的影响。可以通过免疫沉淀分离RTK并用胰蛋白酶消化以产生肽片段用于通过质谱法分析。肽质谱法是一种成熟的方法，用于定量测定蛋白质的酪氨酸磷酸化程度；酪氨酸的磷酸化增加了含有磷酸酪氨酸的肽离子的质量，通过质谱法容易地从非磷酸化的肽分离该肽。

例如，已知酪氨酸-1139和酪氨酸-1248在HER2RTK中自磷酸化。可以通过经验确定或者基于多肽(如通过使用ExPASy-PeptideMass程序)预测胰蛋白酶消化的肽。酪氨酸-1139和酪氨酸-1248的磷酸化程度可以从含有这些酪氨酸的肽的质谱数据确定。此类测定法可以用于评估RTK同种型的自磷酸化程度和RTK同种型对RTK磷酸根转移的能力。

2.复合体形成

可以检测和/或测量复合体形成，如RTK和RTK同种型的二聚化和TNFR和TNFR同种型的三聚化。例如，可以将分离的多肽混合在一起并进行凝胶电泳和蛋白质印迹。也可以将CSR和/或CSR同种型加入细胞和细胞提取物，如完整细胞或分级分离的提取物中，并且可以进行凝胶电泳和蛋白质印迹。识别多肽的抗体可以用于检测单体、二聚体和其他复合形式的存在。备选地，可以在测定法中检测经标记的CSR和/或经标记的CSR同种型。

例如，此类测定法可以用于在RKT同种型存在和不存在下比较RTK的同二聚化或两种或多种RTK的异二聚化。与可以进行测定法以评估RTK同种型的同二聚化和/或它与RKT异二聚化的能力。例如，可以评估ErbB2RTK同种型与HER2、HER3和HER4异二聚化的能力。此外，可以评估HER2 RTK同种型调节HER2与自身同二聚化的能力。

3.配体结合

通常，CSR结合到一种或多种配体。配体结合调节受体的活性，从而调节例如，信号转导途径中的信号转导。可以测量CSR同种型的配体结合和CSR同种型存在下CSR的配体结合。例如，可以在CSR同种型存在或不存在(对照)下，将经标记的配体如放射性标记的配体加入纯化的或部分纯化的CSR中。免疫沉淀和放射性的测量可以用于在CSR同种型存在和不存在下定量结合到CSR的配体的量。也可以评估CSR同种型的配体结合，如通过将CSR同种型与经标记的配体温育并测定如与野生型或优势形式的对应CSR结合的量相比，CSR同种型结合的经标记配体的量。

4.受体结合

通过评估同种型与细胞的结合直接评估CSR和配体同种型。对于配体同种型，可以将结合与同族配体与细胞的结合比较。在一些实例中，可以使用竞争测定法，使用同种型和其他已知的配体或同种型用于结合到已知表达结合受体的细胞。例如，可以评估HGF同种型与HGF竞争结合MET受体的能力。通过氯胺T方法(见Nakamura et al.，(1997)，Cancer Res.57，3305-3313)可以放射性碘化HGF和HGF同种型并且可以测量¹²⁵I-HGF和¹²⁵I-HGF同种型的比活性。在用于结合测定法的多孔板中培养正常表达MET受体的细胞。将细胞在冰预冷的结合缓冲液中平衡并与多种浓度的¹²⁵I-HGF或¹²⁵I-HGF同种型温育，使用或不使用过量摩尔比的未标记的HGF或HGF同种型。对于竞争性结合测定法，将固定浓度的¹²⁵I-HGF和多种浓度的未标记的HGF或HGF同种型与细胞温育。温育期后，洗涤细胞，溶解并使用γ-计数器测量结合的经标记蛋白。

可以为一种或一种以上的细胞表面分子直接或间接测量同种型与细胞表面分子的结合。例如，免疫沉淀可以用于评估细胞表面分子结合。将细胞裂解物与同种型温育。针对抗体表面分子，如SCR(包括RTK、TNFR或其他配体受体)的抗体用于免疫沉淀复合体。使用抗同种型抗体对免疫沉淀物的蛋白质印迹来定量和/或检测复合体中同种型的量。

5.细胞增殖测定法

许多RTK，如VEGFR，涉及细胞增殖。可以测量RTK同种型对细胞增殖的影响。例如，可以将配体加入到表达RTK的细胞。可以在配体加入之前、同时或之后向此类细胞中加入RTK同种型并测量对细胞增殖的影响。备选地，例如，使用腺病毒载体，可以在此类细胞模型中表达RTK同种型。例如，可以将VEGFR同种型加入到表达VEGFR的内皮细胞。同种型加入后，加入VEGF配体并在标准生长温度(例如，37℃)下培育细胞几天。将细胞用胰蛋白酶消化，用锥虫蓝染色并计数活细胞。不暴露于VEGFR同种型和/或配体的细胞用作比较的对照。可以使用其他合适的对照。

6.促运动(motogenic)测定法

CSR或同种型配体，如从本文提供的同种型融合物产生的那些可以用于评估它们干扰配体诱导的细胞能动性的能力。例如，将内皮细胞培养在多孔板中直到牢固地附着到培养皿表面。然后加入新鲜培养基并用轻质矿物油覆盖以防止蒸发。加入含有HGF、HGF或MET同种型或其组合的培养基并用数字照相机和慢速拍摄记录器(time lapse recorder)记录图像。从来自每帧的确定数目的细胞计算移动的距离。

也可以通过内皮细胞创伤测定法评估同种型对配体诱导的细胞迁移的影响。将内皮细胞培养在平板上并生长到汇合。将细胞用82号针头伤害以产生约200μm的创伤。然后洗涤细胞并加入含有HGF或MET同种型、HGF，或其组合的新鲜培养基。如上记录细胞迁移图像，并计算创伤正面(wound front)的迁移距离。

也可以使用改良的Boyden室测定法评估细胞迁移。将内皮细胞，如人类皮肤毛细血管内皮细胞血清饥饿并接种在用13.4μg/ml纤连蛋白包被的Transwell平板(6.5mm直径聚碳酸酯膜，5μm孔径，Costar，Cambridge，MA)的内室上。向外室中加入培养基并温育一段时间，该培养基含有HGF、bFGF或VEGF，或诱导细胞迁移的其他配体，有或没有CSR或配体同种型。通过计数每孔中随机选择的显微视野中的细胞定量通过膜迁移到滤膜下表面的细胞数目。

7.细胞凋亡测定法

许多配体通过特定CSR的信号转导发挥抗细胞凋亡作用。例如，HGF对用细胞毒性剂处理的细胞发挥抗细胞凋亡作用，所述细胞毒性剂为如放射和某些癌症治疗剂，包括顺铂、喜树碱(camtothesin)、阿霉素和紫杉醇。可以测量HGF或MET同种型改变HGF处理的抗细胞凋亡作用的能力。将细胞用含有不同浓度的HGF或MET同种型和/或HGF的培养基培养。然后在温育期内将细胞接触细胞毒性剂，并使用3-(4，5-二甲基噻唑-2-基)-2，5-二苯基溴化四唑鎓(MTT，Sigma)测定法测量细胞活力。

凋亡细胞显示出特征性核断裂，其可以通过核染色显示。用HGF处理的细胞显示出应答细胞毒性剂降低的核断裂。可以评估HGF或MET同种型拮抗HGF的该效果的能力。将细胞平板接种在载玻片上并如上述用细胞毒性剂处理，接着用HGF和/或HGF或MET同种型处理。使用Hoescht 33342染料和荧光显微镜在350nm的激发波长和450nm的发射波长下观察细胞的核。用于评估CSR或配体同种型对细胞凋亡的影响的其他测定法可以包括DNA断裂测定法、DNA滤器洗脱测定法、TUNEL染色、胱天蛋白酶-3活性的测定，和/或用于诱导AKT的体外激酶活性测定法。

8.细胞疾病模型测定法

来自疾病或状况或者可以被调节成模拟疾病或状况的细胞可以用于测量和/或检测CSR同种型的作用。许多动物和体外疾病模型是本领域技术人员已知的。例如，将CSR同种型加入细胞或在细胞中表达，并测量或检测表型，与不接触或不表达CSR同种型的细胞比较。此类测定法可以用于测量影响，包括对细胞增殖、肿瘤转移、炎症、血管发生、病原体感染和骨吸收的影响。

例如，可以使用此类测定法测量MET同种型的影响。活细胞模型，如HepG2肝细胞可以用于监测子孢子对培养物中疟疾的感染性。可以将RTK同种型，如MET同种型加入到细胞中和/或在细胞中表达。然后测量疟疾子孢子对此类细胞的感染，如通过染色并计数由于感染产生的子孢子的EEF(红细胞外型)(Carrolo et al.(2003)Nat Med 9(11):1363-1369)进行测量。通过将结果与没有暴露或表达RTK同种型的细胞和/或未感染的细胞比较，可以评估RTK同种型的影响。

也可以测量CSR或配体同种型对血管发生的影响。例如，内皮细胞如人脐静脉内皮细胞(HUVEC)体外小管形成可以用作测定法以测量血管发生和对血管发生的影响。向体外血管发生测定中加入不同量的CSR或配体同种型是适于筛选CSR或配体同种型作为血管发生调节剂的有效性的方法。

可以在细胞培养物中测量骨吸收以测量CSR或配体同种型的有效性，如通过使用破骨细胞培养物。破骨细胞是造血来源的高度分化的细胞，其在生物中吸收骨并且能够在体外从骨片吸收骨。本领域中已经描述了破骨细胞的细胞培养方法和测量破骨细胞细胞培养物中骨吸收的定量技术。例如，可以从人外周血分离单核细胞并培养。CSR或配体同种型的加入和/或表达可以用于评估对破骨细胞形成的影响，如通过测量对酒石酸抗性酸性磷酸酶阳性的多核细胞和吸收的区域和从骨片释放的胶原碎片。可以用剂量反应曲线确定调节骨吸收必须的同种型的治疗有效量。

9.动物模型

动物模型可以用于评估CSR或配体同种型或其含有额外氨基酸的修饰形式的效果或活性。合适的模型是本领域技术人员已知的。在一个实例中，可以研究疾病的动物模型以确定同种型的导入是否影响该疾病。例如，可以测量CSR或配体同种型对肿瘤形成(包括癌细胞增殖、迁移和侵入性)的影响。在一个此类测定法中，用表达同种型的腺病毒感染癌细胞，如卵巢癌细胞，所述同种型为诸如最小含有有效连接到同种型序列(不存在内源信号序列)的tPA前/原序列的同种型融合物。体外培养期后，将细胞用胰蛋白酶消化，悬浮在合适的缓冲液中并注射到小鼠中(例如，皮下注射到小鼠如Balb/c裸鼠的侧腹和肩部中)。随着时间监测肿瘤生长。可以将不表达CSR或配体同种型的对照细胞注射到小鼠中用于比较。可以用其他细胞类型和动物模型进行类似的测定，所述细胞类型和动物模型为例如NIH3T3细胞、鼠肺癌(LLC)细胞、原发性胰腺腺癌(PANC-1)细胞、TAKA-1胰腺导管细胞和C57BL/6小鼠和SCID小鼠。在另一实例中，可以使用诸如角膜微囊袋(micropocket)测定法评估CSR或配体同种型对眼病症的影响。简言之，在测定前2-3天，小鼠通过注射接受表达同种型融合物(或者对照)的细胞。随后，将小鼠麻醉，将受体配体小丸植入眼的角膜微囊袋中。然后例如植入后5天测量新血管形成。然后评估与对照相比，CSR或配体同种型对血管形成和眼表型的影响。

在额外实例中，可以通过用来自已经用含有CSR或配体同种型融合物的cDNA的逆转录病毒载体转导的DBA/1小鼠的脾细胞或未修饰的脾细胞腹膜内注射SCID小鼠评估II型胶原诱导的关节炎(CIA)的模型中同种型的效果。接受未修饰的脾细胞的小鼠在11-13天内发生关节炎，并且可以用作参考对照来确定表达同种型的脾细胞对关节炎的发展的影响，例如，通过关节炎的临床的、组织学的或免疫学(如抗体水平)参数来评估。在另一实例中，可以通过在CSR或配体同种型存在或不存在下(以重组形式或通过基因疗法施用)通过单次皮内注射牛II型胶原，直接在DBA/1小鼠中诱导疾病，并在免疫后随时间(长达数周)评估关节炎的发作。

通过施用纯化或重组形式的CSR或配体同种型可以额外评估CSR同种型对疾病的动物模型的影响。例如，可以利用遗传性糖尿病db+/db+小鼠，在伤口愈合不良模型中评估伤口愈合，其中在糖尿病小鼠的背部产生完整厚度的切割伤口。用同种型局部或全身处理后，可以通过分析伤口闭合、伤口部位炎性细胞浸润，和/或炎性细胞因子的表达来评估伤口愈合。可以随时间评估同种型对伤口愈合的效果，并且可以将效果与接受对照处理，如仅仅载体的对照处理的小鼠相比较。在另一实例中，可以在通过博来霉素或二氧化硅诱导的肺纤维化模型中施用从同种型融合，如tPA内含子融合蛋白融合物产生的重组同种型，以确定肺纤维化是否减轻，如通过分析肺损伤的组织学切片和通过测定对博来霉素/二氧化硅诱导的肺羟脯氨酸含量的增加的影响来评估。

CSR或配体同种型缺陷的动物也可以用于监测同种型的生物活性。例如，通过产生定向构建体进行同种型特异性破坏，在所述构建体中，在IRES-LacZ盒上游在合适的读框内导入翻译终止密码子以确保受体或配体蛋白质及早终止。备选地，可以使用LoxP/Cre重组策略。证实被定向破坏后，通过分析与野生型小鼠相比缺陷小鼠的表型来建立CSR或配体同种型中缺陷的后果，所述表型包括多种器官的发育，如肺、四肢、眼睑、前叶垂体和胰腺。此外，通过组织学或分离特定细胞群体，可以评估其他参数，如细胞凋亡或细胞增殖以确定缺少同种型的动物或分离的细胞与野生型CSR或配体之间的差异。也可以评估信号级联的组分和下游基因的表达来确定CSR同种型的缺失是否影响受体信号传递和基因表达。

CSR和配体同种型和CSR和配体同种型组合物，尤其由于分泌后不完全加工引起的在N-末端含有额外氨基酸、存在编码的接头序列或存在表位标记的经修饰的CSR和配体同种型多肽可以经配制后通过本领域技术人员已知的任一途径施用，所述途径包括肌内、静脉内、皮内、腹膜内、皮下、硬膜外、鼻、口、直肠、局部、吸入、含服(例如舌下)和经皮施用或任何途径。可以通过任何方便的途径施用CSR和配体同种型，例如通过灌注或快速浓注，通过上皮或皮肤粘膜内层(例如，口粘膜、直肠和肠粘膜等等)吸收并且可以与其他生物活性剂顺序、间歇地或在相同组合物中施用。取决于治疗部位，施用可以是局部的、表面的或者全身的。局部施用于需要治疗的区域可以如下实现，例如，但不限于，在手术期间局部灌注、表面应用，例如，在手术后与伤口敷剂一起使用，通过注射，通过导管，通过栓剂，或通过植入物。施用还可以包括控释系统，包括控释制剂和装置控释，如通过泵。在任一给定情况下最合适的途径将取决于被治疗的疾病或状况的性质和严重性和使用的具体组合物的性质。

多种递送系统是已知的并且可以用于施用CSR或配体同种型，包括本文提供的表达的或分泌的CSR和配体同种型，如但不限于，在脂质体、微粒、微囊中包裹、能够表达所述化合物的重组细胞、受体介导的内吞作用，和递送编码CSR同种型的核酸分子的递送，如逆转录病毒递送系统。

可以制备含有CSR和配体同种型的药物组合物。通常，将按照管理机构的批准制备或者根据公认的药典制备药学上可接受的组合物用于动物和人类中。药物组合物可以包括用于施用同种型的载体，如稀释剂、辅剂、赋形剂或运载体。此类药物载体可以是无菌液体，如水和油，包括石油、动物、植物或合成来源的油，如花生油、大豆油、矿物油、和芝麻油。当静脉内施用药物组合物时，水是典型的载体。盐水溶液和含水葡萄糖和甘油溶液也可以用作液体载体，尤其用于注射液。组合物可以含有与活性成分一起的:稀释剂，如乳糖、蔗糖、磷酸二钙，或者羧甲基纤维素；润滑剂，如硬脂酸镁、硬脂酸钙和滑石粉；和黏合剂，如淀粉、天然树胶，如阿拉伯胶、明胶、葡萄糖、糖蜜、聚乙烯吡咯烷酮、纤维素和其衍生物、聚维酮、交聚维酮和本领域技术人员已知的其他此类黏合剂。合适的药物赋形剂包括淀粉、葡萄糖、乳糖、蔗糖、明胶、麦芽糖、稻、面粉、白垩、硅胶、硬脂酸钠、单硬脂酸甘油酯、滑石粉、氯化钠、脱脂奶粉、甘油、丙二醇、水和乙醇。如果希望，组合物也可以含有少量湿润剂或乳化剂，或者pH缓冲剂，例如，乙酸盐、柠檬酸钠、环糊精衍生物、去水山梨糖醇单月桂酸酯、三乙醇胺乙酸钠、油酸三乙醇胺，和其他此类试剂。这些组合物可以采取溶液剂、混悬剂、乳剂、片剂、丸剂、胶囊剂、粉剂，和缓释制剂的形式。使用常规的黏合剂和载体，如甘油三酯，可以将组合物配制为栓剂。口服制剂可以包括标准载体，如药物级甘露醇、乳糖、淀粉、硬脂酸镁、糖精钠、纤维素、碳酸镁，和其他此类试剂。合适的药物载体的实例在E.W.Martin的“Remington’s Pharmaceutical Sciences”中描述。此类组合物将含有通常纯化形式的治疗有效量的化合物，以及合适量的载体，以便提供用于适当施用于患者的形式。制剂将适于施用方式。

提供制剂以单位剂型施用于人和动物，如片剂、胶囊剂、丸剂、粉剂、粒剂、无菌肠胃外溶液剂或混悬剂，和口服溶液剂或混悬剂，和水油乳剂，其含有合适量的化合物或其药学上可接受的衍生物。药学治疗活性化合物和其衍生物通常以单位剂型或多次剂型配制和施用。每个单位剂量含有预定量的治疗活性化合物，其与所需的药物载体、运载体或赋形剂结合足够产生希望的治疗效果。单位剂型的实例包括安瓿和注射器和单独包装的片剂或胶囊剂。可以以部分或其倍数施用单位剂型。多次剂型是在单个容器中包装的多个相同的单位剂型，其将以分开的单位剂型施用。多次剂型的实例包括小瓶、片剂或胶囊瓶或品脱或加仑瓶。所以，多次剂型是在包装中不分开的多个单位剂量。

可以制备含有0.005％到100％的活性成分的剂型或组合物，剩余部分由无毒载体组成。对于口服施用，药物组合物可以采取例如片剂或胶囊剂的形式，其通过常规方法用药学上可接受的赋形剂如黏合剂(例如，预胶化的玉米淀粉、聚乙烯吡咯烷酮或者羟丙基甲基纤维素)；填充剂(例如，乳糖、微晶纤维素或磷酸氢钙)；润滑剂(例如，硬脂酸镁、滑石粉或二氧化硅)；崩解剂(例如，马铃薯淀粉或淀粉羟乙酸钠)；或湿润剂(例如，十二烷基硫酸钠)制备。可以通过本领域公知的方法包衣片剂。

药物组合物也可以为液体形式，例如，溶液剂、糖浆剂或混悬剂，或者可以以药物产品给出，其在使用前用水或其他合适的运载体重构。此类液体制剂可以通过常规方法用药学上可接受的添加剂制备，所述添加剂为如悬浮剂(例如，山梨醇糖浆、纤维素衍生物或氢化食用脂肪)；乳化剂(例如，卵磷脂或阿拉伯胶)；非水性运载体(例如，杏仁油、油性酯，或者分级分离的植物油)；和防腐剂(例如，对羟基苯甲酸甲酯或丙酯或山梨酸)。

适于直肠施用的制剂可以作为单位剂量栓剂提供。这些可以通过将活性化合物与一种或多种固体载体，如可可脂混合，然后将所得混合物成型来制备。

适于局部应用于皮肤或眼睛的制剂包括软膏剂、霜剂、洗剂、糊剂、凝胶剂、喷雾剂、气雾剂和油。示例性载体包括凡士林、羊毛脂、聚乙二醇、醇类，和其两种或多种的组合。局部制剂也可以含有按重量计0.05％到15％、20％、25％的增稠剂，其选自羟丙基甲基纤维素、甲基纤维素、聚乙烯吡咯烷酮、聚乙烯醇、聚(亚烷基二醇)、聚/羟基烷基(甲基)丙烯酸酯或聚(甲基)丙烯酰胺类。通常通过滴注或作为软膏剂应用到结膜囊中来应用局部制剂。它也可以用于冲洗或润滑眼、面部窦和外耳道。也可以将它注射到眼前房(anterior eye chamber)和其他地方。液体状态的局部制剂也可以以带或者隐形眼镜的形式存在于亲水的三维聚合物基质中，活性成分从所述基质释放。

对于通过吸入施用，用于本文的化合物可以以来自加压包装或喷雾器的气雾剂喷雾的形式递送，使用合适的推进剂，如二氯二氟甲烷、三氯氟甲烷、二氯四氟乙烷、二氧化碳或其他合适的气体。对于加压的气雾剂的情况，可以通过提供用于递送计量的量的阀门来确定剂量单位。可以配制用于吸入器或吹入器中的如明胶的胶囊和药筒，其含有所述化合物和合适的粉剂基质如乳糖或淀粉的粉末混合物。

适于含服(舌下)施用的制剂包括例如，在调味基质(通常蔗糖和阿拉伯胶或西黄蓍胶)中含有活性化合物的锭剂；和在惰性基质如明胶和甘油或蔗糖和阿拉伯胶中含有化合物的软锭剂。

可以配制CSR和配体同种型的药物组合物用于通过注射，例如，通过快速浓注或连续灌注进行肠胃外施用。用于注射的制剂可以为单位剂型，例如，在安瓿或多剂量容器中，具有加入的添加剂。组合物可以为油性或水性载体中的混悬剂、溶液剂或乳剂，并且可以含有配制试剂，如悬浮剂、稳定剂和/或分散剂。备选地，活性成分可以为粉末形式，在使用前用合适的载体如无菌无致热原的水或其他溶剂重构。

适于经皮施用的制剂可以以离散的贴剂给出，适于在长时间内与接受者的表皮保持密切接触。此类贴剂合适地含有活性化合物作为活性化合物的例如0.1到0.2M浓度的任选缓冲的水溶液。适于经皮施用的制剂也可以通过离子电渗疗法(见例如，Pharmaceutical Research 3(6)，318(1986))递送并且通常采取活性化合物的任选缓冲的水溶液形式。

也可以通过控释手段和/或递送装置施用药物组合物(见，例如，美国专利号3,536,809；3,598,123；3,630,200；3,845,770；3,847,770；3,916,899；4,008,719；4,687,610；4,769,027；5,059,595；5,073,543；5,120,548；5,354,566；5,591,767；5,639,476；5,674,533和5,733,566)。

在一些实施方案中，脂质体和/或纳米颗粒也可以用于CSR同种型施用。脂质体从分散在水性介质中的磷脂形成并且自发形成多层同心双层小泡，也称作多层脂质体(MLV)。MLV通常具有25nm到4μm的直径。MLV的声处理导致形成单层小脂泡(SUV)，其具有200到

的直径，在核心中含有水溶液。

取决于脂类与水的摩尔比，磷脂当分散在水中时可以形成不同于脂质体的多种结构。在低比例下，形成脂质体。脂质体的物理特征取决于pH、离子强度和二价阳离子的存在。脂质体可以显示出对离子和极性物质的低通透性，但是在升高的温度下经历相变，其显著改变它们的通透性。相变涉及从紧密堆积的有序结构(称作凝胶态)改变为松散堆积的有序度较低的结构(称作流态)。这在特征性相变温度下发生并且导致对离子、糖和药物的通透性增加。

脂质体通过不同的机理与细胞相互作用:网状内皮系统的吞噬细胞如巨噬细胞和嗜中性粒细胞的胞吞作用；吸附到细胞表面(通过非特异性弱疏水或静电力，或者通过与细胞表面组分的特异相互作用)；通过脂质体的脂质双层插入到质膜中同时释放脂质体内容物到细胞质中而与原生质细胞膜融合；和通过将脂质体脂类转移到细胞或亚细胞膜中，或反之亦然，没有与脂质体内含物的结合。改变脂质体制剂可以改变起作用的机理，尽管一种以上的机理可以同时起作用。

纳米囊通常可以以稳定和可再现的方式捕获化合物。为了避免由于细胞内聚合物过载引起的副作用，应该使用能够在体内降解的聚合物设计此类超微颗粒(大小约0.1μm)。预期满足这些要求的生物可降解的聚氰基丙烯酸烷基酯纳米颗粒用于本文，并且可以容易地制备这些颗粒。

可以用施用方法减小CSR或配体同种型暴露于降解过程，如蛋白酶解降解和通过抗原或免疫原性应答的免疫学干预。此类方法的实例包括在治疗部位局部施用。已经报道治疗剂的聚乙二醇化增加对蛋白酶解的抗性，增加血浆半寿期，并降低抗原性和免疫原性。聚乙二醇化方法的实例是本领域已知的(见，例如，Lu和Felix，Int.J Peptide Protein Res.，43:127-138，1994；Lu和Felix，Peptide Res.，6:142-6，1993；Felix et al.，Int.J.PeptideRes.，46:253-64，1995；Benhar et al.，J.Biol.Chem.，269:13398-404，1994；Brumeanu et al.，J Immunol.，154:3088-95，1995；也见，Caliceti et al.(2003)Adv.Drug Deliv.Rev.55(10):1261-77和Molineux(2003)Pharmacotherapy 23(8Pt2):35-8S)。聚乙二醇化也可以用于在体内递送核酸分子。例如，腺病毒的聚乙二醇化可以增加稳定性和基因转移(见，例如，Cheng et al.(2003)Pharm.Res.20(9):1444-51)。

通过连续灌注活性剂可以保持所希望的血液水平，如通过血浆水平确定。应该指出主治医生将知道由于毒性或骨髓、肝脏或肾脏功能异常而怎样、何时结束、中断或者调整治疗以降低剂量。相反地，如果临床应答不足，主治医生将也知道怎样、何时调节治疗到更高的水平(排除毒副作用)。例如，通过经口、肺、肠胃外(肌内、腹膜内、静脉内(IV)或皮下注射)、吸入(通过细粉末制剂)、经皮、鼻、阴道、直肠或舌下施用途径施用活性剂并且可以将所述活性剂以适于每种施用途径的剂型配制(见例如，国际PCT申请号WO 93/25221和WO 94/17784；和欧洲专利申请613,683)。

CSR或配体同种型包括在可药用载体中，所述CSR或配体同种型的量足够在不存在不希望的副作用情况下对所治疗的患者发挥治疗有用效果。可以通过在已知的体外和体内系统，如本文提供的测定法中测试化合物，通过经验确定治疗有效浓度。

组合物中CSR或配体同种型的浓度将取决于复合体的吸收、失活和排泄速率、复合体的理化特征、剂量方案，和施用量以及本领域技术人员已知的其他因素。可以通过标准临床技术确定为了治疗疾病或病症，如癌症、自身免疫病和感染所施用的CSR或配体同种型的量。此外，可以用体外测定法和动物模型帮助鉴定最佳的剂量范围。可以通过经验确定的精确剂量可以取决于施用途径和疾病的严重性。用于施用的合适剂量范围可以为约0.01pg/kg体重到1mg/kg体重，更典型地0.05mg/kg到200mg/kg CSR:患者体重。

CSR或配体同种型可以一次施用，或者可以分成许多较小的剂量以一定的时间间隔施用。可以在治疗时间如在几小时、几天、几周或几个月内以一次或多次剂量施用CSR或配体同种型。在一些情况中，连续施用是有用的。可以理解精确剂量和治疗持续时间是被治疗的疾病的函数并且可以使用已知的测试方案根据经验确定或通过从体内或体外测试数据外推确定。还应该注意到浓度和剂量值也可以随着待减轻的疾病的严重性而变。还理解对于任何具体受试者，特定剂量方案将随时间根据个体需要和施用组合物或监督组合物施用的人的专业判断来调整，并且在本文给出的浓度范围仅仅是示例性的并且不意在限制组合物和含有它们的组合的范围或用途。

H.CSR和配体同种型的体内表达和基因疗法

CSR和配体同种型，尤其在表达和分泌后在它们的N-末端含有额外氨基酸的经修饰的CSR和配体同种型可以通过表达核酸分子递送到细胞和组织中。CSR和配体同种型可以作为编码CSR或配体同种型的核酸分子施用，包括先体外后体内(ex vivo)技术和直接体内表达。

1.核酸的递送

可以将核酸，如但不限于SEQ ID NO:31、33、35、37、39、41、43、45或47任一个中给出的任一种通过本领域技术人员已知的任一种方法递送到细胞和组织。

a.载体-附加型和整合

通过表达编码核酸分子施用CSR和配体同种型的方法包括施用重组载体。可以将载体设计成保持附加型，如通过包括复制起点或者可以设计成整合到细胞的染色体中。

CSR和配体同种型还可以用于使用非病毒载体进行先体外后体内基因表达疗法。例如，可以将细胞工程化为表达CSR和配体同种型，如通过将CSR和配体同种型编码核酸整合到基因组位置中，与调节序列有效连接或者使得它被置于基因组位置中与调节序列有效连接。然后可以将此类细胞局部或全身性施用于受试者，如需要治疗的患者。

可以使用病毒载体，包括例如，被设计用于基因疗法的腺病毒、泡疹病毒、逆转录病毒和其他病毒载体。载体可以保持为附加型或者可以整合到被治疗的受试者的染色体中。通过施用于需要治疗的受试者的病毒表达CSR或配体同种型。适于基因疗法的病毒载体包括上述腺病毒、腺伴随病毒、逆转录病毒、慢病毒和其他病毒。例如，腺病毒表达技术是本领域公知的并且腺病毒产生和施用方法也是公知的。腺病毒血清型可以例如从美国典型培养物保藏中心(ATCC，Rockville，MD)得到。腺病毒可以先体外后体内使用，例如，从需要治疗的患者分离细胞，将其用表达CSR或配体同种型的腺病毒载体转导。合适的培养期后，将转导的细胞局部和/或全身施用于受试者。备选地，分离表达CSR或配体同种型的腺病毒颗粒并以药学上可接受的载体配制用于递送治疗有效量以预防、治疗或减轻受试者的疾病或状况。典型地，以每千克受试者体重1个颗粒到10¹⁴个颗粒，通常每千克受试者体重10⁶或10⁸个颗粒到10¹²个颗粒的剂量递送腺病毒颗粒。在一些情况中，希望为核酸来源提供靶定细胞的物质，如对细胞表面膜蛋白或靶细胞特异的抗体，或者对靶细胞上受体特异的配体。

b.人工染色体和其他非病毒载体递送方法

CSR或配体同种型也可以使用非病毒载体用于先体外后体内基因表达疗法。例如，可以工程化表达CSR或配体同种型的细胞，如通过将CSR或配体同种型序列整合到基因组位置中，与调节序列有效连接或者使得它被置于基因组座位中与调节序列有效连接。然后将此类细胞局部或全身施用于受试者，如需要治疗的患者。

可以将核酸分子导入人工染色体和其他非病毒载体中。可以将人工染色体(见例如，美国专利号6,077,697和PCT国际申请号WO 02/097059)工程化为编码和表达所述同种型。

c.脂质体和其他包裹形式和含有核酸的细胞的施用

核酸可以包裹在载体如脂质体中，或者导入细胞，如细菌细胞，尤其减毒的细菌中或者导入病毒载体中。例如当使用脂质体时，结合与胞吞相关的细胞表面膜蛋白的蛋白质可以用于靶定和/或促进摄入例如壳体蛋白质或者其对特定细胞类型向性的片段，在循环中经历内化的蛋白质的抗体，和靶定细胞内定位和增强细胞内半寿期的蛋白质。

2.体外和先体外后体内递送

对于先体外后体内和体内方法，将编码CSR或配体同种型的核酸分子导入来自合适的供体或待治疗的受试者的细胞中。CSR或配体同种型的体内表达可以与额外分子的表达联系起来。例如，CSR或配体同种型的表达可以与如工程化的病毒中细胞毒性产物的表达联系起来或者在细胞毒性病毒中表达。此类病毒可以被靶向特定细胞类型，该细胞类型是治疗效果的靶标。所表达的CSR或配体同种型，尤其在它们的N-末端含有额外氨基酸的表达的和分泌的修饰形式的CSR和配体同种型可以用于增强病毒的细胞毒性。

CSR或配体同种型的体内表达可以包括将编码CSR或配体同种型的核酸分子有效连接到特定调节序列，如细胞特异性或组织特异性启动子。也可以从特异感染靶细胞类型和/或组织和/或在其中复制的载体表达CSR或配体同种型。诱导型启动子可以用于选择性调节CSR或配体同种型表达。

为了治疗目的可以导入核酸的细胞包括适于待治疗的疾病或状况的任何希望的、可利用的细胞类型，包括但不限于上皮细胞、内皮细胞、角质形成细胞、成纤维细胞、肌细胞、肝细胞；血细胞，如T淋巴细胞、B淋巴细胞、单核细胞、巨噬细胞、嗜中性粒细胞、嗜酸性粒细胞、巨核细胞、粒细胞；多种干细胞或祖细胞，尤其造血干细胞或祖细胞，例如，从骨髓、脐血、外周血、胎儿肝脏和其他来源得到的干细胞。肿瘤细胞也可以是用于体内表达CSR或配体同种型的靶细胞。用于体内表达同种型的细胞也包括患者自体的细胞。此类细胞可以从患者得到，导入用于表达CSR或配体同种型的核酸，然后通过注射或植入施用于患者。

适于在体外向哺乳动物细胞中转移核酸的技术包括使用脂质体和阳离子脂类(例如，DOTMA、DOPE和DC-Chol)、电穿孔、显微注射、细胞融合、DEAE-葡聚糖、和磷酸钙沉淀方法。DNA递送方法可以用于在体内表达CSR同种型。此类方法包括脂质体递送核酸和裸DNA递送，包括局部和系统性递送，如使用电穿孔、超声和磷酸钙递送。其他技术包括显微注射、细胞融合、染色体介导的基因转移、微细胞介导的基因转移和原生质球融合。

对于先体外后体内治疗，从与待治疗的受试者相容的供体取出细胞或从待治疗的受试者取出细胞，将核酸导入这些分离的细胞中并对受试者施用经修饰的细胞。

治疗包括直接施用，如包裹在多孔膜中，将所述多孔膜植入患者中(见，例如，美国专利号4,892,538和5,283,187)。适于在体外向哺乳动物细胞中转移核酸的技术包括使用脂质体和阳离子脂类(例如，DOTMA、DOPE和DC-Chol)、电穿孔、显微注射、细胞融合、DEAE-葡聚糖，和磷酸钙沉淀方法。DNA递送方法可以用于在体内表达CSR同种型。此类方法包括脂质体递送核酸和裸DNA递送，包括局部和全身递送，如使用电穿孔、超声和磷酸钙递送。其他技术包括显微注射、细胞融合、染色体介导的基因转移、微细胞介导的基因转移和原生质球融合。

CSR或配体同种型的体内表达可以与额外分子的表达联系起来。例如，CSR或配体同种型的表达可以与毒性产物如在工程化的病毒或者在细胞毒性病毒中表达联系起来。此类病毒可以靶定特定细胞类型，其是治疗效果的靶标。所表达的CSR或配体同种型可以用于增强病毒的细胞毒性。

CSR或配体同种型的体内表达可以包括将编码CSR或配体同种型的核酸分子有效连接到特定调节序列，如细胞特异性或组织特异性启动子。CSR或配体同种型也可以从特异感染靶细胞类型和/或组织和/或在其中复制的载体表达。诱导型启动子可以选择性调节CSR或配体同种型表达。此外，CSR或配体同种型的体内表达可以包括CSR或配体同种型编码核酸与序列(如前体序列，包括tPA前/原序列)有效连接，以实现CSR或配体同种型从靶细胞类型的分泌。

3.全身、局部和表面递送

通过全身施用、表面、局部和其他施用途径，可以将核酸分子，如裸核酸或载体、人工染色体、脂质体或其他运载体中的核酸分子施用于受试者。当全身和体内施用时，核酸分子或含有核酸分子的运载体可以被靶向细胞。

施用也可以是直接的，如通过施用通常靶向细胞或组织的载体或细胞。例如，肿瘤细胞或增殖细胞可以是为了体内表达CSR或配体同种型被靶定的细胞。用于体内表达同种型的细胞也包括患者自体的细胞。可以从患者取出此类细胞，导入用于表达CSR或配体同种型的核酸，然后如通过注射或植入对患者施用。

I.用CSR同种型的示例性治疗和研究

本文提供了用CSR或配体同种型，尤其在同种型表达和分泌后在N-末端含有一个或多个额外氨基酸的经修饰的CSR或配体同种型治疗疾病和状况的方法。经修饰的CSR或配体同种型包括例如，由于分泌后不完全加工(例如，GAR)、存在编码的接头序列(例如，LE或SR)，和/或存在表位标记(例如，c-myc或His-标记)而在N-末端具有额外氨基酸的那些同种型。此类CSR和配体同种型或编码CSR和配体同种型的核酸，如RTK同种型、TNFR同种型、RAGE同种型，和包括HGF同种型的配体同种型可以用于治疗多种疾病和状况，包括本文描述的那些。通常，通过本文提供的多肽同种型，或者编码多肽同种型的核酸对疾病、病症或状况的治疗是由同族受体或配体介导的疾病、病症或状况。例如，RAGE介导的信号转导诱导的慢性活化促进老年性黄斑退化症中的疾病发展。所以，用如本文提供的任一种RAGE同种型对老年性黄斑退化症的治疗可以用作老年性黄斑退化症和其他血管发生疾病的治疗。同族CSR和配体对其他多种疾病和病症的促进是本领域技术人员已知的并且在下文中示例。

通过合适的途径施用多肽制剂可以实现治疗，所述多肽制剂可以在组合物中作为多肽提供并且可以连接到用于定向递送的寻靶试剂或者可以包裹在递送载体如脂质体中。备选地，编码多肽的核酸可以作为裸核酸施用或者在载体中，尤其基因治疗载体中施用。通过本领域技术人员已知的任一种方法可以实现基因治疗。通过直接施用核酸或载体可以在体内实现基因治疗。例如，可以全身地、局部地、表面地或通过任何合适的途径递送核酸。载体或核酸可以通过在递送载体(如病毒或脂质体)中包括寻靶试剂而被靶定，或者它们可以缀合到寻靶试剂，如抗体。可以将载体或核酸先体外后体内导入细胞，通过从受试者或者合适的供体取出细胞，向细胞中导入载体或核酸，然后向受试者中导入经修饰的细胞可以实现所述导入。

本文提供的CSR同种型或配体同种型(尤其由于不完全加工、存在编码的接头序列或者存在表位标记而在N-末端含有额外的氨基酸的经修饰的同种型)可以用于治疗多种病症，尤其增殖性、免疫和炎性病症。治疗包括，但不限于，治疗血管发生相关的疾病和状况，包括眼疾病、动脉粥样硬化、癌症和血管损伤、神经变性疾病，包括阿尔茨海默氏病、炎性疾病和状况，包括动脉粥样硬化、与细胞增殖相关的疾病和状况，包括癌症，和平滑肌细胞相关的疾病，和多种自身免疫疾病。为使用RTK同种型、TNFR同种型、RAGE同种型或HGF同种型的治疗和疗法描述了示例性治疗和临床前研究。此类描述意在仅仅为示例性的并且不局限于具体的RTK、TNFR、RAGE或HGF同种型。本领域技术人员可以确定具体的治疗和剂量。在评估性治疗中的考虑包括:待治疗的疾病、疾病的严重性和过程、施用的分子用于预防性还是治疗性目的、以前的治疗、患者的临床史和对治疗的应答，和主治医生的考虑。

1.血管发生相关的疾病

CSR同种型(包括但不限于RTK同种型，包括VEGFR、PDGFR、MET、TIE/TEK、EGFR和EphA)、TNFR同种型(包括TNFR1和TNFR2)、RAGE同种型和HGF同种型可以用于治疗血管发生相关的疾病和状况，如眼疾病和状况，包括涉及新血管形成的眼疾病。眼的新血管形成疾病的特征是新血管侵入到眼的结构，如视网膜或角膜中。它是失明的最常见原因并且涉及大约20种眼疾病。在老年性黄斑退化症中，相关的视力问题由脉络膜毛细管的向内生长(由于玻璃膜中的缺陷)与视网膜色素上皮下方的纤维血管组织的增生引起。血管发生性损伤也与糖尿病性视网膜病变、早产儿视网膜病、角膜移植物排斥、新生血管性青光眼和晶状体后纤维组织形成相关。与角膜新血管形成相关的其他疾病包括但不限于，流行性角结膜炎、维生素A缺乏病、接触镜片过度磨损(contact lens overwear)、特应性角膜炎、边上角膜炎(superior limbic keratitis)、翼状胬肉干燥性角膜炎、舍格伦病、红斑痤疮、phylectenulosis、梅毒、分枝杆菌感染、脂类变性、化学品灼伤、细菌性溃疡、真菌性溃疡、单纯疱疹感染、带状疱疹感染、原生动物感染、卡波西肉瘤、莫伦溃疡、角膜边缘性变性(Terrien’s marginaldegeneration)、边缘角质分离(marginal keratolysis)、类风湿性关节炎、系统性红斑狼疮、多动脉炎、创伤、韦格纳结节病、巩膜炎、约-斯病、角膜放射状切开术(periphigoid radial keratotomy)、角膜移植物排斥。与视网膜/脉络膜新血管形成相关的疾病包括但不限于，糖尿病性视网膜病变、黄斑变性、镰状细胞性贫血、结节病、梅毒、弹力纤维性假黄瘤、佩吉特病、静脉阻塞、动脉阻塞、颈动脉阻塞性病、慢性葡萄膜炎/玻璃体炎、分枝杆菌感染、赖姆病、系统性红斑狼疮、早产儿视网膜病、伊尔斯病、贝赫切特病、引起感染的视网膜炎或脉络膜炎、假定的眼组织胞浆菌病、贝斯特病、近视、视窝、黄斑变性、平坦部炎、慢性视网膜脱落、高粘滞综合征、弓形体病、创伤和激光后并发症。其他疾病包括，但不限于，与潮红相关的疾病(角的新血管形成)和纤维血管或纤维性组织的异常增生引起的疾病，包括所有形式的增生性玻璃体视网膜病变。

CSR和配体同种型(包括CSR和配体同种型的修饰形式)在如眼疾病的治疗中对血管发生的治疗效果可以在动物模型(如在角膜植入物，如本文所述)中评估。例如，血管发生(如对RTK)的调节可以在裸鼠模型，如在裸鼠中表皮样A431肿瘤和植入裸鼠中的VEGF或PIGF转导的大鼠C6神经胶质瘤中评估。可以局部或全身地作为蛋白质注射CSR或配体同种型。备选地，可以将表达CSR同种型的细胞局部接种或者接种在远离肿瘤位置处。可以比较对照处理的和CSR同种型处理的模型之间的肿瘤以观察肿瘤抑制表型，包括血管化很弱的和灰白的肿瘤、坏死、减弱的增殖和增加的肿瘤细胞凋亡。在一种此类治疗中，Flt-1同种型用于治疗眼疾病并在此类模型中评估。

可以用TIE/TEK同种型治疗的眼病症的实例是特征为眼新血管形成的眼疾病，包括但不限于，糖尿病性视网膜病变(糖尿病的主要并发症)、早产儿视网膜病(破坏性的眼疾病，其经常导致慢性视力问题和具有高风险失明，是早产儿护理期间严重的并发症)、新生血管性青光眼、视网膜母细胞瘤、晶状体后纤维组织形成、潮红、葡萄膜炎、黄斑变性、和角膜移植物新血管形成。其他眼炎性疾病、眼肿瘤和与脉络膜或虹膜新血管形成相关的疾病也可以用TIE/TEK同种型治疗。

例如，CSR和配体同种型，包括RAGE同种型，可以用于治疗眼疾病和病症，包括老年性黄斑退化症。老年性黄斑退化症与视力丧失有关，其由如下引起:累积的黄斑玻璃疣、Brusch’s膜中的细胞外沉积，和由于黄斑玻璃疣上的RPE和光感受器中的变性的细胞和分子改变引起的视网膜色素上皮(RPE)功能异常。在RPE中发生的细胞和分子改变(部分是由于老化的眼睛中的氧化应激)包括细胞因子、基质组织、细胞粘附和凋亡基因的改变的表达，导致可能在RPE-Brusch’s膜边缘上局灶性炎性应答的诱导。例如，氧化应激诱导在早期老年性黄斑退化症中在RPE和光感受器层中RAGE配体的积累。积累的RAGE配体刺激表达RAGE的RPE细胞诱导多种炎性事件，包括NFκB核定位、细胞凋亡，和最重要的是RAGE受体自身的上调，启动持续的配体可利用性维持的正反馈环。配体/RAGE介导的信号转导诱导的慢性活化促进老年性黄斑退化症中的疾病发展。用CSR或配体同种型治疗早期老年性黄斑退化症可以减轻该疾病的一种或多种症状。

PDGFR同种型也可以用于治疗增生性玻璃体视网膜病变。例如，构建含有编码PDGFR同种型的核酸分子的表达载体，如逆转录病毒载体。通过转染(如对于逆转录病毒载体)或通过转化(如对于质粒或基于染色体的载体)产生含有所述表达载体的兔结膜成纤维细胞(RCF)。通过本领域已知的手段可以监测细胞中PDGFR同种型的表达，所述手段包括使用识别PDGFR同种型的抗体和通过使用肽标记(例如，myc标记)和对应的抗体。将RCF注射到眼的玻璃质部分中。例如，在兔动物模型中，通过gasvitreomy注射约1 x 10⁵RCF。在同一天注射～2 x 10⁷CFU的表达PDGFR同种型的逆转录病毒。手术后2-4周可以观察对增生性玻璃体视网膜病变的效果，如疾病症状的减轻。

EphA同种型可以用于治疗如眼疾病中具有失调的和/或不合适的血管发生的疾病或病症。例如，EphA同种型可以在动物模型，如小鼠角膜模型中评估对肝配蛋白A-1诱导的血管发生的影响。将仅仅含有肝配蛋白A-1或还具有EphA同种型蛋白的Hydron小丸植入小鼠角膜中。在植入后数天进行目测观察以观察EphA同种型抑制或者血管发生的减轻。如为VEGFR同种型所述的抗血管发生治疗和方法可以应用于EphA同种型。

2.血管发生相关的动脉粥样硬化

CSR和配体同种型，包括RTK同种型，例如VEGFR Flt-1和TIE/TEK同种型，可以用于治疗涉及动脉粥样硬化的血管发生状况，如动脉粥样硬化斑的新血管形成。已经表明在血管腔中形成的斑块具有生血管刺激活性。人冠状动脉粥样硬化损伤中的VEGF表达与人冠状动脉粥样硬化的进展有关。

动物模型可以用于在动脉粥样硬化的治疗中评估CSR和配体同种型。载脂蛋白E缺陷小鼠(ApoE^-/-)易于发生动脉粥样硬化。如在5、10和20周龄时开始，随着时间过程在5周内注射RTK同种型，如VEGFR同种型，如Flt-1内含子融合蛋白来治疗此类小鼠。评估对照ApoE^-/-小鼠和同种型治疗的ApoE^-/-小鼠之间主动脉根部的损伤以观察同种型治疗的小鼠中动脉粥样硬化损伤的减轻。

3.血管发生相关的糖尿病

CSR和配体同种型，包括RAGE同种型，可以用于治疗糖尿病相关的疾病状况，如血管疾病、牙周病，和自身免疫病。糖尿病可以以两种主要形式发生:I型糖尿病的特征是胰腺β胰岛细胞的进行性破坏，其导致胰岛素缺乏；2型糖尿病的特征是胰岛素的增加的耐受性和/或分泌不足，导致高血糖。高血糖引起的并发症，如心肌梗塞、中风和指(趾)或四肢的截肢可以导致发病和死亡。高血糖导致RAGE配体的持续积累，RAGE通过其配体的信号转导促进糖尿病组织中RAGE受体的增强的表达和慢性配体介导的RAGE信号转导。

a.血管疾病

CSR和配体同种型，如RAGE同种型可以用于治疗糖尿病相关的血管疾病，包括大血管和微血管疾病。在2型糖尿病中发生的高血糖导致慢性血管损伤，其特征是多种大血管干扰，包括动脉粥样硬化斑块的发生、血管平滑肌的增强的增殖、细胞外基质的产生，和血管炎症。RAGE被其受体衔接可以引起和恶化血管炎症，导致慢性血管炎症、加速的动脉粥样硬化，和再血管化操作后增加的再狭窄。RAGE同种型可以用于阻断RAGE被其配体的连接，以抑制糖尿病的血管并发症。例如，在糖尿病相关的渗透性过高的动物模型中，用可溶性RAGE同种型治疗动物可以导致组织通透性接近正常化。在糖尿病相关的血管疾病的另一实例中，已经被诱导而发生糖尿病的高脂血症的动物模型(如ApoE -/-小鼠或LDL受体-/-小鼠)显示出RAGE配体的增强的积累和RAGE的增强的表达。用可溶性RAGE同种型治疗糖尿病小鼠可以减轻糖尿病相关的动脉粥样化形成，如通过与载体治疗的小鼠相比减小的动脉粥样硬化损伤面积大小和水平降低的组织因子VCAM-1和NFκB所证实。用RAGE同种型阻断糖尿病性动脉粥样硬化的治疗可以在疾病进展期间的任何时间给予，包括在动脉粥样硬化斑建立之后。

糖尿病相关的血管疾病也可以在微脉管系统中表现，影响眼、肾、和外周神经。重要的是，肾脏疾病是任何糖尿病特异性并发症的最高百分比死亡率的原因。RAGE同种型可以用于治疗糖尿病相关的血管疾病，包括肾脏疾病。例如，在糖尿病的小鼠模型——胰岛素耐受性db/db小鼠中，RAGE在肾小球，尤其在足细胞中被上调，同样，表达RAGE-配体的单核吞噬细胞也在肾小球中积累。用可溶性RAGE同种型治疗db/db小鼠阻断VEGF表达，已知其是介导渗透性过高和单核吞噬细胞向肾小球募集的一种因素。用RAGE同种型的进一步治疗也减小肾小球和系膜的膨胀并降低白蛋白排泄速率。

CSR和配体同种型，包括RAGE同种型，也可以用于治疗与伤口愈合相关的糖尿病相关的血管疾病。慢性伤口愈合通常与糖尿病相关并且可以导致并发症，如感染和截肢。使用2型糖尿病的db/db小鼠模型，通过进行完全厚度切除伤口以产生慢性溃疡可以建立伤口愈合模型。在这种模型中，RAGE和其配体的水平升高。用可溶性RAGE同种型治疗小鼠可以通过抑制细胞因子(包括IL-6、TNF-α、和MMP-2、3和9)的水平而增加伤口闭合。该细胞因子水平的降低促进减轻的慢性炎症和最终增强厚的、良好血管化的肉芽组织的产生和升高的VEGF和PDGF-B水平。

b.牙周病

CSR和配体同种型，包括RAGE同种型，可以用于治疗糖尿病相关的牙周病。糖尿病是由于多种因素引起的牙周病的一种危险因素，所述多种因素包括例如，细菌病原体侵入时受损的宿主防御，和一旦感染建立增大的炎性应答。不合适的免疫应答可以导致牙周病特征性的牙槽骨质丢失，其由多种机理引起，包括例如，病原细菌感染后嗜中性粒细胞的受损的募集和功能、胶原产生减少和增大的溶胶原活性、遗传素因，和导致增强的炎症应答的机理，如通过RAGE的持续信号转导。RAGE和它的配体在牙龈炎-牙周炎患者中糖尿病牙龈的多种细胞类型中积累，所述细胞类型包括内皮和浸润性单核吞噬细胞。使用链脲霉素诱导糖尿病，然后用人牙周病病原体牙龈红棕色单胞菌(Porphyromonas gingivalis)接种小鼠产生的糖尿病小鼠模型可以用作牙周病的模型。用RAGE同种型治疗的小鼠，如用牙龈红棕色单胞菌接种后立即每天一次腹膜内注射2周的小鼠可以通过评估牙槽骨质丢失的程度来观察牙周病。也可以观察用RAGE同种型治疗后与载体对照相比，参与非矿化结缔组织和骨的破坏的细胞因子和基质金属蛋白酶(如IL-6、TNF-α、MMP-2、3、9)的减少。

4.额外的血管发生相关的治疗

CSR和配体同种型(包括RTK同种型，如VEGFR同种型，如Flt1同种型，和EphA同种型)也可以用于治疗血管发生性和炎症相关的疾病，如如存在于类风湿性关节炎(RA)中的滑膜细胞的增殖、炎性细胞的浸润、炎性关节疾病，包括软骨破坏和血管翳形成。例如，II型胶原诱导的关节炎，如小鼠中诱导的多发性关节炎的自身免疫模型可以用作人RA的模型。在这种模型中，小鼠可以用CSR的配体同种型治疗，所述同种型包括但不限于，HER2同种型、FGFR同种型、VEGFR同种型或者本文描述的其他此类同种型，如通过局部注射蛋白质或者通过基因疗法手段。治疗后，可以观察小鼠的关节炎症状包括爪子肿胀、红斑和关节强硬的减轻。也可以观察滑液血管发生和滑液炎症的减轻。

可以用VEGFR同种型治疗的其他血管发生相关的疾病包括血管瘤。儿童的最频繁的血管发生疾病之一是血管瘤。在多数情况中，肿瘤是良性的并且在没有干预下消退。在更严重的病例中，肿瘤发展为大的多孔和浸润性形式并且产生临床并发症。血管瘤的系统形式多发性血管瘤具有高的死亡率。存在血管瘤的许多病例，其不能被治疗或者难以用当前使用的治疗剂治疗。

VEGFR同种型可以用于治疗此类疾病和状况，其中血管发生造成损伤，如奥-韦-朗病或者遗传性出血性毛细血管扩张中的损伤。这是一种遗传疾病，其特征是多个小血管瘤，血管或淋巴管的肿瘤。血管瘤在皮肤和粘膜中被发现，通常伴随着鼻出血(鼻子出血)或胃肠出血，有时伴随着肺或肝脏动静脉瘘。特征是不希望的血管通透性的疾病和病症也可以通过VEGFR同种型治疗。这些包括与脑肿瘤相关的水肿、与恶性肿瘤相关的腹水、梅热综合征、肺部炎症、肾病综合征、心包积液和胸腔积液。

血管发生也涉及正常的生理过程，如生殖和伤口愈合。血管发生在排卵和受精后囊胚的植入中是重要的步骤。VEGFR同种型对血管发生的调节可以用于诱导闭经，以阻断排卵或者防止囊胚的植入。VEGFR同种型也可以用于外科手术中。例如，在伤口愈合中，过度修复或者纤维组织形成对于外科手术可以是有害的副作用并且可以引起血管发生或因血管发生而恶化。粘连是常见的手术并发症并且引起诸如小肠梗阻的问题。

PDGFR同种型可以用于在动脉损伤如动脉手术后调节新内膜形成。例如，PDGFRB同种型可以用于调节如参与新内膜形成的PDGF-BB诱导的细胞增殖。例如，可以在气囊损伤的公鸡股动脉模型中评估PDGFR同种型。构建表达PDGFR同种型的腺病毒载体并在动脉模型中在体内转导。在转导的动脉中评估新内膜相关的血栓形成以观察与对照相比的减轻。

可用于治疗血管发生相关疾病和状况的CSR和配体同种型也可以用于组合疗法中，如与抗血管发生药物和分子组合使用，所述分子与RTK相关途径中的其他信号分子相互作用，包括VEGFR配体的调节。例如，表明已知的抗风湿药布西拉明(BUC)在其作用机理中包括抑制滑膜细胞产生VEGF。BUC的抗风湿效果通过抑制关节炎滑膜中的血管发生和滑液增殖来介导，所述抑制是通过抑制滑膜细胞的VEGF产生实现的。此类药物与VEGFR同种型的组合疗法可以允许多种作用机理和作用位点用于治疗。

5.癌症

RTK同种型，如EGFR、TIE/TEK、VEGFR和FGFR的同种型可以用于治疗癌症。RTK同种型，包括但不限于，EGFR RTK同种型，如ErbB2和ErbB3同种型，VEGFR同种型，如Flt1同种型，FGFR同种型，如FGFR4同种型，和EphA1同种型可以用于治疗癌症。在本文中待治疗的癌症的实例包括，但不限于，癌、淋巴瘤、胚细胞瘤、肉瘤，和白血病或淋巴样恶性肿瘤。此类癌症的额外实例包括鳞状细胞癌(例如，上皮鳞状细胞癌)、肺癌，包括小细胞肺癌、非小细胞肺癌、肺的腺癌和肺的鳞状癌，腹膜的癌，肝细胞癌，胃癌，包括胃肠癌，胰腺癌、成胶质细胞瘤、宫颈癌、卵巢癌、肝癌、膀胱癌、肝细胞瘤、乳腺癌、结肠癌、直肠癌、结直肠癌、子宫内膜或子宫癌、唾液腺癌、肾癌、前列腺癌、女阴癌、甲状腺癌、肝癌、肛门癌、阴茎癌，以及头颈癌。组合疗法可以使用EGFR同种型，包括抗激素化合物、保心药，和抗癌剂，如化学治疗剂和生长抑制剂。

可以用EGFR同种型治疗的癌症通常是表达EGFR受体或者EGF配体与之相互作用的受体的那些癌症。此类癌是本领域技术人员已知的和/或可以通过本领域中用于检测EGFR表达的任何手段鉴定。可以得到的ErbB2表达诊断/预后测定法的实例包括HERCEPTEST.RTM.(Dako).。将来自肿瘤活组织检查的石蜡包埋的组织切片进行IHC测定法并且使得与ErbB2蛋白质染色强度标准一致。符合小于阈值得分的肿瘤可以表征为不过表达ErbB2，而具有大于或等于阈值得分的那些肿瘤可以表征为过表达ErbB2。在一个治疗实例中，评估过表达ErbB2的肿瘤作为用EGFR同种型如ErbB2同种型治疗的候选物。

本文提供的同种型可以用于治疗癌症。例如，TIE/TEK同种型可以通过如调节肿瘤相关的血管发生而用于癌症治疗中。血管化涉及调节癌的生长和扩散。例如，血管发生和新血管形成的抑制抑制了实体瘤生长和扩大。已经表明TIE/TEK受体如Tie2影响正常的和癌性组织中的血管生长。TIE/TEK同种型可以用作肿瘤血管发生的抑制剂。如通过在细胞中表达TIE/TEK同种型而产生该蛋白质。例如，可以在细胞中表达并从培养基收获TIE/TEK同种型的分泌形式。通过本领域已知的生物化学手段和通过使用抗体纯化，如针对TIE/TEK同种型或其部分产生的抗体或者通过使用标记的TIE/TEK同种型和对应的抗体纯化或部分纯化蛋白质。可以在动物模型中监测对血管发生的影响，如通过用TIE/TEK同种型处理大鼠角膜，所述TIE/TEK同种型被配制成hydron丸剂中的条件培养基，将其手术植入大鼠角膜的微囊袋中或者作为纯化蛋白质(例如，100μg/剂)施用于窗口小室(window chamber)。例如，大鼠模型，如具有无血管角膜的的F344大鼠可以与肿瘤细胞条件培养基组合使用或者通过将肿瘤碎片植入眼的窗口小室中以诱导血管发生。可以通过组织学方法检查角膜以检测肿瘤细胞条件培养基诱导的血管发生。TIE/TEK同种型也可以用于治疗恶性或转移状况，如实体瘤，包括原发性和转移的肉瘤和癌。

FGFR4同种型可以用于治疗癌症，例如，垂体肿瘤。动物模型可以用于模拟人垂体肿瘤发展的进展。例如，在转基因小鼠中表达的FGFR的N-末端截短的形式ptd-FGFR4重演了垂体肿瘤发生(Ezzat et al.(2002)JClin.Invest.109:69-78)，包括不存在延长的和大量增生情况下的垂体腺癌形成。可以将FGFR4同种型施用于ptd-FGFR4小鼠并将垂体结构和肿瘤发展的过程与对照小鼠比较。

6.阿尔茨海默氏病

CSR受体或配体同种型，如FGFR同种型，也可以用于治疗炎性状况或涉及此类应答的其他状况，如阿尔茨海默氏病和相关状况。人阿尔茨海默氏病有多种可用的小鼠模型，包括过表达突变的淀粉状蛋白前体蛋白的转基因小鼠和表达家族性常染色体显性连锁的PS1的小鼠和过表达两种蛋白(PS1M146L/APPK670N:M671L)的小鼠。如通过注射ErbB同种型治疗阿尔茨海默氏模型。如使用染色和抗体免疫反应性测定法，通过观察海马、内嗅皮层和大脑皮层中的神经炎性斑块可以评估斑块发展。

其他神经变性疾病，如克雅氏病和亨廷顿舞蹈症可以用CSR或配体同种型治疗。例如，RAGE和它的配体在克雅氏病的朊病毒蛋白质斑中和亨廷顿舞蹈症的尾状核中积累。用CSR或配体同种型，如RAGE同种型治疗神经变性疾病可以限制与持续的RAGE信号转导相关的炎症和疾病。

7.平滑肌增殖相关的疾病和状况

CSR同种型，包括EGFR同种型，如ErbB同种型，可以用于治疗涉及哺乳动物如人中的平滑肌细胞增殖的多种疾病和状况。一个实例是涉及血管平滑肌细胞(VSMC)增殖并导致内膜增生的心脏病，如血管狭窄、血管成形术或手术或支架植入导致的再狭窄、动脉粥样硬化和高血压。在此类状况中，多种细胞和释放的细胞因子相互作用以自分泌、旁分泌或近分泌的方式作用，导致VSMC从中膜中它们的正常位置迁移到受损的内膜。迁移的VSMC过度增殖并导致内膜增厚，其导致血管的狭窄或堵塞。该问题与损伤部位血小板聚集和沉积混在一起。一种多功能的丝氨酸蛋白酶α-凝血酶在血管损伤部位浓缩并刺激VSMC增殖。该受体活化后，VSMC产生并分泌多种自分泌生长因子，包括PDGF-AA、HB-EGF和TGF。EGFR涉及信号转导级联，其最终导致成纤维细胞和VSMC的迁移和增殖，以及VSMC的刺激以分泌多种细胞因子，其促进内皮细胞的有丝分裂并在内皮细胞中诱导趋化应答。用EGFR同种型治疗可以用于调节此类信号转导和应答。

EGFR同种型如ErbB2和ErbB3同种型可以用于治疗EGFR如ErbB2和ErbB3调节膀胱SMC的状况，如应答阻塞综合征发生的膀胱壁增厚，影响下泌尿道。EGFR同种型可以用于控制膀胱平滑肌细胞的增殖，并且因此可以用于预防或治疗泌尿梗阻综合征。

EGFR同种型可以用于治疗具有涉及平滑肌细胞增殖的潜在病理的呼吸道阻塞疾病。一个实例是哮喘，其在呼吸道炎症和支气管收缩中表现出来。已经表明EGF刺激人呼吸道SMC的增殖并且可能是涉及呼吸道阻塞疾病中呼吸道SMC的病理性增殖的因素之一。EGFR同种型可以用于调节通过EGFR的效应和对EGF的应答。

8.炎性疾病

CSR和配体同种型，如TNFR同种型或RAGE同种型，可以用于治疗炎性疾病，包括中枢神经系统疾病(CNS)、自身免疫病、呼吸道高反应性状况(如哮喘中的)、类风湿性关节炎和炎性肠病。

TNF-α和淋巴毒素(LT)是促炎细胞因子和疾病和状况如多发性硬化中炎性应答的关键介体。TNF-α和LT-α通过浸润性淋巴细胞和巨噬细胞产生并且额外通过活化的CNS实质细胞、小胶质细胞和星形细胞产生。在MS患者中，TNF-α在血清和脑脊液中过量产生。在损伤中，TNF-α和TNFR大量表达。TNF-α和LT-α可以诱导主要少突胶质细胞中的选择性毒性并且在CNS组织中诱导髓鞘质损伤。从而，这两种细胞因子已经与脱髓鞘作用有关。

实验性自身免疫性脑脊髓炎(EAE)可以作为多发性硬化(MS)模型(见例如，Probert et al.(2000)Brain 123:2005-2019)。通过用髓鞘质和髓鞘质组分，如髓磷脂碱蛋白、蛋白脂质蛋白质和髓磷脂少突胶质细胞糖蛋白(MOG)免疫，可以在许多遗传敏感的物种中诱导EAE。例如，MOG诱导的EAE重演人MS的基本特征，包括慢性的、复发性临床疾病过程、炎症的病理组织学三元组、反应性神经胶质增生和大的汇合的脱髓鞘斑的形成。额外的MS模型包括过表达TNF-α的转基因小鼠，该模型非自免疫介导MS。将转基因小鼠工程化为在神经胶质细胞中局部表达TNF-α；人和鼠TNF-α引发MS样症状。TNFR同种型可以在EAE动物模型中评估。如通过注射施用同种型，并与对照动物比较监测症状的过程和进展。

细胞因子如TNF-α也涉及呼吸道平滑肌收缩性质。TNFR1和TNFR2在调节呼吸道平滑肌的生理效应中起作用。TNFR2调节钙稳态并且从而调节呼吸道平滑肌高反应性。TNFR1调节呼吸道平滑肌中TNF-α的效应。可以在用卡巴胆碱诱导的鼠气管环中评估呼吸道平滑肌应答。可以在TNF-α存在和不存在下监测效应，如卡巴胆碱诱导的收缩。可以将TNFR同种型加入气管环中以评估同种型对呼吸道平滑肌的效应。

CSR，包括TNFR和其他CSR，调节疾病如类风湿性关节炎(RA)中的炎症(Edwards et al.(2003)Adv Drug Deliv.Rev.55(10):131536)。TNFR同种型(包括TNFR1或TNFR2同种型)可以用于治疗RA。例如，可以局部或全身性注射TNFR同种型。可以每天或每周施用同种型。聚乙二醇化的TNFR同种型可以用于诱导免疫原性。可以用灵长类动物模型治疗RA。可以在用TNFR同种型治疗的受试者和对照中监测触痛和肿胀关节的反应以评估TNFR同种型治疗。

9.心血管疾病

CSR或配体同种型，包括例如，RAGE同种型，可以用于治疗心血管疾病。RAGE和它的配体在老化组织(包括老化的人心脏)中积累，导致持续的和慢性RAGE介导的信号转导。例如，RAGE信号转导可以通过活化基质金属蛋白酶而介导细胞基质相互作用的调节，其已经例如在心脏纤维化相关的心成纤维细胞中观察到。相反地，在具有冠状动脉疾病的患者(但不是对照受试者)的血浆中可溶性RAGE同种型的降低的水平和与冠状动脉疾病有关的动脉粥样硬化和血管炎症的预后相关。用RAGE同种型治疗患有心血管疾病和相关状况的患者可以通过防止配体介导的RAGE依赖的细胞活化而发挥抗动脉粥样硬化效果。

10.肾疾病

CSR和配体同种型，包括RAGE同种型，可以用于治疗慢性肾疾病。肾疾病的特征是慢性炎症和促炎细胞因子如TNF-α、L-1β和AGE(RAGE的配体)的升高的血液水平。RAGE也在来自慢性肾疾病的患者的外周血单核细胞上积累，随着肾功能恶化而增加。RAGE/RAGE配体信号转导与和慢性肾疾病相关的慢性单核细胞介导的系统炎症有关。用RAGE同种型治疗可以减小RAGE同种型与细胞表面RAGE的结合并减弱RAGE介导的信号转导，如促炎细胞因子像TNF-α的产生。

J.组合疗法

CSR或配体同种型，尤其本文提供的被修饰而在表达或分泌后在它们的N-末端包括额外氨基酸的那些同种型可以相互地、与其他细胞表面受体或配体同种型组合使用，所述其他细胞表面受体或配体同种型如美国申请序列号09/942,959，09/234,208，09/506,079；美国临时申请序号60/571,289，60/580,990和60/666,825；和美国专利号6,414,130，公布的国际PCT申请号WO 00/44403，WO 1/61356，WO 2005/016966中所述的herstatin或任一种，包括但不限于SEQ ID Nos.32、34、36、38、40、42、44、46、48、140、142、143、145、147、149、150、152、153、155、157、159、161-168、170、172、174、176、178、180、181、183、185、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、217、219、221、223、225、227、229、230-233、225、237、239、241、243、245、247、248-251、253、255、257、259、261、263、264-270、272、274-280、282、284、286、288、289-303，或319-333的任一个中给出的那些)和/或与其他现有的药物和治疗剂组合使用，用来治疗疾病和状况，尤其涉及异常血管发生和/或新血管形成的那些疾病和状况，包括，但不限于，癌症和其他增生性病症、炎性疾病和自身免疫病症，如本文给出的和本领域技术人员已知的。

例如，如本文所述，多种同种型可以用于治疗血管发生相关的状况和疾病和/或控制肿瘤增殖。此类治疗可以与抗血管发生和/或抗肿瘤生成药物和/或治疗剂结合进行。可用于组合疗法的抗血管发生和/或抗肿瘤生成药物和疗法的实例包括酪氨酸激酶抑制剂和能够调节酪氨酸激酶信号转导并且可以用于组合疗法的分子，包括，但不限于，4-氨基吡咯并[2，3-d]嘧啶(见例如，美国专利号5,639,757)，和喹唑啉化合物和组合物(例如，美国专利号5,792,771)。可用于组合疗法的其他化合物包括类固醇，如angiostatic4，9(11)-类固醇和C21-氧合类固醇、制管张素、内皮抑制素、vasculostatin、canstatin和脉丝平、血管生成素、细菌多糖CM101和抗体LM609(美国专利号5,753,230)、血小板反应蛋白(TSP-1)、血小板因子4(PF4)、干扰素、金属蛋白酶抑制剂、药理学物质，包括AGM-1470/TNP-470、沙立度胺、和羧基酰氨基三唑(CAI)、可的松，如肝素或肝素片段存在下，抗侵入因子、视黄酸和紫杉醇((美国专利号5,716,981；引入本文作为参考)、鲨鱼软骨提取物、阴离子聚酰胺或聚脲寡聚物、羟吲哚(oxindole)衍生物、雌二醇衍生物和噻唑并嘧啶衍生物。

在另一实例中，CSR或配体同种型，如VEGF同种型，可以与用于治疗糖尿病的活性剂一起施用。此类活性剂包括用于治疗任何或所有状况的活性剂，所述状况如糖尿病性牙周病、糖尿病性血管病、小管间质性疾病和糖尿病神经病变。在另一实例中，CSR同种型与治疗癌症的活性剂如抗癌剂、化学治疗剂和生长抑制剂一起施用，包括共同施用不同化学治疗剂的混合物。化学治疗剂的实例包括紫杉烷类(如紫杉醇和多西他赛)和蒽环类抗生素。此类化学治疗剂的制备和给药方案可以根据生产商的使用说明或者由有经验的医生根据经验确定。此类化学治疗剂的制备和给药方案也在Chemotherapy Service Ed.，M.C.Perry，Williams & Wilkins，Baltimore，Md.(1992)中描述。待治疗的癌症的实例包括鳞状细胞癌(例如，上皮鳞状细胞癌)、肺癌，包括小细胞肺癌、非小细胞肺癌、肺的腺癌和肺的鳞状癌、腹膜的癌、肝细胞癌、胃癌，包括胃肠癌，胰腺癌、成胶质细胞瘤、宫颈癌、卵巢癌、肝癌、膀胱癌、肝细胞瘤、乳腺癌、结肠癌、直肠癌、结直肠癌、子宫内膜或子宫癌、唾液腺癌、肾癌、前列腺癌、女阴癌、甲状腺癌、肝癌、肛门癌、阴茎癌，以及头颈癌。任一种CSR同种型可以与两种或多种活性组合施用以治疗疾病或状况。

额外的化合物可以与CSR或配体同种型用于组合疗法中。抗激素化合物可以如与EGFR同种型用于组合疗法中。此类化合物的实例包括抗雌激素化合物，如他莫昔芬；抗孕酮，如奥那斯酮和抗雄激素，如氟利坦，以此类分子已知的剂量使用。还有利的是也共同施用保心药(以防止或减轻与疗法相关的心肌功能异常)或一种或多种细胞因子。除了上面的治疗方案外，患者还可以进行手术去除癌细胞和/或放射疗法。

CSR或配体同种型，尤其本文提供的那些(包括在它们的N-末端含有一个或多个额外氨基酸的同种型的修饰形式)与一种或多种不同的CSR或配体同种型(包括与herstatins和其他物质)的组合可以用于治疗涉及异常血管发生的癌症和其他病症(见例如，共同待决的和公布的申请美国申请序号09/942,959，09/234,208，09/506,079；美国临时申请序号60/571,289，60/580,990和60/666,825；和美国专利号6,414,130，公布的国际PCT申请号WO 00/44403，WO 01/61356，WO 2005/016966)。细胞表面受体包括受体酪氨酸激酶，如VEGFR、FGFR、PDGFR(包括Rα、Rβ、CSFIR、Kit)、MET(包括c-Met、c-RON)、TIE和EPHA家族的成员。这些可以包括ErbB2(HER-2)、ErbB3、ErbB4、EGFR、DDR1、DDR2、EphA1、EphB1、FGFR-2、FGFR-3、FGFR-4、MET、PDGFR-A、TEK、Tie-1、KIT、VEGFR-1、VEGFR-2、VEGFR-3、Flt1、Flt3、RON或CSFIR、TNFR1、TNFR2、RON、CSFR1和其他。细胞表面受体也可以包括TNFR或RAGE的同种型。配体同种型也可以组合使用，包括HGF同种型。此类同种型的实例是herstatins(见SEQ ID NO:290-303和SEQ ID NO:304-318中给出的编码核酸序列)、包括herstatin的内含子部分的多肽(见，SEQ ID NO:319-333和SEQ ID NO:334-348中给出的编码核酸序列)，以及本文提供的任一种同种型。所选的同种型和/或药物物质的组合是待治疗的疾病的函数并且是基于目标组织和细胞和在其上表达的受体的考虑。

所述组合例如可以靶定血管发生和/或内皮细胞保持途径中的两种或多种细胞表面受体或步骤或者可以靶定疾病过程中的两种或多种细胞表面受体或步骤，如其中涉及这些途径的一种或两种的任一种疾病过程，如本文提到的和本领域技术人员已知的炎性疾病、肿瘤和所有其他疾病。两种或多种物质可以作为单一组合物施用或者可以作为两种或多种组合物(其中存在两种以上的物质)同时、间歇或顺序施用。它们可以包装为药盒，其含有单独两种或多种组合物或者作为合并的组合物和任选地施用说明书和/或施用的装置，如注射器。

佐剂和其他免疫调节剂可以与CSR同种型组合用于治疗癌症，例如以增加对肿瘤细胞的免疫应答。组合疗法可以增加治疗的有效性，并且在一些情况中，产生协同效果使得组合比单独治疗的累加效果更有效。佐剂的实例包括但不限于，细菌DNA、减毒的分枝杆菌细胞(BCG；卡介苗)的核酸片段、来自BCG基因组的合成的寡核苷酸，和含有CpG基序的合成的寡核苷酸(CpG ODN；Wooldridge et al.(1997)Blood 89:2994-2998)，左旋咪唑、氢氧化铝(alum)、BCG、不完全弗氏佐剂(IFA)、QS-21(植物来源的免疫刺激剂)、匙孔血蓝蛋白(KLH)、和二硝基苯酚(DNP)。免疫调节剂的实例包括但不限于，细胞因子，如白介素(例如，IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-9、IL-10、IL-11、IL-12、IL-13、IL-15、IL-16、IL-17、IL-18、IL-1α、IL-1β和IL-1RA)、粒细胞集落刺激因子(G-CSF)、粒细胞巨噬细胞集落刺激因子(GM-CSF)、制癌蛋白M、红细胞生成素、白血病抑制因子(LIF)、干扰素、B7.1(也称作CD80)、B7.2(也称作B70、CD86)、TNF家族成员(TNF-α、TNF-β、LT-β、CD40配体、Fas配体、CD27配体、CD30配体、4-1BBL、Trail)，和MIF、干扰素、细胞因子，如IL-2和IL-12；和趋化剂，如甲氨蝶呤和苯丁酸氮芥。

临床前研究

模型动物研究可以用于作为候选治疗剂的RTK同种型的临床前评估。可以评估的参数包括，但不限于功效和浓度-反应、安全性、药物动力学、物种间标度和组织分布。模型动物研究包括如本文所述的测定法以及本领域技术人员已知的那些。动物模型可以用于得到数据，然后将其外推到人的剂量以便设计临床试验和用RTK同种型的治疗。例如，在带有肿瘤的小鼠中的功效和浓度反应VEGFR抑制剂可以被外推到人的治疗(Mordenti et al.，(1999)Toxicol Pathol.Jan-Feb；27(1):14-21)以便确定对于人使用在所需的有效范围内保持治疗性抑制剂(如抗VEGFR的抗体)有效的临床给药方案。此类模型和剂量研究可以应用于VEGFR同种型剂量确定并且转化为合适的人剂量，以及技术人员已知的其他技术。例如，可以在猴子、小鼠、大鼠和兔中进行临床前安全性研究和临床前药物代谢动力学研究。来自小鼠、大鼠和猴子的药物代谢动力学数据已经用于用异速生

标度来预测在人类中对应的治疗剂的药物代谢动力学。因此，可以为人病理状况的治疗确定合适的剂量信息，所述病理状况包括类风湿性关节炎、眼新血管形成和癌症。抗-VEGF抗体的人源化形式已经用于临床研究中作为抗癌剂(Brem，(1998)Cancer Res.58(13):2784-92；Presta et al.，(1997)Cancer Res.57(20):4593-9)并且当为VEGFR同种型设计治疗剂量时，此类临床数据也可以被认为是参考来源。

K.实施例

包括下面的实施例仅仅用于阐明性目的并且不意在限制本发明的范围。

实施例1

克隆CSR同种型的方法

A.信使RNA的制备

从来自主要人组织类型的健康或患病组织或细胞系分离的mRNA购自Clontech(BD Biosciences，Clontech，Palo Alto，CA)和Stratagene(LaJolla，CA)。合并等量的mRNA并用作基于反转录的PCR扩增(RT-PCR)的模板。

B.cDNA合成

在40％ DMSO存在下将mRNA在70℃变性10分钟并在冰上淬灭。在含有10％ DMSO，50mM Tris-HCl(pH8.3)，75mM KCl，3mM MgCl₂，10mM DTT，2mM每种dNTP，5μgm RNA，和200单位的Stratascript逆转录酶(Stratagene，La Jolla，CA)的20μl反应物中用200ng寡聚(dT)或20ng随机六聚物合成第一链cDNA。在37℃温育1小时后，合并来自两个反应的cDNA并用10单位RNA酶H(Promega，Madison，WI)处理。

C.PCR扩增

使用Oligo 6.6软件(Molecular Biology Insights，Inc.，Cascade，CO)选择并由Qiagen-Operon(Richmond，CA)合成对细胞表面受体特异的基因特性PCR引物(示例性细胞表面受体见例如表8)。正向引物(见例如，表9)在起始密码子侧翼。反向引物在终止密码子一侧或者选自距离起始密码子下游至少1.5kb的区域(见表9)。每种PCR反应物含有10ng逆转录的cDNA，0.025 U/μl TaqPlus(Stratagene)，0.0035 U/μl PfuTurbo(Stratagene)，0.2mM dNTP(Amersham，Piscataway，NJ)，和0.2μM正向和反向引物，总体积为50μl。PCR条件为35个循环，每个循环为94.5℃ 45s，58℃ 50s，和72℃ 5分钟。反应以72℃ 10分钟的延伸步骤结束。

表8:用于克隆CSR同种型的基因列表

家族	成员	ntACC.#	催化结构域	SEQIDNO:	ORF	prt ACC.#	SEQIDNO:
家族	成员	ntACC.#	催化结构域	SEQIDNO:	ORF	prt ACC.#	SEQIDNO:	DDR	DDR1	NM_013993	2149-3057	355	337-3078	NP_054699	392
	DDR2	NM_006182	2022-2900	356	354-2921	NP_006173	393	DDR	DDR1	NM_013993	2149-3057	355	337-3078	NP_054699	392
	DDR2	NM_006182	2022-2900	356	354-2921	NP_006173	393	EPH	EPHA1	NM_005232	1939-2736	357	88-3018	NP_005223	394
	EPHA2	NM_004431	1956-2759	358	138-3068	NP_004422	395	EPH	EPHA1	NM_005232	1939-2736	357	88-3018	NP_005223	394
	EPHA2	NM_004431	1956-2759	358	138-3068	NP_004422	395		EPHA3	NM_005233	2086-2859	359	226-3177	NP_005224	396
	EPHA4	NM_004438	1885-2685	360	43-3003	NP_004429	397		EPHA3	NM_005233	2086-2859	359	226-3177	NP_005224	396
	EPHA4	NM_004438	1885-2685	360	43-3003	NP_004429	397		EPHA5	L36644	1259-1460	361	1-2976	AAA74245	398
	EPHA6	AL133666	691-1332	362	343-1347	CAB63775	399		EPHA5	L36644	1259-1460	361	1-2976	AAA74245	398
	EPHA6	AL133666	691-1332	362	343-1347	CAB63775	399		EPHA7	NM_004440	2092-2892	363	214-3210	NP_004431	400
	EPHA8	NM_020526	2028-2801	364	126-3143	NP_065387	401		EPHA7	NM_004440	2092-2892	363	214-3210	NP_004431	400
	EPHA8	NM_020526	2028-2801	364	126-3143	NP_065387	401		EPHB1	NM_004441	2051-2857	365	215-3169	NP_004432	402
	EPHB2	AF025304	1886-2681	366	26-3193	AAB94602	403		EPHB1	NM_004441	2051-2857	365	215-3169	NP_004432	402
	EPHB2	AF025304	1886-2681	366	26-3193	AAB94602	403		EPHB3	NM_004443	2316-3122	367	438-3434	NP_004434	404
	EPHB4	NM_004444	2200-3006	368	376-3339	NP_004435	405		EPHB3	NM_004443	2316-3122	367	438-3434	NP_004434	404
	EPHB4	NM_004444	2200-3006	368	376-3339	NP_004435	405		EPHB6	NM_004445	2761-3498	369	799-3819	NP_004436	406
ERB	EGFR	NM_005228	2380-3148	370	247-3879	NP_005219	407		EPHB6	NM_004445	2761-3498	369	799-3819	NP_004436	406
ERB	EGFR	NM_005228	2380-3148	370	247-3879	NP_005219	407		ERBB2	NM_004448	2396-3164	371	239-4006	NP_004439	408
	ERBB3	NM_001982	2318-3086	372	194-4222	NP_001973	409		ERBB2	NM_004448	2396-3164	371	239-4006	NP_004439	408
	ERBB3	NM_001982	2318-3086	372	194-4222	NP_001973	409	FGFR	FGFR1	M34641	1435-2263	373	10-2472	AAA35835	410
	FGFR2	NM_000141	2009-2872	374	593-3058	NP_000132	411	FGFR	FGFR1	M34641	1435-2263	373	10-2472	AAA35835	410
	FGFR2	NM_000141	2009-2872	374	593-3058	NP_000132	411		FGFR3	NM_000142	1429-2292	375	40-2460	NP_000133	412
	FGFR4	NM_002011	1534-2394	376	157-2565	NP_002002	413		FGFR3	NM_000142	1429-2292	375	40-2460	NP_000133	412
	FGFR4	NM_002011	1534-2394	376	157-2565	NP_002002	413	MET	MET	NM_000245	3419-4198	377	188-4360	NP_000236	414
	RON	NM_002447	3242-4260	378	29-4231	NP_002438	415	MET	MET	NM_000245	3419-4198	377	188-4360	NP_000236	414
	RON	NM_002447	3242-4260	378	29-4231	NP_002438	415	PDGFR	CSFIR	NM_005211	2012-3208	379	293-3211	NP_005202	416
	FLT3	NM_004119	1861-2886	380	58-3039	NP_004110	417	PDGFR	CSFIR	NM_005211	2012-3208	379	293-3211	NP_005202	416

家族	成员	nt ACC.#	催化结构域	SEQIDNO:	ORF	prtACC.#	SEQIDNO:
家族	成员	nt ACC.#	催化结构域	SEQIDNO:	ORF	prtACC.#	SEQIDNO:		KIT	NM_000222	1762-2799	381	22-2952	NP_000213	418
	PDGFRA	NM_006206	2147-3253	382	395-3664	NP_006197	419		KIT	NM_000222	1762-2799	381	22-2952	NP_000213	418
	PDGFRA	NM_006206	2147-3253	382	395-3664	NP_006197	419		PDGFRB	NM_002609	2133-3215	383	357-3677	NP_002600	420
RAGE	AGE	NM_001136		384	25-1239	NP_001127	421		PDGFRB	NM_002609	2133-3215	383	357-3677	NP_002600	420
RAGE	AGE	NM_001136		384	25-1239	NP_001127	421	TEK	TEK	NM_000459	2603-3433	385	149-3523	NP_000450	422
	TIE	NM_005424	2579-3409	386	80-3496	NP_005415	423	TEK	TEK	NM_000459	2603-3433	385	149-3523	NP_000450	422
	TIE	NM_005424	2579-3409	386	80-3496	NP_005415	423	TNFR	TNFR1	NM_001065	1323-1598(DD)	387	282-1649	NP_001056	424
	TNFR2	NM_001066	n/a	388	90-1475	NP_001057	425	TNFR	TNFR1	NM_001065	1323-1598(DD)	387	282-1649	NP_001056	424
	TNFR2	NM_001066	n/a	388	90-1475	NP_001057	425	VEGFR	VEGFR1	NM_002019	2704-3702	389	250-4266	NP_002010	426
	VEGFR2	NM_002253	2779-3792	390	304-4374	NP_002244	427	VEGFR	VEGFR1	NM_002019	2704-3702	389	250-4266	NP_002010	426
	VEGFR2	NM_002253	2779-3792	390	304-4374	NP_002244	427		VEGFR3	NM_002020	2530-3525	391	22-3918	NP_002011	428
HGF	HGF	NM_000601		460	166-2352	NP_000592	461		VEGFR3	NM_002020	2530-3525	391	22-3918	NP_002011	428

表9:用于PCR克隆的引物

SEQID NO	引物	序列
SEQID NO	引物	序列	463	CSFIR_F1	CTG CCA CTT CCC CAC CGA GG
464	DDR1_F1	GGG ATC AGG AGC TAT GGG ACC A	463	CSFIR_F1	CTG CCA CTT CCC CAC CGA GG
464	DDR1_F1	GGG ATC AGG AGC TAT GGG ACC A	465	DDR2_F1	CTG AGA TGA TCC TGA TTC CCAGAA
466	EPHA1_F1	GGA GCT ATG GAG CGG CGC TG	465	DDR2_F1	CTG AGA TGA TCC TGA TTC CCAGAA
466	EPHA1_F1	GGA GCT ATG GAG CGG CGC TG	467	EPHA2_F1	AGC GAG AAG CGC GGC ATG GA
468	EPHA3_F1	CAC CAG CAA CAT GGA TTG TCA GC	467	EPHA2_F1	AGC GAG AAG CGC GGC ATG GA
468	EPHA3_F1	CAC CAG CAA CAT GGA TTG TCA GC	469	EPHA4_F1	CGA ACC ATG GCT GGG ATT TTC TA
470	EPHA7_F1	ATA AAA CCT GCT CAT GCA CCA TG	469	EPHA4_F1	CGA ACC ATG GCT GGG ATT TTC TA
470	EPHA7_F1	ATA AAA CCT GCT CAT GCA CCA TG	471	EPHB1_F1	GCG ATG GCC CTG GAT TAT CTA

SEQID NO	引物	序列
SEQID NO	引物	序列	472	EPHB2_F1	CCC CGG GAA GCG CAG CCA
473	EPHB3_F1	GCT CCT AGA GCT GCC ACG GC	472	EPHB2_F1	CCC CGG GAA GCG CAG CCA
473	EPHB3_F1	GCT CCT AGA GCT GCC ACG GC	474	EPHB4_F1	GAT CCT ACC CGA GTG AGG CGG
475	CSFIR_R1	GGG CTC CTG CAG AGA TGG GTA	474	EPHB4_F1	GAT CCT ACC CGA GTG AGG CGG
475	CSFIR_R1	GGG CTC CTG CAG AGA TGG GTA	476	DDR1_R1	AGA GCC ATT GGG GAC ACA GGG A
477	DDR2_R1	AGC CTG ACT CCT CCT CCC CTG	476	DDR1_R1	AGA GCC ATT GGG GAC ACA GGG A
477	DDR2_R1	AGC CTG ACT CCT CCT CCC CTG	478	EPHA1_R1	AGC TCT GTC AGC AAG ACC CTG G
479	EPHA2_R1	AGG TGG TGT CTG GGG CCA GGT C	478	EPHA1_R1	AGC TCT GTC AGC AAG ACC CTG G
479	EPHA2_R1	AGG TGG TGT CTG GGG CCA GGT C	480	EPHA3_R1	GTC AGG CTT GAG GCT ACT GAT GG
481	EPHA4_R1	AAC ATA GGA AGT GAG AGG GTTCAG G	480	EPHA3_R1	GTC AGG CTT GAG GCT ACT GAT GG
481	EPHA4_R1	AAC ATA GGA AGT GAG AGG GTTCAG G	482	EPHA7_R1	ACT CCA TTG GGA TGC TCT GGT TC
483	EPHB1_R1	AGC CCA TCA ATC CTT GCT GTG	482	EPHA7_R1	ACT CCA TTG GGA TGC TCT GGT TC
483	EPHB1_R1	AGC CCA TCA ATC CTT GCT GTG	484	EPHB2_R1	GCG TGC CCG CAC CTG GAA GA
485	EPHB3_R1	GCT GGT CAC TGT GGA GGC GA	484	EPHB2_R1	GCG TGC CCG CAC CTG GAA GA
485	EPHB3_R1	GCT GGT CAC TGT GGA GGC GA	486	EPHB4_R1	GGT AGC TGG CTC CCC GCT TCA
487	CSFIR_R2	CCG AGG GTC TTA CCA AAC TGC	486	EPHB4_R1	GGT AGC TGG CTC CCC GCT TCA
487	CSFIR_R2	CCG AGG GTC TTA CCA AAC TGC	488	DDR1_R2	AAG CGG AGT CGA GAT CGA GGG A
489	DDR2_R2	GGG GAA CTC CTC CAC AGC CA	488	DDR1_R2	AAG CGG AGT CGA GAT CGA GGG A
489	DDR2_R2	GGG GAA CTC CTC CAC AGC CA	490	EPHA1_R2	CGG GTA AAG TCC AAG GCT CCC
491	EPHA2_R2	GAC ACA GGA TGG ATG GAT CTC GG	490	EPHA1_R2	CGG GTA AAG TCC AAG GCT CCC
491	EPHA2_R2	GAC ACA GGA TGG ATG GAT CTC GG	492	EPHA3_R2	ATC AAT GGA TAT GTT GGT GGCATC
493	EPHA4_R2	AGG ATG CGT CAA TTT CTT TGG CA	492	EPHA3_R2	ATC AAT GGA TAT GTT GGT GGCATC
493	EPHA4_R2	AGG ATG CGT CAA TTT CTT TGG CA	494	EPHA7_R2	CTG CAC CAA TCA CAC GCT CAA

SEQID NO	引物	序列
SEQID NO	引物	序列	495	EPHB1_R2	ATC AAT CTC CTT GGC AAA CTC C
496	EPHB2_R2	GCC CAT GAT GGA GGC TTC GC	495	EPHB1_R2	ATC AAT CTC CTT GGC AAA CTC C
496	EPHB2_R2	GCC CAT GAT GGA GGC TTC GC	497	EPHB3_R2	ACG CAG GAC ACG TCG ATC TCC
498	EPHB4_R2	ACC TGC ACC AAT CAC CTC TTC AA	497	EPHB3_R2	ACG CAG GAC ACG TCG ATC TCC
498	EPHB4_R2	ACC TGC ACC AAT CAC CTC TTC AA	499	EPHB6_F1	AGA GTG GCG GGC ATG GTG TG
500	EPHB6_R1	GCG GAG CTG ATA GTC CAG GAT G	499	EPHB6_F1	AGA GTG GCG GGC ATG GTG TG
500	EPHB6_R1	GCG GAG CTG ATA GTC CAG GAT G	501	EPHB6_R2	CCT GTC CCA ATG ACC TCC TCA A
502	EPHA6_F1	GGA GAT GAA AGA CTC TCC ATTTCA AG	501	EPHB6_R2	CCT GTC CCA ATG ACC TCC TCA A
502	EPHA6_F1	GGA GAT GAA AGA CTC TCC ATTTCA AG	503	FGFR1_F1	ATT CGG GAT GTG GAG CTG GA
504	FGFR2_F1	AGG ACC GGG GAT TGG TAC CG	503	FGFR1_F1	ATT CGG GAT GTG GAG CTG GA
504	FGFR2_F1	AGG ACC GGG GAT TGG TAC CG	505	FGFR3_F1	CAT GGG CGC CCC TGC CTG
506	FGFR4F1	AGA AGG AGA TGC GGC TGC TG	505	FGFR3_F1	CAT GGG CGC CCC TGC CTG
506	FGFR4F1	AGA AGG AGA TGC GGC TGC TG	507	TNFRIA(p55)_F1	AGC TGT CTG GCA TGG GCC TCT C
508	TNFRIB(p55)_F1	ACC GGA CCC CGC CCG CAC	507	TNFRIA(p55)_F1	AGC TGT CTG GCA TGG GCC TCT C
508	TNFRIB(p55)_F1	ACC GGA CCC CGC CCG CAC	509	EPHA6_R1	ATCT TAG ACC GAC AGA AAA TTTGGC
510	FGFR1_R1	CAA GGG ACC ATC CTG CGT GC	509	EPHA6_R1	ATCT TAG ACC GAC AGA AAA TTTGGC
510	FGFR1_R1	CAA GGG ACC ATC CTG CGT GC	511	FGFR2_R1	AGG GGC TTG CCC AGT GTC AG
512	FGFR3_R1	GCT CCC ATT TGG GGT CGG CA	511	FGFR2_R1	AGG GGC TTG CCC AGT GTC AG
512	FGFR3_R1	GCT CCC ATT TGG GGT CGG CA	513	FGFR4_R1	CGG GGG AAC TCC CAT AGT GG
514	TNFRIA(p55)_R1	GGC GCA GCC TCA TCT GAG AAG A	513	FGFR4_R1	CGG GGG AAC TCC CAT AGT GG
514	TNFRIA(p55)_R1	GGC GCA GCC TCA TCT GAG AAG A	515	TNFRIB(p55)_R1	CAC AGC CCA CAC CGG CCT GG
516	FLT3_F1	GGA GGC CAT GCC GGC GTT G	515	TNFRIB(p55)_R1	CAC AGC CCA CAC CGG CCT GG
516	FLT3_F1	GGA GGC CAT GCC GGC GTT G	517	KIT-F1	CGC AGC TAC CGC GAT GAG AGG

SEQID NO	引物	序列
SEQID NO	引物	序列	518	MET_F1	CTC ATA ATG AAG GCC CCC GC
519	PDGFRA_F1	AAG TTT CCC AGA GCT ATG GGG A	518	MET_F1	CTC ATA ATG AAG GCC CCC GC
519	PDGFRA_F1	AAG TTT CCC AGA GCT ATG GGG A	520	PDGFRB_F1	AGC AGC AAG GAC ACC ATG CG
521	RON_F1	GGT CCC AGC TCG CCT CGA TG	520	PDGFRB_F1	AGC AGC AAG GAC ACC ATG CG
521	RON_F1	GGT CCC AGC TCG CCT CGA TG	522	TEK_F1	AGA TTT GGG GAA GCA TGG ACT C
523	TIE_F1	CGG CCT CTG GAG TAT GGT CTG	522	TEK_F1	AGA TTT GGG GAA GCA TGG ACT C
523	TIE_F1	CGG CCT CTG GAG TAT GGT CTG	524	VEGFR1_F1	CAT GGT CAG CTA CTG GGA CAC C
525	VEGFR2_F1	AGG TGC AGG ATG CAG AGC AAG	524	VEGFR1_F1	CAT GGT CAG CTA CTG GGA CAC C
525	VEGFR2_F1	AGG TGC AGG ATG CAG AGC AAG	526	VEGFR3_F1	AGC GGC CGG AGA TGC AGC G
527	FLT3_R1	CTG CTC GAC ACC CAC TGT CCA	526	VEGFR3_F1	AGC GGC CGG AGA TGC AGC G
527	FLT3_R1	CTG CTC GAC ACC CAC TGT CCA	528	KIT-R1	GCA GAA GTC TTG CCC ACA TCG
529	MET_R1	CTT CGT GAT CTT CTT CCC AGT GA	528	KIT-R1	GCA GAA GTC TTG CCC ACA TCG
529	MET_R1	CTT CGT GAT CTT CTT CCC AGT GA	530	PDGFRA_R1	AGA TTC TTA GCC AGG CAT CGC A
531	PDGFRB_R1	AGC GCA CCG ACA GTG GCC GA	530	PDGFRA_R1	AGA TTC TTA GCC AGG CAT CGC A
531	PDGFRB_R1	AGC GCA CCG ACA GTG GCC GA	532	RON_R1	GCA CGG GCT GCC CAC TGT CA
533	TEK_R1	CTG TCC GAG GTT CCA AAT AGTTGA	532	RON_R1	GCA CGG GCT GCC CAC TGT CA
533	TEK_R1	CTG TCC GAG GTT CCA AAT AGTTGA	534	TIE_R1	CGT TCT CAC TGG GGT CCA CCA
535	VEGFR1_R1	ATT ATT GCC ATG CGC TGA GTG A	534	TIE_R1	CGT TCT CAC TGG GGT CCA CCA
535	VEGFR1_R1	ATT ATT GCC ATG CGC TGA GTG A	536	VEGFR2_R1	GCC GCT TGG ATA ACA AGG GTA
537	VEGFR3_R1	AAC TCG GTC CAG GTG TCC AGG C	536	VEGFR2_R1	GCC GCT TGG ATA ACA AGG GTA
537	VEGFR3_R1	AAC TCG GTC CAG GTG TCC AGG C	538	FLT3_R2	CTT GGA AAC TCC CAT TTG AGATCA
539	KIT-R2	ACA ACC TTC CCG AAA GCT CCA	538	FLT3_R2	CTT GGA AAC TCC CAT TTG AGATCA
539	KIT-R2	ACA ACC TTC CCG AAA GCT CCA	540	MET_R2	ACT ACA TGC TGC ACT GCC TGG A

SEQID NO	引物	序列
SEQID NO	引物	序列	541	PDGFRA_R2	CCC GAC CAA GCA CTA GTC CAT C
542	PDGFRB_R2	CCA GAG CCG AGG GTG CGT CC	541	PDGFRA_R2	CCC GAC CAA GCA CTA GTC CAT C
542	PDGFRB_R2	CCA GAG CCG AGG GTG CGT CC	543	RON_R2	CAG GTC ATT CAG GTT GGG AGG A
544	TEK_R2	ATT TGA TGT CAT TCC AGT CAA GCA	543	RON_R2	CAG GTC ATT CAG GTT GGG AGG A
544	TEK_R2	ATT TGA TGT CAT TCC AGT CAA GCA	545	TIE_R2	AGC ACT GGG TAG CTC AGG GGC
546	VEGFR1_R2	AAC TCC CAC TTG CTG GCA TCA	545	TIE_R2	AGC ACT GGG TAG CTC AGG GGC
546	VEGFR1_R2	AAC TCC CAC TTG CTG GCA TCA	547	VEGFR2_R2	AAT TCC CAT TTG CTG GCA TCA
548	VEGFR3_R2	ATT CCC ACT GGC TGG CAT CGT A	547	VEGFR2_R2	AAT TCC CAT TTG CTG GCA TCA
548	VEGFR3_R2	ATT CCC ACT GGC TGG CAT CGT A	549	RAGE_Fu	CAG GAC CCT GGA AGG AAG CA
550	RAGE_F1	AGG ATG GCA GCC GGA ACA G	549	RAGE_Fu	CAG GAC CCT GGA AGG AAG CA
550	RAGE_F1	AGG ATG GCA GCC GGA ACA G	551	RAGE_flR1	CCC CTC AAG GCC CTC CAG TA
552	RAGE_Intron3R1	GGA AGT CAG AGG CCC TCA TGG	551	RAGE_flR1	CCC CTC AAG GCC CTC CAG TA
552	RAGE_Intron3R1	GGA AGT CAG AGG CCC TCA TGG	553	RAGE_Intron4R1	GGG AAA GAG TGG TGA CCT CAG A
554	RAGE_Intron5R1	CTT GGG GGG CAC CTT AGG ACT C	553	RAGE_Intron4R1	GGG AAA GAG TGG TGA CCT CAG A
554	RAGE_Intron5R1	CTT GGG GGG CAC CTT AGG ACT C	555	RAGE_Intron6R1	ACT CCC TCT TTC CCT AAG GGT CA
556	RAGE_Intron7R1	GTT ATG GTT CAC CCT ACC TCC CA	555	RAGE_Intron6R1	ACT CCC TCT TTC CCT AAG GGT CA
556	RAGE_Intron7R1	GTT ATG GTT CAC CCT ACC TCC CA	557	RAGE_Intron8R1	ATTT AGC TCA GAG GGA AGA AGGGA
558	HGF_F1	AGG ATT CTT TCA CCC AGG CA	557	RAGE_Intron8R1	ATTT AGC TCA GAG GGA AGA AGGGA
558	HGF_F1	AGG ATT CTT TCA CCC AGG CA	559	HGF_intron11R1	GAA TAA ATG CCA GAC CAC CTA
560	HGF_F2	ACC ATG TGG GTG ACC AAA CT	559	HGF_intron11R1	GAA TAA ATG CCA GAC CAC CTA
560	HGF_F2	ACC ATG TGG GTG ACC AAA CT	561	HGF_intron11R2	TCA CAA GAC ACC AAT CCC TAA CT
562	HGF_intron13R1	TCC ATA TTT CTG GGA ATA GGAGGA C	561	HGF_intron11R2	TCA CAA GAC ACC AAT CCC TAA CT

D.PCR产物的克隆和测序

将PCR产物在1％琼脂糖凝胶上电泳，并且来自可检测带的DNA用Gelstar(Bio Whitaker Molecular Application，Walkersville，MD)染色。将DNA带用QiaQuick凝胶提取试剂盒(Qiagen，Valencia，CA)提取，连接到pDrive UA-克隆载体(Qiagen)中，并转化到大肠杆菌中。在含有100μg/ml羟苄西林的LB琼脂培养板上选择重组质粒。对应每个转染，随机挑选192个菌落并通过PCR用M13正向和反向载体引物测定它们的cDNA插入片段大小。如通过荧光成像(Alpha Innotech，San Leandro，CA)显示的来自PCR产物的具有可区分的分子量的代表性克隆然后从两个方向用载体引物(M13正向和反向)测序。使用定制引物完整测序所有克隆，所述定制引物用于在带缺口区域间的定向测序完成。

E.序列分析

使用SIM4(用于分析剪接变体的计算机程序)，通过比对每种cDNA序列与它的各自的基因组序列进行选择性剪接的计算机分析。仅仅具有规则(例如，GT-AG)的供体-受体剪接位点的转录物被考虑进行分析。进一步研究编码CSR同种型的克隆(见下文，表10)。

F.示例性CSR和配体同种型

使用本文所述的方法制备的示例性CSR和配体同种型在下面的表10给出。提供了编码CSR和配体同种型的核酸分子并且包括含有核苷酸或核糖核苷酸或核苷酸或核糖核苷酸类似物的那些核酸分子。在表10描述了示例性核酸和示例性CSR同种型多肽的氨基酸序列的SEQ ID NOS。

表10 CSR同种型

基因	ID	类型	长度	SEQ ID NO(核苷酸)	SEQ ID NO(氨基酸)
基因	ID	类型	长度	SEQ ID NO(核苷酸)	SEQ ID NO(氨基酸)	DDR1	SR005_A11	外显子缺失	286aa	139	140
DDR1	SR005_A10	外显子缺失	243aa	141	142	DDR1	SR005_A11	外显子缺失	286aa	139	140
DDR1	SR005_A10	外显子缺失	243aa	141	142	EPHA1	SR004_G03	内含子融合	474aa	144	145
EPHA1	SR004_G07	内含子融合，外显子缺失	311aa	146	147	EPHA1	SR004_G03	内含子融合	474aa	144	145

基因	ID	类型	长度	SEQ ID NO(核苷酸)	SEQ ID NO(氨基酸)
基因	ID	类型	长度	SEQ ID NO(核苷酸)	SEQ ID NO(氨基酸)	EPHA1	SR004_H03	内含子融合	490aa	148	149
EPHA2	SR016_E12	内含子融合	497aa	151	152	EPHA1	SR004_H03	内含子融合	490aa	148	149
EPHA2	SR016_E12	内含子融合	497aa	151	152	EPHB1	SR005_D06	外显子缩短	242aa	154	155
EPHB4	SR012_C08	外显子缺失	306aa	156	157	EPHB1	SR005_D06	外显子缩短	242aa	154	155
EPHB4	SR012_C08	外显子缺失	306aa	156	157	EPHB4	SR012_D11	外显子缩短	516aa	158	159
EPHB4	SR012_E11	缩短的外显子	414aa	160	161	EPHB4	SR012_D11	外显子缩短	516aa	158	159
EPHB4	SR012_E11	缩短的外显子	414aa	160	161	FGFR1	SR001_E12	外显子缺失	228aa	169	170
FGFR1	SR022_C02	外显子缺失，内含子融合	320aa	171	172	FGFR1	SR001_E12	外显子缺失	228aa	169	170
FGFR1	SR022_C02	外显子缺失，内含子融合	320aa	171	172	FGFR2	SR022_C10	内含子融合	266aa	173	174
FGFR2	SR022_C11	内含子融合	317aa	175	176	FGFR2	SR022_C10	内含子融合	266aa	173	174
FGFR2	SR022_C11	内含子融合	317aa	175	176	FGFR2	SR022_D04	外显子缺失，内含子融合	281aa	177	178
FGFR2	SR022_D06	内含子融合	396aa	179	180	FGFR2	SR022_D04	外显子缺失，内含子融合	281aa	177	178
FGFR2	SR022_D06	内含子融合	396aa	179	180	FGFR4	SR002_A11	内含子融合	72aa	182	183
FGFR4	SR002_A10	内含子融合	446aa	184	185	FGFR4	SR002_A11	内含子融合	72aa	182	183
FGFR4	SR002_A10	内含子融合	446aa	184	185	MET	SR020_C10	内含子融合	413aa	187	188
MET	SR020_C12	内含子融合	468aa	189	190	MET	SR020_C10	内含子融合	413aa	187	188
MET	SR020_C12	内含子融合	468aa	189	190	MET	SR020_D04	内含子融合	518aa	191	192
MET	SR020_D07	内含子融合	596aa	193	194	MET	SR020_D04	内含子融合	518aa	191	192
MET	SR020_D07	内含子融合	596aa	193	194	MET	SR020_D11	内含子融合	408aa	195	196
MET	SR020_E11	内含子融合	621aa	197	198	MET	SR020_D11	内含子融合	408aa	195	196
MET	SR020_E11	内含子融合	621aa	197	198	MET	SR020_F08	内含子融合	664aa	199	200
MET	SR020_F11	内含子融合	719aa	201	202	MET	SR020_F08	内含子融合	664aa	199	200

基因	ID	类型	长度	SEQ ID NO(核苷酸)	SEQ ID NO(氨基酸)
基因	ID	类型	长度	SEQ ID NO(核苷酸)	SEQ ID NO(氨基酸)	MET	SR020_F12	内含子融合	697aa	203	204
MET	SR020_G03	外显子缩短，内含子融合	691aa	205	206	MET	SR020_F12	内含子融合	697aa	203	204
MET	SR020_G03	外显子缩短，内含子融合	691aa	205	206	MET	SR020_G07	内含子融合	661aa	207	208
MET	SR020_H03	内含子融合	755aa	209	210	MET	SR020_G07	内含子融合	661aa	207	208
MET	SR020_H03	内含子融合	755aa	209	210	MET	SR020_H06	内含子融合	823aa	211	212
MET	SR020_H07	内含子融合	877aa	213	214	MET	SR020_H06	内含子融合	823aa	211	212
MET	SR020_H07	内含子融合	877aa	213	214	MET	SR020_H08	外显子缺失，内含子融合	764aa	215	216
RON	SR004_C11	内含子融合	495aa	218	219	MET	SR020_H08	外显子缺失，内含子融合	764aa	215	216
RON	SR004_C11	内含子融合	495aa	218	219	RON	SR014_C01	内含子融合	541aa	220	221
RON	SR014_C09	内含子融合	908aa	222	223	RON	SR014_C01	内含子融合	541aa	220	221
RON	SR014_C09	内含子融合	908aa	222	223	RON	SR014_E12	内含子融合	647aa	224	225
CSF1R	SR005_A06	外显子缺失	306aa	226	227	RON	SR014_E12	内含子融合	647aa	224	225
CSF1R	SR005_A06	外显子缺失	306aa	226	227	KIT	SR002_H01	内含子融合	413aa	228	229
PDGFRB	SR007_C09	外显子缩短(4bp)	336aa	232	233	KIT	SR002_H01	内含子融合	413aa	228	229
PDGFRB	SR007_C09	外显子缩短(4bp)	336aa	232	233	RAGE	SR021_A05	内含子融合	146	234	235
RAGE	SR021_C02	内含子融合	266	236	237	RAGE	SR021_A05	内含子融合	146	234	235
RAGE	SR021_C02	内含子融合	266	236	237	RAGE	SR021_C06	内含子融合	387	238	239
RAGE	SR021_C08	内含子融合	173	240	241	RAGE	SR021_C06	内含子融合	387	238	239
RAGE	SR021_C08	内含子融合	173	240	241	RAGE	SR021_F6	内含子融合	172	242	243
TEK	SR007_G02	内含子融合，外显子缩短	367aa	244	245	RAGE	SR021_F6	内含子融合	172	242	243
TEK	SR007_G02	内含子融合，外显子缩短	367aa	244	245	TEK	SR007_H03	外显子缺失，	468aa	246	247

基因	ID	类型	长度	SEQ ID NO(核苷酸)	SEQ ID NO(氨基酸)
基因	ID	类型	长度	SEQ ID NO(核苷酸)	SEQ ID NO(氨基酸)			内含子融合
TIE	SR006_A04	内含子融合	251aa	253	254			内含子融合
TIE	SR006_A04	内含子融合	251aa	253	254	TIE	SR006_B07	内含子融合	379aa	255	256
TIE	SR006_B06	内含子融合	161aa	257	258	TIE	SR006_B07	内含子融合	379aa	255	256
TIE	SR006_B06	内含子融合	161aa	257	258	TIE	SR006_B12	内含子融合	414aa	259	260
TIE	SR006_B10	外显子缺失	317aa	261	262	TIE	SR006_B12	内含子融合	414aa	259	260
TIE	SR006_B10	外显子缺失	317aa	261	262	TIE	SR016_G03	内含子融合	751aa	263	264
TNFRIB	SR003_H02	内含子融合	155aa	272	273	TIE	SR016_G03	内含子融合	751aa	263	264
TNFRIB	SR003_H02	内含子融合	155aa	272	273	VEGFR1	SR004_C05	内含子融合	174aa	274	275
VEGFR1	SR01_C02	内含子融合	541aa	n/a	280	VEGFR1	SR004_C05	内含子融合	174aa	274	275
VEGFR1	SR01_C02	内含子融合	541aa	n/a	280	VEGFR2	SR015_F1	外显子缩短	712aa	282	283
VEGFR3	SR007_E10	外显子缩短	227aa	284	285	VEGFR2	SR015_F1	外显子缩短	712aa	282	283
VEGFR3	SR007_E10	外显子缩短	227aa	284	285	VEGFR3	SR007_F05	外显子缺失	295aa	286	287
VEGFR3	SR015_G09	内含子融合	765aa	288	289	VEGFR3	SR007_F05	外显子缺失	295aa	286	287
VEGFR3	SR015_G09	内含子融合	765aa	288	289	HGF	SR023A02	内含子融合	467aa	349	350
HGF	SR023A08	内含子融合	472aa	351	352	HGF	SR023A02	内含子融合	467aa	349	350
HGF	SR023A08	内含子融合	472aa	351	352	HGF	SR023E09	内含子融合	514aa	353	354

实施例2

制备和在人细胞中表达内含子融合蛋白构建体

A. tPA cDNA的产生

为了得到人组织纤溶酶原激活物(tPA)cDNA，基于公开的信息(Kohneet al(1999)J Cellular Biochem 75:446-461)选择对人组织纤溶酶原激活物(tPA)的5’部分(包括tPA信号/原序列)(基于如SEQ ID NO:1中给出的人tPA cDNA序列)特异的PCR引物并由Qiagen-Operon(Richmond，CA)合成。引物的序列在SEQ ID NO:7和SEQ ID NO:8中给出。每种PCR反应物含有10ng逆转录的cDNA，0.025U/μl TaqPlus(Stratagene)，0.0035U/μlPfuTurbo(Stratagene)，0.2mM dNTP(Amersham，Piscataway，NJ)，和0.2μM正向和反向引物，总体积为50μl。PCR条件为94.5℃ 45s，58℃ 50s，和72℃ 5分钟的35个循环。反应用72℃ 10分钟的延伸步骤结束。将PCR产物在1％琼脂糖凝胶上电泳，并将来自可检测带的DNA用Gelstar(Bio Whitaker Molecular Application，Walkersville，MD)染色。将DNA带用QiaQuick凝胶提取试剂盒(Qiagen，Valencia，CA)提取，连接到pDriveUA-克隆载体(Qiagen)中，并转化到大肠杆菌中用于纯化pDrive-tPA载体。

B. tPA信号/原序列的PCR扩增和表达

为了克隆包括编码如SEQ ID NO:1中给出的tPA信号/原序列(见表11)的核苷酸的核酸部分，使用SEQ ID NO:9和SEQ ID NO:10中给出的引物(见表12)进行PCR。产生引物以含有Nhe I和Xho I的限制酶切割位点，以及myc-tag，以方便将扩增的产物克隆到pCI表达质粒中(Promega)。备选地，通过用如SEQ ID NO:11和SEQ ID NO:12中给出的引物进行PCR反应产生EcoRI和Xba I的限制酶切割位点，并将扩增产物克隆到pcDNA3.1表达质粒(Invitrogen)中。如上用10ng pDrive-tPA进行PCR反应。PCR条件包括35个循环的:94.5℃ 45s，58℃ 50s，和72℃ 5分钟。反应以72℃ 10分钟的延伸步骤结束。将tPA编码的cDNA用Nhe I和XhoI或用EcoRI和Xba I消化以产生tPA信号/原序列片段并亚克隆到pCI表达质粒(Promega)中处于Nhe I和Xho I位点中以形成pCI-tPA:myc载体或者亚克隆到pcDNA 3.1表达质粒(Invitrogen)中处于EcoR I和Xba I位点中以形成pcDNA3.1-tPA载体。

表11:用于克隆tPA-内含子融合蛋白构建体的基因列表

nt ACC.#	描述	SEQ IDNO:	ORF	prt ACC.#	SEQ IDNO:
nt ACC.#	描述	SEQ IDNO:	ORF	prt ACC.#	SEQ IDNO:	NM_000930	tPA	3	NP_000921	4
	tPA前/原序列	1			2	NM_000930	tPA	3	NP_000921	4

C.内含子融合蛋白向pCI-tPA载体的克隆

内含子融合蛋白分别从它们的pDrive测序载体扩增，并随后克隆到pCI-tPA:myc载体中。对于PCR扩增，正向引物含有Xho I位点，反向引物含有NotI位点。使用如SEQ ID NO:13和14中给出的引物扩增没有信号序列的EGFR1-内含子融合蛋白(SEQ ID NO.279)。使用如SEQ IDNO:15和16给出的引物通过PCR扩增没有信号序列的Met-内含子融合蛋白(SEQ ID NO.214)。使用如SEQ ID NO:17和18给出的引物通过PCR扩增没有信号序列的FGFR2-内含子融合蛋白(SEQ ID NO.180)。使用如SEQ ID NO:21和22给出的引物通过PCR扩增没有信号序列的FGFR2-内含子融合蛋白(SEQ ID NO.178)。使用如SEQ ID NO:23和24给出的引物通过PCR扩增没有信号序列的FGFR-4-内含子融合蛋白(SEQ ID NO.185)。使用如SEQ ID NO:25和26给出的引物通过PCR扩增没有信号序列的RAGE内含子融合蛋白(见例如，SEQ ID NO:237)。使用如SEQ IDNO:27和28给出的引物通过PCR扩增没有信号序列的TEK内含子融合蛋白(见例如，SEQ ID NO:245)。使用如SEQ ID NO:29和30给出的引物通过PCR扩增没有信号序列的RON内含子融合蛋白(见例如，SEQ IDNO:233)。每种PCR反应物含有10ng逆转录的cDNA，0.025U/μl TaqPlus(Stratagene)，0.0035U/μl PfuTurbo(Stratagene)，0.2mM dNTP(Amersham，Piscataway，NJ)，和0.2μM正向和反向引物，总体积为50μl。PCR条件为25个循环，每个循环为94.5℃ 45s，58℃ 50s，和72℃ 5分钟。反应以72℃ 10分钟的延伸步骤结束。将PCR产物在1％琼脂糖凝胶上电泳，用Gelstar(Bio Whitaker Molecular Application，Walkersville，MD)染色来自可检测带的DNA。用QiaQuick凝胶提取试剂盒(Qiagen，Valencia，CA)提取DNA带，亚克隆到pCI-tPA:myc载体中处于tPA/原序列下游的Xho I和NotI位点中以产生如SEQ ID NOS.31-35，39-47(核苷酸)和32-36，40-48(氨基酸)给出的tPA:myc-内含子融合蛋白构建体。

从peDNA3.1 His-Herstatin(Gail Clinton(OHSU)提供)PCR扩增编码如SEQ ID NO:289中所示的没有信号序列的herstatin(Dimercept^TM)-内含子融合蛋白的核酸，并将其随后克隆到pcDNA 3.1-tPA载体中。对于PCR扩增，产生含有Xba I位点的正向引物，和含有Not I位点的反向引物。使用如SEQ ID NO:19和20给出的引物扩增编码herstatin-内含子融合蛋白的cDNA。如上述进行PCR反应。纯化PCR产物并亚克隆到pcDNA3.1-tPA载体中处于Xba I和Not I位点以产生如SEQ ID NO.37(核苷酸)和SEQ ID NO.38(氨基酸)给出的tpA-HER2内含子融合蛋白构建体。示例性tPA-内含子融合蛋白融合蛋白在表13中给出。

表12:用于PCR克隆的引物

SEQIDNO	引物	ID	序列
SEQIDNO	引物	ID	序列	7	iPA_F		CTCTGCGAGGAAAGGGAAGGA
8	iPA_R		CGTGCCCCTGTAGCTGATGCC	7	iPA_F		CTCTGCGAGGAAAGGGAAGGA
8	iPA_R		CGTGCCCCTGTAGCTGATGCC	9	tPApre/proF1		ATTAGCTAGCCACCATGGATGCAATGAAGAGAGGG
10	tPApre/pro_R1		ATTACTCGAGCAGATCCTCTTCTGAGATGAGTTTTTGTTCTGGCTCCTCTTCGAATCG	9	tPApre/proF1		ATTAGCTAGCCACCATGGATGCAATGAAGAGAGGG
10	tPApre/pro_R1		ATTACTCGAGCAGATCCTCTTCTGAGATGAGTTTTTGTTCTGGCTCCTCTTCGAATCG	11	tPApre/pro_F2		ATTAGAATTCCACCATGGATGCAATGAAGAGAGGG
12	tPApre/pro_R2		ATTATCTAGATCTGGCTCCTCTTCTGAATCG	11	tPApre/pro_F2		ATTAGAATTCCACCATGGATGCAATGAAGAGAGGG
12	tPApre/pro_R2		ATTATCTAGATCTGGCTCCTCTTCTGAATCG	13	VEGFRIIFP_F	SR018_C02	AAGGCTCGAGTCAAAATTAAAAGATCCTGAAC
14	VEGFRIIFP_R	SR018_C02	AAGGAAAAAAGCGGCCGCTCACGGAAGGAAATGGAAG	13	VEGFRIIFP_F	SR018_C02	AAGGCTCGAGTCAAAATTAAAAGATCCTGAAC
14	VEGFRIIFP_R	SR018_C02	AAGGAAAAAAGCGGCCGCTCACGGAAGGAAATGGAAG	15	METIFP_F	SR020_H07	AAGGCTCGAGTGTAAAGAGGCACTAGCAAAG

16	METIFP_R	SR020_H07	AAGGAAAAAAGCGGCCGCTCACGGAAGGAAATGGAAG
16	METIFP_R	SR020_H07	AAGGAAAAAAGCGGCCGCTCACGGAAGGAAATGGAAG	17	FGFR2IFP_F	SR022_D06	AAGGCTCGAGCCCTCCTTCAGTTTAGTTGA
18	FGFR21FP_R	SR022_D06	AAGGAAAAAAGCGGCCGCTTATGCAAGGATAAAAGGGG	17	FGFR2IFP_F	SR022_D06	AAGGCTCGAGCCCTCCTTCAGTTTAGTTGA
18	FGFR21FP_R	SR022_D06	AAGGAAAAAAGCGGCCGCTTATGCAAGGATAAAAGGGG	19	DCPTIFP_F	Herstatin	AATTTCTAGACAAGTGTGCACCGGCACAGAC
20	DCPTIFP_R	Herstatin	AAGGAAAAGCGGCCGCTCAGCCTTCATACCGGGAC	19	DCPTIFP_F	Herstatin	AATTTCTAGACAAGTGTGCACCGGCACAGAC
20	DCPTIFP_R	Herstatin	AAGGAAAAGCGGCCGCTCAGCCTTCATACCGGGAC	21	FGFR2IFP_F2	SR022_D04	AATTCTCGAGCCCTCCTTCAGTTTAGTTGA
22	FGFR2IFP_R2	SR022_D04	AATTGAATTCTTATGCAAGGATAAAAGGGGC	21	FGFR2IFP_F2	SR022_D04	AATTCTCGAGCCCTCCTTCAGTTTAGTTGA
22	FGFR2IFP_R2	SR022_D04	AATTGAATTCTTATGCAAGGATAAAAGGGGC	23	FGFR4IFP_F	SR002_A10	AATTCTCGAGGAGGAAGTGGAGCTTGAGCC
24	FGFR4IFP_R	SR002_A10	AATTGAATTCCTAACTCAGTCCCTCCCAG	23	FGFR4IFP_F	SR002_A10	AATTCTCGAGGAGGAAGTGGAGCTTGAGCC
24	FGFR4IFP_R	SR002_A10	AATTGAATTCCTAACTCAGTCCCTCCCAG	25	RAGEIFP_F	SR021_C02	AATTCTCGAGCAAAACATCACAGCCCGGA
26	RAGEIFP_R	SR021_C02	AATTGAATTCCTAAGGGTCAGACTTCCAGA	25	RAGEIFP_F	SR021_C02	AATTCTCGAGCAAAACATCACAGCCCGGA
26	RAGEIFP_R	SR021_C02	AATTGAATTCCTAAGGGTCAGACTTCCAGA	27	TEKIFP_F	SR007_G02	AATTCTCGAGGTGGAAGGTGCCATGGACT
28	TEKIFP_R	SR007_G02	AATTGAATTCTTACCACTGTTTACTTCTATATGA	27	TEKIFP_F	SR007_G02	AATTCTCGAGGTGGAAGGTGCCATGGACT
28	TEKIFP_R	SR007_G02	AATTGAATTCTTACCACTGTTTACTTCTATATGA	29	RONIFP_F	SR014_C09	AATTCTCGAGGACTGGCAGTGCCCGCG

30

RONIFP_R

SR014_C09

AATTGAATTCTCATGAGGACCAGCCAGTAG

表13:tPA-内含子融合蛋白融合物

ID	同种型	SEQ ID NO(核苷酸)	SEQ ID NO(氨基酸)
ID	同种型	SEQ ID NO(核苷酸)	SEQ ID NO(氨基酸)	SR018C02	tPA-myc-VEGFR-1	31	32
SR02H07	tPA-myc-MET	33	34	SR018C02	tPA-myc-VEGFR-1	31	32
SR02H07	tPA-myc-MET	33	34	SR022D06	tPA-myc-FGFR-2	35	36
Herstatin	tPA_DCPT	37	38	SR022D06	tPA-myc-FGFR-2	35	36
Herstatin	tPA_DCPT	37	38	SR022D04	tPA-myc-FGFR-2	39	40
SR002A10	tPA-myc-FGFR-4	41	42	SR022D04	tPA-myc-FGFR-2	39	40
SR002A10	tPA-myc-FGFR-4	41	42	SR021C02	tPA-myc-RAGE	43	44
SR007G02	tPA-myc-TEK	45	46	SR021C02	tPA-myc-RAGE	43	44
SR007G02	tPA-myc-TEK	45	46	SR014C09	tPA-myc-RON	47	48

D.蛋白质表达和分泌

来自培养的人细胞的培养基用于评估每种tPA内含子融合蛋白的分泌。为了在人细胞中表达tPA-内含子融合蛋白，将人胚胎肾293T细胞以2 x 10⁶个细胞/孔接种在6孔板中并保持在Dulbecco改良的Eagle培养基(DMEM)和10％胎牛血清(Invitrogen)中。用LipofectAMINE 2000(Invitrogen)按照生产商的使用说明转染细胞。在转染当天，将5μg质粒DNA与15μl LipofectAMINE 2000在0.5ml无血清的DMEM中混合。混合物在室温温育20分钟后加入细胞。将细胞在CO₂培养箱中37℃下培养48小时。为了研究内含子融合蛋白的蛋白质分泌，在转染后48小时收集条件培养基并通过蛋白质印迹分析表达水平。通过在SDS-聚丙烯酰胺凝胶上分离，接着用抗Myc-抗体(Invitrogen)或抗Herstatin抗体(Upstate)通过免疫印迹分析条件培养基。将抗体稀释1:5000。为了研究内含子融合蛋白的细胞蛋白质表达，去除细胞培养基后，收获转染的细胞并在细胞裂解缓冲液(PBS/0.25％ Triton X-100)中裂解。通过离心澄清裂解物以除去不溶的细胞残渣。通常，测定蛋白质浓度后在SDS-PAGE凝胶上从每个样品分离10μg蛋白质。使用抗Myc抗体(Invitrogen)或抗-Herstatin抗体(Upstate)通过蛋白质印迹分析细胞裂解物。将含有tPA前/原序列的内含子融合蛋白的表达和分泌与含有最初的或内源信号肽的内含子融合蛋白相比较。内含子融合蛋白的表达和分泌的比较在表14和表15中描述。

表14:

内含子融合蛋白蛋白质表达和分泌总结

内含子融合蛋白ID	基因	蛋白质表达w/最初的sp	蛋白质分泌w/最初的sp	蛋白质表达w/tPAsp	蛋白质分泌w/tPAsp
内含子融合蛋白ID	基因	蛋白质表达w/最初的sp	蛋白质分泌w/最初的sp	蛋白质表达w/tPAsp	蛋白质分泌w/tPAsp	SR018C02	VEGFR1	-	-	+++	+++
SR020H07	MET	++	-	+++	+++	SR018C02	VEGFR1	-	-	+++	+++
SR020H07	MET	++	-	+++	+++	SR022D04	FGFR2	++	+	+++	+++
SR021C02	RAGE	++	+	+++	+++	SR022D04	FGFR2	++	+	+++	+++
SR021C02	RAGE	++	+	+++	+++	SR002A10	FGFR4	++	-	++	+
SR007G02	TEK	++	-	++	+	SR002A10	FGFR4	++	-	++	+
SR007G02	TEK	++	-	++	+	SR014C09	RON	++	-	++	+
Herstatin	HER2	+++	-	+++	+++	SR014C09	RON	++	-	++	+
Herstatin	HER2	+++	-	+++	+++	SR022D06	FGFR2	++	+	+++	+++

表15:tPA-内含子融合蛋白融合物促进重组内含子融合蛋白在293T细胞中的分泌

tPA-内含子融合蛋白	克隆ID	蛋白质分泌中的增加倍数
tPA-内含子融合蛋白	克隆ID	蛋白质分泌中的增加倍数	tPA-FGFR-2	SR022D06	5
tPA-VEGFR-1	SR018C02	10	tPA-FGFR-2	SR022D06	5
tPA-VEGFR-1	SR018C02	10	tPA-MET	SR020H07	30
tPA-HER2	Herstatin	30	tPA-MET	SR020H07	30

实施例3

Herstatin(Dimercept^TM)纯化和基于细胞的生长抑制测定法

A.使用293T细胞瞬时表达tPA-HER2

在DMEM/10％胎牛血清中保持293T细胞(ATCC)。为了转染，以每100mm细胞培养板1 x 10⁷的密度接种细胞。24小时后使用LipofectAmine^TM2000试剂(Invitrogen)按照生产商的推荐进行瞬时转染。简言之，在转染开始即刻前对293T细胞喂饲无血清的DMEM。为了转染每个293T细胞平板，在2ml无血清的DMEM中混合75μl LipofectAmine2000和25μg tPA-HER2表达构建体(或pcDNA对照质粒)。在室温温育DNA-LipofectAmine混合物20分钟然后逐滴应用到293T细胞平板。48小时后从转染的细胞收集上清液，离心，并过滤以除去剩余细胞。处理澄清的上清液用于蛋白质纯化。

B.部分纯化的Herstatin(Dimercept^TM)的纯化

使用切向流滤膜或使用搅拌的细胞系统滤器，将含有构建体编码的所表达的herstatin蛋白质产物的瞬时转染的条件细胞培养基浓缩约10倍，显示出10,000分子量分离截断值。进一步处理滤膜或滤器保持的物质。前述浓缩/体积减少之后，将样品用冷的50mM乙酸钠，pH5.5稀释(样品用一或二等体积的缓冲液稀释)并监测pH并使用乙酸或HCl调节pH(如果需要)，以实现最终pH 5.5。pH调节后，将条件培养基穿过0.45微米滤器以除去任何颗粒，然后进行柱层析。

随后将上述浓缩/调节的物质加到(每5ml床体积50-300ml进料；1-3ml/min流速)到SP-琼脂糖(Sepharose)离子交换层析柱上，用50mM乙酸钠，pH5.5平衡。使用柱平衡缓冲液将加样物洗涤到柱子上，并监测洗脱液直到在280nm的光吸收为最小且恒定。保留所得的穿过液和柱子洗涤液用于以后的评估。

使用等度步骤洗脱方法进行结合的蛋白质的柱洗脱，该洗脱以顺次的顺序使用下面的缓冲液:50mM乙酸钠，pH5.5，200mM氯化钠；50mM乙酸钠，pH5.5，500mM氯化钠；50mM乙酸钠，pH5.5，1M氯化钠；和50mM乙酸钠，pH5.5，2M氯化钠。在每个洗脱阶段，监测洗脱液的280nm吸收谱并进行在那些各自条件下含有从柱洗脱的物质的基线-基线合并。合并级分后，立即使用1M Tris-HCl，pH8(～10μl/ml级分合并)调节pH至7.0和7.5之间。

多数操作在2-8℃进行。所制备的物质和在分离过程中产生的所有级分的等分试样在2-8℃或-80℃保存直到进一步分析。

C.测定纯化的Herstatin(Dimercept^TM)的抗增殖活性

生物测定法评估-Herstatin的Alamar Blue生长抑制测定法

将DU-145细胞在测定前当天以5000/孔接种在96孔板中含有2％胎牛血清的DMEM中。细胞用0.2％ FBS/DMEM中的纯化的herstatin(nDcp)的合并级分的2倍连续稀释液和对照(代表10％、5％、2.5％、1.25％和0.75％测定体积)处理。在37℃培养5天后，通过Alamar Blue(Sigma Cat.#R7017)方法测量孔中的细胞密度。向含有100μl培养基的每孔加入100μl2x Alamar Blue并在Ex.＝530nm/Em.＝590nm下测量每个处理的和对照孔的荧光2-4小时。基于荧光读数通过剂量反应曲线分析DU145生长抑制并与来自对照处理的结果比较。纯化的herstatin合并级分在0.75％的测定体积浓度下抑制细胞增殖和生长约15％，在1.25％测定体积的浓度下观察到最大抑制(与pcDNA对照相比80％抑制)。

因为修饰将是本领域技术人员显而易见的，所以本发明意在仅仅被所附权利要求的范围所限定。

Claims

1.多肽，其包含受体酪氨酸激酶(RTK)同种型，该同种型直接或者通过多肽接头间接有效连接到异源前体序列或其足够实现所连接的RTK内含子融合蛋白的分泌、加工和/或运输的部分。

2.权利要求1的多肽，其中所述RTK同种型含有内源信号序列。

3.权利要求1的多肽，其中所述RTK同种型不含有内源信号序列。

4.权利要求1-3任一项的多肽，其中所述前体序列选自组织纤溶酶原激活物(tPA)前/原序列或其足够实现分泌的部分，和其等位基因变体和物种变体。

5.权利要求4的多肽，其中所述tPA前/原序列是哺乳动物tPA前/原序列。

6.权利要求4或5任一项的多肽，其中所述tPA前/原序列包含SEQ IDNO:2中给出的氨基酸序列或其等位基因变体或具有至少约80％、85％、90％、95％、96％、97％、98％、99％或更高序列同一性的变体，其中所述tPA部分实现所连接的RTK同种型的分泌、加工和/或运输。

7.权利要求1-6任一项的多肽，其中所述RTK同种型选自VEGFR、FGFR、PDGFR、MET、EPH、TIE、DDR和HER融合蛋白。

8.权利要求7的多肽，其中所述RTK同种型选自DDR1、EphA1、EphA2、EphA8、EphB1、EphB4、EGFR、HER-2(ErbB2)、ErbB3、FGFR-1、FGFR-2、FGFR-4、MET、RON、CSF1R、KIT、PDGFR-A、PDGFR-B、TEK、Tie-1、VEGFR-1、VEGFR-2、VEGFR-3和其等位基因变体或其与这些RTK同种型的任一种有至少约80％、85％、90％、95％、96％、97％、98％、99％或更高序列同一性的变体，其中所述变体具有对应的RTK同种型的至少一种活性。

9.权利要求8的多肽，其中所述RTK同种型包含SEQ ID NO:140、142、143、145、147、149、150、152、153、155、157、159、161-168、170、172、174、176、178、180、181、183、185、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、217、219、221、223、225、227、229-231、233、245、247-251、253、255、257、259、261、263-270、274-280、282、284、286、288、289-303的任一个中给出的氨基酸序列或其活性部分。

10.权利要求1-9任一项的多肽，其中所述RTK同种型通过接头有效连接到tPA前体序列或者其足够实现分泌的部分。

11.权利要求10的多肽，其中所述接头是限制酶接头，该接头由被一种或多种限制酶识别的核苷酸序列编码。

12.权利要求11的多肽，其中所述限制酶接头连接在同种型和tPA前/原序列或其足够实现分泌的部分之间。

13.权利要求1-12任一项的多肽，其任选包括方便多肽纯化和/或检测的标记。

14.权利要求13的多肽，其中所述标记连接在限制酶接头和tPA前体序列或其足够实现分泌的部分之间。

15.权利要求14的多肽，其中所述标记是myc标记。

16.权利要求15的多肽，其中所述RTK同种型选自VEGFR-1、FGFR-2、FGFR-4、TEK、RON、MET和其等位基因变体或其与这些RTK同种型的任一种有至少约80％、85％、90％、95％、96％、97％、98％、99％或更高序列同一性的变体，其中所述变体具有对应的RTK同种型的至少一种活性。

17.权利要求1-16任一项的多肽，其包含SEQ ID NO:32、34、36、40、42、46和48的任一个中给出的氨基酸序列。

18.权利要求13的多肽，其中所述构建体包括限制酶接头，并且所述标记位于所述限制酶接头和所述同种型之间。

19.权利要求13或18的多肽，其中所述标记是多聚-His标记。

20.权利要求1-19任一项的多肽，其中所述RTK同种型是HER-2或其等位基因变体。

21.权利要求1的多肽，其包含SEQ ID NO:38中给出的氨基酸序列。

22.多肽，其包含渐进性糖化终极产物的受体(RAGE)同种型，该同种型直接或者通过多肽接头间接地有效连接到异源前体序列或其足够实现RAGE同种型分泌和/或运输的部分。

23.权利要求22的多肽，其中所述RAGE同种型含有内源信号序列。

24.权利要求23的多肽，其中所述RAGE同种型蛋白不含有内源信号序列。

25.权利要求22-24任一项的多肽，其中所述前体序列是组织纤溶酶原激活物(tPA)前/原序列或其足够实现分泌的部分，和其等位基因变体或其变体，所述变体与所述前体序列有至少约80％、85％、90％、95％、96％、97％、98％、99％或更高序列同一性以实现RAGE同种型的分泌和/或加工或运输。

26.权利要求25的多肽，其中所述tPA前/原序列是哺乳动物tPA前/原序列。

27.权利要求25和26任一项的多肽，其中所述tPA前/原序列包含SEQ ID NO:2中给出的氨基酸序列，或其等位基因变体。

28.权利要求22-27任一项的多肽，其中所述RAGE同种型包含SEQID NO:235、237、239、241、243任一个中给出的氨基酸序列，或者其与之有至少约80％、85％、90％、95％、96％、97％、98％、99％或更高序列同一性的活性部分或变体。

29.权利要求22-28任一项的多肽，其中所述RAGE同种型通过接头有效连接到tPA前/原序列或者其足够实现分泌的部分。

30.权利要求29的多肽，其中所述接头是限制酶接头，该接头由被一种或多种限制酶识别的核苷酸序列编码。

31.权利要求30的多肽，其中所述限制酶接头连接在RAGE同种型或其活性部分和tPA前/原序列或其足够实现分泌的部分之间。

32.权利要求22-31任一项的多肽，其任选包括方便多肽纯化和/或检测的标记。

33.权利要求32的多肽，其中所述多肽含有限制酶接头，并且所述标记连接在限制酶接头和tPA前/原序列或其足够实现分泌的部分之间。

34.权利要求33的多肽，其中所述标记是myc标记。

35.权利要求22的多肽，其包含SEQ ID NO:44中给出的氨基酸序列。

36.多肽，其包含肿瘤坏死因子受体(TNFR)同种型，该同种型直接或者通过接头间接有效连接到异源前体序列或其足够实现TNFR同种型的分泌、加工和/或运输的部分。

37.权利要求36的多肽，其中所述TNFR同种型含有内源信号序列。

38.权利要求36的多肽，其中所述TNFR同种型不含有内源信号序列。

39.权利要求36-38任一项的多肽，其中所述前体序列是组织纤溶酶原激活物(tPA)前/原序列或其足够实现分泌的部分，或其等位基因变体或其与所述前体序列有至少约80％、85％、90％、95％、96％、97％、98％、99％或更高的序列同一性的变体。

40.权利要求39的多肽，其中所述tPA前/原序列是哺乳动物tPA前/原序列。

41.权利要求39和40任一项的多肽，其中所述tPA前/原序列包含SEQ ID NO:2中给出的氨基酸序列。

42.权利要求36-41任一项的多肽，其中所述TNFR同种型是TNFR1或TNFR2。

43.权利要求42的多肽，其中所述TNFR同种型是TNFR2同种型。

44.权利要求43的多肽，其中所述TNFR同种型包含SEQ ID NO:272中给出的氨基酸序列或其活性部分或与之有至少约80％、85％、90％、95％、96％、97％、98％、99％或更高序列同一性的变体。

45.权利要求36-44任一项的多肽，其中所述TNFR同种型通过接头有效连接到tPA前/原序列或其足够实现分泌、加工或运输的部分。

46.权利要求45的多肽，其中所述接头是限制酶接头，该接头由被一种或多种限制酶识别的核苷酸序列编码。

47.权利要求46的多肽，其中所述限制酶接头连接在同种型或其活性部分和tPA前/原序列或其足够实现分泌的部分之间。

48.权利要求36-47任一项的多肽，其任选包括方便多肽纯化和/或检测的标记。

49.权利要求48的多肽，其中所述多肽包括限制酶接头，并且所述标记连接在限制酶接头和tPA前体序列或其足够实现分泌的部分之间。

50.权利要求36-49任一项的多肽，其中所述标记是myc标记。

51.核酸分子，其包含编码权利要求1-50或92-104任一项的多肽的核苷酸序列。

52.核酸分子，其包含SEQ ID NO:31、33、35、37、39、41、43、45和47任一个中给出的核苷酸序列。

53.载体，其包含权利要求51或权利要求52的分子。

54.权利要求53的载体，其是哺乳动物表达载体。

55.权利要求54的载体，其选自pCI载体和pcDNA3.1载体。

56.权利要求53的载体，其选自腺病毒载体、腺伴随病毒载体、EBV、SV40、巨细胞病毒载体、痘苗病毒载体、疱疹病毒载体、反转录病毒载体、慢病毒载体，或人工染色体。

57.权利要求53-56任一项的载体，其是附加型的或者整合到它所导入的细胞的染色体中。

58.细胞，其包含权利要求53-57任一项的载体。

59.权利要求58的细胞，其是哺乳动物细胞。

60.权利要求59的细胞，其中所述哺乳动物细胞选自小鼠、大鼠、人、猴、鸡和仓鼠细胞。

61.权利要求59或60任一项的细胞，其中所述细胞选自CHO、Balb/3T3、HeLa、MT2、小鼠NS0和其他骨髓瘤细胞系、杂交瘤和异杂交瘤细胞系、淋巴细胞、成纤维细胞、Sp2/0、COS、NIH3T3、HEK293、293T、293S、2B8，和HKB细胞，和EBNA-1细胞。

62.产生CSR同种型或配体同种型的方法，其包括培养权利要求58-61任一项的细胞，从而分泌同种型。

63.权利要求62的方法，其还包括从细胞培养物纯化分泌的同种型。

64.权利要求63的方法，其中:

所述同种型包含用于方便纯化的表位标记；和

所述表位标记在所述蛋白质上表达。

65.权利要求63和64任一项的方法，其中用外切蛋白酶处理所述纯化的蛋白质。

66.权利要求65的方法，其中所述外切蛋白酶是纤溶酶样蛋白酶。

67.产生CSR同种型或配体同种型的方法，其包括导入编码所述同种型和信号序列的DNA构建体，从而从细胞分泌所述同种型。

68.权利要求67的方法，其中所述细胞是哺乳动物细胞。

69.权利要求68的方法，其中所述哺乳动物细胞选自小鼠、大鼠、人、猴、鸡和仓鼠细胞。

70.权利要求68和69任一项的方法，其中所述细胞选自CHO、Balb/3T3、HeLa、MT2、小鼠NS0和其他骨髓瘤细胞系、杂交瘤和异杂交瘤细胞系、淋巴细胞、成纤维细胞、Sp2/0、COS、NIH3T3、HEK293、293T、293S、2B8和HKB细胞，和EBNA-1细胞。

71.权利要求67-70任一项的方法，其中所述核酸分子是权利要求51或52的DNA构建体。

72.权利要求67-71任一项的方法，其中通过选自转染、电穿孔和核显微注射的方法将所述核酸分子导入细胞中。

73.权利要求67-72任一项的方法，其中通过使用磷酸钙、阳离子脂类试剂或者聚阳离子将核酸分子导入细胞中。

74.权利要求73的方法，其中所述阳离子脂类试剂选自:阳离子脂类N-[1-(2，3-二油基氧基)丙基]-N，N，N-三甲基氯化铵(DOTMA)和二油酰基-磷脂酰乙醇胺(DOPE)的1:1(w/w)制剂；聚阳离子脂类2，3-二油基氧基-N-[2(精胺-酰胺基)乙基]-N，N-二甲基-1-三氟乙酸丙铵(DOSPA)和二油酰基-磷脂酰乙醇胺(DOPE)的3:1(w/w)制剂和包含DOTMA、DOSPA和DOPE的一种或多种的其他组合物。

75.权利要求67-74任一项的方法，其还包括从细胞培养物纯化分泌的同种型。

76.权利要求75的方法，其中通过所述同种型表达的表位标记方便该蛋白质的纯化。

77.权利要求75和76任一项的方法，其中用外切蛋白酶处理纯化的蛋白质。

78.权利要求77的方法，其中所述外切蛋白酶是纤溶酶样蛋白酶。

79.多肽，其包含细胞表面受体(CSR)或配体同种型，其中:

所述多肽缺少内源前体序列；和

所述多肽在它的N-末端含有一个或多个额外的氨基酸。

80.权利要求79的多肽，其中所述内源前体序列包含信号序列。

81.权利要求79的多肽，其中所述内源前体序列包含信号序列和一个额外的氨基酸。

82.权利要求79-81任一项的多肽，其中所述CSR同种型是选自RTK、TNFR和RAGE同种型的同种型。

83.权利要求79-81的多肽，其中所述配体同种型是HGF的同种型。

84.权利要求79-83任一项的多肽，其包含SEQ ID NO:140、142、143、145、147、149、150、152、153、155、157、159、161-168、170、172、174、176、178、180、181、183、185、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、217、219、221、223、225、227、229-231、233、235、237、239、241、243、245、247-251、253、255、257、259、261、263-270、272、274-280、282、284、286、288、289-303、350、352和354任一个中给出的氨基酸序列的全部或部分、其等位基因变体或物种变体和其与之有至少约80％、85％、90％、95％、96％、97％、98％、99％或更高序列同一性的变体，该变体具有SEQID NO:140、142、143、145、147、149、150、152、153、155、157、159、161-168、170、172、174、176、178、180、181、183、185、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、217、219、221、223、225、227、229-231、233、235、237、239、241、243、245、247-251、253、255、257、259、261、263-270、272、274-280、282、284、286、288、289-303、350、352和354任一个中给出的对应多肽的至少一种活性。

85.权利要求79-84任一项的多肽，其中在N-末端的一个或多个额外的氨基酸是一个或多个限制酶接头序列或tPA的原序列的部分或者表位标记，其中限制酶接头由被一种或多种限制酶识别的核苷酸序列编码。

86.权利要求79-85任一项的多肽，其中在N-末端的一个或多个额外氨基酸是GAR、SR或LE。

87.权利要求79-86任一项的多肽，其中在N-末端的一个或多个额外氨基酸是GARSR或GARLE。

88.权利要求1-50和79-87任一项的多肽，其包含多聚化结构域。

89.药物组合物，其包含权利要求1-50和79-88任一项的多肽。

90.治疗疾病或状况的方法，其包括对受试者施用权利要求89的药物组合物，其中所述疾病或状况由同族CSR或配体介导。

91.权利要求90的方法，其中所述疾病或状况是炎性疾病、癌症、血管发生介导的疾病，或超增生疾病。

92.权利要求91的方法，其中所述疾病或状况选自眼疾病、动脉粥样硬化、糖尿病、类风湿性关节炎、血管瘤、伤口愈合、阿尔茨海默氏病、克雅氏病、亨廷顿舞蹈症、平滑肌增生相关的疾病、多发性硬化、心血管疾病和肾病。

93.权利要求91的方法，其中所述癌症选自癌、淋巴瘤、胚细胞瘤、肉瘤、白血病、淋巴样恶性肿瘤、鳞状细胞癌、肺癌，包括小细胞肺癌、非小细胞肺癌、肺的腺癌和肺的鳞状癌，腹膜的癌、肝细胞癌、胃癌，包括胃肠癌，胰腺癌、成胶质细胞瘤、宫颈癌、卵巢癌、肝癌、膀胱癌、肝细胞瘤、乳腺癌、结肠癌、直肠癌、结直肠癌、子宫内膜或子宫癌、唾液腺癌、肾脏或肾癌、前列腺癌、女阴癌、甲状腺癌、肝癌、肛门癌、阴茎癌和头颈癌。

94.多肽，其包含肝细胞生长因子(HGF)同种型，该同种型直接或者间接有效连接到异源前体序列或其足够实现HGF同种型分泌和/或运输的部分。

95.权利要求94的多肽，其中HGF同种型含有内源信号序列。

96.权利要求95的多肽，其中HGF同种型不含有内源信号序列。

97.权利要求94-95任一项的多肽，其中所述前体序列是组织纤溶酶原激活物(tPA)前/原序列或其足够实现分泌的部分，和其等位基因变体或其有至少约80％、85％、90％、95％、96％、97％、98％、99％或更高序列同一性的变体，其中所述变体实现所连接的同种型的分泌、加工和/或运输。

98.权利要求97的多肽，其中所述tPA前/原序列是哺乳动物tPA前/原序列。

99.权利要求97和98任一项的多肽，其中所述tPA前/原序列包含SEQ ID NO:2中给出的氨基酸序列，或其等位基因变体。

100.权利要求94-99任一项的多肽，其中所述HGF同种型包含SEQID NO:350、352和354任一个中给出的氨基酸序列或者其活性部分。

权利要求95-100任一项的多肽，其中所述HGF同种型通过接头有效连接到tPA前/原序列或者其足够实现所连接的同种型的分泌、加工和/或运输的部分。

权利要求101的多肽，其中所述接头是限制酶接头，该接头由被一种或多种限制酶识别的核苷酸序列编码。

权利要求102的多肽，其中所述限制酶接头连接在同种型或其活性部分和tPA前/原序列或其足够实现分泌的部分之间。

权利要求95-103任一项的多肽，其任选包括方便多肽纯化和/或检测的标记。

权利要求104的多肽，其中:

所述多肽包含限制酶接头，其中该接头是由被一种或多种限制酶识别的核苷酸序列编码的限制酶接头；和

所述标记连接在限制酶接头和tPA前体序列或其足够实现分泌的部分之间。

权利要求94-104任一项的多肽，其中所述标记是myc标记。

权利要求1-50、78-87和94-106任一项的多肽，其中所述同种型是内含子融合蛋白。

权利要求62-78任一项的方法，其中所述同种型是内含子融合蛋白。

药物组合物，其包含权利要求51或52的核酸分子，或权利要求53-57任一项的载体或权利要求58-61任一项的细胞，其中所述疾病或状况由CSR或其配体介导。

110.治疗疾病或状况的方法，其包括对受试者施用权利要求109的药物组合物，其中所述疾病或状况由同族CSR或配体介导。

111.权利要求110的方法，其中所述疾病或状况是炎性疾病、癌症、血管发生介导的疾病，或超增生疾病。

112.权利要求110的方法，其中所述疾病或状况选自眼疾病、动脉粥样硬化、糖尿病、类风湿性关节炎、血管瘤、伤口愈合、阿尔茨海默氏病、克雅氏病、亨廷顿舞蹈症、平滑肌增生相关的疾病、多发性硬化、心血管疾病和肾病。

113.权利要求112的方法，其中所述癌症选自癌、淋巴瘤、胚细胞瘤、肉瘤、白血病、淋巴样恶性肿瘤、鳞状细胞癌、肺癌，包括小细胞肺癌、非小细胞肺癌、肺的腺癌和肺的鳞状癌，腹膜的癌、肝细胞癌、胃癌，包括胃肠癌，胰腺癌、成胶质细胞瘤、宫颈癌、卵巢癌、肝癌、膀胱癌、肝细胞瘤、乳腺癌、结肠癌、直肠癌、结直肠癌、子宫内膜或子宫癌、唾液腺癌、肾脏或肾癌、前列腺癌、女阴癌、甲状腺癌、肝癌、肛门癌、阴茎癌和头颈癌。

114.权利要求51或52的DNA构建体，或权利要求53-57任一项的载体或权利要求58-61任一项的细胞的用途，用于治疗CSR或其配体介导的疾病或状况。

115.权利要求51或52的DNA构建体，或权利要求53-57任一项的载体或权利要求58-61任一项的细胞的用途，用于配制治疗CSR或其配体介导的疾病或状况的药物。

116.权利要求114或权利要求115的用途，其中所述疾病或状况是炎性疾病、癌症、血管发生介导的疾病，或超增生疾病。