CN101280305A - 能调节对细胞因子的细胞反应性的治疗和诊断制剂 - Google Patents

能调节对细胞因子的细胞反应性的治疗和诊断制剂 Download PDF

Info

Publication number
CN101280305A
CN101280305A CNA2006101359229A CN200610135922A CN101280305A CN 101280305 A CN101280305 A CN 101280305A CN A2006101359229 A CNA2006101359229 A CN A2006101359229A CN 200610135922 A CN200610135922 A CN 200610135922A CN 101280305 A CN101280305 A CN 101280305A
Authority
CN
China
Prior art keywords
seq
amino acid
socs
sequence
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006101359229A
Other languages
English (en)
Inventor
D·J·希尔顿
W·S·亚历山大
E·M·威尼
T·A·威尔逊
R·T·理查森
R·斯塔尔
S·E·尼科尔森
D·梅特卡夫
N·A·尼克拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inst Medical W & E Hall
Original Assignee
Inst Medical W & E Hall
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AUPO3384A external-priority patent/AUPO338496A0/en
Priority claimed from AUPO5117A external-priority patent/AUPO511797A0/en
Application filed by Inst Medical W & E Hall filed Critical Inst Medical W & E Hall
Publication of CN101280305A publication Critical patent/CN101280305A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2/00Peptides of undefined number of amino acids; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4703Inhibitors; Suppressors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P19/00Drugs for skeletal disorders
    • A61P19/02Drugs for skeletal disorders for joint disorders, e.g. arthritis, arthrosis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P29/00Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/08Drugs for disorders of the metabolism for glucose homeostasis
    • A61P3/10Drugs for disorders of the metabolism for glucose homeostasis for hyperglycaemia, e.g. antidiabetics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/08Antiallergic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • A61P9/12Antihypertensives

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Diabetes (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Zoology (AREA)
  • Rheumatology (AREA)
  • Endocrinology (AREA)
  • Pulmonology (AREA)
  • Orthopedic Medicine & Surgery (AREA)
  • Pain & Pain Management (AREA)
  • Hematology (AREA)
  • Obesity (AREA)
  • Emergency Medicine (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Cardiology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明总的涉及治疗和诊断试剂,更具体地,本发明提供能调节信号传导,例如但不限于细胞因子介导的信号传导的治疗分子。本发明在调节对细胞因子及其它信号传导介质如内源或外源分子、抗原、微生物群体和微生物产物、病毒或其组成成分、离子、激素和寄生物的细胞反应性中有用。

Description

能调节对细胞因子的细胞反应性的治疗和诊断制剂
本申请为分案申请,母案申请日为1997年10月31日,申请号为97180920.8(国际申请号PCT/AU97/00729),发明名称为“能调节对细胞因子的细胞反应性的治疗和诊断制剂”。
发明领域
本发明总的涉及治疗和诊断制剂。更具体地,本发明提供能够调节信号传导,例如但不限于细胞因子介导的信号传导的治疗分子。本发明在调节对细胞因子及其它信号传导介质如内源或外源分子、抗原、微生物群体和微生物产物、病毒或其组成成分、离子、激素和寄生物的细胞反应性中有用。
作者将本说明书提及的公开文献的目录细节收在本说明书后。本说明中提及的核苷酸和氨基酸的序列鉴定号在文献目录后定义。SEQ IDNO总结于表1。
在下面说明书和权利要求书中,除非内容需求,否则词“包括”或“包含”应理解将为含有所述的整数或整数群但不排除任何其它整数或整数群。
发明背景
为调节生理和生化过程,继而影响将发生的行为,细胞持续地监测着它们的环境。一般地,细胞与其周边之间最初的相互作用经质膜上表达的受体发生。受体经内源配体(如细胞因子)或外源配体(如抗原)结合而活化,激发从膜到细胞质至细胞核的生化级联反应。
在内源配体中,细胞因子为特别重要和熟悉的一类。细胞因子是调节存活、繁殖、分化和体内名种细胞功能的蛋白(Nicola,1994)。造血细胞因子有共同的4个α螺旋串结构并且大多数与结构相关的细胞表面受体家族I型和II型细胞因子受体相互作用(Bazan,1990;Sprang,1993)。在所有情况下,配体诱导的受体聚集看来是启动细胞内信号传导级联反应的关键事件。一些细胞因子如生长激素、促红细胞生成素和粒细胞集落刺激因子(G-CSF)激发受体同源二聚体的形成,而对于其它细胞因子,异源二聚体或异源三聚体形成是关键的。对于后一种情况,几种细胞因子使用共同的受体亚单位,并且基于此可以将它们归为具有相似的细胞内活化模式和相似的生物效应的三个家族(Hilton,1994)。白细胞介素-3(IL-3)、IL-5和粒细胞-巨噬细胞集落刺激因子(G-CSF)使用共同的β受体亚单位,并且每个细胞因子都刺激粒细胞和巨噬细胞的合成和功能性活性。IL-2、IL-4、IL-7、IL-9和IL-15都使用共同的γ链(γc),而IL-4和IL-13使用可选择的γ链(γC或IL-13受体α链)。这些细胞因子都在调节淋巴系统内获得性免疫方面起重要作用。最后,IL-6、IL-11、白血病抑制因子(LIF)、制癌蛋白-M(OSM)、睫状神经营养因子(CNTF)和促心激素(CT)使用受体亚单位gp130。这些细胞因子都表现高度多效性,在造血系统内外都有效力[Nicola,1994)。
在所有上述情况中,每种受体复合物的至少一个亚单位在它们的胞质尾部含有保守的序列元件,称为元件盒1和元件盒2[Murakami,1991]。元件盒1是富集脯氨酸的基序,位于比酸性元件盒2元件离转膜结构域更近的位置。元件盒1区域作用为称为JAK(Janus激酶)的一类胞质酪氨酸激酶的结合位点。配体诱导的受体二聚体形成导致结合的JAK通过交叉磷酸化作用增加催化活性。然后活化的JAK对几种底物包括受体本身进行酪氨酸磷酸化。然后受体上特异的磷酸酪氨酸残基作用为含SH2蛋白的对接位点,含SH2蛋白的最佳典型是信号转导蛋白、转录激活物(STAT)和转接蛋白shc。然后STAT可能在酪氨酸处被JAK磷酸化,从受体上解离并通过一个STAT的SH2结构域和另一个STAT的磷酸酪氨酸残基位点间的相互作用形成同源二聚体和异源二聚体。然后STAT二聚体转移到核内,在那里它们与特异的细胞因子反应性启动子结合并活化转录[Darnell,1994;Ihle,1995,Ihle,1995)。在另一通路中,酪氨酸磷酸化的Shc与另一含有SH2结构域的蛋白Grb-2相互作用最终导致MAP激酶家族成员的活化并继而导致转录因子如fos和jun的激活[San,1993;Culter,1993]。这些通路不是细胞因子受体家族成员专有的,因为结合受体酪氨酸激酶的细胞因子也能激活STAT和MAP激酶家族的成员[David,1996;Leamen,1996;Shual,1993;Sato,1993;Cutler,1993]。
已有JAK胞质酪氨酸激酶家族的四个成员JAK1、JAK2、JAK3和JYK2得到描述,这四个成员的每一个都与细胞因子受体亚单位的特定亚型结合。也有6个STAT得到描述(STAT1-STAT6),它们也由不同的细胞因子/受体复合物活化。例如,STAT1看来对干扰素系统有功能特异性,STAT4看来对IL-12特异,而STAT6对IL-4和IL-13特异。因此,尽管有相同的活化机制,但是某些程度的细胞因子特异性可以通过使用特异的JAK和STAT得到[Thierfelder,1996;Kaplan,1996;Takeda,1996;Shimoda,1996;Meraz,1996;Durbin,1996]。
除了上述的那些,也有一些这些通路活化的其它机制。例如,JAK/STAT通路看来能独立于shc诱导的通路活化MAP激酶[David,1995],并且STAT本身也许可以在不与受体结合时通过与JAK直接相互作用活化[Gupta,1996]。相反地,STAT的完全活化可能需要MAP激酶的活化和JAK的活化[David,1995;Wen 1995]。
尽管对这些信号通路活化的了解越来越多,但是对这些通路的调节包括正或负反馈环的情况了解还很少。既然一旦细胞开始对刺激反应是重要的,那么调节反应的强度和时间及信号传导的关闭也是关键的。同样,系统地或甚至局部地在所需的位置增强反应的强度是有利的。
在取得本发明的工作中,发明人设法分离信号传导的负调节因子。本发明人目前已鉴定了能作用为信号调节因子的新蛋白家族。根据最初鉴定的新蛋白家族分子抑制细胞因子介导的信号传导的能力,将它们定义为细胞因子信号传导抑制剂(SOCS)家族。然而应当注意的是,不是所有的SOCS家族成员一定有抑制功能或只是靶向细胞因子介导的信号传导。依据位于称为SOCS元件盒的C末端基序的N端氨基酸,SOCS家族包含至少三类蛋白分子。新的调节分子家族的鉴定使得可以制备一系列能够调节信号传导并因此能调节对一系列分子包括细胞因子的反应性的效应物或调节剂分子。因此,本发明提供以SOCS蛋白,其衍生物、同系物、类似物和模拟物以及SOCS蛋白的拮抗剂和兴奋剂为基础的治疗和诊断试剂。
发明概述
本发明尤其提供编码SOCS蛋白家族成员的核酸分子以及蛋白本身。此后提及的“SOCS”包括任何或所有SOCS家族成员。特异的SOCS分子用数字定义,如SOCS1、SOCS2和SOCS3。从中得到SOCS的物种可以用开始的单字母缩写表示,其中“h”是人,“m”是小鼠,“r”是大鼠。因此,“mSOCS1”是来自动物小鼠的特异的SOCS。此处提及的“SOCS”不是指蛋白专门抑制细胞因子介导的信号传导,分子也可以调节其它效应物如通过激素或其它内源或外源分子、抗原、微生物群体和微生物产物、病毒或其成分、离子、寄生物介导的信号传导。术语“调节”包括正调节、负调节及特定水平的维持。
本发明的一方面提供包含编码在其C末端区域含有SOCS元件盒的蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核苷酸序列的核酸分子或在42℃低严格条件下与其杂交的核酸分子。
本发明的另一方面提供包含编码含有在其C末端区域的SOCS元件盒和蛋白:分子相互作用区域的蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核苷酸序列的核酸分子或在42℃低严格条件下与其杂交的核酸分子。
本发明的另一方面针对包含编码含有C末端区域SOCS元件盒和位于SOCS元件盒的N端区域的蛋白:分子相互作用区域的蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核昔酸序列的核酸分子或在42℃低严格条件下与其杂交的核酸分子。
优选地,蛋白:分子相互作用区域是蛋白:DNA或蛋白:蛋白结合区域。
本发明的另一方面提供包含编码含有在其C末端区域的SOCS元件盒和SOCS元件盒N端的一个或多个SH2结构域、WD-40重复或锚蛋白重复的蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核苷酸序列的核酸分子或在42℃低严格条件下与其杂交的核酸分子。
本发明的另一方面针对包含编码在其C末端区域含有SOCS元件盒的蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核苷酸序列的核酸分子或在42℃低严格条件下与其杂交的核酸分子,其中SOCS元件盒含有以下氨基酸序列:
X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]nX17X18X19X20X21X22X23[Xj]nX24X25X26X27X28
其中,X1是L,I,V,M,A或P;
X2是任何氨基酸残基;
X3是P,T或S;
X4是L,I,V,M,A或P;
X5是任何氨基酸;
X6是任何氨基酸;
X7是L,I,V,M,A,F,Y或W;
X8是C,T或S;
X9是R,K或H;
X10是任何氨基酸;
X11是任何氨基酸;
X12是L,I,V,M,A或P;
X13是任何氨基酸;
X14是任何氨基酸;
X15是任何氨基酸;
X16是L,I,V,M,A,P,G,C,T或S;
[Xi]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X17是L,I,V,M,A或P;
X18是任何氨基酸;
X19是任何氨基酸;
X20L,I,V,M,A或P;
X21是P;
X22是L,I,V,M,A,P或G;
X23是P或N;
[Xj]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X24是L,I,V,M,A或P;
X25是任何氨基酸;
X26是任何氨基酸;
X27是Y或F;
X28是L,I,V,M,A或P;
并且在SOCS元件盒的N端的蛋白:分子相互作用区域例如但不限于一个或多个SH2结构域、WD-40重复和/或锚蛋白重复。
本发明的另一方面针对包含编码表现以下特征的蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核苷酸序列的核酸分子或在42℃低严格条件下与其杂交的核酸分子:
(i)在其C末端区域包含具有如下氨基酸序列的SOCS元件盒:
X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]nX17X18X19X20X21X22X23[Xj]n X24X25X26X27X28
其中,X1是L,I,V,M,A或P;
X2是任何氨基酸残基;
X3是P,T或S;
X4是L,I,V,M,A或P;
X5是任何氨基酸;
X6是任何氨基酸;
X7是L,T,V,M,A,F,Y或W;
X8是C,T或S;
X9是R,K或H;
X10是任何氨基酸;
X11是任何氨基酸;
X12是L,I,V,M,A或P;
X13是任何氨基酸;
X14是任何氨基酸;
X15是任何氨基酸;
X16是L,I,V,M,A,P,G,C,T或S;
[Xi]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X17是L,I,V,M,A或P;
X18是任何氨基酸;
X19是任何氨基酸;
X20L,I,V,M,A或P;
X21是P;
X22是L,I,V,M,A,P或G;
X23是P或N;
[Xj]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X24是L,I,V,M,A或P;
X25是任何氨基酸;
X26是任何氨基酸;
X27是Y或F;
X28是L,I,V,M,A或P;
(ii)在SOCS元件盒N端区域内包含至少一个SH2结构域、WD-40重复和/或锚蛋白重复或其它蛋白:分子相互作用区域。
优选地,SOCS分子调节诸如来自细胞因子或激素或其它外源或内源分子、微生物群体或微生物产物、抗原或寄生物的信号传导。
更优选地,SOC分子调节细胞因子介导的信号传导。
本发明的另一方面提供包含编码表现以下特征的蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核苷酸序列的核酸分子或在42℃低严格条件下与其杂交的核酸分子:
(i)能调节信号传导;
(ii)在其C末端包含具有以下氨基酸序列的SOCS元件盒:
X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]n X17X18X19X20X21X22X23[Xj]nX24X25X26X27X28
其中,X1是L,I,V,M,A或P;
X2是任何氨基酸残基;
X3是P,T或S;
X4是L,I,V,M,A或P;
X5是任何氨基酸;
X6是任何氨基酸;
X7是L,I,V,M,A,F,Y或W;
X8是C,T或S;
X9是R,K或H;
X10是任何氨基酸;
X11是任何氨基酸;
X12是L,I,V,M,A或P;
X13是任何氨基酸;
X14是任何氨基酸;
X15是任何氨基酸;
X16是L,I,V,M,A,P,G,C,T或S;
[Xi]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X17是L,I,V,M,A或P;
X18是任何氨基酸;
X19是任何氨基酸;
X20L,I,V,M,A或P;
X21是P;
X22是L,I,V,M,A,P或G;
X23是P或N;
[Xj]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X24是L,I,V,M,A或P;
X25是任何氨基酸;
X26是任何氨基酸;
X27是Y或F;
X28是L,I,V,M,A或P;
(iii)在SOCS元件盒N端区域内包含至少一个SH2结构域、WD-40重复和/或锚蛋白重复或其它蛋白:分子相互作用结构域。
优选地,信号传导由细胞因子如一个或多个EPO,TPO,G-CSF,GM-CSF,IL-3,IL-2,IL-4,IL-7,IL-13,IL-6,LIF,IL-12,IFNα,TNF α,IL-1和/或M-CSF介导。
优选地,信号传导由一个或多个白细胞介素6(IL-6)、白血病抑制因子(LIF)、制癌蛋白(OSM)、干扰素(IFN)-α和/或促血小板生成素介导。
优选地,信号传导由IL-6介导。
特别优选的核酸分子包含主要如下列出的核苷酸序列:
SEQ ID NO:3(mSOCS1),SEQ ID NO:5(mSOCS2),SEQ ID NO:7(mSOCS3),SEQID NO:9(hSOCS1),SEQ ID NO:11(rSOCS1),SEQ ID NO:13(mSOCS4),SEQ ID NO:15和SEQID NO:16(hSOCS4),SEQ ID NO:17(mSOCS5),SEQ ID NO:19(hSOCS5),SEQID NO:20(mSOCS6),SEQ ID NO:22和SEQ ID NO:23(hSOCS6),SEQ ID NO:24(mSOCS7),SEQ ID NO:26和SEQ ID NO:27(hSOCS7),SEQ ID NO:28(mSOCS8),SEQID NO:30(mSOCS9),SEQ ID NO:31(hSOCS9),SEQ ID NO:32(mSOCS 10),SEQ ID NO:33和SEQ ID NO:34(hSOCS 10),SEQ ID NO:35(hSOCS 11),SEQ ID NO:37(mSOCS 12),SEQ ID NO:38和SEQ ID NO:39(hSOCS 12),SEQ ID NO:40(mSOCS 13),SEQ ID NO:42(hSOCS 13),SEQ ID NO:43(mSOCS 14),SEQ ID NO:45(mSOCS 15)和SEQ ID NO:47(hSOCS15)或与任一列出的序列的所有或部分区域有至少约15%相似性的核苷酸序列或能与任一列出的序列在42℃低严格条件下杂交的核酸分子。
本发明的另一方面涉及在其C末端区域包含SOCS元件盒的蛋白或其同系物、类似物或模拟物。
本发明的另一方面针对包含在其C末端区域的SOCS元件盒和蛋白:分子相互作用区域的蛋白或其同系物、类似物或模拟物。
本发明的另一方面提供在SOCS元件盒的N端区域含有相互作用区域的蛋白或其同系物、类似物或模拟物。
优选地,蛋白:分子相互作用区域是蛋白:DNA或蛋白:蛋白结合区域。
本发明的另一方面包括包含在其C末端区域的SOCS元件盒和SOCS元件盒N端的SH2结构域、WD-40重复成锚蛋白重复的蛋白或其同系物、类似物或模拟物。
本发明的另一方面提供表现以特征的蛋白或其同系物、类似物或模拟物。
(i)在其C末端包含具有以下氨基酸序列的SOCS元件盒:
X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]nX17X18X19X20X21X22X23[Xj]nX24X25X26X27X28
其中,X1是L,I,V,M,A或P;
X2是任何氨基酸残基;
X3是P,T或S;
X4是L,I,V,M,A或P;
X5是任何氨基酸;
X6是任何氨基酸;
X7是L,I,V,M,A,F,Y或W;
X8是C,T或S;
X9是R,K或H;
X10是任何氨基酸;
X11是任何氨基酸;
X12是L,I,V,M,A或P;
X13是任何氨基酸;
X14是任何氨基酸;
X15是任何氨基酸;
X16是L,I,V,M,A,P,G,C,T或S;
[Xi]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X17是L,I,V,M,A或P;
X18是任何氨基酸;
X19是任何氨基酸;
X20L,I,V,M,A或P;
X21是P;
X22是L,I,V,M,A,P或G;
X23是P或N;
[Xj]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X24是L,I,V,M,A或P;
X25是任何氨基酸;
X26是任何氨基酸;
X27是Y或F;
X28是L,I,V,M,A或P;
(ii)在SOCS元件盒N端区域内包含至少一个SH2结构域、WD-40重复和/或锚蛋白重复或其它蛋白:分子相互作用结构域。
优选地,蛋白调节信号传导如细胞因子介导的信号传导。
优选的细胞因子是EPO,TPO,G-CSF,GM-CSF,IL-3,IL-2,IL-4,IL-7,IL-13,IL-6,LIF,IL-12,IFYγ,TNFα,IL-1和/或M-CSF。
特别优选的细胞因子是IL-6。
本发明的另一方面提供表现以下特征的蛋白或其衍生物、同系物、类似物或模拟物:
(i)能调节信号传导如细胞因子介导的信号传导;
(ii)在其C末端包含具有以下氨基酸序列的SOCS元件盒:
X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]n X17X18X19X20X21X22X23[Xj]n X24X25X26X27X28
其中,X1是L,I,V,M,A或P;
X2是任何氨基酸残基;
X3是P,T或S;
X4是L,I,V,M,A或P;
X5是任何氨基酸;
X6是任何氨基酸;
X7是L,I,V,M,A,F,Y或W;
X8是C,T或S;
X9是R,K或H;
X10是任何氨基酸;
X11是任何氨基酸;
X12是L,I,V,M,A或P;
X13是任何氨基酸;
X14是任何氨基酸;
X15是任何氨基酸;
X16是L,I,V,M,A,P,G,C,T或S;
[Xi]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X17是L,I,V,M,A或P;
X18是任何氨基酸;
X19是任何氨基酸;
X20L,I,V,M,A或P;
X21是P;
X22是L,I,V,M,A,P或G;
X23是P或N;
[Xj]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X24是L,I,V,M,A或P;
X25是任何氨基酸;
X26是任何氨基酸;
X27是Y或F;
X28是L,I,V,M,A或P;
(iii)在SOCS元件盒N端区域内包含至少一个SH2结构域、WD-40重复和/或锚蛋白重复或其它蛋白:分子相互作用结构域。
特别优选的SOCS蛋白包含主要如下列出的氨基酸序列:
SEQ ID NO:4(mSOCS1),SEQ ID NO:6(mSOCS2),SEQ ID NO:8(mSOCS3),SEQ IDNO:10(hSOCS1),SEQ ID NO:12(rSOCS1),SEQ ID NO:14(mSOCS4),SEQ ID NO:18(mSOCS5),SEQ ID NO:21(mSOCS6),SEQ ID NO:25(mSOCS7),SEQ ID NO:29(mSOCS8),SEQ ID NO:36(hSOCS11),SEQ ID NO:41(mSOCS13),SEQ ID NO:44(mSOCS14),SEQ ID NO:46(mSOCS15)和SEQ ID NO:48(hSOCS15)或与任一列出的序列的所有或部分区域有15%相似性的氨基酸序列。
本发明的另一方面包括调节细胞内SOCS蛋白水平的方法,该方法包括使含有SOCS基因的细胞与有效量的SOCS基因表达或SOCS蛋白活性的调节剂在足以调节所述SOCS蛋白水平的条件下接触一段时间。
本发明的另一方面提供调节含有SOCS基因的细胞内信号传导的方法,该方法包括使所述细胞与有效量的SOCS基因表达或SOCS蛋白活性的调节剂接触足以调节信号传导的一段时间。
本发明的另一方面针对影响其中至少一种细胞带有SOCS基因的细胞间相互作用的方法,该方法包括使带有SOCS基因的细胞与有效量的SOCS基因表达或SOCS蛋白活性的调节剂接触足以调节信号传导的一段时间。
根据本发明,[Xi]n和[Xj]n中的n除了1-50外,还可以是1-30,1-20,1-10和1-5。
在本说明书中提及的SEQ ID NO的总结在表1中给出。
表1  序列鉴定号的总结
Figure A20061013592200261
使用单字母和三字母缩写指代氨基酸残基并且将它们总结在表2中。
表2
Figure A20061013592200271
附图简述
在一些图中,使用缩写来指代具有特定结合基序的SOCS蛋白。含有WD-40重复的SOCS蛋白称为WSB1-WSB4。带有锚蛋白重复的SOCS蛋白称为ASB1-ASB3。
图1是表示制备在逆转录病毒RUFneo逆转录病毒侵染时IL-6非反应性的M1克隆的图示,表示了限制性内切酶标记、4A2cDNA插入和PCR引物序列的位置。
图2是Southern和Northern分析的摄影图示。左边和中间板表示克隆4A2和对照侵染的M1克隆的基因组DNA的Southern印迹分析。用BamHI消化DNA以揭示每个克隆携带的逆转录病毒的数目,用SacI消化以估计逆转录病毒cDNA插入的大小。左边板:用neo探测。右边板:用XhoI消化的4A2PCR产物探测。左边板表示用XhoI消化的4A2PCR产物探测克隆4A2和对照侵染的M1克隆的总RNA的Northern印迹分析。两条带表示来自逆转录病毒基因组剪接供体和受体位点的未剪接的和剪接的逆转录病毒转录物。
图3是SOCS1基因的氨基酸序列和结构图示。A:鼠染色体16上与鱼精蛋白基因簇相关的SOCS1的基因组前后关系。该基因座的登记号是MMPRMGNS(直接提交;G.Schlueter,1996)。B:SOCS1cDNA的核苷酸序列和推测的氨基酸序列。使用传统的单字母缩写代表氨基酸序列,星号代表终止密码子。编码区域以大写字母表示,非编码区域以小写字母表示。
图4是细胞因子参与的细胞分化图示。使用亲本M1细胞(M1和M1.mpl)和表达SOCS1的M1细胞(4A2和M1.mpl.SOCS1)的半固体培养物并测定对1mg/ml IL-6(●),100ng/ml LIF(◇),1mg/ml OSM(□),100ng/m IFN-γ(▲),500ng/ml TPO(●)或3×10-6M地塞米松的滴度反应分化的克隆百分数。
图5是在含有10ng/ml IL-6或盐水时培养4天的亲本M1细胞(M1和M1.mpl)和表达SOCS1的M1细胞(4A2和M1.mpl.SOCS1)的液体培养物的细胞自旋(Cytospin)摄影图示。
图6是表示SOCS1抑制信号传导磷酸化作用的摄影图示。亲本M1细胞(M1和M1.mpl)和表达SOCS1的M1细胞(4A2和M1.mpl.SOCS1)于37℃在含有(+)或不含有(-)10ng/ml IL-6的情况下培养4分钟。裂解细胞抽提物或者在SDS-PAGE前用抗小鼠gp130的抗体免疫沉淀(上面两板)或直接电泳(下面两板)。然后将胶印迹并用抗磷酸酪氨酸的抗体(上面板)、抗gp130的抗体(上面第二块板)、抗磷酸STAT3的抗体(底部第二块板)或抗STAT3的抗体(下面板)探测膜。使用过氧化物酶偶联的二抗和加强的Chemiluminescence(ECL)试剂使印迹可见。
图7是从于37℃在10ml含盐水、100ng/ml IL-6或100ng/ml IFN-γ的无血清DME中培养10分钟的(A)M1细胞或表达SOCS1的M1细胞(4A2)和(B)M1.mpl细胞或M1.mpl.SOCS1细胞制备的蛋白提取物图示。结合反应包含4-6μg蛋白(在给定实验中不变)、5ng32P标记的编码高亲和性SIF(c-sis诱导的因子)结合位点的m67寡核苷酸和800ng超声处理的鲑精DNA。在某些实验中,蛋白样品与过量的未标记的m67寡核苷酸或与对STAT1或STAT2特异的抗体一起预培养。
图8是Northern杂交的摄影图示。用2μg在不同时间间期后静脉注射小鼠,取出肝脏并纯化多聚腺苷酸化mRNA。用500ng/ml IL-6对M1细胞刺激不同长度时间之后分离多聚腺苷酸化mRNA。通过电泳分离mRNA并固定在尼龙膜上。对Northern印迹进行预杂交,用随机引物标记的32P标记的SOCS1或GAPDH DNA片段杂交、洗涤并对胶片曝光过夜。
图9表示SOCS1、SOCS2、SOCS3和CIS氨基酸序列的比较,小鼠(mm)、人(hs)和大鼠(rr)SOCS1、SOCS2、SOCS3和CIS的推测氨基酸序列的匹配。画上阴影的残基在三个或四个小鼠SOCS家族成员中保守。SH2结构域框在实线内,而SOCS元件盒包在双线内。
图10是表示IL-6非反应性M1细胞克隆4A2的表型的摄影图示。亲本M1细胞(左板)和克隆4A2(右板)的集落在半固体培养基中在盐水或100ng/ml IL-6中培养7天。
图11表示SOCS家族成员的mRNA体外和体内表达的摄影图示。
(A)来自一系列鼠器官的mRNA的Northern分析,表示SOCS家族成员在有限数量的组织中组成型表达。
(B)来自肝和M1细胞的mRNA的Northern分析,表示与IL-6接触后SOCS家族成员的表达诱导。
(C)来自骨髓的mRNA的反转录酶PCR分析,表示一系列细胞因子诱导SOCS家族成员的表达。
图12是表示SOCS1抑制gp130和STAT3的磷酸化和活化的摄影图示。
(A)来自用(+)或不用(-)100ng/ml IL-6刺激的亲本M1细胞(M儿M.mpl)和表达SOCS1的M1细胞(4A2和M1.mpl.SOCS1)的抽提物的Western印迹。顶部:用抗gp130(αgp130)的抗体免疫沉淀并用抗磷酸酪氨酸的抗体(αPY-STAT3,或对于STAT3的αSTAT3)免疫印迹以确定上样蛋白量相同。条带的分子量在右边表示。
(B)用(+)或不用(-)100ng/ml IL-6或100ng/ml IFNγ刺激的M1.mpl和M1.mpl.SOCS1细胞的EMSA。DNA结合复合物SIFA、B和C在左边表示。
图13表示SOCS蛋白的氨基酸序列比较,(A)SOCS蛋白包括含WD-40重复(WSB)和锚蛋白重复(ASB)的蛋白的结构图,(B)SOCS蛋白N末端区域的匹配,(C)CIS,COS1,2,3,5,9,11和14的SH2结构域的匹配,(D)SOCS4、SOCS6、SOCS13和SOCS15的WD-40重复的匹配,(E)SOCS7和SOCS10的锚蛋白重复的匹配。(F)SOCS元件盒的匹配。在每种情况下,使用传统的氨基酸单字母缩写,×指代不确定身份的残基,○○○代表重叠群的开始和结束。由来自分离的cDNA的核苷酸序列的概念翻译得来的氨基酸序列以大写字母表示,而由EST的概念翻译得来的氨基酸序列以小写字母表示并且仅仅是大约的。在SH2结构域、WD-40重复、锚蛋白重复和SOCS元件盒中定义为(LIVMA)、(FYW)、(DE)、(QN)、(C,S,T)、(KRH)、(PG)的保留残基上画上阴影。对于SH2结构域、WD-40重复、锚蛋白重复的匹配在上面表示。在每种情况中,均从大量不同的结构域配套的检查中得来(Neer等,1994;Bork,1993)。
图14(A)和(B)是小鼠SOCS1和SOCS5及含有WD-40重复(WSB2)和锚蛋白重复(ASB1)的SOCS的mRNA表达分析的摄影图示。
图15是表示鼠SOCS4cDNA的核苷酸序列的图示。编码从推测的ATG“起始”密码子到终止密码子的成熟编码区域的核苷酸用大写字母表示,而推测的5′和3′非翻译区以小写字母表示。小鼠和人EST重叠群与小鼠cDNA序列的关系在图17中表示。
图16是表示从图15中核苷酸序列得来的小鼠SOCS4蛋白的推测氨基酸序列的图示。在SOCS元件盒(也在图13中表示)下划线。
图18是表示从对表4.1中列出的EST的分析得来的人SOCS4cDNA重叠群h4.1和h4.2的核苷酸序列的图示。这些重叠群与小鼠cDNA序列的关系在图17中表示。
图19是表示从对小鼠EST(表5.1)和人cDNA克隆(5-94-2)和EST(表5.2)的分析得来的小鼠SOCS5基因组(57-2)和cDNA(5-3-2)克隆与重叠群关系的图示。小鼠SOCS5重叠群的核苷酸序列在图20中表示,人SOCS5重叠群(h5.1)的序列在图21中表示。小鼠SOCS5的推测氨基酸序列在图20B中表示。蛋白的结构以图解表示,SH2结构域和SOCS元件盒以()表示。推测的5′和3′非翻译区用细实线表示。
图20A是表示从对基因组和cDNA克隆的分析得来的小鼠SOCS5的核苷酸序列的图示。编码从推测的ATG“起始”密码子到终止密码子的成熟编码区域的核苷酸以大写字母表示,而推测的5′和3′非翻译区以小写字母表示。小鼠cDNA序列和人EST重叠群的关系在图19中表示。
图20B是表示从图20A中核苷酸序列得来的小鼠SOCS5蛋白的推测氨基酸序列的图示。在SOCS元件盒(也在图13中表示)下划线。
图21是表示从对cDNA克隆5-94-2和表5.2中列出的EST的分析得来的人SOCS5cDNA重叠群h5.1的核苷酸序列的图示。这些重叠群与小鼠cDNA序列的关系在图19中表示。
图22是表示从对小鼠EST(表6.1)和人EST(表6.2)的分析得来的小鼠SOCS6cDNA(6-1A,6-2A,6-5B,6-4N,6-18,6-29,6-3N和6-5N)克隆与重叠群的关系的图示。小鼠SOCS6重叠群的核苷酸序列在图23中表示,人SOCS6重叠群(h6.1和h6.2)的序列在图24中表示。小鼠SOCS6的推测氨基酸序列在图23B中表示。蛋白的结构以图解表示,WD-40重复和SOCS元件盒以()表示。推测的5′和3′非翻译区用细实线表示。
图23A是表示从对cDNA克隆64-10A-11的分析得来的小鼠SOCS6的核苷酸序列的图示。编码终止于终止密码子的推测的部分编码区域的核苷酸以大写字母表示,而推测的3′非翻泽区以小写字母表示。小鼠cDNA序列与人EST重叠群的关系在图22中表示。
图23B是表示从图23A中核苷酸序列得来的小鼠SOCS6蛋白的推测氨基酸序列的图示。在SOCS元件盒(也在图13中表示)下划线。
图24是表示从对cDNA克隆5-94-2和表6.2中列出的EST的分析得来的人SOCS6cDNA重叠群h6.1的核苷酸序列的图示。这些重叠群与小鼠cDNA序列的关系在图22中表示。
图25是表示从对小鼠EST(表7.1)和人EST(表7.2)的分析得来的小鼠SOCS7cDNA克隆(74-10A-11)与重叠群的关系的图示。小鼠SOCS7重叠群的核苷酸序列在图26中表示,人SOCS7重叠群(h7.1和h7.2)的序列在图27中表示。小鼠SOCS7的推测氨基酸序列在图26B中表示。蛋白的结构以图解表示,锚蛋白重复和SOCS元件盒以()表示。推测的5′和3′非翻译区在小鼠中用细实线表示,在h7.2中用波浪线表示。根据对至今分离的克隆和EST的分析,mSOCS7和hSOCS7的3’非翻译区表现极小的相似性。
图26A是表示从对cDNA克隆74-10A-11的分析得来的小鼠SOCS7的核苷酸序列的图示。编码终止于终止密码子的推测的部分编码区域的核苷酸以大写字母表示,而推测的3′非翻译区以小写字母表示。小鼠cDNA序列与人EST重叠群的关系在图25中表示。
图26B是表示从图26A中核苷酸序列得来的小鼠SOCS7蛋白的推测氨基酸序列的图示。在SOCS元件盒(也在图13中表示)下划线。
图27是表示从对表7.2中列出的EST的分析得来的人SOCS7cDNA重叠群h7.1和h7.2的核苷酸序列的图示。这些重叠群与小鼠cDNA序列的关系在图25中表示。
图28是表示从对小鼠SOCS8EST(表8.1和图29A)的分析得来的序列与小鼠SOCS8的推测蛋白结构的关系的图示。小鼠SOCS5的推测的部分氨基酸序列在图29B中表示。蛋白的结构以图解表示,SOCS元件盒以()表示。推测的3′非翻译区用细实线表示。
图29A是表示从对EST的分析得来的小鼠SOCS8的部分核苷酸序列的图示。编码终止于终止密码子的推测的部分编码区域的核苷酸以大写字母表示,而推测的3′非翻译区以小写字母表示。
图29B是表示从图29A中核苷酸序列得来的小鼠SOCS8蛋白的部分推测氨基酸序列的图示。在SOCS元件盒(也在图13中表示)下划线。
图30是表示小鼠EST(表9.1)和人SOCS9EST(表9.2)的关系的图示。鼠SOCS9重叠群(m9.1)的核苷酸序列在图31中表示,人SOCS9重叠群(h9.1)的序列在图32中表示。人SOCS9的推测氨基酸序列以图解表示,SH2结构域和SOCS元件盒以()表示。推测的3′非翻译区用细实线表示。
图31是表示从对表9.1中列出的EST的分析得来的小鼠SOCS9cDNA(重叠群m9.1)的部分核苷酸序列的图示。这些重叠群与小鼠cDNA序列的关系在图30中表示。
图32是表示从对表9.2中列出EST的分析得来的人SOCS9cDNA(重叠群h9.1)的部分核苷酸序列的图示。尽管重叠群h9.1编码具有SH2结构域和SOCS元件盒的蛋白这一点是清楚的,但是序列的质量不足够高以推测单一的清楚的开放阅读框架。这些重叠群与鼠cDNA序列的关系在图30中表示。
图33是表示小鼠SOCS10cDNA克隆(10-9,10-12,10-23和10-24)与从对小鼠EST(表10.1)和人EST(表10.2)的分析得来的重叠群的关系的图示。小鼠SOCS10重叠群的核苷酸序列在图10.2中表示,人SOCS10重叠群(h10.1和h10.1)的序列在图35中表示。蛋白的结构以图解表示,锚蛋白重复和SOCS元件盒以()表示。推测的3′非翻译区在小鼠中用细实线表示,在h10.2中以波浪线表示。根据对至令分离的克隆和EST的分析,mSOCS10和hSOCS10的3′非翻译区表现极小的相似性。
图34是表示从对cDNA克隆10-9,10-12,10-23和10-24的分析得来的小鼠SOCS10的核苷酸序列的图示。编码终止于终止密码子的推测的部分编码区域的核苷酸以大写字母表示,而3′非编码区以小写字母表示。尽管重叠群m10.1编码具有一系列锚蛋白和SOCS元件盒的蛋白这一点是清楚的,但是序列的质量不足够高以推测单一的清楚的开放阅读框架。小鼠和人重叠群与小鼠cDNA序列的关系在图33中表示。
图35是表示从对表10.2中列出的EST的分析得来的人SOCS10cDNA重叠群h10.1和h10.2的核苷酸序列的图示。这些重叠群与小鼠cDNA序列的关系在图33中表示。
图36A是表示从对表11.1中列出的EST的分析得来的人SOCS11cDNA的部分核苷酸序列的图示。编码从推测的ATG“起始”密码子到终止密码子的成熟编码区域的核苷酸以大写字母表示,而推测的5′和3′非翻译区以小写字母表示。从EST得来的部分cDNA序列与推测蛋白的关系在图37中表示。
图36B是表示从图36A中核苷酸序列得来的人SOCS11蛋白的推测的部分氨基酸序列的图示。在SOCS元件盒(也在图13中表示)下划线。
图37是表示从对人SOCS11EST(表11.1和图36A)的分析得来的序列与人SOCS11的推测蛋白结构的关系的图示。人SOCS11的推测的部分氨基酸序列在图36B中表示。蛋白的结构以图解表示,SH2结构域和SOCS元件盒以()表示。推测的3′非翻译区用细实线表示。
图38是表示小鼠SOCS12cDNA克隆(12-1)与从对小鼠EST(表12.1)和人EST(表12.2)的分析得来的重叠群的关系的图示。小鼠SOCS12重叠群的核苷酸序列在图12.2中表示,人SOCS12重叠群(h12.1和h12.2)的序列在图40中表示。鼠SOCS12的推测的部分氨基酸序列在图39中表示。蛋白的结构以图解表示,锚蛋白重复和SOCS元件盒以()表示。推测的3′翻译区在小鼠中用细实线表示,在h12.2中以波浪线表示。根据对至令分离的克隆和EST的分析,mSOCS12和hSOCS12的3′非翻译区表现极小的相似性。
图39是表示从对cDNA克隆12-1和表12.1列出的EST的分析得来的小鼠SOCS12的核苷酸序列的图示。编码部分推测编码区域的核苷酸包括终止密码子以大写字母表示,而推测的3′非翻译区以小写字母表示。通过与人SOCS12的同源性可以了解重叠群m12.1编码含有一系列锚蛋白重复和SOCS元件盒的蛋白,但是序列的质量不足够高以至不能推测出单一确定的开放阅读框架。小鼠cDNA序列与小鼠和人EST重叠群的关系在图38中表示。
图40是表示从对表12.2中列出的EST的分析得来的人SOCS12cDNA重叠群h12.1和h12.2的核苷酸序列的图示。这些重叠群与小鼠cDNA序列的关系在图38中表示。
图41是表示从对小鼠EST(表13.1)和小鼠SOCS13cDNA克隆(62-1,62-6-7,62-14))的分析得来的重叠群m13.1与从对人EST(表13.2)的分析得来的重叠群h13.1的关系的图示。小鼠SOCS13重叠群的核苷酸序列在图42中表示,人SOCS13重叠群(h13.1)的序列在图43中表示。小鼠SOCS13的推测氨基酸序列在图42B中表示。蛋白的结构以图解表示,WD-40重复和SOCS元件盒以()表示。推测的3′非翻译区用细实线表示。
图42A是表示从对cDNA克隆62-1,62-6-7和62-14的分析得来的小鼠SOCS13的核苷酸序列的图示。编码终止于终止密码子的推测的部分编码区域的核苷酸以大写字母表示,而推测的3′非翻译区以小写字母表示。小鼠cDNA序列与人和小鼠EST重叠群的关系在图41中表示。
图42B是表示从图42A中核苷酸序列得来的小鼠SOCS13蛋白的推测氨基酸序列的图示。在SOCS元件盒(也在图13中表示)下划线。
图43是表示从对表13.2中列出的EST的分析得来的人SOCS13cDNA重叠群h13.1的核苷酸序列的图示。这些重叠群与小鼠cDNA序列的关系在图41中表示。
图44是表示小鼠SOCS14部分cDNA克隆(14-1)与从对小鼠EST(表14.1)的分析得来的重叠群的关系的图示。小鼠SOCS14重叠群的核苷酸序列在图45中表示。小鼠SOCS14的推测的部分氨基酸序列在图45B中表示。蛋白的结构以图解表示,SH2结构域和SOCS元件盒以()表示。推测的3′非翻译区用细实线表示。
图45A是表示从对基因组和cDNA克隆分析得来的小鼠SOCS14的核苷酸序列的图示。编码从推测的ATG“起始”密码子到终止密码子的成熟编码区域的核苷酸以大写字母表示,而推测的5′和3′非翻译区以小写字母表示。小鼠cDNA序列与小鼠和人EST重叠群的关系在图44中表示。
图45B是表示从对图45B中核苷酸序列得来的小鼠SOCS14蛋白的推测氨基酸序列的图示。在SOCS元件盒(也在图13中表示)下划线。
图46是表示从对小鼠BAC和小鼠EST(表15.1)的分析得来的重叠群m15.1与从对人BAC和人EST(表15.2)的分析得来的重叠群m15.1的关系的图示。小鼠SOCS15重叠群的核苷酸序列在图47中表示,人SOCS15重叠群(h15.1)的序列在图47中表示。小鼠SOCS15的推测氨基酸序列在图47B中表示。蛋白的结构以图解表示,WD-40重复和SOCS元件盒以()表示。推测的5′和3′非翻译区用细实线表示。打断编码区域的内含子用∧表示
图47A是表示从对表15.1中列出的小鼠BAC的分析得来的覆盖小鼠SOCS15基因的核苷酸序列的图示。编码起始于ATG并终止于终止密码子的推测编码区域的核苷酸以大写字母表示,而那些编码推测的5′非编码区、内含子和3′非翻译区的核苷酸以小写字母表示。小鼠BAC与小鼠和人EST重叠群的关系在图46中表示。
图47B是表示从图47A中核苷酸序列得来的小鼠SOCS15蛋白的推测氨基酸序列的图示。在SOCS元件盒(也在图13中表示)下划线。
图48A是表示从对表15.2中列出的人BAC的分析得来的覆盖人SOCS15基因的核苷酸序列的图示。鳊码开始于ATG并终止于终止密码子的推测编码区域的核苷酸以大写字母表示,而那些编码推测的5′非翻译区、内含子和3′非翻译区的核苷酸以小写字母表示。小鼠BAC与小鼠和人EST重叠群的关系在图46中表示。
图48B是表示从图48A中核苷酸序列得来的人SOCS15蛋白的推测氨基酸序列的图示。在SOCS元件盒(也在图13中表示)下划线。
图49是表示抑制JAK2激酶活性的摄影图示。(A)上面板:Cos M6细胞用Flag标记的mJAK2和mSOCS1DNA(SOCS1)或只用Flag-mJAK2DNA瞬间转染并裂解,JAK2蛋白用抗JAK2抗体免疫沉淀并用于体外激酶试验。下面板:JAK2免疫沉淀部分用抗JAK2抗体进行Western印迹探测。(B)上面板:Cos M6细胞用Flag-mJAK2和Flag-mSOCS1DNA或只用Flag-mJAK2DNA瞬间转染并裂解,JAK2蛋白用抗JAK2抗体(UBI)免疫沉淀并用SDS/PAGE胶分离。然后用抗磷酸酪氨酸的抗体通过Western印迹分析免疫沉淀。下面板:JAK2表达。Cos细胞用SDS/PAGE胶分离并用抗Flag抗体(M2)通过Western印迹分析。
图50是表示JAK2和SOCS蛋白相互作用的摄影图示。(A)Cos M6细胞用Flag标记的mJAK2和Flag标记的各种SOCS DNA(SOCS1;S1,SOCCS2;S2,SOCS3;S3,CIS)或只用Flag-mJAK2瞬间转染并裂解,JAK2蛋白用抗JAK2抗体(UBI)免疫沉淀并通过SDS/PAGE分离。然后用抗FLAG的抗体(M2)通过Western印迹分析免疫沉淀。(B)(A)中所述的Cos细胞裂解物用SDS/PAGE胶分离并用抗Flag抗体(M2)通过Western印迹测定各种蛋白的表达水平。(C)JAK2酪氨酸磷酸化作用:A中所述的COS细胞裂解裂用SDS/PAGE胶分离并用抗磷酸酪氨酸的抗体通过Western印迹分析蛋白。
图51是pBgalpAloxneo的图示。
图52是pBgalpAloxneoTK的图示。
图53是SOCS1失效构建体的图示。
优选实施方案详述
本发明提供新的信号传导调节剂家族。由于此家族的最初成员抑制细胞因子信号传导,此家族称为“细胞因子信号传导的抑制剂”家族“SOCS”。SOCS家族根据称为“SOCS元件盒”的C末端结构域的存在来定义。SOCS分子的不同种类根据参与蛋白:分子相互作用如蛋白:DNA或蛋白:蛋白相互作用的一般但不仅位于SOCS元件盒的N端的基序来定义。特别优选的基序选自SH2结构域、WD-40重复和锚蛋白重复。
WD-40重复最初在G蛋白的β亚单位中识别。WD-40重复看来形成β-螺旋浆样结构并可能参与蛋白-蛋白相互作用。锚蛋白重复最初在细胞骨架蛋白锚蛋白中识别。
SOCS家族成员可以以各种方法鉴定。例如SOCS1-SOCS3是通过它们抑制细胞因子介导的信号传导的能力得到鉴定的,因此是基于活性得到鉴定的。SOCS4-SOCS15是作为在SOCS元件盒水平上表现相似性的核苷酸序列得到鉴定的。
SOCS元件盒是位于SOCS分子的C末端区域的保守基序,根据本发明,SOCS元件盒的氨基酸序列是:
X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]n X17X18X19X20X21X22X23[Xj]n X24X25X26X27X28
其中,X1是L,I,V,M,A或P;
X2是任何氨基酸残基;
X3是P,T或S;
X4是L,I,V,M,A或P;
X5是任何氨基酸;
X6是任何氨基酸;
X7是L,I,V,M,A,F,Y或W;
X8是C,T或S;
X9是R,K或H;
X10是任何氨基酸;
X11是任何氨基酸;
X12是L,I,V,M,A或P;
X13是任何氨基酸;
X14是任何氨基酸;
X15是任何氨基酸;
X16是L,I,V,M,A,P,G,C,T或S;
[Xi]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X17是L,I,V,M,A或P;
X18是任何氨基酸;
X19是任何氨基酸;
X20L,I,V,M,A或P;
X21是P;
X22是L,I,V,M,A,P或G;
X23是P或N;
[Xj]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X24是L,I,V,M,A或P;
X25是任何氨基酸;
X26是任何氨基酸;
X27是Y或F;
X28是L,I,V,M,A或P;
如上所述,根据本发明,基于位于SOCS元件盒的N端的蛋白:分子相互作用区域例如但不限于SH2结构域、WD-40重复和锚蛋白重复的存在将SOCS蛋白分成几类,后三个结构域是蛋白:蛋白相互作用结构域。
含SH2的SOCS蛋白的例子包括SOCS1、SOCS2、SOCS3、SOCS5、SOCS9、SOCS11和SOCS14。含WD-40重复的SOCS的例子包括SOCS4、SOCS6和SOCS15。含锚蛋白重复的例子包括SOCS7、SOCS10和SOCS12。
本发明特别提供鳊码SOCS蛋白的核酸分子、纯化的天然存在的SOS蛋白和重组形式的SOCS蛋白以及通过SOCS蛋白的调节活性或SOCS基因的表达来调节信号传导的方法。优选地,信号传导由细胞因子介导,细胞因子的例子包括EPO、TPO、G-CSF、GM-CSF、IL-3、IL-2、IL-4、IL-7、IL-13、IL-6、LIF、IL-12、IFNγ、TNFα、IL-1和/或M-CSF。特别优选的细胞因子包括IL-6、LIF、OSM、IFNγ和/或促血小板生成素。
因此,本发明的一方面提供包含编码含有在其C末端区域的SOCS元件盒和选择性地SOCS元件盒N端的蛋白:分子相互作用结构域的蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核苷酸序列的核酸分子或在42℃低严格条件下能与其杂交的核酸分子。
优选地,蛋白:分子相互作用结构域是蛋白:DNA或蛋白:蛋白相互作用结构域。最优选地,蛋白:分子相互作用结构域是SH2结构域、WD-40重复和/或锚蛋白重复之一。
如上所述,优选地,该SOCS调节细胞因子介导的信号传导。然而,本发明可推延至调节其它效应物如其它内源或外源分子、抗原、微生物群体和微生物产物、病毒或其成分、离子、激素和寄生物介导的信号传导的SOCS分子。本文中内源分子是携带SOCS分子的细胞内产生的分子。外源分子是由其它细胞产生或导入体内的分子。
优选地,核酸分子或SOCS蛋白是以分离或纯化的形式。术语“分离的”和“纯化的”是指已经历至少一步从其它物质分离的纯化步骤的分子。
优选地,核酸分子是以分离的形式,是DNA如cDNA或基因组DNA。DNA可以编码与天然存在的SOCS相同的氨基酸序列或者SOCS可以含有一个或多个氨基酸替换、缺失和/或添加。核苷酸序列可以对应于基因组编码序列(包括外显子和内含子)或对应于来自从基因组基因转录的mRNA的cDNA中的核苷酸序列,或者它可在带有在其上的一个或多个核苷酸替换,缺失和/或添加。
在优选的实施方案中,核酸分子包含编码SOCS蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核苷酸序列,其中所述SOCS蛋白的氨基酸序列选自:
SEQ ID NO:4(mSOCS 1),SEQ ID NO:6(mSOCS2),SEQ ID NO:8(mSOCS3),SEQ IDNO:10(hSOCS1),SEQ ID NO:12(rSOCS1),SEQ ID NO:14(mSOCS4),SEQ ID NO:18(mSOCS5),SEQ ID NO:21(mSOCS6),SEQ ID NO:25(mSOCS27),SEQ ID NO:29(mSOCS8),SEQ ID NO:36(hSOCS11),SEQ ID NO:41(mSOCS 13),SEQ ID NO:44(mSOCS14),SEQ ID NO:46(mSOCS15)和SEQ ID NO:48(mSOCS15),或编码在所列序列上有单一或多个氨基酸替换、缺失和/或添加的氨基酸序列或是能在42℃低严格条件下与所述核酸分子杂交核苷酸序列。
在甚至更优选的实施方案中,本发明提供包含编码SOCS蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核苷酸序列的核酸分子,其中核苷酸序列选自主要在:
SEQ ID NO:3(mSOCS1),SEQ ID NO:5(mSOCS2),SEQ ID NO:7(mSOCS3),SEQ ID NO:9(mSOCS11),SEQ ID NO:11(rSOCS1),SEQ ID NO:13(mSOCS4),SEQ ID NO:15和SEQ ID NO:16(mSOCS1),SEQ ID NO:5(mSOCS2),SEQ ID NO:7(mSOCS3),SEQ ID NO:9(hSOCS 11),SEQ ID NO:11(rSOCS 1),SEQ ID NO:13(mSOCS4),SEQ ID NO:15和SEQ ID NO:16(hSOCS4),SEQ ID NO:17(mSOCS5),SEQ ID NO:19(hSOCS5),SEQ ID NO:20(mSOCS6),SEQ ID NO:22和SEQ ID NO:23(hSOCS6),SEQ ID NO:24(mSOCS7),SEQ ID NO:26和SEQ ID NO:27(hSOCS7),SEQ ID NO:28(mSOCS8),SEQ ID NO:30(mSOCS9),SEQ IDNO:31(hSOCS9),SEQ ID NO:32(mSOCS 10),SEQ ID NO:33和SEQ ID NO:34(hSOCS 1O),SEQ ID NO:35(hSOCS11),SEQ ID NO:37(mSOCS 12),SEQ ID NO:38和SEQ ID NO:39(hSOCS 12),SEQ ID NO:40(mSOCS 13),SEQ ID NO:42(hSOCS 13),SEQID NO:43(mSOCS 14),SEQ ID NO:45(mSOCS15)和SEQ ID NO:47(hSOCS 15)中列出的核苷酸,或是与任一列出的序列的所有或部分区域有至少约15%相似性的核苷酸序列;或能与任一列出的序列在42℃低严格条件下杂交的核酸分子。
此处提及的在42℃低严格条件包括并包含至少约1%(体积/体积)到至少约15%(体积/体积)的甲酰胺及至少约1M到至少约2M盐的杂交条件和至少约1M到至少约2M盐的洗涤条件。如果需要,可以应用其它杂交条件,如中等严格条件,包括并包含至少约16%(体积/体积)到至少约30%(体积/体积)的甲酰胺及至少约0.5M到至少约0.9M盐的杂交条件和至少约0.5M到至少约0.9M盐的洗涤条件;或高度严格条件,包括并包含至少约30%(体积/体积)到至少约50%(体积/体积)甲酰胺及至少约0.01M到至少约0.15M盐的杂交条件和至少约0.01M到至少约0.15M盐的洗涤条件。
在另一实施方案中,本发明针对SOCS蛋白或其衍生物、同系物、类似物或模拟物,其中所述SOCS蛋白鉴定为如下:
人SOCS4鉴定为:EST81149,EST180909,EST182619,ya99H09,ye70co4,yh53c09,yh77g11,yh87h05,yi45h07,yj04e06,yq 12h06,yq56a06,yq60e02,yq92g03,yq97h06,yr90f01,yt69c03,yv30a08,yv55f07,yv57h09,yv87h02,yv98e 11,yw68d10,yw82a03,yx08a07,yx72h06,yx76b09,yy37h08,yy66b02,za81f08,zb18f07,zc06e08,zd14g06,zd51h12,zd52b09,ze25g11,ze69f02,zf54f03,zh96e07,zv66h12,zs83a08和zs83g08;
小鼠SOCS-4鉴定为:mc65f04,mf42e06,mp10c10,mr81g09和mt19h12;
人SOCS-5鉴定为:EST15B103,EST15B105,EST27530和zf50f01;
小鼠SOCS-5鉴定为:mc55a01,mh98f09,my26h12和ve24e06;
人SOCS-6鉴定为:yf61e08,yf93a09,yg05f12,yg41f04,yg45c02,yh11f10,yh13b05,zc35a12,ze02h08,z109a03,z169e10,zn39d08和zo39e06;
小鼠SOCS-6鉴定为:mc04c05,md48a03,mf31d03,mh26b07,mh78e11,mh88h09,mh94h07,mi27h04和mj29c05,mp66g04,mw75g03,va53b05,vb34h02,vc55d07,vc59e05,vc67d03,vc68d10,vc97h01,vc99c08,vd07h03,vd08c01,vd09b12,vd 19b02,vd29a04和vd46d06;
人SOCS-7鉴定为:STS WI30171,EST00939,EST12913,yc29b05,yp49f10,zt10f03和zx73g04;
小鼠SOCS-7鉴定为:mj39a01和vi52h07;
小鼠SOCS-8鉴定为:mj6e09和vj27a029;
人SOCS-9鉴定为:CSRL-82f2-u,EST114054,yy06b07,yy06g06,zr40c09,zr72h01,yx92c08,yx93b08和hfe0662;
小鼠SOCS-9鉴定为:me65d05;
人SOCS-10鉴定为:aa48h10,zp35h01,zp97h12,zq08h01,zr34g05,EST73000和HSDHEI005;
小鼠SOCS-10鉴定为:mb14d12,mb40f06,mg89b11,mq89e12,mp03g12和vh53c11;
人SOCS-11鉴定为:zt24h06和zr43b02;
人SOCS-13鉴定为:EST59161;
小鼠SOCS-13鉴定为:ma39a09,me60c05,mi78g05,mk10c11,mo48g12,mp94a01,vb57c07和vh07c11;并且
人SOCS-14鉴定为:mi75e03,vd29h11和vd53g07;
或者上述EST的衍生物或同系物鉴定为能与任一列出的EST在42℃低严格条件下杂交的核酸分子。
在另一实施方案中,核酸分子编码如下氨基酸序列:
X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]n X17X18X19X20X21X22X23[Xj]nX24X25X26X27X28
其中,X1是L,I,V,M,A或P;
X2是任何氨基酸残基;
X3是P,T或S;
X4是L,I,V,M,A或P;
X5是任何氨基酸;
X6是任何氨基酸;
X7是L,I,V,M,A,F,Y或W;
X8是C,T或S;
X9是R,K或H;
X10是任何氨基酸;
X11是任何氨基酸;
X12是L,I,V,M,A或P;
X13是任何氨基酸;
X14是任何氨基酸;
X15是任何氨基酸;
X16是L,I,V,M,A,P,G,C,T或S;
[Xj]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X17是L,I,V,M,A或P;
X18是任何氨基酸;
X19是任何氨基酸;
X20L,I,V,M,A或P;
X21是P;
X22是L,I,V,M,A,P或G;
X23是P或N;
[Xj]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X24是L,I,V,M,A或P;
X25是任何氨基酸;
X26是任何氨基酸;
X27是Y或F;
X28是L,I,V,M,A或P;
上述序列比较优选地是针对完整分子,但也可以是其部分。优选地,针对至少约21个核苷酸或至少约5个氨基酸的连续系列进行比较。更优选地,针对至少约21个连续的核苷酸或至少7个连续的氨基酸进行比较。比较也可以仅针对SOCS元件盒区域或包含蛋白:分子相互作用区域如SH2结构域、WD-40重复和/或锚蛋重复的区域进行。
本发明的另一实施方案包括在其C末端区域包含SOCS元件盒的分离的多肽或其衍生物、同系物或模拟物。
优选地,多肽进一步包含蛋白:分子相互作用结构域如蛋白:DNA或蛋白:蛋白相互作用结构域。优选地,此结构域位于SOCS元件盒的N端。特别优选的蛋白:分子相互作用结构域是至少一个SH2结构域、WD-4重复和/或锚蛋白重复。
优选地,信号传导由选自EPO、TPO、G-CSF、GM-CSF、IL-3、IL-2、IL-4、IL-7、IL-13、IL-6、LIF、IL-12、IFNγ、TNFα、IL-1和/或M-CSF的细胞因子介导。优选的细胞因子是IL-6、LIF、OSM、IFFNγ或促血小板生成素。
更优选地,蛋白包含具如下氨基酸序列的SOCS元件盒:
X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]nX17X18X19X20X21X22X23[Xj]nX24X25X26X27X28
其中,X1是L,I,V,M,A或P;
X2是任何氨基酸残基;
X3是P,T或S;
X4是L,I,V,M,A或P;
X5是任何氨基酸;
X6是任何氨基酸;
X7是L,I,V,M,A,F,Y或W;
X8是C,T或S;
X9是R,K或H;
X10是任何氨基酸;
X11是任何氨基酸;
X12是L,I,V,M,A或P;
X13是任何氨基酸;
X14是任何氨基酸;
X15是任何氨基酸;
X16是L,I,V,M,A,P,G,C,T或S;
[Xi]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X17是L,I,V,M,A或P;
X18是任何氨基酸;
X19是任何氨基酸;
X20L,I,V,M,A或P;
X21是P;
X22是L,I,V,M,A,P或G;
X23是P或N;
[Xj1n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X24是L,I,V,M,A或P;
X25是任何氨基酸;
X26是任何氨基酸;
X27是Y或F;
X28是L,I,V,M,A或P;
另一个实施方案提供含有主要如:
SEQ ID NO:4(mSOCS1),SEQ ID NO:6(mSOCS2),SEQ ID NO:8(mSOCS3),SEQ ID NO:10(hSOCS 1),SEQ ID NO:12(rSOCS 1),SEQ ID NO:14(mSOCS4),SEQ ID NO:18(mSOCS5),SEQ ID NO:21(mSOCS6),SEQ ID NO:25(mSOCS7),SEQ ID NO:29(mSOCS8),SEQ IDNO:36(hSOCS11),SEQ ID NO:41(mSOCS 13),SEQ ID NO:44(mSOCS14),SEQ ID NO:46(mSOCS15)和SEQ ID NO:48(hSOCS15)中列出的氨基酸序列或与任一列出的氨基酸序列有至少15%相似性的氨基酸序列的分离的多肽或其衍生物、同系物、类似物或模拟物。
优选的核苷酸相似性百分比包括至少约20%,至少约40%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%或更高如93%、95%、98%、99%。
优选的氨基酸相似性包括至少约20%,至少约30%,至少约40%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%,至少约95%,至少约97%或约98%或更高。
如上所述,相似性可以针对完整的分子或包含至少21个核苷酸或至少7个氨基酸的区域测定。优选地,测定在保守区域如SH2结构域、WD-40重复、锚蛋白重复或其它蛋白质:分子相互作用结构域或SOCS元件盒中的相似性。
术语“相似性”包括序列间的精确相同性,或者,即使序列不同,不同的氨基酸之间在结构、功能、生化或构象水平上相关。
这种核酸分子可以从任何动物如人、灵长类动物、家畜动物(如马、牛、羊、驴、猪)、实验室测试动物(如小鼠、大鼠、兔、仓鼠、豚鼠)、陪伴动物(如狗、猫)或捕获的野生动物(如鹿、狐狸、袋鼠)中分离。
术语“衍生物”不论对于核酸分子还是蛋白质都包括部分、突变体、片段和类似物以及杂交或融合分子和糖基化变异体。特别有用的衍生物包括对SOCS氨基酸序列的单个或多个氨基酸替换,删除或添加。
优选地,衍生物具有功能活性或选择性地作用为拮抗剂或激动剂。本发明进一步扩展到SOCS的同系化合物,包括来自不同种动物的功能上或结构上相关的分子。本发明也包括类似物和模拟物。模拟物包括一般但不必然具有非氨基酸结构的一类分子,并且它能以与其所模拟的蛋白(在此即SOCS)类似的方式作用。模拟物可以包括糖类、芳香环、脂类或其它复杂化学结构或者在组成上也可以是蛋白质。在此考虑的模拟物以及激动剂和拮抗剂可方便地通过环境如瑚瑚、海洋和淡水河床、植物群体和微生物的系统搜索找到。此处有时称为天然产物筛选。另外,可筛选合成的化合物库以得到潜在的有用分子。
如上述,本发明考虑SOCS的激动剂和拮抗剂。拮抗剂的一个实施例是反义寡核苷酸序列。有用的寡核苷酸是那些具有能与核苷酸序列的蛋白编码或“正义”序列的至少部分互补的那些寡核苷酸。这些反义核苷酸可用于引起基因表达的特异抑制。反义方法可通过反义构建体与目标mRNA之间的互补配对形成可能导致翻译杂交阻遏的反平行双螺旋,从而引起显著的基因表达抑制。也可应用RNA酶和协同抑制分子。反义和其它核苷酸分子可能首先需要经过化学修饰以允许细胞透过膜和/或增加它们的血清半衰期或用其他方法使其在体内施用时更加稳定。尽管在诊断应用和SOCS蛋白纯化中更有用,抗体也可作用为拮抗剂或激动剂。拮抗剂和激动剂也可在天然产物筛选或化学化合物库筛选后得到鉴定,或者可以是SOCS的衍生物或类似物。
相应地,本发明扩展到本发明的SOCS蛋白的类似物。类似物可用于例如治疗或预防细胞因子介导的功能失调如自身免疫、免疫抑制或免疫机能亢进或在包括但不限于造血系统、内分泌、肝脏及神经系统中的其它情况。其它信号传导因子如激素或内源或外源分子、抗原、微生物群体和微生物产物、病毒及其成分、离子、激素和寄生虫介导的功能失调也在本发明中予以考虑。
在此考虑的蛋白和类似物包括但不限于对侧链的修饰,在肽、多肽或蛋白质合成时掺入非天然氨基酸和/或其衍生物以及使用交联剂和其它方法在蛋白分子或其类似物上强加构象限制。
本发时考虑的侧链修饰的例子包括氨基修饰如通过与醛反应还原性烷基化后用NaBH4还原;用甲基乙酰亚胺酰胺化;用乙酸酐乙酰化;用氰酸盐使氨基甲氨酰化;用2,4,6-三硝基苯磺酸(TNBS)使氨基三硝基苯化;用琥珀酸酐和四氢邻苯二甲酸酐使氨基乙酰化;以及用吡哆醛-5-磷酸盐使赖氨酸吡哆醛化后用NaBH4还原。
精氨酸残基的胍基可通过与试剂如2,3-丁二酮、苯甲酰甲醛和乙二醛形成杂环缩合产物来修饰。
羧基可通过碳二亚胺活化,即通过O-酰基异脲的形成及随后的衍生作用如形成相应的酰胺来修饰。
Sulphydryl基通过例如如下方法修饰:用碘乙酸或碘乙酰胺羧甲基化;过甲酸氧化成磺基丙氨酸;与其它硫醇化合物形成混合的二硫化物;与马来酰亚胺、马来酐或其它取代的马来酰亚胺反应;应用4-对氯汞苯甲酸、4-氯汞基苯磺酸、氯化苯汞、2-氯汞基-4-硝基苯酚和其它汞化合物形成汞衍生物;用氰酸盐在碱性PH下的甲氨酰化。
色氨酸残基修饰可通过例如用N-溴代丁二酰亚胺氧化或用2-羟基-5硝基苄基溴化物或Sulphenyl卤化物使吲哚环烷化来修饰。
另一方面,酪氨酸残基可通过用四硝基甲烷形成3-硝基酪氨酸衍生物来改变。
组氨酸残基咪唑环的修饰可通过用碘乙酸衍生物烷化或用二乙基焦碳酸酯乙酯化来完成。
在合成肽时掺入非天然氨基酸和衍生物的实例包括但不限于应用正亮氨酸,4-氨基丁酸,4-氨基-3-羟基-5-苯基戊酸,6-氨基己酸,叔丁基甘氨酸,正缬氨酸,苯甘氨酸,鸟氨酸,肌氨酸,4-氨基-3-羟基-6-甲基庚酸,2-噻嗯基丙氨酸和/或氨基酸的D-异构体。表3所列的是在此所考虑的非天然氨基酸目录。
表3
Figure A20061013592200501
Figure A20061013592200511
Figure A20061013592200521
Figure A20061013592200531
交联剂可用于例如稳定3D构象,可使用同型双功能交联剂如n=1到n=6具有(CH2)n间隔基团的双功能酰亚胺酯、戊二醛和N-羟琥珀酰亚胺酯以及异型双功能试剂,这些试剂通常含有氨基酸反应性组分如N-羟琥珀酰亚胺和其它基团特异性反应性组分如马来酰亚胺或联硫基组分(SH)或碳二亚胺(COOH)。另外,肽可受到构象限制,例如通过掺入Cα和Nα-甲基氨基酸,在氨基酸Cα和Cβ原子间引入双键和通过引入共价键如在N和C端之间、两侧链间或侧链与N或C端之间形成酰胺键而形成环状肽或类似物。
如果施用给个体或用作诊断试剂,这些修饰类型对于稳定细胞因子可能是重要的。
本发明所考虑的其它衍生物包括从完整的非糖基化分子到修饰的糖基化分子的一系列糖基化变体。改变的糖基化模式可能源于不同的宿主细胞中重组分子的表达。
本发明的另一实施方案涉及调节哺乳动物中SOCS蛋白表达的方法,该方法使编码SOCS或参与控制SOCS基因表达的因子/因素的基因与有效量的SOCS表达调节剂在足以上调或下调或其它调节SOCS表达的条件下接触一定时间。调节剂的一个例子是细胞因子如IL-6或其它SOCS表达的转录调节剂。表达包括转录或翻译或两者兼有。
本发明的另一方面包括调节人中SOCS活性的方法,该方法包括在足以升高或降低SOCS活性的条件下给所述哺乳动物施用调节有效量的分子一定时间。这种分子可以是蛋白或化学本质,也可以是SOCS的衍生物或SOCS的化学类似物或截断突变体。
本发明的另一方面提供诱导SOCS合成或SOCS转录/翻译的方法,包括使含SOCS基因的细胞与有效量的能诱导所述SOCS的细胞因子在足以使所述SOCS产生的条件下接触一定时间。例如,SOCS1可由IL-6诱导。
本发明的另一方面包括调节细胞中SOCS蛋白水平的方法,包括使含有SOCS基因与有效量的SOCS基因表达或SOCS蛋白活性的调节剂在足以调节所述SOCS蛋白水平的条件下接触一定时间。
本发明的另一方面包括调节含SOCS基因的细胞中信号传导的方法,包括使所述细胞与有效量的SOCS基因表达或SOCS蛋白活性的调节剂接触足以调节信号传导的一段时间。
本发明的另一方面包括影响其中至少一种细胞携带SOCS基因的细胞间相互作用的方法,该方法包括使带有SOCS基因的细胞与有效量的SOCS基因表达或SOCS蛋白活性的调节剂接触足以调节信号传导的一段时间。
如上所述,本发明考虑能作为SOCS拮抗剂或激动剂的一系列模拟物或小分子。这些分子可从天然产物筛选如从珊瑚、土壤、植物或海洋或南极环境获得,或者可方便地对肽、多肽或蛋白库或化学物质库进行筛选。例如,表达SOCS的M1细胞在IL-6存在时不经历分化。此系统可用于筛选在IL-6和SOCS存在时能分化的分子。可制备一系列检测细胞以筛选一系列细胞因子的拮抗剂和激动剂。这些分子优选地是小分子并可以是氨基酸来源或化学来源。SOCS分子与信号蛋白(如JAKS)的相互作用可提供分子筛选以检测干扰或促进这种相互作用的分子。一种这样的筛选方法包括天然产物筛选。
因此,本发明包括含有SOCS或其衍生物或SOCS表达或SOCS活性的调节剂和一种或多种药学上可接受的载体和/或稀释剂的药物组合物。这些组成成分称为“活性成分”。本发明的这些或其它方面适用于任何SOCS分子,例如但不限于SOCS1至SOCS15。
这些药物形式含有适于注射用的活性成分,包括用于即时制备无菌注射无菌水溶液的(在水中可溶的)无菌粉末。这些成分必须在制造和贮存条件下稳定并且必须能抗微生物如细菌和真菌的污染而得到保存。载体可以是溶剂或分散介质,包括例如水、乙醇、多元醇(如甘油、丙二醇和液体聚乙二醇等)及其适当混合物和植物油。合适的流动性可例如通过应用诸如licithin的包被剂、或通过在分散剂参与下维持要求的颗粒大小和通过应用表面活性剂来保持。微生物作用的防止可用各种抗细菌和抗真菌剂如对羟基苯甲酸酯类,氯丁醇、苯酚、山梨酸,thirmerosal等来实施。在许多情况下,优选地包含等渗试剂如糖或氯化钠。可注射成分的延缓吸收可通过在组合物中应用延迟吸收剂如用单硬脂酸铵和白明胶来达到。无菌注射液可通过将所需数量的活性化合物掺入含有以上所列的各种其它成分的合适溶剂中并且随后如所要求的过滤除菌而得到制备。对于制备无菌注射液的无菌粉末,优选的制备方法是真空干燥和冷冻干燥,产生活性成分及其先前灭菌过滤溶液中任何其它所需成分的粉末。
活性成分得到适当保护时,它们可口服给药。例如用隋性稀释剂或可食用可消化吸收的载体,或它可装入硬或软的壳明胶胶囊中,或它可压缩成片剂。对于口服治疗给药,活性成分可与赋形剂结合并以可消化的片剂、颊含片、药片、胶囊、酏剂、悬浮液、糖浆,薄片等形式使用。这些组合物和制品应包含占重量比至少1%的活性成分。当然,这样的组合物和制品的百分比可以变化,并可方便地占单位重量的约5~约80%。在这样的治疗有效的组合物中活性成分的量使得能得到适当的剂量。制备根据本发明所述的优选的组合物或制品以使口服剂量单位包含约0.1μg到约2000mg之间的活性成分。
药片、片剂、丸剂、胶囊等也可含有以下所列的成分:粘合剂如树胶、阿拉伯树胶、玉米淀粉或明胶,赋形剂如磷酸氢二钙,分散剂如玉米淀粉、土豆淀粉、藻酸等,润滑剂如硬脂酸镁,可以加入的甜味剂如蔗糖、乳糖或糖精或调味剂如胡椒薄荷、冬青油或樱桃香精。除了以上形式的物质,如果剂量单位形式是胶囊,还可含有液体载体。其它多种材料可作为包被剂存在或修饰剂量单位的物理形式。例如,片剂、丸剂或胶囊可用紫胶,糖或二者包被。糖浆或酏剂可含有活性化合物、作为甜味剂的蔗糖、作为防腐剂的甲基和丙基对羟基苯甲酸酯类、染色剂和香精如樱桃或桔子香精。当然,用于制备剂量单位形式的任何物质应是药学纯的并且所用量基本上无毒。另外,活性化合物可掺入缓释制剂和配方。
本发明也扩展到适于体表给药形式如乳膏、洗液和凝胶。
制药上可接受的载体和/或稀释剂包括任何或所有溶剂,分散介质,包被剂,抗细菌和抗真菌剂、等渗和延缓吸收的药剂等。已在本领域内熟知对制药活性物质应用这些介质和药剂。除非在此范围内,任何传统的介质或试剂与活性成分不相容,应考虑应用其药物组合物。补充的活性成分也可掺入组合物。
配制剂量单位形式的非肠道组合物具有特别的优点,可使给药容易和剂量均一。在此所应用的剂量单位形式指的是适于给所治疗的哺乳动物个体以单位剂量的物质分散单位,每单位含有事先决定的活性物质的量。这一量是根据与所要求的制药载体相一致的,应产生所要达到的疗效而计算出的。本发明的新的剂量单位形式说明书是根据并直接依据(a)活性物质的特性和应达到的特殊疗效(b)在此详细公开的本领域的活性物质化合物治疗健康受损的病态情况下生命体的疾病的固有的局限。
在此之前公开了主要的活性物质的合成。活性物质与合适的药学可接受载体结合成一剂量单位形式以方便、有效地以有效量给药。一单位剂量可以,例如,含有主要活性化合物,其量是从0.5μg至约2000mg。用比例表达是:活性化合物一般占载体的从大约0.5μg到大约2000mg/ml组合物包括补充活性成分,剂量根据有用剂量和所说的成分的给药方式来决定。有效量也可方便地以每kg体重的量的方式来表示。例如,可以服用约0.01ng到约10,000mg/kg体重。
药物组合物还包括基因分子如可转染目的细胞的载体。载体上携带一核苷酸分子。这一分子可调节SOCS表达或SOCS活性。载体可以,例如,是病毒载体。在此,本发明考虑的一类基因治疗包括分离某种细胞,基因操作,和重新返回这些细胞到同一实验对象或基因相关或相似的实验对象。
本发明的另一方面涉及SOCS及其衍生物的抗体。这样的抗体可以是单克隆或多克隆的并可选自天然存在的针对SOCS的抗体或可以特异地针对SOCS或其衍生物产生。对于后者,SOCS或其衍生物首先需要与载体分子结合。本发明的抗体和/或重组SOCS或其衍生物作为治疗或诊断试剂特别有用。
例如,SOCS及其衍生物可用于筛选天然产生的针对SOCS的抗体。这些抗体可能例如在某些自身免疫病中产生。另外,特异的抗体可用于筛选SOCS。这样的分析测定技术在本领域内已熟知并且包括例如三明治测定法和ELISA。SOCS水平的了解可能对诊断某些癌症或癌症倾向或监测细胞因子介导的细胞反应性或监测某些治疗措施有意义。
本发明的SOCS抗体可以是单克隆抗体或多克隆抗体,另外,可应用抗体的片段如Fab片段。另外,本发明扩展到重组和合抗抗体以及杂种抗体。在此考虑的“合成抗体”包括抗体的片段和杂化物。本发明的这一方面的抗体,对于免疫治疗特别有用处,并也可作为诊断工具以检测细胞凋亡或监测某些治疗方法的程序。
例如,特异性抗体可用于筛选SOCS蛋白。后者很重要。例如,作为筛选细胞提取液或其它生物体液中SOCS水平或从培养上清液中纯化重组的SOCS的方法。
本发明范围内包括任何二抗(单克隆,多克隆或抗体或合成抗体的片段)。这些二抗直接与上面首先讨论的抗体相关,这些一抗、二抗可用于检测分析或可应用商业性可获得的抗免疫球蛋白抗体作为一抗。在此考虑的抗体包括对SOCS的任一区段有特异性的抗体。
多克隆和单克隆抗体可用酶或蛋白免疫获得。并且两种类型都可用于免疫测定。自血清中获得两种抗体的方法在此领域内已熟知,多克隆血清较少优选,但相对容易制备,制备通过给适当的实验动物注射有效量的SOCS或其抗原性部分,从动物身上收集血清,应用所知的免疫吸附技术收集特异性血清。尽管用这种方法产生的抗体可应用于几乎所有类型的免疫测定,但由于产品潜在不均一性,他们一般较少优选。
单克隆抗体由于能大量生产及产品具有均一性,所以特别优选用于免疫测定。可通过融合不死细胞系和被免疫原性制备剂致敏的淋本发明细胞产生用于生产多克隆抗体的杂交瘤细胞系。这些技术已被本领域的技术人员所熟知并可应用。
本发明的另一方面包括用于检测来自受测试者的生物样品中的SOCS的方法,该方法包括使所述生物样品与对SOCS或其衍生物或同系化合物特异的抗体在足以形成抗体-SOCS复合物的条件下接触一定时间,然后检测该复合物。
SOCS的存在可用大量方法检测到,如Western印迹杂交和ELISA法。多种免疫测定技术可以参考美国专利号4,016,043,4,424,279和4,018,653。这些当然包括非竞争类型的单位点和双位点或“三明治”测定,以及传统的竞争结合测定。这些测定技术还包括标记的抗体与目标的直接结合。
三明治测定技术是最有用的和最普遍使用的测定方法,并且在此发明中优选地应用。本发明包括大量变化了的和所有的三明治测定技术。简要地,一个典型的系列测定中,未标记抗体被固定在一固体支持物上,样品可与固定的分子接触而被检测。经过适当的孵育时间,这段时间经足够允许抗原抗原复合物形成,之后,加入标记有报告分子能产生可检测信号的抗原特异性二抗,并孵育一段时间,以形成另外一个标记的抗体-抗原抗体复合物。洗脱掉其它未反应物。抗原的存在就可通过观察报告分子产生的信号来测定。结果既可通过仅仅观察可见信号定性,又可通过与含有一定数量半抗原的对照样品对比业定量。这种系列测定法的变化包括一种同时测定,即样品和标记的抗体同时加到固定抗体上、本领域的技术人员熟知这些技术,包括可能会很明显的任何小的变化。根据本发明,可能含有SOCS的样品包括细胞提取液、组织活检或可能的血清,唾液,粘膜分泌物,淋本发明、组织液和呼吸液。因此,样品一般是生物样品,包括生物体液,而且还扩展到发酵液或培养细胞的上清液。
典型的系列三明治检测技术中,有SOCS或其抗原部分特异性的一抗既可共价地,又可被动地与固体表面结合。固体表面典型的是玻璃或高分子,最常用的高分子是纤维素,聚丙烯酰胺,信号传导龙,聚苯二烯,聚氯乙烯或聚丙烯。固定支持物形状可是管型,珠状,微孔板或其它适于进行免疫测定的表面。本领域众所周知其结合过程,并且一般是由交联共价结合或物理吸附,在制备测试样品时冲洗高分子一抗体复合物。然后把被测的可整除的样品加到固相复合物上,在合适的条件下(如室温到37℃)孵育足够的时间(例如2-40分钟或如更方便地过液)以保证抗体中任何亚单位固定、孵育之后,冲洗抗体亚单位固相并干燥后再和半抗原的部分特异性二抗孵育,二抗连接有报告分子,报告分子用于显示二抗与半抗原的结合。
另外一种方法涉及固定生物样品中的目标分子,然后暴露固定的目标于特异性抗体中,此特异性抗体可标有或未标有报告分子。依据目标分子的数量及报告分子信号的强度,可通过直接标记抗体来检测固定的目标分子。或者,与一抗特异性结合的标记二抗暴露于目标-一抗复合物中以形成目标-一抗-二抗三级复合物。通过报告分子发出的信号来检测该复合物。
本说明书中所用的“报告分子”是指其化学性质提供可分析鉴定的信号使得可以检测抗原结合的抗体的一类分子。检测可以是定性或定量的。这种测定中最常用的报告分子是酶、荧光基团或含有放射性核素(即放射性同位素)的分子和化学发光分子。
在酶免疫测定时,酶与二抗结合,结合一般通过戊二醛或过碘酸(盐)。尽管容易识别,但存在多种不同的结合技术。这些技术易被本领域的技术人员所应用。常用的酶包括辣根过氧化物酶,葡糖氧化醛,β-半乳糖苷酶和碱性磷酸酶及其它。根据底物与特异的酶作用后的产物,该产物经过相应酶水解后产生可检测的颜色变化来选择所用的底物。合适的酶的实例包括碱性磷酸酶和过氧化物酶。也可用荧光底物,这样产生的是荧光产物而不是上面所提到的产色底物。所有情况中,把酶标抗体加到一抗-抗原复合物上,使其发生结合,然后洗掉过多的试剂,然后把含有合适的底物的溶液加到抗体-抗原-抗体复合物上。底物将与酶标二抗反庆,产生定性的可见信号。这些信号可被进一步定量,通常采用分光光度法,得到样品中半抗原量的指示。“报告分子”也可扩展到应用细胞凝集或凝集抑制。如红细胞在乳胶珠上凝集抑制等。
或者,荧光化合物如荧光素和罗丹明可以在不改变其结合能力的情况下与抗体结合。当被一定波长的光所激发后荧光标记的抗体以收光强,诱导分子进入可激发态,随后发出可用光学显微镜检测到的特征性颜色的光。在EIA中,荧光素标记抗体可与一抗-半抗原复合物结合。洗脱掉未结合的试剂后,剩下的三级复合物就暴露于适当的波长的光下,即可观察到显示感兴趣的半抗原和存在。免疫荧光和EIA技术在本领域中都易于建立,且特别优选用于本方法。然而,也可应用其它报告分子,如放射同位素,化学发光物或生物发光物分子。
本发明还包括基因测定如采用PCR分析来检测SOCS基因或其衍生物。替代的方法或联合应用的方法包括直接核苷酸测序或突变扫描如单链构象多态性分析(SSCP)、特异寡核苷酸杂交和诸如直接蛋白截断测定的方法。
由于细胞因子参与某些SOCS分子的转录,SOCS的检测给细胞因子或细胞因子活性提供了替代标记。这可以在评估患有诸如那些自身免疫疾病,如风湿性关节炎、糖尿病和stiff man综合征等的一系列疾病的对象时有用。
本发明的核酸分子可以是DNA或RNA。当核酸分子以DNA形式时,它可以是基因组DNA或cDNA。本发明的核酸分子的RNA形式一般是mRNA。
尽管本发明的核酸分子一般以分离的形式,但是它们可整合入或连接入或融合或结合于其它遗传分子如载体分子上或特定表达载体分子中。载体和表达载体一般能复制并且,如果可行,在原核细胞或真核细胞中表达。优选地,原核细胞包括大肠杆菌、杆菌属种类和假单孢菌属种类。优选的真核细胞包括酵母菌、真菌、哺乳动物和昆虫细胞。
因此,本发明的另一方面包括包含载体部分、哺乳动物或更具体地人SOCS基因部分的基因构建体,SOCS基因部分能编码SOCS多肽或其功能上或免疫学上相互作用性的衍生物。
优选地,基因构建体的SOCS基因部分可调控地与载体上的启动子相连,使得启动子能指导所述SOCS基因部分在适当细胞中表达。
另外,基因构建体的SOCS基因部分可包含与另一遗传序列如编码谷胱甘肽-S-转移酶或其部分的核苷酸序列融合的所有或部分基因。
本发明扩展到这样的基因构建体及含有相同的基因构建体的原核和真核细胞。
本发明还扩展到SOCS的任何或所有衍生物,包括突变体、部分、片段、组分、同系物、类似物或它们的编码基因序列,包括对天然存在的核苷酸或氨基酸序列的一个或多个核苷酸或氨基酸替换、添加和/或缺失。本发明还扩展到SOCS的模拟物和激动剂及拮抗剂。
本发明的SOCS及其基因序列将在制备一系列治疗和诊断试剂有用并尤其将在检测参与特定细胞反应的细胞因子或此细胞因子的受体中有用。例如,表达SOCS基因的细胞如表达SOCS1基因的M1细胞,将不再对某特定细胞因子,即对于SOCS1的IL-6应答。清楚地,本发明进一步包括诸如表达任何SOCS基因如SOCS1到SOCS15的M1细胞的细胞,更进一步,本发明提供调节或加强治疗性细胞因子能力的分子的用途。例如,阻断一些SOCS活性的分子可能对治疗性细胞因子的潜在活性作用(如G-CSF)。
在治疗涉及细胞因子介导的细胞反应性的疾病、损伤或异常如超免疫反应、免疫抑制、变态反应、高血压等时特别有用的可溶性SOCS多肽也包括在本发明内。
本发明的另一方面包括应用SOCS及其功能性衍生物在制备用于治疗与细胞因子介导的细胞反应性有关的疾病的药物中的用途。
本发明进一步包括表达SOCS基因的转基因哺乳动物细胞。这些细胞是用于测定细胞因子功能抑制的有用的指示细胞系。一个实例是表达SOCS基因的M1细胞。这样的细胞系可用于筛选细胞因子或筛选能作用为细胞因子拮抗剂或激动剂的分子如来自植物、珊瑚、微生物或生物有机活性土壤或水的天然存在的分子。
本发明进一步包括来自相同或不同动物种的不同SOCS间的杂合体。例如,杂合体可在小鼠SOCS1和人SOCS1的所有或功能部分间形成。或者,杂合体可在小鼠SOCS1与小鼠SOCS2的所有或功能部分间形成。在此包括所有这样的杂合体并在开发多效性分子时特别有用。
本发明进一步包括一系列筛选带缺陷型SOCS基因个体的以基因为基础的诊断分析法。这些突变可产生不对特定细胞因子应答的细胞类型或导致引起病情的过量表达。SOCS基因序列可容易地通过用各种PCR或其它测定基因中是否有突变的技术来证实。然后合适的基因治疗或其它干涉治疗可被采用。
本发明用以下非限制性的实施例进一步描述。
实施例1-16涉及根据活性鉴定的SOCS1,SOCS2和SOCS3。实施例17-24涉及最初根据序列相似性克隆的SOCS4至SOCS15的各个方面。实施例25-26分别涉及SOCS4至SOCS15的具体方面。
实施例1细胞培养和细胞因子
M1细胞系源自SL小鼠中自发产生的白血病[Ichikawa,1969]。本研究中所用的亲本M1细胞已在澳大利亚维多利亚墨尔本的Walter和Eliza Hall医学研究所中传代约10年。通过每周在含10%(体积/体积)胎牛血清(FCS)的Dulbecco改良的Eagle培养基(DME)中传代来维持M1细胞。重组细胞因子通常可从商业来源获得或通过已公开的方法制备。如前所述,重组的鼠LIF在大肠杆菌中合成[Gearing,1989]。从PeproTech Inc(Rocky Hill,NJ,USA)购得纯化的人oncostain M,从Genzyme Diagnostics(Cambridge,MA,USA)获得纯化的小鼠IFN-γ。重组的鼠促血小板生成素在CHO细胞中作为FLAGTM标记的融合蛋白合成并髓后得到纯化。
实施例2琼脂集落分析
在装有补加20%(体积/体积)胎牛血清(FCS),0.3%(重量/体积)琼脂和0.1毫升IL-6、LIF、OSM、IFN-γ、tpo或地塞米松(Sigma ChemicalCompany,St Louis,MI)的连续稀释液的1毫升DME的35毫米培养皿中培养300个细胞以检测对细胞因子反应的M1细胞的分化。在37℃含10%(体积/体积)CO2的完全湿润的空气中培养7日后,对M1细胞集落计数,并且如果细胞由分散的细胞组成或在紧密包裹的中心周围有分散细胞冠,就将其归类为分化。
实施例3逆转录病毒文库的产生
基本如所述的[Rayner,1994]从因子依赖型造血细胞系FDC-P1构建cDNA表达文库。简要地说,将cDNA克隆入逆转录病毒载体pRUFneo,然后转染进双嗜性包装细胞系(PA317)。转染后48小时从细胞上清收集瞬间产生的病毒并用于转染Y2亲嗜性包装细胞以得到产生高滴度病毒的细胞系。
实施例4M1细胞的逆转录病毒侵染
对106个侵染的ψ2细胞群进行辐射(3000rad)并与106个M1细胞在添加10%(体积/体积)FCS和4微克/毫升Polybrene的DME中于37℃共培养2天。为筛选IL-6非反性性克隆,用DME洗一次逆转录病毒侵染的M1细胞并在1毫升含400微克/毫升遗传霉素(Gibc0BRL,Grand Island,NY)和100纳克/毫升IL-6的琼脂培养基中按约2×104细胞/毫升培养。如通过在仅存在geneticin时侵染细胞的琼脂铺板估算的,M1细胞的侵染效率是1-2%。
实施例5PCR
用SacI消化逆转录病毒侵染的M1细胞的基因组DNA,然后通过聚合酶链反应(PCR)扩增1微克酚/氯仿抽提的DNA。用于扩增整合逆转录病毒的cDNA插入的引物是对应于多克隆位点5’的约30bp的载体gag序列GAG3(5’CACGCCGCCCACGTGAAG GC 3’[SEQ IDNO:1]),和对应于多克隆位点3’的约200bp的pMCLneo序列的HSVTK(5’TTCGCCAATGACAAGACGCT 3’[SEQ ID No:2])。PCR需要94℃起始变性5分钟,35个循环的94℃变性1分钟、56℃退火2分钟和72℃延伸3分钟,然后是最后的10分钟延伸。凝胶纯化PCR产物并将其连接入pGEM-T质粒(Promega,Madison,WI),并用ABIPRISM Dye终止循环测序试剂盒和373型DNA自动测序仪(AppliedBiosystems Inc,Foster City,CA)进行测序。
实施例6cDNA克隆
基本上如所述(Hilton等,1994)从鼠胸腺cDNA文库分离编码小鼠SOCS1的独立cDNA克隆。用BLASTN和TFASTA算法(Pearson和Lipman,1988;Pearson,1990;Altsch等,1990)将小鼠SOCS1cDNA的核苷酸和推测的氨基酸序列与数据库比较。从编码人SOCS1及小鼠SOCS1和SOCS3的EST设计寡核苷酸并用于探测商业购买的小鼠胸腺和脾cDNA文库。用ABI自动测序仪根据生产商的说明进行测序。
实施例7DNA和RNA印迹及RT-PCR
用随机十核甘酸标记试剂盒(Bresatec,Adelaide,South Australia)从来自质粒pPGKneo的编码新霉素磷酸转移酶的600bp PstI片段、通过用Xh0I消化1.4kbp PCR产物所得的SOCS1基因的1070bp片段、SOCS2、SOCS3、CIS和小鸡甘油醛3-磷酸脱氢酶基因的1.2kbp片段产生32P标记的探针[Dugaiczyk,1983]。
基本上如所述的用蛋白酶K-十二烷基硫酸钠方法从细胞分离基因组DNA。基本上如所述的[Sambrook,1989],用BamH I或Sac I消化15微克DNA,在0.8%(重量/体积)琼脂糖凝胶上分级分离,转移至GeneScreenPlus膜(Du Pont NEN,Boston MA)上,预杂交,与随机引物32P标记的DNA片段杂交并冲洗。
如生产商(GibcoBRL,GRand Island,NY)所推荐的用Trizol试剂从细胞和组织分离总RNA。基本上如所述的[Alexander,1995]纯化所需的多聚腺苷酸化mRNA。如所述的[Alexander,1995]对蛋白印迹预杂交,用随机引物32P标记的DNA片段杂交并冲洗。
向小鼠C57BL6静脉注射5微克IL-6,然后在注射后指定时间点收集肝脏以评估IL-6对SOCS基因的诱导。M1细胞在存在20纳克/毫升IL-6的情况下培养并在指定时间收集。对于RT-PCR分析,如所述的(Metacalf等,1995)收集骨髓细胞并用100纳克/毫升的一系列细胞因子在37℃刺激1小时。如所述的对总RNA进行RT-PCR(Metcalf等,1995)。在琼脂糖凝胶上分辨PCR产物并用每个SOCS家族成员特异的探针与DNA印迹杂交。检测β-肌动蛋白的表达以确保扩增的一致性。
实施例8DNA构建和转染
通过将完整SOCS1编码区亚克隆入已加工编码起始蛋氨酸下游的框架内FLAG抗原决定基的pEF-BOS表达载体[Mizushima,1990]产生编码表位标记的SOCS1的cDNA(pF-SOCS1)。用前述的电穿孔[Hilton,1994],将20微克Aat II消化的pF-SOCS1表达质粒和2微克Sca I消化的其中编码嘌呤霉素N-乙酰转移酶的cDNA的转录由小鼠磷酸甘油激酶启动子(pPGkPuropA)驱动的质粒转染入表达促血小板生成素受体(M1.mp1)的M1细胞。在培养48小时后,用20微克/毫升嘌呤霉素(Sigma Chemical Company,St Louis MO)筛选转染的细胞,并用M2抗FLAG的单克隆抗体根据生产商说明书(Eastman Kodak,Rochester NY)通过蛋白印迹分析筛选SOCS1的表达。在其它实验中,仅用pF-SOCS1质粒或对照转染M1细胞并根据其在存在100纳克/毫升IL-6时在琼脂中的生长能力来筛选。
实施例9免疫沉淀和蛋白印迹分析
在免疫沉淀或蛋白印迹分析(Western blotting)前,将107M1细胞或其衍生物洗两次,重新悬浮于1毫升DME中,并在37℃培养30分钟。然后用盐水或100纳克/毫升IL-6在37℃刺激细胞4分钟,然后加入钒化钠(Sigma Chemical C0.,St Louis,MI)至1mM浓度。将细胞置于冰上,用含1mM钒化钠盐水洗一次,然后用含完全蛋白酶抑制剂(Boehringer Mannheim,Mannheim,Germany)和1mM钒化钠的300微升的1%(体积/体积)Triton X-100,150mM NaCl,2mM EDTA,50mMTris-HCl pH7.4在冰上溶解5分钟。通过离心使裂解物澄清并用考马斯蛋白分析试剂(Pierce,Rockford IL)进行定量。
对于免疫沉淀,用4微克抗gp130的抗体(M20;Santa CruzBiotechnology Inc.,Santa Cruz,CA)或4微克抗磷酸酪氨酸的抗体(4G10;Upstate Biotechnology Inc.,Lake Placid NY)和15微升包装体积的蛋白G Sepharose(Pharmacia,Uppsala,Sweden)与相同浓度的蛋白提取物(1-2毫克)于4℃培养1小时或过夜[Hilton等,1996]。用含完全蛋白酶抑制剂(Boehringer Mannheim,Mannheim,Germany)和1mM钒化钠的1%(体积/体积)NP40,105mM NaCl,50mM Tris-HCl pH8.0洗免疫沉淀两次。样品在SDS样品缓冲液(625mM Tris-HCl pH 6.8,0.05%(重量/体积)SDS,0.1%(体积/体积)甘油,溴酚蓝,0.125%(V/V)2-疏基乙醇)中于95℃加热5分钟,通过SDS-PAGE分级分离并如上述免疫印迹。
对于蛋白印迹分析,将来自免疫沉淀反应的10微克细胞提取物或物质蛋白上样到4-15%预备胶(Bio-Rad Laboratories,Hercules CA)上并通过十二烷基硫酸钠聚丙酰胺凝胶电泳(SDS-PAGE)分辨。在100V下1小时将蛋白转移至PVDF膜(Micron Separations Inc.,WestboroughMA)上。用下列一抗探测膜:抗酪氨酸磷酸化的STAT3(1∶1000稀释;New England Biolabs,Beverly,MA);抗-STAT3(C-20;1∶100稀释;Santa Cruz Biotechnology Inc.,Santa Cruz CA);抗gp130(M20,1∶100稀释;Santa Cruz Biotechnology Inc.Santa Cruz CA);抗磷酸酪氨酸(辣根过氧化酶偶联的RC20,1∶5000稀释;Transduction Laboratories,Lexington KY);抗酪氨酸磷酸化的MAP激酶和抗MAP激酶(1∶1000稀释;New England Biolabs,Beverly,MA)的抗体。根据生产商说明书(Pierce,Rockford IL)用过氧化物偶联的二抗和增强的化学发光(ECL)试剂观察印迹。
实施例10电泳迁移率变化分析
如所述的[Novak,1995],用高亲和性SIF(c-sis诱导因子)结合位点m67进行分析[wakao,1994]。从在10毫升含盐水、100ng/ml IL-6或100ng/ml IFN-γ的无血清DME中37℃培养4-10分钟的M1细胞中制备蛋白提取物。结合反应包含4-6微克蛋白(在给定实验中恒定)、5纳克32P标记的m67寡核苷酸和800纳克超声处理的鲑鱼精子DNA。对于某些实验,如所述的[Novak,1995],蛋白样品与过量的未标记m67寡核苷酸或对STAT1(Transduction Laboratories,Lexington,KY)或STAT3(Santa Cruz Biotechnology Inc.,Santa Cruz CA)特异的抗体一起预培养。
如所述的[Nicola等,1996]用抗酪氨酸磷酸化的STAT3或抗STAT3(New England Biolabs,Beverly,MA)或抗gp130(Santa CruzBiotechnology Inc.)的抗体进行蛋白印迹分析。如所述的(Novak等,1995)用m67寡核苷酸探针进行EMSA。
实施例11细胞因子信号传导新抑制剂的表达克隆
采取表达克隆方法鉴定能抑制细胞因子信号传导的cDNA。此策略针对可对细胞因子IL-6,LIF,OSM和IFN-γ及类固醇地塞米松应答分化成成熟巨噬细胞并停止增殖的单核白血病细胞系M1细胞。用其中已克隆入因子依赖型造血细胞系FDC-P1的cDNA的RUFneo逆转录病毒侵染亲本M1细胞。在此逆转录病毒中,新霉素抗性基因和克隆的cDNA的转录由逆转录病毒LTR中存在的强组成型启动子驱动(图1)。亲本M1细胞在半固体琼脂中培养时形成大的紧密包裹的集落。用IL-6刺激时,M1细胞经历快速分化,导致在琼脂中仅形成单一巨噬细胞或小的分散细胞群。在半固体琼脂培养基中根据在IL-6和遗传霉素存在形成大的紧密包裹的集落的能力来挑选对IL-6非反应性的逆转录病毒侵染的M1细胞。在检查104个侵染的细胞后获得单一稳定的IL-6未反应性克隆。
新霉素磷酸转移酶(neo)基因片段用于探测克隆4A2的基因组DNA的DNA印迹并且表明细胞系已由含大约1.4kbp的cDNA的单一逆转录病毒感染(图2)。用来自逆转录病毒载体位于cDNA克隆位点两侧的引物进行PCR扩增保证了我们已命名为细胞因子信号传导抑制剂1或SOCS1的1.4kbp cDNA插入的回收。将此PCR产物用于探测相似的4A2基因组DNA的DNA印迹并与两个片段杂交,一个片段对应于内源SOCS1基因,另一个片段符合用neo探针时所见到的条带大小、对应克隆入整合逆转录病毒的SOCS1cDNA(图2)。用含不相关cDNA的逆转录病毒侵染的M1细胞中没有观察到后者。相似地,RNA印迹分析表明SOCS1mRNA在细胞系4A2中丰富,但不存在于对照侵染的M1细胞克隆中(图2)。
实施例12SOCS1、SOCS2、SOCS3和CIS定义含SH2的蛋白新家族
SOCS1 PCR产物用作探针从小鼠胸腺cDNA文库中分离同源cDNA。cDNA序列被证明与PCR产物相同,表明SOCS1蛋白的组成型或过量表达而不是突变足以产生IL-6-非反应性表型。将SOCS1cDNA序列与核苷酸序列数据库比较发现它存在于小鼠和大鼠包含小鼠染色体16中发现的鱼精蛋白基因群的基因组DNA克隆。进一步检测表明1.4kb SOCS1序列不与任何鱼精蛋白基因同源,但确实代表位于这些克隆的远3′端的先前未鉴定的开放阅读框架(图3)。在SOCS1cDNA和基因座序列间没有不连续区,表明SOCS1由单一外显子编码。除含鱼精蛋白基因的基因组克隆,一系列鼠和人表达序列标记(EST)也揭示出与小鼠SOCS1相同的大块核苷酸序列。人EST提供的序列信息确保了编码人SOCS1的eDNA的快速克隆。
小鼠和大鼠SOCS1基因编码212个氨基酸的蛋白,而人SOCS1基因编码211个氨基酸的蛋白。小鼠、大鼠和人SOCS1蛋白具有95-99%的氨基酸相同性(图9)。用推测的SOCS氨基酸序列搜索翻译的核酸数据库表明它与最近克隆的细胞因子诱导的立即早期基因产物CIS和两类EST最相关。两类EST的全长cDNA得到分离并发现编码具有与SOCS1和CIS相似长度和总体结构的蛋白。这些克隆命名为SOCS2和SOCS3。四种蛋白中的每一种都包含中央SH2结构域和定义为SOCS基序的C末端区。SOCS1蛋白在不同种中表现极高水平的氨基酸序列相似性(95-99%相同性)。但是,清楚定义含SH2的蛋白新家族的来自相同动物的SOCS1、SOCS2、SOCS3和CIS表现更低的氨基酸相同性。SOCS2和CIS表现约38%氨基酸相同,而家族的其余成员表现25%氨基酸相同性(图9)。SOCS1和SOC3基因编码区看来不含内含子,而SOCS2和CIS基因的编码区分别包含1个和2个内含子。
此处提及的序列的Genbank保藏号是小鼠SOCS1cDNA(U88325),人SOCS1 cDNA(U88326),小鼠SOCS2cDNA(U88327),小鼠SOCS3cDNA(U88328)。
实施例13抑制一系列细胞因子作用的SOCS1组成型表达
为正式确定4A2细胞系的表型与SOCS1表达直接相关,并与这些细胞中独立发生的非相关遗传变化无关,将EF1α启动子调控下的编码SOCS1的表位标记模式的cDNA转染入亲本M1细胞和表达促血小板生成素受体的M1细胞c-mpl(M1.mpl)。两种细胞系中SOCS1表达载体的转染导致IL-6非反应性M1细胞的频率增加。
如蛋白印迹所检测到的,表达SOCS1的M1细胞的多个独立克隆表示不能与4A2区分的细胞因子非反应性表型。此外,如果不在嘌呤霉素中保存转染子,一定时间后SOCS1表达丢失并且细胞重新获得细胞因子反应性。在无细胞因子时,来自4A2和其它表达SOCS1的克隆的集落特征性地长得比由对照M1细胞形成的集落更小(图10)。
用4A2细胞系和表达SOCS1的M1.mpl细胞(M1.mpl.SOCS1)的克隆研究组成型SOCS1表达在M1细胞对一系列细胞因子应答中的影响。不像亲本M1细胞和M1.mpl细胞,表达SOCS1的两种细胞系继续增殖并且不能对IL-6、LIF、OSM、IFN-γ或促血小板生成素(对于M1.mplSOCS1细胞系)反应形成分化集落(图4)。但是对于两种细胞系,观察到对地塞米松的正常反应,表明SOCS1特异影响细胞因子信号传导而不是分化。与这些数据一致,亲本M1细胞和M1.mpl细胞并对IL-6应答变大并形成空泡,4A2和Ml.mpl.SOCS1细胞也没有表现对IL-6或其它细胞因子反应形态分化的证明(图5)。
实施例14SOCS1抑制一系列IL-6信号传导过程,包括STAT3磷酸化和活化
细胞表面受体成分gp130的磷酸化作用、胞质酪氨酸激酶JAK1和转录因子STAT3被认为在IL-6信号传导中起重要作用。在亲本M1和M1.mpl细胞系及其表达SOCS1的对应细胞系中比较这些事件。如所期望的,在两种亲本系中gp130对IL-6应答快速磷酸化,但是在表达SOCS1的细胞系中减少5到10倍(图6)。同样地,在表达SOCS1的细胞系中对IL-6应答STAT3磷酸化也减至约10倍(图6)。与STAT3磷酸化作用减少一致,如通过电泳迁移率转变检测所测定的,特异STAT DNA结合复合物的活化也减少。引人注意的是,在用IL-6刺激的M1细胞中诱导的三种STAT复合物SIF-A(含STAT3)、SIF-B(STAT1/STAT3异源二聚体)和SIF-C(含STAT1)的形成减少(图7)。相似地,SOCS1的组成型表达也抑制IFN-γ激活的p91同二聚体的形成(图7)。STAT磷酸化和活化不是唯一受SOCS1表达影响的胞质过程,因为包括shc和MAP激酶的其它蛋白的磷酸化作用也减至相似程度(图7)。
实施例15体外和体内IL-6刺激SOCS1基因的转录
尽管SOCS1在M1细胞中组成型表达可以抑制细胞因子信号传导,但是这一点并不必然表明SOCS1通常作用为负调节IL-6反应。
为了研究此种可能性,本发明人测定了M1细胞是否对IL-6反应而调节SOCS1基因的转录,因为IL-6在调节对损伤和感染的急性阶段反应中起关键作用,所以也测定了肝对5mg IL-6静脉注射的反应。在无IL-6时,在M1细胞和肝中都检测不到SOCS1mRNA。然而,对于两种细胞类型,用IL-6在20-40分钟内诱导1.4kb SOCS1转录物(图8)。对于M1细胞,如果IL-6在整个实验中存在,SOCS1mRNA的水平一直升高(图6)。相反,用单次静脉注射体内施用IL-6并迅速从循环中清除导致IL-6对肝的间断刺激。与此一致,可在肝中检测到SOCS1mRNA的瞬间表达,注射后约40分钟达到高峰并在4小时内降至基线水平(图8)。
实施例16 SOCS基因的调节
既然CIS作为细胞因子诱导的立即早期基因得到克隆,本发明人测定了SOCS1、SOCS2和SOC3是否受到相似调节。四个SOCS基因表达的基本模式通过对来自雌性和雄性C57B1/6小鼠组织的mRNA进行Northern印迹分析来测定(图11A)。在胸腺中观察到SOCS1的组成型表达,在脾和肺水平更低。SOCS2表达基本限制在睾丸和某些动物的肝或肺中;对于SOCS1,在肺、脾和胸腺中观察到低水平表达,而CIS表达更广泛,包括睾丸、心脏、肺、肾和某些动物的肝。
本发明人设法测定四个SOCS基因的表达是否由IL-6调节。从未处理的和注射IL-6的小鼠或未刺激的和IL-6刺激的M1细胞制备的mRNA的Northern印迹用标记的SOCS1、SOCS2、SOCS3和CIS cDNA片段杂交(图11B)。IL-6注射后,所有四个SOCS基因在肝中的表达都增加,然而诱导动力学看来不同。SOCS1和SOCS在肝中的表达是瞬间的,在IL-6注射20分钟后有可检测到的mRNA,对于SOCS1在4小时内降至基础水平,对于SOCS3在8小时内降至基础水平。SOCS2和CIS mRNA在肝中的诱导遵循与SOCS1相似的起始动力学,但在升高的水平上保持至少24小时。SOCS基因mRNA的相似诱导也在其它器官,明显地在肺和脾中发现。相反,在M1细胞中,SOCS1和CISmRNA受IL-6诱导,而没有观察SOCS2或SOCS3表达的诱导。此结果表明在SOCS家族成员基因对相同细胞因子应答的表达中的细胞类型特异性的不同。
为了测定能诱导各种SOCS基因家族成员转录的细胞因子的范围,用一系列细胞因子刺激骨髓细胞,然后提取mRNA并合成cDNA。然后使用PCR评估SOCS1、SOCS2、SOCS3和CIS的表达(图11C)。在不刺激时,通过PCR在骨髓中检测到极少的任一SOCS基因的表达或检测不到任何SOCS基因的表达。用广泛的细胞因子刺激骨髓细胞看来能正调节一个或多个SOCS家族成员的mRNA。例如,IFN γ诱导所有四个SOCS基因的表达,而促红细胞生成素、粒细胞集落刺激因子、颗细胞--巨噬细胞集落刺激因子和白细胞介素-3诱导SOCS2、SOCS3和CIS的表达。有趣地是,通过不属于I型细胞因子受体类型的受体作用的肿瘤坏死因子、巨噬细胞集落刺激因子和白细胞介素-1也表现出能诱导SOCS3和CIS的表达,证明SOCS蛋白可以在调节信号传导中起更广泛的作用。
由于SOCS1的组成型表达抑制M1细胞对一系列细胞因子的反应,本发明人测定了被认为在IL-6信号传导中起关键作用的细胞表面受体成分gp130和转录因子STAT3的磷酸化是否受到影响。在亲本M1和M1.mp1细胞和它们表达SOCS1的对应物中比较这些事件。如所预测的,在两种亲本细胞系中,gp130迅速对IL-6反应而磷酸化,然而在表达SOCS1的细胞系中磷酸化作用降低(图12A)。同样,STAT3对IL-6反应的磷酸化作用也在表达SOCS1的那些细胞系中降低(图12A)。与STAT3磷酸化作用降低一致,通过电泳泳动率变化实验测定的特异STAT/DNA结合复合物的活化也降低。明显地,用IL-6在M1细胞中诱导的主要STAT复合物SIF-A(含有STAT3)和SIF-B(STAT1/STAT3异源二聚体)没有形成。相似地,SOCS1的组成型表达也抑制IFN γ刺激的SIF-C(STAT1同源二聚体)的形成(图12B)。这些实验与SOCS1有效地在激酶水平上抑制受体上游的信号传导和STAT磷酸化作用的假设一致。
SOCS1抑制信号传导并最终抑制对细胞因子的生物反应的能力表明,如同含有SH2的磷酸酶SHP-1[Ihle等,1994;Yi等,1993],SOCS蛋白通过抑制信号传导过程在控制细胞对各种细胞外刺激反应的强度和/或时间中起关键作用。此处提供的证据表明对于细胞因子信号传导,SOCS家族以典型的负反馈环作用。如同其它基因如OSM,编码SOCS蛋白的基因的表达由细胞因子经STAT的活化诱导。一旦表达,认为SOCS蛋白抑制JAK的活性并因此减少受体和STAT的磷酸化作用,由此抑制信号传导和任何随后的生物学反应。重要的是,在长时间范围内,STAT活化的抑制将导致SOCS基因表达的减少,使细胞重新得到对细胞因子的反应性。
实施例17数据搜索
用TFASTA和MOTIF/PATTERN算法(Pearson,1990;Cockwell和Giles,1989)搜索包含表达序列标鉴(EST)的主要数据和人表达序列标鉴的TIGR数据的NCBI遗传序列数据(Genbank)以寻找与保守的SOCS元件盒基序更具相似性的序列。使用软件包SRS(Etzold等,1996),寻找与SOCS元件盒有相似性的EST(和从cDNA的另一端测序得来它们的伴侣)并使用Autoassembler(Applied Biosystems,FosterCity,CA)将它们排列成重叠群。然后用BLA STN[Altschul等,1990],使用来自重叠的EST的保守核苷酸序列搜索不同的数据。又得到阳性EST并加到重叠群中。重复此过程直到不再能找到另外的EST。然后同Sequence Navigator(Applied Biosystems,Foster City,CA)翻泽保守的核苷酸序列。
编码新SOCS蛋白的EST如下:人SOCS4(EST81149,EST180909,EST182619,ya99H09,ye70co4,yh53c09,yh77g11,yh87h05,yi45h07,yj04e06,yq12h06,yq56a06,yq60e02,yq92g03,yq97h06,yr90f01,yt69c03,yv30a08,yv55f07,yv57h09,yv87h02,yv98e11,yw68d10,yw82a03,yx08a07,yx72h06,yx76b09,yy37h08,yy66b02,za81f08,zb18f07,zc06e08,zd14g06,zd51h12,zd52b09,ze25g11,ze69f02,zf54f03,zh96e07,zv66h12,zs83a08和zs83g08),小鼠SOCS-4(mc65f04,mf42e06,mp10c10,mr81g09,和mt19h12),人SOCS-5(EST15B103,EST15B105,EST27530和zf50f01),小鼠SOCS-5(mc55a01,mh98f09,my26h12和ve24e06),人SOCS-6(yf61e08,yf93a09,yg05f12,yg41f04,yg45c02,yh11f10,yh13b05,zc35a12,ze02h08,z109a03,z169e10,zn39d08和zo39e06),小鼠SOCS-6(mc04c05,md48a03,mf31d03,mh26b07,mh78e 11,mh88h09,mh94h07,mi27h04和mj29c05,mp66g04,mw75g03,va53b05,vb34h02,vc55d07,vc59e05,vc67d03,vc68d 10,vc97h01,vc99c08,vd07h03,vd08c01,vd09b12,vd19b02,vd29a04和vd46d06),人SOCS-7(STS WI30171,EST00939,EST12913,yc29b05,yp49f10,zt10f03和zx73g04),小鼠SOCS-7(mj39a01和vi52h07),小鼠SOCS-8(mj6e09和vj27a029),人SOCS-9(CSRL-82f2-u,EST114054,yy06b07,yy06g06,zr40c09,zr72h01,yx92c08,yx93b08和hfe0662),小鼠SOCS-9(me65d05),人SOCS-10(aa48h10,zp35h01,zp97h12,zq08h01,zr34g05,EST73000和HSDHEI005),小鼠SOCS-10(mb14d12,mb40f06,mg89b11,mq89e12,mp03g12和vh53c11),人SOCS-11(zt24h06和zr43b02),人SOCS-13(EST59161),小鼠SOCS-13(ma39a09,me60c05,mi78g05,mk10c11,mo48g12,mp94a01,vb57c07和vh07c 11),人SOCS-14(mi75e03,vd29h 11和vd53g07)。
实施例18cDNA克隆
根据从重叠EST得来的保守序列设计对不同SOCS家族成员特异的寡核苷酸。按上述标记寡核苷酸并将其用于筛选商业购买的用入噬菌体克隆的基因组和cDNA文库。覆盖鼠SOCS4、鼠SOCS5和鼠SOCS6的完整编码区域的基因组和/或cDNA克隆得到分离。完整SOCS15基因在人12p13BAC(Genbank登记号HSU47924)和鼠6号染色体BAC上(Genbank登记号AC002393)。鼠SOCS7、SOCS9、SOCS10、SOCS11、SOCS12、SOCS13和SOCS14的部分cDNA也得到分离。
实施例19Northern印迹和vt PCR
Northern印迹按上述进行。杂交探针来源如下:(i)鼠SOCS1cDNA的完整编码区域,(ii)来自SH2结构域上游SOCS编码区域的1059bpPCR产物,(iii)鼠SOCS6cDNA的完整编码区域,(iv)来自部分SOCS7cDNA的编码区域的790bp PCR产物和(v)鸡甘油醛-3-磷酸脱氢酶(GAPDH)cDNA的1200bp PstI片段。
实施例20SOCS家族的其它成员
SOCS1、SOCS2和SOCS3是在实施例1-16中鉴定的SOCS蛋白家族的成员。它们各含有中央的SH2结构域和称为SOCS元件盒的C末端保守基序。为了分离此蛋白家族的其它成员,用对应于SOCS元件盒保守残基的氨基酸序列搜索各种DNA数据。这种搜索表明存在编码12个SOCS蛋白家族其它成员的人和小鼠EST(图13)。用此序列信息分离编码SOCS4、SOCS5、SOCS6、SOCS7、SOCS9、SOCS10、SOCS11、SOCS12、SOCS13、SOCS14和SOCS15的cDNA。来自EST的重叠群和cDNA的进一步分析表明可以根据SOCS蛋白SOCS元件盒N端的推测结构将它们分成三类。这三类是带有(i)SH2结构域、(ii)WD-40重复和(iii)锚蛋白重复的SOCS蛋白。
实施例21带有SH2结构域的SOCS蛋白
带有SH2结构域的8个SOCS蛋白得到鉴定。它们包括SOCS1、SOCS2、SOCS3、SOCS5、SOCS9、SOCS11和SOCS14(图13)。小鼠SOCS5和SOCS14的全长cDNA及编码小鼠SOCS9和SOCS14的部分克隆得到分离。一级氨基酸序列和基因结构的分析表明这些蛋白对(SOCS1和SOCS3,SOCS2和CIS,SOCS5和SOCS14及SOCS9和SOCS11)是亲缘关系最近的(图13)。的确,SOCS5和SOCS14的SH2结构域是最相同的(图13B),并且与CIS、SOCS1、SOCS2和SOCS3不同,SOCS5和SOCS14在它们的SH2结构域前有延伸的、尽管保守性更低的N端区域(图13A)。
实施例22
带有WD-40重复的4个SOCS蛋白得到鉴定。与带有SH2结构域的SOCS蛋白相同,这些蛋白的两两之间亲缘关系很近。小鼠SOCS4和SOCS6的全长cDNA得到分离并表明编码蛋白在SOCS元件盒的N端含有8个WD-40重复并与SOCS4和SOCS6有65%的氨基酸相似性。基于对来自人染色体12p13和小鼠6号染色体合成区域的BAC测序,SOCS15识别为开放阅读框架[Ansari-Lari等,1997]。在人、黑猩猩和小鼠中,SOC15由位于丙糖磷酸异构酶(TPI)基因3’末端几百碱基对内的二个编码外显子编码,但在IPI的相反链上编码。除了(末端)SOCS元件盒,SOCS15蛋白还含有四个WD-40重复。有趣地是,在EST数据库中,存在与SOCS15有亲缘关系的线虫、昆虫和鱼序列。
实施例23
鉴定了带有锚蛋白重复的三个SOCS蛋白。小鼠SOCS7、SOCS10和SOCS12的部分cDNA分析证明了多个锚蛋白重复的存在。
实施例24SOCS蛋白的表达模式
对每种SOCS蛋白的代表性成员-来自SH2结构域类的SOCS1和SOCS,来自WD-40重复类的SOCS6和来自锚蛋白重复类的SOCS7的mRNA的表达进行检测。
既然SOCS1基因的转录受细胞因子诱导,本发明人设法测定细胞因子刺激后SOCS5、SOCS6和SOCS7的mRNA水平是否增加。在用IL-6注射的小鼠肝中,SOCS1mRNA可在20分钟后检测到并在2小时内降至背景水平。相反,SOCS5mRNA表达的动力学十分不同,在IL-6注射12-24小时后可检测到。SOCS6mRNA看来是组成型表达的,而SOCS7mRNA在IL-6注射前或注射后的任何时候都检测不到。
这些基因的表达也在细胞因子刺激经加工而表达bcl-W的因子依赖型细胞系FDCP-1后检测到。同样,SOCS6mRNA是组成型表达的。
实施例25 SOCS4
通过用SOCS元件盒保守序列搜索EST数据库识别出人和小鼠SOCS4(图13)。那些来自人和小鼠SOCS4cDNA的EST在下面列表(表4.1和4.2)。使用来自小鼠EST的序列信息设计几个寡核苷酸并用于以传统方式筛选克隆入λ噬菌体的小鼠胸腺cDNA文库。编码小鼠SOCS4的cDNA得到分离并完全测序(图15),并表明与数据库中鉴定的小鼠EST重叠(表4.1和图17)。这些cDNA包括5′非翻译区、完整小鼠SOCS编码区域和3′非翻译区(图17)。序列分析确认了SOCS4cDNA编码C末端的SOCS元件盒和SOCS元件盒前的8个WD-40重复(图17和16)。人SOCS4的两个序列重叠群(h4.1和h4.2)与实验测定的小鼠SOCS cDNA序列的关系在图17中表示。两个人重叠群的核苷酸序列在图18中列出。
SEQ ID NO:13和14代表鼠SOCS4的核苷酸序列和相应的氨基酸序列。SEQ ID NO:15和16分别是SOCS4cDNA人重叠群h4.1和h4.2。
实施例26SOCS5
通过用SOCS元件盒保守序列搜索EST数据库识别出人和小鼠SOCS5(图13)。那些来自人和小鼠SOCS5cDNA的EST在下面列表(表5.1和5.2)。使用来自小鼠和人EST的序列信息设计几个寡核苷酸并用于以传统方式筛选克隆入入噬菌体的小鼠胸腺cDNA文库、小鼠基因组cDNA文库和人胸腺cDNA文库。编码小鼠SOCS5的单一基因组DNA克隆(57-2)和(5-3-2)cDNA克隆得到分离并完全测序,并表明与数据库中鉴定的小鼠EST重叠(图19和20A)。小鼠SOCS5的完整编码区域和5′和3′非翻译区看来在单一外显子上编码(图19)。序列分析(图20)确认了SOCS5基因组和cDNA克隆编码含有在其C末端的SOCS元件盒和SH2结构域的蛋白(图19和20B)。从对cDNA克隆5-94-2和人SOCS EST(表5.2)的分析得来的人SOCS5重叠群(h5.1和图21)与小鼠SOCS5cDNA序列的关系在图19中表示。鼠SOCS5的核苷酸序列和相应的氨基酸序列分别在SEQ ID NO:17和18中表示。人SOCS5的核苷酸序列在SEQ ID NO:19中表示。
实施例27 SOCS6
通过用SOCS元件盒保守序列搜索EST数据库识别出人和小鼠SOCS6(图13)。那些来自人和小鼠SOCS6 cDNA的EST在下面列表(表6.1和6.2)。使用来自小鼠EST的序列信息设计几个寡核苷酸并用于以传统方式筛选小鼠胸腺cDNA文库。8个编码小鼠SOCS6的cDNA克隆(6-1A,6-2A,6-5B,6-4N,6-18,6-29,6-3N,6-5N)得到分离并完全测序(图15),并表明与数据库中鉴定的小鼠EST(和图22和23A)重叠。序列分析(图23)确认了小鼠SOCS cDNA克隆编码含有在其C末端的SOCS元件盒和8个WD-40重复的蛋白(图22和23B)。从对人SOCS6EST(表6.2)的分析得来的人SOCS6重叠群(h6.1和h6.2,图24)与小鼠SOCS cDNA序列的关系在图22中表示。鼠SOCS6的核苷酸序列和相应的氨基酸序列分别在SEQ IDNO:20和21中表示。人SOCS6重叠群h6.1和h6.2分别在SEQ ID NO:22和23中表示。
实施例28SOCS7
通过用SOCS元件盒保守序列搜索EST数据库识别出人和小鼠SOCS7(图13)。那些来自人和小鼠SOCS7cDNA的EST在下面列表(表7.1和7.2)。使用来自小鼠EST的序列信息设计几个寡核苷酸并用于以传统方式筛选小鼠胸腺cDNA文库。编码小鼠SOCS7的一个cDNA克隆(74-10A-11)得到分离并完全测序,并表明与数据库中鉴定的小鼠EST(图25和图26A)重叠。序列分析(图26)证明小鼠SOCS7编码含有在其C末端的SOCS元件盒和几个锚蛋白重复的蛋白(图25和26B)。从对人SOCS7EST(表7.2)的分析得来的人SOCS7重叠群(h7.1和h7.2,图27)与小鼠SOCS7DNA序列的关系在图25中表示。鼠SOCS7的核苷酸序列和相应的氨基酸序列分别在SEQ ID NO:24和25中表示。人SOCS7重叠群h7.1和h7.2的核苷酸序列分别在SEQ IDNO:26和27中表示。
实施例29SOC88
来自小鼠SOCS8 eDNA的EST在下表列表(表8.1)。如上对SOCS家族其它成员所述,有可能使用来自小鼠EST的序列信息分离小鼠SOCS8的cDNA。EST与推测的SOCS8编码区域的关系在图28中表示。从EST得到的核苷酸序列在图29A中表示,SOCS8的部分氨基酸序列在图29B中表示。鼠SOCS8的核苷酸序列和相应的氨基酸序列分别在SEQ ID NO 28和29中表示。
实施例30SOCS9
通过用SOCS元件盒保守序列搜索EST数据库识别出人和小鼠SOCS9(图13)。那些来自人和小鼠SOCS9cDNA的EST在下面列表(表9.1和9.2)。从对小鼠SOCS9EST(表9.1)的分析得来的小鼠SOCS9重叠群(m9.1,表9.2)与人SOCS9DNA重叠群的关系在图31中表示。序列分析(图32)表明人SOCS9编码含有在其C末端的SOCS元件盒和SH2结构域的蛋白(图30)。鼠SOCS9cDNA的核苷酸序列在SEQID NO:30中表示。人SOCS cDNA的核苷酸序列在SEQ ID NO:31中表示。
实施例31SOCS10
通过用SOCS元件盒保守序列搜索EST数据库识别出人和小鼠SOCS10(图13)。那些来自人和小鼠SOCS10cDNA的EST在下面列表(表10.1和10.2)。使用来自小鼠EST的序列信息设计几个寡核苷酸并用于以传统方式筛选小鼠胸腺cDNA文库。编码小鼠SOCS10的四个cDNA克隆(10-9,10-12,10-23和10-24)得到分离并完全测序,并表明与数据库中鉴定的小鼠和人EST重叠(图33和图34)。序列分析(图34)表明小鼠SOCS10cDNA不是全长但它的确编码含有在其C末端的SOCS元件盒和几个锚蛋白重复的蛋白(图33)。从对人SOCS10EST的分析得来的人SOCS10重叠群(h10.1和h10.2,图35)与小鼠SOCS10DNA序列的关系在图33中表示。小鼠cDNA克隆和EST与人EST的比较表明,小鼠和人SOCS10的3’非翻译区明显不同。鼠SOCS10的核苷酸序列在SEQ ID NO:32中表示。人SOCS10重叠群h10.1和h10.2的核苷酸序列分别在SEQ ID NO:33和34中表示。
实施例32SOCS11
通过用SOCS元件盒保守序列搜索EST数据库识别出人SOCS11(图13)。那些来自人SOCS11cDNA的EST在下面列表(表11.1和11.2)。从对EST(表11.2)的分析得来的人SOCS11重叠群(h11.1,图36A,B)与推测编码蛋白的关系在图37中表示。序列分析(图36B)表明人SOCS11cDNA编码含有在其C末端的SOCS元件盒和SH2结构域的蛋白(图37和36B)。人SOCS11的核苷酸序列和相应的氨基酸序列分别在SEQ ID NO:35和36中表示。
实施例33SOCS12
通过用SOCS元件盒保守序列搜索EST数据库识别出人和小鼠SOCS12(图13)。那些来自人和小鼠SOCS12cDNA的EST在下面列表(表12.1和12.2)。使用来自小鼠EST的序列信息设计几个寡核苷酸并用于以传统方式筛选小鼠胸腺cDNA文库。编码小鼠SOCS12的四个cDNA克隆(10-9,10-12,10-23和10-24)得到分离并完全测序,并表明与数据库中鉴定的小鼠和人EST重叠(图33和图34)。序列分析(图39和40)表明小鼠SOCS12cDNA克隆编码含有在其C末端的SOCS元件盒和几个锚蛋白重复的蛋白(图38)。从对人SOCS12EST的分析得来的人SOCS12重叠群(h12.1和h12.2,图40)与小鼠SOCS12DNA序列的关系在图38中表示。小鼠cDNA克隆和EST与人EST的比较表明小鼠和人SOCS12的3’非翻译区明显不同。SOCS12的核苷酸序列在SEQ ID NO:37中表示。人SOCS12重叠群h12.1和h12.2分别在SEQ ID NO:38和39中表示。
实施例34 SOCS13
通过用SOCS元件盒保守序列搜索EST数据库识别出人和小鼠SOCS13(图13)。那些来自人和小鼠SOCS13cDNA的EST在下面列表(表13.1和13.2)。使用来自小鼠EST的序列信息设计几个寡核苷酸并用于以传统方式筛选小鼠胸腺和小鼠胚cDNA文库。编码小鼠SOCS13的三个cDNA克隆(62-1,62-6-7和62-14)得到分离并完全测序,并表明与数据库中鉴定的小鼠EST(图41和图42A)重叠。序列分析(图42)表明小鼠SOCS13编码含有在其C末端的SOCS元件盒和可能的WD-40重复的蛋白(图41和42B)。从对人SOCS13EST(表13.2)的分析得来的人SOCS13重叠群(h13.1和h13.2,图43)与小鼠SOCS13DNA序列的关系在图41中表示。鼠SOCS13的核苷酸序列和相应的氨基酸序列分别在SEQ ID NO:40和41中表示。人SOCS13重叠群h13.1的核苷酸序列在SEQ ID NO:42中表示。
实施例35SOCS14
通过用SOCS元件盒保守序列搜索EST数据库识别出人和小鼠SOCS14(图13)。那些来自人和小鼠SOCS14cDNA的EST在下面列表(表14.1和14.2)。使用来自小鼠和人EST的序列信息设计几个寡核苷酸并用于以传统方式筛选克隆入λ噬菌体的小鼠胸腺cDNA文库、小鼠基因组DNA文库和人胸腺DNA文库。编码小鼠SOCS14的一个基因组DNA克隆(57-2)和cDNA克隆(5-3-2)得到分离并完全测序,并表明与数据库中鉴定的小鼠EST(图44和图45A)重叠。小鼠SOCS14的完整编码序列及5’和3’非翻译区看来在单一外显子上编码(图44)。序列分析(图45)确认了小鼠SOCS14基因组和cDNA克隆编码含有在其C末端的SOCS元件盒和SH2结构域的蛋白(图44和45B)。从对cDNA克隆5-94-2和人SOCS14EST(表14.2)的分析得来的人SOCS14重叠群(h14.1,表14.3)与小鼠SOCS14DNA序列的关系在图44中表示。鼠SOCS14的核苷酸序列和相应的氨基酸序列分别在SEQID NO:43和44中表示。
实施例36SOCS15
通过用SOCS元件盒保守序列搜索EST数据库识别出人和小鼠SOCS15(图13)。那些来自人和小鼠SOCS15cDNA的EST在下面列表(表15.1和15.2),也列出了含有完整小鼠和人SOCS15基因的小鼠和人BAC。使用来自EST和BAC的序列信息有可能推测SOCS15的完整氨基酸,并且如对其它SOCS基因所述的,设计特异的寡核苷酸探针以分离cDNA是可行。BAC与EST的关系在图46中表示,并且来自小鼠和人BAC的SOCS15的核苷酸序列和推测的氨基酸序列在图47和48中表示。鼠SOCS15的核苷酸序列和相应的氨基酸序列分别在SEQ ID NO:46和47中表示。人SOCS15的核苷酸序列和相应的氨基酸序列分别在SEQ ID NO:48和49中表示。
实施例37SOCS与JAK2激酶的相互作用
这些实施例表明SOCS和JAK2激酶之间的相互作用。相互作用由SOCS1,2,3和CIS的SH2结构域介导(图49)。JAK和SOCS1,2,3及CIS之间的基本相互作用在图50中表示。
使用以下方法:
免疫沉淀:通过电穿孔瞬间转染COS6细胞并培养48小时。然后在冰上在加有完全蛋白酶抑制剂(Boehringer Mannheim)的裂解缓冲液[50mM Tris/HCl(pH7.5),150mM NaCl,1%(体积/体积)TritonX-100,1mM EDTA,1mM Naf,1mM Na3VO4]中裂解,于4℃离心并保留上清以用5μl抗JAK2抗体(UBI)进行免疫沉淀。抗原-抗体复合物用蛋白A-Sepharose(30μl 50%浆液)回收。
Westerrn印迹:免疫沉淀用十二烷基硫酸钠(SDS)-聚丙烯酰胺凝胶电泳在还原条件下分析。然后将蛋白电泳转移到硝酸纤维素膜上,在10%(重量/体积)脱脂牛奶中封闭过夜并在PBS/0.1%(体积/体积)Tween-20(Sigma)洗脱缓冲液中洗涤,然后与稀释于洗涤缓冲液/1%(重量/体积)BSA的抗磷酸铬氨酸的抗体(4G 10)(1∶5000,UBI)、抗FLAG的抗体(1.6μg/ml)或抗JAK2的抗体(1∶2000,UBI)一起温育2小时。洗涤硝酸纤维素膜印迹并用稀释于洗涤缓冲液/1%(重量/体积)BSA中的过氧化物酶偶联的羊抗兔免疫球蛋白(1∶5000,Silenus)或过氧化物酶偶联的羊抗鼠免疫球蛋白(1∶5000,Silenus)检测一抗。洗涤印迹并用加强的Chemiluminescenle(ECL)系统(Ainersham,UK)根据厂商说明使抗体结合可见。
体外激酶分析:进行体外激酶分析以评估JAK2激酶催化活性。如上述对JAK2蛋白进行免疫沉淀,在激酶分析缓冲液(50mM NaCl,5mM MgCl2,5mM MnCl2,1mM NaF,1mM Na3VO4,10mM HEPES,pH7.4)中洗两次并悬浮于含0.25μCi/ml(γ-32p)-ATP的等体积激酶缓冲液中(30分钟,室温)。除去过量的(γ-32p)-ATP并用SDS/PAGE在还原条件下分析免疫沉淀。通过用1M KOH(55℃,2小时)处理对胶进行温和碱水解以除去磷酸丝氨酸和磷酸铬氨酸。用IMAGEQOANT软件在phosphorImage系统(Molecular Dynamics,Sunnyvale,CA,USA)上观察放射性条带。
实施例38制备失效构建体
在图51-53中表示质粒构建体和失效构建体的图解。用限制性酶BamHI和EcoRI消化基因组SOCS-1克隆95-11-10以得到编码区域(SOCS1外显子)3’的3.6kb DNA片段用作SOCS1失效载体中的3’臂。然后将此片段的末端补平并将此片段连接入下列载体:
pBgalpAloxNeo和pBgalpAloxNeoTK它们已在单一xhoI位点处切开并补平。此连接导致下列载体的形成:
3’SOCS1臂在pBgalpAloxNeo  中和3’SOCS-1臂在pBgalpAloxNeoTK
通过用PCR从SOCS-1基因组克隆95-11-10得到SOCS1编码区域(SOCS1外显子)的正好5’端的2.5kb PCR产物。用于制备此产物的寡核苷酸是:
5’寡核苷酸(有义)(2465)
AGCT AGA TCT GGA CCC TAC AAT GGC AGC[SEQ ID NO:49]
3’寡核苷酸(反义)(2466)
AGCT AG ATC TGC CAT CCT ACT CGA GGG GCC AGC TGG[SEQ ID NO:50]
用限制性酶Bgl II消化PCR产物以得到PCR产物的Bgl II末端。然后如下连接带有Bgl II末端的此5’SOCS1PCR产物:已用单一限制性酶BamHI切开的3’SOCS-1臂在pBgalpAloxNeo中和3’SOCS1臂在pBgalpAloxNeoTK中。
这导致下列载体的形成:
5’&3’SOCS1臂在pBgalpAloxNeo  中和5’&3’SOCS1臂在pBgalpAloxNeoTK中
由此得到SOCS1失效构建体。两个这样的构建体缺少全部SOCS1编码区域(SOCS1外显子),用Bgal的部分、B球蛋白多聚腺苷酸、PGK启动子、新霉素和PGK多聚腺苷酸序列代替。5’&3’SOCS1臂在pBgalpAloxNeoTK载体中在新霉素和PGK多聚腺苷酸化序列之间也包含tymidine激酶基因。
载体:5’&3’SOCS1臂在pBgalpAloxNeo和5’&3’SOCS1臂在pBgalpAloxNeoTK中,用单一限制性酶NotI切开,然后通过电穿孔转染入胚干细胞。选择对新霉素有抗性的克隆并通过Southern印迹分析以确定它们是否正确地包含了整合的SOCS1目的序列。为了确定正确整合是否已经出现,用限制性酶EcoRI消化新霉素抗性克隆中的基因组DNA。然后将消化的DNA印迹到尼龙膜上并用失效构建体所用的5’臂序列的5’端的1.5kb EcoRI/Hind III DNA片段探测。正确整合的预期大小是:
野生型SOCS-1等位基因的5.4kb
5’&3’SOCS1臂在pBgalpAloxNeo中的SOCS-1失效等位基因的8.2kb
或5&3’SOCS1臂在pBgalpAloxNeoTK中转化的细胞中的11kb。
本领域技术人员将理解此处所述的本发明容易在已具体描述的基础上变化和改进。应当理解本发明包括所有这样的变化和改进。本发明也分别或全体地包括此说明书中提及或表示的步骤、特征、组合物和化合物以及任意二个或多个所述步骤或特征的所有结合。
表4.1
来自小鼠SOCS-4cDNA的EST的总结
SOCS    物种  EST名称   末端EST号         文库来源     重叠群
SOCS-4  小鼠  mc65f04   5′  EST0549700   d13.5-14.5   m4.1
                                          小鼠胚
              mf42e06   5′  EST0593477   d13.5-14.5   m4.1
                                          小鼠胚
              mp10c10   5′  EST0747905   d 8.5小鼠胚  m4.1
              mr81g09   5′  EST0783081   d13胚        m4.1
              mt19h12   5′  EST0816531   脾           m4.1
表4.2
来自小鼠SOCS-4cDNA的EST的总结
SOCS    物种   EST名称    末端  EST号        文库来源   重叠群
SOCS-4  人     27b5       5′   EST0534081   视网膜     h4.2
               30d2       5′   EST0534315   视网膜     h4.2
               J0159F     5′   EST0461188   胎儿心脏   h4.2
               J3802F     5′   EST0461428   胎儿心脏   h4.2
               EST19523   5′   EST0958884   视网膜     h4.2
               EST81149   5′   EST1011015   胎盘       h4.2
               EST180909  5′   EST0951375   Jurkat T   h4.2
                                             淋巴细胞
               EST182619  5′   EST0953220   Jurkat T   h4.1
                                             淋巴细胞
               ya99h09    3′   EST0103262   胎盘       h4.2
               ye70c04    5′   EST0172673   胎儿肝/脾  h4.2
               yh53c09    5′   EST0197390   胎盘       h4.2
                          3′   EST0197391              h4.2
yh77g11   5′  EST0203418    胎盘         h4.2
          3′  EST0203419                 h4.1
yh87h05   5′  EST0204888    胎盘         h4.1
          3′  EST0204773                 h4.1
yi45h07   5′  EST0246604    胎盘         h4.2
yj04e06   5′  EST0258541    胎盘         h4.1
          3′  EST0258285                 h4.1
yq 12h06  5′  EST0309968    胎儿肝/脾    h4.2
yq56a06   3′  EST0346924    胎儿肝/脾    h4.2
yq60e02   5′  EST0347259    胎儿肝/脾    h4.2
          3′  EST0347209                 h4.2
yq92g03   5′  EST0355932    胎儿肝/脾    h4.2
          3′  EST0355884                 h4.2
yq97h06   5′  EST0357618    胎儿肝/脾    h4.2
          3′  EST0357416                 h4.2
yr90f01   5′  EST0372402    胎儿肝/脾    h4.2
yt69c03   5′  EST0338395    胎儿肝/脾    h4.2
          3′  EST0338303                 h4.2
yv30a08   3′  EST0458506    胎儿肝/脾    h4.2
yv55f07   5′  EST0465391    胎儿肝/脾    h4.2
          3′  EST0463331                 h4.2
yv57h09   5′  EST0464336    胎儿肝/脾    h4.2
          3′  EST0458765                 h4.2
yv87h02   5′  EST0388085    黑素细胞     h4.2
yv98e11   5′  EST0400679    黑素细胞     h4.2
          3′  EST0400680                 h4.2
yw68d10   5′  EST0441370    胎盘(8-9wk)  h4.2
yw82a03   5′  EST0463005    胎盘(8-9wk)  h4.2
         3′  EST0433678                    h4.1
yx08a07  3′  EST0407016  黑素细胞          h4.1
yx72h06  5′  EST0435158  黑素细胞          h4.2
         3′  EST0422871  黑素细胞          h4.1
yx76b09  5′  EST0434011  黑素细胞          h4.2
yy37h08  5′  EST0451704  黑素细胞          h4.2
yy66b02  5′  EST0505446  多发性硬化损伤    h4.2
za81f08  5′  EST0511777  胎儿肺            h4.2
zb18f07  3′  EST0485315  胎儿肺            h4.1
zc06e08  5′  EST0540473  甲状旁腺癌        h4.1
         3′  EST0540354                    h4.1
zd14g06  3′  EST0564666  胎儿心脏          h4.1
zd51h12  3′  EST0578099  胎儿心脏          h4.1
zd52b09  5′  EST0582012  胎儿心脏          h4.1
         3′  EST0581958                    h4.1
ze25g11  3′  EST0679543  胎儿心脏          h4.1
ze69f02  5′  EST0635563  视网膜            h4.2
         3′  EST0635472                    h4.1
zf54f03  5′  EST0680111  视网膜            h4.2
zh96e07  5′  EST0616241  胎儿肝/脾         h4.2
         3′  EST0615745                    h4.2
zv66h12  5′  EST1043265  8-9w胎儿          h4.2
zs83a08  5′  EST0920072  生发中心B         h4.1
                          细胞
         3′  EST0920016                    h4.1
zs83g08  5′  EST0920121  生发中心B         h4.1
                          细胞
         3′  EST0920122                    h4.1
表5.1
来自小鼠SOCS-5cDNA的EST的总结
SOCS    物种    EST名称  末端  EST号       文库来源     重叠群
SOCS-5  小鼠    mc55a01  5′   EST0541556  d13.5-14.5    m5.1
                                           小鼠胚
                mh98f09  5′   EST0638237  胎盘          m5.1
                my26h12  5′   EST0859939  混合的器官    m5.1
                ve24e06  5′   EST0819106  心            m5.1
表5.2
来自小鼠SOCS-5cDNA的EST的总结
SOCS    物种  EST名称   末端  EST号        文库来源   重叠群
SOCS-5  人    EST15B103  ?   EST0258029   脂肪组织   h5.1
              EST15B105  ?   EST0258028   脂肪组织   h5.1
              EST27530   5′  EST0965892   小脑       h5.1
              zf50f01    5′  EST0679820   视网膜     h5.1
表6.1
来自小鼠SOCS-6cDNA的EST的总结
SOCS    物种  EST名称  末端  EST号         文库来源        重叠群
SOCS-6  小鼠  mco4c05  5′   EST0525832    d19.5胚         m6.1
              md48a03  5′   EST0566730    d13.5-14.5胚    m6.1
              mf31d03  5′   EST0675970    d13.5-14.5胚    m6.1
              mh26b07  5′   EST0628752    d13.5-14.5胎盘  m6.1
              mh78e11  5′   EST0637608    d13.5-14.5胎盘  m6.1
              mh88h09  5′   EST0644383    d13.5-14.5胎盘  m6.1
mh94h07    5′    EST0638078    d13.5-14.5胎盘    m6.1
mi27h04    5′    EST0644252    d13.5-14.5胚      m6.1
mj29c05    5′    EST0664093    d13.5-14.5胚      m6.1
mp66g04    5′    EST0757905    胸腺              m6.1
mw75g03    5′    EST0847938    肝                m6.1
va53b05    5′    EST0901540    d12.5胚           m6.1
vb34h02    5′    EST0930132    淋巴节            m6.1
vc55d07    3′    EST1057735    2 细胞胚          m6.1
vc59e05    3′    EST1058201    2 细胞胚          m6.1
vc67d03    3′    EST1057849    2 细胞胚          m6.1
vc68d10    3′    EST1058663    2 细胞胚          m6.1
vc97h01    3′    EST1059343    2 细胞胚          m6.1
vc99c08    3′    EST1059410    2 细胞胚          m6.1
vd07h03    3′    EST1058173    2 细胞胚          m6.1
vd08c01    3′    EST1058275    2 细胞胚          m6.1
vd09b12    3′    EST1058632    2 细胞胚          m6.1
vd19b02    3′    EST1059723    2 细胞胚          m6.1
vd29a04    3′    ?未发现                        m6.1
vd46d06    3′    ?未发现                        m6.1
表6.2
来自人SOCS-5cDNA的EST的总结
SOCS    物种  EST名称   末端  EST号        文库来源          contig
SOCS-6  Human
              yf61e08    5′  EST0184387    d73  婴儿脑      h6.1
              yf93a09    5′  EST0186084    d73  婴儿脑      h6.1
              yg05f12    5′  EST0191486    d73  infant bra  h6.1
              yg41f04    5′  EST0195017    d73  婴儿脑      h6.1
              yg45c02    5′  EST0185308    d73  婴儿脑      h6.1
              yh11f10    5′  EST0236705    d73  婴儿脑      h6.1
              yh13b05    5′  EST0237191    d73  婴儿脑      h6.1
                         3′  EST0236958                     h6.2
              zc35a12    5′  EST0555518    衰老成纤维细胞   h6.1
              ze02h08    5′  EST0603826    胎儿心脏         h6.1
                         3′  EST0603718                     h6.2
              z109a03    5′  EST0773936    怀孕子宫         h6.1
                         3′  EST0773892                     h6.1
              z169e10    5′  EST0683363    结肠             h6.1
              zn39d08    5′  EST0718885    内皮细胞         h6.1
              zo39e06    5′  EST0785947    内皮细胞         h6.1
表7.1
来自小鼠SOCS-7cDNA的EST的总结
SOCS    物种  EST名称  末端 EST号       文库来源             重叠群
SOCS-7  小鼠  mj39a01  5′  EST0665627  d13.5/14.5胚         m7.1
              vi52h07  5′  EST1267404  d7.5胚               m7.1
表7.2
来自人S0CS-5cDNA的EST的总结
SOCS  物种  EST名称      末端  EST号         文库来源   重叠群
SOCS-7  人  STS WI-30171       (G21563)      染色体     h7.2
            EST00939      5′  EST0000906    海马       h7.1
            EST12913      3′  EST0944382    子宫       h7.2
            yc29b05       3′  EST0128727    肝         h7.2
            yp49f10       3′  EST0301914    视网膜     h7.2
            zt10f03       5′  EST0922932    生发中心B  h7.2
                                             细胞
                          3′  EST0921231h7.1
            zx73g04       3′  EST1102975    卵巢癌     h7.1
表8.1
来自小鼠SOCS-8cDNA的EST的总结
SOCS    物种  EST名称    末端 EST号       文库来源      重叠群
SOCS-8  小鼠  mj16e09    r1   EST0666240  d13.5/14.5胚  m8.1
              vj27a029   r1   EST1155973  心脏          m8.1
表9.1
来自小鼠SOCS-9cDNA的EST的总结
SOCS  物种   EST名称  末端   EST号       文库来源      重叠群
      小鼠   me65d05  5′    EST0585211  d13.5/14.5胚  m9.1
表9.2
来自人SOCS-5cDNA的EST的总结
SOCS  物种  EST名称      末端  EST号        文库来源    重叠群
SOCS-9  人  CSRL-83f2-u        (B06659)     染色体11    h9.1
            EST114054    5′   EST0939759   胎盘        h9.1
yy06b07    3′    EST0434504    黑素细胞       h9.1
yy06g06    5′    EST0443783    黑素细胞       h9.1
zr40c09    5′    EST0832461    黑素细胞,     h9.1
                                心脏,子宫
zr72h01    5′    EST0892025    黑素细胞,     h9.1
                                心脏,子宫
           3′    EST0892026                   h9.1
yx92c08    5′    EST0441160    黑素细胞       h9.1
yx93b08    5′    EST0441260    黑素细胞       h91
hfe0662    5′    EST0889611    胎儿心脏       h9.1
表10.1
来自小鼠SOCS-10cDNA的EST的总结
SOCS  物种  EST名称   末端  EST号        文库来源      重叠群
      小鼠  mb14d12   5′   EST0549887   d19.5胚       m10.1
            mb40f06   5′   EST0515064   d19.5胚       m10.1
            mg89b11   5′   EST0630631   d13.5-14.5胚  m10.1
            mq89e12   5′   EST0776015   心            m10.1
            mp03g12   5′   EST0741991   心            m10.1
            vh53c11   5′   EST1154634   乳腺          m10.1
表10.2
来自人SOCS-5cDNA的EST的总结
SOCS     物种 EST名称  末端  EST号        文库来源       重叠群
SOCS-10  人   aa48h10  3′   EST1135220   生发中心B细胞  h10.2
              zp35h01  3′   EST0819137   肌肉           h10.2
              zp97h12  5′   EST0835442   肌肉           h102
          3′  EST0831211              h10.2
zq08h01   5′  EST0835907  肌肉        h10.1
zr34g05   5′  EST0834251  黑素细胞,  h10.2
          3′  EST0834440  心脏,子宫  h10.2
EST73000  5    EST1004491  卵巢        h10.2
HSDHEI005 ?   EST0013906  心脏        h10.2
表11.1
来自人SOCS-5cDNA的EST的总结
SOCS    物种  EST名称  末端  EST号       文库来源    重叠群
SOCS-11  人   zt24h06  r1    EST0925023  卵巢癌      11.1
              zr43b02  r1    EST0873006  黑素细胞,  11.1
                       s1    EST0872954  心脏,子宫  11.1
表12.1
来自小鼠SOCS-12cDNA的EST的总结
SOCS     物种  EST名称  末端  EST号       文库来源   重叠群
SOCS-12  小鼠  EST03803  5′  EST1054173  第7.5天,  m12.1
                                          胚绒膜锥
               mt18f02   5′  EST0817652  3NbMS 脾   m12.1
               mz60g10   5′  EST0890872  淋巴节     m12.1
               va05c11   5′  EST0909449  淋巴节     m12.1
表12.2
来自人SOCS-5cDNA的EST的总结
SOCS      物种  EST名称         末端   EST号       文库来源         重叠群
SOCS-12   人    STS-SHGC-13867                     染色体           h12.2
                EST177695       5′    EST0948071  细胞   h12.1
EST64550    5′  EST0997367    细胞       h12.1
EST76868    5′  EST1007291    松果体     h12.2
PMY2369     5′  EST1115998    KG-1       h12.1
yb38f04     5′  EST0108807    胎儿脾     h12.1
            3′                           h12.2
yg74e12     5′  EST0224407    d73脑      h12.1
yh13g04     5′  EST0237226    d73脑      h12.1
            3′  EST0236992               h12.2
yh48b06     5′  yh48b06       胎盘       h12.2
yh53a05     5′  EST0197282    胎盘       h12.2
            3′  EST0197486               h12.2
yn48h09     5′  EST0278258    脑         h12.2
            3′  EST0278259               h12.2
yn90a09     3′  EST0302557    脑         h12.2
yo08f03     5′  EST0301790    脑         h12.2
            3′  EST0302059               h12.2
yo11e01     3′  未发现                   h12.2
yo63b12     5′  EST0303606    乳房       h12.2
            3′  EST0304085               h12.2
yq56g02     3′  EST0346935    胎儿肝/脾  h12.1
zh57c04     3′  EST0594201    胎儿肝/脾  h12.2
zh79h01     3′  EST0598945    胎儿肝/脾  h12.2
zh99a11     3′  EST0618570    胎儿肝/脾  h12.2
zo92h12     5′  EST0803392    卵巢癌     h12.1
            3′  EST0803393               h12.2
zs48c01     5′  EST0925714    生发中心   h12.1
                               B-细胞
            3′  EST0925530               h12.2
zs45h02   3′  EST0932296   生发中心     h12.2
                            B细胞
表3.1
来自小鼠SOCS-13cDNA的EST的总结
SOCS     物种  EST名称  末端 EST号         文库来源           重叠群
SOCS-13  小鼠  ma39c09  5′  EST0517875    第19.5天,胚       m13.1
               me60c05  5′  EST0584950    第13.5/14.5天,胚  m13.1
               mi78g05  5′  EST0653834    第19.5天,胚       m13.1
               mk10c11  5′  EST0735158    第9.5天,胚        m13.1
               mo48g12  5′  EST0745111    第10.5天,胚       m13.1
               mp94a01  5′  EST0762827    胸腺               m13.1
               vb57c07  5′  EST1028976    第11.5天,胚       m13.1
               vh07c11  5′  EST1117269    乳腺               m13.1
表13.2
来自人SOCS-13cDNA的EST的总结
SOCS     物种 EST名称   末端  EST号       文库来源  重叠群
SOCS-13  人   EST59161  5′   EST0992726  婴儿脑    h13.1
表14.1
来自小鼠SOCS-14cDNA的EST的总结
SOCS     物种  EST名称  末端 EST号       文库来源     重叠群
SOCS-14  小鼠  mi75e03  5′  EST0651892  d19.5 胚     m14.1
               vd29hI1  5′  EST1067080  2 细胞胚     m14.1
vd53g07    5′    EST1119627    2细胞胚    m14.1
表15.1来自小鼠SOCS-15cDNA的EST的总结
SOCS     物种  EST名称  末端 EST号         文库来源       重叠群
SOCS-15  小鼠  mh29b05  5′  EST0628834    胎盘           m15.1
               mh98h09  5′  EST0638243    胎盘           m15.1
               m145a02  5′  EST0687171    睾丸           m15.1
               mu43a10  5′  EST851588     胸腺           m15.1
               my38c09  5′  EST878461     合并的器官     m15.1
               vj37h07  5′  EST1174791    隔膜           m15.1
               AC002393                    染色体6        m15.1
                                           BAC
表15.2
来自人SOCS-15cDNA的EST的总结
SOCS    物种 EST名称  末端  EST号       文库来源  重叠群
SOCS-15  人  EST98889  5′  EST1026568  甲状腺    h15.1
             ne48bo5   3′  EST1138057  结肠癌    h15.1
             yb12h12   5′  EST0098885  胎盘      h15.1
                       3′  EST0098886            h15.1
             HSU47924                   染色体12  h15.1
                                        BAC
参考文献:
Alexander WS,Metcalf D和Dunn AR(1995).Embo Journal 14,5569-78.
Altschul,S.F.Gish,W.Miller,W.Myers,E.W.&Lipman,D.J.(1990)分子生物学杂志,215,403-10.
Ansari-Lari,M.A.,Shen,Y.,Munzy,D.M.,Lee,W.和Gibbs,R.A.(1997)基因组研究,7,268-280.
Bazan JF(1990).[Review].Immunology Today 11,350-4.
Bork,P.(1993)Proteins:Struct.Funct.Genet.17,363-374.
Cockwell,L.Y.和Giles,I.G.(1989)Comp.Appl.Biosci.5,227-232.
Cutler RL,Liu L,Damen JE和Krystal G(1993).生物化学杂志,268,21463-5.
Darnell JJ r.,Kerr IM和Stark GR(1994).科学,264,1415-21.
David M,Petricoin E3,Benjamin C,Pine R,Weber MJ和Larner AC(1995).科学,269,1721-3.
David M,Wong L,Flavell R,Thompson SA,Wells A,Larner AC和Johnson GR(1996).生物化学杂志,271,9185-8.
Dugaiczyk A,Haron JA,Stone EM,Dennison OE,Rothblum KN和Schwartz RJ(1983).生物化学,22,1605-13.
Durbin JE,Hackenmiller R,Simon MC和Levy DE(1996).细胞,84,443-50.
Etzold,T.,Ulyanov,A.和Argos,P.(1996)酶学方法,266,114-28.
Gearing DP,Nicola NA,Metcalf D,Foote S,Willson TA,Gough NM和Williams L(1989).生物技术,1157-1161.
Gupta S,Yan H,Wong LH,Ralph S,Krolewski J和Schindler C(1996).Embo Journal 15,1075-84.
Hilton DJ(1994).细胞因子受体介绍,《细胞因子及其受体指南》第8-16页,N.A.Nicola(编辑),Oxford大学出版社,Oxford.
Hilton DJ,Hilton AA,Raicevic A,Rakar S,Harrison-Smith M,Gough NM,Begley CG,Metcalf D,Nicola NA和Willson TA(1994).Embo Journal 13,4765-75.
Hilton DJ,Watowich SS,Katz L和Lodish HF(1996).生物化学杂志271,4699-4708.
Ichikawa Y(1969).细胞生理学杂志,74,223-34.
Ihle JN(1995).自然,377,591-4.
Ihle JN,Witthuhn BA,Quelle FW,Yamamoto K和Silvennoinen O(1995).免疫学年鉴,13,369-98.
Kaplan MH,Schindler U,Smiley ST和Grusby MJ(1996a).Immunity 4,313-9.
Kaplan MH,Sun YL,Hoey T和Grusby MJ(1996b).自然,382,174-179.
Levy DE和Stark GR(1996).Molecular & Cellular Biology 16,369-75.
Metcalf D,Wilson TA,Hilton DJ,DiRago L和Mifsud S.(1995)Leukaemia 9,1556-1564.
Meraz MA,White JM,Sheehan KC,Bach EA,Rodig SJ,Dighe AS,Kaplan DH,Riley JK,Greenlund AC,Campbell D,Carver-Moore K,DuBois RN,Clark R,Aguet M和SchreiberRD(1996)细胞84,431-42.
Mizushima S和Nagata S(1990).核酸研究,18,5322.
Murakami M,Narazaki M,Hibi M,Yawata H,Yasukawa K,Hamaguchi M,Taga T和Kishimoto T(1991)美国国家科学院院报88,11349-11353.
Neer,E.J.,Schmidt,C.J.,Nambudripad,R.和Smith,T.F.(1994)自然,371,297-300.
Nicola NA((1994).细胞因子及其受体指南,Oxford大学出版社Oxford.
Nicola,NV,Viney E,Hilton DJ,Roberts B和Wilson T.(1996)生长因子,13,141-149.
Novak U,Harpur AG,Paradiso L,Kanagasundaram V,Jaworowski A,Wilks AF和Hamilton JA(1995)血液,86,2948-56.
Pearson WR和Lipman DJ.(1988)美国国家科学院院报85,2444-8.
Pearson WR.(1990)酶学方法,183,63-98.
Rayner JR和Gonda TJ(1994).Molecular & Cellular Biology 14,880-7.
Sambrook J,Fritsch EF和Maniatis T(1989).分子克隆:实验手册,冷泉港实验室出版社,冷泉港,美国。
Sato N,Sakamaki K,Terada N,Arai K和Miyajima A(1993).Embo Journal 12,4181-9.
Shimoda K,van Deursen J,Sangster MY,Sarawar SR,Carson RT,Tripp RA,Chu C,QuelleFW,Nosaka T,Vignali DA,Doherty PC,Grosveld G,Paul WE和Ihle JN(1996).自然,380,630-3.
Shual K,Ziemiecki A,Wilks AF,Harpur AG,Sadowski HB,Gilman MZ和Darnell JE(1993).自然,366,580-3.
Sprang SR和Bazan JF(1993).Curr.Opin.Structural Biol.3,815-827.
Takeda K,Tanaka T,Shi W,Matsumoto M,Minami M,Kashiwamura S,Nakanishi K,Yoshida N,Kishimoto T和Akira S(1996).自然,380,627-30.
Thierfelder WE,Vandeursen JM,Yamamoto K,Tripp RA,Sarawar SR,Carson RT,SangsterMY,Vignali DDA,Doherty PC,Grosveld GC和Ihle JN(1996).自然,382,171-174.
Wakao H,Gouilleux F和Groner B(1994).Embo Journal 13,2182-91.
Wen Z,Zhong Z和Darnell J Jr.(1995)细胞82,241-50.
Yi T,Mui AL,Krystal G和Ihle JN(1993).分子细胞生物学,13,7577-86.
Yoshimura A,Ohkubo T,Kiguchi T,Jenkins NA,Gilbert DJ,Copeland NG,Hara T和Miyajima A(1995).Embo Journal 14.2816-26.
序列表
(1)基本信息
(i)申请人:(美国以外的地区):THE WALTER AND ELIZAHALL INSTITUTE OF MEDICAL RESEARCH
(ii)发明名称:治疗和诊断试剂
(iii)序列数:50
(iv)联系地址:
(A)名称:Davis collison Cave
(B)街道:1 Little Collins street
(C)城市:Melbourne
(D)州名:Victoria
(E)国家:澳大利亚
(F)邮政编号:300
(v)计算机可读形式:
(A)介质类型:软盘
(B)计算机:IBM PC兼容机
(C)操作系统:PC-DOS/MS-DOS
(D)软件:PatentIn Release#1.0,版本#1.25
(vi)目前申请资料:
(A)申请号:PCT国际申请
(B)递交日:1997年10月31日
(vii)在先申请资料:
(A)申请号:PO5117
(B)递交日:1997年2月14日
(vii)在先申请资料:
(A)申请号:PO3384
(B)递交日:1996年11月1日
(viii)律师/代理人信息
(A)名称:Hughes DR,E John L
(C)参考/著录号:ELH/EK
(ix)电信信息:
(A)电话:+61 3 9254 2777
(B)传真:+61 3 9254 2770
(2)关于SEQ ID NO:1的信息:
(i)序列特征
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:1:
CACGCCGCCC ACGTGAAGGC                         20
(2)关于SEQ ID NO:2的信息:
(i)序列特征
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:2:
TTCGCCAATG ACAAGACGCT                         20
(2)关于SEQ ID NO:3的信息
(i)序列特征
(A)长度:1236个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(ix)特征:
(A)名称/关键:CDS
(B)位置:1..636
(xi)序列描述:SEQ ID NO:3:
CGAGGCTCAA GCTCCGGGCG GATTCTGCGT GCCGCTCTCG CTCCTTGGGG TCTGTTGGCC       -101
GGCCTGTGCC ACCCGGACGC CCGGCTCACT GCCTCTGTCT CCCCCATCAG CGCAGCCCCG       -41
GACGCTATGG CCCACCCCTC CAGCTGGCCC CTCGAGTAGG                             -1
ATG GTA GCA CGC AAC CAG GTG GCA GCC GAC AAT GCG ATC TCC CCG GCA          48
Met Val Ala Arg Asn Gln Val Ala Ala Asp Asn Ala Ile Ser Pro Ala
  1               5                  10                  15
GCA GAG CCC CGA CGG CGG TCA GAG CCC TCC TCG TCC TCG TCT TCG TCC          96
Ala Glu Pro Arg Arg Arg Ser Glu Pro Ser Ser Ser Ser Ser Ser Ser
             20                  25                  30
TCG CCA GCG GCC CCC GTG CGT CCC CGG CCC TGC CCG GCG GTC CCA GCC         144
Ser Pro Ala Ala Pro Val Arg Pro Arg Pro Cys Pro Ala Val Pro Ala
         35                  40                  45
CCA GCC CCT GGC GAC ACT CAC TTC CGC ACC TTC CGC TCC CAC TCC GAT         192
Pro Ala Pro Gly Asp Thr His Phe Arg Thr Phe Arg Ser His Ser Asp
     50                  55                  60
TAC CGG CGC ATC ACG CGG ACC AGC GCG CTC CTG GAC GCC TGC GGC TTC         240
Tyr Arg Arg Ile Thr Arg Thr Ser Ala Leu Leu Asp Ala Cys Gly Phe
65                   70                  75                  80
TAT TGG GGA CCC CTG AGC GTG CAC GGG GCG CAC GAG CGG CTG CGT GCC         288
Tyr Trp Gly Pro Leu Ser Val His Gly Ala His Glu Arg Leu Arg Ala
                 85                  90                  95
GAG CCC GTG GGC ACC TTC TTG GTG CGC GAC AGT CGT CAA CGG AAC TGC         336
Glu Pro Val Gly Thr Phe Leu Val Arg Asp Ser Arg Gln Arg Asn Cys
            100                 105                 110
TTC TTC GCG CTC AGC GTG AAG ATG GCT TCG GGC CCC ACG AGC ATC CGC         384
Phe Phe Ala Leu Ser Val Lys Met Ala Ser Gly Pro Thr Ser Ile Arg
        115                 120                 125
GTG CAC TTC CAG GCC GGC CGC TTC CAC TTG GAC GGC AGC CGC GAG ACC         432
Val His Phe Gln Ala Gly Arg Phe His Leu Asp Gly Ser Arg Glu Thr
    130                 135                 140
TTC GAC TGC CTT TTC GAG CTG CTG GAG CAC TAC GTG GCG GCG CCG CGC         480
Phe Asp Cys Leu Phe Glu Leu Leu Glu His Tyr Val Ala Ala Pro Arg
145                 150                 155                 160
CGC ATG TTG GGG GCC CCG CTG CGC CAG CGC CGC GTG CGG CCG CTG CAG         528
Arg Met Leu Gly Ala Pro Leu Arg Gln Arg Arg Val Arg Pro Leu Gln
                165                 170                 175
GAG CTG TGT CGC CAG CGC ATC GTG GCC GCC GTG GGT CGC GAG AAC CTG         576
Glu Leu Cys Arg Gln Arg Ile Val Ala Ala Val Gly Arg Glu Asn Leu
            180                 185                 190
GCG CGC ATC CCT CTT AAC CCG GTA CTC CGT GAC TAC CTG AGT TCC TTC        624
Ala Arg Ile Pro Leu Asn Pro Val Leu Arg Asp Tyr Leu Ser Ser Phe
        195                 200                 205
CCC TTC CAG ATC TGA CCGGCTG CCGCTGTGCC GCAGCATTAA GTGGGGGCGC         676
Pro Phe Gln Ile  *
    210
CTTATTATTT CTTATTATTA ATTATTATTA TTTTTCTGGA ACCACGTGGG AGCCCTCCCC    736
GCCTGGGTCG GAGGGAGTGG TTGTGGAGGG TGAGATGCCT CCCACTTCTG GCTGGAGACC    796
TCATCCCACC TCTCAGGGGT GGGGGTGCTC CCCTCCTGGT GCTCCCTCCG GGTCCCCCCT    856
GGTTGTAGCA GCTTGTGTCT GGGGCCAGGA CCTGAATTCC ACTCCTACCT CTCCATGTTT    916
ACATATTCCC AGTATCTTTG CACAAACCAG GGGTCGGGGA GGGTCTCTGG CTTCATTTTT    976
CTGCTGTGCA GAATATCCTA TTTTATATTT TTACAGCCAG TTTAGGTAAT AAACTTTATT   1036
ATGAAAGTTT TTTTTTAAAA GAAAAAAAAA AAAAAAAAA                          1075
(2)关于SEQ ID NO:4的信息
(i)序列特征
(A)长度:212个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:4:
Met Val Ala Arg Asn Gln Val Ala Ala Asp Asn Ala Ile Ser Pro Ala
  1               5                  10                  15
Ala Glu Pro Arg Arg Arg Ser Glu Pro Ser Ser Ser Ser Ser Ser Ser
             20                  25                  30
Ser Pro Ala Ala Pro Val Arg Pro Arg Pro Cys Pro Ala Val Pro Ala
         35                  40                  45
Pro Ala Pro Gly Asp Thr His Phe Arg Thr Phe Arg Ser His Ser Asp
     50                  55                  60
Tyr Arg Arg Ile Thr Arg Thr Ser Ala Leu Leu Asp Ala Cys Gly Phe
 65                  70                  75                 80
Tyr Trp Gly Pro Leu Ser Val His Gly Ala His Glu Arg Leu Arg Ala
                 85                  90                  95
Glu Pro Val Gly Thr Phe Leu Val Arg Asp Ser Arg Gln Arg Asn Cys
            100                 105                 110
Phe Phe Ala Leu Ser Val Lys Met Ala Ser Gly Pro Thr Ser Ile Arg
        115                 120                 125
Val His Phe Gln Ala Gly Arg Phe His Leu Asp Gly Ser Arg Glu Thr
    130                 135                 140
Phe Asp Cys Leu Phe Glu Leu Leu Glu His Tyr Val Ala Ala Pro Arg
145                 150                 155                 160
Arg Met Leu Gly Ala Pro Leu Arg Gln Arg Arg Val Arg Pro Leu Gln
                165                 170                 175
Glu Leu Cys Arg Gln Arg Ile Val Ala Ala Val Gly Arg Glu Asn Leu
            180                 185                 190
Ala Arg Ile Pro Leu Asn Pro Val Leu Arg Asp Tyr Leu Ser Ser Phe
        195                 200                 205
Pro Phe Gln Ile
    210
(2)关于SEQ ID NO:5的信息
(i)序列特征
(A)长度:1121个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(ix)特征:
(A)名称/关键:CDS
(B)位置:223..819
(xi)序列描述:SEQ ID NO:5:
GCGATCTGTG GGTGACAGTG TCTGCGAGAG ACTTTGCCAC ACCATTCTGC CGGAATTTGG    60
AGAAAAAGAA CCAGCCGCTT CCAGTCCCCT CCCCCTCCGC CACCATTTCG GACACCCTGC    120
ACACTCTCGT TTTGGGGTAC CCTGTGACTT CCAGGCAGCA CGCGAGGTCC ACTGGCCCCA    180
GCTCGGGCGA CCAGCTGTCT GGGACGTGTT GACTCATCTC CC ATG ACC CTG CGG       234
                                               Met Thr Leu Arg
                                                 1
TGC CTG GAG CCC TCC GGG AAT GGA GCG GAC AGG ACG CGG AGC CAG TGG      282
Cys Leu Glu Pro Ser Gly Asn Gly Ala Asp Arg Thr Arg Ser Gln Trp
  5                  10                  15                  20
GGG ACC GCG GGG TTG CCG GAG GAA CAG TCC CCC GAG GCG GCG CGT CTG      330
Gly Thr Ala Gly Leu Pro Glu Glu Gln Ser Pro Glu Ala Ala Arg Leu
                 25                  30                  35
GCG AAA GCC CTG CGC GAG CTC AGT CAA ACA GGA TGG TAC TGG GGA AGT      378
Ala Lys Ala Leu Arg Glu Leu Ser Gln Thr Gly Trp Tyr Trp Gly Ser
             40                  45                  50
ATG ACT GTT AAT GAA GCC AAA GAG AAA TTA AAA GAG GCT CCA GAA GGA      426
Met Thr Val Asn Glu Ala Lys Glu Lys Leu Lys Glu Ala Pro Glu Gly
         55                  60                  65
ACT TTC TTG ATT AGA GAT AGT TCG CAT TCA GAC TAC CTA CTA ACT ATA      474
Thr Phe Leu Ile Arg Asp Ser Ser His Ser Asp Tyr Leu Leu Thr Ile
     70                  75                  80
TCC GTT AAG ACG TCA GCT GGA CCG ACT AAC CTG CGG ATT GAG TAC CAA      522
Ser Val Lys Thr Ser Ala Gly Pro Thr Asn Leu Arg Ile Glu Tyr Gln
 85                  90                  95                 100
GAT GGG AAA TTC AGA TTG GAT TCT ATC ATA TGT GTC AAG TCC AAG CTT      570
Asp Gly Lys Phe Arg Leu Asp Ser Ile Ile Cys Val Lys Ser Lys Leu
                105                 110                 115
AAA CAG TTT GAC AGT GTG GTT CAT CTG ATT GAC TAC TAT GTC CAG ATG      618
Lys Gln Phe Asp Ser Val Val His Leu Ile Asp Tyr Tyr Val Gln Met
            120                 125                 130
TGC AAG GAT AAA CGG ACA GGC CCA GAA GCC CCA CGG AAT GGG ACT GTT      666
Cys Lys Asp Lys Arg Thr Gly Pro Glu Ala Pro Arg Asn Gly Thr Val
        135                 140                 145
CAC CTG TAC CTG ACC AAA CCT CTG TAT ACA TCA GCA CCC ACT CTG CAG      714
His Leu Tyr Leu Thr Lys Pro Leu Tyr Thr Ser Ala Pro Thr Leu Gln
    150                 155                 160
CAT TTC TGT CGA CTC GCC ATT AAC AAA TGT ACC GGT ACG ATC TGG GGA      762
His Phe Cys Arg Leu Ala Ile Asn Lys Cys Thr Gly Thr Ile Trp Gly
165                 170                 175                 180
CTG CCT TTA CCA ACA AGA CTA AAA GAT TAC TTG GAA GAA TAT AAA TTC      810
Leu Pro Leu Pro Thr Arg Leu Lys Asp Tyr Leu Glu Glu Tyr Lys Phe
                185                 190                 195
CAG GTA TAAGTATTTC TCTCTCTTTT TCGTTTTTTT TTAAAAAAAA AAAAACACAT       866
Gln Val
GCCTCATATA GACTATCTCC GAATGCAGCT ATGTGAAAGA GAACCCAGAG GCCCTCCTCT    926
GGATAACTGC GCAGAATTCT CTCTTAAGGA CAGTTGGGCT CAGTCTAACT TAAAGGTGTG    986
AAGATGTAGC TAGGTATTTT AAAGTTCCCC TTAGGTAGTT TTAGCTGAAT GATGCTTTCT    1046
TTCCTATGGC TGCTCAAGAT CAAATGGCCC TTTTAAATGA AACAAAACAA AACAAAACAA    1106
AAAAAAAAAA AAAAA                                                     1121
(2)关于SEQ ID NO:6的信息
(A)长度:198个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:6:
Met Thr Leu Arg Cys Leu Glu Pro Ser Gly Asn Gly Ala Asp Arg Thr
  1               5                  10                  15
Arg Ser Gln Trp Gly Thr Ala Gly Leu Pro Glu Glu Gln Ser Pro Glu
             20                  25                  30
Ala Ala Arg Leu Ala Lys Ala Leu Arg Glu Leu Ser Gln Thr Gly Trp
         35                  40                  45
Tyr Trp Gly Ser Met Thr Val Asn Glu Ala Lys Glu Lys Leu Lys Glu
     50                  55                  60
Ala Pro Glu Gly Thr Phe Leu Ile Arg Asp Ser Ser His Ser Asp Tyr
65                  70                  75                  80
Leu Leu Thr Ile Ser Val Lys Thr Ser Ala Gly Pro Thr Asn Leu Arg
                 85                  90                  95
Ile Glu Tyr Gln Asp Gly Lys Phe Arg Leu Asp Ser Ile Ile Cys Val
            100                 105                 110
Lys Ser Lys Leu Lys Gln Phe Asp Ser Val Val His Leu Ile Asp Tyr
        115                 120                 125
Tyr Val Gln Met Cys Lys Asp Lys Arg Thr Gly Pro Glu Ala Pro Arg
    130                 135                 140
Asn Gly Thr Val His Leu Tyr Leu Thr Lys Pro Leu Tyr Thr Ser Ala
145                 150                 155                 160
Pro Thr Leu Gln His Phe Cys Arg Leu Ala Ile Asn Lys Cys Thr Gly
                165                 170                 175
Thr Ile Trp Gly Leu Pro Leu Pro Thr Arg Leu Lys Asp Tyr Leu Glu
            180                 185                 190
Glu Tyr Lys Phe Gln Val
        195
(2)关于SEQ ID NO:7的信息
(i)序列特征
(A)长度:2187个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(ix)特征:
(A)名称/关键:CDS
(B)位置:18..695
(xi)序列描述:SEQ ID NO:7:
CGCTGGCTCC GTGCGCC ATG GTC ACC CAC AGC AAG TTT CCC GCC GCC GGG     50
                   Met Val Thr His Ser Lys Phe Pro Ala Ala Gly
                     1               5                  10
ATG AGC CGC CCC CTG GAC ACC AGC CTG CGC CTC AAG ACC TTC AGC TCC    98
Met Ser Arg Pro Leu Asp Thr Ser Leu Arg Leu Lys Thr Phe Ser Ser
             15                  20                  25
AAA AGC GAG TAC CAG CTG GTG GTG AAC GCC GTG CGC AAG CTG CAG GAG    146
Lys Ser Glu Tyr Gln Leu Val Val Asn Ala Val Arg Lys Leu Gln Glu
         30                  35                  40
AGC GGA TTC TAC TGG AGC GCC GTG ACC GGC GGC GAG GCG AAC CTG CTG    194
Ser Gly Phe Tyr Trp Ser Ala Val Thr Gly Gly Glu Ala Asn Leu Leu
     45                  50                  55
CTC AGC GCC GAG CCC GCG GGC ACC TTT CTT ATC CGC GAC AGC TCG GAC    242
Leu Ser Ala Glu Pro Ala Gly Thr Phe Leu Ile Arg Asp Ser Ser Asp
 60                  65                  70                  75
CAG CGC CAC TTC TTC ACG TTG AGC GTC AAG ACC CAG TCG GGG ACC AAG      290
Gln Arg His Phe Phe Thr Leu Ser Val Lys Thr Gln Ser Gly Thr Lys
                 80                  85                  90
AAC CTA CGC ATC CAG TGT GAG GGG GGC AGC TTT TCG CTG CAG AGT GAC      338
Asn Leu Arg Ile Gln Cys Glu Gly Gly Ser Phe Ser Leu Gln Ser Asp
             95                 100                 105
CCC CGA AGC ACG CAG CCA GTT CCC CGC TTC GAC TGT GTA CTC AAG CTG      386
Pro Arg Ser Thr Gln Pro Val Pro Arg Phe Asp Cys Val Leu Lys Leu
        110                 115                 120
GTG CAC CAC TAC ATG CCG CCT CCA GGG ACC CCC TCC TTT TCT TTG CCA      434
Val His His Tyr Met Pro Pro Pro Gly Thr Pro Ser Phe Ser Leu Pro
    125                 130                 135
CCC ACG GAA CCC TCG TCC GAA GTT CCG GAG CAG CCA CCT GCC CAG GCA      482
Pro Thr Glu Pro Ser Ser Glu Val Pro Glu Gln Pro Pro Ala Gln Ala
140                 145                 150                 155
CTC CCC GGG AGT ACC CCC AAG AGA GCT TAC TAC ATC TAT TCT GGG GGC      530
Leu Pro Gly Ser Thr Pro Lys Arg Ala Tyr Tyr Ile Tyr Ser Gly Gly
                160                 165                 170
GAG AAG ATT CCG CTG GTA CTG AGC CGA CCT CTC TCC TCC AAC GTG GCC      578
Glu Lys Ile Pro Leu Val Leu Ser Arg Pro Leu Ser Ser Asn Val Ala
            175                 180                 185
ACC CTC CAG CAT CTT TGT CGG AAG ACT GTC AAC GGC CAC CTG GAC TCC      626
Thr Leu Gln His Leu Cys Arg Lys Thr Val AsnGly His  Leu Asp Ser
        190                 195                 200
TAT GAG AAA GTG ACC CAG CTG CCT GGA CCC ATT CGG GAG TTC CTG GAT      674
Tyr Glu Lys Val Thr Gln Leu Pro Gly Pro Ile Arg Glu Phe Leu Asp
    205                 210                 215
CAG TAT GAT GCT CCA CTT TAAGGAGCAA AAGGGTCAGA GGGGGGCCTG             722
Gln Tyr Asp Ala Pro Lau
220                 225
GGTCGGTCGG TCGCCTCTCC TCCGAGGCAC ATGGCACAAG CACAAAAATC CAGCCCCAAC    782
GGTCGGTAGC TCCCAGTGAG CCAGGGGCAG ATTGGCTTCT TCCTCAGGCC CTCCACTCCC    842
GCAGAGTAGA GCTGGCAGGA CCTGGAATTC GTCTGAGGGG AGGGGGAGCT GCCACCTGCT    902
TTCCCCCCTC CCCCAGCTCC AGCTTCTTTC AAGTGGAGCC AGCCGGCCTG GCCTGGTGGG    962
ACAATACCTT TGACAAGCGG ACTCTCCCCT CCCCTTCCTC CACACCCCCT CTGCTTCCCA    1022
AGGGAGGTGG GGACACCTCC AAGTGTTGAA CTTAGAACTG CAAGGGGAAT CTTCAAACTT    1082
TCCCGCTGGA ACTTGTTTGC GCTTTGATTT GGTTTGATCA AGAGCAGGCA CCTGGGGGAA    1142
GGATGGAAGA GAAAAGGGTG TGTGAAGGGT TTTTATGCTG GCCAAAGAAA TAACCACTCC    1202
CACTGCCCAA CCTAGGTGAG GAGTGGTGGC TCCTGGCTCT GGGGAGAGTG GCAAGGGGTG    1262
ACCTGAAGAG AGCTATACTG GTGCCAGGCT CCTCTCCATG GGGCAGCTAA TGAAACCTCG    1322
CAGATCCCTT GCACCCCAGA ACCCTCCCCG TTGTGAAGAG GCAGTAGCAT TTAGAAGGGA    1382
GACAGATGAG GCTGGTGAGC TGGCCGCCTT TTCCAACACC GAAGGGAGGC AGATCAACAG    1442
ATGAGCCATC TTGGAGCCCA GGTTTCCCCT GGAGCAGATG GAGGGTTCTG CTTTGTCTCT    1502
CCTATGTGGG GCTAGGAGAC TCGCCTTAAA TGCCCTCTGT CCCAGGGATG GGGATTGGCA    1562
CACAAGGAGC CAAACACAGC CAATAGGCAG AGAGTTGAGG GATTCACCCA GGTGGCTACA            1622
GGCCAGGGGA AGTGGCTGCA GGGGAGAGAC CCAGTCACTC CAGGAGACTC CTGAGTTAAC            1682
ACTGGGAAGA CATTGGCCAG TCCTAGTCAT CTCTCGGTCA GTAGGTCCGA GAGCTTCCAG            1742
GCCCTGCACA GCCCTCCTTT CTCACCTGGG GGGAGGCAGG AGGTGATGGA GAAGCCTTCC            1802
CATGCCGCTC ACAGGGGCCT CACGGGAATG CAGCAGCCAT GCAATTACCT GGAACTGGTC            1862
CTGTGTTGGG GAGAAACAAG TTTTCTGAAG TCAGGTATGG GGCTGGGTGG GGCAGCTGTG            1922
TGTTGGGGTG GCTTTTTTCT CTCTGTTTTG AATAATGTTT ACAATTTGCC TCAATCACTT            1982
TTATAAAAAT CCACCTCCAG CCCGCCCCTC TCCCCACTCA GGCCTTCGAG GCTGTCTGAA            2042
GATGCTTGAA AAACTCAACC AAATCCCAGT TCAACTCAGA CTTTGCACAT ATATTTATAT            2102
TTATACTCAG AAAAGAAACA TTTCAGTAAT TTATAATAAA AGAGCACTAT TTTTTAATGA            2162
AAAAAAAAAA AAAAAAAAAA AAAAA                                                  2187
(2)关于SEQ ID NO:8的信息
(i)序列特征
(A)长度:225个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:8:
Met Val Thr His Ser Lys Phe Pro Ala Ala Gly Met Ser Arg Pro Leu
  1               5                  10                  15
Asp Thr Ser Leu Arg Leu Lys Thr Phe Ser Ser Lys Ser Glu Tyr Gln
             20                  25                  30
Leu Val Val Asn Ala Val Arg Lys Leu Gln Glu Ser Gly Phe Tyr Trp
         35                  40                  45
Ser Ala Val Thr Gly Gly Glu Ala Asn Leu Leu Leu Ser Ala Glu Pro
     50                  55                  60
Ala Gly Thr Phe Leu Ile Arg Asp Ser Ser Asp Gln Arg His Phe Phe
 65                  70                  75                  80
Thr Leu Ser Val Lys Thr Gln Ser Gly Thr Lys Asn Leu Arg Ile Gln
                 85                  90                  95
Cys Glu Gly Gly Ser Phe Ser Leu Gln Ser Asp Pro Arg Ser Thr Gln
            100                 105                 110
Pro Val Pro Arg Phe Asp Cys Val Leu Lys Leu Val His His Tyr Met
        115                 120                 125
Pro Pro Pro Gly Thr Pro Ser Phe Ser Leu Pro Pro Thr Glu Pro Ser
    130                 135                 140
Ser Glu Val Pro Glu Gln Pro Pro Ala Gln Ala Leu Pro Gly Ser Thr
145                 150                 155                 160
Pro Lys Arg Ala Tyr Tyr Ile Tyr Ser Gly Gly Glu Lys Ile Pro Leu
                165                 170                 175
Val Leu Ser Arg Pro Leu Ser Ser Asn Val Ala Thr Leu Gln His Leu
            180                 185                 190
Cys Arg Lys Thr Val Asn Gly His Leu Asp Ser Tyr Glu Lys Val Thr
        195                 200                 205
Gln Leu Pro Gly Pro Ile Arg Glu Phe Leu Asp Gln Tyr Asp Ala Pro
    210                 215                 220
Leu
225
(2)关于SEQ ID NO:9的信息:
(i)序列特征
(A)长度:1094个碱基对
(B)类型:核酸
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:9:
CTCCGGCTGG CCCCTTCTGT AGGATGGTAG CACACAACCA GGTGGCAGCC GACAATGCAG    60
TCTCCACAGC AGCAGAGCCC CGACGGCGGC CAGAACCTTC CTCCTCTTCC TCCTCCTCGC    120
CCGCGGCCCC CGCGCGCCCG CGGCCGTGCC CCGCGGTCCC GGCCCCGGCC CCCGGCGACA    180
CGCACTTCCG CACATTCCGT TCGCACGCCG ATTACCGGCG CATCACGCGC GCCAGCGCGC    240
TCCTGGACGC CTGCGGATTC TACTGGGGGC CCCTGAGCGT GCACGGGGCG CACGAGCGGC    300
TGCGCGCCGA GCCCGTGGGC ACCTTCCTGG TGCGCGACAG CCGCCAGCGG AACTGCTTTT    360
TCGCCCTTAG CGTGAAGATG GCCTCGGGAC CCACGAGCAT CCGCGTGCAC TTTCAGGCCG    420
GCCGCTTTCA CCTGGATGGC AGCCGCGAGA GCTTCGACTG CCTCTTCGAG CTGCTGGAGC    480
ACTACGTGGC GGCGCCGCGC CGCATGCTGG GGGCCCCGCT GCGCCAGCGC CGCGTGCGGC    540
CGCTGCAGGA GCTGTGCCGC CAGCGCATCG TGGCCACCGT GGGCCGCGAG AACCTGGCTC    600
GCATCCCCCT CAACCCCGTC CTCCGCGACT ACCTGAGCTC CTTCCCCTTC CAGATTTGAC    660
CGGCAGCGCC CGCCGTGCAC GCAGCATTAA CTGGGATGCC GTGTTATTTT GTTATTACTT    720
GCCTGGAACC ATGTGGGTAC CCTCCCCGGC CTGGGTTGGA GGGAGCGGAT GGGTGTAGGG    780
GCGAGGCGCC TCCCGCCCTC GGCTGGAGAC GAGGCCGCAG ACCCCTTCTC ACCTCTTGAG    840
GGGGTCCTCC CCCTCCTGGT GCTCCCTCTG GGTCCCCCTG GTTGTTGTAG CAGCTTAACT    900
GTATCTGGAG CCAGGACCTG AACTCGCACC TCCTACCTCT TCATGTTTAC ATATACCCAG    960
TATCTTTGCA CAAACCAGGG GTTGGGGGAG GGTCTCTGGC TTTATTTTTC TGCTGTGCAG    1020
AATCCTATTT TATATTTTTT AAAGTCAGTT TAGGTAATAA ACTTTATTAT GAAAGTTTTT    1080
TTTTTTAAAA AAAA                                                      1094
(2)关于SEQ ID NO:10的信息:
(i)序列特征
(A)长度:211个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:10:
Met Val Ala His Asn Gln Val Ala Ala Asp Asn Ala Val Ser Thr Ala
1               5                   10                  15
Ala Glu Pro Arg Arg Arg Pro Glu Pro Ser Ser Ser Ser Ser Ser Ser
            20                  25                  30
Pro Ala Ala Pro Ala Arg Pro Arg Pro Cys Pro Ala Val Pro Ala Pro
        35                  40                  45
Ala Pro Gly Asp Thr His Phe Arg Thr Phe Arg Ser His Ala Asp Tyr
    50                  55                  60
Arg Arg Ile Thr Arg Ala Ser Ala Leu Leu Asp Ala Cys Gly Phe Tyr
65                  70                  75                  80
Trp Gly Pro Leu Ser Val His Gly Ala His Glu Arg Leu Arg Ala Glu
                85                  90                  95
Pro Val Gly Thr Phe Leu Val Arg Asp Ser Arg Gln Arg Asn Cys Phe
            100                 105                 110
Phe Ala Leu Ser Val Lys Met Ala Ser Gly Pro Thr Ser Ile Arg Val
        115                 120                 125
His Phe Gln Ala Gly Arg Phe His Leu Asp Gly Ser Arg Glu Ser Phe
    130                 135                 140
Asp Cys Leu Phe Glu Leu Leu Glu His Tyr Val Ala Ala Pro Arg Arg
145                 150                 155                 160
Met Leu Gly Ala Pro Leu Arg Gln Arg Arg Val Arg Pro Leu Gln Glu
                165                 170                 175
Leu Cys Arg Gln Arg Ile Val Ala Thr Val Gly Arg Glu Asn Leu Ala
            180                 185                 190
Arg Ile Pro Leu Asn Pro Val Leu Arg Asp Tyr Leu Ser Ser Phe Pro
        195                 200                 205
Phe Gln Ile
    210
(2)关于SEQ ID NO:11的信息:
(i)序列特征
(A)长度:2807个碱基对
(B)类型:核酸
(D)拓扑结构:线型
(ii))分子类型:DNA
(xi)序列描述:SEQ ID NO:11:
GGAAACCGAG GCGGGGAGAC CAGGAGGCCT TGGCCTCAGA GCTTCAGAGT CGCGTGGCAG    60
CAAACAGAGA AACCTGTAGA GGGCAGTGTG CGTCACTTAG CTCAGGGAAG CTGCACGCGA    120
AACTCACCCG CCTTCATTCA TAAACATCGT CAGCTAGGCA CCTACTCCTG GGCTTTCAGG    180
ACAAACGAA  TCACGAAACC ACAGTGTCCT TAAAATAGGT CTGACCGCCT GAATCCCTGG    240
CCAAGGTGTG TACGGGGCAT GGGAGCCCTT GTGCAGAGAT GCTTGCAGGA GCCTTGAGGG    300
GCTCTGTAAG ACAGAGGCTA GGAAGACAAA GTTGGGGGCT ACAGCTTCTT GTCCTGCCCG    360
GGGCCTCAGT TTCTTCGGTT GCCCACGTAG GAGTGCAGAG AGTCCAGCCC CTGGGGACCC    420
AACCCAACCC CGCCCAGTTT CCGAGGAACT CGTCCGGGAG CGGGGGCGCC CCTCCCGCAC    480
CGCCTTAGGC TTCCTTTGAA GCCTCTGCGG TCAGGCCACC GCTTCCTGGG AAGCCCAAGC    540
CAAGGCCAGG CCGAGTGGCC AACGGGAGGG GCCCGCGCGC GATTCTGGAG GAGGGCGGCG    600
GCCCCACAGG TCTCCAGGGC TGGCTAGCCG GGCTCCTAGA GCGGAGACTG CCAAGGCCTT    660
CGGGTCCTGG GGAGGAAGGA TCCTGGCAGG GAGGAGTTGC TTGGGGGGTG GGGGGGAAAG    720
GCTCCAGGCG CGGTGGAGCT CTGACCAGGA GAATGCACAC ACTCGGAGGG GAGGAGGCGT    780
GTCAGCCCCA AGCTAGCATC CCACCCGGGG AGCAGCGATG TGGGGCGAAG GTAGCCAGAG    840
CAAAAGAGCA GGCACCAGGT GACACGAAAC AGAAGATTCC GGGTAGAGCC AGAACCCCAG    900
AAGTCCCATT CAGGGAAGGT GCGAGGCGAG AACGAGTTAG GTGGACCCTC TCCAGGGGCA    960
GCCAAAGAAA TCTAAAGAGA ACCCGAAGGA CTTGCCGGAA AGAGAAACCG AAAGCGGCGG    1020
TGGGCGGGAT CGGTGGGCGG GGCCTCCCTG GTTTAAGAGC TTGATGCAGG GGCGGGCAGC    1080
AGCAGAGAGA ACTGCGGCCG TGGCAGCGGC ACGGCTCCCG GCCCCGGAGC ATGCGCGACA    1140
GCAGCCCCGG AACCCCCAGC CGCGGCGCCC CGCGTCCCGC CGCCAGGTGA GCCGAGGCAG    1200
CTGCGAAGGA GCAGGCGGGA GGGGATGGGA GGAAGGGGAG CAGAGCCTGG CAGGACTATC    1260
CTCGCAGACT GCATGGCGGG GTCGTGGATG CTATGCCTCT GGCGCCCGCC CCACCGGCTG    1320
GCCCAGGCGG CCCCTCGCGC GCGCGGGGCG CCGTCAGCCC CTCCTCTCCG GCCCTGAGCC    1380
CGGATCGTCC GCCCGGGTTC CAGTTCCCGG CGTGGCCAGT AGGCGGCAAC CGCGAGGCGG    1440
CAAGCCACCC AGCGGGGACG GCCTGGAGTC GGGCCCCTCT CCACGCCCCC TTCTCCACGC    1500
GCGCGGGGAG GCAGGGCTCC ACCGCCAGTC TGGAAGGGTT CCACATACAG GAACGGCCTA    1560
CTTCGCAGAT GAGCCCACCG AGGCTCAGGC TCCGGGCGGA TTCTGCGTGT CACCCTCGCT    1620
CCTTGGGGTC CGCTGGCCGG CCTGTGCCAC CCGGACGCCC GGTTCACTGC CTCTGTCTCC    1680
CCCATCAGCG CAGCCCCGGA CGCTATGGCC CACCCCTCCA GCTGGCCCCT CGAGTAGGAT    1740
GGTAGCACGT AACCAGGTGG AAGCCGACAA TGCGATCTCC CCGGCATCAG AGCCCCGACG    1800
GCGGCCAGAG CCATCCTCGT CCTCGTCTTC GTCCTCGCCG GCGGCCCCGG CGCGTCCCCG    1860
GCCCTGCCCG GTGGTCCCGG CCCCGGCTCC GGGCGACACT CACTTCCGCA CCTTCCGCTC    1920
CCACTCTGAT TACCGGCGCA TCACGCGGAC CAGCGCTCTC CTGGACGCCT GCGGCTTCTA    1980
CTGGGGACCC CTGAGCGTGC ATGGGGCGCA CGAACGGCTG CGTTCCGAAC CCGTGGGCAC    2040
CTTCTTGGTG CGCGACAGTC GCCAGCGGAA CTGCTTCTTC GCGCTCAGCG TGAAGATGGC    2100
TTCGGGCCCC ACGAGCATTC GTGTGCACTT CCAGGCCGGC CGCTTCCACC TGGACGGCAA    2160
CCGCGAGACC TTCGACTGCC TCTTCGAGCT GCTGGAGCAC TACGTGGCGG CGCCGCGCCG    2220
CATGTTGGGG GCCCCACTGC GCCAGCGCCG CGTGCGGCCG CTGCAGGAGC TGTGTCGCCA    2280
GCGCATCGTG GCCGCCGTGG GTCGCGAGAA CCTGGCACGC ATCCCTCTTA ACCCGGTACT    2340
CCGTGACTAC CTGAGTTCCT TCCCCTTCCA GATCTGACCG GCTGCCGCCG TGCCCGCAGA    2400
ATTAAGTGGG AGCGCCTTAT TATTTCTTAT TATTAATTAT TATTATTTTT CTGGAACCAC    2460
GTGGGAGCCC TCCCCGCCTA GGTCGGAGGG AGTGGGTGTG GAGGGTGAGA TCCCTCCCAC    2520
TTCTGGCTGG AGACCTTATC CCGCCTCTCG GGGGGCCTCC CCTCCTGGTG CTCCCTCCCG    2580
GTCCCCCTGG TTGTAGCAGC TTGTGTCTGG GGCCAGGACC TGAACTCCAC GCCTACCTCT    2640
CCATGTTTAC ATGTTCCCAG TATCTTTGCA CAAACCAGGG GTGGGGGAGG GTCTCTGGCT    2700
TCATTTTTCT GCTGTGCAGA ATATTCTATT TTATATTTTT ACATCCAGTT TAGATAATAA    2760
ACTTTATTAT GAAAGTTTTT TTTTTTAAAG AAACAAAGAT TTCTAGA                  2807
(2)关于SEQ ID NO:12的信息
(i)序列特征
(A)长度:212个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:12:
Met Val Ala Arg Asn Gln Val Glu Ala Asp Asn Ala Ile Ser Pro Ala
1               5                   10                  15
Ser Glu Pro Arg Arg Arg Pro Glu Pro Ser Ser Ser Ser Ser Ser Ser
            20                  25                  30
Ser Pro Ala Ala Pro Ala Arg Pro Arg Pro Cys Pro Val Val Pro Ala
        35                  40                  45
Pro Ala Pro Gly Asp Thr His Phe Arg Thr Phe Arg Ser His Ser Asp
    50                  55                  60
Tyr Arg Arg Ile Thr Arg Thr Ser Ala Leu Leu Asp Ala Cys Gly Phe
65                  70                  75                  80
Tyr Trp Gly Pro Leu Ser Val His Gly Ala His Glu Arg Leu Arg Ser
                85                  90                  95
Glu Pro Val Gly Thr Phe Leu Val Arg Asp Ser Arg Gln Arg Ash Cys
            100                 105                 110
Phe Phe Ala Leu Ser Val Lys Met Ala Ser Gly Pro Thr Ser Ile Arg
        115                 120                 125
Val His Phe Gln Ala Gly Arg Phe His Leu Asp Gly Asn Arg Glu Thr
    130                 135                 140
Phe Asp Cys Leu Phe Glu Leu Leu Glu His Tyr Val Ala Ala Pro Arg
145                 150                 155                 160
Arg Met Leu Gly Ala Pro Leu Arg Gln Arg Arg Val Arg Pro Leu Gln
                165                 170                 175
Glu Leu Cys Arg Gln Arg Ile Val Ala Ala Val Gly Arg Glu Asn Leu
            180                 185                 190
Ala Arg Ile Pro Leu Asn Pro Val Leu Arg Asp Tyr Leu Ser Ser Phe
        195                 200                 205
Pro Phe Gln Ile
    210
(2)关于SEQ ID NO:13的信息
(i)序列特征
(A)长度:1611个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(ix)特征:
(A)名称/关键:CDS
(B)位置:263..1529
(xi)序列描述:SEQ ID NO:13:
CGAATTCCGG GCGGGCTGTG TGAGTCTGTG AGTGGAAGGC GCGCCGGCTC TTTTGTCTGA       60
GTGTGACCCG GTGGCTTTGT TCCAGGCATT CCGGTGATTT CCTCCGGGCA GTCCGCAGAA       120
GCCGCAGCGG CCGCCCGCGC TCTCTCTGCA GTCTCCACAC CCGGGAGAGC CTGAGCCCGC       180
GTCACGCCCC TCAGCCCCCG CTGAGTCCCT TCTCTGTTGT CGCGTCCGAA TCGAGTTCCC       240
GGAATCAGAC GGTGCCCCAT AG ATG GCC AGC TTT CCC CCG AGG GTT AAC GAG        292
                         Met Ala Ser Phe Pro Pro Arg Val Asn Glu
                           1               5                  10
AAA GAG ATC GTG AGA TCA CGT ACT ATA GGG GAA CTC TTG GCT CCA GCA         340
Lys Glu Ile Val Arg Ser Arg Thr Ile Gly Glu Leu Leu Ala Pro Ala
                 15                  20                  25
GCT CCT TTT GAC AAG AAA TGT GGT GGT GAG AAC TGG ACG GTT GCT TTT         388
Ala Pro Phe Asp Lys Lys Cys Gly Gly Glu Asn Trp Thr Val Ala Phe
             30                  35                  40
GCT CCT GAT GGT TCC TAC TTT GCG TGG TCA CAA GGA TAT CGC ATA GTG         436
Ala Pro Asp Gly Ser Tyr Phe Ala Trp Ser Gln Gly Tyr Arg Ile Val
         45                  50                  55
AAG CTT GTC CCG TGG TCC CAG TGC CGT AAG AAC TTT CTT TTG CAT GGT         484
Lys Leu Val Pro Trp Ser Gln Cys Arg Lys Asn Phe Leu Leu His Gly
     60                  65                  70
TCC AAA AAT GTT ACC AAT TCA AGC TGT CTA AAA TTG GCA AGA CAA AAC         532
Ser Lys Asn Val Thr Asn Ser Ser Cys Leu Lys Leu Ala Arg Gln Asn
 75                  80                  85                  90
AGT AAT GGT GGT CAG AAA AAC AAG CCT CCT GAG CAC GTT ATA GAC TGT         580
Ser Asn Gly Gly Gln Lys Asn Lys Pro Pro Glu His Val Ile Asp Cys
                 95                 100                 105
GGA GAC ATA GTC TGG AGT CTT GCT TTT GGG TCT TCA GTT CCA GAA AAA         628
Gly Asp Ile Val Trp Ser Leu Ala Phe Gly Ser Ser Val Pro Glu Lys
            110                 115                 120
CAG AGT CGT TGC GTT AAT ATA GAA TGG CAT CGG TTC CGA TTT GGA CAG         676
Gln Ser Arg Cys Val Asn Ile Glu Trp His Arg Phe Arg Phe Gly Gln
        125                 130                 135
GAT CAG CTA CTC CTT GCC ACA GGA TTA AAC AAT GGT CGC ATC AAA ATC     724
Asp Gln Leu Leu Leu Ala Thr Gly Leu Asn Asn Gly Arg Ile Lys Ile
    140                 145                 150
TGG GAT GTA TAT ACA GGA AAA CTC CTC CTT AAT TTG GTA GAC CAC ATT     772
Trp Asp Val Tyr Thr Giy Lys Leu Leu Leu Asn Leu Val Asp His Ile
155                 160                 165                 170
GAA ATG GTT AGA GAT TTA ACT TTT GCT CCA GAT GGG AGC TTA CTC CTT     820
Glu Met Val Arg Asp Leu Thr Phe Ala Pro Asp Gly Ser Leu Leu Leu
                175                 180                 185
GTA TCA GCT TCA AGA GAC AAA ACT CTA AGA GTG TGG GAC CTG AAA GAT     868
Val Ser Ala Ser Arg Asp Lys Thr Leu Arg Val Trp Asp Leu Lys Asp
            190                 195                 200
GAT GGA AAC ATG GTG AAA GTA TTG CGG GCA CAT CAG AAT TGG GTG TAC     916
Asp Gly Asn Met Val Lys Val Leu Arg Ala His Gln Asn Trp Val Tyr
        205                 210                 215
AGT TGT GCA TTC TCT CCC GAC TGT TCT ATG CTG TGT TCA GTG GGC GCC     964
Ser Cys Ala Phe Ser Pro Asp Cys Ser Met Leu Cys Ser Val Gly Ala
    220                 225                 230
AGT AAA GCA GTT TTC CTT TGG AAT ATG GAT AAA TAC ACC ATG ATT AGG    1012
Ser Lys Ala Val Phe Leu Trp Asn Met Asp Lys Tyr Thr Met Ile Arg
235                 240                 245                 250
AAG CTG GAA GGT CAT CAC CAT GAT GTT GTA GCT TGT GAC TTT TCT CCT    1060
Lys Leu Glu Gly His His His Asp Val Val Ala Cys Asp Phe Ser Pro
                255                 260                 265
GAT GGA GCA TTG CTA GCT ACT GCA TCC TAT GAC ACT CGT GTG TAT GTC    1108
Asp Gly Ala Leu Leu Ala Thr Ala Ser Tyr Asp Thr Arg Val Tyr Val
            270                 275                 280
TGG GAT CCA CAC AAT GGA GAC CTT CTG ATG GAG TTT GGG CAC CTG TTT    1156
Trp Asp Pro His Asn Gly Asp Leu Leu Met Glu Phe Gly His Leu Phe
        285                 290                 295
CCC TCG CCC ACT CCA ATA TTT GCT GGA GGA GCA AAT GAC CGA TGG GTG    1204
Pro Ser Pro Thr Pro Ile Phe Ala Gly Gly Ala Asn Asp Arg Trp Val
    300                 305                 310
AGA GCT GTG TCT TTC AGT CAT GAT GGA CTG CAT GTT GCC AGC CTT GCT    1252
Arg Ala Val Ser Phe Ser His Asp Gly Leu His Val Ala Ser Leu Ala
315                 320                 325                 330
GAT GAT AAA ATG GTG AGG TTC TGG AGA ATC GAT GAG GAT TGT CCG GTA    1300
Asp Asp Lys Met Val Arg Phe Trp Arg Ile Asp Glu Asp Cys Pro Val
                335                 340                 345
CAA GTT GCA CCT TTG AGC AAT GGT CTT TGC TGT GCC TTT TCT ACT GAT    1348
Gln Val Ala Pro Leu Ser Asn Gly Leu Cys Cys Ala Phe Ser Thr Asp
            350                 355                 360
GGC AGT GTT TTA GCT GCT GGG ACA CAT GAT GGA AGT GTG TAT TTT TGG    1396
Gly Ser Val Leu Ala Ala Gly Thr His Asp Gly Ser Val Tyr Phe Trp
        365                 370                 375
GCC ACT CCA AGG CAA GTC CCT AGC CTT CAA CAT ATA TGT CGC ATG TCA    1444
Ala Thr Pro Arg Gln Val Pro Ser Leu Gln His Ile Cys Arg Met Ser
    380                 385                 390
ATC CGA AGA GTG ATG TCC ACC CAA GAA GTC CAA AAA CTG CCT GTT CCT    1492
Ile Arg Arg Val Met Ser Thr Gln Glu Val Gln Lys Leu Pro Val Pro
395                 400                 405                 410
TCC AAA ATA TTG GCG TTT CTC TCC TAC CGC GGT TAG A CTGAAGACTG       1539
Ser Lys Ile Leu Ala Phe Leu Ser Tyr Arg Gly  *
                415                 420
CCTTTCCTGG TAGGCCTGCC AGACAGAGCG CCCTTTACAA GACACACCTC AAGCTTTACC  1599
TCGTGCCGAA TT                                                      1611
(2)关于SEQ ID NO:14的信息
(i)序列特征
(A)长度:422个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:14:
Met Ala Ser Phe Pro Pro Arg Val Asn G1u Lys GluIle Val Arg  Ser
  1               5                  10                 15
Arg Thr Ile Gly Glu Leu Leu Ala Pro Ala Ala Pro Phe Asp Lys Lys
             20                  25                  30
Cys Gly Gly Glu Asn Trp Thr Val Ala Phe Ala Pro Asp Gly Ser Tyr
         35                  40                  45
Phe Ala Trp Ser Gln Gly Tyr Arg Ile Val Lys Leu Val Pro Trp Ser
     50                  55                  60
Gln Cys Arg Lys Asn Phe Leu Leu His Gly Ser Lys Asn Val Thr Asn
 65                  70                  75                  80
Ser Ser Cys Leu Lys Leu Ala Arg Gln Asn Ser Asn Gly Gly Gln Lys
                 85                  90                  95
Asn Lys Pro Pro Glu His Val Ile Asp Cys Gly Asp Ile Val Trp Ser
            100                 105                 110
Leu Ala Phe Gly Ser Ser Val Pro Glu Lys Gln Ser Arg Cys Val Asn
        115                 120                 125
Ile Glu Trp His Arg Phe Arg Phe Gly Gln Asp Gln Leu Leu Leu Ala
    130                 135                 140
Thr Gly Leu Asn Asn Gly Arg Ile Lys Ile Trp Asp Val Tyr Thr Gly
145                 150                 155                 160
Lys Leu Leu Leu Asn Leu Val Asp His Ile Glu Met Val Arg Asp Leu
                165                 170                 175
Thr Phe Ala Pro Asp Gly Ser Leu Leu Leu Val Ser Ala Ser Arg Asp
            180                 185                 190
Lys Thr Leu Arg Val Trp Asp Leu Lys Asp Asp Gly Asn Met Val Lys
        195                 200                 205
Val Leu Arg Ala His Gln Asn Trp Val Tyr Ser Cys Ala Phe Ser pro
    210                 215                 220
Asp Cys Ser Met Leu Cys Ser Val Gly Ala Ser Lys Ala Val Phe Leu
225                 230                 235                 240
Trp Asn Met Asp Lys Tyr Thr Met Ile Arg Lys Leu Glu Gly His His
                245                 250                 255
His Asp Val Val Ala Cys Asp Phe Ser Pro Asp Gly Ala Leu Leu Ala
            260                 265                 270
Thr Ala Ser Tyr Asp Thr Arg Val Tyr Val Trp Asp Pro His Asn Gly
        275                 280                 285
Asp Leu Leu Met Glu Phe Gly His Leu Phe Pro Ser Pro Thr Pro Ile
    290                 295                 300
Phe Ala Gly Gly Ala Asn Asp Arg Trp Val Arg Ala Val Ser Phe Ser
305                 310                 315                 320
His Asp Gly Leu His Val Ala Ser Leu Ala Asp Asp Lys Met Val Arg
                325                 330                 335
Phe Trp Arg Ile Asp Glu Asp Cys Pro Val Gln Val Ala Pro Leu Ser
            340                 345                 350
Asn Gly Leu Cys Cys Ala Phe Ser Thr Asp Gly Ser Val Leu Ala Ala
        355                 360                 365
Gly Thr His Asp Gly Ser Val Tyr Phe Trp Ala Thr Pro Arg Gln Val
    370                 375                 380
Pro Ser Leu Gln His Ile Cys Arg Met Ser Ile Arg Arg Val Met Ser
385                 390                 395                 400
Thr Gln Glu Val Gln Lys Leu Pro Val Pro Ser Lys Ile Leu Ala Phe
                405                 410                 415
Leu Ser Tyr Arg Gly   *
            420
(2)关于SEQ ID NO:15的信息:
(i)序列特征
(A)长度:783个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:15:
CTGTCTTCCT CCGCAGCGCG AGGCTGGGTA CAGGGTCTAT TGTCTGTGGT TGACTCCGTA    60
CTTTGGTCTG AGGCCTTCGG GAGCTTTCCC GAGGCAGTTA GCAGAAGCCG CAGCGACCGC    120
CCCCGCCCGT CTCCTCTGTC CCTGGGCCCG GGAGACAAAC TTGGCGTCAC GCCCTCAGCG    180
GTCGCCACTC TCTTCTCTGT TGTTGGGTCC GCATCGTATT CCCGGAATCA GACGGTGCCC    240
CATAGATGGC CAGCTTTCCC CCGAGGGTCA ACGAGAAAGA GATCGTGAGA TCACGTACTA    300
TAGGTGAACT TTTAGCTCCT GCAGCTCCTT TTGACAAGAA ATGTGGTCGT GAAAATTGGA    360
CTGTTGCTTT TGCTCCAGAT GGTTCATACT TTGCTTGGTC ACAAGGACAT CGCACAGTAA    420
AGCTTGTTCC GTGGTCCCAG TGCCTTCAGA ACTTTCTCTT GCATGGCACC AAGAATGTTA    480
CCAATTCAAG CAGTTTAAGA TTGCCAAGAC AAAATAGTGA TGGTGGTCAG AAAAATAAGC    540
CTCGTGACAT ATTATAGACT GTGGAGATAT AGTCTGGAGT CTTGCTTTTG GGTCATCAGT    600
TCCAGAAAAA CAGAGTCGCT GTGTAAATAT AGAATGGCAT CGCTTCAGAT TTGGACAAGA    660
TCAGCTACTT CTTGCTACAG GGTTGAACAA TGGGCGTATC AAAATATGGG ATGTATATCA    720
GGAAACTCCT CCTTAACTTG GTAGATCATA CTGAAGTGGT CAGAGATTTA ACTTTTGCTC    780
CAG                                                                  783
(2)关于SEQ ID NO:16的信息
(i)序列特征
(A)长度:1122个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:16:
CTCTGTATGT CTGAATGAAG CTATAACATT TGCCTTTTTA TTGCAGGTTT TCCTTTGGAA    60
TATGGATAAA TACACCATGA TACGGAAACT AGAAGGACAT CACCATGATG TGGTAGCTTG    120
TGACTTTTCT CCTGATGGAG CATTACTGGC TACTGCATCT TATGATACTC GAGTATATAT    180
CTGGGATCCA CATAATGGAG ACATTCTGAT GGAATTTGGG CACCTGTTTC CCCCACCTAC    240
TCCAATATTT GCTGGAGGAG CAAATGACCG GTGGGTACGA TCTGTATCTT TTAGCCATGA    300
TGGACTGCAT GTTGCAAGCC TTGCTGATGA TAAAATGGTG AGGTTCTGGA GAATTGATGA    360
GGATTATCCA GTGCAAGTTG CACCTTTGAG CAATGGTCTT TGCTGTGCCT TCTCTACTGA    420
TGGCAGTGTT TTAGCTGCTG GGACACATGA CGGAAGTGTG TATTTTTGGG CCACTCCACG    480
GCAGGTCCCT AGCCTGCAAC ATTTATGTCG CATGTCAATC CGAAGAGTGA TGCCCACCCA    540
AGAAGTTCAG GAGCTGCCGA TTCCTTCCAA GCTTTTGGAG TTTCTCTCGT ATCGTATTTA    600
GAAGATTCTG CCTTCCCTAG TAGTAGGGAC TGACAGAATA CACTTAACAC AAACCTCAAG    660
CTTTACTGAC TTCAATTATC TGTTTTTAAA GACGTAGAAG ATTTATTTAA TTTGATATGT    720
TCTTGTACTG CATTTTGATC AGTTGAGCTT TTAAAATATT ATTTATAGAC AATAGAAGTA    780
TTTCTGAACA TATCAAATAT AAATTTTTTT AAAGATCTAA CTGTGAAAAC ATACATACCT    840
GTACATATTT AGATATAAGC TGCTATATGT TGAATGGACC CTTTTGCTTT TCTGATTTTT    900
AGTTCTGACA TGTATATATT GCTTCAGTAG AGCCACAATA TGTATCTTTG CTGTAAAGTG    960
CAAGGAAATT TTAAATTCTG GGACACTGAG TTAGATGGTA AATACTGACT TACGAAAGTT    1020
GAATTGGGTG AGGCGGGCAA ATCACCTGAG GTCAGCAGTT TGAGACTAGC CTGGCAAACA    1080
TGATGAAACC CTGTCTCTAC TAAAAATACA AAAAAAAAAA AA                       1122
(2)关于SEQ ID NO:17的信息
(i)序列特征
(A)长度:2537个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(ix)特征:
(A)名称/关键:CDS
(B)位置:422..2029
(xi)序列描述:SEQ ID NO:17:
CGGCACGAGC CGGGCTCCGT CCGGAGGAAG CGAGGCTGCG CCGCCGGCCC GGCAGGAGCG    60
GAGGACGGGA GCGCGGGCGG TCGCGCTCGC CCTGTCGCTG ACTGCGCTGC CCCGGCCCAT    120
CCTTGCCTGG CCGCAGGTGC CCTGGATGAG GCCGCCGCGC GTGTCCCGGC CGCTGAGTGT    180
CCCCCGCGGT CGCCCGGCGC CTGCCCTCAA GCGGCCGCCT CTCCTTGCCC GGGTCCCCGT    240
TTTCCCCCGG CGCAGTCCTC CTCCGGTGGG CGCCTCCGCA CCTCGGCGCA GGCGGCACGG    300
CCCTCGGGCC GGGATGGATC CGCCGGGAAG AGGAAGACAA GCCGGGGCGT TGAGCCCCTG    360
CGCACGGTGC CGCCGCGCGT AGTGGGAGCT TACTCGCAGT AGGCTCTCGC TCTTCTAATC    420
A ATG GAT AAA GTG GGG AAA ATG TGG AAC AAC TTA AAA TAC AGA TGC        466
  Met Asp Lys Val Gly Lys Met Trp Asn Asn Leu Lys Tyr Arg Cys
    1               5                  10                  15
CAG AAT CTC TTC AGC CAC GAG GGA GGA AGC CGT AAT GAG AAC GTG GAG      514
Gln Asn Leu Phe Ser His Glu Gly Gly Ser Arg Asn Glu Asn Val Glu
                 20                  25                  30
ATG AAC CCC AAC AGA TGT CCG TCT GTC AAA GAG AAA AGC ATC AGT CTG      562
Met Asn Pro Asn Arg Cys Pro Ser Val Lys Glu Lys Ser Ile Ser Leu
             35                  40                  45
GGA GAG GCA GCT CCC CAG CAA GAG AGC AGT CCC TTA AGA GAA AAT GTT      610
Gly Glu Ala Ala Pro Gln Gln Glu Ser Ser Pro Leu Arg Glu Asn Val
         50                  55                  60
GCC TTA CAG CTG GGA CTG AGC CCT TCC AAG ACC TTT TCC AGG CGG AAC      658
Ala Leu Gln Leu Gly Leu Ser Pro Ser Lys Thr Phe Ser Arg Arg Asn
     65                  70                  75
CAA AAC TGT GCC GCA GAG ATC CCT CAA GTG GTT GAA ATC AGC ATC GAG      706
Gln Asn Cys Ala Ala Glu Ile Pro Gln Val Val Glu Ile Ser Ile Glu
80                  85                  90                  95
AAA GAC AGT GAC TCG GGT GCC ACC CCA GGA ACG AGG CTT GCA CGG AGA   754
Lys Asp Ser Asp Ser Gly Ala Thr Pro Gly Thr Arg Leu Ala Arg Arg
                100                 105                 110
GAC TCC TAC TCG CGG CAC GCC CCG TGG GGA GGA AAG AAG AAA CAT TCC   802
Asp Ser Tyr Ser Arg His Ala Pro Trp Gly Gly LysLys Lys His Ser
            115                 120                 125
TGT TCC ACA AAG ACC CAG AGT TCA TTG GAT ACC GAG AAA AAG TTT GGT   850
Cys Ser Thr Lys Thr Gln Ser Ser Leu Asp Thr Glu Lys Lys Phe Gly
        130                 135                 140
AGA ACT CGA AGC GGC CTT CAG AGG CGA GAG CGG CGC TAT GGA GTC AGC   898
Arg Thr Arg Ser Gly Leu Gln Arg Arg Glu Arg Arg Tyr Gly Val Ser
    145                 150                 155
TCC ATG CAG GAC ATG GAC AGC GTT TCT AGC CGC GCG GTC GGG AGC CGC   946
Ser Met Gln Asp Met Asp Ser Val Ser Ser Arg Ala Val Gly Ser Arg
160                 165                 170                 175
TCC CTG AGG CAG AGG CTC CAG GAC ACG GTG GGT TTG TGT TTT CCC ATG   994
Ser Leu Arg Gln Arg Leu Gln Asp Thr Val Gly Leu Cys Phe Pro Met
                180                 185                 190
AGA ACT TAC AGC AAG CAG TCA AAG CCA CTC TTT TCC AAT AAA AGA AAA   1042
Arg Thr Tyr Ser Lys Gln Ser Lys Pro Leu Phe Ser Asn Lys Arg Lys
            195                 200                 205
ATA CAT CTT TCT GAA TTA ATG CTG GAG AAA TGC CCT TTT CCT GCT GGC   1090
Ile His Leu Ser Glu Leu Met Leu Glu Lys Cys Pro Phe Pro Ala Gly
        210                 215                 220
TCG GAT TTA GCA CAA AAG TGG CAT TTG ATT AAA CAG CAT ACC GCC CCT   1138
Ser Asp Leu Ala Gln Lys Trp His Leu Ile Lys Gln His Thr Ala Pro
    225                 230                 235
GTG AGC CCA CAC TCA ACA TTT TTT GAT ACA TTT GAT CCA TCA CTG GTG   1186
Val Ser Pro His Ser Thr Phe Phe Asp Thr Phe Asp Pro Ser Leu Val
240                 245                 250                 255
TCT ACA GAA GAT GAA GAA GAT AGG CTT CGC GAG AGA AGA CGG CTT AGT   1234
Ser Thr Glu Asp Glu Glu Asp Arg Leu Arg Glu Arg Arg Arg Leu Ser
                260                 265                 270
ATC GAA GAA GGG GTG GAT CCC CCT CCC AAC GCA CAA ATA CAC ACC TTT   1282
Ile Glu Glu Gly Val Asp Pro Pro Pro Asn Ala Gln Ile His Thr Phe
            275                 280                 285
GAA GCT ACT GCA CAG GTC AAC CCA TTG TAT AAG CTG GGA CCA AAG TTA   1330
Glu Ala Thr Ala Gln Val Asn Pro Leu Tyr Lys Leu Gly Pro Lys Leu
        290                 295                 300
GCT CCT GGG ATG ACA GAG ATA AGT GGA GAT GGT TCT GCA ATT CCA CAA    1378
Ala Pro Gly Met Thr Glu Ile Ser Gly Asp Gly Ser Ala Ile Pro Gln
    305                 310                 315
GCA ATT GTG ACT CAG AAG AGG ATT CAA CCA CCC TAT GTC TGC AGT CAC    1426
Ala Ile Val Thr Gln Lys Arg Ile Gln Pro Pro Tyr Val Cys Ser His
320                 325                 330                 335
GGA GGC AGA AGC AGC GCC AGG TGT CCG GGG ACA GCC ACG CGC ACG TTA    1474
Gly Gly Arg Ser Ser Ala Arg Cys Pro Gly Thr Ala Thr Arg Thr Leu
                340                 345                 350
GCA GAC AGG GAG CTT GGA AAG TTC ATA CGC AGA TCG ATT ACA TAC ACT    1522
Ala Asp Arg Glu Leu Gly Lys Phe Ile Arg Arg Ser Ile Thr Tyr Thr
            355                 360                 365
GCC TCG TGC CAG ATT TGC TTC AGA TCA CAG GGA ATC CCT GTT ACT GGG    1570
Ala Ser Cys Gln Ile Cys Phe Arg Ser Gln Gly Ile Pro Val Thr Gly
        370                 375                 380
GCG TGA TGG ACC GAT ACG AGG CCG AAG CCC TTC TAG AAG GGA AAC CGG    1618
Ala  * Trp Thr Asp Thr Arg Pro Lys Pro Phe  * Lys Gly Asn Arg
    385                 390                 395
AAG GCA CGT TCT TGC TCA GGG ACT CTG CAC AGG AGG ACT ACC TCT TCT    1666
Lys Ala Arg Ser Cys Ser Gly Thr Leu His Arg Arg Thr Thr Ser Ser
400                 405                 410                 415
CTG TGA GCT TCC GCC GCT ACA ACA GGT CTC TGC ACG CCC GGA TCG AGC    1714
Leu  * Ala Ser Ala Ala Thr Thr Gly Leu Cys Thr Pro Gly Ser Ser
                420                 425                 430
AGT GGA ACC ACA ACT TCA GCT TCG ATG CCC ATG ACC CCT GCG TGT TTC    1762
Ser Gly Thr Thr Thr Ser Ala Ser Met Pro Met Thr Pro Ala Cys Phe
            435                 440                 445
ACT CCT CCA CGT CAC GGG GCT TCT CGA ACA CTA TAA AGA CCC CAG CTC    1810
Thr Pro Pro Arg His Gly Ala Ser Arg Thr Leu  * Arg Pro Gln Leu
        450                 455                 460
TTG CAT GTT TTT TGA ACC GTT GCT AAC GAT ATC ACT GAA TAG AAC TTT    1858
Leu His Val Phe  * Thr Val Ala Asn Asp Ile Thr Glu  * Asn Phe
        465             470                 475
CCC TTT CAG CCT GCA GTA TAT CTG CCG CGC AGT GAT CTG CAG ATG CAC    1906
Pro Phe Gln Pro Ala Val Tyr Leu Pro Arg Ser Asp Leu Gln Met His
480                 485                 490                 495
TAC GTA TGA TGG GAT TGA CGG GCT CCC GCT ACC GTC GAT GTT ACA GGA    1954
Tyr Val  * Trp Asp  * Arg Ala pro Ala Thr Val Asp Val Thr Gly
                500                 505                 510
TTT TTT AAA AGA GTA TCA TTA TAA ACA AAA AGT TAG GGT TCG CTG GTT    2002
Phe Phe Lys Arg Val Ser Leu  * Thr Lys Ser  * Gly Ser Leu Val
            515                 520                 525
AGA ACG AGA CCA GTC AAA GCA AAG TAACTCCTGT CCCCAAAGGG CACTAACTAA   2056
Arg Thr Arg Pro Val Lys Ala Lys
       530                 535
GTCTGCTCCT CCCGTGCATC GAACTGCACC CATAGGAGGC AGTCAGCTGC TAGGATTTCC   2116
CACCCAGAAT GGGAGCTTAG TCATTAGCCT CTGCCCTATG GGGTCCGCTG TTCCTCAGAC   2176
AAAGGTGCCT AGGGACAGCA AGATGGCTTG CAGGTGTTCG GTGGGCTGTG ACAACTGAGG   2236
GAGGCAACTC TGGGGCATTT GCTATGAAGA ATTCTATTTC TTACCGAAGA ACAAATTATT   2296
AATATTGGAT GGGTATTTCA ATAGTGTGAC TAATGTTTGA AATTATTTTT TCTAAGAATT   2356
TTTCTATAAC CTTCAGAAAA AGTAGTGATG TTTGTAGTTA CTATAAATCA AGCTTTGAAA   2416
GTTCAAAACA AACAAGTTAA ATAAAAGACT ACCTTCCTTT TAGAGAAAAC AAATGCAAGT   2476
TTTCCCAGCC ACAGGCATTG TGCACTGTTA ATGTTGCTTG TTATCAGCTC CTTTCTCCTC   2536
 C                                                                  2537
(2)关于SEQ ID NO:18的信息:
(i)序列特征
(A)长度:535个碱基对
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:18:
Met Asp Lys Val Gly Lys Met Trp Asn Asn Leu Lys Tyr Arg Cys Gln
  1               5                  10                  15
Asn Leu Phe Ser His Glu Gly Gly Ser Arg Asn Glu Asn Val Glu Met
             20                  25                  30
Asn Pro Asn Arg Cys Pro Ser Val Lys Glu Lys Ser Ile Ser Leu Gly
         35                  40                  45
Glu Ala Ala Pro Gln Gln Glu Ser Ser Pro Leu Arg Glu Asn Val Ala
     50                  55                  60
Leu Gln Leu Gly Leu Ser Pro Ser Lys Thr Phe Ser Arg Arg Asn Gln
 65                  70                  75                  80
Asn Cys Ala Ala Glu Ile Pro Gln Val Val Glu Ile Ser Ile Glu Lys
                 85                  90                  95
Asp Ser Asp Ser Gly Ala Thr Pro Gly Thr Arg Leu Ala Arg Arg Asp
            100                 105                 110
Ser Tyr Ser Arg His Ala Pro Trp Gly Gly Lys Lys Lys His Ser Cys
        115                 120                 125
Ser Thr Lys Thr Gln Ser Ser Leu Asp Thr Glu Lys Lys Phe Gly Arg
    130                 135                 140
Thr Arg Ser Gly Leu Gln Arg Arg Glu Arg Arg Tyr Gly Val Ser Ser
145                 150                 155                 160
Met Gln Asp Met Asp Ser Val Ser Ser Arg Ala Val Gly Ser Arg Ser
                165                 170                 175
Leu Arg Gln Arg Leu Gln Asp Thr Val Gly Leu Cys Phe Pro Met Arg
            180                 185                 190
Thr Tyr Ser Lys Gln Ser Lys Pro Leu Phe Ser Asn Lys Arg Lys Ile
        195                 200                 205
His Leu Ser Glu Leu Met Leu Glu Lys Cys Pro Phe Pro Ala Gly Ser
    210                 215                 220
Asp Leu Ala Gln Lys Trp His Leu Ile Lys Gln His Thr Ala Pro Val
225                 230                 235                 240
Ser Pro His Ser Thr Phe Phe Asp Thr Phe Asp Pro Ser Leu Val Ser
                245                 250                 255
Thr Glu Asp Glu Glu Asp Arg Leu Arg Glu Arg Arg Arg Leu Ser Ile
            260                 265                 270
Glu Glu Gly Val Asp Pro Pro Pro Asn Ala Gln Ile His Thr Phe Glu
        275                 280                 285
Ala Thr Ala Gln Val Asn Pro Leu Tyr Lys Leu Gly Pro Lys Leu Ala
    290                 295                 300
Pro Gly Met Thr Glu Ile Ser Gly Asp Gly Ser Ala Ile Pro Gln Ala
305                 310                 315                 320
Ile Val Thr Gln Lys Arg Ile Gln Pro Pro Tyr Val Cys Ser His Gly
                325                 330                 335
Gly Arg Ser Ser Ala Arg Cys Pro Gly Thr Ala Thr Arg Thr Leu Ala
            340                 345                 350
Asp Arg Glu Leu Gly Lys Phe Ile Arg Arg Ser Ile Thr Tyr Thr Ala
        355                 360                 365
Ser Cys Gln Ile Cys Phe Arg Ser Gln Gly Ile Pro Val Thr Gly Ala
    370                 375                 380
*  Trp Thr Asp Thr Arg Pro Lys Pro Phe  * Lys Gly Asn Arg Lys
385                 390                 395                 400
Ala Arg Ser Cys Ser Gly Thr Leu His Arg Arg Thr Thr Ser Ser Leu
                405                 410                 415
*  Ala Ser Ala Ala Thr Thr Gly Leu Cys Thr Pro Gly Ser Ser Ser
            420                 425                 430
Gly Thr Thr Thr Ser Ala Ser Met Pro Met Thr Pro Ala Cys Phe Thr
        435                 440                 445
Pro Pro Arg His Gly Ala Ser Arg Thr Leu  * Arg Pro Gln Leu Leu
    450                 455                 460
His Val Phe  * Thr Val Ala Asn Asp Ile Thr Glu  * Asn Phe Pro
465                 470                 475                 480
Phe Gln Pro Ala Val Tyr Leu Pro Arg Ser Asp Leu Gln Met His Tyr
                485                 490                 495
Val *  Trp Asp *  Arg Ala Pro Ala Thr Val Asp Val Thr Gly Phe
            500                 505                 510
Phe Lys Arg Val Ser Leu  * Thr Lys Ser  * Gly Ser Leu Val Arg
        515                 520                 525
Thr Arg Pro Val Lys Ala Lys
    530                 535
(2)关于SEQ ID NO:19的信息:
(i)序列特征
(A)长度:1221个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQID NO:19:
GATTAAACAG CATACAGCTC CTGTGAGCCC ACATTCAACA TTTTTTGATA CTTTGATCCA    60
TCTTTGGTTT CTACAGAAGA TGAAGAAGAT AGGCTTAGAG AGAGAAGGCG GCTTAGTATT    120
GAAGAAGGGG TTGATCCCCC TCCCAATGCA CAAATACATA CATTTGAAGC TACTGCACAG    180
GTTAATCCAT TATTAAACTG GGACCAAAAT TAGCTCCTGG AATGACTGAA ATAAGTGGGG    240
ACAGTTCTGC AATTCCACAA GCTAATTGTG ACTCGGAAGA GGATACAACC ACCCTGTGTT    300
GCAGTCACGG AGGCAGAAGC AGCGTCAGAT ATCTGGAGAC AGCCATACCC ATGTTAGCAG    360
ACAGGGAGCT TGGAAAGTCC ACACACAGAT TGATTACATA CACTGCTTCG TGCCTGATTT    420
GCTTCAAATT ACAGGGAATC CCTGTTACTG GGGAGTGATG GACCGTTATG AAGCAGAAGC    480
CCTTCTCGAA GGGAAACCTG AAGGCACGTT TTTGCTCAGG GACTCTGCGC AAGAGGACTA    540
CTTCTTCTCT GTGAGCTTCC GCCGATACAA CAGATCCCTG CATGCCCGAA TTGAGCAGTG    600
GAATCACAAC TTTAGTTTCG ACGCCCATGA CCCGTGTGTA TTTCACTCCT CCACTGTAAC    660
GGGACTTTTA GAACATTATA AAGATCCCAG TTCGTGCATG TTTTTTGAAC CATTGCTTAC    720
TATATCACTA AATAGGACTT TCCCTTTTAG CCTGCAGTAT ATCTGTCGCG CGGTAATCTG    780
CAGGTGCACT ACGTATGATG GAATTGATGG GCTCCCTCTA CCCTCAATGT TACAGGATTT    840
TTTAAAAGAG TATCATTATA AACAAAAAGT TAGAGTTCGC TGGTTGGAAC GAGAACCAGT    900
CAAGGCAAAG TAAACTCTCC GGTCCCCAAA GGGTGTTAAC TAGGTCCGCT TTCATGTGCA    960
TCAGACAGTA CACCTATAGC AAGCACACGT AGCAGTGTTA GGCTTTTTCA TACAGTATGT    1020
AAGCTTAGTG TTAGTATCTG TCAGATGCTA CCTGCTGTTA CTTATTCAGA TAAACATGGT    1080
GCCTATTGGA ACAATAGCGG ATAGAGCTAC AGGTGTTCAG TAAGACTACA AAAACATTTT    1140
GCCTATTTCG CTAACAGTTT GGTTTTTAAT GGCTGTGGTA TTTGAGTGAG GCAACTCTGG    1200
GGCATTTGTT ATGAAGAAAT G                                              1221
(2)关于SEQ ID NO:20的信息
(i)序列特征
(A)长度:2369个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(ix)特征:
(A)名称/关键:CDS
(B)位置:116..1330
(xi)序列描述:SEQ ID NO:20:
GGCACGAGGC GGTGGTGGCG GCGGCGGGCG CGGCCGCGGC GGGGCGGGCG CGGAATGAAG     60
GCCCACGGCC CTGGGGGCTG AGGCGCCCGC CGCCTGGGGC GGGCCGCGCG TCCTC ATG     118
                                                             Met
                                                               1
GAG GCC GGA GAG GAG CCG CTG CTG CTG GCT GAA CTC AAG CCT GGG CGC    166
Glu Ala Gly Glu Glu Pro Leu Leu Leu Ala Glu Leu Lys Pro Gly Arg
              5                  10                 15
CCC CAC CAG TTC GAC TGG AAG TCA AGC TGC GAG ACC TGG AGC GTG GCC    214
Pro His Gln Phe Asp Trp Lys Ser Ser Cys Glu Thr Trp Ser Val Ala
         20                  25                  30
TTC TCG CCA GAC GGT TCC TGG TTC GCC TGG TCT CAA GGA CAC TGC GTG    262
Phe Ser Pro Asp Gly Ser Trp Phe Ala Trp Ser Gln Gly His Cys Val
     35                  40                  45
GTC AAG CTG GTC CCC TGG CCC TTA GAG GAA CAG TTC ATC CCT AAA GGA    310
Val Lys Leu Val Pro Trp Pro Leu Glu Glu Gln Phe Ile Pro Lys Gly
 50                  55                  60                  65
TTC GAA GCC AAG AGC CGA AGC AGC AAG AAT GAC CCA AAA GGA CGG GGC    358
Phe Glu Ala Lys Ser Arg Ser Ser Lys Asn Asp Pro Lys Gly Arg Gly
                 70                  75                  80
AGT CTG AAG GAG AAG ACG CTG GAC TGT GGC CAG ATT GTG TGG GGG CTG    406
Ser Leu Lys Glu Lys Thr Leu Asp Cys Gly Gln Ile Val Trp Gly Leu
             85                  90                  95
GCC TTC AGC CCG TGG CCC TCT CCA CCC AGC AGG AAA CTC TGG GCA CGT    454
Ala Phe Ser Pro Trp Pro Ser Pro Pro Ser Arg Lys Leu Trp Ala Arg
        100                 105                 110
CAC CAT CCC CAG GCG CCT GAT GTT TCT TGC CTG ATC CTG GCC ACA GGT    502
His His Pro Gln Ala Pro Asp Val Ser Cys Leu Ile Leu Ala Thr Gly
    115                 120                 125
CTC AAC GAT GGG CAG ATC AAG ATT TGG GAG GTA CAG ACA GGC CTC CTG    550
Leu Asn Asp Gly Gln Ile Lys Ile Trp Glu Val Gln Thr Gly Leu Leu
130                 135                 140                 145
CTT CTG AAT CTT TCT GGC CAC CAA GAC GTC GTG AGA GAT CTG AGC TTC    598
Leu Leu Asn Leu Ser Gly His Gln Asp Val Val Arg Asp Leu Ser Phe
                150                 155                 160
ACG CCC AGC GGC AGT TTG ATT TTG GTC TCT GCA TCC CGG GAT AAG ACA    646
Thr Pro Ser Gly Ser Leu Ile Leu Val Ser Ala Ser Arg Asp Lys Thr
            165                 170                 175
CTT CGA ATT TGG GAC CTG AAT AAA CAC GGT AAG CAG ATC CAG GTG TTA   694
Leu Arg Ile Trp Asp Leu Asn Lys His Gly Lys Gln Ile Gln Val Leu
        180                 185                 190
TCC GGC CAT CTG CAG TGG GTT TAC TGC TGC TCC ATC TCC CCT GAC TGT   742
Ser Gly His Leu Gln Trp Val Tyr Cys Cys Ser Ile Ser Pro Asp Cys
    195                 200                 205
AGC ATG CTG TGC TCT GCA GCT GGG GAG AAG TCG GTC TTT CTG TGG AGC   790
Ser Met Leu Cys Ser Ala Ala Gly Glu Lys Ser Val Phe Leu Trp Ser
210                 215                 220                 225
ATG CGG TCC TAC ACA CTA ATC CGG AAA CTA GAA GGC CAC CAA AGC AGT   838
Met Arg Ser Tyr Thr Leu Ile Arg Lys Leu Glu Gly His Gln Ser Ser
                230                 235                 240
GTT GTC TCC TGT GAT TTC TCT CCT GAT TCA GCC TTG CTT GTC ACA GCT   886
Val Val Ser Cys Asp Phe Ser Pro Asp Ser Ala Leu Leu Val Thr Ala
            245                 250                 255
TCG TAT GAC ACC AGT GTG ATT ATG TGG GAC CCC TAC ACC GGC GCG AGG   934
Ser Tyr Asp Thr Ser Val Ile Met Trp Asp Pro Tyr Thr Gly Ala Arg
        260                 265                 270
CTG AGG TCA CTT CAT CAC ACA CAA CTT GAA CCC ACC ATG GAT GAC AGT   982
Leu Arg Ser Leu His His Thr Gln Leu Glu Pro Thr Met Asp Asp Ser
    275                 280                 285
GAC GTC CAC ATG AGC TCC CTG AGG TCC GTG TGC TTC TCA CCT GAA GGC   1030
Asp Val His Met Ser Ser Leu Arg Ser Val Cys Phe Ser Pro Glu Gly
290                 295                 300                 305
TTG TAT CTC GCT ACG GTG GCA GAT GAC AGG CTG CTC AGG ATC TGG GCT   1078
Leu Tyr Leu Ala Thr Val Ala Asp Asp Arg Leu Leu Arg Ile Trp Ala
                310                 315                 320
CTG GAA CTG AAG GCT CCG GTT GCC TTT GCT CCG ATG ACC AAT GGT CTT   1126
Leu Glu Leu Lys Ala Pro Val Ala Phe Ala Pro Met Thr Asn Gly Leu
            325                 330                 335
TGC TGC ACG TTC TTC CCA CAC GGT GGA ATT ATT GCC ACA GGG ACG AGA   1174
Cys Cys Thr Phe Phe Pro His Gly Gly Ile Ile Ala Thr Gly Thr Arg
        340                 345                 350
GAT GGC CAT GTC CAG TTC TGG ACA GCT CCC CGG GTC CTG TCC TCA CTG      1222
Asp Gly His Val Gln Phe Trp Thr Ala Pro Arg Val Leu Ser Ser Leu
    355                 360                 365
AAG CAC TTA TGC AGG AAA GCC CTC CGA AGT TTC CTG ACA ACG TAT CAA      1270
Lys His Leu Cys Arg Lys Ala Leu Arg Ser Phe Leu Thr Thr Tyr Gln
370                 375                 380                 385
GTC CTA GCA CTG CCA ATC CCC AAG AAG ATG AAA GAG TTC CTC ACA TAC      1318
Val Leu Ala Leu Pro Ile Pro Lys Lys Met Lys Glu Phe Leu Thr Tyr
                390                 395                 400
AGG ACT TTC TAGCAGTGCC GGCTCCCCCA CCTCCTGCAG CAGCAGCAGT              1367
Arg Thr Phe
             405
ACAAGGGACT GGCTAGGATG GAGTCAGGCA GCTCACACTG GACCAGTGTG GACCTTCCTT    1427
CCTCCCATGG CATGTGCAAG TAGGTCTGCG TGACCCCACT TCTGTGGTGC CGGCCTTACC    1487
TCGTCTTCAT CCGTGGTGAG CAGCCTTCGT CAGTCTAGTT GTGTTGAAGC CAAGTGCAGT    1547
TGTGGATGTT GCTGGGGTAA TAAAGGCAAG CGGGCTCCAG AGCCTCTCTG GTGGCGGCCA    1607
AGCCACACTC CCTTAACTGG GAAGTACCTG CCACGTAGGG CATTTCTGCT GCCTATTTCC    1667
AGCCAGCGGC TGCATGGTTT GAAGTTCCTC CGTTGTGGTC AGAAGAACTC TGGTGTTTGG    1727
TTCCCTGCTC AGCTGCGCGT GGACTGGGCT GAGCTCCTCA CCATACACTA GTGCCGGCTT    1787
TTGTTTCCTG TAAACAGTGG TTGCATGTGT AGAGAAGTAA CAAGCGAGTA TTCAGATCAT    1847
ACGAGGAGGC GTTCCTCGGT GCATGACGGT CAGATGGCCA TTTATCAGCA TATTTATTTG    1907
TATTTTCTCA GCACATAGTA AGGTACAACT GTGTTTTCTC AATTGTCTCG AAAAAACAGA    1967
GTTCTTAAGT GGCCCAGTTG TGGAGCCAAG TCTAAGTCGT GTGGAGTCAG TGCTGACATC    2027
ACTGGCTTGT GCTGTCTGTC ACATGTGTTT GTCTCTGCTG CTTGACCTCA TGGGATGTAC    2087
CCTCCAGTTC AACTGCCCAA AACAGACAGC CCCTTCCAAG CACCGTTCTT TGACAGCGGT    2147
AGCAGCTACC TATTCAAGAC GCCTCACACA AAATCTGCCT TAGAAAGTTA ATATATTTTA    2207
AATTATTTTA AAAGAAACTC AACATCTTAT TCTTTGGCCT TTCTTAATTG ATGCTTTATG    2267
GAGGCAGTGT TAACATTGTA CAGTGTATGC ATAGAGGAGT CTCCTCTATT TGAAGAACAA    2327
TGCAAAATGA GGCTTTCATT GAAGGGAAAA AAAAAAAAAA AA                       2369
(2)关于SEQ ID NO:21的信息
(i)序列特征
(A)长度:404个碱基对
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:21:
Met Glu Ala Gly Glu Glu Pro Leu Leu Leu Ala Glu Leu Lys Pro Gly
  1               5                  10                  15
Arg Pro His Gln Phe Asp Trp Lys Ser Ser Cys Glu Thr Trp Ser Val
             20                  25                  30
Ala Phe Ser Pro Asp Gly Ser Trp Phe Ala Trp Ser Gln Gly His Cys
         35                  40                  45
Val Val Lys Leu Val Pro Trp Pro Leu Glu Glu Gln Phe Ile Pro Lys
     50                  55                  60
Gly Phe Glu Ala Lys Ser Arg Ser Ser Lys Asn Asp Pro Lys Gly Arg
65                  70                  75                  80
Gly Ser Leu Lys Glu Lys Thr Leu Asp Cys Gly Gln Ile Val Trp Gly
                 85                  90                  95
Leu Ala Phe Ser Pro Trp Pro Ser Pro Pro Ser Arg Lys Leu Trp Ala
            100                 105                 110
Arg His His Pro Gln Ala Pro Asp Val Ser Cys Leu Ile Leu Ala Thr
        115                 120                 125
Gly Leu Asn Asp Gly Gln Ile Lys Ile Trp Glu Val Gln Thr Gly Leu
    130                 135                 140
Leu Leu Leu Ash Leu Ser Gly His Gln Asp Val Val Arg Asp Leu Ser
145                 150                 155                 160
Phe Thr Pro Ser Gly Ser Leu Ile Leu Val Ser Ala Ser Arg Asp Lys
                165                 170                 175
Thr Leu Arg Ile Trp Asp Leu Asn Lys His Gly Lys Gln Ile Gln Val
            180                 185                 190
Leu Ser Gly His Leu Gln Trp Val Tyr Cys Cys Ser Ile Ser Pro Asp
        195                 200                 205
Cys Ser Met Leu Cys Ser Ala Ala Gly Glu Lys Ser Val Phe Leu Trp
    210                 215                 220
Ser Met Arg Ser Tyr Thr Leu Ile Arg Lys Leu Glu Gly His Gln Ser
225                 230                 235                 240
Ser Val Val Ser Cys Asp Phe Ser Pro Asp Ser Ala Leu Leu Val Thr
                245                 250                 255
Ala Ser Tyr Asp Thr Ser Val Ile Met Trp Asp Pro Tyr Thr Gly Ala
            260                 265                 270
Arg Leu Arg Ser Leu His His Thr Gln Leu Glu Pro Thr Met Asp Asp
        275                 280                 285
Ser Asp Val His Met Ser Ser Leu Arg Ser Val Cys Phe Ser Pro Glu
    290                 295                 300
Gly Leu Tyr Leu Ala Thr Val Ala Asp Asp Arg Leu Leu Arg Ile Trp
305                 310                 315                 320
Ala Leu Glu Leu Lys Ala Pro Val Ala Phe Ala Pro Met Thr Asn Gly
                325                 330                 335
Leu Cys Cys Thr Phe Phe Pro His Gly Gly Ile Ile Ala Thr Gly Thr
            340                 345                 350
Arg Asp Gly His Val Gln Phe Trp Thr Ala Pro Arg Val Leu Ser Ser
        355                 360                 365
Leu Lys His Leu Cys Arg Lys Ala Leu Arg Ser Phe Leu Thr Thr Tyr
    370                 375                 380
Gln Val Leu Ala Leu Pro Ile Pro Lys Lys Met Lys Glu Phe Leu Thr
385                 390                 395                 400
Tyr Arg Thr Phe
(2)关于SEQ ID NO:22的信息
(i)序列特征
(A)长度:1246个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:22:
GACACTGCAT CGTCAAACTG ATCCCCTGGC CGTTGGAGGA GCAGTTCATC CCTAAAGGGT    60
TTGAAGCCAA AAGCCGAAGT AGCAAAAATG AGACGAAAGG GCGGGGCAGC CCAAAAGAGA    120
AGACGCTGGA CTGTGGTCAG ATTGTCTGGG GGCTGGCCTT CAGCCTGTGC TTTCCCCACC    180
CAGCAGGAAG CTCTGGGCAC GCCACCACCC CCAAGTGCCC GATGTCTCTT GCCTGGTTCT    240
TGCTACGGGA CTCAACGATG GGCAGATCAA GATCTGGGAG GTGCAGACAG GGCTCCTGCT    300
TTTGAATCTT TCCGGCCACC AAGATGTCGT GAGAGATCTG AGCTTCACAC CCAGTGGCAG    360
TTTGATTTTG GTCTCCGCGT CACGGGATAA GACTCTTCGC ATCTGGGACC TGAATAAACA    420
CGGTAAACAG ATTCAAGTGT TATCGGGCCA CCTGCAGTGG GTTTACTGCT GTTCCATCTC    480
CCCAGACTGC AGCATGCTGT GCTCTGCAGC TGGAGAGAAG TCGGTCTTTC TATGGAGCAT    540
GAGGTCCTAC ACGTTAATTC GGAAGCTAGA GGGCCATCAA AGCAGTGTTG TCTCTTGTGA    600
CTTCTCCCCC GACTCTGCCC TGCTTGTCAC GGCTTCTTAC GATACCAATG TGATTATGTG    660
GGACCCCTAC ACCGGCGAAA GGCTGAGGTC ACTCCACCAC ACCCAGGTTG ACCCCGCCAT    720
GGATGACAGT GACGTCCACA TTAGCTCACT GAGATCTGTG TGCTTCTCTC CAGAAGGCTT    780
GTACCTTGCC ACGGTGGCAG ATGACAGACT CCTCAGGATC TGGGCCCTGG AACTGAAAAC    840
TCCCATTGCA TTTGCTCCTA TGACCAATGG GCTTTGCTGG CACATTTTTT CCACATGGTG    900
GAGTCATTGC CACAGGGACA AGAGATGGCC ACGTCCAGTT CTGGACAGCT CCTAGGGTCC    960
TGTCCTCACT GAAGCACTTA TGCCGGAAAG CCCTTCGAAG TTTCCTAACA ACTTACCAAG    1020
TCCTAGCACT GCCAATCCCC AAGAAAATGA AAGAGTTCCT CACATACAGG ACTTTTTAAG    1080
CAACACCACA TCTTGTGCTT CTTTGTAGCA GGGTAAATCG TCCTGTCAAA GGGAGTTGCT    1140
GGAATAATGG GCCAAACATC TGGTCTTGCA TTGAAATAGC ATTTCTTTGG GATTGTGAAT    1200
AGAATGTAGC AAAACCAGAT TCCAGTGTAC TAGTCATGGA TTTTTC                  1246
(2)关于SEQ ID NO:23的信息
(i)序列特征
(A)长度:422个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:23:
ACCATGGTTC CAAGTCCTCT CCCCTGTGGT CAAGTTGCCC GAATGTTGGG CCCAAGTGCC    60
TTTTCCTCCT TGGGCCTCCC CTTCTGACCT GCAGGACAGT TTTCCGGAGC CCATTTGGTA    120
TGAGGTATTA ATTAGCCTTA ACTAAATTAC AGGGGACTCA GAGGCCGTGC TCCTGACCGA    180
TCCAGACACT ATTTTTTTTT TTTTTTTTTA ACAATGGTGT GCATGTGCAG GAAATGACAA    240
ATTTGTATGT CAGATTATAC AAGGATGTAT TCTTAAACCG CATGACTATT CAGATGGCTA    300
CTGAGTTATC AGTGGCCATT TATTAGCATC ATATTTATTT GTATTTTCTC AACAGATGTT    360
AAGGTACAAC TGTGTTTTTC TCGATTATCT AAAAACCATA GTACTTAAAT TGAAAAAAAA    420
AA                                                                   422
(2)关于SEQ ID NO:24的信息
(i)序列特征
(A)长度:2019个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:24
GGCACGAGGC GGGGTCAGGG CGGAGGCTGA GGACCAAGTA GGCATGGCGG AGGGCGGGAC   60
CGGCCCCGAT GGACGGGCCG GCCCGGGACC CGCAGGTCCT AATCTGAAGG AGTGGCTGAG   120
GGAGCAGTTC TGTGACCATC CACTGGAGCA CTGTGACGAT ACAAGACTCC ATGATGCAGC   180
CTATGTAGGG GACCTCCAGA CCCTCAGGAA CCTACTGCAA GAGGAGAGCT ACCGGAGCCG   240
CATCAATGAG AAGTCTGTCT GGTGCTGCGG CTGGCTTCCC TGCACACCAC TGAGGATCGC   300
AGCCACTGCA GGCCATGGGA ACTGTGTGGA CTTCCTCATA CGCAAAGGGG CCGAGGTGGA   360
CCTGGTGGAT GTCAAGGGGC AGACTGCCCT GTATGTGGCT GTAGTGAACG GGCACTTGGA   420
GAGCACTGAG ATCCTTTTGG AAGCTGGTGC TGATCCCAAC GGCAGCCGGC ACCACCGCAG   480
CACTCCTGTG TACCATGCCT YTCGTGTGGG TAGGGACGAC ATCCTGAAGG CTCTTATCAG   540
GTATGGGGCA GATGTTGATG TCAACCATCA TCTGAATTCT GACACCCGGC CCCCTTTTTC   600
ACGGCGGCTA ACCTCCTTGG TGGTCTGTCC TCTATACATC AGTGCTGCCT ACCATAACCT   660
TCAGTGCTTC AGGCTGCTCT TGCAGGCTGG GGCAAATCCT GACTTCAATT GCAATGGCCC   720
TGTCAACACC CAGGAGTTCT ACAGGGGATC CCCTGGGTGT GTCATGGATG CTGTCCTGCG   780
CCATGGCTGT GAAGCAGCCT TCGTGAGTCT GTTGGTAGAG TTTGGAGCCA ACCTGAACCT   840
GGTGAAGTGG GAATCCCTGG GCCCAGAGGC AAGAGGCAGA AGAAAGATGG ATCCTGAGGC   900
CTTGCAGGTC TTTAAAGAGG CCAGAAGTAT TCCCAGGACC TTGCTGAGTT TGTGCCGGGT   960
GGCTGTGAGA AGAGCTCTTG GCAAATACCG ACTGCATCTG GTTCCCTCGC TGCCGCTGCC   1020
AGACCCCATA AAGAAGTTTT TGCTTTATGA GTAGCATTCA CATGCAGTGC TGACTGCAAT   1080
GTGGAAGCCG ATCACCTGCA GTGAAAACTG ACACAGACTC TGGCATCCTG GGAACCATGG   1140
CCTGTGCTGC CAGCTTGATC CTTGGCTGTC AGTGAAGAAA AAACGGCTGT GTTCTCTTGG   1200
ACTGTGATTC TATCTCAGGT GCTTGGGCCA TCGAACGCTC CTTGAGTCAT TGTCAACTGA   1260
GAGGCACATA CAAACTTAAT TTTGTTCCTC TTCAGTCTCT CTGTTTTGGA TTCTTCCTGG    1320
CAATGTGTGC AGCATGGGCT GAGCCTGGTG ATTGCCCTAG TGGGGAAGGC TTTTTTCTCC    1380
AGGCTATGCA TCTATTTATG TTCCTACTTT GCAATTTATT GTTCTTTTAA GGCTTGATAT    1440
CAAAACAGAA AGAGGTTTGT TAAGAAAAGA TATAGGGAGA AAGGAATTCC GGTTCCGTGC    1500
ACTTGCTAGC CTGCTTTCCT TGCCTGGGTT TGTCTGTCTA TGCTGCCTGG TGCACATCCC    1560
TTCTCTTTGC TGCCACTGTT CTATTTTGGG AGTTGTCTTC CGTCTAAGAT GGCTTCTGGG    1620
GTTCTATCTT ATTGCACAGA GGTCCCAGAA CAGTGTTCAT AGGGCACCAT CTGCTCTGCC    1680
AAGGGTTTTC TGATGTCTTA CCCTGGGGAT CTTCAGACAG TGGTTACCTT TAGGAGACCC    1740
ACCTGGAACT AACCATTAAG TGACTGCCCA CATTCAGATC AGGGACCATC TTAATAGTAC    1800
TCACTGCCAG TCCTCACAAG AGAAGATGAC ACGGGTGCTC TCTTCAGACA CTCCCATACA    1860
GGAAGTTGGA AAATGTCTTG GTCACCTGGG TTGTTCCCAG GCTACAACTT CTTGGTGTTC    1920
CACTAARACC AGRATATCCT AGTTTTTTGG GTTGACTGTT CCCTCCCCAC TTTCCTTGAA    1980
NCCCAATGCC CNTTTGTKTN GGTTGCTTCC CTAAAAKTT                           2019
(2)关于SEQ ID NO:25的信息:
(i)序列特征
(A)长度:350个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:25:
Ala Arg Gly Gly Val Arg Ala Glu Ala Glu Asp Gln Val Gly Met Ala
1               5                   10                  15
Glu Gly Gly Thr Gly Pro Asp Gly Arg Ala Gly Pro Gly Pro Ala Gly
            20                  25                  30
Pro Asn Leu Lys Glu Trp Leu Arg Glu Gln Phe Cys Asp His Pro Leu
        35                  40                  45
Glu His Cys Asp Asp Thr Arg Leu His Asp Ala Ala Tyr Val Gly Asp
    50                  55                  60
Leu Gln Thr Leu Arg Asn Leu Leu Gln Glu Glu Ser Tyr Arg Ser Arg
65                  70                  75                  80
Ile Asn Glu Lys Ser Val Trp Cys Cys Gly Trp Leu Pro Cys Thr Pro
                85                  90                  95
Leu Arg Ile Ala Ala Thr Ala Gly His Gly Asn Cys Val Asp Phe Leu
            100                 105                 110
Ile Arg Lys Gly Ala Glu Val Asp Leu Val Asp Val Lys Gly Gln Thr
        115                 120                 125
Ala Leu Tyr Val Ala Val Val Asn Gly His Leu Glu Ser Thr Glu Ile
    130                 135                 140
Leu Leu Glu Ala Gly Ala Asp Pro Asn Gly Ser Arg His His Arg Ser
145                 150                 155                 160
Thr Pro Val Tyr His Ala Xaa Arg Val Gly Arg Asp Asp Ile Leu Lys
                165                 170                 175
Ala Leu Ile Arg Tyr Gly Ala Asp Val Asp Val Asn His His Leu Asn
            180                 185                 190
Ser Asp Thr Arg Pro Pro Phe Ser Arg Arg Leu Thr Ser Leu Val Val
        195                 200                 205
Cys Pro Leu Tyr Ile Ser Ala Ala Tyr His Asn Leu Gln Cys Phe Arg
    210                 215                 220
Leu Leu Leu Gln Ala Gly Ala Asn Pro Asp Phe Asn Cys Asn Gly Pro
225                 230                 235                 240
Val Asn Thr Gln Glu Phe Tyr Arg Gly Ser Pro Gly Cys Val Met Asp
                245                 250                 255
Ala Val Leu Arg His Gly Cys Glu Ala Ala Pne Val Ser Leu Leu Val
            260                 265                 270
Glu Phe Gly Ala Asn Leu Asn Leu Val Lys Trp Glu Ser Leu Gly Pro
        275                 280                 285
Glu Ala Arg Gly Arg Arg Lys Met Asp Pro Glu Ala Leu Gln Val Phe
    290                 295                 300
Lys Glu Ala Arg Ser Ile Pro Arg Thr Leu Leu Ser Leu Cys Arg Val
305                 310                 315                 320
Ala Val Arg Arg Ala Leu Gly Lys Tyr Arg Leu His Leu Val Pro Ser
                325                 330                 335
Leu Pro Leu Pro Asp Pro Ile Lys Lys Phe Leu Leu Tyr Glu
            340                 345                 350
(2)关于SEQ ID NO:26的信息:
(i)序列特征
(A)长度:419个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:26:
GCATCCATGG CGGAGGGCGG CAGCACGACG GGCGGGCAGG GCCGGGCTCC GCAGGTCGTA  60
ATCTGAAGGA GTGGCTGAGG GAGCAATTTT GTGATCATCC GCTGGAGCAC TGTGAGGACA  120
CGAGGCTCCA TGATGCAGCT TACGTCGGGG ACCTCCAGAC CCTCAGGAGC CTATTGCAAG  180
AGGAGAGCTA CCGGAGCCGC ATCAACGAGA AGTCTGTCTG GTGCTGTGGC TGGCTCCCCT  240
GCACACCGTT GCGAATCGCG GCCACTGCAG GCCATGGGAG CTGTGTGGAC TTCCTCATCC  300
GGAAGGGGGC CGAGGTGGAT CTGGTGGACG TAAAAGGACA GACGGCCCTG TATGTGGCTG  360
TGGTGAACGG GCACCTAGAG AGTACCCAGA TCCTTCTCGA AGCTGGCGCG GACCCCAAC      419
(2)关于SEQ ID NO:27的信息:
(i)序列特征
(A)长度:595个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:27:
GAGGAAGAAG AAAAGTGGAC CCTGAGGCCT TGCAGGTCTT TAAAGAGGCC AGAAGTGTTC    60
CCAGAACCTT GCTGTGTCTG TGCCGTGTGG CTGTGAGAAG AGCTCTTGGC AAAACCGGCT    120
TCATCTGATT CCTTCGCTGC CTCTGCCAGA CCCCATAAAG AAGTTTCTAC TCCATGAGTA    180
GACTCCAAGT GCTGCGGTTG ATTCCAGTGA GGGAGAAAGT GATCTGCAGG GAGGTGGACA    240
CCGAGCCCTG AGTGCTGTGC TGCTGCTGGT CTCCTGATGG CTGTTGCTGC AGAAGATGTC    300
CTCGTAGACT GTCATTGCTC CTCAGGTGCC TGGGCCGCTG AACAGTCCTT GGGTCATTGT    360
CAGCTGAGAG GCTTATACTA AAGTTATTAT TGTTTTTCCC AAGTTCTCTG TTCTGGATTT    420
TCAGTTGCAT ATTAATGTAA CGGGCCATGG GGTATGTACA TGTAGGGGCT GAGGTTGGAG    480
GCCTACTAAT TTCCTGTAGG GAAGACTCCC AGCACTTCTG GAACTGTGCT TCTCTTTATT    540
TTTCTACTTC TCAATTTGAT GGTTCGATTA AAGCCTTCTA GTATCTCAAT GAAAA         595
(2)关于SEQ ID NO:28的信息:
(i)序列特征
(A)长度:896个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(ix)特征:
(A)名称/关键:CDS
(B)位置:4..396
(xi)序列描述:SEQ ID NO:28:
CTG ATG TCC GCA ATT CTG AAG GTT GGA CAC CAC TGC TGG CTG CCT GTG    48
    Met Ser Ala Ile Leu Lys Val Gly His His Cys Trp Leu Pro Val
      1               5                  10                  15
ACA TCC GCT GTC AAT CCC CAA AGG ATG CTG AGG CCA CCA CCA ACC GCT    96
Thr Ser Ala Val Asn Pro Gln Arg Met Leu Arg Pro Pro Pro Thr Ala
                 20                  25                  30
GTT TTC AAC TGT GCC GCT TGC TGC TGT CTG TGG GGG CAG ATG CTG ATG    144
Val Phe Asn Cys Ala Ala Cys Cys Cys Leu Trp Gly Gln Met Leu Met
             35                  40                  45
AAT ACA TAC CGT GTA GTT CAG CTT CCT GAG GAG GCC AAG GGC TTG GTG    192
Asn Thr Tyr Arg Val Val Gln Leu Pro Glu Glu Ala Lys Gly Leu Val
         50                  55                  60
CCA CCA GAG ATT CTA CAG AAG TAC CAT GGA TTC TAC TCT TCC CTC TTT    240
Pro Pro Glu Ile Leu Gln Lys Tyr His Gly Phe Tyr Ser Ser Leu Phe
     65                  70                  75
GCC TTG GTG AGG CAG CCC AGG TCG CTG CAG CAT CTC TGC CGT TGT GCG    288
Ala Leu Val Arg Gln Pro Arg Ser Leu Gln His Leu Cys Arg Cys Ala
 80                  85                  90                  95
CTC CGC AGT CAC CTG GAG GGC TGT CTG CCC CAT GCA CTA CCG CGC CTT    336
Leu Arg Ser His Leu Glu Gly Cys Leu Pro His Ala Leu Pro Arg Leu
                100                 105                 110
CCC CTG CCA CCG CGC ATG CTC CGC TTT CTG CAG CTG GAC TTT GAG GAT    384
Pro Leu Pro Pro Arg Met Leu Arg Phe Leu Gln Leu Asp Phe Glu Asp
            115                 120                 125
CTG CTC TAC TAGGCTTGCT GCCCTGTGAA CAAAGCAGAC CCCACCCCCA            433
Leu Leu Tyr
        130
CCCCAAGGGC ATCTCTCAGC AATGAATGAT GCAAGGCGGT CTGTCTTCAA GTCAGGAGTG    493
GACGCCTTGA TCCACACTTG AGAGAAGAGG CCAGATCAGC ACCYGGCTGG TAGTGATNGC    553
AGAGGGCACC TGTGCAGATC TGTGTGCGCA CTGGAAATCT CTAGGCTGAA GGCYAGAGCA    613
AATGGTGCAR GTGTTAGTCC TTGGGANGAG AGACAGANGG TGAGAAAGCA AGACAGAGGT    673
GAGAGTGCAC ATGTCAAGTG GTAGATTGCC TTAAAAGAAA GCTAAAAAAA GAAAAAGATT    733
CGGGCGAACT TCTTTAGGGG TAATGCTGCA GCGTGTTAAA CTGACTGACC AGCGTCCATA    793
TCTTTGGACC CTTCCCGGGT GAAAAAGCCC CTTCATCCTC CAGCGCTCCC CAAGGGTGCT    853
TAGCAATACC GGGTGCTTTT CTGCCGCAAA GTGAGTTACC AAA                      896
(2)关于SEQ ID NO:29的信息
(i)序列特征
(A)长度:130个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SE ID NO:29:
Met Ser Ala Ile Leu Lys Val Gly His His Cys Trp Leu Pro Val Thr
  1               5                  10                  15
Ser Ala Val Asn Pro Gln Arg Met Leu Arg Pro Pro Pro Thr Ala Val
             20                  25                  30
Phe Asn Cys Ala Ala Cys Cys Cys Leu Trp Gly Gln Met Leu Met Asn
         35                  40                  45
Thr Tyr Arg Val Val Gln Leu Pro Glu Glu Ala Lys Gly Leu Val Pro
     50                  55                  60
Pro Glu Ile Leu Gln Lys Tyr His Gly Phe Tyr Ser Ser Leu Phe Ala
65                   70                  75                  80
Leu Val Arg Gln Pro Arg Ser Leu Gln His Leu Cys Arg Cys Ala Leu
                 85                  90                  95
Arg Ser His Leu Glu Gly Cys Leu Pro His Ala Leu Pro Arg Leu Pro
            100                 105                 110
Leu Pro Pro Arg Met Leu Arg Phe Leu Gln Leu Asp Phe Glu Asp Leu
        115                 120                 125
Leu Tyr
    130
(2)关于SEQ ID NO:30的信息
(i)序列特征
(A)长度:436个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:30:
GTGGGGGCGT CATCATGACC TCCTCTAGGG CTCTGCAACA TGACTCCTGT GGTGCAAATC    60
AACAAATTGT TCACTGATGA ATCCACAAGG ATCTCTGGGC CTACAACCAG GTCCTGGTCC    120
ACATGACTGT CGTCTTCGGA GAAGGCACCA CTCGCCCCCG GCAGGTACGG CTGACACCTC    180
CATGGGAGAA GACGTATCCA GGCAGCAGCT GCGCGGCCCT TCAAGAGGGC ACATCCCGTC    240
ATCTAAAGGC ACGGTGTACT GAAGGTAGTC CTGAGACATG AGTCCGATTA CTACAGGCAC    300
GTGTTCCTCC AGGTGGAGGC TCAGGTCCCC GGGTGAGCTG GGGCTGCAGC GGGACTCAGG    360
GCGCGGCTCT GGCTGCAGGT CTCGCAGCTC CCTGGGCTGT AGCTCCCGCA GATCCTTGCG    420
CACACCGTTG ACTGGT                                                    436
(2)关于SEQ ID NO:31的信息
(i)序列特征
(A)长度:2180个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:31:
TTAATAGTAC CTACATAGTA GAAAATTATA ACTCCACTTT AAAACAATGT TTTCTTTCTA   60
TTCAAATCAA TTTAAAACTT TTTATAAACA TTAATGTTGC AAGAGAATCC AGTCCATTTA   120
TGAAAATTAG TTGACAATCA AGTTCACCCA AGAAAATGTT GACTAAGCTA AAGAAATCAC   180
AGATAAAACA TTTTACCAAA AGGATAGGTA ACACACAAAA AAATGCTATC ACAGGAAGCT   240
ATGATCATCT AATATTTCTT TAATAATAAT TCTAGTTCCA TAGGTTTTCA TGTTATGCCA   300
ATTTGTACCC GAGTTTAATT ACAGAAAAGG CAACAATTTC TAAATTGGTG GTATACATTT   360
CTTTACAATT TTTTAATGTA AGGCCATTTA TTAAAATAGA CAAACTAGAA GATGAAAACG   420
AAGGCAACAG AAAAATTCAA CTTTTCACAA CCAAAAGAAT TAGCACAACC TTAGAAATAA   480
TTTAGAAAAA AGTGTTGTTA AAAGATATGT TGCAGATCTC CGTTCCATTA CCCAAGATTA   540
TGTCAATTCA CGATTCTAAA TAAATCTTTT TAAAGTAAGA GATTAAAAAC TCATCTTCAG   600
TGTATATGTA AATTCCGTGG TTTTATCACA CAGGTATGTT TATTCAACAC TGCTTTGGAA   660
ATGGACCATT TAAAAGGACA TGGCAATTTC CATTCTGTTA AGTTTCATTC AACCTTTACT   720
TAGGGGTTGA TTACCACATG AAATGTGCTT TTAATGCATA AAAATCACAG TGGATTAGCC   780
AGCAAAAGGG ACTGGGCGGG GGGGGCATTG AGGAGAATTT GATAATTCAC ATTGTGATTA   840
TTCTGCACAT TGATGAAACA TAATTCACAC CTCTAAAACC TCAAGACTTC CCTTTTTTAA   900
AGAACCAAAA TAAACCCAAG ACACCTTGCT GACACTTCCC CACCCCTAAA CAAACTGATG   960
ACTCTTTTAC ACATAAAACT GAAATAGTTA TGGCAGCAAA AGATTTTGAT GGCAATGAAA   1020
GTTTGTAAAC TGTATTTCAA TCTCTTGTTC TTATTCCCAA AGTGCAAGAT GCAGGGTTCT    1080
CAATCTTTCA GTAGTGCTTC TCCTGTAAAT AATCCTTCAT TTTGTTTGGC AAAGGCAGTT    1140
TCTGAATTAA GTCTATTCTG GTATACTGAC GTATAACAAA ACGACACAGG TACTGCAACG    1200
AGCGCACCTA TGAACCCCGG AACACTGGTT GGCAAGTTCT GACGGAAGTG CAGATTCCAG    1260
GCAGCGAGAC CTTGAATAAC AAAAAGCTCC CATTTTCAGA GTCCCTGATT GAATGCTCCA    1320
ATTAGATCAA CTATGGACGT ATGTCCTTCC ACATCGGCTG TTCATAAAAG CTAAACCTAC    1380
CATTTGAGTG CTCAATTCTA GTGTGAAGTG TTTTACCATG GGAGCGAAAG TCACAGCTTA    1440
AAAGGTAACG GTCGTCAGAA CTGTCCCGAA CAAGAAAAGA ACCATCTGGC ACGTTTGCTA    1500
GCTTCCCTTC TGCCTCCCAA CGTGTGATTG GTCCCCAGTA CCATCCTTGC TTTGCAAGTT    1560
TTTTCAGCTC CTCTGTAAGG CTTGTCACAA CCATGGGACC ACTACTTTGC ACTGAGTCAT    1620
AAACTCTTGC AACCCCAGGA GCAGAGTTCG GATCAAAATT CAAATGACAG CGCATAACTT    1680
TCAGCCACGT GGGGCTTTCT GTCCAGTGAG TCCACTGAAA GTTCCCCTTT GGGATTTGGA    1740
TTATTCCTGC ATTGGAGTAA CCAATGGTGA AGATTGGAGG GACATCCATC GTGAACCCGC    1800
TCTCCGGGGT TCTGCAACAT GACTCCCGTG GTGCCAATCA ACAAGCCATT CACCGGACTG    1860
ATCCACGAAG ATCTCTGGGG CGACAACTAG GTCCTGGTCT ACCTGACTCT CATCCTCGGG    1920
GAAAGCGCGC CCTCCCACTT GAGGAGGAAC CGCAGAGACT TCCATGGGAG AAGAGCTGTC    1980
CAGACAATAG CTCCGTGATC CTTCCAAAGG ATACATCCCC TCATCTAAAG GCACAGTATA    2040
CTGAATGTAG TCCTGAGGCA TAAGTCCAAT AACGACAGGC ACATGTTCAT CCAGGTGAAG    2100
ATGCAGGTCT CCATTATGAG AAGCCGAGCT CTTCAGTGAA TTGGCTTGCT CCTGGCACGT    2160
GGTCTCAGAC TGGAGGTCGT                                                2180
(2)关于SEQ ID NO:32的信息
(i)序列特征
(A)长度:2649个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:32:
GGCACGAGGC TGTGTCCAGC ACACAGAGAG GGCCCGGCCA TCTGCTTTGG TTCAGAGCCC   60
TGTGTCTGTC TGTCACTTAG ACTCTTCCTC CCGGCTCGCA GCTCACCCTC CATCCTCCTT   120
ACTGGCTCCA GCATGACTCG CTTCTCTTAT GCAGAGTACT TTGCTCTGTT TCACTCTGGC   180
TCTGCACCTT CCAGGTCCCC TTCGTCTCCC GAGAACCCAC CGGCCCGCGC ACCCCTGGGT   240
CTGTTCCAAG GGGTCATGCA GAAGTATAGC AGCAACCTGT TCAAGACCTC CCAGATGGCG   300
GCTATGGACC CCGTGCTGAA GGCCATCAAG GAAGGGGATG AAGAGGCCTT GAAGATCATG   360
ATCCAGGATG GGAAGAATCT TGCAGAGCCC AACAAGGAGG GCTGGCTGCC GCTCCACGAG   420
GCTGCCTACT ATGGCCAGCT GGGCTGCCTG AAAGTCCTGC AGCAAGCCTA CCCAGGGACC   480
ATTGACCAAC GCACACTGCA GGAAGAGACA GCATTATACC TGGCCACATG CAGAGAACAC   540
CTGGATTGCC TCCTGTCGCT GCTCCAGGCG GGGGCAGAGC CTGACATCTC TAACAAATCC   600
AGGGAGACTC CACTTTACAA AGCCTGTGAG CGCAAGAACG CGGAGGCGGT GAGGATATTG   660
GTGCGATACA ACGCAGACGC CAACCACCGC TGTAACAGGG GCTGGACCGC ACTGCACGAG   720
TCTGTCTCCC GCAATGACCT GGAGGTCATG GAGATCCTAG TGAGTGGCGG GGCCAAGGTG   780
GAGGCCAAGA ATGTCTACAG CATCACCCCT TTGTTTGTGG CTGCCCAGAG TGGGCAGCTG   840
GAGGCCCTGA GGTTCCTGGC CAAGCATGGT GCAGACATCA ACACGCAGGC CAGTGACAGT   900
GCATCAGCCC TCTACGAGGC CAGCAAGAAT GAGCATGAAG ACGTGGTAGA GTTTCTTCTC   960
TCTCAGGGCG CCGATGCTAA CAAAGCCAAC AAGGACGGCC TGCTCCCCCT GCATGTTGCC   1020
TCCAAGAAGG GCAACTATAG AATAGTGCAG ATGCTGCTGC CTGTGACCAG CCGCACGCGC    1080
GTGCGCCGTA GCGGCATCAG CCCGCTGCAC CTAGCGGCCG AGCGCAACCA CGACGCGGTG    1140
CTGGAGGCGC TGCTGGCCGC GCGCTTCGAC GTGAACGCAC CTCTGGCTCC CGAGCGCGCC    1200
CGCCTCTACG AGGACCGCCG CAGTTCTGCG CTCTACTTCG CTGTGGTCAA CAACAATGTG    1260
TACGCCACCG AGCTGTTGCT GCTGGCGGGC GCGGACCCCA ACCGCGATGT CATCAGCCCT    1320
CTGCTCGTGG CCATCCGCCA CGGCTGCCTG CGCACCATGC AGCTGCTGTT GGACCATGGC    1380
GCCAACATCG ACGCCTACAT CGCCACTCAC CCCACCGCCT TTCCAGCCAC CATCATGTTT    1440
GCCATGAAGT GCCTGTCGTT ACTCAAGTTC CTTATGGACC TCGGCTGCGA TGGCGAGCCC    1500
TGCTTCTCCT GCCTGTACGG CAACGGGCCG CACCACCCGC CCCGCGACCT GGCCGCTTCC    1560
ACGACGCACC CGTGGACGAC AAGGCACCTA GCGTGGTGCA GTTCTGTGAG TTCCTGTCGG    1620
CCCCGGAAGT GAGCCGCTGG GCGGGACCCA TCATCGATGT CCTCCTGGAC TATGTGGGCA    1680
ACGTGCAGCT GTGCTCCCGG CTGAAGGAGC ACATCGACAG CTTTGAGGAC TGGGCTGTCA    1740
TCAAGGAGAA GGCAGAACCT CCGAGACCTC TGGCTCACCT CTGCCGGCTG CGGGTTCGGA    1800
AGGCCATAGG AAAATACCGG ATAAAACTCC TGGACACACT GCCGCTTCCC GGCAGGCTAA    1860
TCAGATACTT GAAATATGAG AATACACAGT AACCAGCCTG GAGAGGAGAT GTGGCCTTCA    1920
GACTGTTTCC GGGACGCCCC AGGTGGCCTG CATCCAGGAC CCCCTGGGGT CAGAACAGGT    1980
GTGACCTTGC TGGTTCTTTG CTGGAGCTTC ACCCAAAGTG AGAACCTGAT GTGGGGAGTG    2040
GACGTGGAAC CTCTGCTTTC ACACTGTCAG CGGATCGCAG ACCCGCTCTG CTTCTGGCCA    2100
TAGCCAGAGA CCTTCAACCT GGGGCCAGGG GAGAGCTGGT CTGGGCAAGG TGGCCCAGGC    2160
AGGAATCCTG GCCTTAAGCT GGAGAACTTG TAGGAATCCC TCACTGGACC CTCAGCTTTC    2220
AGGCTGCGAG GGAGACGCCC AGCCCAAGTA TTTTATTTCC GTGACACAAT AACGTTGTAT    2280
CAGAAAAAAA AAAAAACATG GGCGCAGCTT ATTCCTTAGT AGGGTATTTA CTTGCATGCG    2340
CGCTTAAAGC TACTGGAAAC ATGCGTTCCA CTATGCTTGA GAATCCCCTT GCACTGGTAA    2400
ACGAGAGCCG ACGTGCTTCA AGGTTGGATT TTTGGTTGCC CCTTTGGCGT TCCGCGGGTT    2460
TGTCCGACGT AATTGACCCC GTGTTTTGTC ACTTTCGAGT GTTCCGACTA TTGGGGGGCT    2520
TTTGGTTGTC CCCAAAATTG TGGGTGGTGT GCGGACGCCA CGAGAAGTGG TTCATGGGCG    2580
ATAATCATTA CTGGAGAATG TAGAGCGGCG GTTTTACGAA TAAATATTTT TTAAGCCGCC    2640
TTCCCAAAA                                                            2649
(2)关于SEQ ID NO:33的信息
(i)序列特征
(A)长度:495个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:33:
CCTCCTGAGA GTTCGCCGGC CCGGGCCCAA TGGGTTGTTC CAAGGGGTCA TGCAGAAATA    60
CAGCAGCAGC TTGTTCAAGA CCTCCCAGCT GGCGCCTGCG GACCCCTTGA TAAAGGCCAT    120
CAAGGATGCG ATGAAGAGGC CTTGAAGACC ATGATCAAGG AAGGGAAGAA TCTCGCAGAG    180
CCCAACAAGG AGGGCTGGCT GCCGCTGCAC GAGGCCGCAT ACTATGGCCA GGTGGGCTGC    240
CTGAAAGTCC TGCAGCGAGC GTACCCAGGG ACCATCGACC AGCGCACCCT GCAGGAGGAA    300
ACAGCCGTTT ACTTGGCAAC GTGCAGGGGC CACCTGGACT GTCTCCTGTC ACTGCTCCAA    360
GCAGGGGCAG AGCGGGACAT CTCCAACAAA TCCCGAGAGA ACCGCTCTAC AAAGCCTGTG    420
AGCGCAAGAA CGCGGAAGCC GTGAAGATTC TTGGTGCAGC ACAACGCAGA CACCAACAAC    480
GCTGCAACCG GGCTG                                                     495
(2)关于SEQ ID NO:34的信息
(i)序列特征
(A)长度:709个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:34:
GTGCAGCTCT GCTCGCGGCT GAAGGAACAC ATCGACAGCT TTGAGGACTG GGCCGTCATC    60
AAGGAGAAGG CAGAACCTCC AAGACCTCTG GCTCACCTTT GCCGACTGCG GGTTCGAAAG    120
GCCATTGGGA AATACCGTAT AAAACTCCTA GACACCTTGC CGCTCCCAGG CAGGCTGATT    180
AGATACCTGA AATACGAGAA CACCCAGTAA CTGGGGCCAC GGGGAGAGAG GAGTAGCCCC    240
TCAGACTCTT CTTACTAAGT CTCAGGACGT CGGTGTTCCC AACTCCAAGG GGACCTGGTG    300
ACAGACGAGG CTGCAGGCTG CCTCCCTCTC AGCCTGGACA GCTACCAGGA TCTCACTGGG    360
TCTCAGGGCC CAGAGCTTTG GCCAGAGCAG AGAACAGAAT GTGTCAAGGA GAAGAATCAT    420
TTGTTTACAA ACTGATGAGC AGATCCCAGA CCTTCTCTAC CTTCAGGAAT GGCAGAAACC    480
TCTATTCCTG GGGCCAGGGC AGAGCTTGAG GTGTTCTGGG GAAGGTGGTG CTCAGAGCCT    540
TCCCTGTGCC CCTCCACTTG TTCTGGAAAA CTCACCACTT GACTTCAGAG CTTTCTCTCC    600
AAAGACTAAG ATGAAGACGT GGCCCAAGGT AGGGGGTAGG GGGAGCCTGG GTCTTGGAGG    660
GCTTTGTTAA GTATTAATAT AATAAATGTT ACACATGTGA AAAAAAAAA                709
(2)关于SEQ ID N0:35的信息
(i)序列特征
(A)长度:848个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(ix)特征:
(A)名称/关键:CDS
(B)位置:1..624
(xi)序列描述:SEQ ID NO:35:
TTG GAG AAG TGT GGT TGG TAT TGG GGG CCA ATG AAT TGG GAA GAT GCA    48
Leu Glu Lys Cys Gly Trp Tyr Trp Gly Pro Met Asn Trp Glu Asp Ala
  1               5                  10                  15
GAG ATG AAG CTG AAA GGG AAA CCA GAT GGT TCT TTC CTG GTA CGA GAC    96
Glu Met Lys Leu Lys Gly Lys Pro Asp Gly Ser Phe Leu Val Arg Asp
             20                  25                  30
AGT TCT GAT CCT CGT TAC ATC CTG AGC CTC AGT TTC CGA TCA CAG GGT    144
Ser Ser Asp Pro Arg Tyr Ile Leu Ser Leu Ser Phe Arg Ser Gln Gly
         35                  40                  45
ATC ACC CAC CAC ACT AGA ATG GAG CAC TAC AGA GGA ACC TTC AGC CTG    192
Ile Thr His His Thr Arg Met Glu His Tyr Arg Gly Thr Phe Ser Leu
    50                   55                  60
TGG TGT CAT CCC AAG TTT GAG GAC CGC TGT CAA TCT GTT GTA GAG TTT    240
Trp Cys His Pro Lys Phe Glu Asp Arg Cys Gln Ser Val Val Glu Phe
 65                  70                  75                  80
ATT AAG AGA GCC ATT ATG CAC TCC AAG AAT GGA AAG TTT CTC TAT TTC    288
Ile Lys Arg Ala Ile Met His Ser Lys Asn Gly Lys Phe Leu Tyr Phe
                 85                  90                  95
TTA AGA TCC AGG GTT CCA GGA CTG CCA CCA ACT CCT GTC CAG CTG CTC    336
Leu Arg Ser Arg Val Pro Gly Leu Pro Pro Thr Pro Val Gln Leu Leu
            100                 105                 110
TAT CCA GTG TCC CGA TTC AGC AAT GTC AAA TCC CTC CAG CAC CTT TGC    384
Tyr Pro Val Ser Arg Phe Ser Asn Val Lys Ser Leu Gln His Leu Cys
        115                 120                 125
AGA TTC CGG ATA CGA CAG CTC GTC AGG ATA GAT CAC ATC CCA GAT CTC    432
Arg Phe Arg Ile Arg Gln Leu Val Arg Ile Asp His Ile Pro Asp Leu
    130                 135                 140
CCA CTG CCT AAA CCT CTG ATC TCT TAT ATC CGA AAG TTC TAC TAC TAT      480
Pro Leu Pro Lys Pro Leu Ile Ser Tyr Ile Arg Lys Phe Tyr Tyr Tyr
145                 150                 155                 160
GAT CCT CAG GAA GAG GTA TAC CTG TCT CTA AAG GAA GCG CAG CGT CAG      528
Asp Pro Gln Glu Glu Val Tyr Leu Ser Leu Lys Glu Ala Gln Arg Gln
                165                 170                 175
TTT CCA AAC AGA AGC AAG AGG TGG AAC CCT CCA CGT AGC GAG GGG CTC      576
Phe Pro Asn Arg Ser Lys Arg Trp Asn Pro Pro Arg Ser Glu Gly Leu
            180                 185                 190
CCT GCT GGT CAC CAC CAA GGG CAT TTG GTT GCC AAG CTC CAG CTT TGAAGAACCA
631
Pro Ala Gly His His Gln Gly His Leu Val Ala Lys Leu Gln Leu
        195                 200                 205
AATTAAGCTA CCATGAAAAG AAGAGGAAAA GTGAGGGAAC AGGAAGGTTG GGATTCTCTG    691
TGCAGAGACT TTGGTTCCCC ACGCAAGCCC TGGGGCTTGG AAGAAGCACA TGACCGTACT    751
CTGCGTGGGG CTCCACCTCA CACCCACCCC TGGGCATCTT AGGACTGGAG GGGCTCCTTG    811
GAAAACTGGA AGAAGTCTCA ACACTGTTTC TTTTTCA                             848
(2)关于SEQ ID NO:36的信息
(i)序列特征
(A)长度:207个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:36:
Leu Glu Lys Cys Gly Trp Tyr Trp Gly Pro Met Asn Trp Glu Asp Ala
  1               5                  10                  15
Glu Met Lys Leu Lys Gly Lys Pro Asp Gly Ser Phe Leu Val Arg Asp
             20                  25                  30
Ser Ser Asp Pro Arg Tyr Ile Leu Ser Leu Ser Phe Arg Ser Gln Gly
         35                  40                  45
Ile Thr His His Thr Arg Met Glu His Tyr Arg Gly Thr Phe Ser Leu
     50                  55                  60
Trp Cys His Pro Lys Phe Glu Asp Arg Cys Gln Ser Val Val Glu Phe
 65                  70                  75                  80
Ile Lys Arg Ala Ile Met His Ser Lys Asn Gly Lys Phe Leu Tyr Phe
                 85                  90                  95
Leu Arg Ser Arg Val Pro Gly Leu Pro Pro Thr Pro Val Gln Leu Leu
            100                 105                 110
Tyr Pro Val Ser Arg Phe Ser Asn Val Lys Ser Leu Gln His Leu Cys
        115                 120                 125
Arg Phe Arg Ile Arg Gln Leu Val Arg Ile Asp His Ile Pro Asp Leu
    130                 135                 140
Pro Leu Pro Lys Pro Leu Ile Ser Tyr Ile Arg Lys Phe Tyr Tyr Tyr
145                 150                 155                 160
Asp Pro Gln Glu Glu Val Tyr Leu Ser Leu Lys Glu Ala Gln Arg Gln
                165                 170                 175
Phe Pro Asn Arg Ser Lys Arg Trp Asn Pro Pro Arg Ser Glu Gly Leu
            180                 185                 190
Pro Ala Gly His His Gln Gly His Leu Val Ala Lys Leu Gln Leu
        195                 200                 205
(2)关于SEQ ID NO:37的信息
(i)序列特征
(A)长度:464个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:37:
GTTCCAAGCC TAACCCATCT TTGTCGTTTG GAAATTCGGG CCAGTCTAAA AGCAGAGCAC    60
CTTCACTCTG ACATTTTCAT CCATCAGTTG CCACTTCCCA GAAGTCTGCA GAACTATTTG    120
CTCTATGAAG AGGTTTTAAG AATGAATGAG ATTCTAGAAC CAGCAGCTAA TCAGGATGGA    180
GAAACCAGCA AGGCCACCTG ACACAGGTCC TTTAATTCTG TTTAGTCACA AAAGACGGCT    240
TGTGTGACTG TTTGGATTTG GTGATCAAAT GTCCATGTTT ACAGTTGCTT TTCCCAGTTT    300
GTGTCTTTCC CAATATTGTG AACCTTATCC ATCTTGCCTT ACTCAGTTTT ATTTCTAGTG    360
CACTTTGTTG TGTATTATTT GTTTACCTGA CCATTTTCTA CTTTATTCTG CTAATAAACT    420
GTAATTCTGA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAA                     464
(2)关于SEQ ID NO:38的信息
(i)序列特征
(A)长度:747个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:38:
GGGGATCGAA AGCGGGGGCT TCTGGGACGC AGCTCTGGAG ACGCGGCCTC GGACCAGCCA    60
TTTCGGTGTA GAAGTGGCAG CACGGCAGAC TGGTCAAACA AATGGATTTT ACAGAGGCTT    120
ACGCGGACAC GTGCTCTACA GTTGGACTTG CTGCCAGGGA AGGCAATGTT AAAGTCTTAA    180
GGAAACTGCT CAAAAAGGGC CGAAGTGTCG ATGTTGCTGA TAACAGGGGA TGGATGCCAA    240
TTCATGAAGC AGCTTATCAC AACTCTGTAG AATGTTTGCA AATGTTAATT AATGCAGATT    300
CATCTGAAAA CTACATTAAG ATGAAGACCT TTGAAGGTTT CTGTGCTTTG CATCTCGCTG    360
CAAGTCAAGG ACATTGGAAA ATCGTACAGA TTCTTTTAGA AGCTGGGGCA GATCCTAATG    420
CAACTACTTT AGAAGAAACG ACACCATTGT TTTTAGCTGT TGAAAATGGA CAGATAGATG    480
TGTTAAGGCT GTTGCTTCAA CACGGAGCAA ATGTTAATGG ATCCCATTCT ATGTGTGGAT    540
GGAACTCCTT GCACCAGGCT TCTTTTCAGG AAAATGCTGA GATCATAAAA TTGCTTCTTA    600
GAAAAGGAGC AAACAAGGAA TGCCAGGATG ACTTTGGAAT CACACCTTTA TTTGTGGCTG    660
CTCAGTATGG CCAAGCTAGA AAGCTTTGAA GCATACTTAT TTCATCCGGG TGCAAATGTC    720
AATTGTCAAG CCTTGGACAA AGCTACC                                        747
(2)关于SEQ ID NO:39的信息
(i)序列特征
(A)长度:1018个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:39:
CACAAATGGG ACCATACAAA AATCTTGGAC TTGTTAATAA CCACTTACTA ACCGGGACCT      60
GTGACACTGG GCTAAACAAA GTAAGTCCCT GTTTACTCAG CAGTGTTTGG GGGACATGAA      120
GGATTGCCTA GAAATATTAC TCCGGAATGG TCTACAGCCC AGACGCCCAG GCGTGCCTTG      180
TTTTTGGATT CAGTTCTCCT GTGTGCATGG CTTTCCAAAA GGAGGTGGAG CTGTAGTTCT      240
TTGGAATTGT GAACATTCTT TTGAAATATG GAGCCCAGAT AAATGAACTT CATTTGGCAT      300
ACTGCCTGAA GTACGAGAAG TTTTCGATAT TTCGCTACTT TTTGAGGAAA GGTTGCTCAT      360
TGGGACCATG GAACCATATA TATGAATTTG TAAATCATGC AATTAAAGCA CAAGCAAAAT      420
ATAAGGAGTG GTTGCCACAT CTTCTGGTTG CTGGATTTGA CCCACTGATT CTACTGTGCA      480
ATTCTTGGAT TGACTCAGTC AGCATTGACA CCCTTATCTT CACTTTGGAG TTTACTAATT      540
GGAAGACACT TGCACCAGCT GTTGAAAGGA TGCTCTCTGC TCGTGCCTCA AACGCTTGGA      600
TTCTACAGCA ACATATTGCC CACTGTTCCA TCCCTGACCC ATCTTTGTCG TTTGGAAATT      660
CGGTCCAGTC TAAAATCAGA ACGTCTACGG TCTGACAGTT ATATTAGTCA GCTGCCACTT   720
CCCAGAAGCC TACATAATTA TTTGCTCTAT GAAGACGTTC TGAGGATGTA TGAAGTTCCA   780
GAACTGGCAG CTATTCAAGA TGGATAAATC AGTGAAACTA CTTAACACAG CTAATTTTTT   840
TCTCTGAAAA ATCATCGAGA CAAAAGAGCC ACAGAGTACA AGTTTTTATG ATTTTATAGT   900
CAAAAGATGA TTATTGATTG TCAGATAGGT TAGGTTTTGG GGGGCCAGTA GTTCAGTGAG   960
AATGTTTATG TTTACAACTA GCCTTCCCAG TAAAAAAAAA AAAAAAAAAA AAAAAAAA     1018
(2)关于SEQ ID NO:40的信息
(i)序列特征
(A)长度:1897个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:40:
CGGGGGGCTG GGACCTGGGG CGTAACCGTC TCTACCACGA CGGCAAGAAC CAGCCAAGTA      60
AAACATACCC AGCCTTTCTG GAGCCGGACG AGACATTCAT TGTCCCTGAC TCCTTTTTCG      120
TGGCCCTGGA CATGRATGAT GGGACCTTAA GTTTCATCGT GGATGGACAG TACATGGGAG      180
TGGCTTTCCG GGGACTCAAG GGTAAAAAGC TGTATCCTGT AGTGAGTGCC GTCTGGGGCC      240
ACTGTGAGAT CCGCATGCGC TACTTGAACG GACTTGATCC TGAGCCCCTG CCACTCATGG      300
ACCTGTGCCG GCGTTCGGTG CGCCTAGCGC TGGGAAAAGA GCGCCTGGGT GCCATCCCCG      360
CTCTGCCGCT ACCTGCCTCC CTCAAAGCCT ACCTCCTCTA CCAGTGATCC ACATCCCAGG      420
ACCGCCATAC GACAGCCATC TGGTGCCAAR TCACTGAGCC CGTTGGGGTC CGCCGACCCC      480
TGCGCCTGGG ATGGAAGCCC ACCTCAGCCA TGGGCAGACG TGCCCCCTCA TCCTACCGGC      540
TGCCTCTGCT GGGGGAACCT ATGCCAACGG ACTTCTCCCT TCCCAACACT GGCTGAAGCA    600
GCAGCACCCA GGCCCTTCCC TGAACCAGAT GCAGAGAATA AACTATGAAA ACCTCTCTCA    660
GGCGCCTTCT GCTCTCAGGT GGAGTGGGCT GCCCCCCACT CTCTGCAGAG AGAGGCTACA    720
CCCACCTGGG GGGTCCTGGG AGGTAAGACT AGTAGGAGGT GCCAGGGCTG ARTCCAAAAG    780
CAGGAATGGC CAGGAMCAGG CCATACAGAT GAAGCTCAGG ATGTCACATA CCATGGACAM    840
TGAGACAGAA CCCCAGGTTG GAMTTCCCTT GGGCCAACGA GTGCCAGCTT TAATGTCAGC    900
TGCMGGTGCT CTGTGGCCTG TATTTATTCT TTAAACAGTA GCAAAGGCCA TTTATTTATT    960
CCACTTAGAA AGGAAACCTT GGTGGGTGGY TTCCCTCGAT GTGCTTTCCC CCACCTCCCT    1020
GGAATGTGTG TGCCACACCT GTCCTTGTCC CAGGCCAGGA CTGTGGCACA TGAGCTGGTG    1080
TGCACAGATA CACGTATGTC GTCGTGCATG ACCCCTGACT AGTTCCTAAG TAGCCCTGCA    1140
CCAAGCACCA GAGCAGACCC CAAGAGAGGC CCGTGCAAGT CCCCATGTCC CCAGGTCCCT    1200
GCTTCTGTTG CCTTGGGACT CATACACCGG CACACGTGTT TCAGCCTCTT GACTTCCATG    1260
AGCTTCGAAT TTTGCCCCCG ATTCTTCTGA TATTTCCCAT TGGCATCCTC CAAAGCTCTG    1320
GGCCTGGAGG GCATTAGGAC ACATGGAATG AGTGGGGTCT CCAGCCCCTG GGAAAGCCAC    1380
TGGCAAGGCA GGATTAGAAA GACCAAGAGC AGGGTGGGGC GCCATGAAGC CTGTATGCCT    1440
CTCAGGCTCA AGACCCCGCC ACACACCCAC TCAAGCCTCA GAAGTGGTGT GTAGGGCAGC    1500
CCCAGGAGAG GAATGCCTGT CCTAGCAGCA CGTACATGGA GCACCCCACA TGTGCTCCAG    1560
CCCTCTGGCT GTTTCTCTTG CTCTAGAATC AACTCCCTAC ATTGGGAATG TAGCCATTTG    1620
GTAGAGGACT TGCCTAGCCT GCAGGAAGCT CACGTTCCAT CCCCTGCACC AAGGAGAATC    1680
AAAGCTCAGG AGGCTGAGGC AGGAGGATTG CTGTCAGTGG TGTACAGAGG TCATGGCCAT    1740
CCTGGGCTAT ATTAAACCTT GTCCTTTAAG AAAAAGAAAA GAAATCAACT TCCATTGAAT    1800
CTGAGTTCTG CTCATTTCTG CACAGGTACA ATAGATGACT TKATTTGTTG AAAAATGKTT    1860
AATATATTTA CMTATATATA TATTTGTAAG AAGCATT                             1897
(2)关于SEQ ID NO:41的信息:
(i)序列特征
(A)长度:134个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:41:
Gly Gly Trp Asp Leu Gly Arg Asn Arg Leu Tyr His Asp Gly Lys Asn
1               5                   10                  15
Gln Pro Ser Lys Thr Tyr Pro Ala Phe Leu Glu Pro Asp Glu Thr Phe
            20                  25                  30
Ile Val Pro Asp Ser Phe Phe Val Ala Leu Asp Met Xaa Asp Gly Thr
        35                  40                  45
Leu Ser Phe Ile Val Asp Gly Gln Tyr Met Gly Val Ala Phe Arg Gly
    50                  55                  60
Leu Lys Gly Lys Lys Leu Tyr Pro Val Val Ser Ala Val Trp Gly His
65                  70                  75                  80
Cys Glu Ile Arg Met Arg Tyr Leu Asn Gly Leu Asp Pro Glu Pro Leu
                85                  90                  95
Pro Leu Met Asp Leu Cys Arg Arg Ser Val Arg Leu Ala Leu Gly Lys
            100                 105                 110
Glu Arg Leu Gly Ala Ile Pro Ala Leu Pro Leu Pro Ala Ser Leu Lys
        115                 120                 125
Ala Tyr Leu Leu Tyr Gln
    130
(2)关于SEQ ID NO:42的信息
(i)序列特征
(A)长度:265个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:42:
AAGGGTAAAA AACTGTATCC TGTAGTGAGT GCCGTCTGGG GCCACTGTAG ATCCGAATGC    60
GCTACTTGAA CGGACTCGAT CCCGAGACTG CCGCTCATGG ATTTGTGCCG TCGCTCGGTG    120
CGCCTGGCCC TGGGGAGGGA GCGCCTGGGG GAGAACCACA CCTGCCGCTG CCGGCTTCCC    180
TCAAGGCCTA CCTCCTCTAC CAGTGACGTT CGCCATCATA CCGCCAGCGC GACAGCCACC    240
TGGTGCCAAC TCACTGAGCC GCCTG                                          265
(2)关于SEQ ID NO:43的信息
(i)序列特征
(A)长度:2438个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:43:
AAGTGGCGGC GGTCCCTGGA GAGCAGGCGG AGGCAGCGGC AAGTCTGACT CTGGGCTGAC    60
CGTGGAGCCG GGGCGGGGGC TGACAGCCAG GCCTCCGCCT GGCGGGAGCC GCACGAGGAG    120
CGGGAGTGGC CGGGCCTCTC TTCCGCGCTT GAGCGAGCGC CGGGTGATGG CGGTGGTGAT    180
GGCGGCAGGC GCTCGGACAG CTCCGCTTGA GCTGAGCTCG GAGAGATCCG TCCAGAAAGT    240
GCCCAGAAGA AACTTCCTCT TAGAAAAGCT GAAAAACACA RTATTTATAA CACTGGAAAT   300
TGTAAAGAAT TTGTTTAAAA TGGCTGAAAA CAATAGTAAA AATGTAGATG TACGGCCTAA   360
AACAAGTCGG AGTCGAAGTG CTGACAGGAA GGATGGTTAT GTGTGGAGTG GAAAGAAGTT   420
GTCTTGGTCC AAAAAGAGTG AGAGTTGTTC TGAATCTGAA GCCATAGGTA CTGTTGAGAA   480
TGTTGAAATT CCTCTAAGAA GCCAAGAAAG GCAGCTTAGC TGTTCGTCCA TTGAGTTGGA   540
CTTAGATCAT TCCTGTGGGC ATAGATTTTT AGGCCGATCC CTTAAACAGA AACTGCAAGA   600
TGCGGTGGGG CAGTGTTTTC CAATAAAGAA TTGTAGTGGC CGACACTCTC CAGGGCTTCC   660
ATCTAAAAGA AAGATTCATA TCAGTGAACT CATGTTAGAT AAGTGCCCTT TCCCACCTCG   720
CTCAGATTTA GCCTTTAGGT GGCATTTTAT TAAACGACAC ACTGTTCCTA TGAGTCCCAA   780
CTCAGATGAA TGGGTGAGTG CAGACCTGTC TGAGAGGAAA CTGAGAGATG CTCAGCTGAA   840
ACGAAGAAAC ACAGAAGATG ACATACCCTG TTTCTCACAT ACCAATGGCC AGCCTTGTGT   900
CATAACTGCC AACAGTGCTT CGTGTACAGG TGGTCACATA ACTGGTTCTA TGATGAACTT   960
GGTCACAAAC AACAGCATAG AAGACAGTGA CATGGATTCA GAGGATGAAA TTATAACGCT   1020
GTGCACAAGC TCCAGAAAAA GGAATAAGCC CAGGTGGGAA ATGGAAGAGG AGATCCTGCA   1080
GTTGGAGGCA CCTCCTAAGT TCCACACCCA GATCGACTAC GTCCACTGCC TTGTTCCAGA   1140
CCTCCTTCAG ATCAGTAACA ATCCGTGCTA CTGGGGTGTC ATGGACAAAT ATGCAGCCGA   1200
AGCTCTGCTG GAAGGAAAGC CAGAGGGCAC CTTTTTACTT CGAGATTCAG CGCAGGAAGA   1260
TTATTTATTC TCTGTTAGTT TTAGACGCTA CAGTCGTTCT CTTCATGCTA GAATTGAGCA   1320
GTGGAATCAT AACTTTAGCT TTGATGCCCA TGATCCTTGT GTCTTCCATT CTCCTGATAT   1380
TACTGGGCTC CTGGAACACT ATAAGGACCC CAGTGCCTGT ATGTTCTTTG AGCCGCTCTT   1440
GTCCACTCCC TTAATCCGGA CGTTCCCCTT TTCCTTGCAG CATATTTGCA GAACGGTTAT   1500
TTGTAATTGT ACGACTTACG ATGGCATCGA TGCCCTTCCC ATTCCTTCGC CTATGAAATT   1560
GTMTCTGAAG GAATACCATT ATAAATCAAA AGTTAGGTTA CTCAGGATTG ATGTGCCAGA   1620
GCAGCAGTGA TGCGGAGAGG TTAGAATGTC GACCTGCATA CATATTTTCA TTTAATATTT    1680
TATTTTTCTT ATGCCTCTTT GAATTTTTGT ACAAAGGCAG TTGAATCAAA TAAAACTGTG    1740
CCCTAAGTTT TAATTCCAGA TCAATTTATT TTTTTTATGA TACACTTGTT ATATATTTTT    1800
AAGCAGGTGT TTGGTTTTGT TTTTACCATA TAAATTTACA TATGGTCCAG GCATATTTAC    1860
AATTTCAAGG CATTGCATAT ACATTTGAAT ATTCTGTATT TTTTAAATAA TCTTTTGTTC    1920
TTTCCTATGT GTGAAATATT TTGCTAATCT ATGCTATCAG TATTCTTGTA TGACCGAATA    1980
GTTACCTATT CTCTTTTCAT CTTGAAGATT TTCAGTAAAG AGTGTTGTAA TCAATCCATT    2040
ATAATGTAAT TGACTTTTGT AATTTGCCAA TAGGAGTGTT AAACAACAAA ATGATTTAAA    2100
ATGAAACTTA ATGTATTTTC ATTTTAAATA TTAACTAAAC CAAGTTTGTT TGTTAGTTAT    2160
TCTAGCCAAT AAGAAAAGAG AATGTAGCAT CCTAGAGGTG TATTTGTTCT GCAGTTTGGC    2220
AGGACCGTCA GTTAGTCCAA ATAAACATCC CCTCAGCGTG GAGGCGAATG GAACCTGTGC    2280
TCCTTTCTTA CGGGAAGCTT TGCAAAGCAA AATAGCAGGG TTACAAGCTT GGAGTTGTTA    2340
AGGCAACTAG AGTTTTCTCT ATTAATTTAT AGACTGTTGT TGCACCTACT TAGCTCTTTT    2400
TTGGGAACTC TAGTTCCCAG GGGAAAATAC CTCGTGCC                            2438
(2)关于SEQ ID NO:44的信息
(i)序列特征
(A)长度:542个氨基酸
(B)类型:氨基酸
C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:44:
Ser Gly Gly Gly Pro Trp Arg Ala Gly Gly Gly Ser Gly Lys Ser Asp
1               5                   10                  15
Ser Gly Leu Thr Val Glu Pro Gly Arg Gly Leu Thr Ala Arg Pro Pro
            20                  25                      30
Pro Gly Gly Ser Arg Thr Arg Ser Gly Ser Gly Arg Ala Ser Leu Pro
        35                  40                      45
Arg Leu Ser Glu Arg Arg Val Met Ala Val Val Met Ala Ala Gly Ala
    50                  55                      60
Arg Thr Ala Pro Leu Glu Leu Ser Ser Glu Arg Ser Val Gln Lys Val
65                  70                  75                  80
Pro Arg Arg Asn Phe Leu Leu Glu Lys Leu Lys Asn Thr Xaa Phe Ile
                85              90                      95
Thr Leu Glu Ile Val Lys Asn Leu Phe Lys Met Ala Glu Asn Asn Ser
            100                 105                 110
Lys Asn Val Asp Val Arg pro Lys Thr Ser Arg Ser Arg Ser Ala Asp
        115                 120                 125
Arg Lys Asp Gly Tyr Val Trp Ser Gly Lys Lys Leu Ser Trp Ser Lys
    130                 135                 140
Lys Ser Glu Ser Cys Ser Glu Ser Glu Ala Ile Gly Thr Val Glu Asn
145                 150                 155                 160
Val Glu Ile Pro Leu Arg Ser Gln Glu Arg Gln Leu Ser Cys Ser Ser
                165                 170                 175
Ile Glu Leu Asp Leu Asp His Ser Cys Gly His Arg Phe Leu Gly Arg
            180                 185                 190
Ser Leu Lys Gln Lys Leu Gln Asp Ala Val Gly Gln Cys Phe Pro Ile
        195                 200                 205
Lys Asn Cys Ser Gly Arg His Ser Pro Gly Leu Pro Ser Lys Arg Lys
    210                 215                 220
Ile His Ile Ser Glu Leu Met Leu Asp Lys Cys Pro Phe Pro Pro Arg
225                 230                 235                 240
Ser Asp Leu Ala Phe Arg Trp His Phe Ile Lys Arg His Thr Val Pro
                245                 250                 255
Met Ser Pro Asn Ser Asp Glu Trp Val Ser Ala Asp Leu Ser Glu Arg
            260                 265                 270
Lys Leu Arg Asp Ala Gln Leu Lys Arg Arg Asn Thr Glu Asp Asp Ile
        275                 280                 285
Pro Cys Phe Ser His Thr Asn Gly Gln Pro Cys Val Ile Thr Ala Asn
    290                 295                 300
Ser Ala Ser Cys Thr Gly Gly His Ile Thr Gly Ser Met Met Asn Leu
305                 310                 315                 320
Val Thr Agn Asn Ser Ile Glu Asp Ser Asp Met Asp Ser Glu Asp Glu
                325                 330                 335
Ile Ile Thr Leu Cys Thr Ser Ser Arg Lys Arg Asn Lys Pro Arg Trp
            340                 345                 350
Glu Met Glu Glu Glu Ile Leu Gln Leu Glu Ala Pro pro Lys Phe His
        355                 360                 365
Thr Gln Ile Asp Tyr Val His Cys Leu Val Pro Asp Leu Leu Gln Ile
    370                 375                 380
Ser Asn Asn Pro Cys Tyr Trp Gly Val Met Asp Lys Tyr Ala Ala Glu
385                 390                 395                 400
Ala Leu Leu Glu Gly Lys Pro Glu Gly Thr Phe Leu Leu Arg Asp Ser
                405                 410                 415
Ala Gln Glu Asp Tyr Leu Phe Ser Val Ser Phe Arg Arg Tyr Ser Arg
            420                 425                 430
Ser Leu His Ala Arg Ile Glu Gln Trp Asn His Asn Phe Ser Phe Asp
        435                 440                 445
Ala His Asp Pro Cys Val Phe His Ser Pro Asp Ile Thr Gly Leu Leu
    450                 455                 460
Glu His Tyr Lys Asp Pro Ser Ala Cys Met Phe Phe Glu Pro Leu Leu
465                 470                 475                 480
Ser Thr Pro Leu Ile Arg Thr Phe Pro Phe Ser Leu Gln His Ile Cys
                485                 490                 495
Arg Thr Val Ile Cys Asn Cys Thr Thr Tyr Asp Gly Ile Asp Ala Leu
            500                 505                 510
Pro Ile Pro Ser Pro Met Lys Leu Tyr Leu Lys Glu Tyr His Tyr Lys
        515                 520                 525
Ser Lys Val Arg Leu Leu Arg Ile Asp Val Pro Glu Gln Gln
    530                 535                 540
(2)关于SEQ ID NO:45的信息
(i)序列特征
(A)长度:4999个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:45:
CCCTCTGGGC AAGCCGCCCC CCCCCCACCC ATCTACCACA CACACACACA CACACACACA    60
CACACATTCA GACCTTGGGG CAAAAACAAA GCAAAATAAC AACAACAAAA ACACTGCCTG    120
TGGAAAGTCC TTACTTCAGG AAGGTTGGCA GATGAGGAGC AAGGGAACAT TTTATCAGGA    180
CTGCCACAAA GGAGTCTTTT TTTTTAATGG TTTTTCAAGA CAGGGTTTCT CTGTATAGCC    240
CTGGCTGTCC TGGAGCTCAC TTTGTAGACC AGGCTGGCCT CGAACTCAGA AATTCGCCTG    300
CCTCTGCCTC CTGAGTGCTG GGATTAAAGG CGTGCAGCAC CATGTCCAAC TGGCATTTTC    360
TCAATTAAGG TTCGTTCCTT TCAGATAACT CTAGGTTCTG GGTCAAGCTG ACACAAGGCT    420
ACACAGCACA GTTTGTATGC CACATTCAGT TCAGAAGACA CCCAACCTCC CTGGAACTGG    480
AACTTATGCA CATTTGTGAG CTTCCACTTG GGAGTGGGAA CCTGAACTGG GTCCTCTGCA    540
AGAGCAGCCG TGCTCTTAAC TGCTGAGCCA TTTCAGCAGC CTCACATCAG AATTAAGTTA    600
GAAATTAGCCG GGTATGAATC ATACCCTTAG AATCCTAGCA TCTGAAAGCA GAGCTAAGAG
660
AAACAGGGAT TCAAGACCAG CTCTTGGCTA CAGAGCCCGT CCTGTCCTAG GATGGGCTAC    720
AAGAGACTAT TTCAAAGCCA TCCAAACAAC AATAACTACA ACAACAACAA G3TTAAAATT    780
AGGCTGGGCA CAGGGTACAC ACCTTTAATG CCAACACTCA GGAGGCAGAG GCAGGCTGAT    840
CAGTGTGAGT TTGAGTTCAA CGTGGTCTAC ATAGGGAGTT CTAGGCCAGC AGAGGTTACA    900
GTCTCTCTCT CTCTCTCTCT CTCTCTCTCT CTCTCACACA CACACACACA CACACACACA    960
CACACACACA CACACACGGT GGCATTATGG GATTTTTTTG GGATAAGGTT TCTCTGTCTA    1020
GCCCTGGCAT AGATTCACTC TGTAGACTAG GCTAGCCTTG AACTCAGAGA TCCGCCTGCC    1080
TCTGCCTCCC AAGTGCTGGG ATTATAGGTG TTGCACCACC ACTGCCCAGC CACTTTGGGA    1140
TTTTTGAACT GTTATCAAGA GGCTTTCGAG GAGGTCAAAC TTCAACAGCA ACCTCTCCAT    1200
GATAATGTAG CTAATGATCA AACGACACTC AAAACTTAAC CCTTAAAGCA CACATCCACC    1260
AGACAGCGTG CCCACTCGTA GTTCCATTAC TCAGGAGGCT GAAGCAGGAG GATGAAGGAC    1320
TAAGGCTTCA GCAACCTAGG GAGCCGCAGG GGACAGTAGT CTCAATCCCT ACATTCTCCT    1380
GAACACAGGA GCAGGAGTTC AGGAAGGGTG TCAAGGCCGC TTACTGATCT TAGGGCCTCA    1440
GGAATGACTA GCTCAGGCAG AGAGAGCAAA GGTCTCCAGT GGAGAAGTCT ACACACACAC    1500
ACACACACAC ACACACACAC ACACACACAC AGAATCCAAG GCGATGACGT CATCAAAGGG    1560
TTAATTCTAG TCTGGGATGG GGGGGAGGGT GGGGCACGCA GCTGTCAGGT GGCTTTGGAA    1620
AAATAAACTG CTGAAGAGTC TGACGCCAGG GAGTCCTGGG AGGGACAAGA GGTTACCCAC    1680
TCAAAGAGTG TGCTCCACAA AGCATGCGCG CTTGTCCACG TCTGGAGTCG TCACTTATTT    1740
TTTGCCTGGA TTCTTTGTAG CCGGTGGGTT CTCAAGGCGG TAAGTGGTGT GGCCGCCGTG    1800
GTCTGGGAGG TGACGATAGG GTTAATCGTC CACAGAGCCC AGGGGCGGAG CGCGGGCGGG    1860
CGTCCGCAGC CCCGCTGGAG CCGGAAGCAG TGGCTGGTCA GGGGCGCTTC TAGCCTTCCC    1920
TATCTGTACT TCCACAGAGG TCTCTGCGAG CTAGGGGGAC AGTGAGGTGC GGGGTAGGGG    1980
CCCGGCGTTA GAGCCAGCAA GGGGACGGTT CACGGTAAGG TCTGAGGGAG AGAGAGCTCC    2040
TGAGAAACTT GGGGGGCGCG ACACAGATAG GGTGAAAGCA GAGTGATAGA CCTGGGATGG    2100
TTAGGGGACC AAGGGAAGAC CAGGCTGGTT GGCATACACC GGTGAACGGA TGGGAGTCCT    2160
AGGGAAAGAT GATGCGCCTA ACAGTCCTTT CTGTCTCCAC ACCACTCCAG GGGACGATCC    2220
GGAGCTCAAC TTTCAAAAGC GAGACGCCCC AGCAAGCCTG TTTTGAGAAG TTCTTCAGCG    2280
GCTCTCCTCA TGGGCCAGAC GGCCCTGGCA AGGGGCAGCA GCAGCACCCC TACCTCGCAG    2340
GCTCTGTACT CGGACTTCTC TCCTCCCGAG GGCTTGGAGG AGCTCCTGTC TGCTCCCCCT    2400
CCTGACCTGG TTGCCCAACG GCACCACGGC TGGAACCCCA AGGATTGCTC CGAGAACATC    2460
GATGTCAAGG AAGGGGGTCT GTGCTTTGAG CGGCGCCCTG TGGCCCAGAG CACTGATGGA    2520
GTCCGGGGGA AACGGGGCTA TTCGAGAGGT CTGCACGCCT GGGAGATCAG CTGGCCCCTG    2580
GAGCAAAGGG GCACACACGC CGTGGTGGGC GTGGCCACCG CCCTCGCCCC GCTGCAGGCT    2640
GACCACTATG CGGCGCTTTT GGGCAGCAAC AGCGAGTCCT GGGGCTGGGA TATTGGGCGG    2700
GGAAAATTGT ATCATCAGAG TAAGGGCCTC GAGGCCCCCC AGTATCCAGC TGGACCTCAG    2760
GGTGAGCAGC TAGTGGTGCC AGAGAGACTG CTGGTGGTTC TGGACATGGA GGAGGGGACT    2820
CTTGGCTACT CTATTGGGGG CACGTACCTG GGACCAGCCT TCCGTGGACT GAAGGGGAGG    2880
ACCCTCTATC CCTCTGTAAG TGCTGTTTGG GGCCAGTGCC AGGTCCGCAT CCGCTACATG    2940
GGCGAAAGAA GAGGTGAGAT ACGGACTAGG TGTGGGGAGA TCACTACTCT TGGCAATGGT    3000
TTGGGCTGGA AACTCATGGT TGGAGCACAG GAAGTAGGCT TCTTGTCACT TTGGCCTGTC    3060
ACTTAGATGG CCTTGGATCT AGCTTCACTC CCAATCCCTA TTGGATGTGA TGCACAAATT    3120
CAGAGCCTTT GGGTCTCCCT CAGCTGAGGT GGCGGTGGAA ATGGAGGAAG AAGGAAGGGT    3180
GCCTGAGCAG GATCTCAAGT TCAAGGATGC CTGGAGTTGC TTACTTACCT TGTCTTCCTT    3240
CTCTCTCCGC AGTGGAGGAA CCACAATCCC TTCTGCACCT GAGCCGCCTG TGTGTGCGCC    3300
ATGCTCTGGG GGACACCCGG CTGGGTCAAA TATCCACTCT GCCTTTGCCC CCTGCCATGA    3360
AGCGCTATCT GCTCTACAAA TGACCCAGTA GTACAGGGTG TGCTGGCACC CTACCGTGGG    3420
GACAGGTGGA GAGGCACCCG CTGGCCTAGA CAACTTTAAA AAGCTGGTGA AGCTGGGGGG    3480
GGGGGGCTGG ACCCCTTCAC CTCCCCTTCT CACAGGAGCA AGACATATAG AAATGATATT    3540
AAACACCATG GCAGCCTGGG ACAAAGAGGT TTTTGAAGTA AAAAATGAGA TGTATTGTCA    3600
CAACCTGTTT CATTATTGTT TTTTGTTTTG TTTTACACTC CCCCACCCCA GGCTAGAGCC    3660
CCATCACTGT CTTAAGGAAT TATGACAACC CACAAAGCTC AGGCCCAGGT GTTTATTTCC    3720
CTTACATGTA GGATGGTTCA CAAACACAAT ACAGGGGCTT TGGCACCGTG GGGGAGGGGA    3780
CTATCCCAGG CCTCTTAGGG TCTCATGTAT ACCGAATTCA GACCCGAAAG CTCTGAATTT    3840
CTGCATCAGA CATCCAGTAG AACTTGGGAG TGAAGCTAGA GCCAAGGCCA TCTAAGTGAC    3900
AGGCCAAAGT GACACGAAGC CCACTTCCTG TGCTCCAACC ATGAGTTTCC AGCCCAAACC    3960
AATGGAAGGT GATTTCACTT GTCAGGGCCC AAAGGGACAG TCAGTTCTAC TCCCTCCCCT    4020
CACTAGGAGC CACCTTGGTG ACAGTTGATT CTACCCACTG TAAGTGGTAA AGGGATTGGC    4080
CTGGTCCCAA CCATAATAGG GCGGTGGAAA CGGCTCAGGA GGGTACAGCG TGGATTAGGC    4140
CACAAGATGG GGCAGATGAT GTCATCAGAA GCATGTGACC GGTGGGAGCA GTTACTAAAC    4200
TTCTGGGCAA CCTAGTCCAT GCTATGCAGG CAGGTAGAGG GATGGGCAGT GCTCATTGTT    4260
TGGCATTGAT GATGTCCACA AATTCAGGCT TGAGAGATGC GCCACCCACA AGGAAGCCGT    4320
CCACGTCAGG CTGGCTTGCC AGCTCTTTGC AGGTTGCTCC AGTCACAGAA CCTGTACCAG    4380
GAACAAGAAG ACAGTTTGGT CAGGTCTATG ATCAGAACAC TTAAGCCCCA CCTCTCTGTG    4440
CAAGGCAGCC TCAGTCTGTC TTAGCCCATT TCCGTCTTAG CTAGAGCCAA AGCCACTCAC    4500
CTCCATAAAT GATCCGGGTG CTCTGAGCCA CCCCATCATT GACATTGGAT TTCAGCCATC    4560
CCCGGAGCTT CTCGTGTACT TCCTGTGCCT AGAAGGAGGA GGCAGAGCTA CTAAGTAAGC    4620
TCCTTCCTAT CTATCATTCA AGGAGTAAAA ACCACTGGTT CTCACATAGA GTTGAGTTTC    4680
CAGAAAAGCC CCGGGACCAG AGAGTGGCAA GGCTCCAATC CCACCAGGCT TGGAATGAAC    4740
ATTTTTGGCA AAGTCACTCT CCTTGGTGAG TTTGGGGGCC CTCTGTCTCT AAAGGGGCTT    4800
GGATGGGCTC CATAGCTGTG TGAGTCTGTT AAAGCCGGAC AGGCTGAGGA GCTCTGGGTA    4860
GTTACCTGCT GAGGGGTTGC CGTCTTGCCA GTCCCAATGG CCCACACAGG TTCATAGGCC    4920
AGGACCACCT TGCTCCAGTC TTTCACATTA TCTGTGGGGC AGAGAGGAGA GTGAGTAGGA    4980
AGGAGCTGAC CCGCCAAGC                                                 4999
(2)关于SEQ ID NO:46的信息
(i)序列特征
(A)长度:264个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:46:
Met Gly Gln Thr Ala Leu Ala Arg Gly Ser Ser Ser Thr Pro Thr Ser
1               5                   10                  15
Gln Ala Leu Tyr Ser Asp Phe Ser Pro Pro Glu Gly Leu Glu Glu Leu
            20                  25                  30
Leu Ser Ala Pro Pro Pro Asp Leu Val Ala Gln Arg His His Gly Trp
        35                  40                  45
Asn Pro Lys Asp Cys Ser Glu Asn Ile Asp Val Lys Glu Gly Gly Leu
    50                  55                  60
Cys Phe Glu Arg Arg Pro Val Ala Gln Ser Thr Asp Gly Val Arg Gly
65                  70                  75                  80
Lys Arg Gly Tyr Ser Arg Gly Leu His Ala Trp Glu Ile Ser Trp Pro
                85                  90                  95
Leu Glu Gln Arg Gly Thr His Ala Val Val Gly Val Ala Thr Ala Leu
            100                 105                 110
Ala Pro Leu Gln Ala Asp His Tyr Ala Ala Leu Leu Gly Ser Asn Ser
        115                 120                 125
Glu Ser Trp Gly Trp Asp Ile Gly Arg Gly Lys Leu Tyr His Gln Ser
    130                 135                 140
Lys Gly Leu Glu Ala Pro Gln Tyr Pro Ala Gly Pro Gln Gly Glu Gln
145                 150                 155                 160
Leu Val Val Pro Glu Arg Leu Leu Val Val Leu Asp Met Glu Glu Gly
                165                 170                 175
Thr Leu Gly Tyr Ser Ile Gly Gly Thr Tyr Leu Gly Pro Ala Phe Arg
            180                 185                 190
Gly Leu Lys Gly Arg Thr Leu Tyr Pro Ser Val Ser Ala Val Trp Gly
        195                 200                 205
Gln Cys Gln Val Arg Ile Arg Tyr Met Gly Glu Arg Arg Val Glu Glu
    210                 215                 220
Pro Gln Ser Leu Leu His Leu Ser Arg Leu Cys Val Arg His Ala Leu
225                 230                 235                 240
Gly Asp Thr Arg Leu Gly Gln Ile Ser Thr Leu Pro Leu Pro Pro Ala
                245                 250                 255
Met Lys Arg Tyr Leu Leu Tyr Lys
            260
(2)关于SEQ ID NO:47的信息:
(i)序列特征
(A)长度:5615个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:47:
GTACTTTCTT TATATCTCCA TAATTTTATT TACTATTACT ACATGATACA TTATTTTATA   60
AAAGTCTTTG TAACCTCCTT AAGGATTCAC TGCTTAATCT CCAGTGCTTA GCACAAATCA   120
TTAAATGCGA ACCAGAAACT CTTCCAAATG TGTTACATCT ATAACCTCAT TGGATTCTCA   180
CTACCAACCC CATGCAATAG ATACTAATGT GATCTCTGTC TTACAGAGGA AGAAACAGGC   240
ACAGGGAGGT TCAGTAATTT GCCCAAGGTC ATACACACAC TGGCCTTCAG GTATTCATGC   300
CCGGGGAGTC TGGTCCCACA GCTGGCATGT TTGCCATTAT ATTATATTGC CTCCTTATAG   360
TGTCGGCACT CATTAAGCAC ATTGACAGCT ATGCTTGGTG AGTGACTACT ATGTACCCAG   420
CTCTGTGCTA CATGCTTTAC CTGGATTATT TCAACTGCAC AACAACCCTG TGAGGTAACT   480
ACCATCATTG CTCCTATTTT ACATAACAGA AAACTACAGA AATCTGGGGC TGGGCGTAGT   540
GGCTCATGCC TGAAATCCCA GCACTTTGGG AGACCCTGTC TCTAAAAAAA ATTTTTTTTT   600
GGCCGGACGT GGTGGCTCAC ACCTGTAATC TCAGCACTTT GGGAGGCTAA GGCAGGCAGA   660
TCACAAGGTC AGGAGTTCTA GACCAGCCTG GCCAACATGG CAAAACCCTG TGTCTACTAA   720
AAATACAAAA AATAGCTAGG CGTGGTGGCA GGTGCCTGTA ATCCCAGCTA CTCAGGAGGC   780
TGAGGCAGGA GAATCCCCTG AACCTGGGAG ATGGAGGTTA CAGAGAGCCG AGATCGTGCC   840
GCTGCACTCC AGCCTGGGCA ACAAGAGCAA GACTCTGTCT CGAAAAAAAT AAAAATAAAA   900
ATAAAAATAT TTTTTTAAAA ATTAGCTGGG TGTGGTAGCA CATGCCTGTA GTCCCAGCTA   960
CTTGGGAGGC TGAGGTAGGA GGATCACTTG AGCCCAGGAG GTCAAGGCTG CAGTGGGCTG   1020
TGATGGCGCC ACTGCACTCT AGCCTTGGTG ACAGCAAGAC CCTGTCTCAA AAAAAAAAAA   1080
AAGAGAAATC GGGCAACTTC CCCAAGATCG CGCAGTTAAC TAGTGGCATA GCTTCACTCA   1140
AACTCGAAGT CTTAATCAGG ACACTCTACC AAATGAGATC AACGGCTCAG TAATGGATTG   1200
GCATCCAGTA TGAAGACTGG ACCAGCAGGG AGAACTATGA TGCGTACAGC CTAGAGCCTG   1260
AAGCAGATTT CACAGCCTCA GAGGTGGCAC AGGCTGACTC ACAACCCGGG GCAGAAAGGG   1320
ACCAGCCCAG AAACAGTGAC CCAGAATCAC AGGGAAGTAG AAATGGGATT CGGCACAATG    1380
AAGCCCCTCC TTGACCCCAT GCTCCTTACC CTCAGGGGCG CAGGAGTTAG TCGCTCAGGC    1440
GGCTCAAAGG TCTTGACGGT GGAGAACACC ATCCCCAGGG ATTCCCGACG CGGTGATGCC    1500
ATCAAAGCGT TAATTCTGAG ATGGGCCTGC CCGGGTGCGG ACTCTGCCGC AGCAAGAGAA    1560
GGGTTAACTG CCCCGGGCCT TCGCCGTGGG GGCGGGGCCT CGGGGAGGGT CACAGCCCGG    1620
GACTGAGACC CGAGGTTAAC CGCCCGGGGT GGGCTCCACG GGGGCGGGGC ATGCTCTCCG    1680
CGGCTGCTGC CGGTATAGAG CGGTAACTGC CCAGGAGGGG GCGGGGCCCC ACAGGGGCGT    1740
GGCCTCGGAG CTGCACGGCC GTGGGCGGCG ATGAGAGGGT TAAGCCCCAG AGGGCCCTGG    1800
AGGGGCGGGG CCGCGGGACG GGCTCGGCCC AAGGGAGGAG CTGGGGGCGG AAGCGGCCGG    1860
CGGTCTGCGC CCTGCGCGCC TCGGCTTCTT TCCGCCCGGC TCCTTCAGAG GCCCGGCGAC    1920
CTCCAGGGCT GGGAAGTCAA CCGAGGTTCG GGGGCAGCGG CGAGGGCTCC GGGCGAGTAA    1980
GGGGGATGGT CCATGCTGAG GCCCAAATGG GGCGAACTCG CGAGAGTCTC TGGCGACCTG    2040
GATCAGATGG GGCGAGGGCA GATGAAGGGC CCAGGAGCTT TGGGGCAGCG AGGAGGGAGG    2100
AGCGGGCCCG TTGGCAAACT TGGGTGAAAG GATGGGGTAC CTGGGTGACG AGCCCCCGCC    2160
AGGATTCTGC TCTTCACGCC CCTTTTCTCC CAGCTCCCTT CCAGGTCAAT CCAAACTGGA    2220
GCTCAACTTT CAGAAGAGAA AGACGCCCCA GCAAGCCTCT TTCGGGGAGT CCTCTAGCTC    2280
CTCACCTCCA TGGGCCAGAC AGCTCTGGCA GGGGGCAGCA GCAGCACCCC CACGCCACAG    2340
GCCCTGTACC CTGACCTCTC CTGTCCCGAG GGCTTGGAAG AGCTGCTGTC TGCACCCCCT    2400
CCTGACCTGG GGGCCCAGCG GCGCCACGGT TGGAACCCCA AAGACTGTTC AGAGAACATC    2460
GAGGTCAAGG AAGGAGGGTT GTACTTTGAG CGGCGGCCCG TGGCCCAGAG CACTGATGGG    2520
GCCCGGGGTA AGAGGGGCTA TTCAAGGGGC CTGCACGCCT GGGAGATCAG CTGGCCCCTA    2580
GAGCAGAGGG GCACGCATGC CGTGGTGGGC GTGGCCACGG CCCTCGCCCC GCTGCAGACT    2640
GACCACTACG CGGCGCTGCT GGGCAGCAAC AGCGAGTCGT GGGGCTGGGA CATCGGGCGG    2700
GGGAAGCTGT ACCATCAGAG CAAGGGGCCC GGAGCCCCCC AGTATCCAGC GGGAACTCAG    2760
GGTGAGCAGC TGGAGGTGCC AGAGAGACTG CTGGTGGTTC TGGACATGGA GGAGGGAACT    2820
CTGGGCTACG CTATTGGGGG CACCTACCTG GGGCCAGCAT TCCGCGGACT GAAGGGCAGG    2880
ACCCTCTATC CGGCAGTAAG CGCTGTCTGG GGCCAGTGCC AGGTCCGCAT CCGCTACCTG    2940
GGCGAAAGGA GAGGTGAGGC CTGGGGCAGA CGTGGGGAGA ACTTTCTGTC CCTGGTGGCA    3000
GTGGTTTGGG ATGGAAACTC TTCTGACAAG AGCAGAGGGG ATGGACCTTC ATCCAGCCTG    3060
CCTCAACCTC TGTTCAGTGC TGGGAAAGGC TAGGGGTCTT CACAGCTGTT ATTTAATTTA    3120
ACCCAACAGC AATAGAGGTG AAACAGGCTT GAGAAAGCAA CTTTCTCAAG TTCTCTTGGC    3180
CAGTAAATGG TGAACCTTCA GAATGGAGGG AGGAACTGCA GGGATGAGAG AATTCAGGAG    3240
ATATCAACCC CTGAGCAAGA GGTGCAAAGC GTTAGGTACT GGGTTTGATG TACAGGTCCA    3300
AAAGAAGGAT GGGCAGAGCC AGGTACCCAG GCTGTATACC GGATTCCCTG GGCTCTAACC    3360
TGTCTCTGTG CCACATACCT ACTTCCTTCC TCAGCCACAC CTCTGGATGG AGACACTGGG    3420
GCCCTGGGCA CCAGGGAGGA GAGCAGTGGA GGAGGCAGGG CCTTAGGGTG GGGCAGCAGG    3480
GGAGGAGCCT CCCCAGGAAC TGACTGGGTC CAGGGCTTGG AGCTGCTCTC TGCAGTTGTG    3540
TGGGCTGTAG AGTGGAGGGC CATCCCTCCT CACCTCAGCC CCAGCTCCCA AGCCTCTGGA    3600
GTCAAAGCCT GGGCCAGCTC CACCACTGTC AGAGCCACCT TGGCCTGTTG TTTAGAGGGC    3660
CTTAGCCAGC TCTTCACCCC CAGCTCTGAC TAGGGATGTG TGAAATCTTA TCTGGGAGGC    3720
AGAACTTCCG GGTATCTCAA ATTCCCCTTT CAGCCAGGTG GGCACACTCG AAGCAGGAAA    3780
GCAGAAAGGC ATCTGAGTAG GACCCCGTAG TTTGAGGACA TCTGGCTGGT GGCTGCACCC    3840
ATACTTACAT TCCCCTCCTT CTCTCTCCCA GCGGAGCCAC ACTCCCTTCT GCACCTGAGC    3900
CGCCTGTGTG TGCGCCACAA CCTGGGGGAT ACCCGGCTCG GCCAGGTGTC TGCCCTGCCC    3960
TTGCCCCCTG CCATGAAGCG CTACCTGCTC TACCAGTGAG CCCTGTGATA CCACAGACTG    4020
TGCTGAGGTC TTGCCACCAC CCCTCCCCTT GGGGAGGTGG GGAGGCACTG CTGGCCTAGA    4080
CCAGCTGCTG AAAGCTGGTG AGGCTGAGCC CCTACCCCAA CCCAAGCTCT GCGGAAATCA    4140
ACAGCCCCAG AGCCACTTGG AGGGAGGAAG AAAGGGAGCC GGCGTTCAAG GCTATGACAG    4200
TCTGCTACGC AAAACATTTT TTCAAGTAAA AATAGTAAGA GATGTTGTTA TAGAAACCTG    4260
TTCTTGTTTT TTTTTTTTTC TTGCACAAAT GATCATTTAT ATAGCTGCCT CAAAAAGGAA    4320
GATTATCTGG GCAAGTCCAG TGAAGGCAGA CAAACCACAA GACCTAGTGC CAGGTTTATT    4380
CCCTCACATG GGTGGTTCAC ATACACAGCA CAGAGGCACG GGCACCATGG GAGAGGGCAG    4440
CACTCCTGCC TTCTGAGGGG ATCTTGGCCT CACGGTGTAA GAAGGGAGAG GATGGTTTCT    4500
CTTCTGCCCT CACTAGGGCC TAGGGAACCC AGGAGCAAAT CCCACCACGC CTTCCATCTC    4560
TCAGCCAAGG AGAAGCCACC TTGGTGACGT TTAGTTCCAA CCATTATAGT AAGTGGAGAA    4620
GGGATTGGCC TGGTCCCAAC CATTACAGGG TGAAGATATA AACAGTAAAG GAAGATACAG    4680
TTTGGATGAG GCCACAGGAA GGAGCAGATG ACACCATCAG AAGCATATGC AGGGAAAGGG    4740
CAGTTACTGG GCTTCTGGGC TGCTTAGTCC CTGGCTTGGC AGGAAGGGTA GGGAAGATGG    4800
ATGGGGCTCA TTGTTTGGCA TTGATGATGT CCACGAATTC GGGCTTGAGG GAAGCACCAC    4860
CCACAAGGAA GCCATCCACA TCAGGCTGGC TGGCCAGCTC CTTGCAGGTT GCCCCAGTCA    4920
CAGAGCCTGG GAAGGGAGCA GAACAAGGGC TTGGTCAAGA ATGGGATGAG TCTGCCCCAT    4980
CCCCACCTCC ATGTCCGAGG GCTCAGTCTA GTCCTCAGCC CACTCCACCT CAGCCGGGAA    5040
CCAAAGCCAC TCACCTCCAT AAATGATACG GGTGCTCTGA GCCACCGCAT CAGAGACGTT    5100
GGACTTCAGC CATCCTCGGA GCTTCTCGTG TACTTCCTGG GCCTAGAACA AGAAGCTGGC    5160
CTAAGTAAGA CCTTTTCTGC CTCTCTAAGA GGAAAAATCA CTGGCACCAG TGGACACTTA    5220
GTGTGGTTTC TGACTGAGTC AGAGTACCAG GGCTCTGATC CAAGCCAGGC CCTGGACTGG    5280
ATGCCCTTGG ACAAGTCACT GTCTCTGGGT TCAAGGTCTC TGTGTCTTTG AAATAAGGGG    5340
TTGCCCCATG TGGGCTGTGT CTGTCCAAAC CTATTGAGGC AGGCTGGGAT GAGGGCAGGG    5400
CTCCTGGGCC CGGTTACCTG TTGGGGTGTT GCAGTCTTGC CAGTACCAAT GGCCCACACA    5460
GGCTCATAGG CCAGGACGAC CTTGCTCCAG TCCTTCACGT TATCTGCAGG GCAGAGATAC    5520
AGATGGAGGG AAGGGTGAAC AAGAAAGAGC TCTCCAGCCA GGTTCTCCGG AGTACGAAGA    5580
ACGGTGGCCT ACTGCCCCCT AGTGGACATT GGGGG                               5615
(2)关于SEQ ID NO:48的信息:
(i)序列特征
(A)长度:263个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:48:
Met Gly Gln Thr Ala Leu Ala Gly Gly Ser Ser Ser Thr Pro Thr Pro
1               5                   10                  15
Gln Ala Leu Tyr Pro Asp Leu Ser Cys Pro Glu Gly Leu Glu Glu Leu
            20                  25                  30
Leu Ser Ala Pro Pro Pro Asp Leu Gly Ala Gln Arg Arg His Gly Trp
        35                  40                  45
Asn Pro Lys Asp Cys Ser Glu Asn Ile Glu Val Lys Glu Gly Gly Leu
    50                  55                  60
Tyr Phe Glu Arg Arg Pro Val Ala Gln Ser Thr Asp Gly Ala Arg Gly
65                  70                  75                  80
Lys Arg Gly Tyr Ser Arg Gly Leu His Ala Trp Glu Ile Ser Trp Pro
                85                  90                  95
Leu Glu Gln Arg Gly Thr His Ala Val Val Gly Val Ala Thr Ala Leu
            100                 105                 110
Ala Pro Leu Gln Thr Asp His Tyr Ala Ala Leu Leu Gly Ser Asn Ser
        115                 120                 125
Glu Ser Trp Gly Trp Asp Ile Gly Arg Gly Lys Leu Tyr His Gln Ser
    130                 135                 140
Lys Gly Pro Gly Ala Pro Gln Tyr Pro Ala Gly Thr Gln Gly Glu Gln
145                 150                 155                 160
Leu Glu Val Pro Glu Arg Leu Leu Val Val Leu Asp Met Glu Glu Gly
                165                 170                 175
Thr Leu Gly Tyr Ala Ile Gly Gly Thr Tyr Leu Gly Pro Ala Phe Arg
            180                 185                 190
Gly Leu Lys Gly Arg Thr Leu Tyr Pro Ala Val Ser Ala Val Trp Gly
        195                 200                 205
Gln Cys Gln Val Arg Ile Arg Tyr Leu Gly Glu Arg Arg Ala Glu Pro
    210                 215                 220
His Ser Leu Leu His Leu Ser Arg Leu Cys Val Arg His Asn Leu Gly
225                 230                 235                 240
Asp Thr Arg Leu Gly Gln Val Ser Ala Leu Pro Leu Pro Pro Ala Met
                245                 250                 255
Lys Arg Tyr Leu Leu Tyr Gln
            260
(2)关于SEQ ID NO:49的信息
(i)序列特征
(A)长度:28个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:49:
AGCTAGATCT GGACCCTACA ATGGCAGC                           28
(2)关于SEQ ID NO:50的信息
(i)序列特征
(A)长度:36个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:50:
AGCTAGATCT GCCATCCTAC TCGAGGGGCC AGCTGG                         36

Claims (40)

1. 一种核酸分子,包含编码在其C末端区域含有SOCS元件盒的蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核苷酸序列的核酸分子或在42℃低严格条件下与其杂交的核酸分子。
2. 根据权利要求1所述的核苷酸序列,其中蛋白进一步包含蛋白:分子相互作用区域。
3.根据权利要求1所述的核苷酸序列,其中蛋白:分子相互作用区域位于SOCS元件盒的N端区域。
4. 根据权利要求2或3所述的核苷酸序列,其中蛋白:分子相互作用区域是蛋白:分子结合区域或蛋白:蛋白结合区域。
5. 根据权利要求4所述的核苷酸序列,其中蛋白:分子相互作用区域是一个或多个SH2结构域、WD-40重复或锚蛋白重复。
6. 根据权利要求1-5中的任意一项所述的核苷酸序列,其中SOSC元件盒包含如下氨基酸序列:
X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]nX17X18X19X20X21X22X23[Xj]n X24X25X26X27X28
其中,X1是L,I,V,M,A或P;
X2是任何氨基酸残基;
X3是P,T或S;
X4是L,I,V,M,A或P;
X5是任何氨基酸;
X6是任何氨基酸;
X7是L,I,V,M,A,F,Y或W;
X8是C,T或S;
X9是R,K或H;
X10是任何氨基酸;
X11是任何氨基酸;
X12是L,I,V,M,A或P;
X13是任何氨基酸;
X14是任何氨基酸;
X15是任何氨基酸;
X16是L,I,V,M,A,P,G,C,T或S;
[Xi]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X17是L,I,V,M,A或P;
X18是任何氨基酸;
X19是任何氨基酸;
X20L,I,V,M,A或P;
X21是P;
X22是L,I,V,M,A,P或G;
X23是P或N;
[Xj]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X24是L,I,V,M,A或P;
X25是任何氨基酸;
X26是任何氨基酸;
X27是Y或F;
X28是L,I,V,M,A或P。
7. 根据权利要求6所述的核苷酸序列,其中蛋白调节信号传导。
8. 根据权利要求7所述的核苷酸序列,其中信号传导由细胞因子、激素、微生物群体或微生物产物、寄生物、抗原或其它效应物分子调节。
9. 根据权利要求8所述的核苷酸序列,其中蛋白调节细胞因子介导的信号传导。
10. 根据权利要求9所述的核苷酸序列,其中信号传导由一个或多个细胞因子EPO、TPO、G-CSF、GM-CSF、IL-3、IL-2、IL-4、IL-7、IL-13、IL-6、LIF、IL-12、IFNγ、TNFα、IL-1和/或M-CSF介导。
11. 根据权利要求10所述的核苷酸序列,其中信号传导由一个或多个IL-6、LIF、OSM、IFNγ和/或促血小板生成素介导。
12. 根据权利要求11所述的核苷酸序列,其中信号传导由IL-6介导。
13. 根据权利要求1所述的核苷酸序列,其中核苷酸序列编码主要如SEQ ID NO.4,SEQ ID NO.6,SEQ ID NO.8,SEQ ID NO.10,SEQID NO.12,SEQ ID NO.14,SEQ ID NO.18,SEQ ID NO.21,SEQ IDNO.25,SEQ ID NO.29,SEQ ID NO.36,SEQ ID NO.41,SEQ IDNO.44,SEQ ID NO.46或SEQ ID NO.48中所列出的氨基酸序列或与列出的序列的全部或部分有至少约15%相似性的氨基酸序列,或在42℃低严格条件下与核酸分子杂交的核苷酸序列。
14. 根据权利要求1所述的核苷酸序列,其中核苷酸序列主要如SEQ ID NO.3,SEQ ID NO.5,SEQ ID NO.7,SEQ ID NO.9,SEQ IDNO.11,SEQ ID NO.13,SEQ ID NO.15,SEQ ID NO.16,SEQ IDNO.17,SEQ ID NO.20,SEQ ID NO.22,SEQ ID NO.23,SEQ IDNO.24,SEQ ID NO.26,SEQ ID NO.27,SEQ ID NO.28,SEQ IDNO.30,SEQ ID NO.31,SEQ ID NO.32,SEQ ID NO.33,SEQ IDNO.34,SEQ ID NO.35,SEQ ID NO.37,SEQ ID NO.38,SEQ IDNO.39,SEQ ID NO.40,SEQ ID NO.42,SEQ ID NO.43,SEQ ID NO.45或SEQ ID NO.47的核苷酸序列或与所列出的序列的全部或部分有至少15%相似性的核苷酸序列或在42℃低严格条件下能与列出的序列杂交的核苷酸序列。
15. 一种核酸分子,包含编码表现以下特征的蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核苷酸序列的核酸分子或在42℃低严格条件下与其杂交的核酸分子:
(i)在其C末端包含具有以下氨基酸序列的SOCS元件盒:
X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]n X17X18X19X20X21X22X23[Xj]nX24X25X26X27X28
其中,X1是L,I,V,M,A或P;
X2是任何氨基酸残基;
X3是P,T或S;
X4是L,I,V,M,A或P;
X5是任何氨基酸;
X6是任何氨基酸;
X7是L,I,V,M,A,F,Y或W;
X8是C,T或S;
X9是R,K或H;
X10是任何氨基酸;
X11是任何氨基酸;
X12是L,I,V,M,A或P;
X13是任何氨基酸;
X14是任何氨基酸;
X15是任何氨基酸;
X16是L,I,V,M,A,P,G,C,T或S;
[Xi]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X17是L,I,V,M,A或P;
X18是任何氨基酸;
X19是任何氨基酸;
X20L,I,V,M,A或P;
X21是P;
X22是L,I,V,M,A,P或G;
X23是P或N;
[Xj]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X24是L,I,V,M,A或P;
X25是任何氨基酸;
X26是任何氨基酸;
X27是Y或F;
X28是L,I,V,M,A或P;
(ii)在SOCS元件盒N端区域内包含至少一个SH2结构域、WD-40重复和/或锚蛋白重复或其它蛋白:分子相互作用结构域;并且
(iii)调节信号传导。
16. 在其C末端区域含有SOCS元件盒的分离的蛋白或其衍生物、同系物或模拟物。
17. 根据权利要求16所述的分离的蛋白,其中蛋白进一步包含蛋白:分子相互作用区域。
18. 根据权利要求17所述的分离的蛋白,其中蛋白:分子相互作用区域位于SOCS元件盒的N端区域。
19. 根据权利要求16或17所述的分离的蛋白,其中蛋白:分子相互作用区域是蛋白:DNA结合区域或蛋白:蛋白结合区域。
20. 根据权利要求19所述的分离的蛋白,其中蛋白:分子相互作用区域是一个或多个SH2结构域、WD-40重复或锚蛋白重复。
21. 根据权利要求16-20中的任意一项所述的分离的蛋白,其中SOCS元件盒包含如下氨基酸序列:
X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]nX17X18X19X20X21X22X23[Xj]nX24X25X26X27X28
其中,X1是L,I,V,M,A或P;
X2是任何氨基酸残基;
X3是P,T或S;
X4是L,I,V,M,A或P;
X5是任何氨基酸;
X6是任何氨基酸;
X7是L,I,V,M,A,F,Y或W;
X8是C,T或S;
X9是R,K或H;
X10是任何氨基酸;
X11是任何氨基酸;
X12是L,I,V,M,A或P;
X13是任何氨基酸;
X14是任何氨基酸;
X15是任何氨基酸;
X16是L,I,V,M,A,P,G,C,T或S;
[Xi]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X17是L,I,V,M,A或P;
X18是任何氨基酸;
X19是任何氨基酸;
X20L,I,V,M,A或P;
X21是P;
X22是L,I,V,M,A,P或G;
X23是P或N;
[Xj]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X24是L,I,V,M,A或P;
X25是任何氨基酸;
X26是任何氨基酸;
X27是Y或F;
X28是L,I,V,M,A或P。
22. 根据权利要求21所述的分离的蛋白,其中蛋白调节信号传导。
23. 根据权利要求22所述的分离的蛋白,其中信号传导由细胞因子或其它内源分子、激素、微生物群体或微生物产物,寄生物、抗原或其它效应物分子调节。
24. 根据权利要求23所述的分离的蛋白,其中蛋白调节细胞因子介导的信号传导。
25. 根据权利要求24所述的分离的蛋白,其中信号传导由一个或多个细胞因子EPO、TPO、G-CSF、GM-CSF、IL-3、IL-2、IL-4、IL-7、IL-13、IL-6、LIF、IL-12、IFNγ、TNFα、IL-1和/或M-CSF介导。
26. 根据权利要求25所述的分离的蛋白,其中信号传导由一个或多个IL-6、LIF、OSM、IFNγ和/或促血小板生成素介导。
27. 根据权利要求26述的分离的蛋白,其中信号传导由IL-6介导。
28. 根据权利要求16所述的分离的蛋白,其中核苷酸序列编码主要如SEQ ID NO.4,SEQ ID NO.6,SEQ ID NO.8,SEQ ID NO.10,SEQID NO.12,SEQ ID NO.14,SEQ ID NO.18,SEQ ID NO.21,SEQ IDNO.25,SEQ ID NO.29,SEQ ID NO.36,SEQ ID NO.41,SEQ IDNO.44,SEQ ID NO.46或SEQ ID NO.48中所列出的氨基酸序列或与列出的序列的全部或部分有至少约15%相似性的氨基酸序列或在42℃低严格条件下与核酸分子杂交的核苷酸序列。
29. 根据权利要求16所述的核苷酸序列,其中核苷酸序列主要如SEQ ID NO.3,SEQ ID NO.5,SEQ ID NO.7,SEQ ID NO.9,SEQ IDNO.11,SEQ ID NO.13,SEQ ID NO.15,SEQ ID NO.16,SEQ IDNO.17,SEQ ID NO.20,SEQ ID NO.22,SEQ ID NO.23,SEQ IDNO.24,SEQ ID NO.26,SEQ ID NO.27,SEQ ID NO.28,SEQ IDNO.30,SEQ ID NO.31,SEQ ID NO.32,SEQ ID NO.33,SEQ IDNO.34,SEQ ID NO.35,SEQ ID NO.37,SEQ ID NO.38,SEQ IDNO.39,SEQ ID NO.40,SEQ ID NO.42,SEQ ID NO.43,SEQ ID NO.45或SEQ ID NO.47的核苷酸序列或与所列出的序列的全部或部分有至少15%相似性的核苷酸序列或在42℃低严格条件下能与列出的序列杂交的核苷酸序列。
30. 具有以下特征的分离的蛋白或其衍生物、同系物、类似物或模拟物:
(i)在其C末端包含SOCS元件盒,所述SDCS元件包含以下氨基酸序列:
X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]nX17X18X19X20X21X22X23[Xj]nX24X25X26X27X28
其中,X1是L,I,V,M,A或P;
X2是任何氨基酸残基;
X3是P,T或S;
X4是L,I,V,M,A或P;
X5是任何氨基酸;
X6是任何氨基酸;
X7是L,I,V,M,A,F,Y或W;
X8是C,T或S;
X9是R,K或H;
X10是任何氨基酸;
X11是任何氨基酸;
X12是L,I,V,M,A或P;
X13是任何氨基酸;
X14是任何氨基酸;
X15是任何氨基酸;
X16是L,I,V,M,A,P,G,C,T或S;
[Xi]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X17是L,I,V,M,A或P;
X18是任何氨基酸;
X19是任何氨基酸;
X20L,I,V,M,A或P;
X21是P;
X22是L,I,V,M,A,P或G;
X23是P或N;
[Xj]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X24是L,I,V,M,A或P;
X25是任何氨基酸;
X26是任何氨基酸;
X27是Y或F;
X28是L,I,V,M,A或P;
(ii)在SOCS元件盒N端区域内包含至少一个SH2结构域、WD-40重复和/或锚蛋白重复或其它蛋白:分子相互作用结构域;并且
(iii)调节信号传导。
31. 调节细胞中SOCS蛋白水平的方法,该方法包括使含有SOCS基因的细胞与有效量的SOCS基因表达或SOCS蛋白活性的调节剂在足以调节所述SOCS蛋白水平的条件下接触一段时间。
32. 在含SOCS基因的细胞中调节信号传导的方法,包括使所述细胞与有效量的SOCS基因表达或SOCS蛋白活性的调节剂接触足以调节信号传导的一段时间。
33. 影响其中至少一种细胞带有SOCS基因的细胞间相互作用的方法,该方法包括使带有SOCS基因的细胞与有效量的SOCS基因表达或SOCS蛋白活性的调节剂接触足以调节信号传导的一段时间。
34. 根据权利要求31-33中的任意一项所述的方法,其中信号传导由细胞因子、激素、微生物群体或微生物产物、寄生物、抗原或其它效应物分子调节。
35. 根据权利要求34所述的方法,其中信号传导由一个或多个细胞因子EPO、TPO、G-CSF、GM-CSF、IL-3、IL-2、IL-4、IL-7、IL-13、IL-6、LIF、IL-12、IFN γ、TNF α、IL-1和/或M-CSF介导。
36. 根据权利要求35所述的方法,其中信号传导由一个或多个IL-6、LIF、OSM、IFN γ和/或促血小板生成素介导。
37. 根据权利要求36所述的方法,其中信号传导由IL-6介导。
38. 根据权利要求31-37中的任意一项所述的方法,其中SOSC基因编码带有含如下氨基酸序列的SOCS元件盒的蛋白:
X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]n X17X18X19X20X21X22X23[Xj]nX24X25X26X27X28
其中,X1是L,I,V,M,A或P;
X2是任何氨基酸残基;
X3是P,T或S;
X4是L,I,V,M,A或P;
X5是任何氨基酸;
X6是任何氨基酸;
X7是L,I,V,M,A,F,Y或W;
X8是C,T或S;
X9是R,K或H;
X10是任何氨基酸;
X11是任何氨基酸;
X12是L,I,V,M,A或P;
X13是任何氨基酸;
X14是任何氨基酸;
X15是任何氨基酸;
X16是L,I,V,M,A,P,G,C,T或S;
[Xi]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X17是L,I,V,M,A或P;
X18是任何氨基酸;
X19是任何氨基酸;
X20L,I,V,M,A或P;
X21是P;
X22是L,I,V,M,A,P或G;
X23是P或N;
[Xj]n是n个氨基酸的序列,其中n是从1到50个氨基酸,而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸;
X24是L,I,V,M,A或P;
X25是任何氨基酸;
X26是任何氨基酸;
X27是Y或F;
X28是L,I,V,M,A或P。
39. 根据权利要求38所述的方法,其中SOCS基因包含选自SEQID NO.3,SEQ ID NO.5,SEQ ID NO.7,SEQ ID NO.9,SEQ ID NO.11,SEQ ID NO.13,SEQ ID NO.15,SEQ ID NO.16,SEQ ID NO.17,SEQID NO.20,SEQ ID NO.22,SEQ ID NO.23,SEQ ID NO.24,SEQ IDNO.26,SEQ ID NO.27,SEQ ID NO.28,SEQ ID NO.30,SEQ IDNO.31,SEQ ID NO.32,SEQ ID NO.33,SEQ ID NO.34,SEQ IDNO.35,SEQ ID NO.37,SEQ ID NO.38,SEQ ID NO.39,SEQ IDNO.40,SEQ ID NO.42,SEQ ID NO.43,SEQ ID NO.45或SEQ IDNO.47的核苷酸序列。
40. 根据权利要求38所述的方法,其中SOCS基因编码包含主要如SEQ ID NO.4,SEQ ID NO.6,SEQ ID NO.8,SEQ ID NO.10,SEQID NO.12,SEQ ID NO.14,SEQ ID NO.18,SEQ ID NO.21,SEQ IDNO.25,SEQ ID NO.29,SEQ ID NO.36,SEQ ID NO.41,SEQ IDNO.44,SEQ ID NO.46或SEQ ID NO.48中所列出的氨基酸序列的蛋白。
CNA2006101359229A 1996-11-01 1997-10-31 能调节对细胞因子的细胞反应性的治疗和诊断制剂 Pending CN101280305A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
AUPO3384A AUPO338496A0 (en) 1996-11-01 1996-11-01 Therapeutic and diagnostic agents
AUPO3384 1996-11-01
AUPO5117A AUPO511797A0 (en) 1997-02-14 1997-02-14 Therapeutic and diagnostic agents-II
AUPO5117 1997-02-14

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN97180920A Division CN1253565A (zh) 1996-11-01 1997-10-31 能调节对细胞因子的细胞反应性的治疗和诊断制剂

Publications (1)

Publication Number Publication Date
CN101280305A true CN101280305A (zh) 2008-10-08

Family

ID=25645307

Family Applications (2)

Application Number Title Priority Date Filing Date
CN97180920A Pending CN1253565A (zh) 1996-11-01 1997-10-31 能调节对细胞因子的细胞反应性的治疗和诊断制剂
CNA2006101359229A Pending CN101280305A (zh) 1996-11-01 1997-10-31 能调节对细胞因子的细胞反应性的治疗和诊断制剂

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN97180920A Pending CN1253565A (zh) 1996-11-01 1997-10-31 能调节对细胞因子的细胞反应性的治疗和诊断制剂

Country Status (13)

Country Link
US (1) US20080166730A1 (zh)
EP (2) EP0948522B1 (zh)
JP (2) JP2001502183A (zh)
KR (2) KR20000053017A (zh)
CN (2) CN1253565A (zh)
AT (1) ATE398136T1 (zh)
CA (1) CA2270171A1 (zh)
DE (1) DE69738767D1 (zh)
DK (1) DK0948522T3 (zh)
ES (1) ES2308785T3 (zh)
GB (1) GB2331753A (zh)
NO (1) NO992116L (zh)
WO (1) WO1998020023A1 (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6495518B1 (en) 1994-06-13 2002-12-17 Vanderbilt University Method for importing biologically active molecules into cells
CA2230986A1 (en) * 1997-05-07 1998-11-07 Smithkline Beecham Corporation Epo primary response gene 1, eprg1
AU8484698A (en) * 1997-07-18 1999-02-10 Schering Corporation Suppressors of cytokine signaling socs16; related reagents
EP0970215A1 (en) * 1997-11-03 2000-01-12 Incyte Pharmaceuticals, Inc. Suppressor of cytokine signaling
CA2320226A1 (en) * 1998-02-11 1999-08-19 Beth Israel Deaconess Medical Center Methods and compositions for modulating leptin activity
JP2002507418A (ja) * 1998-03-23 2002-03-12 スミスクライン・ビーチャム・パブリック・リミテッド・カンパニー サイトカインシグナル伝達のサプレッサー
EP0953636A3 (en) * 1998-03-23 2000-03-29 Smithkline Beecham Plc Cytokine signal regulators
US6620382B1 (en) * 1998-05-22 2003-09-16 Biopheresis Technologies, Llc. Method and compositions for treatment of cancers
CA2329053A1 (en) * 1998-05-28 1999-12-02 Incyte Pharmaceuticals, Inc. Human socs proteins
SE9803398D0 (sv) * 1998-10-06 1998-10-06 Sahltech Ab "New use"
US7078174B1 (en) 1998-12-21 2006-07-18 The Walter & Eliza Hall Institute Of Medical Research Screening methods using SOCS box-containing peptides
AU4651900A (en) * 1999-04-20 2000-11-02 Beth Israel Deaconess Medical Center Methods and compositions for modulating ciliary neurotrophic factor activity
US6541244B1 (en) * 1999-06-07 2003-04-01 Cedars-Sinai Medical Center Suppressor of cytokine signaling (SOCS)-3 promoter and methods for its use in genetic therapy in humans
DE60038977D1 (de) * 1999-11-16 2008-07-03 Inst Medical W & E Hall Tiermodell für hormonsignalstudien und verfahren zum verändern der signalübertragung
AU784277B2 (en) * 1999-11-16 2006-03-02 Walter And Eliza Hall Institute Of Medical Research, The An animal model for studying hormone signalling and method of modulating the signalling
AU2001251612A1 (en) * 2000-04-14 2001-10-30 Millennium Pharmaceuticals, Inc. Roles of jak/stat family members in tolerance induction
WO2002030184A1 (en) * 2000-10-09 2002-04-18 Amrad Operations Pty Ltd Modulating cytokine or hormone signalling in an animal comprising up-regulating the expression of socs sequence in the animal
GB2373502A (en) * 2000-11-08 2002-09-25 Smithkline Beecham Corp Suppressor of cytokine signalling 4 (SOCS4)
US20040106784A1 (en) * 2000-12-14 2004-06-03 Parodi Luis A. Socs (suppressor of cytokine signaling)
AUPR556601A0 (en) * 2001-06-08 2001-07-12 Ludwig Institute For Cancer Research Therapeutic and diagnostic molecules - II
JPWO2003072778A1 (ja) * 2002-02-27 2005-06-23 株式会社ジェノックス創薬研究所 アレルギー性疾患の検査方法
JP2007526000A (ja) * 2004-03-04 2007-09-13 バンダービルト ユニバーシティ サイトカイン誘導性シグナル伝達を阻害する細胞透過性socsポリペプチド
JP2005312364A (ja) * 2004-04-28 2005-11-10 Mitsuo Itakura 糖尿病治療剤スクリーニング方法
JP5041231B2 (ja) * 2005-02-15 2012-10-03 東亞合成株式会社 抗菌ペプチド及びその利用
EP2427210A4 (en) * 2009-05-08 2012-10-24 Inst Medical W & E Hall MODULATION OF INDUCIBLE NITRIC OXIDE BINDING (INOS) TO SOCS-BOX (SSB) PEPTIDES CONTAINING SPRY DOMAINS
KR101124622B1 (ko) * 2009-10-26 2012-03-19 한국생명공학연구원 Socs2 유전자의 발현을 조절하여 자연 살해 세포를 활성화시키는 방법
ES2952064T3 (es) 2015-12-16 2023-10-26 Walter & Eliza Hall Inst Medical Res Inhibición de la proteína SH2 inducida por citocinas en células NK

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4420782C1 (de) * 1994-06-15 1995-08-17 Fluegge Ulf Ingo Prof Dr DNA-Sequenz, kodierend einen 2-Oxoglutarat/Malat-Translokator, Plasmide, Bakterien, Hefen und Pflanzen enthaltend diesen Transporter
US4018653A (en) 1971-10-29 1977-04-19 U.S. Packaging Corporation Instrument for the detection of Neisseria gonorrhoeae without culture
US4016043A (en) 1975-09-04 1977-04-05 Akzona Incorporated Enzymatic immunological method for the determination of antigens and antibodies
US4424279A (en) 1982-08-12 1984-01-03 Quidel Rapid plunger immunoassay method and apparatus
CA2143491C (en) * 1994-03-01 2011-02-22 Yasumasa Ishida A novel peptide related to human programmed cell death and dna encoding it
EP0832117A1 (en) * 1995-06-05 1998-04-01 The Trustees Of Dartmouth College Ligand-stimulated gene expression
WO1998030688A1 (fr) * 1997-01-10 1998-07-16 Tadamitsu Kishimoto Nouvelle proteine de regulation de la fonction stat
AU8484698A (en) * 1997-07-18 1999-02-10 Schering Corporation Suppressors of cytokine signaling socs16; related reagents

Also Published As

Publication number Publication date
EP1975234A2 (en) 2008-10-01
US20080166730A1 (en) 2008-07-10
JP2001502183A (ja) 2001-02-20
GB9905020D0 (en) 1999-04-28
EP0948522B1 (en) 2008-06-11
ES2308785T3 (es) 2008-12-01
CN1253565A (zh) 2000-05-17
EP0948522A4 (en) 2001-09-19
KR100719080B1 (ko) 2007-05-16
DK0948522T3 (da) 2008-09-22
ATE398136T1 (de) 2008-07-15
JP2009060903A (ja) 2009-03-26
GB2331753A (en) 1999-06-02
NO992116D0 (no) 1999-04-30
KR20060053007A (ko) 2006-05-19
EP0948522A1 (en) 1999-10-13
KR20000053017A (ko) 2000-08-25
NO992116L (no) 1999-06-29
CA2270171A1 (en) 1998-05-14
DE69738767D1 (de) 2008-07-24
WO1998020023A1 (en) 1998-05-14

Similar Documents

Publication Publication Date Title
CN101280305A (zh) 能调节对细胞因子的细胞反应性的治疗和诊断制剂
Takahashi et al. Mice lacking a CDK inhibitor, p57 Kip2, exhibit skeletal abnormalities and growth retardation
US6369196B1 (en) Molecules of the card-related protein family and uses thereof
Riley et al. Mutations of N-terminal regions render the retinoblastoma protein insufficient for functions in development and tumor suppression
US20060003377A1 (en) Therapeutic and diagnostic proteins comprising a SOCS box
EP0876483A1 (en) Nucleic acids and proteins related to alzheimer's disease, and uses therefor
JPH10513359A (ja) サイクリン依存性キナーゼCDK4およびCDK6のインヒビター、InK4c−p18およびInK4d−p19、ならびにそれらの使用
JP2002525067A (ja) レプチン誘導遺伝子
US6482933B1 (en) Molecules of the card-related protein family and uses thereof
JP3562528B2 (ja) Ikaros:t細胞経路調節遺伝子
US20080293583A1 (en) Methods for diagnosing mood disorders
US20020155564A1 (en) Cloning of a high growth gene
GB2504775A (en) Transgenic animals with reduced ERF expression and ossification defect
Corcoran et al. All known in vivo functions of the Oct-2 transcription factor require the C-terminal protein domain
EP1354946B1 (en) Bhlh-pas proteins, genes thereof and utilization of the same
US20080032926A1 (en) Knockout Non-Human Animal
AU735735B2 (en) Therapeutic and diagnostic agents capable of modulating cellular responsiveness to cytokines
AU779095B2 (en) Therapeutic and diagnostic agents capable of modulating cellular responsiveness to cytokines
JP2002543767A (ja) 生殖細胞と体細胞が4e−bp1をコードするdnaにノックアウト突然変異を含有する非ヒトトランスジェニック動物
US6905842B1 (en) Therapeutic and diagnostic agents
WO2002102144A1 (en) Cell deah-inducible model nonhuman animal
Albright Gene targeting of a tissue-specific TBP-associated factor
Xu Developmental regulation and functional analysis of a tissue-specific LIM-homeobox gene
AU2006252108A1 (en) Therapeutic and diagnostic agents capable of modulating cellular responsiveness to cytokines
JP2003000279A (ja) bHLH−PAS蛋白質、その遺伝子及びそれらの利用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20081008