CN101796196A - 蛋白错误折叠和神经保护的调节剂及使用方法 - Google Patents

蛋白错误折叠和神经保护的调节剂及使用方法 Download PDF

Info

Publication number
CN101796196A
CN101796196A CN200880102307A CN200880102307A CN101796196A CN 101796196 A CN101796196 A CN 101796196A CN 200880102307 A CN200880102307 A CN 200880102307A CN 200880102307 A CN200880102307 A CN 200880102307A CN 101796196 A CN101796196 A CN 101796196A
Authority
CN
China
Prior art keywords
leu
ala
gly
val
thr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200880102307A
Other languages
English (en)
Inventor
盖伊·考德威尔
金·A·考德威尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Alabama UA
University of Arkansas
Original Assignee
University of Arkansas
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Arkansas filed Critical University of Arkansas
Publication of CN101796196A publication Critical patent/CN101796196A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6893Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
    • G01N33/6896Neurological disorders, e.g. Alzheimer's disease
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P21/00Drugs for disorders of the muscular or neuromuscular system
    • A61P21/02Muscle relaxants, e.g. for tetanus or cramps
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/14Drugs for disorders of the nervous system for treating abnormal movements, e.g. chorea, dyskinesia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/14Drugs for disorders of the nervous system for treating abnormal movements, e.g. chorea, dyskinesia
    • A61P25/16Anti-Parkinson drugs
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/28Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/001Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/90Enzymes; Proenzymes
    • G01N2333/902Oxidoreductases (1.)
    • G01N2333/90206Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Neurology (AREA)
  • Molecular Biology (AREA)
  • Neurosurgery (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Zoology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Psychology (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Toxicology (AREA)
  • Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Cell Biology (AREA)
  • Gastroenterology & Hepatology (AREA)

Abstract

本发明提供多核苷酸分子和由此分子编码的蛋白,以及以蛋白聚集为特征的神经病症的诊断和治疗方法。本发明所述的基因影响易聚集蛋白(如α-突触核蛋白)的错误折叠和随后的聚集,并涉及与蛋白聚集相关的神经疾病(如帕金森病)的诊断和治疗。在蛋白聚集秀丽隐杆线虫(C.elegans)模型中用RNAi对本发明所述基因的表达进行敲减可导致α-突触核蛋白的聚集。还可以通过过表达蛋白从而在过表达α-突触核蛋白后产生多巴胺能神经保护。对与蛋白错误折叠和聚集相关的基因的理解为开发诊断筛选方法、突变分析和用于开发治疗神经变性疾病(如帕金森病)的新型治疗性和神经保护化合物的药物设计信息提供了有力手段。

Description

蛋白错误折叠和神经保护的调节剂及使用方法
优先权声明和相关申请的交叉引用
本申请要求2007年8月8日提交的美国临时专利申请第60/964,184号的优先权,该申请通过引用并入本文。
发明领域
本发明涉及编码调控蛋白聚集的神经保护蛋白的多核苷酸分子,及其使用方法。更具体地,本发明涉及使用多核苷酸分子以及由其编码的神经保护蛋白来防止蛋白错误折叠和神经变性的方法,以及筛选用于预防蛋白错误折叠和神经变性的化合物的方法。
背景技术
易聚集毒性蛋白(toxic,aggregation-prone protein)可导致神经元功能失常和损伤,而此症状是很多神经疾病的特征。这包括,例如肌萎缩侧索硬化、阿尔茨海默病、帕金森病、朊病毒病、多聚谷氨酰胺扩展病(polyglutamineexpansion diseases)、脊髓小脑性共济失调、脊髓和延髓性肌萎缩、海绵状脑病、tau蛋白病(tauopathy)、亨廷顿病或张力失常的病症。已经鉴定出编码导致这些病症的易聚集毒性蛋白的蛋白及其编码基因。正常的代谢酶重复利用蛋白,产生合成和分解的永恒循环。这些基因中的突变导致错误折叠蛋白的异常积累和分解。已知这些错误折叠的蛋白引起可象征神经元损伤的神经元包涵体和神经元斑。因此,对减少、抑制和改善此类错误折叠蛋白所需的分子工具的细胞机理和鉴定的理解非常重要。此外,了解蛋白错误折叠和聚集对神经元存活的影响将为这些病症的合理有效疗法的开发提供了可能。
帕金森病是以肢体震颤、行动迟缓或没有行动、肢体僵硬、行走拖曳和驼背姿势为特征的神经病症。其他症状可以包括抑郁、个性改变、痴呆、睡眠障碍、语言障碍或性功能障碍。这些症状的严重程度逐渐加大。这些症状是基底节中单胺能神经变性(monoaminergic neurodegeneration)的结果。这种神经元变性通常与α-突触核蛋白(alpha-synuclein)的错误折叠以及随后的聚集相关。黑质中的神经元变性导致神经递质多巴胺减少,从而产生严重损害运动技能的神经传递缺陷。
认为α-突触核蛋白的突变形式会提高错误折叠的倾向,并且还诱导其他蛋白并入聚集体。蛋白降解酶的缺陷还可能导致蛋白积累、聚集,并改变细胞的自动调节。这些聚集体被称作路易体,并主要由α-突触核蛋白构成。还发现神经原纤维缠结中存在的α-突触核蛋白与阿尔茨海默病、皮克病、进行性核上性麻痹和皮质基底节变性相关。
神经变性病症的主要问题是直到表现出临床症状之前,患者都不会觉察到导致神经元变性的神经元环境正在形成。到出现临床症状时,已经有大量的神经元损失,并且神经元环境已经明显不利于神经元的存活。用于检测蛋白聚集或神经元损失的可靠的早期检测方法的缺乏使得这些变性疾病在无监测的状态下发展,直到由于已经发生的神经元损失使得治疗可能无效或多余的地步。而且,即使有可靠的早期检测方法,现有的疗法对这些神经变性疾病的长期治疗也是无效的,因此就需要新型药物和新的治疗方法。
需要对异常蛋白聚集的分子机制和蛋白调节剂进行了解,从而开发在出现显著神经元破坏前的早期阶段诊断这些病症的改进方法,并为药物设计和开发提供模型系统。使用模型系统,可以筛选并开发靶向与蛋白聚集相关的特异基因和基因产物的化合物。还有必要了解神经变性机制并开发可以阻止或缓解神经元损失的神经保护化合物,直至开发出针对异常蛋白折叠和聚集的根本原因的更有效治疗方法。
发明内容
本发明涉及使用多核苷酸分子以及由此分子编码的蛋白的新方法,其用于诊断和治疗以神经元功能障碍、神经变性或蛋白错误折叠及随后的聚集为特征的神经病症的方法中。具体而言,本文描述了影响易聚集蛋白的错误折叠和随后的聚集的多个基因,并表明这些基因可用于与蛋白聚集相关的神经疾病的诊断和治疗。本文描述的基因在RNAi筛选被敲减时导致蛋白错误折叠和聚集的增加,特别是α-突触核蛋白的错误折叠和聚集的增加。对与此过程相关的基因的了解为开发诊断筛选方法、突变分析以及用于开发新的治疗性和神经保护性化合物的药物设计信息提供有力的手段。这些方法包括调节多个蛋白的活性以减少或预防蛋白错误折叠,或者提供神经保护。所述蛋白包括SURF蛋白家族、SEC22蛋白家族和酰基辅酶A氧化酶。
因此,本发明的目的是提供用于检测和治疗与蛋白错误折叠和聚集相关的神经病症的方法和组合物。
本发明的另一个目的是提供用于检测和治疗特别是帕金森病或由α-突触核蛋白错误折叠和聚集造成的病症的方法和组合物。
本发明的另一个目的是提供用于检测某人是否患有神经变性病症的方法,其中所述病症的特征是与蛋白错误折叠和聚集相关的基因表达水平的改变或者该基因的一个或多个突变。
本发明的另一个目的是提供用于检测其他神经元基因突变或多态性的方法,这些基因参与特定表型的产生,该特定表型在哺乳动物中引起与所述基因的神经解剖学表达相一致的明显临床症状。
本发明的另一个目的是提供与人体内蛋白错误折叠和聚集相关的神经病症的诊断方法。优选地,本文提供用于诊断人体内是否存在所述病症方法;预测发展为所述病症的可能性或发展所述病症的易感性的方法。
本发明的另一个目的是提供用于鉴定神经元基因突变或多态性的方法,其中所述神经元基因与导致神经元疾病易感性提高的蛋白聚集相关。
本发明的另一个目的是提供通过比较化合物存在时蛋白错误折叠和聚集的数量与化合物不存在时蛋白错误折叠和聚集的数量,来筛选减少、抑制、改善或预防蛋白错误折叠和聚集的化合物的方法。
本发明的另一个目的是提供通过比较化合物存在时神经变性的数量与化合物不存在时神经变性的数量,来筛选减少、抑制、改善或预防神经变性的化合物的方法。
本发明的另一个目的是提供用于设计和开发治疗性化合物的方法,该化合物是为对促进蛋白聚集的环境易感的神经元提供神经保护的化合物,或者阻止或缓解蛋白错误折叠和聚集的化合物,或者溶解蛋白聚集体的化合物。
本发明的另一个目的是提供用于减少、终止、减轻、改善或预防由于蛋白聚集而造成的细胞功能紊乱的方法。
本发明的另一个目的是提供含有效量组合物的药物配方,以降低需要治疗的动物中的蛋白错误折叠和聚集,或提供神经保护。
本发明还涉及使用多核苷酸分子及其编码的多肽为对促进蛋白错误折叠和聚集的环境易感的神经元提供神经保护的方法。
本发明的另一个目的是提供用于治疗与蛋白错误折叠和聚集相关的神经疾病的药物的制备方法。
本发明的另一个目的是提供用于筛选治疗神经病症新疗法的转基因动物。
本发明的另一个目的是提供用于诊断在人中是否存在神经变性病症的试剂盒,所述试剂盒包含用于检测来自此人的样品中的基因突变的一种或多种试剂。
在阅读以下具体实施方式和所附权利要求书后,可更清晰地了解本发明的这些及其他目的、特点和优点。
附图说明
图1提供显示α-突触核蛋白诱导的变性(其随动物衰老而发生)后,秀丽隐杆线虫(C.elegans)SEC22蛋白表达对多巴胺神经元的神经保护作用的图。
图2提供本文所描述的核苷酸和蛋白序列的列表。
发明详述
通过参照下文所包括的对具体实施方式的详细描述,可以更容易地理解本发明。尽管已经通过参考某些实施方式的具体细节对本发明进行了描述,但并不意味着这些细节应被视为对本发明范围的限制。本文提到的参考文献的内容通过引用全文并入本文。
神经元尤其易受突变或错误折叠蛋白的毒性作用的攻击。基于对处理具有潜在毒性的不良蛋白的正常细胞机制的理解,本发明提供了用于消除错误折叠或聚集蛋白对神经元的作用的独特方法和组合物。突变或错误折叠蛋白不仅可以导致神经元的损伤、变性或死亡,而且还可造成神经元的功能紊乱,此时神经元存活,但细胞生理过程受损从而导致出现神经疾病的临床症状。
除非文中另有清楚的说明,否则在本说明书和权利要求书中使用的单数形式″一个″、″一种″、″这″、″该″等包括复数的所指事物。
应理解,尽管以下讨论特指人类患者,但本文讲授的内容也可用于表达表1中蛋白的任何动物。本文定义的术语“哺乳动物”是指任何脊椎动物,包括单孔目动物和有袋目动物。哺乳动物种的实例包括灵长类(如人、猴子、黑猩猩和狒狒),啮齿类(如大鼠、小鼠、豚鼠和仓鼠)以及反刍动物(如牛和马)。
在本发明范围内的“治疗”包括减少、抑制、改善或预防与如神经变性疾病的异常相关的症状或分子事件,其中所述神经变性疾病包括但不局限于帕金森病。优选地,可治疗蛋白聚集、由蛋白错误折叠和聚集造成的细胞功能失常,和与蛋白聚集相关的疾病。
“神经病症”包括以神经元变性和/或损失为特征的临床病症。这些病症包括肌萎缩侧索硬化、阿尔茨海默病、帕金森病、朊病毒病、额颞痴呆、多聚谷氨酰胺扩展病、脊髓小脑性共济失调、脊髓和延髓性肌萎缩、海绵状脑病、tau蛋白病、亨廷顿病和张力失常等。
本文所用术语“线虫(worm)”是指用于研究本发明蛋白聚集的模型系统,此模型生物源自线虫动物门。其含义包括特定的线虫动物秀丽隐杆线虫(Caenorhabditis elegans或C.elegans)。
正确折叠需要蛋白质在可能但不正确的构象群中选择一个具体结构。多肽没有选择其正确结构是对细胞功能和存活力的主要威胁。错误折叠的蛋白可能本身具有毒性,并且形成可能导致非常严重的后果(甚至致死)的聚集体。因此,已进化出精细的系统来保护细胞免受错误折叠蛋白的有害影响。
本发明范围内的“蛋白”包括全长蛋白、同源物、糖基化改变的蛋白、蛋白片段、剪接变体、功能等同的变体、基本保留了与野生型蛋白相同的功能的突变体及其保守取代蛋白。
本发明范围内的“蛋白聚集”包括至少两个多肽以某种方式彼此接触从而导致其中任何一个多肽处于去溶剂化(de-solvation)状态的现象。这也可以包括多肽天然功能或活性的丢失。
本发明范围内的“与蛋白聚集相关的疾病”包括任何疾病、病症和/或痛苦,与蛋白聚集相关的疾病包括神经变性病症。
在本发明还包括包含定义、方法和实施基本技术的手段的标准分子生物学教材以作为参考。参见,例如Sambrook et al.,Molecular Cloning:ALaboratory Manual,Third Edition,Cold Spring Harbor Laboratory Press,NewYork(2001);Current Protocols in Molecular Biology,Ausebel et al(eds.),JohnWiley & Sons,New York(2001)及其引用的多篇参考文献。
本发明提供了编码与蛋白错误折叠/聚集和神经保护相关的蛋白的多个多核苷酸。某些候选基因编码功能或活性至今未知的假定蛋白。然而,本发明确定这些蛋白的至少一个共同功能或活性是防止蛋白错误折叠和聚集。在秀丽隐杆线虫模型中使用RNAi降低这些蛋白的活性导致蛋白的错误折叠和α-突触核蛋白的聚集。导致这些蛋白及其编码多核苷酸的表达和/或活性降低的改变也将导致蛋白错误折叠和聚集。
这些蛋白中的某些还为如含多巴胺神经元的神经元提供神经保护。因此,本发明提供了在神经变性疾病中进行干预治疗的新方法,所述方法包括将本文描述的多核苷酸用于对含多巴胺神经元的神经保护;这样本发明为帕金森病治疗的研发提供了另外一条途径。可以使用编码为多巴胺能神经元提供神经保护性能的蛋白的基因来开发基因和蛋白疗法、抗体疗法以及设计和筛选新药物,从而为多巴胺神经元提供神经保护。相似地,这些分子的改变会使神经元在不利的条件下易于受损和死亡。由这些基因编码的蛋白包括SURF蛋白家族、SEC22蛋白家族和酰基辅酶A氧化酶。表I中提供这些蛋白的列表。
表I:
  秀丽隐杆线虫ORF标识   预测功能  人同源物   E值
  C54H2.5   Sft-4;假定的运输蛋白(cargo transportprotein)ERV29  SURF-4   7.8e-88
  F55A4.1   突触囊泡蛋白(synaptobrevin)/VAMP样蛋白SEC22;囊泡转运蛋白的SEC22家族  SEC22囊泡转运蛋白   2.3e-47
  F59F4.1   酰基辅酶A氧化酶蛋白  酰基辅酶A氧化酶   2.4e-138
sft-4基因编码假定的运输蛋白ERV29,其是与小鼠surf-4基因高度保守的SURF家族成员,并且保守区(conservation)包括所编码的参与小鼠蛋白的内质网定位的双赖氨酸基序。
通过跨膜域锚定的SEC22在内质网和高尔基体顺面之间发挥正向转运(anterograde)和反向转运(retrograde)的功能。
酰基辅酶A氧化酶是过氧物酶体β-氧化途径中的第一个酶。
本发明全文中“分离的”或“纯化的”是指从其自然环境中分离出来,并且基本不含有其他污染蛋白、多核苷酸和/或在细胞提取物中常见的其他生物物质。
本发明全文中的“多核苷酸”通常是指多聚核糖核苷酸和多聚脱氧核糖核苷酸,其可以是非修饰的RNA或DNA或者是修饰的RNA或DNA。多核苷酸分子可包括编码蛋白的基因和RNA或者是非编码的RNA或DNA。
表I中所示的分子列出的是秀丽隐杆线虫开放阅读框(ORF)标识的名称,但本发明并不局限于秀丽隐杆线虫的序列。表I所列分子的其他物种同源物也适用于本发明,尤其是人同源物。本文提供了秀丽隐杆线虫及相应的人基因和蛋白的序列。表II中提供了相应的秀丽隐杆线虫核苷酸和蛋白序列以及人核苷酸和蛋白序列。
表II:
  秀丽隐杆线虫ORF标识   名称  序列编号#   序列的来源和类型
  C54H2.5   sft-4  1   秀丽隐杆线虫核苷酸
  ERV29  2   秀丽隐杆线虫蛋白
  SURF-4  3   人核苷酸
  ERV29  4   人蛋白
  F55A4.1   突触囊泡蛋白/VAMP样蛋白SEC22  5   秀丽隐杆线虫核苷酸
  秀丽隐杆线虫ORF标识   名称  序列编号#   序列的来源和类型
  突触囊泡蛋白/VAMP样蛋白SEC22  6   秀丽隐杆线虫蛋白
  突触囊泡蛋白/VAMP样蛋白SEC22  7   人核苷酸
  突触囊泡蛋白/VAMP样蛋白SEC22  8   人蛋白
  F59F4.1   酰基辅酶A氧化酶  9   秀丽隐杆线虫核苷酸
  酰基辅酶A氧化酶  10   秀丽隐杆线虫蛋白
  酰基辅酶A氧化酶  11   人核苷酸
  酰基辅酶A氧化酶  12   人蛋白
本领域技术人员将意识到除人以外的生物也包含此类基因(例如真核生物,更具体地,哺乳动物(优选大猩猩、恒河猴和黑猩猩)、啮齿动物、线虫(优选秀丽隐杆线虫)、昆虫(优选,黑腹果蝇(D.melanogaster))、鸟类、鱼类、酵母和植物)。本发明旨在包括但不局限于从上述生物中分离出的编码表1所列蛋白的核酸分子。
这些基因中许多都具有显著的进化保守度,这证明蛋白在物种之间的高度同源性。例如,人酰基辅酶A氧化酶(SEQ ID NO:11和SEQ ID NO:12)与秀丽隐杆线虫F55A4.1(SEQ ID NO:9和SEQ ID NO:10)同源,并且与黑腹果蝇(SEQ ID NO:13和SEQ ID NO:14)、斑马鱼(Danio rerio,SEQ IDNO:15和SEQ ID NO:16)、牛(SEQ ID NO:17和SEQ ID NO:18)、小鼠(SEQID NO:19和SEQ ID NO:20)和大鼠(SEQ ID NO:21和SEQ ID NO:22)的基因/蛋白同源。所有这些序列的e值都基本为0,这证明此基因在进化中高度保守。考虑到在结构上的高度同源性,这些序列以适当水平表达时应该具有减少神经变性、蛋白错误折叠和聚集的相同功能。
本发明的分离核酸分子还包括化学合成的核酸分子。例如,可以设计带有编码基因表达产物的核苷酸序列的核酸分子,并且,如果需要,可将其分为适当的较小片段。然后,可以合成与此核酸分子或每一个分开的片段对应的寡聚物。此类合成寡核苷酸可以合成制备(Matteucci et al.,1981,J Am.Chem.Soc.103:3185-3191),或者通过使用自动DNA合成仪制备。寡核苷酸可以通过合成或者克隆得到。如果需要,可以使用T4多核苷酸激酶将寡核苷酸5′-端磷酸化。对寡核苷酸5′-端使用激酶(kinasing)提供了通过例如向5′-端加入放射性同位素(通常是32P)来标记特定寡核苷酸的途径。随后,寡核苷酸可以退火并通过T4连接酶等进行连接。
此外,利用来自表II中序列的引物,通过多聚酶链式反应(PCR)制备的DNA序列对本发明是有用的。此类寡核苷酸通常具有至少15个核苷酸的长度。
本发明还涉及以相应方式来自表I中所列蛋白的氨基酸序列及其应用。
根据本说明书和权利要求书的目的,下文所用的与核酸序列相关的术语“基本由……组成”是指与第三碱基简并性相关的核苷酸取代。本领域技术人员可知,由于第三碱基的简并性,几乎每一个氨基酸在核酸编码序列中都可以用不止一个三联体密码子表示。此外,少量碱基对改变可以导致所编码氨基酸序列的变异(保守取代),而预期不会使基因产物的生物学活性产生实质改变。因此,编码本文公开的蛋白或肽的核酸序列在序列上可以进行轻微修饰(例如取代三联体密码子中的核苷酸),但仍编码其具有相同氨基酸序列的相应基因产物。
本文所用多核苷酸序列中的“改变”是指序列表达水平的差异,例如通过敲除或敲减基因导致的序列表达水平的升高或降低。也包括影响野生型蛋白所提供的蛋白正确折叠和神经保护的序列本身的差异。此类改变包括提高或降低多核苷酸分子或蛋白的表达、突变、截短和缺失。因此,与编码SURF蛋白家族、SEC22蛋白家族和酰基辅酶A氧化酶或其片段的多核苷酸分子杂交的DNA序列也是本发明的组成部分。
本领域技术人员可以找到通过由专家发现的杂交方式鉴定DNA序列的指导,例如在″The DIG System Users Guide for Filter Hybridization″fromBoehringer Mannheim GmbH(Mannheim,Germany,1993)手册中和在Liebl etal.(International Journal of Systematic Bacteriology 41:255-260(1991))中。杂交在严谨条件下进行,也就是说,只有探针和靶序列(即用探针处理的寡核苷酸)至少70%相同时才能形成杂合体。已知可以通过改变缓冲液组成、温度和盐浓度来影响和确定杂交(包括洗涤步骤)的严谨性。与洗涤步骤相比,优选在相对较低的严谨性下进行杂交反应(Hybaid Hybridisation Guide,Hybaid Limited,Teddington,UK,1996)。
例如,可将约50℃-68℃的5x SSC缓冲液用于杂交反应。这样探针也可以杂交与探针序列的同一性小于70%的多核苷酸。此类杂合体稳定性较差,并通过严谨条件下洗涤而除去。上述杂交可以通过下述条件来实现,例如通过将盐浓度降低到2xSSC和任选地随后降低至0.5xSSC(The DIG SystemUser′s Guide for Filter Hybridisation,Boehringer Mannheim,Mannheim,Germany,1995),同时温度确定为约50℃-68℃。也可任选地将盐浓度降低到0.1xSSC。可通过以每步约1-2℃的步幅将杂交温度从50℃逐步升高到68℃,从而分离与所用探针序列具有如至少70%,或至少80%,或至少90%-95%同一性的多核苷酸片段。关于杂交的其他说明可以以所谓试剂盒的形式从市场获得(例如来自德国曼海姆Roche Diagnostics GmbH的DIG Easy Hyb,商品号1603558)。
“突变”是遗传物质的任何可检测到的变化,其可以传递到子细胞中并且甚至可能转递到继代,从而产生突变细胞或突变个体。突变可以是影响到一个或多个脱氧核糖核苷酸的化学或物理组成、突变性、复制、表型功能或者重组中任何一个(或其组合)的可检测到的非天然变化;核苷酸可以被添加、缺失、取代,反转,或在反转或非反转的情况下转移到新位置上。本文所用术语“突变”还涉及在编码本文所述蛋白之一的核酸序列上的任何修饰。例如,突变可以是点突变或者是添加、缺失、插入和/或取代一个或多个核苷酸,或者是以上的组合。突变可以是错义或移码突变。修饰可以是,例如保守的或者不保守的,天然的或者非天然的修饰。进一步可知,在蛋白N和/或C末端的变化不会产生实质性的损坏,甚至可以稳定其功能。本文中的信息可以由专家发现,其中可在Ben-Bassat et al.(Journal of Bacteriology169:751-757(1987))、O′Regan et al.(Gene 77:237-251(1989))、Sahin-Toth et al.(Protein Sciences 3:240-247(1994))、Hochuli et al.(BioTechnology 6:1321-1325(1988))以及已知的遗传和分子生物学教材中发现。可以通过与表II所列多核苷酸分子或其片段相应的多核苷酸分子的杂交来分离突变。
本发明还包括使用多种多肽分子,例如涉及防止蛋白错误折叠的蛋白的方法及其使用方法。蛋白在表I中描述,氨基酸序列在表II中列出。优选将这些蛋白纯化或分离成不含污染蛋白、多核苷酸或其他污染化合物的基本纯净状态。
本文所用的蛋白中的“改变”是指蛋白在辅助蛋白正确折叠和提供如野生型蛋白所提供的神经保护能力方面的变化。此类改变可包括,例如蛋白表达的变化、蛋白序列的突变和可选择的剪接形式,不过也包括改变蛋白活性的其他改变。
在另一个实施方式中,多肽具有表II所述的氨基酸序列或其突变体或种变体;或与其具有至少70%同一性,进一步至少80%的同一性或更进一步至少90%同一性(优选至少90%、95%、96%、97%、98%或99%同一性或至少95%、96%、97%、98%或99%的相似性),或至少6个连续氨基酸(优选其至少10、15、20、25或50个连续氨基酸)。
可以以糖基化或非糖基化的形式提供本发明的蛋白。糖基化蛋白质或其片段的制备是本领域内已知的,通常包括在真核细胞中表达编码该肽的重组DNA。同样,本领域公知在原核(例如细菌)细胞中表达编码该肽的重组DNA可获得非糖基化的肽。这些和其他改变糖蛋白的糖部分的方法可见于Essentials of Glycobiology(1999),Edited By Ajit Varki,Cold Spring HarborLaboratory Press,Cold Spring Harbor,New York,其内容通过引用并入本文。
本发明还涉及基本由表I所列蛋白质的多肽序列组成的多肽分子。
本发明的蛋白质可以包含一个或多个受保护的氨基酸残基。受保护的氨基酸是通过已知方法用一个或多个保护集团保护其一个或多个官能团的氨基酸,并且可商购多种受保护的氨基酸。蛋白质或其片段也可以包含一个或多个修饰氨基酸。此类氨基酸的列表可参见美国专利公开第2003/0235823号,其全文通过引用并入本文。
虽然导入氨基酸序列变异的位点是预设的,但突变本身并不需要预设。例如,为了在期望活性方面对特定多肽的性能进行优化,可以在多肽的靶密码子或区域进行随机突变,并筛选具有最佳期望活性的表达变体。在序列已知的DNA的预设位点进行取代突变的技术是已知的,例如定点突变。
氨基酸序列缺失通常在1-30个残基,更优选1-10个残基的范围内。氨基酸序列插入包括在氨基和/或羧基端融合长度从一个残基到基本不受限制的多肽,还包括在序列内插入一个或多个氨基酸残基。序列内插入(即,在完整蛋白序列内的插入)通常在约1-10个残基,更优选1-5个残疾的范围内。
第三组变体是至少一个氨基酸残基,优选只有一个残基被去除并在其位置插入不同残基的那些多肽分子。
功能或免疫特性的实质性变化是通过选择保守性较低的取代来实现的,即选择在维持其对以下方面的作用区别更为显著的残基:a)在取代区域内多肽骨架的结构,如片层构象或螺旋构象,b)靶点分子的电荷或疏水性,或c)侧链体积(bulk)。保守取代是取代氨基酸(天然存在或修饰的)与将被取代的氨基酸在结构上相关,即与将被取代的氨基酸具有几乎相同的大小和带电性质的取代。因此,取代氨基酸的侧链中可具有与原氨基酸相同或相似的官能团。提供功能相似的氨基酸的保守取代表在本领域内是已知的。下述六个组,每组都包含可互相保守取代的氨基酸:
1)丙氨酸(A)、丝氨酸(S)、苏氨酸(T);
2)天门冬氨酸(D)、谷氨酸(E);
3)天门冬酰胺(N)、谷氨酰胺(Q);
4)精氨酸(R)、赖氨酸(K);
5)异亮氨酸(I),亮氨酸(L),蛋氨酸(M),缬氨酸(V);和
6)苯基丙氨酸(F)、酪氨酸(Y),色氨酸(W)。
进一步的取代可以包括:
a)甘氨酸和/或脯氨酸被另一个氨基酸取代,或者被缺失或插入;
b)用亲水残基(例如丝氨酰或苏氨酰)取代疏水残基(例如亮氨酰、异亮氨酰、苯基丙氨酰、缬氨酰或丙氨酰);
c)用半胱氨酸残基取代其他任何残基;
d)用具有带正电侧链的残基(例如赖氨酰、精氨酰或组氨酰)取代具有带负电的残基(例如谷氨酰或天门冬氨酰);或
e)用具有大侧链的残基(例如苯基丙氨酸)取代不具有此类侧链的残基(例如甘氨酸)。
一些缺失、插入和取代预期不对蛋白质的性质产生根本的变化。本领域技术人员理解,通常可以使用动物模型(如本文公开的动物模型)以及化学和体内筛选试验来评估取代的效果。
在一个实施方式中,本发明涉及使用表I中所述蛋白的表位以引发抗体响应的方法。选择抗原表位片段的方法在本领域是已知的(Sutcliffe et al.,1983,Science.219:660-666)。本发明的带有抗原表位的肽和多肽可用于产生特异识别此多肽的免疫应答。本发明的带有抗原表位的肽和多肽包含可以通过DNA突变制备的表I中所列蛋白的氨基酸序列变体蛋白的至少4个氨基酸(优选6、7、9、10、12、15或20个氨基酸)。这样的变体包括,例如对本文所述氨基酸序列内的残基进行缺失、插入或取代。只要最终结构具有期望的活性,还可以通过缺失、插入和取代的任意组合来获取最终的构建体。在一个实施方式中,使用本文所述蛋白制备与此蛋白的野生型或改变型对应的多肽序列的特异性抗体。抗体也可用来作为探针或用于预防性或治疗性处理。
本发明提供了参与错误折叠和蛋白聚集的蛋白的筛选方法。例如表I中所列的序列是从使用过表达人α-突触核蛋白::GFP融合蛋白的转基因线虫系的RNAi文库筛选中得到的。也可以以融合蛋白的形式与α-突触核蛋白一起表达如GFP、RFP、BFP、YFP和荧光素酶的其他报告分子。可以以此方式过表达其他易聚集蛋白,从而研究其他神经疾病的蛋白错误折叠和聚集,例如但不局限于:阿尔茨海默病的tau蛋白和β-淀粉样蛋白、亨廷顿病(或多聚谷氨酰胺扩展病)中的突变亨廷顿蛋白,肌萎缩侧索硬化中的SOD1蛋白和神经丝,以及脊髓性和延髓性肌萎缩中的突变雄性激素受体。特别是帕金森病,在秀丽隐杆线虫中过表达α-突触核蛋白导致可通过荧光显微镜检测的可见α-突触核蛋白聚集体的形成。基因表达在unc-54启动子的控制下,以定向表达在体壁(body wall)上,从而便于观察。发现TOR-2是可使过表达α-突触核蛋白的秀丽隐杆线虫中的蛋白聚集减少的蛋白。包含α-突触核蛋白::GFP+TOR-2的转基因线虫系可用于与错误折叠和蛋白聚集相关的候选基因的RNAi筛选。对于多聚谷氨酰胺依赖性蛋白聚集,此前已有报道称TOR-2对错误折叠和蛋白聚集具有相似的抑制作用(Caldwell et al.Hum MoIGenet.2003Feb 1;12(3):307-19)。该转基因生物提供了通过向包含α-突触核蛋白::GFP+TOR-2的转基因线虫体壁肌肉内饲喂(feeding)RNAi而进行快速筛选的方法,用来发现通过RNAi敲减基因表达而恢复α-突触核蛋白聚集的基因。可以使用RNAi通过常规方法对秀丽隐杆线虫基因文库进行筛选,从而通过可重复的结果确定基因敲减对α-突触核蛋白聚集的影响。通常,对于被评为参与蛋白聚集的靶基因,在约80%的受检α-突触核蛋白::GFP+TOR-2生物体中出现聚集表型。可使用NCBI BLAST(NCBI,National Library ofMedicine,NIH,Bethesda,MD)确定同源序列。
在另一个实施方式中,本发明的基因编码为神经元提供神经保护性的蛋白。根据本文的讲授,可筛选秀丽隐杆线虫基因文库以确定候选基因是否为神经元提供保护。例如,在秀丽隐杆线虫模型中使用神经毒素6-OHDA的处理可导致多巴胺能神经元的损失。所选基因的过表达阻止了由6-OHDA处理导致的多巴胺能神经元损失。使用6-OHDA的处理通过形成活性氧导致损伤和死亡。因此,6-OHDA处理提供了用于分析与活性氧形成相关的神经疾病的神经保护的模型。同样可以建立表达参与神经疾病的易聚集倾蛋白的神经疾病模型。例如,在秀丽隐杆线虫的多巴胺神经元中过表达人α-突触核蛋白重现了帕金森病的神经变性特征,这是因为这些动物随年龄表现出多巴胺神经元损失(Cao et al,JNeurosci.2005Apr 13;25(15):3801-12)。在本文中,转基因线虫代表了用于鉴定特定化合物和基因的神经保护功能的模型系统。
由在神经元特异性启动子控制下表达荧光蛋白(如GFP、RFP、BFP或荧光素酶等)的转基因线虫开始制备过表达靶基因的秀丽隐杆线虫。神经元特异性启动子是本领域常规可用的启动子,包括但不局限于控制神经递质合成酶和神经递质转运子的启动子,例如酪氨酸羟化酶、多巴胺β羟化酶、多巴胺转运子、5-羟色胺转运子和膜泡乙酰胆碱转运子等。
在另一个实施方式中,本发明涉及使用核酸探针特异性检测样品中是否存在相关核酸的方法,所述相关核酸包括相应于上述核酸分子或至少其片段的DNA或RNA分子,其在严谨杂交和洗脱条件下与此核酸探针(nucleic acid)杂交。
在某些应用中,可将本文所述的多核苷酸检测并入用于说明与神经变性疾病相关的蛋白错误折叠或聚集的存在或倾向的诊断分析。在一个优选的实施方式中,本发明涉及由10-1000个核苷酸(优选10-500、10-100、10-50、10-35、20-1000、20-500、20-100、20-50或20-35个核苷酸)组成的优选与RNA或DNA片段杂交的分离核酸探针,其中所述核酸探针是由至少10个连续核苷酸(优选15、18、20、25或30个核苷酸)组成或与至少10个连续核苷酸(优选15、18、20、25或30个核苷酸)互补的核苷酸序列,所述连续核苷酸来自于包含与一个或多个下述序列具有90%同一性的多核苷酸序列的核酸分子:编码表II所列多肽的核苷酸序列;与任一上述核苷酸序列互补的核苷酸序列;以及上文所述的任一核苷酸序列。
可以通过,例如放射性标记、荧光标记、生物素/亲和素标记和化学发光等的标准标记技术对本发明的杂交探针进行标记,以用于检测。在杂交后,可以使用已知的方法使探针可视化。
在另一个实施方式中,本发明涉及通过在可使杂交发生的特定杂交条件下使样品与上述核酸探针接触,并检测是否存在与核酸分子结合的探针,从而检测样品中是否存在此核酸的方法。本领域技术人员可基于如上所述本领域已知的技术选择核酸探针。待测样品包括但不局限于来自人体组织的RNA或DNA样品。
适用于本发明核酸探针方法的待测样品包括,例如,细胞或细胞的核酸提取物或者生物液体。在本文所述方法中使用的样品可随分析方式、检测方式以及分析中使用的组织、细胞或提取物的性质而变化。制备细胞核酸提取物的方法是本领域内已知的,并且易于调整以得到与所采用的方法相适应的样品。
本发明还提供了通过检测与错误折叠/聚集相关的蛋白或提供神经保护的蛋白中的改变来诊断神经疾病的方法。在这些方法中,将来自个体的组织样品进行分析以获得如下蛋白发生的改变,这些蛋白选自SURF蛋白家族、SEC22蛋白家族和酰基辅酶A氧化酶,其中出现改变表明对神经疾病易感神经疾病或存在神经疾病。本文所用“组织”是指来自个体的生物样品。此类样品的实例包括但不限于细胞样品、单个细胞、体液样品(例如血液、淋巴或唾液,其中所述样品中可能存在或不存在细胞)。
在另一个实施方式中,用于检测样品中选自SURF蛋白家族、SEC22蛋白家族和酰基辅酶A氧化酶的蛋白的方法包括:在形成免疫复合物的条件下使样品与上述抗体(或蛋白)接触,和检测是否存在与所述多肽接合的抗体。可以将特异结合的抗体或蛋白与可检测的标签偶联。详细而言,该方法包括将待测样品与一种或多种本发明抗体一起温育,并分析所述抗体是否与待测样品结合。与正常水平相比较,样品中蛋白水平或活性的改变能够表明特定的疾病。
在另一个实施方式中,本发明涉及检测样品中表I中蛋白的特异性抗体的方法,所述方法包括:在形成免疫复合物的条件下使样品与表I中的蛋白接触,和检测与抗体接合的蛋白或与蛋白接合的抗体的存在。详细而言,该方法包括将待测样品与一个或多个本发明的蛋白一起温育,并分析抗体是否与待测样品结合。
抗体和待测样品的温育条件有多种。温育条件依赖于所采取的分析方式、所采取的检测方式和分析中所用抗体的类型和性质。本领域的技术人员可认识到常规可用的免疫学分析方式(例如放射性免疫测定、酶联免疫吸收测定、底层扩散平板(diffusion based Ouchterlony)或快速免疫荧光测定(rocketinimunofluorescent assays))中的任何一种都可以经调整而适合用于本发明的抗体(Chard,In:An Introduction to Radioimmunoassay and Related Techniques,Elsevier Science Publishers,Amsterdam,The Netherlands(1986);Bullock,et al.,In:Techniques in Immunocytochemistry,Academic Press,Orlando,FIa.Vol.1(1982),Vol.2(1983),Vol.3(1985);Tijssen,In:Practice and Theory of enzymeImmunoassays:Laboratory Techniques in Biochemistry and Molecular Biology,Elsevier Science Publishers,Amsterdam,The Netherlands(1985))。
本发明的免疫分析待测样品包括细胞、蛋白或细胞的膜提取物,或者生物液体,如血液、血清、血浆或尿液。在上述方法中使用的待测样品可随分析方式、检测方法的性质和用作待分析样品的组织、细胞或提取物而变化。细胞的蛋白提取物或膜提取物的制备方法是本领域已知的,并且易于调整以得到所采用系统能够利用的样品。
本发明使用了可测定聚集并引起神经疾病的蛋白的几个合适的分析方法。合适的分析方法包括免疫方法,例如放射性免疫测定、酶联免疫吸收测定(ELISA)和化学发光测定等。
在多个优选的实施方式中,免疫技术通过混合型抗体(即,一个或多个抗体)的方式检测表I中蛋白的水平,所述混合型抗体包括单克隆和/或多克隆抗体,及其混合物。例如,这些免疫技术可以使用多克隆和/或单克隆抗体的混合物,例如鼠单克隆抗体和兔多克隆抗体的混合物。
本领域技术人员可以得到针对适当免疫原的抗体,所述免疫原例如分离的和/或重组的蛋白或者其部分或片段(包括合成分子,例如合成的肽)。在一个实施方式中,制备针对表I所列的分离的和/或重组的蛋白,或者其部分或片段(例如肽)的抗体,或者针对表达这些重组蛋白之一的宿主细胞的抗体。此外,可以将表达重组蛋白的细胞,如转染细胞,用作免疫原或用于筛选与蛋白结合的抗体。
根据此方法,可通过分析方法确定生物样品中蛋白的水平或浓度。为了测定蛋白的量,分析方法包括在适合抗体和蛋白形成复合物的条件下使待测样品与具有蛋白特异性的抗体组合,并检测或测定(直接或间接)复合物的形成。可通过适合特定样品(例如全血、组织提取物、血清)和所选分析方式的方法获得和制备样品。例如,适用于全血收集的方法是静脉穿刺或从留置动脉导管收集血液。收集血液的容器可包含抗凝血剂,如CACD-A、肝素或EDTA。还选择结合样品和抗体的方法,以及检测复合物形成的方法以与分析方式相适应。可直接检测合适的标签,如放射性、荧光或化学发光标签;或者使用如酶标和其他抗原或特异结合伴侣(如生物素和胶体金)进行间接检测。此类标签的实例包括荧光标签如荧光素、罗丹明、CY5和APC,化学发光标签如荧光素酶,放射性同位素标签如32p、125I和131I,酶标签如辣根过氧化物酶和碱性磷酸酶、β-半乳糖苷酶、生物素、亲和素和自旋标记(spinlabel)等。也可以使用随后被检测的第二抗体通过免疫学方式检测复合物中的抗体。可以采用常规的或其他合适的方法直接或间接标记抗体。
在另一个实施方式中,表I中所列的分子可以用于诊断和筛选方法,所述方法包括检测基因中是否存在突变,其中此基因的突变会造成人神经疾病。例如,本发明的诊断和筛选方法对诊断人类患者的神经基因是否存在突变或多态性尤其有用,其中该患者根据其家族史而被怀疑具有患与表I中蛋白表达水平改变相关的疾病的风险,或者患者自愿检测与这些蛋白相关的疾病。
在另一个实施方式中,可将本文所述多核苷酸开发成微阵列用于筛选突变的存在,或者野生型序列或使个体易患神经病症的序列的缺失。微阵列可包含本文所述的野生型或改变的序列,以检测来自个体的组织样品中基因表达的变化。所述阵列可以包含本文提供的所有序列或可以与样品中的互补序列特异结合的所述序列的片段和突变体。此阵列也用于确认野生型基因表达的升高或降低,其中所述野生型基因导致易患神经病症或表明存在神经病症。在任何情况下,均在所述阵列上提供典型量的完整序列,从而可以检测到来自组织样品的互补序列。多核苷酸的阵列或微阵列通常是核酸,例如DNA、RNA、PNA和cDNA,但也可包括蛋白质、多肽、寡糖、细胞、组织以及能够与靶分子特异结合的其任何变换(permutation)。微阵列的筛选可包括使用阵列上核酸序列的特异性可检测标签。此类筛选的实施可通过,例如点样微阵列或依据制造商的说明使用Affymetrix,Inc.(Santa Clara,Calif.)的片段DNA微阵列技术(并基本如Schena et al.,Proc.Natl.Acad.Sci.USA93:10614-10619,1996和Heller et al.,Proc.Natl.Acad.Sci.USA94:2150-2155,1997所述)。Fritz et al Science 288:316,2000;″MicroarrayBiochip Technology″,L Shi,www.Gene-Chips.com中大致回顾了微阵列在基因表达分析中的应用。实施微阵列分析的系统和试剂可商购于如Affymetrix,Inc.,Santa Clara Calif.;Gene Logic Inc.,Columbia Md.;HySeq Inc.,SunnyvaleCalif.;Molecular Dynamics Inc.,Sunnyvale Calif.;Nanogen,San Diego Calif.;和Synteni Inc.,Fremont Calif(由Incyte Genomics,Palo Alto Calif.购得)等公司。
本文使用的“微阵列”和“阵可互换,是指一系列核苷酸序列在集中区域内的排列。阵列可以置于例如,固体基板(如载玻片)或半固体基板(如硝化纤维素膜)的表面上。核苷酸序列可以是DNA、RNA或其任何变换。本领域内已知,微阵列指固定在基板(表面)上特定位置的不同多核苷酸或寡核苷酸的组合。阵列形成在由下列物质制作的基板上:例如纸张、玻璃、塑料(如聚丙烯和尼龙)、聚丙烯酰胺、硝化纤维素、硅、光学纤维、聚苯乙烯或其他任何合适的固体或半固体支持介质,并且制成平板(如玻璃板和硅芯片)或三维(如引脚、纤维、珠、颗粒、微滴定孔和毛细管)结构。可通过多种方式将形成阵列的多核苷酸或寡核苷酸连结到基板上,包括(i)使用照相平板印刷技术的原位合成(如高密度寡核苷酸阵列)(参见Fodor et al.,Science(1991),251:767-773;Pease et al.,Proc.Natl.Acad.Sci.U.S.A.(1994),91:5022-5026;Lockhart et al.,Nature Biotechnology(1996),14:1675;美国专利第5,578,832、5,556,752和5,510,270号);(ii)以中密度至低密度在玻璃、尼龙或硝化纤维素上点样/印刷(如cDNA探针)(Schena et al,Science(1995),270:467-470;DeRisi et al,Nature Genetics(1996),14:457-460;Shalon et al.,Genome Res.(1996),6:639-645;和Schena et al.,Proc.Natl.Acad.Sci.U.S.A.(1995),93:10539-11286);(iii)利用掩模(Maskos and Southern,Nuc.Acids.Res.(1992),20:1679-1684)和(iv)在尼龙或硝化纤维素杂交膜上的斑点印迹方法(参见例如Sambrook et al.,Eds.,1989,Molecular Cloning:A LaboratoryManual,2nd ed.,Vol.1-3,Cold Spring Harbor Laboratory(Cold Spring Harbor,N.Y.))。
在一个实施方式中,在制备用于诊断神经病症的阵列时,微阵列包含与选自SURF蛋白家族、SEC22蛋白家族和酰基辅酶A氧化酶的蛋白相关的序列。
在另一个实施方式中,本发明涉及用于筛选激活或减弱表I中蛋白活性的化合物的方法。这些蛋白也可以在体外表达并纯化以用于筛选试验,或者在动物模型中表达用于蛋白错误折叠/聚集和神经毒性。对于随机筛选,随机选择如肽、碳水化合物和药剂等的试剂并测定其与蛋白结合或激活/减弱蛋白活性的能力。所述方法包括将表达此蛋白的细胞和待测化合物一起温育;并通过测量化合物对此蛋白与ATP结合的影响来分析细胞的蛋白活性。只要表达功能形式的蛋白并且可测量蛋白活性,任何细胞都可用于上述分析。优选的表达细胞是真核细胞或生物体。可以使用本领域已知的常规手段改造此类细胞以使其包含编码此蛋白的DNA序列。或者,本领域技术人员也可以将编码此蛋白的mRNA直接导入细胞。
在另一个实施方式中,本发明涉及对医药品(如药物)的筛选,其中所述医药品可以中和被改变的蛋白的表达或异常活性。优选地,通过本文描述的载体技术,使用神经元培养物来过表达突变形式的蛋白。分析神经元形态和蛋白分布的变化,并使用定量方法。随后,将此生物分析方法用于筛选可以改善该表型的药物。使用表I中蛋白的配体(包括上述拮抗剂和激动剂),本发明进一步提供了调节细胞中所述蛋白活性的方法。通常,可制备经鉴定可阻止或激活所述蛋白活性的药物(拮抗剂和激动剂),以使该化合物可以与在体内表达蛋白的细胞接触。此类细胞与此类化合物的接触导致对该蛋白活性的体内调节。
候选化合物可选自传统分类的治疗剂,例如小分子化合物、肽化合物、肽类似物、抗体、抗体片段、抗体衍生物、核苷酸分子和激素等。
在一个实施方式中,候选小分子化合物可包括拓扑异构酶II抑制剂、细菌转肽酶抑制剂、钙通道拮抗剂、环氧合酶抑制剂、叶酸合成抑制剂和钠通道阻断剂。如公开的PCT申请WO 2007/062186A2(其全文通过引用并入本文)中的公开,这些分子防止蛋白错误折叠和聚集,或者提供了神经保护。
此分析中筛选的其他试剂包括但不局限于氨基酸衍生物、肽、碳水化合物、维生素衍生物或其他药剂。可以通过合理的选择,或通过使用例如蛋白或配体建模技术的方法(优选计算机建模)随机选择并筛选这些试剂。
表I中描述的核苷酸序列和蛋白也可以用于设计充当内源分子的激动剂、拮抗剂或结合伴侣的新化合物。通过本文所述筛选方法鉴定的影响错误折叠和蛋白聚集的活性测试试剂可以作为先导化合物用于类似化合物的合成。通常,合成的类似化合物具有与先导化合物相似的电子构型和分子构象。类似化合物的鉴定可通过使用如自洽场(SCF)分析、构型相互作用(CI)分析和正常模式动态分析的技术完成。可获得执行这些技术的计算机程序。参见,例如Rein et al.,(1989)Computer-Assisted Modeling of Receptor-LigandInteractions(Alan Liss,New York)。
一旦制备出类似物,可以使用本文所述方法对其进行筛选以鉴定出那些对蛋白聚集的调节能力提高的类似物。随后,可对此类化合物采取进一步分析以鉴定那些最有可能成为药剂的化合物。或者,也可以将在筛选方法中显示活性的类似物作为先导化合物用于制备可通过本文所述方法筛选的再进一步类似物。筛选、合成类似物和再筛选的循环可重复多次。
或者,也可以合理地选择或设计试剂。在基于蛋白构象选择试剂时,该试剂在本文中被称为“合理选择或设计”。
定量构效关系(QSAR)方法可用于量化化合物的化学结构和其生物学活性之间的关系。可通过一个或多个技术来对每一种化合物类型的广谱功效进行定性或定级,这些技术包括构效关系(SAR)和/或定量构效关系(QSAR)方法,所述方法鉴定与化合物类型相关的一个或多个结构所涉及的一个或多个活性。此后,可以根据如合成性、适应性、专一性、活性、毒性和/或新陈代谢的因素来排定这些化合物类型中的每一个的优先次序。在这种情形下,可以测定和分析每个特定化合物类型中的所有化合物或附加组的化合物。由于某些化合物类型十分庞大,可测定和分析化合物类型中的亚组,并且如果此类型持续表现出超过预计水平的功效,则继续测定剩余的成员。此方法也可鉴定用于本发明的化合物的功能类似物和化合物类型。然后,通过使用筛选神经保护作用以及蛋白错误折叠和聚集作用的秀丽隐杆线虫模型确认功能类似物的活性。
计算机建模技术可使所选分子的三维原子结构可视化,并合理设计与该分子相互作用的新化合物。这些方法提供了发现那些已知具有神经保护作用和蛋白错误折叠和聚集功能的小分子化合物的功能性类似物的途径。分析化合物与靶蛋白结合时的三维结构可鉴定出相互作用位点,该位点可用于鉴定具有相似结合特性的小分子化合物和功能性类似物。三维结构通常依赖于由所选分子的x射线晶体图像分析或NMR成像所得的数据。分子动力学需要力场数据。计算机图像系统使预测新化合物如何连接到靶分子上成为可能,并且允许实验性地操纵化合物和靶分子的结构以得到完美结合特异性。当分子和化合物之一或二者都发生小变化时,预测分子-化合物相互作用的情况需要分子力学软件和计算密集型计算机(computationally intensive computer),其通常通过用户友好型菜单操作界面将分子设计程序与用户联系起来。
分子建模系统的实例有CHARMm和QUANTA程序,PolygenCorporation,Waltham,Mass。CHARMm执行能量最小化和分子动力学功能。QUANTA程序执行分子结构的建构、图形建模和分析。QUANTA允许分子间相互行为的互动式建构、修饰、可视化和分析。
多篇文献概述了与特定蛋白相互作用的药物的计算机建模(Schneiderand Fechner,Nat Rev Drug Discov.2005Aug;4(8):649-63;Guner,IDrugs.2005Jul;8(7):567-72;和Hanai,Curr Med Chem.2005;12(5):501-25)。其他筛选和图形预测化学物的计算机程序可从如BioDesign,Inc.、Pasadena,Calif.和Hypercube,Inc.,Cambridge,Ontario的公司获得。尽管这些软件原本设计是用于特定蛋白的特异性药物,但它们也适合设计对DNA或RNA区域的特异性药物,只要此区域已被鉴定。尽管上述内容涉及设计和产生可改变结合的化合物,但本领域技术人员也可筛选已知化合物文库,包括天然产物或合成化学物质,和生物活性物质包括蛋白,以得到作为抑制剂或活化因子的化合物。通过使用筛选神经保护作用和蛋白错误折叠和聚集作用的秀丽隐杆线虫模型确认使用这种方法鉴定的化合物的活性。
本发明还提供了转基因动物模型,该模型用于筛选用于预防和治疗性应用的化合物。本发明的转基因动物是通过非自然手段(即人工操作)导入了一个或多个该动物自然不产生的基因(如外源基因,遗传工程化的内源基因等)的动物。非自然导入的基因(被称为转基因)可来自与该动物相同或不同的物种,但该转基因所赋予的构象和/或染色体位点不是在该动物中自然存在。
转基因可以包括外源DNA序列,即通常不在宿主动物基因组内发现的序列。可选地或另外地,转基因可以包括内源DNA序列,所述的该内源DNA序列由于在体外被重排或突变而是异常的,这是为了改变该基因正常的体内表达模式或者改变或消除由该基因编码的内源基因产物的生物活性(Watson,J.D.,et al.,In:Recombinant DNA,2d Ed.,W.H.Freeman & Co.,New York(1992),pg.255-272;Gordon,J.W.,1989,Intl.Rev.Cytol.115:171-229;Jaenisch,R.,1989,Science.240:1468-1474;Rossant,J.,1990,Neuron.2:323-334)。可以通过原核注射(pronuclear injection)、ES细胞转化、病毒整合方法并入转基因,所有这些方法都是本领域技术人员已知的常规技术。
本发明的非人类动物包括内源基因的转基因插入或改变的任何动物(基因敲除动物)和/或向其基因组中引入针对选自SURF蛋白家族、SEC22蛋白家族和乙酰辅酶A氧化酶的蛋白表达的一个或多个转基因的动物。
所述非人类动物包括脊椎动物如啮齿类、非人类灵长类、羊、狗、牛、两栖动物、爬行动物等。优选的非人类动物是选自非人类的哺乳动物物种,最优选来自啮齿类动物家族的动物,包括大鼠和小鼠,最优选小鼠。
对疾病易感或因转基因而导致疾病的所得转基因非人类动物可用来鉴定诱导该疾病的化合物和评估已知或怀疑诱导该疾病的化合物的致病潜能((Bems,A.J.M,美国专利第5,174,986号),或者评估可用来治疗该疾病或缓解其症状的化合物(Scott,et al.,WO 94/12627)。
靶基因被整合到染色体的,并且在这些转基因生物体中过表达靶蛋白。
在一个实施方式中,本发明提供了转基因动物,其通过表达缺陷蛋白折叠系统或易聚集蛋白而表现出与蛋白错误折叠和聚集相关的神经疾病的症状。其他易聚集蛋白如突变亨廷顿蛋白、β-淀粉样蛋白,tau蛋白,α-突触核蛋白、突变雄性激素受体、突变SODI和突变ataxin等可以用来模拟其他神经疾病。例如,在一个实施方式中,使用了通过神经元特异启动子过表达α-突触核蛋白的转基因生物体。过表达α-突触核蛋白产生错误折叠的蛋白中间体、蛋白聚集和神经元变性。可将此转基因系与过表达由此前的RNAi筛选鉴定的靶基因的生物体杂交,从而确定靶基因产物是否赋予了神经保护性能,以及是否降低了α-突触核蛋白错误折叠和聚集的毒性效应。在转基因是选自SURF蛋白家族、SEC22蛋白家族和酰基辅酶A氧化酶的基因的改变形式的情况下,可使用其他模型。所述改变可包括导致神经疾病症状的蛋白表达增加或降低,或者突变,或者可选择的剪接形式。
在测定神经保护的模型中,使用如已知破坏含多巴胺神经元的6羟色胺(6-OHDA)的神经毒素处理转基因动物。在此筛选方法中也可以使用其他神经毒素,其是本领域技术人员已知的。可在接触毒素后使用荧光显微镜对神经元多态性进行常规筛选。
例如,此筛选方法鉴定了以通过保护多巴胺能神经元免受α-突触核蛋白诱导的神经变性的能力为特征的一些基因产物。该基因具有高度的保守性,例如人、线虫、牛、大鼠和小鼠的酰基辅酶A序列的e值都几乎为0。因此,其他物种的同源物在提供神经保护方面应该具有相同的功能。过表达sec-22为多巴胺神经元提供了免受α-突触核蛋白诱导的神经变性的神经保护。相似地,扭转蛋白也为多巴胺神经元提供了免受α-突触核蛋白诱导的神经变性的神经保护(Cao et al.,J Neurosci.2005Apr 13;25(15):3801-12)。转基因线虫提供了筛选其他基因或化合物神经保护功效的有效模型系统。
在本文中,当通过遗传操作使通常不产生或通常以低水平产生蛋白的细胞产生该蛋白时,该细胞被称为“经改变以表达预期肽”。本领域技术人员可以容易地对方法进行改进,以使其适合将基因组、cDNA或合成的序列导入真核或原核细胞并在其中表达。
如果核酸分子(如DNA)包含具有转录和翻译调控信息的核苷酸序列并且此类序列被“可操作地连接”到编码多肽的核苷酸序列上,则将此核酸分子被称为“能够表达”所述多肽。可操作连接是将调控DNA序列和试图表达的DNA序列以允许实现基因表达的方式连接。
本文所述核酸分子和蛋白质提供了医治神经疾病的治疗靶点。可通过恢复基因或蛋白质的功能来治疗由该基因或蛋白质缺乏或缺陷造成的神经疾病。可通过使用基因治疗或服用化合物来恢复正常基因或蛋白功能的方法来完成此类恢复。
对于已患或易患由蛋白缺乏或缺陷造成的神经疾病的患者,可以以某种方式和剂量向此类患者的细胞提供功能性DNA,从而使由此基因编码的蛋白以足以治疗此类患者的时间和数量表达。本领域已知许多载体系统可以为需要细胞缺失基因或蛋白的人类患者提供这样的递送。例如,可使用逆转录病毒系统,尤其是修饰的逆转录病毒和单纯疱疹病毒(Breakefield,X.O.,et al.,1991,New Biologist.3:203-218;Huang,Q.,et al.,1992,Experimental Neurology.115:303-316;WO93/03743;WO90/09441)。递送编码功能蛋白的DNA序列会有效替换造成疾病的缺失或突变基因。
在本发明的另一实施方式中,基因以重组基因的形式在细胞内表达,这样该细胞可被移植到哺乳动物中,优选移植到需要基因治疗的人类中。为了向个体提供基因治疗,将编码完整或部分基因的遗传序列插入到载体中并导入到宿主细胞。在另一个实施方式中,可以使用RNAi来降低缺陷或功能缺失蛋白的表达。这样的方法见综述Forte et al.(Curr Drug Targets.2005Feb;6(l):21-9)。
适用于基因治疗的疾病包括但不局限于神经变性疾病或病症。此类病症包括帕金森病、阿尔茨海默病、朊病毒病、多聚谷氨酰胺病、tau蛋白病、亨廷顿病、张力失常、家族性肌萎缩侧索硬化、匹克病、进行性核上麻痹和皮质退化症。
可以使用基因治疗方法将表I中蛋白的编码序列转化到患者体内(Chattedee and Wong,1996,Curr.Top.Microbiol.Immunol.218:61-73;Zhang,1996,J.MoI.Med.74:191-204;Schmidt-Wolf and Schmidt-Wolf,1995,J.Hematotherapy.4:551-561;Shaughnessy,et al.,1996,Seminars inOncology.23:159-11;Dunbar,1996,AnnM.Rev.Med.47:11-20)。
可在基因治疗中使用的载体的实例包括但不局限于缺陷逆转录病毒、腺病毒或其他病毒载体(Mulligan,R.C,1993,Science.260:926-932)。将携带基因的载体导入细胞的方法包括但不局限于显微注射、电穿孔、转导,或使用DEAE-Dextran、脂质体和磷酸钙的转染,或者本领域技术人员已知的其他方式(Sambrook,J.,Fritsch,E.F.,and Maniatis,T.,1989,In:Molecular Cloning.ALaboratory Manual.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor)。
可以施用本发明的化合物,包括使用所述筛选方法发现的治疗性化合物,来治疗神经疾病。在一个实施方式中,施用包含治疗用有效剂量化合物的组合物来治疗、降低或根除神经疾病的症状。本领域技术人员也可理解,任何具体治疗方案中的给药剂量都是易于确定的。剂量应该不能大到产生有害副作用,如有害的交叉反应和过敏反应等。通常,剂量依据病人的年龄、病情、性别和患病严重程度、禁忌症(如果有)、以及其他变量而变化,由具体医师来调整。本发明使用的用以提供免疫激活的剂量包括从约1μg到约500μg,其中包括0.5、1.0、1.5、2.0、5.0、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400和450μg,包括其间所有区间和亚区间。此剂量可以作为单一剂量施用,或根据疗程施用,包括后续加大剂量,保证其有效,例如本发明的药物组合物可以一次给药或者在以天、周、月和/或年计的疗程时间内连续给药。可以随药学上可接受的载体施用所述剂量。
此外,可以根据给药方法适当地使用如可注射制剂(溶液、悬浮液、乳液、使用时溶解的固体等)、片剂、胶囊、颗粒、粉剂、液体、脂质体包涵物、膏剂、凝胶、外用粉剂、喷剂、吸入性粉剂、滴眼液、眼膏、栓剂和阴道栓剂等的剂型;并相应地配制本发明的肽。药物制剂在本领域中是公知的,并且记述在如Comprehensive Medicinal Chemistry,Volume 5,Editor Hansch et al,Pergamon Press 1990中第25.2章中。
可以通过注射或随时间逐渐灌注以非肠道方式施用表I的蛋白或其配体。可以通过静脉、腹膜内、肌内、鞘内或皮下施用。确保化合物透过血脑屏障的其他方法也可用于此化合物的施用。
用于非肠道给药饿制剂包括灭菌的含水溶液或非含水溶液、悬浮液和乳液。非含水溶液的实例为丙二醇、聚乙二醇、植物油(如橄榄油)和可注射的有机酯,如油酸乙酯。含水载体包括水、醇/水溶液、乳液或悬浮液,还包括盐水和缓冲介质。注射用载体包括氯化钠溶液、林格氏葡萄糖和氯化钠、乳化林格氏溶液或固定油。静脉载体包括液体和营养补充剂、电解质补充剂,例如基于林格氏葡萄糖的补充剂等。也可添加防腐剂和其他添加剂,例如抗菌剂、抗氧化剂、螯合剂和惰性气体等(Remington′s Pharmaceutical Science,16th ed.,Eds.:Osol,A.,Ed.,Mack,Easton PA(1980))。
在另一个实施方式中,本发明涉及药物组合物,其包含表I中蛋白或足以改变此蛋白活性的其配体,和药学上可接受的稀释剂、载体或赋形剂。如上所述(Remington′s Pharmaceutical Sciences,16th ed.,Eds.:Osol,A.,Ed.,Mack,Easton PA(1980);WO 91/19008),本领域技术人员可以容易地确定适当的浓度和剂量单位大小。
可用于本发明的药物学上可接受的载体包括但不局限于,赋形剂、粘合剂、润滑剂、着色剂、崩解剂、缓冲剂,等渗剂、防腐剂和麻醉剂等医药领域常用的试剂。
在另一个实施方式中,本发明涉及向给动物(优选哺乳动物(更优选人类))施用表I中蛋白或蛋白配体的方法,其施用量足以产生改变该动物体内该蛋白水平的功效。施用的蛋白或配体能够特异影响与蛋白相关的功能。此外,因为表I中的蛋白在脑组织中表达,蛋白或配体的施用可以用于改变脑中蛋白的水平或功能。可以用此方法治疗的神经病症包括蛋白聚集病症,如阿尔茨海默病、帕金森病、朊病毒病、多聚谷氨酰胺病、tau蛋白病、亨廷顿病、家族性肌萎缩侧索硬化、匹克病、进行性核上麻痹和皮质退化症。
在另一个实施方式中,本发明涉及用于检测样品中是否存在表I所列核酸或蛋白的试剂盒。在一个实施方式中,该试剂盒包括试剂盒及其使用说明书,其用于检测改变的蛋白或诊断存在或易患神经疾病的倾向。该试剂盒可以包含至少一个含有置于其中的上述核酸探针的容器。在优选的实施方式中,该试剂盒进一步包含含有洗涤试剂和/或能够检测是否存在杂交核酸探针的试剂的其他容器。检测试剂的实例包括但不局限于放射性标记探针、酶探针(辣根过氧化物酶、碱性磷酸酶)和亲和标记探针(生物素、亲和素或链霉亲和素)。在一个实施方式中,该试剂盒包含用于通过实施PCR、杂交或基于序列的分析或其组合(如微阵列)检测病症的一个或多个试剂。
详细来说,分隔式试剂盒包含以单独容器存储试剂的任何试剂盒。此类容器包括小玻璃容器、塑料容器或者塑料条或纸条。此类容器可以有效地将试剂从一个间隔转移到另一间隔,这样样品和试剂没有交叉污染,并且每个容器的试剂或溶液可以定量地从一个间隔添加到另一个间隔。此类容器包括可接受待测样品的容器、含有该测定中使用的探针或引物的容器、含有洗涤试剂(如磷酸盐缓冲液和Tris缓冲液等)的容器和含有用于检测杂交探针、结合抗体或扩增产物等的试剂的容器。
本领域技术人员容易认识到本发明所述核酸探针可以容易地加入到本领域已知的一个成熟试剂盒中。
在本发明的另一个实施方式中,提供了用于检测表I中蛋白是否存在的试剂盒;或以表I中蛋白是否存在为基础检测哺乳动物产生的病症的可能性。此具体试剂盒包含实施前述检测方法所需的所有试剂。
例如,该试剂盒包含含有上述抗体的第一容器和含有结合物的第二容器,该结合物包含该抗体的结合伴侣和标签。
该试剂盒还可以包含含有上述蛋白的第一容器,和优选地含有结合物的第二容器,该结合物包含该抗体的结合伴侣和标签。更具体地,诊断试剂盒包含如上述表I所列的蛋白质,以检测来自可能已感染的动物和人血浆中的抗体。
在另一个优选实施方式中,所述试剂盒还包含含有一个或多个如下成分的一个或多个其他容器:洗涤试剂和能够检测是否存在结合抗体的试剂。检测试剂的实例包括但不限于标记的第二抗体,或者,如果第一抗体是标记的,能够与标记抗体反应的发光团、酶或抗体结合试剂。分隔式试剂盒可如上所述用于核酸探针试剂盒。该试剂盒可以是,例如RIA试剂盒或ELISA试剂盒。
本领域技术人员可容易地认识到本发明所描述的抗体可以容易地加入到本领域已知的一个成熟试剂盒中。
以下将通过具体实施例对本发明进行更详细地描述。以下提供的实施例仅用于说明,并不以任何方式限定或限制本发明。
实施例1:使用RNAi筛选在帕金森病中调节蛋白聚集的基因
已开发出过表达α-突触核蛋白::GFP的转基因秀丽隐杆线虫系,其导致可通过荧光显微镜观察到的可见α-突触核蛋白聚集体的形成。基因表达处于unc-54启动子的控制下,以指导在体壁上的表达。使用含有α-突触核蛋白::GFP+TOR-2的另一个转基因线虫系用于与蛋白聚集相关的候选基因的RNAi筛选。在α-突触核蛋白::GFP+TOR-2线虫中存在的TOR-2阻止了α-突触核蛋白::GFP融合蛋白在体壁肌肉细胞内的聚集,从而产生扩散的荧光。对于多聚谷氨酰胺的蛋白聚集,此前已有报道称TOR-2对蛋白聚集具有相似的抑制(Caldwell et al.Hum MoI Genet.2003Feb l;12(3):307-19)。此转基因生物允许通过向包含α-突触核蛋白::GFP+TOR-2的转基因线虫体壁肌肉饲喂RNAi而进行快速筛选的方法,以用来发现通过RNAi消减时导致错误折叠升高和恢复α-突触核蛋白聚集的基因。
使用RNAi筛选秀丽隐杆线虫基因文库以确定基因敲减对α-突触核蛋白聚集的影响。购买含有18,000细菌菌株的RNAi文库以用于在秀丽隐杆线虫全基因组RNAi筛选中进行细菌喂食(Sanger Centre,Cambridge)。不同于在整个秀丽隐杆线虫基因组中进行的广泛筛选,合理靶向涉及内质网相关降解(ERAD)、泛素蛋白体系统(UPS)、自噬作用、帕金森病的基因以及相互作用组和微阵列共表达数据鉴定出用于筛选影响蛋白聚集的候选分子。
简要而言,在含有氨苄青霉素和四环素的LB琼脂糖平板上制备表达靶基因dsRNA的大肠杆菌新鲜培养物,并使其生长过夜。次日制备α-突触核蛋白::GFP幼虫(dauer worm)的新鲜培养物和3mL表达靶基因的大肠杆菌细菌培养物。在实验当天,对每个靶基因,先后使用IPTG和细菌培养物涂布一个小型培养板和一个中型培养板,其中在涂布每种物质之间保留干燥的时间。在每个中型培养板上放5条L4线虫,在25℃下放置约42小时。随后,将所有的原始成虫转移到小型IPTG/细菌涂布的平板上,放置9小时,然后烧掉原始成虫。36小时后对子代所产生表型的表达进行分析。
多轮的RNAi分析(每个基因50条线虫;2次重复;当>80%的线虫表现出聚集升高,则判断为阳性)以及在发育阶段动物中进行的更严格的后续筛选(以用于鉴定随衰老而表现更强作用的候选基因)鉴定了表I中列出的在被敲减后可重复地诱导人α-突触核蛋白的错误折叠的候选基因。这些基因是SURF蛋白家族、SEC22蛋白家族和酰基辅酶A氧化酶的秀丽隐杆线虫同源物。
在候选基因的系统性RNAi敲减后,筛选聚集状态得到恢复的α-突触核蛋白::GFP+TOR-2线虫,可以得到多种表型。这些表型包括聚集体在细胞核周围的偶然聚集。
这些实验的发现提供了使用常规实验筛选与α-突触核蛋白聚集相关的蛋白的可靠方法。这些实验的结果提供了对靶蛋白的鉴定,用于研究靶蛋白内引起病理表型的突变,同时提供了用于合理药物设计的蛋白目标。
实施例2:过表达α-突触核蛋白后表达候选基因对多巴胺神经元的神经保护
特别设计了用于筛选候选帕金森病基因的新型线虫同基因系,用于证明神经保护作用。这个新型同基因系包含在多巴胺神经元内过表达人α-突触核蛋白和GFP的染色体整合转基因,以评估在发育和老化期间体内的神经变性。这个系在秀丽隐杆线虫发育的成年期第4天表现出约30-40%变性,并提供了研究环境/遗传因素的理想工具,其中α-突触核蛋白易感性可能影响多巴胺神经变性。通过以下对阳性RNAi筛选候选基因进行系统评估:使在该α-突触核蛋白株的多巴胺神经元内过表达相应cDNA的动物杂交,随后寻找神经保护的证据。此株也用于α-突触核蛋白依赖性变性的小分子抑制剂的中等通量筛选。
材料和方法
秀丽隐杆线虫株和操作方案
使用标准程序(Brenner,1974)来培养线虫。通过用带有Pdat-l::SEC22[UA38(baEx38)株]或Pdat-l::torsinA和Pdat-l::TOR-2的Pdat-l::GFP转化到野生型秀丽隐杆线虫(N2 Bristol种类)中产生转基因系。为了构建α-突触核蛋白过表达系,将Pdat-l::GFP和Pdat-l::α-突触核蛋白[UAl 8(baEx38)株]注射入N2线虫中。对每份质粒构建体的组合,比较多个表达稳定染色体外阵列的线虫系,将3个有代表性的系用于除6-OHDA以外的实验分析,其中,在对所有稳定系进行初始分析后,将单个代表性转基因系用于重复实验。
质粒构建和突变
使用GatewayTM技术(Invitrogen,Carlsbad,CA)构建质粒。具体而言,通过HindIII和Kpnl双酶切将unc-54启动子区从pPD30.38(Andrew Fire惠赠)切除,并替换成从pRN200(Nass et al.,2002)扩增的dat-l启动子区片段。随后,使用GatewayTM技术将所得新载体转入GatewayTM目的载体pDEST-DAT-1中。人α-突触核蛋白cDNA质粒从Philipp Kahle获得。使用编码SEC22(SEQ ID NO:5)α-突触核蛋白、GFP的PCR扩增cDNA片段,通过与pDONR201或pDONR221的BP反应制备GatewayTM入门载体(entryvector)。其后,通过与相应入门载体的LR反应将所有基因克隆到pDEST-DAT-1载体中。
制备用于免疫印迹的秀丽隐杆线虫提取物
在两个100mm NGM平板上的每个转基因系生长到近乎汇集后,制备提取物。通过使用M9缓冲液洗涤,并在1.5ml微离心管内以5,000xg离心1分钟来收集线虫。将线虫沉淀重悬在0.5ml线虫裂解液(100mM Tris,pH 6.8,2%SDS,15%甘油)中,并煮沸5分钟以将其裂解。将此裂解物在13,200xg离心10分钟,收集上清,再使用Cnetricon YM-10柱(Millipore)以14,000xg离心30分钟进行浓缩。使用二羧基二喹啉(bicinchoninic acid)蛋白测定(Sigma,St.Louis,MO)测定蛋白浓度。
α-突触核蛋白诱导的神经变性分析
为了得到α-突触核蛋白转基因系的7日龄的动物,选择含绿色荧光的非整合L1和L2的线虫,并使其生长到成虫期第4天(孵化后约7天)。在每个选定阶段分析每个非整合系的30-40条线虫,对每个转基因组合报道至少3个稳定系的均值。当线虫仍保存所有四个CEP胞体时,无论该树突体形态如何,则将该线虫记录为野生型。
结果
将来自候选基因的野生型cDNA克隆入多巴胺表达载体,以在神经保护分析中在转基因秀丽隐杆线虫内进行评估。
此筛选方法还鉴定以具有保护多巴胺能神经元免受α-突触核蛋白诱导的神经变性的能力为特征的基因。该秀丽隐杆线虫基因为SEC22(SEQ ID NO:5),并与人SEC22基因(SEQ ID NO:7)对应。在GFP标记的多巴胺神经元内过表达SEC22cDNA,并在接触6-OHDA后分析神经保护作用。获得了独立的SEC22表达转基因系,其表现出保护多巴胺神经元免受突触核蛋白诱导的神经变性的明显作用。在过表达酰基辅酶A氧化酶时发现了相似的结果。例如,SEC22在DA神经元内的神经保护作用显示于图1中。进一步的研究将区分在发育早期表现出聚集的其它候选基因和仅随动物年龄而表现聚集的候选基因。
实施例3:使用微阵列检测蛋白改变并诊断人体对帕金森病的易感性或患有帕金森病的方法
帕金森病微阵列的制备
可以使用标准的商用微阵列技术制作帕金森病微阵列,例如Affymetrix公司使用的点样微阵列或基于高密度寡核苷酸的平台。选择中等数量至大量的基因和/或转录本进行分析,即,表达(或响应)谱。可使用本发明方法监测的核酸序列包括但不局限于美国国家生物技术信息中心(网址ncbi.nlm.nih.gov)在GenBank.RTM数据库中所列的基因,和其他公共或商业数据库提供的序列(例如NCBI EST序列数据库、EMBL核苷酸序列数据库;Incyte’s(Palo Alto,Calif.)LifeSeq.TM.数据库和Celera’s(Rockville,Md.)“Discovery System”.TM.数据库)。所述微阵列还包含编码表I中蛋白的人同源基因序列的相应转录本。本阵列可包含与所述基因/转录本对应的全长序列,或者全长序列中可以提供足以检测样品中基因/转录本的特异性的一个或多个片段。所述微阵列可以包含与SEQ ID NOs:3、7或11对应的转录本或片段及其组合,包括这些序列的突变形式和剪接变体。阵列上包含的其它序列包括与帕金森并相关的其他已知基因。与帕金森病相关的其他基因(如SNPs)也可包含在此阵列上(Maraganore et al.,Am J Hum Genet.2005Nov;77(5):685-93)。此阵列还包括阳性对照和阴性对照。
微阵列的使用
从个体收集来自个体的组织样品(如生物活检)并使用标准方法制备微阵列探针,将样品转换为标记的多核苷酸探针,与微阵列杂交,并洗去未结合的探针。随后,使用常规阵列扫描仪扫描此阵列以检测标签,从而确认患者样品中是否存在基因野生型或突变型(定性变化)以及基因表达水平的变化(定量变化)。使用标准商用数据挖掘软件对遗传谱进行分析和聚类。
使用微阵列所得的结果可用于药物基因组学和预测医学的应用。多个患者的遗传谱与症状程度、疾病的发生和严重程度相关,从而构成了帕金森病谱的数据库。患者谱也与患者对已有治疗方法(如L-DOPA疗法)的反应相关。新型治疗性化合物的功效也与早期临床检验期间的患者谱相关,从而确定新治疗的最佳遗传谱。
序列表
SEQ ID NO:1
    atgaac cagttccggg ctccaggtgg tcagaacgaa atgctggcga aagcagaaga
cgccgctgaa gatttcttcc gcaaaacaag gacctaccta ccccacattg ctcgcctctg
cctcgtctcc acattccttg aagatggaat ccgtatgtac ttccaatggg atgatcaaaa
acagttcatg caagagtctt ggtcttgcgg ttggttcatc gcaactttgt tcgtcatcta
caacttcttc ggacagttca tcccggtttt aatgatcatg ctccgcaaga aggtgttggt
cgcatgtgga attcttgcca gcattgtcat tctccaaacc atcgcttacc atattctctg
ggacttgaag ttcttggcca gaaacattgc cgttggtgga ggacttttgc tccttcttgc
cgagacacag gaagagaagg cttccctgtt cgccggagtt ccaacaatgg gagactcgaa
caagccaaaa tcgtacatgc ttcttgccgg acgtgttctt cttatcttca tgttcatgtc
tttgatgcat tttgagatgt ccttcatgca agttttggag attgttgttg gatttgctct
catcactctc gtctcaattg gttacaagac aaagctttcc gcgattgttc ttgtcatctg
gctcttcgga cttaaccttt ggcttaatgc ttggtggacc attccttccg accgcttcta
cagagacttc atgaagtacg atttcttcca aaccatgtcc gtcattggag gacttctcct
tgtcattgcc tacggaccag gaggagtgtc agtcgatgac tacaagaaaa gatggtag
SEQ ID NO:2
MNQFRAPGGQ NEMLAKAEDA AEDFFRKTRT YLPHIARLCL VSTFLEDGIR MYFQWDDQKQ
FMQESWSCGW FIATLFVIYN FFGQFIPVLM IMLRKKVLVA CGILASIVIL QTIAYHILWD
LKFLARNIAV GGGLLLLLAE TQEEKASLFA GVPTMGDSNK PKSYMLLAGR VLLIFMFMSL
MHFEMSFMQV LEIVVGFALI TLVSIGYKTK LSAIVLVIWL FGLNLWLNAW WTIPSDRFYR
DFMKYDFFQT MSVIGGLLLV IAYGPGGVSV DDYKKRW
SEQ ID NO:3
ggagccgcagccgacgcggagcgaggccggccgccgggcacttcctgtggaggccgcagc
gggtgcgggcgccgacgggcgagagccagcgagcgagcgagcgagccgagccgagcctcc
cgccgtcgccatgggccagaacgacctgatgggcacggccgaggacttcgccgaccagtt
cctccgtgtcacaaagcagtacctgccccacgtggcgcgcctctgtctgatcagcacctt
cctggaggacggcatccgtatgtggttccagtggagcgagcagcgcgactacatcgacac
cacctggaactgcggctacctgctggcctcgtccttcgtcttcctcaacttgctgggaca
gctgactggctgcgtcctggtgttgagcaggaacttcgtgcagtacgcctgcttcgggct
ctttggaatcatagctctgcagacgattgcctacagcattttatgggacttgaagttttt
gatgaggaacctggccctgggaggaggcctgttgctgctcctagcagaatcccgttctga
agggaagagcatgtttgcgggcgtccccaccatgcgtgagagctcccccaaacagtacat
gcagctcggaggcagggtcttgctggttctgatgttcatgaccctccttcactttgacgc
cagcttcttttctattgtccagaacatcgtgggcacagctctgatgattttagtggccat
tggttttaaaaccaagctggctgctttgactcttgttgtgtggctctttgccatcaacgt
atatttcaacgccttctggaccattccagtctacaagcccatgcatgacttcctgaaata
cgacttcttccagaccatgtcggtgattgggggcttgctcctggtggtggccctgggccc
tgggggtgtctccatggatgagaagaagaaggagtggtaacagtcacagatccctacctg
cctggctaagacccgtggccgtcaaggactggttcggggtggattcaacaaaactgccag
cttttatgtatcctcttcccttcccctcccttggtaaaggcacagatgttttgagaactt
tatttgcagagacacctgagaatcgatggctcagtctgctctggagccacagtctggcgt
ctgacccttcagtgcaggccagcctggcagctggaagcctcccccacgccgaggctttgg
agtgaacagcccgcttggctgtggcatctcagtcctatttttgagtttttttgtgggggt
acaggagggggccttcaagctgtactgtgagcagacgcattggtattatcattcaaagca
gtctccctcttatttgtaagtttacatttttagcggaaactactaaattattttgggtgg
ttcagccaaacctcaaaacagttaatctccctggtttaaaatcacaccagtggctttgat
gttgtttctgccccgcattgtattttataggaatagtgaaaacatttagggacacccaaa
gaatgatgcagtattaaaggggtggtagaagctgctgtttatgataaaagtcatcggtca
gaaaatcagcttggattggtgccaagtgttttattgggtaacaccctgggagttttagta
gcttgaggcaaggtggaggggcaagaagtccttggggaagctgctggtctgggtgctgct
ggcctccaagctggcagtgggaagggctagtgagaccacacaggggtagccccagcagca
gcaccctgcaagccagcctggccagctgctcagaccagcttgcagagccgcagccgctgt
gggcagggggtgtggcaggagctcccagcactggagacccacggactcaacccagttacc
tcacatggggccttttctgagcaaggtctcgaaagcgcaggccgccctggctgagcagca
ccgccctttcccagctgcactcgccctgtggacagccccgacacaccactttcctgaggc
tgtcgctcactcagattgtccgtttgctatgccgaatgcagccaaaattcctttttacaa
tttgtgatgccttaccgatttgatcttaatcctgtatttaaagttttctaacactgcctt
atactgtgtttctctttttgggggagcttaactgcttgttgctccctgtcgtctgcacca
tagtaaatgccacaagggtagtcgaacacctctctggcccctagacctatctggggacag
gctggctcagcctgtctccagggctgctgcggcccagccccgagcctgcctccctcttgg
cctctcatccattggctctgcagggcaggggtgaggcaggtttctgctcataagtgcttt
tggaagtcacctacctttttaacacagccgaactagtcccaacgcgtttgcaaatattcc
cctggtagcctacttccttacccccgaatattggtaagatcgagcaatggcttcaggaca
tgggttctcttctcctgtgatcattcaagtgctcactgcatgaagactggcttgtctcag
tgtttcaacctcaccagggctgtctcttggtccacacctcgctccctgttagtgccgtat
gacagcccccatcaaatgaccttggccaagtcacggtttctctgtggtcaaggttggttg
gctgattggtggaaagtagggtggaccaaaggaggccacgtgagcagtcagcaccagttc
tgcaccagcagcgcctccgtcctagtgggtgttcctgtttctcctggccctgggtgggct
agggcctgattcgggaagatgcctttgcagggaggggaggataagtgggatctaccaatt
gattctggcaaaacaatttctaagatttttttgctttatgtgggaaacagatctaaatct
cattttatgctgtattttatatcttagttgtgtttgaaaacgttttgatttttggaaaca
catcaaaataaataatggcgtttgttgtatgcagtgtgatccta
SEQ ID NO:4
Figure GPA00001022022800351
SEQ ID NO:5
atggagctaa cgctaattgc ccgtgtacga gacggcctta ttttggccac atcgattgaa
ggaaacaatg acggcagtgg cgactcaagt atggtgaaat actcgaatca agcaaaaatg
ctcttcaaga agctgaatgg ggctccagca cagcaaagtg tagagtcagg accatttgtt
tttcactaca taatcgtcca aaacatttg cgccctggtc ctctgtgata ggaatttccc
gcgtaaagtt gccttccagt acctcagtga cattggccaa gagtttctaa acgagaacag
ttcgagaatc gagcaagtcg ttcgtccata ccatttcctc gaatttgaca aatacatcca
acaagctaaa caaagatatg gagacaccaa caaacacgca atgaatacgg tatccaatga
gctccaggac gtcacaagaa ttatggtcac taatatcgaa gatgtcattc atcgaggaga
agctttgaat attctggaaa accgagcatc cgaattgtct ggaatgagca aaaaatacag
ggatgacgcg aaagccctga atcgacgatc aaccattttc aaagtagcag cctcgattgg
aattgccgga gttcttttcc tcatgctccg cttcattttc ttctag
SEQ ID NO:6
Figure GPA00001022022800352
SEQ ID NO:7
ggagcggcgggtcccgtctcgacaggtcttctctgttggttgaaatgtctatgattttat
ctgcctcagtcattcgtgtcagagatggactgccactttctgcttctactgattatgaac
aaagcacaggaatgcaggagtgcagaaagtattttaaaatgctttcgaggaaacttgctc
aacttcctgatagatgtacactgaaaactggacattataacattaattttattagctctc
tgggagtgagctacatgatgttgtgcactgaaaattacccaaatgttctcgccttctctt
tcctggatgagcttcagaaggagttcattactacttataacatgatgaagacaaatactg
ctgtcagaccatactgtttcattgaatttgataacttcattcagaggaccaagcagcgat
ataataatcccaggtctctttcaacaaagataaatctttctgacatgcagacggaaatca
agctgaggcctccttatcaaatttccatgtgcgaactggggtcagccaatggagtcacat
cagcattttctgttgactgtaaaggtgctggtaagatttcttctgctcaccagcgactgg
aaccagcaactctgtcagggattgtaggatttatccttagtcttttatgtggagctctga
atttaattcgaggctttcatgctatagaaagtctcctgcagagtgatggtgatgatttta
attacatcattgcatttttccttggaacagcagcctgcctttaccagtgttatttacttg
tctactacaccggctggcggaatgtcaaatcttttttgacttttggcttaatctgtctat
gcaacatgtatctctatgaactgcgcaacctctggcagcttttctttcatgtgactgtgg
gagcatttgttacactacagatctggctaaggcaagcccagggcaaggctcccgattatg
atgtctgacaccatccttcagatctattgccttggcttcagggggataaggagggaacat
atcataactgcactgtgatgaagaagctgttccccacagaggagaagctctgctttcttt
ctctccaactttccttttttaaaatcagcatgatgtgcctgtgagcatggaagagtcctc
tcagaagaatgttggccatgagactatcattcagaggaggaggggatttctctcttcaag
gccgtaacagtggaagaacagtcatatgccattggaagtcttggccagcagtcctgaatc
cttcctgaagagttcagaaaatagatgtggtattgctctgaggaccaggcaggaggaact
ctacaacctgagtttgcctttgtgaggcattagtatagaccaaataaaaagctgcagaaa
ttggaaagtttatgttttaaataaatgactgtgataaatatcagattatttgcacactta
tggtactacgagtttataaagtccaagatggtgtgaaattggttctttttacttttatat
ttttgcttgaatcttaactctggaaatcacctgatgtagaagaagactgtgatgagctcg
tctgtggaacatcacaagtatcgaaaatacagtaatggatgtttcctttctaatccacat
ttattgtttcttttgaaatcacgtctaaaaaatatgactcacactatagccgttgtttcc
caaacttcagtctctttagtactacttgtattattttcttaatatttatcttttaaattt
taaagttttttt
SEQ ID NO:8
MSMILSASVIRVRDGLPLSASTDYEQSTGMQECRKYFKMLSRKLAQLPDRCTLKTGHYNI
NFISSLGVSYMMLCTENYPNVLAFSFLDELQKEFITTYNMMKTNTAVRPYCFIEFDNFIQ
RTKQRYNNPRSLSTKINLSDMQTEIKLRPPYQISMCELGSANGVTSAFSVDCKGAGKISS
AHQRLEPATLSGIVGFILSLLCGALNLIRGFHAIESLLQSDGDDFNYIIAFFLGTAACLY
QCYLLVYYTGWRNVKSFLTFGLICLCNMYLYELRNLWQLFFHVTVGAFVTLQIWLRQAQG
KAPDYDV
SEQ ID NO:9
atgagtcgat ggattcagcc aggcgataat gtagacatta ccaatgaacg
gaaaaaagct acgtttgaca cagaacgtat gtcagcttgg atacatggag
ggactgaagt tatgaagcgt cgccgtgaaa ttctggattt tgtcaaaagc
gttgacgact tcaaagatcc ggttccaaca gagtttatgt ctcgcgaaga
acgcattctg aacaatgctc gtaaagttgt ggcaatgaca aataacaccg
atcagattga tggatctgac ttcttcggag aaggaatgta ttatcaagca
ttgacgatgg gccgtgatct tcatgcaatg tcgcttcatt acgttatgtt
tattccaaca cttcaaggtc aaactgacga tgatcaactg gacgagtggc
ttaccaaaac aatttcccgt gcagtagttg gaacttatgc tcaaacagaa
ctcggtcatg gtacaaacct ttcaaaactg gaaaccactg caacttatga
tccagccaca gaagagtttg ttatgaactc gccaacaatc actgcagcca
aatggtggcc gggaggcttg ggtaaatcgt cgaactacgc tgtggttgtt
gcacagttgt acacaaaagg agagtgtaaa ggacctcatc cgttcattgt
gcaacttcgc gatgaagaca ctcactatcc actcaaggga attcgtttgg
gagatattgg accaaaactt ggcatcaatg gaaatgacaa tggattctta
cttttcgata aagtcagaat tccaagaaaa gcattgctga tgagatacgc
aaaagtgaat ccagatggaa cttacattgc tccggctcat tccaaattgg
gatatggaac tatggtgttt gtgagatcaa ttatgatcaa ggatcagtcg
actcaacttg cggcagctgc aacaattgct acgagatatg cagcagtgag
aagacaggga gaaatcactc caggaaaagg ggaagttcaa atcattgact
accaaaccca acaatttcgt gtcttccctc aactcgccag agcgtttgct
ttcatggcag cggccactga aatccgtgat ctctacatga cagtcaccga
gcagcttaca catggaaaca ccgaacttct cgccgagctt catgtcttgt
cttccggtct caagtcgtta gtgtcgtggg atactgctca aggaattgag
caatgcagat tggcgtgtgg aggtcatggg tattcacaag cttctggatt
cccagaaatc tatggatatg ctgttggtgg atgcacttac gagggtgaaa
atattgtgat gcttctgcaa gtagcaagat tcctgatgaa agcagccgaa
ggagttagaa aaggaactgc taacctagca gacatcggag cttacattgg
aaagcctgga aggaaaacct cgcgcttaac aactcaccac cactacacag
atgctgatat cgttgaagat cttgagcacg ttgctcgcaa acaagtattc
cgagcctacg accgcctgaa aaaggctcag agcatcttcg tccggaaga
tgcttggaac tcggtttctg tggaacttgc taaagcttcg agatggcacg
ttcgtctgta tctcgtgaag aacttattgc acaaagtttc tattgctcct
caggatttga agattgtgct cttcgatgtt gctcggctgt atgcttatga
catcattaca tcatcaattg gagcattttt ggaggatggc tacatgagct
ctaatcagat gaatgaagtt aaagaaggta tttataaatg cttgtccaat
atgcgtccaa atgcggttgg cctagttgac tgttgggatt atgacgataa
agagctcaaa tcagttttgg gaagacgtga cggaaacgtg taccctgctc
ttctccagtg ggctcaaaat agtcaactca acagatcgga agttcttccg
gcctacgaaa agtatcttgg tccaatgatg aaagacgctc gatcaaaatt
gtaa
SEQ ID NO:10
MSRWIQPGDN VDITNERKKA TFDTERMSAW IHGGTEVMKR RREILDFVKS VDDFKDPVPT
Figure GPA00001022022800371
SEQ ID NO:11
ctcccctggccaggagcaggggattagtctgccccgcgaccggccccagccacgacgcgg
acatcgccccctctgtctgggccgctgtcactcacgcgccaaagggccacggagaaagaa
ggggcgggccggggcgggccgggcgagcggaggcggggacttgcgccgtcctgaggctgc
ctcctagggtccggccggcgctggagctgcggatttagattgtcactgccacctcggtcg
gtgcttacttcgctgccagctggtcgtcgccatgaacccggacctgcgcagggagcggga
ttccgccagcttcaacccggagctgcttacacacatcctggacggcagccccgagaaaac
ccggcgccgccgagagatcgagaacatgatcctgaacgacccagacttccagcatgagga
cttgaacttcctcactcgcagccagcgttatgaggtggctgtcaggaaaagtgccatcat
ggtgaagaagatgagggagtttggcatcgctgaccctgatgaaattatgtggtttaaaaa
actacatttggtcaattttgtggaacctgtgggcctcaattactccatgtttattcctac
cttgctgaatcagggcaccactgctcagaaagagaaatggctgctttcatccaaaggact
ccagataattggcacctacgcccagacggaaatgggccacggaactcaccttcgaggctt
ggaaaccacagccacgtatgaccctgaaacccaggagttcattctcaacagtcctactgt
gacctccattaaatggtggcctggtgggcttggaaagacttcaaatcatgcaatagttct
tgcccagctcatcactaaggggaaatgctatggattacatgcctttatcgtacctattcg
tgaaatcgggacccataagcctttgccaggaattaccgttggtgacatcggccccaaatt
tggttatgatgagatagacaatggctacctcaaaatggacaaccatcgtattcccagaga
aaacatgctgatgaagtatgcccaggtgaagcctgatggcacatacgtgaaaccgctgag
taacaagctgacttacgggaccatggtgtttgtcaggtccttccttgtgggagaagctgc
tcgggctctgtctaaggcgtgcaccattgccatccgatacagcgctgtgaggcaccagtc
tgaaatcaagccaggtgaaccagaaccacagattttggattttcaaacccagcagtataa
actctttccactcctggccactgcctatgccttccagtttgtgggcgcatacatgaagga
gacctatcaccggattaacgaaggcattggtcaaggggacctgagtgaactgcctgagct
tcatgccctcaccgctggactgaaggctttcacctcctggactgcaaacactggcattga
agcatgtcggatggcttgtggtgggcatggctattctcattgcagtggtcttccaaatat
ttatgtcaatttcaccccaagctgtacctttgagggagaaaacactgtcatgatgctcca
gacggctaggttcctgatgaaaagttatgatcaggtgcactcaggaaagttggtgtgtgg
catggtgtcctatttgaacgacctgcccagtcagcgcatccagccacagcaggtagcagt
ctggccaaccatggtggatatcaacagccccgaaagcctaaccgaagcatataaactccg
tgcagccagattagtagaaattgctgcaaaaaaccttcaaaaagaagtgattcacagaaa
aagcaaggaggtagcttggaacctaacttctgttgaccttgttcgagcaagtgaggcaca
ttgccactatgtggtagttaagctcttttcagaaaaactcctcaaaattcaagataaagc
cattcaagctgtcttaaggagtttatgtctgctgtattctctgtatggaatcagtcagaa
cgcgggggatttccttcaggggagcatcatgacagagcctcagattacacaagtaaacca
gcgtgtaaaggagttactcactctgattcgctcagatgctgttgctttggttgatgcatt
tgattttcaggatgtgacacttggctctgtgcttggccgctatgatgggaatgtgtatga
aaacttgtttgagtgggctaagaactccccactgaacaaagcagaggtccacgaatctta
caagcacctgaagtcactgcagtccaagctctgaagtgtcacaaggacaagtttaatctg
cttcagaaagcgcctgtgtgcaactcaaattttgtggaatctttttcgaattcaaatagc
tatagagcaaatgataaattgacccctttttataaatggagggaaaaaatgaacagattt
cagagattaaatgaaaaaaagcagatgttttaagtgcaattaacactgaaagagacctgt
taaaccattcagaaaaagcttaagaaatgcgatatgacttccttttgtaatgctgctgat
cccagtagactatgacttttgataattagcagaatttaactactgagtagttgattattt
tcacattttaattgctaatcactggctatataagtgtttttaagcaaaggtatttttgaa
gtggtgtagaacccttccaagctttcctgctcagtgttctaccagacttaccctggggcc
tggcttaaaagcaggattgaagaaaagggactgggggaaggaaacttattggaaaacttg
atgcgaatgagtttctgcttggcacagtctctgcctgcttgctctcctttgctgatggat
tgcatttatcaaactattcatgctagcatttttccaacgagggaacttattccgcacggg
cctactgtaggaccattgtctcgtgtaattaggaattttccatttgaaggattgctaaat
tgtcacagtagtaggaagtatagggaaacctctcagctgtggcactgttgtagctttgga
gtgcagagtgtaactctgggacaatcagatttcacatattctgtcatcttggcataagcc
attaaaagcttggagattactgtatttggcattaaaaaaaaatgtcacttaggtcagcac
tcccagacgtagcacagaaaaaccctttgacacaaaccatgtgttctgatttttggttca
gaaaatattgaaactgtgagttgttttttttttaacaactgggaaaaaacaaaaacaaaa
aactatagttagaaaaatggaagttccataggttctatttcttactctatgtatggcttt
gttttcagtctatttctaggagctttctctgaatcgctaattgtcctttcagttgaaatc
taatttatacaatcattctatacttaaaggttaaatacatcttaattaattttttctt
SEQ  ID NO:12
F59F4.1/酰基辅酶氧化酶蛋白同系物
果蝇
SEQ ID NO:13
gcgtgagaataatggttgtgctacagactatttcaacacaaaagcgaact
tattacatgtgtattttcgcggttaaagttcacgtcgttcgagagctggc
atcgatgattagattcggaatagctggatcagatcagcagtccataatct
caatctcctccactggatttcctccaccagcacttgagtgaccgactgac
tgaccactgagcgcaattcgcctttccagcaacaatcagtcagtacgcga
tattcaacgaagacggacgctttgcggtggctcgttaatccataacctgt
ttacgtgacttgaatactgtgccgcatagcaaaatgccagccaaaccagt
gaatcccgatctccagaaggaacgcagcacggccaccttcaatccccggg
agttctccgttctgtgggccggcggcgaggagcgattcaaggagaagaag
gccctggagaaattgtttttggaggatccagcccttcaggacgacttgcc
catttcctatttgtcacacaaggagctctatgagcacagcttgcgcaaag
cctgcatcataggagagaagatccgcaagctacgtgctgatggcgaggat
ggagtggatacttacaatgctctgcttggtggatccttgggatcggctat
tctaaaggagggcaatccgcttgcgctgcactacgtgatgttcgtgccca
ccatcatgggccagggaacgatggatcagcaggtggaatggctgagcaag
gcctgggactgtgaaatcattggcacctatgcccaaacggaactgggaca
cggaaccttcctgcgcggtctggagaccagggctgactacgatgccagca
cccaggagtttgttataaacactccatcactcagtgcatacaagtggtgg
cccggtggattgggacacactgctaaccatgcggttgtggtggcacaact
ctacaccaagggcgagttccgtggtctggctccttttattgtccaattga
gggattccgatactcaccgtcccatgcccggcatcgacattggagatatt
ggtaccaagctgggcatgaagggtgtcaacaatggctatttgggactgaa
gaacgtacgggtgcctttaaacaacatgctgatgaagaaccagcaagtgc
tgcccgatggcacatatgtggcgccgaagaatagcgtgcttacctacgga
actatgatgtttgtgcgttgtgctcttatccgtgataccgctcagagcct
ggcaaaggcatccactattgccactaggtattcagctgttcgccgacaga
gtcccattgatcccaatcaaccggagccccaaatcatggaccataccacg
cagcagttgaagttgttcccccagatagctaaagccatcgttttcaaaac
gacgggtgatggcatctggaatatgtacaacgtgatatctggcgagattg
agcagggtaacttggatcgcctgcccgaaatgcatgcattgtcctgctgc
cttaaggccatctgtagtgccgatgccgccgccggcgtggaaacgtgtcg
tctgtcatgtggcggacatggctacatggactgctccaacttccccacga
tatacggcatgaccacggccgtttgcacctatgagggcgagaacacagtg
atgctgctgcagactgctcgctatttggtgaaggtttatgggcaggcctt
gaatggagagaagctggtgccaacggtttcgtacatcagtgatgcaataa
accaaaccaagtttgttaactttgacggatcattgaggtctattgtcaag
gctttccaattcgttgccgccaacaaaacccgaattgcctatgagcagat
tgaactgcgccgcaagcaaggttatggtaccgaggtggcagctaatctat
gtggcaccttcctaacagcagctgcagatcttcatggacgcgccttccta
gcgcagactgcctatacggagcttttggccttgtcgcgcgaggtgtcccc
agaactagctgaagtcctaaaggtggtgctggagctgtatctggtagacg
cctgcctcaaccgcattggcgacttcttgcggttcattgatctcactgat
caagatgtcacgaaactggaggttcgcctggagaactgcttaaaacgatt
ccggccgaatgccgtcagcttggtggacagctttgatcttcacgatcgcg
tgctagattccgcattgggtgcctatgatggaaatgtttacgaacacatc
ttcgagtctacgaagaagaacccgttgaacaaggagccagtcaacggagc
attccacaagtacttgaagccattcatgaaggctcacctctagattcata
tcctattgctctggaagattttcacaagtgttattattgtaaatatacat
ttgtttccattgtttttgtattatacaactgtctgcttagcaaatggtct    
ttaagacaattatgatgtcagggcttgtgcagttgaaactaggctgtaaa
attatacacaaataaaatattcaactatattt
SEQ ID NO:14
mpakpvnpdl qkerstatfn prefsvlwag geerfkekka leklfledpa lqddlpisyl
shkelyehsl rkaciigeki rklradgedg vdtynallgg slgsailkeg nplalhyvmf
vptimgqgtm dqqvewlska wdceiigtya qtelghgtfl rgletradyd astqefvint
pslsaykwwp gglghtanha vvvaqlytkg efrglapfiv qlrdsdthrp mpgidigdig
tklgmkgvnn gylglknvrv plnnmlmknq qvlpdgtyva pknsvltygt mmfvrcalir
dtaqslakas tiatrysavr rqspidpnqp epqimdhttq qlklfpqiak aivfkttgdg
iwnmynvisg eieqgnldrl pemhalsccl kaicsadaaa gvetcrlscg ghgymdcsnf
ptiygmttav ctyegentvm llqtarylvk vygqalngek lvptvsyisd ainqtkfvnf
dgslrsivka fqfvaanktr iayeqielrr kqgygtevaa nlcgtfltaa adlhgrafla
qtaytellal srevspelae vlkvvlelyl vdaclnrigd flrfidltdq dvtklevrle
nclkrfrpna vslvdsfdlh drvldsalga ydgnvyehif estkknplnk epvngafhky
lkpfmkahl
斑马鱼(Danio rerio)
SEQ ID NO:15
aaaaaaaaag aaaaaaggac acaaagcaga aggcacgtag ctcgaaagaa agtttaactg
aatagtcatg aatcctgata ttagccgtga acgtgaaaat gcgtctttta acctggagat
tcttacaaac gtgctggatg gtggagcgga aaagacaaat agaaggagag aaatagagtc
tctggttatt ggagatccag atttccaaca tgaagaccta aactttctct ctcgaagtga
gcgatatgat gcagcagtgc ggaagagtgc acagatgatt ctgaaactta gggaatatgg
tatctctgat ccagaagaga tctactccta caagactgtt gtgaggggtg tatttcaaga
gcccctaggt gtccataatg tcatgttcat acccacctta aaaagccagt gtactgctga
acaacgcaaa aaatggatcc cattagctga gtcattccat atgttaggca cctatgctca
gacagagctg gggcacggta cacacatccg tgctcttgaa accactgcca catatgaccc
ttccacccaa gagttcgttt tgaacagttc aacaatctcc tcaattaaat ggtggccagg
tggattgggt aaaacctcaa accatgctat agtcctggct cagctgtaca cgcagggcaa
gtgtcatggc ctgcatgctt tcatcacacc cattcgctgt atgaagacac acatgccact
tccaggtgtg gtcgttggtg atattgggcc caaatttggt tttgatgagg tggataatgg
ctatttgaaa ctggaaaatg ttagaattcc acgagagaat atgcttatga agtatgccca
ggttgaaccg gatggtacat atgtgaagcc tcctagtgat aaactcacat atggtaccat
ggtgtttatt cgctccatga tagtgggaga gtcagcacga gctctctcca aatcctgcac
tattgccatt cgctacagtg cagtccgaca tcagtctgaa ctacgcccag gtgaacctga
gccacagatc ttggactatc aaacccagca gtataaacta tttcctcttc tggctactgc
atatgccttt cactttgtag ggcagtacat gaataaaaca taccatcgca tctcaggaga
catcagtctg ggtgacttca gtgagcttcc agagctgcat gccttgtcag ctggtctgaa
agcttttacc acctgggcag caaatactgg cattgaggta tgtcgtatgt catgtggtgg
tcatggctac tcccgctgca gcagtttacc tgacatctac gtcactttta cgccaacctg
cacttatgag ggagagaata cggttatgat gctgcagaca gctaggtatt tggtgaagag
ctacaagcaa gcacgggcag gacaacagtt gactggcatt gtgtcttacc tgaacgaatc
tcagagcagg atacagcccc attctgtgtc ttcccggcct actgttgtca atattaatga
cctggtcagc cttgtcgagg catacaagtt cagagctgca aagttagttg aagttgcagc
taagaacctt cagttggagc tacagcacag caagagtaac gaagatgcct ggaacaacac
ttccattgat ctagtcagag catctgatgc ccattgccat tatgtggttg tgaagctatt
tgctgctaaa ctgagtgaga ttggagataa ggctgtccac tcagtactca gcactttggc
tctgctttat gcccttcatg gagttgcaca gaattctggg gactttttaa aggctggtct
gctaagtgtt tctcagctgg atcagatttc acagaggctg aagggtctcc tcttagagat
aaggcccaat gcagtggctc tcgttgatgc ttttgactac cgtgatgaga tgcttaattc
ttctctggga cgatatgatg gcaacgtcta tgagcacatg tttgagtggg ccaagaagtc
acctctgaac catactgagg tccatgagtc ccacaacaag tatttgaagc cactacgatc
caaattgtaa ctagtgcaag aaaggggaag aaagggaaaa gtctgtctat taaaaaaaaa
tgttagagaa gaaaataatg tttgcttaaa ttctaaatgg atgaggttgc attctccatt
ctaataattt ataacagcaa tccatgattt ctgtgtgcac ttaaaatgaa tgataatttc
aagtaaacaa atttttattt tgttttgtaa ttgtatcgat tctggtatca tgtaatattt
gcttattatt ttgagagaat gtgatgtttc agtaaacata cttctaatga tttggacttt
gtgaaaatgg ttctgtactg aataattaac atttggatga ggatggtaag acatacatat
ctttatgaaa tcatgcctta agacccacat acaagaatgt tttttagtat taataaaatt
aatagttgta tagttccatt tcaatgatgt gtaattatta gatattgtat tgtgatctga
ccatgttata tttgtaacac ttgtcatttg aacttatttg ctgcattaat aaataaatca
tttaacattt acaaaaaaaa aaaaaaaaaa aaaaa
SEQ ID NO:16
mnpdisrere nasfnleilt nvldggaekt nrrreieslv igdpdfqhed lnflsrsery
daavrksaqm ilklreygis dpeeiysykt vvrgvfqepl gvhnvmfipt lksqctaeqr
kkwiplaesf hmlgtyaqte lghgthiral ettatydpst qefvlnssti ssikwwpggl
gktsnhaivl aqlytqgkch glhafitpir cmkthmplpg vvvgdigpkf gfdevdngyl
klenvripre nmlmkyaqve pdgtyvkpps dkltygtmvf irsmivgesa ralsksctia
irysavrhqs elrpgepepq ildyqtqqyk lfpllataya fhfvgqymnk tyhrisgdis
lgdfselpel halsaglkaf ttwaantgie vcrmscgghg ysrcsslpdi yvtftptcty
egentvmmlq tarylvksyk qaragqqltg ivsylnesqs riqphsvssr ptvvnindlv
slveaykfra aklvevaakn lqlelqhsks nedawnntsi dlvrasdahc hyvvvklfaa
klseigdkav hsvlstlall yalhgvaqns gdflkaglls vsqldqisqr lkgllleirp
navalvdafd yrdemlnssl grydgnvyeh mfewakkspl nhtevheshn kylkplrskl
SEQ ID NO:17
gggattcctg ctgtcgccgc tgccacctac actgcctcag ccgcccgtta ccatgaatcc
agacctgcag aaagagcggg ccggcgccag cttcaacccg gagctgctca cgaatgtcct
ggacggcagc cccgagaaca ctcggcgccg ccgagagatc gagaacctca ttctgaacga
cccagacttc cagcatgaga acttgaattt cctcagccgt agccagcgtt acgaggtggc
tgttaagaag agtgccatca tggtgcagaa gatgaggaag tttggcatcg cagatcctgc
tgaaatcatg tggtttaaaa aactacattt ggtcaatttt gtggaacctg tgggcctcaa
ttactccatg tttattccta ccttgctgaa tcagggcacc actgctcagc aagagaaatg
gctgcattca tccaaaggac tcgagataat tggcacctac gcccagacgg aaatgggcca
cggaacccat cttcgaggct tggaaaccac agccacttat gaccctgaaa cccaggagtt
cattctcaac agtcctactg tgacctccat caagtggtgg cctggtggac ttggaaaaac
ttcaaatcat gctatcgtac ttgcccagct cttcactcag ggaaaatgct atggattaca
tgccttcatt gtacctattc gtgaacttgg gacccataag cctttgccag gtattactgt
aggagacatt ggccccaagt ttggctatga tgagatggat aatggctact tgaagatgga
caactatcgt attcccagag aaaacatgct gatgaaacat gcccaggtga agcctgatgg
cacatacgta aaacccctga ataacaagct gacctacggg accatggtgt tcatcaggtc
cttcctcgtg ggagaatccg ctcggagtct gtctaaggca tgcaccattg ccgtccgata
cagtgctgtg aggcatcagt ctgaaatcaa cccaggtgaa ccagaaccac agattttgga
ttatcaaacc cagcaatata aacttttccc cctcctggcc actgcctatg ccttccagtt
tgtaggcgca tacatgaaag agacctatct tcggattaat gaagacattg gccatgggga
cctgagtgag ctgcctgagc ttcacgcgct caccgctggg ctgaaggctt tcacgtcctg
gacaacgaac acagctattg aagcctgtcg gatggcttgt ggcggacatg gctattctca
ctgcagtgga cttccaaata tttatgtcac ttttacccca acctgcacct tcgaggggga
aaacactgtc atgatgctgc agacagccag gttcctgatg aaaagttacg accaggtgca
ctcaggcaag ttggtgtgtg gcatggtgtc ctacttgaat gacctgccca gccagcgcat
ccagccacag caggtggctg tgtggccaac tatggtggat atcaacagcc ccgacagcct
gacagaggcg tacaagcttc gagcggccag attagtagaa attgctgcta aaaaccttca
gactgaagtg attcacagaa aaagcaagga ggtagcgtgg aacctaacgt ccattgacct
tgttcgggca agtgaggcac attgccacta tgtggtggtt aagctcttta cggaaaaagt
cctccagatt caagagaagt ccatccaagc tgtcctaagg cgtttgtgtc tcttgtattc
tttgtatgga atcagtcaga atgcagggga ttttcttcag gggagcatca tgacagagtc
tcagatcacc caggtgaatg ggcgcatcaa ggagctgctg actgcgattc gccctgacgc
ggttgctctg gtggatgcat ttgattttca ggatgtgaca ctgggctctg tgcttggccg
ctatgatggc aatgtgtacg aaaacttgtt tgaatgggcc aagaaatccc cactgaacaa
aacagaggtc catgagtctt acaagcacct aaagtcgctg cagtccaagc tctgacgtgg
cttgatgata agtgcagtct gccctgaaag tagctgttct tacacctgtc acacaaactt
cgtggaatct tgatcaaatt cagaaaagct gtagagcaag tgataaattg accctttcct
ctttttataa atgaaaaaaa aaaaaaaa
SEQ ID NO:18
mnpdlqkera gasfnpellt nvldgspent rrrreienli lndpdfqhen lnflsrsqry
evavkksaim vqkmrkfgia dpaeimwfkk lhlvnfvepv glnysmfipt llnqgttaqq
ekwlhsskgl eiigtyaqte mghgthlrgl ettatydpet qefilnsptv tsikwwpggl
gktsnhaivl aqlftqgkcy glhafivpir elgthkplpg itvgdigpkf gydemdngyl
kmdnyripre nmlmkhaqvk pdgtyvkpln nkltygtmvf irsflvgesa rslskactia
vrysavrhqs einpgepepq ildyqtqqyk lfpllataya fqfvgaymke tylrinedig
hgdlselpel haltaglkaf tswttntaie acrmacgghg yshcsglpni yvtftptctf
egentvmmlq tarflmksyd qvhsgklvcg mvsylndlps qriqpqqvav wptmvdinsp
dslteayklr aarlveiaak nlqtevihrk skevawnlts idlvraseah chyvvvklft
ekvlqiqeks iqavlrrlcl lyslygisqn agdflqgsim tesqitqvng rikelltair
pdavalvdaf dfqdvtlgsv lgrydgnvye nlfewakksp lnktevhesy khlkslqskl
小鼠
SEQ ID NO:19
agactacatatggtcaattttgtggaacctgttggcctcaattactccatgtttatccct
accttgctgaatcagggcaccactgctcagcaggagaaatggatgcacccgtcccaagaa
ctccagataattggcacctacgcccagacggagatgggccacgctctgtgcaccgagggc
atcctgagcctttggaccttcacttgggcatgttcctgcccaccttgcttcaccaggcca
ccgaagagcagcaggagcgtttcttcatgccggcctggaatctggagatcacgggcactt
atgcgcagacagagatgggtcatggaactcatcttcgaggcttggaaaccactgccacat
atgaccccaagacccaagagttcattctcaacagcccaactgtgacttccatcaagtggt
ggcctggggggcttgggaagacttccaatcatgcgatagtcctggctcagctcatcactc
gaggggagtgctacgggttacatgcctttgttgtccctatccgtgagattgggacccaca
agcctctgccaggcatcactgttggggatatcggccccaagtttggttatgaagagatgg
ataatggctacctgaagatggacaattaccgtattcctagagagaacatgttgatgaaat
atgcccaggtgaagcctgacggcacgtatgtaaaacctctgagtaacaagctgacatatg
ggaccatggttttcgtaaggtccttcctcgtgggaagtgcagctcagagtctgtccaagg
catgcaccattgccattcgatacagtgctgtgaggcgccagtctgaaatcaagagaagcg
agccagagccccagattttggattttcagacgcagcagtataaactcttcccgctcctgg
ccaccgcctatgccttccactttctcggaagatacataaaggagacctacatgcggatta
atgagagcattggccaaggcgacctgagtgagctgcctgagcttcatgccctcacagctg
ggctgaaggcttttactacctggacagccaatgctggtatcgaagaatgtcggatggctt
gcggtgggcacggctattctcacagcagtgggattccaaatatttacgtcacgtttaccc
cggcctgcaccttcgagggggagaacactgttatgatgctgcagacggccaggttcttga
tgaaaatctatgaccaggttcagtcggggaagctggtgggtggtatggtgtcgtacttga
atgacctgccgagccagcgtatccagccgcagcaggtggcagtctggccaactctggtgg
acattaacagcctggacagcctgacagaagcctacaagctacgtgcagccagattggtag
aaattgctgcaaaaaaccttcaggcccaagtgagtcacaggaagagcaaggaagtggcgt
ggaacttgacttctgtcgaccttgttcgcgcaagtgaggcgcactgccactacgtgaccg
ttaaggtctttgcagataaactccccaagattcaagacagagccgtgcaagccgtgctga
ggaacctgtgtctcttatattctctctatgggatcagccagaaaggaggggattttcttg
aggggaacatcatcacaggggctcagatgtcacaggtaaacagtcggatcctggagctgc
tcacagtgactcgccccaacgctgtggctttggtggatgcctttgactttaaggatgtga
cccttggctctgttctcggccgctatgatggcaatgtgtatgaaaacttgtttgagtggg
ccaagaagtccccactgaacaagacagaggtccacgaatcttactacaagcacttgaagc
ccctgcagtcgaagctttgaagtttccccagggacaagtctgagctccacagagaggccg
aatctctccttgattcactaatccttgtgaaatcgtcttcagacttgtgtagctatagag
caaatgatgggctggcctttccctctctataagtaaagagaaatgagcagacttagagat
gaaatgagaatccagtgttgtaggtgcagtagtagcccaggccgacgtaggacctcggga
agccactgccgcgctgtggcctggctgacgttatttgttctgctgctaatctctgtaggc
cttgactctgggggaattaacagagtttaactactaaatacttagtaattttcacatttt
cactgctaatcactggatatatgttttttaaacaaaggtgttctatagagctggactttc
caggctttcttgcctagcactttctgatctaccactaagagcaggagtttgggggccaga
aactaatagaaacccagatgtgagtgtgtggcccttacatatgcccctgctgcctgctgt
gtgggtatgtcattcctaccaactgtcacactaacatatcaacaagaggagtccttaaac
acccacccaccaagaaagcagcgctccgggactaagctcccactctggtcttcctggcaa
tggcatgcacccgcccatgaccccacttcctgacacagctaagttgcttgtctttacctc
caggctttcggccgttgcctggacttcaatcatggtggctgaccttccctttcttgcttt
gcttctcctcaaagagataatagagacaatgaccagtctttcctcatagatcaagtatgg
ggagagccctcagctatggtattcctgtattttggtgacttatttaagtaaatttcctgg
gacaatccagatttgaaagattctgtcttcttgttgtcataaactattaaaatgcttggt
ggtcaccaaagtatttgacataaaaataaataaataaatcattcaggccaccttttacac
cagaaatcacaggaaagccctgggccccagccatctgctgagtgttagttgagaagatgg
atcctaagccagctgaagaatgagtgcaggctgtggggaggttcttgctgagtagctggc
tttgtggtaagctgctagcagccttacagggtggcgaagcagcccccctttggatgcaga
gcagcctctacaatcattctgaccttaaaggtagagtatggaccttttgtggtatgtgtg
tgtatgcttttttttatgtagtgattttttttttcttgagacagggcccagagtggcctt
gacctctgatcctcagcctcccagatgctggggttacaggtttgcgctgacatgcctggc
tagttggaactctttgttcttaaaagcacagtagagagatcattgtgacctattaagtct
gtgtctgtggcattggcatcgtgagaacagttctttcagagcagttctgagaacacagta
ttaatggagtggaaatgacatcaagtcaaagccatcagatttgctgacacagtcttaacc
tttctcctggaatgactgataatccctgaagattgacagtaagcagcatgtcacctgtgg
ggtttctatttgacagtaattcatattctggaaaatagccaataaatttaaatgactgg
SEQ ID NO:20
mnpdlrkera aatfnpelit hildgspent rrrreienli lndpdfqhed ynfltrsqry
evavkksatm vkkmrefgia dpeeimwfkn svhrghpepl dlhlgmflpt llhqateeqq
erffmpawnl eitgtyaqte mghgthlrgl ettatydpkt qefilnsptv tsikwwpggl
gktsnhaivl aqlitrgecy glhafvvpir eigthkplpg itvgdigpkf gyeemdngyl
kmdnyripre nmlmkyaqvk pdgtyvkpls nkltygtmvf vrsflvgsaa qslskactia
irysavrrqs eikrsepepq ildfqtqgyk lfpllataya fhflgryike tymrinesig
qgdlselpel haltaglkaf ttwtanagie ecrmacgghg yshssgipni yvtftpactf
egentvmmlq tarflmkiyd qvqsgklvgg mvsylndlps qriqpqqvav wptlvdinsl
dslteayklr aarlveiaak nlqaqvshrk skevawnlts vdlvraseah chyvtvkvfa
dklpkiqdra vqavlrnlcl lyslygisqk ggdflegnii tgaqmsqvns rilelltvtr
pnavalvdaf dfkdvtlgsv lgrydgnvye nlfewakksp lnktevhesy ykhlkplqsk
1
大鼠
SEQ ID NO:21
cggcgcctgg gcagcggaca cgggtcgttg ctttggtgtc tgtcacttct gtcgccacct
cctctgccaa caccaacact gacctccgtc atgaaccccg acctgcgcaa ggagcgggcc
tccgccacct tcaatccgga gttgatcacg cacatcttgg atggcagtcc ggagaatacc
cggcgccgtc gagaaattga gaacttgatt ctgaacgacc cagacttcca gcatgaggac
tataacttcc tcactcgaag ccagcgttat gaggtggctg ttaagaagag tgccaccatg
gtgaagaaga tgagggaata tggcatctcg gaccctgaag aaatcatgtg gtttaaaaaa
ctatatttgg ccaattttgt ggaacctgtt ggcctcaatt actccatgtt tattcctacc
ttgctgaatc agggcaccac tgctcagcag gagaaatgga tgcgcccgtc ccaagaactc
cagataattg gcacctacgc ccagacggag atgggccacg gaactcatct tcgaggcttg
gaaaccactg ccacatatga ccccaagacc caagagttca ttctcaacag ccctactgtg
acttccatta agtggtggcc tgggggactt gggaaaactt ccaatcacgc aatagttctg
gctcagctca tcactcaagg agagtgctac gggttacatg cctttgttgt ccctatccgt
gaaattggga cccacaagcc cttgccaggc atcactgtcg gggatatcgg tcccaaattt
ggttatgaag agatggataa cggctacctg aagatggaca attaccgtat tcccagagag
aacatgctga tgaaatacgc ccaggtgaag cctgatggca catatgtaaa gcctttgagt
aacaagctga cgtatgggac catggttttt gtgaggtcct tcctcgtggg aaatgcagct
cagagtctgt ccaaggcttg cacaatcgcc atacgataca gcgctgtgag gcgccagtct
gaaatcaagc aaagcgaacc agaaccacag attttggatt ttcaaaccca gcagtataaa
ctcttcccgc tcctggccac tgcctatgcc ttccacttcg taggaaggta catgaaggag
acctaccttc gaattaatga gagcattggc caaggggacc tgagtgaact gcctgagctt
cacgccctca ctgctgggct gaaggctttt actacttgga cagccaatgc tggcatcgaa
gaatgtcgaa tggcctgcgg cgggcacggc tattctcaca gcagtgggat tccaaatatt
tacgtcactt ttaccccggc ctgcaccttc gagggagaga acactgttat gatgctgcag
acagccaggt tcttgatgaa aatctacgac caggtgcggt cggggaagtt ggtgggtggt
atggtgtcat acctgaatga cctgccgagt cagcggatcc agccacagca ggtggcagtc
tggccaacta tggtggacat caacagcctg gagggcctga cagaagccta caagcttcgt
gcagccagat tggtagaaat cgctgcaaaa aaccttcaga ctcacgtgag tcacaggaag
agcaaggaag tagcatggaa cctaacctct gtcgaccttg ttcgggcaag tgaggcgcat
tgccactacg tggtcgttaa ggtcttctca gacaaactcc ccaagattca agacaaagcc
gtccaagctg tgctgaggaa cctgtgtctc ttgtattctc tctatgggat cagccagaaa
ggaggggact ttcttgaggg gagcatcatc acaggggctc agctgtcaca agtaaacgct
cggatcctgg agctgctcac cctgatccgc cccaatgctg ttgctctggt ggatgccttt
gactttaagg acatgacact tggctctgtt cttggccgct atgatggaaa tgtgtatgaa
aacttgtttg agtgggccaa gaaatcccca ctgaacaaaa cagaggtcca tgaatcttac
cacaagcact tgaagcccct gcagtccaag ctttgaagtt tccctgggac acgtctgagc
tccacaagca gcagaaactc tctcctctac tcactaatcc ttgtgaaatc gtcatcaaat
ttgtgtagct acagagcaaa tgatgggttt cttttcctcc ctataagtaa agagaaatga
acagacaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa
aaaaaaaaaa aaaaaaaa
SEQ ID NO:22
mnpdlrkera satfnpelit hildgspent rrrreienli lndpdfqhed ynfltrsqry
evavkksatm vkkmreygis dpeeimwfkk lylanfvepv glnysmfipt llnqgttaqq
ekwmrpsqel qiigtyaqte mghgthlrgl ettatydpkt qefilnsptv tsikwwpggl
gktsnhaivl aqlitqgecy glhafvvpir eigthkplpg itvgdigpkf gyeemdngyl
kmdnyripre nmlmkyaqvk pdgtyvkpls nkltygtmvf vrsflvgnaa qslskactia
irysavrrqs eikqsepepq ildfqtqqyk lfpllataya fhfvgrymke tylrinesig
qgdlselpel haltaglkaf ttwtanagie ecrmacgghg yshssgipni yvtftpactf
egentvmmlq tarflmkiyd qvrsgklvgg mvsylndlps qriqpqtvav wptmvdinsl
eglteayklr aarlveiaak nlqthvshrk skevawnlts vdlvraseah chyvvvkvfs
dklpkiqdka vqavlrnlcl lyslygisqk ggdflegsii tgaqlsqvna rilelltlir
pnavalvdaf dfkdmtlgsv lgrydgnvye nlfewakksp lnktevhesy hkhlkplqsk
1
序列表
<110>阿拉巴马大学董事会(The Board of Trustees of the University of Alabama for and
     on Behalf of the University of Alabama)
 
<120>蛋白错误折叠和神经保护的调节剂及使用方法
 
<130>13707-105041(UA-0151)
 
<140>US 12/221,826
<141>2008-08-07
 
<150>US 60/964,184
<151>2007-08-08
 
<160>22
 
<170>PatentIn version 3.4
 
<210>1
<211>834
<212>DNA
<213>秀丽隐杆线虫(Caenorhabditis elegans)
 
<400>1
 
atgaaccagt tccgggctcc aggtggtcag aacgaaatgc tggcgaaagc agaagacgcc     60
gctgaagatt tcttccgcaa aacaaggacc tacctacccc acattgctcg cctctgcctc    120
gtctccacat tccttgaaga tggaatccgt atgtacttcc aatgggatga tcaaaaacag    180
ttcatgcaag agtcttggtc ttgcggttgg ttcatcgcaa ctttgttcgt catctacaac    240
ttcttcggac agttcatccc ggttttaatg atcatgctcc gcaagaaggt gttggtcgca    300
tgtggaattc ttgccagcat tgtcattctc caaaccatcg cttaccatat tctctgggac    360
ttgaagttct tggccagaaa cattgccgtt ggtggaggac ttttgctcct tcttgccgag    420
acacaggaag agaaggcttc cctgttcgcc ggagttccaa caatgggaga ctcgaacaag    480
ccaaaatcgt acatgcttct tgccggacgt gttcttctta tcttcatgtt catgtctttg    540
atgcattttg agatgtcctt catgcaagtt ttggagattg ttgttggatt tgctctcatc    600
actctcgtct caattggtta caagacaaag ctttccgcga ttgttcttgt catctggctc    660
ttcggactta acctttggct taatgcttgg tggaccattc cttccgaccg cttctacaga    720
gacttcatga agtacgattt cttccaaacc atgtccgtca ttggaggact tctccttgtc    780
attgcctacg gaccaggagg agtgtcagtc gatgactaca agaaaagatg gtag          834
 
<210>2
<211>277
<212>PRT
<213>秀丽隐杆线虫
<400>2
 
Met Asn Gln Phe Arg Ala Pro Gly Gly Gln Asn Glu Met Leu Ala Lys
1               5                   10                  15
Ala Glu Asp Ala Ala Glu Asp Phe Phe Arg Lys Thr Arg Thr Tyr Leu
            20                  25                  30
Pro His Ile Ala Arg Leu Cys Leu Val Ser Thr Phe Leu Glu Asp Gly
        35                  40                  45
Ile Arg Met Tyr Phe Gln Trp Asp Asp Gln Lys Gln Phe Met Gln Glu
    50                  55                  60
Ser Trp Ser Cys Gly Trp Phe Ile Ala Thr Leu Phe Val Ile Tyr Asn
65                  70                  75                  80
Phe Phe Gly Gln Phe Ile Pro Val Leu Met Ile Met Leu Arg Lys Lys
                85                  90                  95
Val Leu Val Ala Cys Gly Ile Leu Ala Ser Ile Val Ile Leu Gln Thr
            100                 105                 110
Ile Ala Tyr His Ile Leu Trp Asp Leu Lys Phe Leu Ala Arg Asn Ile
        115                 120                 125
Ala Val Gly Gly Gly Leu Leu Leu Leu Leu Ala Glu Thr Gln Glu Glu
    130                 135                 140
Lys Ala Ser Leu Phe Ala Gly Val Pro Thr Met Gly Asp Ser Asn Lys
145                 150                 155                 160
Pro Lys Ser Tyr Met Leu Leu Ala Gly Arg Val Leu Leu Ile Phe Met
                165                 170                 175
Phe Met Ser Leu Met His Phe Glu Met Ser Phe Met Gln Val Leu Glu
            180                 185                 190
Ile Val Val Gly Phe Ala Leu Ile Thr Leu Val Ser Ile Gly Tyr Lys
        195                 200                 205
Thr Lys Leu Ser Ala Ile Val Leu Val Ile Trp Leu Phe Gly Leu Asn
    210                 215                 220
Leu Trp Leu Asn Ala Trp Trp Thr Ile Pro Ser Asp Arg Phe Tyr Arg
225                 230                 235                 240
Asp Phe Met Lys Tyr Asp Phe Phe Gln Thr Met Ser Val Ile Gly Gly
                245                 250                 255
Leu Leu Leu Val Ile Ala Tyr Gly Pro Gly Gly Val Ser Val Asp Asp
            260                 265                 270
Tyr Lys Lys Arg Trp
        275
 
<210>3
<211>2984
<212>DNA
<213>人(Homo sapiens)
 
<400>3
 
ggagccgcag ccgacgcgga gcgaggccgg ccgccgggca cttcctgtgg aggccgcagc     60
gggtgcgggc gccgacgggc gagagccagc gagcgagcga gcgagccgag ccgagcctcc    120
cgccgtcgcc atgggccaga acgacctgat gggcacggcc gaggacttcg ccgaccagtt    180
cctccgtgtc acaaagcagt acctgcccca cgtggcgcgc ctctgtctga tcagcacctt    240
cctggaggac ggcatccgta tgtggttcca gtggagcgag cagcgcgact acatcgacac    300
cacctggaac tgcggctacc tgctggcctc gtccttcgtc ttcctcaact tgctgggaca    360
gctgactggc tgcgtcctgg tgttgagcag gaacttcgtg cagtacgcct gcttcgggct    420
ctttggaatc atagctctgc agacgattgc ctacagcatt ttatgggact tgaagttttt    480
gatgaggaac ctggccctgg gaggaggcct gttgctgctc ctagcagaat cccgttctga    540
agggaagagc atgtttgcgg gcgtccccac catgcgtgag agctccccca aacagtacat    600
gcagctcgga ggcagggtct tgctggttct gatgttcatg accctccttc actttgacgc    660
cagcttcttt tctattgtcc agaacatcgt gggcacagct ctgatgattt tagtggccat    720
tggttttaaa accaagctgg ctgctttgac tcttgttgtg tggctctttg ccatcaacgt    780
atatttcaac gccttctgga ccattccagt ctacaagccc atgcatgact tcctgaaata    840
cgacttcttc cagaccatgt cggtgattgg gggcttgctc ctggtggtgg ccctgggccc    900
tgggggtgtc tccatggatg agaagaagaa ggagtggtaa cagtcacaga tccctacctg    960
cctggctaag acccgtggcc gtcaaggact ggttcggggt ggattcaaca aaactgccag   1020
cttttatgta tcctcttccc ttcccctccc ttggtaaagg cacagatgtt ttgagaactt   1080
tatttgcaga gacacctgag aatcgatggc tcagtctgct ctggagccac agtctggcgt   1140
ctgacccttc agtgcaggcc agcctggcag ctggaagcct cccccacgcc gaggctttgg   1200
agtgaacagc ccgcttggct gtggcatctc agtcctattt ttgagttttt ttgtgggggt   1260
acaggagggg gccttcaagc tgtactgtga gcagacgcat tggtattatc attcaaagca   1320
gtctccctct tatttgtaag tttacatttt tagcggaaac tactaaatta ttttgggtgg   1380
ttcagccaaa cctcaaaaca gttaatctcc ctggtttaaa atcacaccag tggctttgat   1440
gttgtttctg ccccgcattg tattttatag gaatagtgaa aacatttagg gacacccaaa   1500
gaatgatgca gtattaaagg ggtggtagaa gctgctgttt atgataaaag tcatcggtca   1560
gaaaatcagc ttggattggt gccaagtgtt ttattgggta acaccctggg agttttagta   1620
gcttgaggca aggtggaggg gcaagaagtc cttggggaag ctgctggtct gggtgctgct   1680
ggcctccaag ctggcagtgg gaagggctag tgagaccaca caggggtagc cccagcagca   1740
gcaccctgca agccagcctg gccagctgct cagaccagct tgcagagccg cagccgctgt   1800
gggcaggggg tgtggcagga gctcccagca ctggagaccc acggactcaa cccagttacc   1860
tcacatgggg ccttttctga gcaaggtctc gaaagcgcag gccgccctgg ctgagcagca   1920
ccgccctttc ccagctgcac tcgccctgtg gacagccccg acacaccact ttcctgaggc   1980
tgtcgctcac tcagattgtc cgtttgctat gccgaatgca gccaaaattc ctttttacaa   2040
tttgtgatgc cttaccgatt tgatcttaat cctgtattta aagttttcta acactgcctt   2100
atactgtgtt tctctttttg ggggagctta actgcttgtt gctccctgtc gtctgcacca   2160
tagtaaatgc cacaagggta gtcgaacacc tctctggccc ctagacctat ctggggacag   2220
gctggctcag cctgtctcca gggctgctgc ggcccagccc cgagcctgcc tccctcttgg   2280
cctctcatcc attggctctg cagggcaggg gtgaggcagg tttctgctca taagtgcttt   2340
tggaagtcac ctaccttttt aacacagccg aactagtccc aacgcgtttg caaatattcc   2400
cctggtagcc tacttcctta cccccgaata ttggtaagat cgagcaatgg cttcaggaca   2460
tgggttctct tctcctgtga tcattcaagt gctcactgca tgaagactgg cttgtctcag   2520
tgtttcaacc tcaccagggc tgtctcttgg tccacacctc gctccctgtt agtgccgtat   2580
gacagccccc atcaaatgac cttggccaag tcacggtttc tctgtggtca aggttggttg   2640
gctgattggt ggaaagtagg gtggaccaaa ggaggccacg tgagcagtca gcaccagttc    2700
tgcaccagca gcgcctccgt cctagtgggt gttcctgttt ctcctggccc tgggtgggct    2760
agggcctgat tcgggaagat gcctttgcag ggaggggagg ataagtggga tctaccaatt    2820
gattctggca aaacaatttc taagattttt ttgctttatg tgggaaacag atctaaatct    2880
cattttatgc tgtattttat atcttagttg tgtttgaaaa cgttttgatt tttggaaaca    2940
catcaaaata aataatggcg tttgttgtat gcagtgtgat ccta                     2984
 
<210>4
<211>269
<212>PRT
<213>人
<400>4
 
Met Gly Gln Asn Asp Leu Met Gly Thr Ala Glu Asp Phe Ala Asp Gln
1               5                   10                  15
Phe Leu Arg Val Thr Lys Gln Tyr Leu Pro His Val Ala Arg Leu Cys
            20                  25                  30
Leu Ile Ser Thr Phe Leu Glu Asp Gly Ile Arg Met Trp Phe Gln Trp
        35                  40                  45
Ser Glu Gln Arg Asp Tyr Ile Asp Thr Thr Trp Asn Cys Gly Tyr Leu
    50                  55                  60
Leu Ala Ser Ser Phe Val Phe Leu Asn Leu Leu Gly Gln Leu Thr Gly
65                  70                  75                  80
Cys Val Leu Val Leu Ser Arg Asn Phe Val Gln Tyr Ala Cys Phe Gly
                85                  90                  95
Leu Phe Gly Ile Ile Ala Leu Gln Thr Ile Ala Tyr Ser Ile Leu Trp
            100                 105                 110
Asp Leu Lys Phe Leu Met Arg Asn Leu Ala Leu Gly Gly Gly Leu Leu
        115                 120                 125
Leu Leu Leu Ala Glu Ser Arg Ser Glu Gly Lys Ser Met Phe Ala Gly
    130                 135                 140
Val Pro Thr Met Arg Glu Ser Ser Pro Lys Gln Tyr Met Gln Leu Gly
145                 150                 155                 160
Gly Arg Val Leu Leu Val Leu Met Phe Met Thr Leu Leu His Phe Asp
                165                 170                 175
Ala Ser Phe Phe Ser Ile Val Gln Asn Ile Val Gly Thr Ala Leu Met
            180                 185                 190
Ile Leu Val Ala Ile Gly Phe Lys Thr Lys Leu Ala Ala Leu Thr Leu
        195                 200                 205
Val Val Trp Leu Phe Ala Ile Asn Val Tyr Phe Asn Ala Phe Trp Thr
    210                 215                 220
Ile Pro Val Tyr Lys Pro Met His Asp Phe Leu Lys Tyr Asp Phe Phe
225                 230                 235                 240
Gln Thr Met Ser Val Ile Gly Gly Leu Leu Leu Val Val Ala Leu Gly
                245                 250                 255
Pro Gly Gly Val Ser Met Asp Glu Lys Lys Lys Glu Trp
            260                 265
 
<210>5
<211>645
<212>DNA
<213>秀丽隐杆线虫
 
<400>5
 
atggagctaa cgctaattgc ccgtgtacga gacggcctta ttttggccac atcgattgaa   60
ggaaacaatg acggcagtgg cgactcaagt atggtgaaat actcgaatca agcaaaaatg  120
ctcttcaaga agctgaatgg ggctccagca cagcaaagtg tagagtcagg accatttgtt  180
tttcactaca taatcgtcca aaacatttgc gccctggtcc tctgtgatag gaatttcccg  240
cgtaaagttg ccttccagta cctcagtgac attggccaag agtttctaaa cgagaacagt  300
tcgagaatcg agcaagtcgt tcgtccatac catttcctcg aatttgacaa atacatccaa  360
caagctaaac aaagatatgg agacaccaac aaacacgcaa tgaatacggt atccaatgag  420
ctccaggacg tcacaagaat tatggtcact aatatcgaag atgtcattca tcgaggagaa  480
gctttgaata ttctggaaaa ccgagcatcc gaattgtctg gaatgagcaa aaaatacagg  540
gatgacgcga aagccctgaa tcgacgatca accattttca aagtagcagc ctcgattgga  600
attgccggag ttcttttcct catgctccgc ttcattttct tctag                  645
 
<210>6
<211>214
<212>PRT
<213>秀丽隐杆线虫
 
<400>6
 
Met Glu Leu Thr Leu Ile Ala Arg Val Arg Asp Gly Leu Ile Leu Ala
1               5                   10                  15
Thr Ser Ile Glu Gly Asn Asn Asp Gly Ser Gly Asp Ser Ser Met Val
            20                  25                  30
Lys Tyr Ser Asn Gln Ala Lys Met Leu Phe Lys Lys Leu Asn Gly Ala
        35                  40                  45
Pro Ala Gln Gln Ser Val Glu Ser Gly Pro Phe Val Phe His Tyr Ile
    50                  55                  60
Ile Val Gln Asn Ile Cys Ala Leu Val Leu Cys Asp Arg Asn Phe Pro
65                  70                  75                  80
Arg Lys Val Ala Phe Gln Tyr Leu Ser Asp Ile Gly Gln Glu Phe Leu
                85                  90                  95
Asn Glu Asn Ser Ser Arg Ile Glu Gln Val Val Arg Pro Tyr His Phe
            100                 105                 110
Leu Glu Phe Asp Lys Tyr Ile Gln Gln Ala Lys Gln Arg Tyr Gly Asp
        115                 120                 l25
Thr Asn Lys His Ala Met Asn Thr Val Ser Asn Glu Leu Gln Asp Val
    130                 135                 140
Thr Arg Ile Met Val Thr Asn Ile Glu Asp Val Ile His Arg Gly Glu
145                 150                 155                 160
Ala Leu Asn Ile Leu Glu Asn Arg Ala Ser Glu Leu Ser Gly Met Ser
               165                 170                 175
Lys Lys Tyr Arg Asp Asp Ala Lys Ala Leu Asn Arg Arg Ser Thr Ile
            180                 185                 190
Phe Lys Val Ala Ala Ser Ile Gly Ile Ala Gly Val Leu Phe Leu Met
        195                 200                 205
Leu Arg Phe Ile Phe Phe
    210
 
<210>7
<211>1752
<212>DNA
<213>人
 
<400>7
 
ggagcggcgg gtcccgtctc gacaggtctt ctctgttggt tgaaatgtct atgattttat     60
ctgcctcagt cattcgtgtc agagatggac tgccactttc tgcttctact gattatgaac    120
aaagcacagg aatgcaggag tgcagaaagt attttaaaat gctttcgagg aaacttgctc    180
aacttcctga tagatgtaca ctgaaaactg gacattataa cattaatttt attagctctc    240
tgggagtgag ctacatgatg ttgtgcactg aaaattaccc aaatgttctc gccttctctt    300
tcctggatga gcttcagaag gagttcatta ctacttataa catgatgaag acaaatactg    360
ctgtcagacc atactgtttc attgaatttg ataacttcat tcagaggacc aagcagcgat    420
ataataatcc caggtctctt tcaacaaaga taaatctttc tgacatgcag acggaaatca    480
agctgaggcc tccttatcaa atttccatgt gcgaactggg gtcagccaat ggagtcacat    540
cagcattttc tgttgactgt aaaggtgctg gtaagatttc ttctgctcac cagcgactgg    600
aaccagcaac tctgtcaggg attgtaggat ttatccttag tcttttatgt ggagctctga    660
atttaattcg aggctttcat gctatagaaa gtctcctgca gagtgatggt gatgatttta    720
attacatcat tgcatttttc cttggaacag cagcctgcct ttaccagtgt tatttacttg    780
tctactacac cggctggcgg aatgtcaaat cttttttgac ttttggctta atctgtctat    840
gcaacatgta tctctatgaa ctgcgcaacc tctggcagct tttctttcat gtgactgtgg    900
gagcatttgt tacactacag atctggctaa ggcaagccca gggcaaggct cccgattatg    960
atgtctgaca ccatccttca gatctattgc cttggcttca gggggataag gagggaacat   1020
atcataactg cactgtgatg aagaagctgt tccccacaga ggagaagctc tgctttcttt   1080
ctctccaact ttcctttttt aaaatcagca tgatgtgcct gtgagcatgg aagagtcctc   1140
tcagaagaat gttggccatg agactatcat tcagaggagg aggggatttc tctcttcaag   1200
gccgtaacag tggaagaaca gtcatatgcc attggaagtc ttggccagca gtcctgaatc    1260
cttcctgaag agttcagaaa atagatgtgg tattgctctg aggaccaggc aggaggaact    1320
ctacaacctg agtttgcctt tgtgaggcat tagtatagac caaataaaaa gctgcagaaa    1380
ttggaaagtt tatgttttaa ataaatgact gtgataaata tcagattatt tgcacactta    1440
tggtactacg agtttataaa gtccaagatg gtgtgaaatt ggttcttttt acttttatat    1500
ttttgcttga atcttaactc tggaaatcac ctgatgtaga agaagactgt gatgagctcg    1560
tctgtggaac atcacaagta tcgaaaatac agtaatggat gtttcctttc taatccacat    1620
ttattgtttc ttttgaaatc acgtctaaaa aatatgactc acactatagc cgttgtttcc    1680
caaacttcag tctctttagt actacttgta ttattttctt aatatttatc ttttaaattt    1740
taaagttttt tt                                                        1752
 
<210>8
<211>307
<212>PRT
<213>人
 
<400>8
 
Met Ser Met Ile Leu Ser Ala Ser Val Ile Arg Val Arg Asp Gly Leu
1               5                   10                  15
ProLeu Ser Ala Ser Thr Asp Tyr Glu Gln Ser Thr Gly Met Gln Glu
           20                  25                  30
Cys Arg Lys Tyr Phe Lys Met Leu Ser Arg Lys Leu Ala Gln Leu Pro
        35                  40                  45
Asp Arg Cys Thr Leu Lys Thr Gly His Tyr Asn Ile Asn Phe Ile Ser
    50                  55                  60
Ser Leu Gly Val Ser Tyr Met Met Leu Cys Thr Glu Asn Tyr Pro Asn
65                  70                  75                  80
Val Leu Ala Phe Ser Phe Leu Asp Glu Leu Gln Lys Glu Phe Ile Thr
                85                  90                  95
Thr Tyr Asn Met Met Lys Thr Asn Thr Ala Val Arg Pro Tyr Cys Phe
            100                 105                 110
Ile Glu Phe Asp Asn Phe Ile Gln Arg Thr Lys Gln Arg Tyr Asn Asn
        115                 120                 125
Pro Arg Ser Leu Ser Thr Lys Ile Asn Leu Ser Asp Met Gln Thr Glu
    130                 135                 140
Ile Lys Leu Arg Pro Pro Tyr Gln Ile Ser Met Cys Glu Leu Gly Ser
145                 150                 155                 160
Ala Asn Gly Val Thr Ser Ala Phe Ser Val Asp Cys Lys Gly Ala Gly
                165                 170                 175
Lys Ile Ser Ser Ala His Gln Arg Leu Glu Pro Ala Thr Leu Ser Gly
            180                 185                 190
Ile Val Gly Phe Ile Leu Ser Leu Leu Cys Gly Ala Leu Asn Leu Ile
        195                 200                 205
Arg Gly Phe His Ala Ile Glu Ser Leu Leu Gln Ser Asp Gly Asp Asp
    210                 215                 220
Phe Asn Tyr Ile Ile Ala Phe Phe Leu Gly Thr Ala Ala Cys Leu Tyr
225                 230                 235                 240
Gln Cys Tyr Leu Leu Val Tyr Tyr Thr Gly Trp Arg Asn Val Lys Ser
                245                 250                 255
Phe Leu Thr Phe Gly Leu Ile Cys Leu Cys Asn Met Tyr Leu Tyr Glu
            260                 265                 270
Leu Arg Asn Leu Trp Gln Leu Phe Phe His Val Thr Val Gly Ala Phe
        275                 280                 285
Val Thr Leu Gln Ile Trp Leu Arg Gln Ala Gln Gly Lys Ala Pro Asp
    290                 295                 300
Tyr Asp Val
305
 
<210>9
<211>2003
<212>DNA
<213>秀丽隐杆线虫
 
<400>9
 
atgagtcgat ggattcagcc aggcgataat gtagacatta ccaatgaacg gaaaaaagct     60
acgtttgaca cagaacgtat gtcagcttgg atacatggag ggactgaagt tatgaagcgt    120
cgccgtgaaa ttctggattt tgtcaaaagc gttgacgact tcaaagatcc ggttccaaca    180
gagtttatgt ctcgcgaaga acgcattctg aacaatgctc gtaaagttgt ggcaatgaca    240
aataacaccg atcagattga tggatctgac ttcttcggag aaggaatgta ttatcaagca    300
ttgacgatgg gccgtgatct tcatgcaatg tcgcttcatt acgttatgtt tattccaaca    360
cttcaaggtc aaactgacga tgatcaactg gacgagtggc ttaccaaaac aatttcccgt    420
gcagtagttg gaacttatgc tcaaacagaa ctcggtcatg gtacaaacct ttcaaaactg    480
gaaaccactg caacttatga tccagccaca gaagagtttg ttatgaactc gccaacaatc    540
actgcagcca aatggtggcc gggaggcttg ggtaaatcgt cgaactacgc tgtggttgtt    600
gcacagttgt acacaaaagg agagtgtaaa ggacctcatc cgttcattgt gcaacttcgc    660
gatgaagaca ctcactatcc actcaaggga attcgtttgg gagatattgg accaaaactt    720
ggcatcaatg gaaatgacaa tggattctta cttttcgata aagtcagaat tccaagaaaa    780
gcattgctga tgagatacgc aaaagtgaat ccagatggaa cttacattgc tccggctcat    840
tccaaattgg gatatggaac tatggtgttt gtgagatcaa ttatgatcaa ggatcagtcg    900
actcaacttg cggcagctgc aacaattgct acgagatatg cagcagtgag aagacaggga    960
gaaatcactc caggaaaagg ggaagttcaa atcattgact accaaaccca acaatttcgt   1020
gtcttccctc aactcgccag agcgtttgct ttcatggcag cggccactga aatccgtgat   1080
ctctacatga cagtcaccga gcagcttaca catggaaaca ccgaacttct cgccgagctt  1140
catgtcttgt cttccggtct caagtcgtta gtgtcgtggg atactgctca aggaattgag  1200
caatgcagat tggcgtgtgg aggtcatggg tattcacaag cttctggatt cccagaaatc  1260
tatggatatg ctgttggtgg atgcacttac gagggtgaaa atattgtgat gcttctgcaa  1320
gtagcaagat tcctgatgaa agcagccgaa ggagttagaa aaggaactgc taacctagca  1380
gacatcggag cttacattgg aaagcctgga aggaaaacct cgcgcttaac aactcaccac  1440
cactacacag atgctgatat cgttgaagat cttgagcacg ttgctcgcaa acaagtattc  1500
cgagcctacg accgcctgaa aaaggctcag agcatcttcg tccggaagat gcttggaact  1560
cggtttctgt ggaacttgct aaagcttcga gatggcacgt tcgtctgtat ctcgtgaaga  1620
acttattgca caaagtttct attgctcctc aggatttgaa gattgtgctc ttcgatgttg  1680
ctcggctgta tgcttatgac atcattacat catcaattgg agcatttttg gaggatggct  1740
acatgagctc taatcagatg aatgaagtta aagaaggtat ttataaatgc ttgtccaata  1800
tgcgtccaaa tgcggttggc ctagttgact gttgggatta tgacgataaa gagctcaaat  1860
cagttttggg aagacgtgac ggaaacgtgt accctgctct tctccagtgg gctcaaaata  1920
gtcaactcaa cagatcggaa gttcttccgg cctacgaaaa gtatcttggt ccaatgatga  1980
aagacgctcg atcaaaattg taa                                          2003
 
<210>10
<211>667
<212>PRT
<213>秀丽隐杆线虫
 
<400>10
 
Met Ser Arg Trp Ile Gln Pro Gly Asp Asn Val Asp Ile Thr Asn Glu
1               5                   10                  15
Arg Lys Lys Ala Thr Phe Asp Thr Glu Arg Met Ser Ala Trp Ile His
            20                  25                  30
Gly Gly Thr Glu Val Met Lys Arg Arg Arg Glu Ile Leu Asp Phe Val
        35                  40                  45
Lys Ser Val Asp Asp Phe Lys Asp Pro Val Pro Thr Glu Phe Met Ser
    50                  55                  60
Arg Glu Glu Arg Ile Leu Asn Asn Ala Arg Lys Val Val Ala Met Thr
65                  70                  75                  80
Asn Asn Thr Asp Gln Ile Asp Gly Ser Asp Phe Phe Gly Glu Gly Met
                85                  90                  95
Tyr Tyr Gln Ala Leu Thr Met Gly Arg Asp Leu His Ala Met Set Leu
            100                 105                 110
His Tyr Val Met Phe Ile Pro Thr Leu Gln Gly Gln Thr Asp Asp Asp
        115                 120                 125
Gln Leu Asp Glu Trp Leu Thr Lys Thr Ile Ser Arg Ala Val Val Gly
    130                 135                 140
Thr Tyr Ala Gln Thr Glu Leu Gly His Gly Thr Asn Leu Ser Lys Leu
145                 150                 155                 160
Glu Thr Thr Ala Thr Tyr Asp Pro Ala Thr Glu Glu Phe Val Met Asn
                165                 170                 175
Ser Pro Thr Ile Thr Ala Ala Lys Trp Trp Pro Gly Gly Leu Gly Lys
            180                 185                 190
Ser Ser Asn Tyr Ala Val Val Val Ala Gln Leu Tyr Thr Lys Gly Glu
        195                 200                 205
Cys Lys Gly Pro His Pro Phe Ile Val Gln Leu Arg Asp Glu Asp Thr
    210                 215                 220
His Tyr Pro Leu Lys Gly Ile Arg Leu Gly Asp Ile Gly Pro Lys Leu
225                 230                 235                 240
Gly Ile Asn Gly Asn Asp Asn Gly Phe Leu Leu Phe Asp Lys Val Arg
                245                 250                 255
Ile Pro Arg Lys Ala Leu Leu Met Arg Tyr Ala Lys Val Asn Pro Asp
            260                 265                 270
Gly Thr Tyr Ile Ala Pro Ala His Ser Lys Leu Gly Tyr Gly Thr Met
        275                 280                 285
Val Phe Val Arg Ser Ile Met Ile Lys Asp Gln Ser Thr Gln Leu Ala
    290                 295                 300
Ala Ala Ala Thr Ile Ala Thr Arg Tyr Ala Ala Val Arg Arg Gln Gly
305                 310                 315                 320
Glu Ile Thr Pro Gly Lys Gly Glu Val Gln Ile Ile Asp Tyr Gln Thr
                325                 330                 335
Gln Gln Phe Arg Val Phe Pro Gln Leu Ala Arg Ala Phe Ala Phe Met
            340                 345                 350
Ala Ala Ala Thr Glu Ile Arg Asp Leu Tyr Met Thr Val Thr Glu Gln
        355                 360                 365
Leu Thr His Gly Asn Thr Glu Leu Leu Ala Glu Leu His Val Leu Ser
    370                 375                 380
Ser Gly Leu Lys Ser Leu Val Ser Trp Asp Thr Ala Gln Gly Ile Glu
385                 390                 395                 400
Gln Cys Arg Leu Ala Cys Gly Gly His Gly Tyr Ser Gln Ala Ser Gly
                405                 410                 415
Phe Pro Glu Ile Tyr Gly Tyr Ala Val Gly Gly Cys Thr Tyr Glu Gly
            420                 425                 430
Glu Asn Ile Val Met Leu Leu Gln Val Ala Arg Phe Leu Met Lys Ala
        435                 440                 445
Ala Glu Gly Val Arg Lys Gly Thr Ala Asn Leu Ala Asp Ile Gly Ala
    450                 455                 460
Tyr Ile Gly Lys Pro Gly Arg Lys Thr Ser Arg Leu Thr Thr His His
465                 470                 475                 480
His Tyr Thr Asp Ala Asp Ile Val Glu Asp Leu Glu His Val Ala Arg
                485                 490                 495
Lys Gln Val Phe Arg Ala Tyr Asp Arg Leu Lys Lys Ala Gln Glu His
            500                 505                 510
Leu Arg Pro Glu Asp Ala Trp Asn Ser Val Ser Val Glu Leu Ala Lys
        515                 520                 525
Ala Ser Arg Trp His Val Arg Leu Tyr Leu Val Lys Asn Leu Leu His
    530                 535                 540
Lys Val Ser Ile Ala Pro Gln Asp Leu Lys Ile Val Leu Phe Asp Val
545                 550                 555                 560
Ala Arg Leu Tyr Ala Tyr Asp Ile Ile Thr Ser Ser Ile Gly Ala Phe
                565                 570                 575
Leu Glu Asp Gly Tyr Met Ser Ser Asn Gln Met Asn Glu Val Lys Glu
            580                 585                 590
Gly Ile Tyr Lys Cys Leu Ser Asn Met Arg Pro Asn Ala Val Gly Leu
        595                 600                 605
Val Asp Cys Trp Asp Tyr Asp Asp Lys Glu Leu Lys Ser Val Leu Gly
    610                 615                 620
Arg Arg Asp Gly Asn Val Tyr Pro Ala Leu Leu Gln Trp Ala Gln Asn
625                 630                 635                 640
Ser Gln Leu Asn Arg Ser Glu Val Leu Pro Ala Tyr Glu Lys Tyr Leu
                645                 650                 655
Gly Pro Met Met Lys Asp Ala Arg Ser Lys Leu
        660                 665
 
<210>11
<211>3418
<212>DNA
<213>人
 
<400>11
 
ctcccctggc caggagcagg ggattagtct gccccgcgac cggccccagc cacgacgcgg     60
acatcgcccc ctctgtctgg gccgctgtca ctcacgcgcc aaagggccac ggagaaagaa    120
ggggcgggcc ggggcgggcc gggcgagcgg aggcggggac ttgcgccgtc ctgaggctgc    180
ctcctagggt ccggccggcg ctggagctgc ggatttagat tgtcactgcc acctcggtcg    240
gtgcttactt cgctgccagc tggtcgtcgc catgaacccg gacctgcgca gggagcggga    300
ttccgccagc ttcaacccgg agctgcttac acacatcctg gacggcagcc ccgagaaaac    360
ccggcgccgc cgagagatcg agaacatgat cctgaacgac ccagacttcc agcatgagga    420
cttgaacttc ctcactcgca gccagcgtta tgaggtggct gtcaggaaaa gtgccatcat    480
ggtgaagaag atgagggagt ttggcatcgc tgaccctgat gaaattatgt ggtttaaaaa    540
actacatttg gtcaattttg tggaacctgt gggcctcaat tactccatgt ttattcctac    600
cttgctgaat cagggcacca ctgctcagaa agagaaatgg ctgctttcat ccaaaggact    660
ccagataatt ggcacctacg cccagacgga aatgggccac ggaactcacc ttcgaggctt    720
ggaaaccaca gccacgtatg accctgaaac ccaggagttc attctcaaca gtcctactgt    780
gacctccatt aaatggtggc ctggtgggct tggaaagact tcaaatcatg caatagttct    840
tgcccagctc atcactaagg ggaaatgcta tggattacat gcctttatcg tacctattcg    900
tgaaatcggg acccataagc ctttgccagg aattaccgtt ggtgacatcg gccccaaatt    960
tggttatgat gagatagaca atggctacct caaaatggac aaccatcgta ttcccagaga   1020
aaacatgctg atgaagtatg cccaggtgaa gcctgatggc acatacgtga aaccgctgag   1080
taacaagctg acttacggga ccatggtgtt tgtcaggtcc ttccttgtgg gagaagctgc   1140
tcgggctctg tctaaggcgt gcaccattgc catccgatac agcgctgtga ggcaccagtc   1200
tgaaatcaag ccaggtgaac cagaaccaca gattttggat tttcaaaccc agcagtataa   1260
actctttcca ctcctggcca ctgcctatgc cttccagttt gtgggcgcat acatgaagga   1320
gacctatcac cggattaacg aaggcattgg tcaaggggac ctgagtgaac tgcctgagct   1380
tcatgccctc accgctggac tgaaggcttt cacctcctgg actgcaaaca ctggcattga   1440
agcatgtcgg atggcttgtg gtgggcatgg ctattctcat tgcagtggtc ttccaaatat   1500
ttatgtcaat ttcaccccaa gctgtacctt tgagggagaa aacactgtca tgatgctcca   1560
gacggctagg ttcctgatga aaagttatga tcaggtgcac tcaggaaagt tggtgtgtgg   1620
catggtgtcc tatttgaacg acctgcccag tcagcgcatc cagccacagc aggtagcagt   1680
ctggccaacc atggtggata tcaacagccc cgaaagccta accgaagcat ataaactccg   1740
tgcagccaga ttagtagaaa ttgctgcaaa aaaccttcaa aaagaagtga ttcacagaaa   1800
aagcaaggag gtagcttgga acctaacttc tgttgacctt gttcgagcaa gtgaggcaca   1860
ttgccactat gtggtagtta agctcttttc agaaaaactc ctcaaaattc aagataaagc   1920
cattcaagct gtcttaagga gtttatgtct gctgtattct ctgtatggaa tcagtcagaa   1980
cgcgggggat ttccttcagg ggagcatcat gacagagcct cagattacac aagtaaacca   2040
gcgtgtaaag gagttactca ctctgattcg ctcagatgct gttgctttgg ttgatgcatt   2100
tgattttcag gatgtgacac ttggctctgt gcttggccgc tatgatggga atgtgtatga   2160
aaacttgttt gagtgggcta agaactcccc actgaacaaa gcagaggtcc acgaatctta   2220
caagcacctg aagtcactgc agtccaagct ctgaagtgtc acaaggacaa gtttaatctg   2280
cttcagaaag cgcctgtgtg caactcaaat tttgtggaat ctttttcgaa ttcaaatagc   2340
tatagagcaa atgataaatt gacccctttt tataaatgga gggaaaaaat gaacagattt   2400
cagagattaa atgaaaaaaa gcagatgttt taagtgcaat taacactgaa agagacctgt   2460
taaaccattc agaaaaagct taagaaatgc gatatgactt ccttttgtaa tgctgctgat   2520
cccagtagac tatgactttt gataattagc agaatttaac tactgagtag ttgattattt   2580
tcacatttta attgctaatc actggctata taagtgtttt taagcaaagg tatttttgaa    2640
gtggtgtaga acccttccaa gctttcctgc tcagtgttct accagactta ccctggggcc    2700
tggcttaaaa gcaggattga agaaaaggga ctgggggaag gaaacttatt ggaaaacttg    2760
atgcgaatga gtttctgctt ggcacagtct ctgcctgctt gctctccttt gctgatggat    2820
tgcatttatc aaactattca tgctagcatt tttccaacga gggaacttat tccgcacggg    2880
cctactgtag gaccattgtc tcgtgtaatt aggaattttc catttgaagg attgctaaat    2940
tgtcacagta gtaggaagta tagggaaacc tctcagctgt ggcactgttg tagctttgga    3000
gtgcagagtg taactctggg acaatcagat ttcacatatt ctgtcatctt ggcataagcc    3060
attaaaagct tggagattac tgtatttggc attaaaaaaa aatgtcactt aggtcagcac    3120
tcccagacgt agcacagaaa aaccctttga cacaaaccat gtgttctgat ttttggttca    3180
gaaaatattg aaactgtgag ttgttttttt tttaacaact gggaaaaaac aaaaacaaaa    3240
aactatagtt agaaaaatgg aagttccata ggttctattt cttactctat gtatggcttt    3300
gttttcagtc tatttctagg agctttctct gaatcgctaa ttgtcctttc agttgaaatc    3360
taatttatac aatcattcta tacttaaagg ttaaatacat cttaattaat tttttctt      3418
 
<210>12
<211>660
<212>PRT
<213>人
 
<400>12
 
Met Asn Pro Asp Leu Arg Arg Glu Arg Asp Ser Ala Ser Phe Asn Pro
1               5                   10                  15
Glu Leu Leu Thr His Ile Leu Asp Gly Ser Pro Glu Lys Thr Arg Arg
            20                  25                  30
Arg Arg Glu Ile Glu Asn Met Ile Leu Asn Asp Pro Asp Phe Gln His
        35                  40                  45
Glu Asp Leu Asn Phe Leu Thr Arg Ser Gln Arg Tyr Glu Val Ala Val
    50                  55                  60
Arg Lys Ser Ala Ile Met Val Lys Lys Met Arg Glu Phe Gly Ile Ala
65                  70                  75                  80
Asp Pro Asp Glu Ile Met Trp Phe Lys Lys Leu His Leu Val Asn Phe
                85                  90                  95
Val Glu Pro Val Gly Leu Asn Tyr Ser Met Phe Ile Pro Thr Leu Leu
            100                 105                 110
Asn Gln Gly Thr Thr Ala Gln Lys Glu Lys Trp Leu Leu Ser Ser Lys
        115                 120                 125
Gly Leu Gln Ile Ile Gly Thr Tyr Ala Gln Thr Glu Met Gly His Gly
    130                 135                 140
Thr His Leu Arg Gly Leu Glu Thr Thr Ala Thr Tyr Asp Pro Glu Thr
145                 150                 155                 160
Gln Glu Phe Ile Leu Asn Ser Pro Thr Val Thr SerIle Lys Trp Trp
                165                 170                 175
Pro Gly Gly Leu Gly Lys Thr Ser Asn His Ala Ile Val Leu Ala Gln
            180                 185                 190
Leu Ile Thr Lys Gly Lys Cys Tyr Gly Leu His Ala Phe Ile Val Pro
        195                 200                 205
Ile Arg Glu Ile Gly Thr His Lys Pro Leu Pro Gly Ile Thr Val Gly
    210                 215                 220
Asp Ile Gly Pro Lys Phe Gly Tyr Asp Glu Ile Asp Asn Gly Tyr Leu
225                 230                 235                 240
Lys Met Asp Asn His Arg Ile Pro Arg Glu Asn Met Leu Met Lys Tyr
                245                 250                 255
Ala Gln Val Lys Pro Asp Gly Thr Tyr Val Lys Pro Leu Ser Asn Lys
            260                 265                 270
Leu Thr Tyr Gly Thr Met Val Phe Val Arg Ser Phe Leu Val Gly Glu
        275                 280                 285
Ala Ala Arg Ala Leu Ser Lys Ala Cys Thr Ile AlaIle Arg Tyr Ser
    290                 295                 300
Ala Val Arg His Gln Ser Glu Ile Lys Pro Gly Glu Pro Glu Pro Gln
305                 310                 315                 320
Ile Leu Asp Phe Gln Thr Gln Gln Tyr Lys Leu Phe Pro Leu Leu Ala
                325                 330                 335
Thr Ala Tyr Ala Phe Gln Phe Val Gly Ala Tyr Met Lys Glu Thr Tyr
            340                 345                 350
His Arg Ile Asn Glu Gly Ile Gly Gln Gly Asp Leu Ser Glu Leu Pro
        355                 360                 365
Glu Leu His Ala Leu Thr Ala Gly Leu Lys Ala Phe Thr Ser Trp Thr
    370                 375                 380
Ala Asn Thr Gly Ile Glu Ala Cys Arg Met Ala Cys Gly Gly His Gly
385                 390                 395                 400
Tyr Ser His Cys Ser Gly Leu Pro Asn Ile Tyr Val Asn Phe Thr Pro
                405                 410                 415
Ser Cys Thr Phe Glu Gly Glu Asn Thr Val Met Met Leu Gln Thr Ala
            420                 425                 430
Arg Phe Leu Met Lys Ser Tyr Asp Gln Val His Ser Gly Lys Leu Val
        435                 440                 445
Cys Gly Met Val Ser Tyr Leu Asn Asp Leu Pro Ser Gln Arg Ile Gln
    450                 455                 460
Pro Gln Gln Val Ala Val Trp Pro Thr Met Val Asp Ile Asn Ser Pro
465                 470                 475                 480
Glu Ser Leu Thr Glu Ala Tyr Lys Leu Arg Ala Ala Arg Leu Val Glu
                485                 490                 495
Ile Ala Ala Lys Asn Leu Gln Lys Glu Val Ile His Arg Lys Ser Lys
            500                 505                 510
Glu Val Ala Trp Asn Leu Thr Ser Val Asp Leu Val Arg Ala Ser Glu
        515                 520                 525
Ala His Cys His Tyr Val Val Val Lys Leu Phe Ser Glu Lys Leu Leu
    530                 535                 540
Lys Ile Gln Asp Lys Ala Ile Gln Ala Val Leu Arg Ser Leu Cys Leu
545                 550                 555                 560
Leu Tyr Ser Leu Tyr Gly Ile Ser Gln Asn Ala Gly Asp Phe Leu Gln
                565                 570                 575
Gly Ser Ile Met Thr Glu Pro Gln Ile Thr Gln Val Asn Gln Arg Val
            580                 585                 590
Lys Glu Leu Leu Thr Leu Ile Arg Ser Asp Ala Val Ala Leu Val Asp
        595                 600                 605
Ala Phe Asp Phe Gln Asp Val Thr Leu Gly Ser Val Leu Gly Arg Tyr
    610                 615                 620
Asp Gly Asn Val Tyr Glu Asn Leu Phe Glu Trp Ala Lys Asn Ser Pro
625                 630                 635                 640
Leu Asn Lys Ala Glu Val His Glu Ser Tyr Lys His Leu Lys Ser Leu
                645                 650                 655
Gln Ser Lys Leu
            660
 
<210>13
<211>2532
<212>DNA
<213>黑腹果蝇(Drosphila melanogaster)
 
<400>13
 
gcgtgagaat aatggttgtg ctacagacta tttcaacaca aaagcgaact tattacatgt     60
gtattttcgc ggttaaagtt cacgtcgttc gagagctggc atcgatgatt agattcggaa    120
tagctggatc agatcagcag tccataatct caatctcctc cactggattt cctccaccag    180
cacttgagtg accgactgac tgaccactga gcgcaattcg cctttccagc aacaatcagt    240
cagtacgcga tattcaacga agacggacgc tttgcggtgg ctcgttaatc cataacctgt    300
ttacgtgact tgaatactgt gccgcatagc aaaatgccag ccaaaccagt gaatcccgat    360
ctccagaagg aacgcagcac ggccaccttc aatccccggg agttctccgt tctgtgggcc    420
ggcggcgagg agcgattcaa ggagaagaag gccctggaga aattgttttt ggaggatcca    480
gcccttcagg acgacttgcc catttcctat ttgtcacaca aggagctcta tgagcacagc    540
ttgcgcaaag cctgcatcat aggagagaag atccgcaagc tacgtgctga tggcgaggat    600
ggagtggata cttacaatgc tctgcttggt ggatccttgg gatcggctat tctaaaggag    660
ggcaatccgc ttgcgctgca ctacgtgatg ttcgtgccca ccatcatggg ccagggaacg    720
atggatcagc aggtggaatg gctgagcaag gcctgggact gtgaaatcat tggcacctat    780
gcccaaacgg aactgggaca cggaaccttc ctgcgcggtc tggagaccag ggctgactac    840
gatgccagca cccaggagtt tgttataaac actccatcac tcagtgcata caagtggtgg    900
cccggtggat tgggacacac tgctaaccat gcggttgtgg tggcacaact ctacaccaag    960
ggcgagttcc gtggtctggc tccttttatt gtccaattga gggattccga tactcaccgt   1020
cccatgcccg gcatcgacat tggagatatt ggtaccaagc tgggcatgaa gggtgtcaac   1080
aatggctatt tgggactgaa gaacgtacgg gtgcctttaa acaacatgct gatgaagaac   1140
cagcaagtgc tgcccgatgg cacatatgtg gcgccgaaga atagcgtgct tacctacgga   1200
actatgatgt ttgtgcgttg tgctcttatc cgtgataccg ctcagagcct ggcaaaggca   1260
tccactattg ccactaggta ttcagctgtt cgccgacaga gtcccattga tcccaatcaa   1320
ccggagcccc aaatcatgga ccataccacg cagcagttga agttgttccc ccagatagct   1380
aaagccatcg ttttcaaaac gacgggtgat ggcatctgga atatgtacaa cgtgatatct   1440
ggcgagattg agcagggtaa cttggatcgc ctgcccgaaa tgcatgcatt gtcctgctgc   1500
cttaaggcca tctgtagtgc cgatgccgcc gccggcgtgg aaacgtgtcg tctgtcatgt   1560
ggcggacatg gctacatgga ctgctccaac ttccccacga tatacggcat gaccacggcc   1620
gtttgcacct atgagggcga gaacacagtg atgctgctgc agactgctcg ctatttggtg   1680
aaggtttatg ggcaggcctt gaatggagag aagctggtgc caacggtttc gtacatcagt   1740
gatgcaataa accaaaccaa gtttgttaac tttgacggat cattgaggtc tattgtcaag   1800
gctttccaat tcgttgccgc caacaaaacc cgaattgcct atgagcagat tgaactgcgc   1860
cgcaagcaag gttatggtac cgaggtggca gctaatctat gtggcacctt cctaacagca   1920
gctgcagatc ttcatggacg cgccttccta gcgcagactg cctatacgga gcttttggcc   1980
ttgtcgcgcg aggtgtcccc agaactagct gaagtcctaa aggtggtgct ggagctgtat   2040
ctggtagacg cctgcctcaa ccgcattggc gacttcttgc ggttcattga tctcactgat   2100
caagatgtca cgaaactgga ggttcgcctg gagaactgct taaaacgatt ccggccgaat   2160
gccgtcagct tggtggacag ctttgatctt cacgatcgcg tgctagattc cgcattgggt   2220
gcctatgatg gaaatgttta cgaacacatc ttcgagtcta cgaagaagaa cccgttgaac   2280
aaggagccag tcaacggagc attccacaag tacttgaagc cattcatgaa ggctcacctc   2340
tagattcata tcctattgct ctggaagatt ttcacaagtg ttattattgt aaatatacat   2400
ttgtttccat tgtttttgta ttatacaact gtctgcttag caaatggtct ttaagacaat   2460
tatgatgtca gggcttgtgc agttgaaact aggctgtaaa attatacaca aataaaatat   2520
tcaactatat tt                                                       2532
 
<210>14
<211>669
<212>PRT
<213>黑腹果蝇
 
<400>14
 
Met Pro Ala Lys Pro Val Asn Pro Asp Leu Gln Lys Glu Arg Ser Thr
1               5                   10                  15
Ala Thr Phe Asn Pro Arg Glu Phe Ser Val Leu Trp Ala Gly Gly Glu
            20                  25                  30
Glu Arg Phe Lys Glu Lys Lys Ala Leu Glu Lys Leu Phe Leu Glu Asp
        35                  40                  45
Pro Ala Leu Gln Asp Asp Leu Pro Ile Ser Tyr Leu Ser His Lys Glu
    50                  55                  60
Leu Tyr Glu His Ser Leu Arg Lys Ala Cys Ile Ile Gly Glu Lys Ile
65                  70                  75                  80
Arg Lys Leu Arg Ala Asp Gly Glu Asp Gly Val Asp Thr Tyr Asn Ala
                85                  90                  95
Leu Leu Gly Gly Ser Leu Gly Ser Ala Ile Leu Lys Glu Gly Asn Pro
            100                 105                 110
Leu Ala Leu His Tyr Val Met Phe Val Pro Thr Ile Met Gly Gln Gly
        115                 120                 125
Thr Met Asp Gln Gln Val Glu Trp Leu Ser Lys Ala Trp Asp Cys Glu
    130                 135                 140
Ile Ile Gly Thr Tyr Ala Gln Thr Glu Leu Gly His Gly Thr Phe Leu
145                 150                 155                 160
Arg Gly Leu Glu Thr Arg Ala Asp Tyr Asp Ala Ser Thr Gln Glu Phe
                165                 170                 175
Val Ile Asn Thr Pro Ser Leu Ser Ala Tyr Lys Trp Trp Pro Gly Gly
            180                 185                 190
Leu Gly His Thr Ala Asn His Ala Val Val Val Ala Gln Leu Tyr Thr
        195                 200                 205
Lys Gly Glu Phe Arg Gly Leu Ala Pro Phe Ile Val Gln Leu Arg Asp
    210                 215                 220
Ser Asp Thr His Arg Pro Met Pro Gly Ile Asp Ile Gly Asp Ile Gly
225                 230                 235                 240
Thr Lys Leu Gly Met Lys Gly Val Asn Asn Gly Tyr Leu Gly Leu Lys
                245                 250                 255
Asn Val Arg Val Pro Leu Asn Asn Met Leu Met Lys Asn Gln Gln Val
            260                 265                 270
Leu Pro Asp Gly Thr Tyr Val Ala Pro Lys Asn Ser Val Leu Thr Tyr
        275                 280                 285
Gly Thr Met Met Phe Val Arg Cys Ala Leu Ile Arg Asp Thr Ala Gln
    290                 295                 300
Ser Leu Ala Lys Ala Ser Thr Ile Ala Thr Arg Tyr Ser Ala Val Arg
305                 310                 315                 320
Arg Gln Ser Pro Ile Asp Pro Asn Gln Pro Glu Pro Gln Ile Met Asp
                325                 330                 335
His Thr Thr Gln Gln Leu Lys Leu Phe Pro Gln Ile Ala Lys Ala Ile
            340                 345                 350
Val Phe Lys Thr Thr Gly Asp Gly Ile Trp Asn Met Tyr Asn Val Ile
        355                 360                 365
Ser Gly Glu Ile Glu Gln Gly Asn Leu Asp Arg Leu Pro Glu Met His
    370                 375                 380
Ala Leu Ser Cys Cys Leu Lys Ala Ile Cys Ser Ala Asp Ala Ala Ala
385                 390                 395                 400
Gly Val Glu Thr Cys Arg Leu Ser Cys Gly Gly His Gly Tyr Met Asp
                405                 410                 415
Cys Ser Asn Phe Pro Thr Ile Tyr Gly Met Thr Thr Ala Val Cys Thr
            420                 425                 430
Tyr Glu Gly Glu Asn Thr Val Met Leu Leu Gln Thr Ala Arg Tyr Leu
        435                 440                 445
Val Lys Val Tyr Gly Gln Ala Leu Asn Gly Glu Lys Leu Val Pro Thr
    450                 455                 460
Val Ser Tyr Ile Ser Asp Ala Ile Asn Gln Thr Lys Phe Val Asn Phe
465                 470                 475                 480
Asp Gly Ser Leu Arg Ser Ile Val Lys Ala Phe Gln Phe Val Ala Ala
                485                 490                 495
Asn Lys Thr Arg Ile Ala Tyr Glu Gln Ile Glu Leu Arg Arg Lys Gln
            500                 505                 510
Gly Tyr Gly Thr Glu Val Ala Ala Asn Leu Cys Gly Thr Phe Leu Thr
        515                 520                 525
Ala Ala Ala Asp Leu His Gly Arg Ala Phe Leu Ala Gln Thr Ala Tyr
    530                 535                 540
Thr Glu Leu Leu Ala Leu Ser Arg Glu Val Ser Pro Glu Leu Ala Glu
545                 550                 555                 560
Val Leu Lys Val Val Leu Glu Leu Tyr Leu Val Asp Ala Cys Leu Asn
                565                 570                 575
Arg Ile Gly Asp Phe Leu Arg Phe Ile Asp Leu Thr Asp Gln Asp Val
            580                 585                 590
Thr Lys Leu Glu Val Arg Leu Glu Asn Cys Leu Lys Arg Phe Arg Pro
        595                 600                 605
Asn Ala Val Ser Leu Val Asp Ser Phe Asp Leu His Asp Arg Val Leu
    610                 615                 620
Asp Ser Ala Leu Gly Ala Tyr Asp Gly Asn Val Tyr Glu His Ile Phe
625                 630                 635                 640
Glu Ser Thr Lys Lys Asn Pro Leu Asn Lys Glu Pro Val Asn Gly Ala
                645                 650                 655
Phe His Lys Tyr Leu Lys Pro Phe Met Lys Ala His Leu
            660                 665
 
<210>15
<2ll>2615
<212>DNA
<213>斑马鱼(Danio rerio)
 
<400>15
 
aaaaaaaaag aaaaaaggac acaaagcaga aggcacgtag ctcgaaagaa agtttaactg     60
aatagtcatg aatcctgata ttagccgtga acgtgaaaat gcgtctttta acctggagat    120
tcttacaaac gtgctggatg gtggagcgga aaagacaaat agaaggagag aaatagagtc    180
tctggttatt ggagatccag atttccaaca tgaagaccta aactttctct ctcgaagtga    240
gcgatatgat gcagcagtgc ggaagagtgc acagatgatt ctgaaactta gggaatatgg    300
tatctctgat ccagaagaga tctactccta caagactgtt gtgaggggtg tatttcaaga    360
gcccctaggt gtccataatg tcatgttcat acccacctta aaaagccagt gtactgctga    420
acaacgcaaa aaatggatcc cattagctga gtcattccat atgttaggca cctatgctca    480
gacagagctg gggcacggta cacacatccg tgctcttgaa accactgcca catatgaccc    540
ttccacccaa gagttcgttt tgaacagttc aacaatctcc tcaattaaat ggtggccagg    600
tggattgggt aaaacctcaa accatgctat agtcctggct cagctgtaca cgcagggcaa    660
gtgtcatggc ctgcatgctt tcatcacacc cattcgctgt atgaagacac acatgccact    720
tccaggtgtg gtcgttggtg atattgggcc caaatttggt tttgatgagg tggataatgg    780
ctatttgaaa ctggaaaatg ttagaattcc acgagagaat atgcttatga agtatgccca    840
ggttgaaccg gatggtacat atgtgaagcc tcctagtgat aaactcacat atggtaccat    900
ggtgtttatt cgctccatga tagtgggaga gtcagcacga gctctctcca aatcctgcac    960
tattgccatt cgctacagtg cagtccgaca tcagtctgaa ctacgcccag gtgaacctga   1020
gccacagatc ttggactatc aaacccagca gtataaacta tttcctcttc tggctactgc   1080
atatgccttt cactttgtag ggcagtacat gaataaaaca taccatcgca tctcaggaga   1140
catcagtctg ggtgacttca gtgagcttcc agagctgcat gccttgtcag ctggtctgaa   1200
agcttttacc acctgggcag caaatactgg cattgaggta tgtcgtatgt catgtggtgg   1260
tcatggctac tcccgctgca gcagtttacc tgacatctac gtcactttta cgccaacctg   1320
cacttatgag ggagagaata cggttatgat gctgcagaca gctaggtatt tggtgaagag   1380
ctacaagcaa gcacgggcag gacaacagtt gactggcatt gtgtcttacc tgaacgaatc   1440
tcagagcagg atacagcccc attctgtgtc ttcccggcct actgttgtca atattaatga  1500
cctggtcagc cttgtcgagg catacaagtt cagagctgca aagttagttg aagttgcagc  1560
taagaacctt cagttggagc tacagcacag caagagtaac gaagatgcct ggaacaacac  1620
ttccattgat ctagtcagag catctgatgc ccattgccat tatgtggttg tgaagctatt  1680
tgctgctaaa ctgagtgaga ttggagataa ggctgtccac tcagtactca gcactttggc  1740
tctgctttat gcccttcatg gagttgcaca gaattctggg gactttttaa aggctggtct  1800
gctaagtgtt tctcagctgg atcagatttc acagaggctg aagggtctcc tcttagagat  1860
aaggcccaat gcagtggctc tcgttgatgc ttttgactac cgtgatgaga tgcttaattc  1920
ttctctggga cgatatgatg gcaacgtcta tgagcacatg tttgagtggg ccaagaagtc  1980
acctctgaac catactgagg tccatgagtc ccacaacaag tatttgaagc cactacgatc  2040
caaattgtaa ctagtgcaag aaaggggaag aaagggaaaa gtctgtctat taaaaaaaaa  2100
tgttagagaa gaaaataatg tttgcttaaa ttctaaatgg atgaggttgc attctccatt  2160
ctaataattt ataacagcaa tccatgattt ctgtgtgcac ttaaaatgaa tgataatttc  2220
aagtaaacaa atttttattt tgttttgtaa ttgtatcgat tctggtatca tgtaatattt  2280
gcttattatt ttgagagaat gtgatgtttc agtaaacata cttctaatga tttggacttt  2340
gtgaaaatgg ttctgtactg aataattaac atttggatga ggatggtaag acatacatat  2400
ctttatgaaa tcatgcctta agacccacat acaagaatgt tttttagtat taataaaatt  2460
aatagttgta tagttccatt tcaatgatgt gtaattatta gatattgtat tgtgatctga  2520
ccatgttata tttgtaacac ttgtcatttg aacttatttg ctgcattaat aaataaatca  2580
tttaacattt acaaaaaaaa aaaaaaaaaa aaaaa                             2615
 
<210>16
<211>660
<212>PRT
<213>斑马鱼
 
<400>16
 
Met Asn Pro Asp Ile Ser Arg Glu Arg Glu Asn Ala Ser Phe Asn Leu
1               5                   10                  15
Glu Ile Leu Thr Asn Val Leu Asp Gly Gly Ala Glu Lys Thr Asn Arg
            20                  25                  30
Arg Arg Glu Ile Glu Ser Leu Val Ile Gly Asp Pro Asp Phe Gln His
        35                  40                  45
Glu Asp Leu Asn Phe Leu Ser Arg Ser Glu Arg Tyr Asp Ala Ala Val
    50                  55                  60
Arg Lys Ser Ala Gln Met Ile Leu Lys Leu Arg Glu Tyr Gly Ile Ser
65                  70                  75                  80
Asp Pro Glu Glu Ile Tyr Ser Tyr Lys Thr Val Val Arg Gly Val Phe
                85                  90                  95
Gln Glu Pro Leu Gly Val His Asn Val Met Phe Ile Pro Thr Leu Lys
            100                 105                 110
Ser Gln Cys Thr Ala Glu Gln Arg Lys Lys Trp Ile Pro Leu Ala Glu
        115                 120                 125
Ser Phe His Met Leu Gly Thr Tyr Ala Gln Thr Glu Leu Gly His Gly
    130                 135                 140
Thr His Ile Arg Ala Leu Glu Thr Thr Ala Thr Tyr Asp Pro Ser Thr
145                 150                 155                 160
Gln Glu Phe Val Leu Asn Ser Ser Thr Ile Ser Ser Ile Lys Trp Trp
                165                 170                 175
Pro Gly Gly Leu Gly Lys Thr Ser Asn His Ala Ile Val Leu Ala Gln
            180                 185                 190
Leu Tyr Thr Gln Gly Lys Cys His Gly Leu His Ala Phe Ile Thr Pro
        195                 200                 205
Ile Arg Cys Met Lys Thr His Met Pro Leu Pro Gly Val Val Val Gly
    210                 215                 220
Asp Ile Gly Pro Lys Phe Gly Phe Asp Glu Val Asp Asn Gly Tyr Leu
225                 230                 235                 240
Lys Leu Glu Asn Val Arg Ile Pro Arg Glu Asn Met Leu Met Lys Tyr
                245                 250                 255
Ala Gln Val Glu Pro Asp Gly Thr Tyr Val Lys Pro Pro Ser Asp Lys
            260                 265                 270
Leu Thr Tyr Gly Thr Met Val Phe Ile Arg Ser Met Ile Val Gly Glu
        275                 280                 285
Ser Ala Arg Ala Leu Ser Lys Ser Cys Thr Ile Ala Ile Arg Tyr Ser
    290                 295                 300
Ala Val Arg His Gln Ser Glu Leu Arg Pro Gly Glu Pro Glu Pro Gln
305                 310                 315                 320
Ile Leu Asp Tyr Gln Thr Gln Gln Tyr Lys Leu Phe Pro Leu Leu Ala
                325                 330                 335
Thr Ala Tyr Ala Phe His Phe Val Gly Gln Tyr Met Asn Lys Thr Tyr
            340                 345                 350
His Arg Ile Ser Gly Asp Ile Ser Leu Gly Asp Phe Ser Glu Leu Pro
         355                 360                 365
Glu Leu His Ala Leu Ser Ala Gly Leu Lys Ala Phe Thr Thr Trp Ala
    370                 375                 380
Ala Asn Thr Gly Ile Glu Val Cys Arg Met Ser Cys Gly Gly His Gly
385                 390                 395                 400
Tyr Ser Arg Cys Ser Ser Leu Pro Asp Ile Tyr Val Thr Phe Thr Pro
                405                 410                 415
Thr Cys Thr Tyr Glu Gly Glu Asn Thr Val Met Met Leu Gln Thr Ala
            420                 425                 430
Arg Tyr Leu Val Lys Ser Tyr Lys Gln Ala Arg Ala Gly Gln Gln Leu
        435                 440                 445
Thr Gly Ile Val Ser Tyr Leu Asn Glu Ser Gln Ser Arg Ile Gln Pro
    450                 455                 460
His Ser Val Ser Ser Arg Pro Thr Val Val Asn Ile Asn Asp Leu Val
465                 470                 475                 480
Ser Leu Val Glu Ala Tyr Lys Phe Arg Ala Ala Lys Leu Val Glu Val
                485                 490                 495
Ala Ala Lys Asn Leu Gln Leu Glu Leu Gln His Ser Lys Ser Asn Glu
            500                 505                 510
Asp Ala Trp Asn Asn Thr Ser Ile Asp Leu Val Arg Ala Ser Asp Ala
        515                 520                 525
His Cys His Tyr Val Val Val Lys Leu Phe Ala Ala Lys Leu Ser Glu
    530                 535                 540
Ile Gly Asp Lys Ala Val His Ser Val Leu Ser Thr Leu Ala Leu Leu
545                 550                 555                 560
Tyr A1a Leu His Gly Val Ala Gln Asn Ser Gly Asp Phe Leu Lys Ala
                565                 570                 575
Gly Leu Leu Ser Val Ser Gln Leu Asp Gln Ile Ser Gln Arg Leu Lys
            580                 585                 590
Gly Leu Leu Leu Glu Ile Arg Pro Asn Ala Val Ala Leu Val Asp Ala
        595                 600                 605
Phe Asp Tyr Arg Asp Glu Met Leu Asn Ser Ser Leu Gly Arg Tyr Asp
    610                 615                 620
Gly Asn Val Tyr Glu His Met Phe Glu Trp Ala Lys Lys Ser Pro Leu
625                 630                 635                 640
Asn His Thr Glu Val His Glu Ser His Asn Lys Tyr Leu Lys Pro Leu
                645                 650                 655
Arg Ser Lys Leu
            660
 
<210>17
<211>2188
<212>DNA
<213>牛(Bos sp.)
 
<400>17
 
gggattcctg ctgtcgccgc tgccacctac actgcctcag ccgcccgtta ccatgaatcc    60
agacctgcag aaagagcggg ccggcgccag cttcaacccg gagctgctca cgaatgtcct    120
ggacggcagc cccgagaaca ctcggcgccg ccgagagatc gagaacctca ttctgaacga    180
cccagacttc cagcatgaga acttgaattt cctcagccgt agccagcgtt acgaggtggc    240
tgttaagaag agtgccatca tggtgcagaa gatgaggaag tttggcatcg cagatcctgc    300
tgaaatcatg tggtttaaaa aactacattt ggtcaatttt gtggaacctg tgggcctcaa    360
ttactccatg tttattccta ccttgctgaa tcagggcacc actgctcagc aagagaaatg    420
gctgcattca tccaaaggac tcgagataat tggcacctac gcccagacgg aaatgggcca    480
cggaacccat cttcgaggct tggaaaccac agccacttat gaccctgaaa cccaggagtt    540
cattctcaac agtcctactg tgacctccat caagtggtgg cctggtggac ttggaaaaac    600
ttcaaatcat gctatcgtac ttgcccagct cttcactcag ggaaaatgct atggattaca    660
tgccttcatt gtacctattc gtgaacttgg gacccataag cctttgccag gtattactgt    720
aggagacatt ggccccaagt ttggctatga tgagatggat aatggctact tgaagatgga    780
caactatcgt attcccagag aaaacatgct gatgaaacat gcccaggtga agcctgatgg    840
cacatacgta aaacccctga ataacaagct gacctacggg accatggtgt tcatcaggtc    900
cttcctcgtg ggagaatccg ctcggagtct gtctaaggca tgcaccattg ccgtccgata    960
cagtgctgtg aggcatcagt ctgaaatcaa cccaggtgaa ccagaaccac agattttgga   1020
ttatcaaacc cagcaatata aacttttccc cctcctggcc actgcctatg ccttccagtt   1080
tgtaggcgca tacatgaaag agacctatct tcggattaat gaagacattg gccatgggga   1140
cctgagtgag ctgcctgagc ttcacgcgct caccgctggg ctgaaggctt tcacgtcctg   1200
gacaacgaac acagctattg aagcctgtcg gatggcttgt ggcggacatg gctattctca   1260
ctgcagtgga cttccaaata tttatgtcac ttttacccca acctgcacct tcgaggggga   1320
aaacactgtc atgatgctgc agacagccag gttcctgatg aaaagttacg accaggtgca   1380
ctcaggcaag ttggtgtgtg gcatggtgtc ctacttgaat gacctgccca gccagcgcat   1440
ccagccacag caggtggctg tgtggccaac tatggtggat atcaacagcc ccgacagcct   1500
gacagaggcg tacaagcttc gagcggccag attagtagaa attgctgcta aaaaccttca   1560
gactgaagtg attcacagaa aaagcaagga ggtagcgtgg aacctaacgt ccattgacct   1620
tgttcgggca agtgaggcac attgccacta tgtggtggtt aagctcttta cggaaaaagt   1680
cctccagatt caagagaagt ccatccaagc tgtcctaagg cgtttgtgtc tcttgtattc   1740
tttgtatgga atcagtcaga atgcagggga ttttcttcag gggagcatca tgacagagtc   1800
tcagatcacc caggtgaatgggcgcatcaa ggagctgctg actgcgattc gccctgacgc    1860
ggttgctctg gtggatgcat ttgattttca ggatgtgaca ctgggctctg tgcttggccg   1920
ctatgatggc aatgtgtacg aaaacttgtt tgaatgggcc aagaaatccc cactgaacaa   1980
aacagaggtc catgagtctt acaagcacct aaagtcgctg cagtccaagc tctgacgtgg   2040
cttgatgata agtgcagtct gccctgaaag tagctgttct tacacctgtc acacaaactt   2100
cgtggaatct tgatcaaatt cagaaaagct gtagagcaag tgataaattg accctttcct   2160
ctttttataa atgaaaaaaa aaaaaaaa                                      2188
 
<2l0>18
<211>660
<212>PRT
<213>牛
 
<400>18
 
Met Asn Pro Asp Leu Gln Lys Glu Arg Ala Gly Ala Ser Phe Asn Pro
1               5                   10                  15
Glu Leu Leu Thr Asn Val Leu Asp Gly Ser Pro Glu Asn Thr Arg Arg
            20                  25                  30
Arg Arg Glu Ile Glu Asn Leu Ile Leu Asn Asp Pro Asp Phe Gln His
        35                  40                  45
Glu Asn Leu Asn Phe Leu Ser Arg Ser Gln Arg Tyr Glu Val Ala Val
    50                  55                  60
Lys Lys Ser Ala Ile Met Val Gln Lys Met Arg Lys Phe Gly Ile Ala
65                  70                  75                  80
Asp Pro Ala Glu Ile Met Trp Phe Lys Lys Leu His Leu Val Asn Phe
                85                  90                  95
Val Glu Pro Val Gly Leu Asn Tyr Ser Met Phe Ile Pro Thr Leu Leu
            100                 105                 110
Asn Gln Gly Thr Thr Ala Gln Gln Glu Lys Trp Leu His Ser Ser Lys
        115                 120                 125
Gly Leu Glu Ile Ile Gly Thr Tyr Ala Gln Thr Glu Met Gly His Gly
    130                 135                 140
Thr His Leu Arg Gly Leu Glu Thr Thr Ala Thr Tyr Asp Pro Glu Thr
145                 150                 155                 160
Gln Glu Phe Ile Leu Asn Ser Pro Thr Val Thr Ser Ile Lys Trp Trp
                165                 170                 175
Pro Gly Gly Leu Gly Lys Thr Ser Asn His Ala Ile Val Leu Ala Gln
            180                 185                 190
Leu Phe Thr Gln Gly Lys Cys Tyr Gly Leu His Ala Phe Ile Val Pro
        195                 200                 205
Ile Arg Glu Leu Gly Thr His Lys Pro Leu Pro Gly Ile Thr Val Gly
    210                 215                 220
Asp Ile Gly Pro Lys Phe Gly Tyr Asp Glu Met Asp Asn Gly Tyr Leu
225                 230                 235                 240
Lys Met Asp Asn Tyr Arg Ile Pro Arg Glu Asn Met Leu Met Lys His
                245                 250                 255
Ala Gln Val Lys Pro Asp Gly Thr Tyr Val Lys Pro Leu Asn Asn Lys
            260                 265                 270
Leu Thr Tyr Gly Thr Met Val Phe Ile Arg Ser Phe Leu Val Gly Glu
        275                 280                 285
Ser Ala Arg Ser Leu Ser Lys Ala Cys ThrIle Ala Val Arg Tyr Ser
    290                 295                 300
Ala Val Arg His Gln Ser Glu Ile Asn Pro Gly Glu Pro Glu Pro Gln
305                 310                 315                 320
Ile Leu Asp Tyr Gln Thr Gln Gln Tyr Lys Leu Phe Pro Leu Leu Ala
                325                 330                 335
Thr Ala Tyr Ala Phe Gln Phe Val Gly Ala Tyr Met Lys Glu Thr Tyr
            340                 345                 350
Leu Arg Ile Asn Glu Asp Ile Gly His Gly Asp Leu Ser Glu Leu Pro
        355                 360                 365
Glu Leu His Ala Leu Thr Ala Gly Leu Lys Ala Phe Thr Ser Trp Thr
    370                 375                 380
Thr Asn Thr Ala Ile Glu Ala Cys Arg Met Ala Cys Gly Gly His Gly
385                 390                 395                 400
Tyr Ser His Cys Ser Gly Leu Pro Asn Ile Tyr Val Thr Phe Thr Pro
                405                 410                 415
Thr Cys Thr Phe Glu Gly Glu Asn Thr Val Met Met Leu Gln Thr Ala
            420                 425                 430
Arg Phe Leu Met Lys Ser Tyr Asp Gln Val His Ser Gly Lys Leu Val
        435                 440                 445
Cys Gly Met Val Ser Tyr Leu Asn Asp Leu Pro Ser Gln Arg Ile Gln
    450                 455                 460
Pro Gln Gln Val Ala Val Trp Pro Thr Met Val Asp Ile Asn Ser Pro
465                 470                 475                 480
Asp Ser Leu Thr Glu Ala Tyr Lys Leu Arg Ala Ala Arg Leu Val Glu
                485                 490                 495
Ile Ala Ala Lys Asn Leu Gln Thr Glu Val Ile His Arg Lys Ser Lys
            500                 505                 510
Glu Val Ala Trp Asn Leu Thr Ser Ile Asp Leu Val Arg Ala Ser Glu
        515                 520                 525
Ala His Cys His Tyr Val Val Val Lys Leu Phe Thr Glu Lys Val Leu
    530                 535                 540
Gln Ile Gln Glu Lys Ser Ile Gln Ala Val Leu Arg Arg Leu Cys Leu
545                 550                 555                 560
Leu Tyr Ser Leu Tyr Gly Ile Ser Gln Asn Ala Gly Asp Phe Leu Gln
                565                 570                 575
Gly Ser Ile Met Thr Glu Ser Gln Ile Thr Gln Val Asn Gly Arg Ile
            580                 585                 590
Lys Glu Leu Leu Thr Ala Ile Arg Pro Asp Ala Val Ala Leu Val Asp
        595                 600                 605
Ala Phe Asp Phe Gln Asp Val Thr Leu Gly Ser Val Leu Gly Arg Tyr
    610                 615                 620
Asp Gly Asn Val Tyr Glu Asn Leu Phe Glu Trp Ala Lys Lys Ser Pro
625                 630                 635                 640
Leu Asn Lys Thr Glu Val His Glu Ser Tyr Lys His Leu Lys Ser Leu
                645                 650                 655
Gln Ser Lys Leu
            660
 
<210>19
<211>3539
<212>DNA
<213>小鼠(Mus sp.)
 
<400>19
 
agactacata tggtcaattt tgtggaacct gttggcctca attactccat gtttatccct     60
accttgctga atcagggcac cactgctcag caggagaaat ggatgcaccc gtcccaagaa    120
ctccagataa ttggcaccta cgcccagacg gagatgggcc acgctctgtg caccgagggc    180
atcctgagcc tttggacctt cacttgggca tgttcctgcc caccttgctt caccaggcca    240
ccgaagagca gcaggagcgt ttcttcatgc cggcctggaa tctggagatc acgggcactt    300
atgcgcagac agagatgggt catggaactc atcttcgagg cttggaaacc actgccacat    360
atgaccccaa gacccaagag ttcattctca acagcccaac tgtgacttcc atcaagtggt    420
ggcctggggg gcttgggaag acttccaatc atgcgatagt cctggctcag ctcatcactc    480
gaggggagtg ctacgggtta catgcctttg ttgtccctatccgtgagatt gggacccaca     540
agcctctgcc aggcatcact gttggggata tcggccccaa gtttggttat gaagagatgg    600
ataatggcta cctgaagatg gacaattacc gtattcctag agagaacatg ttgatgaaat    660
atgcccaggt gaagcctgac ggcacgtatg taaaacctct gagtaacaag ctgacatatg    720
ggaccatggt tttcgtaagg tccttcctcg tgggaagtgc agctcagagt ctgtccaagg    780
catgcaccat tgccattcga tacagtgctg tgaggcgcca gtctgaaatc aagagaagcg    840
agccagagcc ccagattttg gattttcaga cgcagcagta taaactcttc ccgctcctgg    900
ccaccgccta tgccttccac tttctcggaa gatacataaa ggagacctac atgcggatta    960
atgagagcat tggccaaggc gacctgagtg agctgcctga gcttcatgcc ctcacagctg   1020
ggctgaaggc ttttactacc tggacagcca atgctggtatcgaagaatgt cggatggctt    1080
gcggtgggca cggctattct cacagcagtg ggattccaaa tatttacgtc acgtttaccc   1140
cggcctgcac cttcgagggg gagaacactg ttatgatgct gcagacggcc aggttcttga   1200
tgaaaatcta tgaccaggtt cagtcgggga agctggtggg tggtatggtg tcgtacttga   1260
atgacctgcc gagccagcgtatccagccgc agcaggtggc agtctggcca actctggtgg    1320
acattaacag cctggacagc ctgacagaag cctacaagct acgtgcagcc agattggtag   1380
aaattgctgc aaaaaacctt caggcccaag tgagtcacag gaagagcaag gaagtggcgt    1440
ggaacttgac ttctgtcgac cttgttcgcg caagtgaggc gcactgccac tacgtgaccg    1500
ttaaggtctt tgcagataaa ctccccaaga ttcaagacag agccgtgcaa gccgtgctga    1560
ggaacctgtg tctcttatat tctctctatg ggatcagcca gaaaggaggg gattttcttg    1620
aggggaacat catcacaggg gctcagatgt cacaggtaaa cagtcggatc ctggagctgc    1680
tcacagtgac tcgccccaac gctgtggctt tggtggatgc ctttgacttt aaggatgtga    1740
cccttggctc tgttctcggc cgctatgatg gcaatgtgta tgaaaacttg tttgagtggg    1800
ccaagaagtc cccactgaac aagacagagg tccacgaatc ttactacaag cacttgaagc    1860
ccctgcagtc gaagctttga agtttcccca gggacaagtc tgagctccac agagaggccg    1920
aatctctcct tgattcacta atccttgtga aatcgtcttc agacttgtgt agctatagag    1980
caaatgatgg gctggccttt ccctctctat aagtaaagag aaatgagcag acttagagat    2040
gaaatgagaa tccagtgttg taggtgcagt agtagcccag gccgacgtag gacctcggga    2100
agccactgcc gcgctgtggc ctggctgacg ttatttgttc tgctgctaat ctctgtaggc    2160
cttgactctg ggggaattaa cagagtttaa ctactaaata cttagtaatt ttcacatttt    2220
cactgctaat cactggatat atgtttttta aacaaaggtg ttctatagag ctggactttc    2280
caggctttct tgcctagcac tttctgatct accactaaga gcaggagttt gggggccaga    2340
aactaataga aacccagatg tgagtgtgtg gcccttacat atgcccctgc tgcctgctgt    2400
gtgggtatgt cattcctacc aactgtcaca ctaacatatc aacaagagga gtccttaaac    2460
acccacccac caagaaagca gcgctccggg actaagctcc cactctggtc ttcctggcaa    2520
tggcatgcac ccgcccatga ccccacttcc tgacacagct aagttgcttg tctttacctc    2580
caggctttcg gccgttgcct ggacttcaat catggtggct gaccttccct ttcttgcttt    2640
gcttctcctc aaagagataa tagagacaat gaccagtctt tcctcataga tcaagtatgg    2700
ggagagccct cagctatggt attcctgtat tttggtgact tatttaagta aatttcctgg    2760
gacaatccag atttgaaaga ttctgtcttc ttgttgtcat aaactattaa aatgcttggt    2820
ggtcaccaaa gtatttgaca taaaaataaa taaataaatc attcaggcca ccttttacac    2880
cagaaatcac aggaaagccc tgggccccag ccatctgctg agtgttagtt gagaagatgg    2940
atcctaagcc agctgaagaa tgagtgcagg ctgtggggag gttcttgctg agtagctggc    3000
tttgtggtaa gctgctagca gccttacagg gtggcgaagc agcccccctt tggatgcaga    3060
gcagcctcta caatcattct gaccttaaag gtagagtatg gaccttttgt ggtatgtgtg    3120
tgtatgcttt tttttatgta gtgatttttt ttttcttgag acagggccca gagtggcctt    3180
gacctctgat cctcagcctc ccagatgctg gggttacagg tttgcgctga catgcctggc    3240
tagttggaac tctttgttct taaaagcaca gtagagagat cattgtgacc tattaagtct    3300
gtgtctgtgg cattggcatc gtgagaacag ttctttcaga gcagttctga gaacacagta    3360
ttaatggagt ggaaatgaca tcaagtcaaa gccatcagat ttgctgacac agtcttaacc    3420
tttctcctgg aatgactgat aatccctgaa gattgacagt aagcagcatg tcacctgtgg    3480
ggtttctatt tgacagtaat tcatattctg gaaaatagcc aataaattta aatgactgg     3539
 
<2l0>20
<211>661
<212>PRT
<213>小鼠
 
<400>20
 
Met Asn Pro Asp Leu Arg Lys G1u Arg Ala Ala Ala Thr Phe Asn Pro
l               5                   10                  15
Glu Leu Ile Thr His Ile Leu Asp Gly Ser Pro Glu Asn Thr Arg Arg
            20                  25                  30
Arg Arg Glu Ile Glu Asn Leu Ile Leu Asn Asp Pro Asp Phe Gln His
        35                  40                  45
Glu Asp Tyr Asn Phe Leu Thr Arg Ser Gln Arg Tyr Glu Val Ala Val
    50                  55                  60
Lys Lys Ser Ala Thr Met Val Lys Lys Met Arg Glu Phe Gly Ile Ala
65                  70                  75                  80
Asp Pro Glu Glu Ile Met Trp Phe Lys Asn Ser Val His Arg Gly His
                85                  90                  95
Pro Glu Pro Leu Asp Leu His Leu Gly Met Phe Leu Pro Thr Leu Leu
            100                 105                 110
His Gln Ala Thr Glu Glu Gln Gln Glu Arg Phe Phe Met Pro Ala Trp
        115                 120                 125
Asn Leu Glu Ile Thr Gly Thr Tyr Ala Gln Thr Glu Met Gly His Gly
    130                 135                 140
Thr His Leu Arg Gly Leu Glu Thr Thr Ala Thr Tyr Asp Pro Lys Thr
145                 150                 155                 160
Gln Glu Phe Ile Leu Asn Ser Pro Thr Val Thr Ser Ile Lys Trp Trp
                165                 170                 175
Pro Gly Gly Leu Gly Lys Thr Ser Asn His Ala Ile Val Leu Ala Gln
            180                 185                 190
Leu Ile Thr Arg Gly Glu Cys Tyr Gly Leu His Ala Phe Val Val Pro
        195                 200                 205
Ile Arg Glu Ile Gly Thr His Lys Pro Leu Pro Gly Ile Thr Val Gly
    210                 215                 220
Asp Ile Gly Pro Lys Phe Gly Tyr Glu Glu Met Asp Asn Gly Tyr Leu
225                 230                 235                 240
Lys Met Asp Asn Tyr Arg Ile Pro Arg Glu Asn Met Leu Met Lys Tyr
                245                 250                 255
Ala Gln Val Lys Pro Asp Gly Thr Tyr Val Lys Pro Leu Ser Asn Lys
            260                 265                 270
Leu Thr Tyr Gly Thr Met Val Phe Val Arg Ser Phe Leu Val Gly Ser
        275                 280                 285
Ala Ala Gln Ser Leu Ser Lys Ala Cys Thr Ile Ala Ile Arg Tyr Ser
    290                 295                 300
Ala Val Arg Arg Gln Ser Glu Ile Lys Arg Ser Glu Pro Glu Pro Gln
305                 310                 315                 320
Ile Leu Asp Phe Gln Thr Gln Gln Tyr Lys Leu Phe Pro Leu Leu Ala
                325                 330                 335
Thr Ala Tyr Ala Phe His Phe Leu Gly Arg Tyr Ile Lys Glu Thr Tyr
            340                 345                 350
Met Arg Ile Asn Glu Ser Ile Gly Gln Gly Asp Leu Ser Glu Leu Pro
        355                 360                 365
Glu Leu His Ala Leu Thr Ala Gly Leu Lys Ala Phe Thr Thr Trp Thr
    370                 375                 380
Ala Asn Ala Gly Ile Glu Glu Cys Arg Met Ala Cys Gly Gly His Gly
385                 390                 395                 400
Tyr Ser His Ser Ser Gly Ile Pro Asn Ile Tyr Val Thr Phe Thr Pro
                405                 410                 415
Ala Cys Thr Phe Glu Gly Glu Asn Thr Val Met Met Leu Gln Thr Ala
            420                 425                 430
Arg Phe Leu Met Lys Ile Tyr Asp Gln Val Gln Ser Gly Lys Leu Val
        435                 440                 445
Gly Gly Met Val Ser Tyr Leu Asn Asp Leu Pro Ser Gln Arg Ile Gln
    450                 455                 460
Pro Gln Gln Val Ala Val Trp Pro Thr Leu Val Asp Ile Asn Ser Leu
465                 470                 475                 480
Asp Ser Leu Thr Glu Ala Tyr Lys Leu Arg Ala Ala Arg Leu Val Glu
                485                 490                 495
Ile Ala Ala Lys Asn Leu Gln Ala Gln Val Ser His Arg Lys Ser Lys
            500                 505                 510
Glu Val Ala Trp Asn Leu Thr Ser Val Asp Leu Val Arg Ala Ser Glu
        515                 520                 525
Ala His Cys His Tyr Val Thr Val Lys Val Phe Ala Asp Lys Leu Pro
    530                 535                 540
Lys Ile Gln Asp Arg Ala Val Gln Ala Val Leu Arg Asn Leu Cys Leu
545                 550                 555                 560
Leu Tyr Ser Leu Tyr Gly Ile Ser Gln Lys Gly Gly Asp Phe Leu Glu
                565                 570                 575
Gly Asn Ile Ile Thr Gly Ala Gln Met Ser Gln Val Asn Ser Arg Ile
            580                 585                 590
Leu Glu Leu Leu Thr Val Thr Arg Pro Asn Ala Val Ala Leu Val Asp
        595                 600                 605
Ala Phe Asp Phe Lys Asp Val Thr Leu Gly Ser Val Leu Gly Arg Tyr
    610                 615                 620
Asp Gly Asn Val Tyr Glu Asn Leu Phe Glu Trp Ala Lys Lys Ser Pro
625                 630                 635                 640
Leu Asn Lys Thr Glu Val His Glu Ser Tyr Tyr Lys His Leu Lys Pro
                645                 650                 655
Leu Gln Ser Lys Leu
            660
 
<210>21
<211>2298
<212>DNA
<213>大鼠(Rattus sp.)
 
<400>21
 
cggcgcctgg gcagcggaca cgggtcgttg ctttggtgtc tgtcacttct gtcgccacct      60
cctctgccaa caccaacact gacctccgtc atgaaccccg acctgcgcaa ggagcgggcc     120
tccgccacct tcaatccgga gttgatcacg cacatcttgg atggcagtcc ggagaatacc     180
cggcgccgtc gagaaattga gaacttgatt ctgaacgacc cagacttcca gcatgaggac     240
tataacttcc tcactcgaag ccagcgttat gaggtggctg ttaagaagag tgccaccatg     300
gtgaagaaga tgagggaata tggcatctcg gaccctgaag aaatcatgtg gtttaaaaaa     360
ctatatttgg ccaattttgt ggaacctgtt ggcctcaatt actccatgtt tattcctacc     420
ttgctgaatc agggcaccac tgctcagcag gagaaatgga tgcgcccgtc ccaagaactc     480
cagataattg gcacctacgc ccagacggag atgggccacg gaactcatct tcgaggcttg     540
gaaaccactg ccacatatga ccccaagacc caagagttca ttctcaacag ccctactgtg     600
acttccatta agtggtggcc tgggggactt gggaaaactt ccaatcacgc aatagttctg     660
gctcagctca tcactcaagg agagtgctac gggttacatg cctttgttgt ccctatccgt     720
gaaattggga cccacaagcc cttgccaggc atcactgtcg gggatatcgg tcccaaattt     780
ggttatgaag agatggataa cggctacctg aagatggaca attaccgtat tcccagagag     840
aacatgctga tgaaatacgc ccaggtgaag cctgatggca catatgtaaa gcctttgagt     900
aacaagctga cgtatgggac catggttttt gtgaggtcct tcctcgtggg aaatgcagct     960
cagagtctgt ccaaggcttg cacaatcgcc atacgataca gcgctgtgag gcgccagtct    1020
gaaatcaagc aaagcgaacc agaaccacag attttggatt ttcaaaccca gcagtataaa    1080
ctcttcccgc tcctggccac tgcctatgcc ttccacttcg taggaaggta catgaaggag    1140
acctaccttc gaattaatga gagcattggc caaggggacc tgagtgaact gcctgagctt    1200
cacgccctca ctgctgggct gaaggctttt actacttgga cagccaatgc tggcatcgaa    1260
gaatgtcgaa tggcctgcgg cgggcacggc tattctcaca gcagtgggat tccaaatatt    1320
tacgtcactt ttaccccggc ctgcaccttc gagggagaga acactgttat gatgctgcag    1380
acagccaggt tcttgatgaa aatctacgac caggtgcggt cggggaagtt ggtgggtggt  1440
atggtgtcat acctgaatga cctgccgagt cagcggatcc agccacagca ggtggcagtc  1500
tggccaacta tggtggacat caacagcctg gagggcctga cagaagccta caagcttcgt  1560
gcagccagat tggtagaaat cgctgcaaaa aaccttcaga ctcacgtgag tcacaggaag  1620
agcaaggaag tagcatggaa cctaacctct gtcgaccttg ttcgggcaag tgaggcgcat  1680
tgccactacg tggtcgttaa ggtcttctca gacaaactcc ccaagattca agacaaagcc  1740
gtccaagctg tgctgaggaa cctgtgtctc ttgtattctc tctatgggat cagccagaaa  1800
ggaggggact ttcttgaggg gagcatcatc acaggggctc agctgtcaca agtaaacgct  1860
cggatcctgg agctgctcac cctgatccgc cccaatgctg ttgctctggt ggatgccttt  1920
gactttaagg acatgacact tggctctgtt cttggccgct atgatggaaa tgtgtatgaa  1980
aacttgtttg agtgggccaa gaaatcccca ctgaacaaaa cagaggtcca tgaatcttac  2040
cacaagcact tgaagcccct gcagtccaag ctttgaagtt tccctgggac acgtctgagc  2100
tccacaagca gcagaaactc tctcctctac tcactaatcc ttgtgaaatc gtcatcaaat  2160
ttgtgtagct acagagcaaa tgatgggttt cttttcctcc ctataagtaa agagaaatga  2220
acagacaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa  2280
aaaaaaaaaa aaaaaaaa                                                2298
 
<210>22
<211>661
<212>PRT
<213>大鼠
 
<400>22
 
Met Asn Pro Asp Leu Arg Lys Glu Arg Ala Ser Ala Thr Phe Asn Pro
1               5                   10                  15
Glu Leu Ile Thr His Ile Leu Asp Gly Ser Pro Glu Asn Thr Arg Arg
            20                  25                  30
Arg Arg Glu Ile Glu Asn Leu Ile Leu Asn Asp Pro Asp Phe Gln His
        35                  40                  45
Glu Asp Tyr Asn Phe Leu Thr Arg Ser Gln Arg Tyr Glu Val Ala Val
    50                  55                  60
Lys Lys Ser Ala Thr Met Val Lys Lys Met Arg Glu Tyr Gly Ile Ser
65                  70                  75                  80
Asp Pro Glu Glu Ile Met Trp Phe Lys Lys Leu Tyr Leu Ala Asn Phe
                85                  90                  95
Val Glu Pro Val Gly Leu Asn Tyr Ser Met Phe Ile Pro Thr Leu Leu
            100                 105                 110
Asn Gln Gly Thr Thr Ala Gln Gln Glu Lys Trp Met Arg Pro Ser Gln
        115                 120                 125
Glu Leu Gln Ile Ile Gly Thr Tyr Ala Gln Thr Glu Met Gly His Gly
    130                 135                 140
Thr His Leu Arg Gly Leu Glu Thr Thr Ala Thr Tyr Asp Pro Lys Thr
145                 150                 155                 160
Gln Glu Phe Ile Leu Asn Ser Pro Thr Val Thr Ser Ile Lys Trp Trp
                165                 170                 175
Pro Gly Gly Leu Gly Lys Thr Ser Asn His Ala Ile Val Leu Ala Gln
            180                 185                 190
Leu Ile Thr Gln Gly Glu Cys Tyr Gly Leu His Ala Phe Val Val Pro
        195                 200                 205
Ile Arg Glu Ile Gly Thr His Lys Pro Leu Pro Gly Ile Thr Val Gly
    210                 215                 220
Asp Ile Gly Pro Lys Phe Gly Tyr Glu Glu Met Asp Asn Gly Tyr Leu
225                 230                 235                 240
Lys Met Asp Asn Tyr Arg Ile Pro Arg Glu Asn Met Leu Met Lys Tyr
                245                 250                 255
Ala Gln Val Lys Pro Asp Gly Thr Tyr Val Lys Pro Leu Ser Asn Lys
            260                 265                 270
Leu Thr Tyr Gly Thr Met Val Phe Val Arg Ser Phe Leu Val Gly Asn
        275                 280                 285
Ala Ala Gln Ser Leu Ser Lys Ala Cys Thr Ile Ala Ile Arg Tyr Ser
    290                 295                 300
Ala Val Arg Arg Gln Ser Glu Ile Lys Gln Ser Glu Pro Glu Pro Gln
305                 310                 315                 320
Ile Leu Asp Phe Gln Thr Gln Gln Tyr Lys Leu Phe Pro Leu Leu Ala
                325                 330                 335
Thr Ala Tyr Ala Phe His Phe Val Gly Arg Tyr Met Lys Glu Thr Tyr
            340                 345                 350
Leu Arg Ile Asn Glu Ser Ile Gly Gln Gly Asp Leu Ser Glu Leu Pro
        355                 360                 365
Glu Leu His Ala Leu Thr Ala Gly Leu Lys Ala Phe Thr Thr Trp Thr
    370                 375                 380
Ala Asn Ala Gly Ile Glu Glu Cys Arg Met Ala Cys Gly Gly His Gly
385                 390                 395                 400
Tyr Ser His Ser Ser Gly Ile Pro Asn Ile Tyr Val Thr Phe Thr Pro
                405                 410                 415
Ala Cys Thr Phe Glu Gly Glu Asn Thr Val Met Met Leu Gln Thr Ala
            420                 425                 430
Arg Phe Leu Met Lys Ile Tyr Asp Gln Val ATg Ser Gly Lys Leu Val
        435                 440                 445
Gly Gly Met Val Ser Tyr Leu Asn Asp Leu Pro Ser Gln Arg Ile Gln
    450                 455                 460
Pro Gln Gln Val Ala Val Trp Pro Thr Met Val Asp Ile Asn Ser Leu
465                 470                 475                 480
Glu Gly Leu Thr Glu Ala Tyr Lys Leu Arg Ala Ala Arg Leu Val Glu
                485                 490                 495
Ile Ala Ala Lys Asn Leu Gln Thr His Val Ser His Arg Lys Ser Lys
            500                 505                 510
Glu Val Ala Trp Asn Leu Thr Ser Val Asp Leu Val Arg Ala Ser Glu
        515                 520                 525
Ala His Cys His Tyr Val Val Val Lys Val Phe Ser Asp Lys Leu Pro
    530                 535                 540
Lys Ile Gln Asp Lys Ala Val Gln Ala Val Leu Arg Asn Leu Cys Leu
545                 550                 555                 560
Leu Tyr Ser Leu Tyr Gly Ile Ser Gln Lys Gly Gly Asp Phe Leu Glu
                565                 570                 575
Gly Ser Ile Ile Thr Gly Ala Gln Leu Ser Gln Val Asn Ala Arg Ile
            580                 585                 590
Leu Glu Leu Leu Thr Leu Ile Arg Pro Asn Ala Val Ala Leu Val Asp
        595                 600                 605
Ala Phe Asp Phe Lys Asp Met Thr Leu Gly Ser Val Leu Gly Arg Tyr
    610                 615                 620
Asp Gly Asn Val Tyr Glu Asn Leu Phe Glu Trp Ala Lys Lys Ser Pro
625                 630                 635                 640
Leu Asn Lys Thr Glu Val His Glu Ser Tyr His Lys His Leu Lys Pro
                645                 650                 655
Leu Gln Ser Lys Leu
            660

Claims (21)

1.用于检测第一蛋白改变的方法,所述方法包括筛选至少一个第二蛋白的错误折叠或聚集,
其中所述第一蛋白选自SURF蛋白家族、SEC22蛋白家族和酰基辅酶A氧化酶。
2.如权利要求1所述的方法,其中所述改变包括所述第一蛋白表达的升高或降低。
3.如权利要求1所述的方法,其中所述改变包括所述第一蛋白的突变。
4.用于诊断神经疾病的方法,所述方法包括检测来自个体的组织样品中蛋白的改变,所述蛋白选自SURF蛋白家族、SEC22蛋白家族和酰基辅酶A氧化酶,
其中所述改变表明易感神经疾病或存在神经疾病。
5.如权利要求4所述的方法,进一步包括在体内或体外模型中测定蛋白错误折叠或聚集的量。
6.如权利要求4所述的方法,其中使用抗体、可检测标签、核酸探针或微阵列检测所述蛋白,所述抗体、可检测标签、核酸探针或微阵列针对所述蛋白的野生型或改变型对应的多核苷酸或多肽序列是特异性的。
7.用于筛选治疗神经疾病的化合物的方法,所述方法包括
使靶化合物与选自SURF蛋白家族、SEC22蛋白家族和酰基辅酶A氧化酶的蛋白接触,和
测定无所述化合物下的所述蛋白的活性变化。
8.如权利要求7所述的方法,进一步包括向神经疾病的动物模型施用所述化合物,以减少至少一个第二蛋白的错误折叠或聚集或提供神经保护。
9.如权利要求8所述的方法,其中所述化合物选自拓扑异构酶II抑制剂、细菌转肽酶抑制剂、钙通道拮抗剂、环氧合酶抑制剂、叶酸合成抑制剂和钠通道阻断剂。
10.用于治疗神经疾病的方法,所述方法包括改变需要治疗的个体的第一蛋白的活性,所述第一蛋白选自SURF蛋白家族、SEC22蛋白家族和酰基辅酶A氧化酶。
11.如权利要求10所述的方法,其中通过向需要治疗的个体施用表达第二蛋白的载体来改变所述第一蛋白的活性,其中所述第二蛋白选自SURF蛋白家族、SEC22蛋白家族和酰基辅酶A氧化酶。
12.如权利要求10所述的方法,其中所述蛋白保护神经元,使其免于变性和死亡。
13.如权利要求10所述的方法,其中通过施用化合物来改变所述第一蛋白的活性,从而改变无所述化合物下的所述第一蛋白的活性。
14.如权利要求10所述的方法,其中所述神经疾病选自肌萎缩侧索硬化、阿尔茨海默病、帕金森病、朊病毒病、多聚谷氨酰胺扩展病、脊髓小脑性共济失调、脊髓和延髓性肌萎缩、海绵状脑病、tau蛋白病、亨廷顿病或张力失常。
15.如权利要求10所述的方法,其中在易患所述神经疾病的个体出现症状前改变所述第一蛋白的活性。
16.如权利要求13所述的方法,其中所述化合物选自拓扑异构酶II抑制剂、细菌转肽酶抑制剂、钙通道拮抗剂、环氧合酶抑制剂、叶酸合成抑制剂和钠通道阻断剂。
17.如权利要求13所述的方法,其中通过吸入、透皮、口服、直肠、经粘膜、肠内或肠胃外途径施用药学可接受载体中的所述化合物。
18.如权利要求13所述的方法,其中在易患所述神经疾病的个体出现症状前施用所述化合物。
19.转基因动物,其包含与野生型动物相比活性改变的蛋白,所述蛋白选自SURF蛋白家族、SEC22蛋白家族和酰基辅酶A氧化酶。
20.如权利要求19所述的转基因动物,其中所述活性改变包括所述蛋白表达的升高或降低,或所述蛋白序列中的突变。
21.用于检测改变的蛋白或诊断神经疾病的试剂盒,其包含试剂及使用说明书,用于检测改变的蛋白或诊断神经疾病,
其中所述蛋白选自SURF蛋白家族、SEC22蛋白家族和酰基辅酶A氧化酶。
CN200880102307A 2007-08-08 2008-08-07 蛋白错误折叠和神经保护的调节剂及使用方法 Pending CN101796196A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US96418407P 2007-08-08 2007-08-08
US60/964,184 2007-08-08
PCT/US2008/009458 WO2009020624A1 (en) 2007-08-08 2008-08-07 Regulators of protein misfolding and neuroprotection and methods of use

Publications (1)

Publication Number Publication Date
CN101796196A true CN101796196A (zh) 2010-08-04

Family

ID=40341595

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880102307A Pending CN101796196A (zh) 2007-08-08 2008-08-07 蛋白错误折叠和神经保护的调节剂及使用方法

Country Status (7)

Country Link
US (1) US20090111768A1 (zh)
EP (1) EP2185724A4 (zh)
JP (1) JP2010535505A (zh)
CN (1) CN101796196A (zh)
AU (1) AU2008284339A1 (zh)
CA (1) CA2694219A1 (zh)
WO (1) WO2009020624A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111286464A (zh) * 2020-04-06 2020-06-16 湖北大学 一种高效表达几丁质酶的工程菌及植物促生长应用

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2543735T3 (es) * 2007-10-22 2015-08-21 Becton Dickinson And Company Artículos médicos revestidos con organopolisiloxano que contienen una disolución de proteína y un tensioactivo no iónico
IT1405762B1 (it) 2010-11-25 2014-01-24 Icgeb Proteine ricombinanti con attivita' di inattivazione selettiva di proteine bersaglio
WO2017137570A1 (en) 2016-02-10 2017-08-17 Becton Dickinson France Method to evaluate the stability of a protein-based formulation
AU2018317807A1 (en) * 2017-08-16 2020-02-06 Roxiant ApS VTFT isoform of a BPIFB4 protein for use in neuronal diseases and injuries

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999027094A2 (en) * 1997-11-25 1999-06-03 Sagami Chemical Research Center HUMAN PROTEINS HAVING TRANSMEMBRANE DOMAINS AND DNAs ENCODING THESE PROTEINS
JP2007525211A (ja) * 2004-01-19 2007-09-06 テクニオン リサーチ アンド ディベロップメント ファウンデーション リミテッド パーキンソン病の診断検査
KR20070110104A (ko) * 2005-02-25 2007-11-15 더 보드 오브 트러스티즈 오브 더 유니버시티 오브 알라바마 포 앤드 온 비하프 오브 더 유니버시티 오브 알라바마 단백질 미스폴딩 및 응집 조절인자 및 그의 사용 방법
JP2009516751A (ja) * 2005-11-21 2009-04-23 ザ・ボード・オブ・トラスティーズ・オブ・ザ・ユニバーシティー・オブ・アラバマ・フォー・アンド・オン・ビハーフ・オブ・ザ・ユニバーシティー・オブ・アラバマ 神経保護のための小分子化合物を使用する方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111286464A (zh) * 2020-04-06 2020-06-16 湖北大学 一种高效表达几丁质酶的工程菌及植物促生长应用

Also Published As

Publication number Publication date
AU2008284339A1 (en) 2009-02-12
CA2694219A1 (en) 2009-02-12
JP2010535505A (ja) 2010-11-25
US20090111768A1 (en) 2009-04-30
EP2185724A4 (en) 2010-09-08
EP2185724A1 (en) 2010-05-19
WO2009020624A1 (en) 2009-02-12

Similar Documents

Publication Publication Date Title
JP2003524393A5 (zh)
JP2008537543A (ja) 神経変性状態に関与する遺伝子
CN101796196A (zh) 蛋白错误折叠和神经保护的调节剂及使用方法
KR20070110104A (ko) 단백질 미스폴딩 및 응집 조절인자 및 그의 사용 방법
WO2005023858A1 (en) Protein complexes associated with app-processing
US20040167066A1 (en) Cleavage and polyadenylation complex of precursor mrna
JP2008263949A (ja) グリシン輸送体
WO2004094651A2 (en) Novel human polypeptides encoded by polynucleotides
US20080176803A1 (en) Components of the presenilin-complex
CN101142482A (zh) 蛋白错误折叠和聚集的调节因子及其使用方法
DE60123074T3 (de) Modulation von gamma-secretase aktivität
KR20140038396A (ko) 다중돌연변이체 타우 단백질 변이체 및 인간 타우 병변을 재현하기 위한 그의 용도
EP1678326A2 (en) Genes involved in neurodegenerative disorders
US20020064828A1 (en) Method of controlling the binding of calmyrin to presenilin
WO1999060122A1 (fr) Methode d&#39;examen des maladies du snc et de criblage des remedes associes
Kiss et al. Interaction of hookworm 14-3-3 with the forkhead transcription factor DAF-16 requires intact Akt phosphorylation sites
JP2002223782A (ja) ヒトafc1
EP0996708A1 (en) Transgenic nematode model of triplet repeat neurological diseases
WO2001096371A2 (en) Adipose-related gene
US20060264610A1 (en) Protein complexes of the tip60 transcriptional activator protein
US20040213738A1 (en) CIRL3-Like proteins, nucleic acids, and methods of modulating CIRL3-L-mediated activity
Wong Cloning of SNAP-23, its tissue distribution and subcellular localization in non-neural cells
Resnick Purification and characterization of an endopeptidase that recognizes substrate secondary structure
Zhang MAP2c and MAP2d: In vitro interaction with microtubules and localization of protein kinase C phosphorylation sites
Korsgaard et al. Sodium channel rNa v 1.5 a

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20100804