CN1795269A - 用于将需要的性状迅速赋予生物的方法和系统 - Google Patents

用于将需要的性状迅速赋予生物的方法和系统 Download PDF

Info

Publication number
CN1795269A
CN1795269A CNA200480014300XA CN200480014300A CN1795269A CN 1795269 A CN1795269 A CN 1795269A CN A200480014300X A CNA200480014300X A CN A200480014300XA CN 200480014300 A CN200480014300 A CN 200480014300A CN 1795269 A CN1795269 A CN 1795269A
Authority
CN
China
Prior art keywords
cell
dna polymerase
archaeal dna
tending
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA200480014300XA
Other languages
English (en)
Inventor
古泽满
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neo Morgan Laboratory Inc
Original Assignee
Neo Morgan Laboratory Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neo Morgan Laboratory Inc filed Critical Neo Morgan Laboratory Inc
Publication of CN1795269A publication Critical patent/CN1795269A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

提供了调节细胞的遗传性状的转化率的方法,包括调节细胞的基因复制的倾向于错误的频率的步骤。提供了生产具有受调节的遗传性状的细胞的方法,包括下述步骤:(a)调节细胞的基因复制的倾向于错误的频率,和(b)繁殖得到的细胞。提供了生产具有受调节的遗传性状的生物的方法,包括下述步骤(a)调节生物的基因复制的倾向于错误的频率,和(b)繁殖得到的生物。

Description

用于将需要的性状迅速赋予生物的方法和系统
技术领域
本发明涉及迅速改变生物的遗传性状的方法,和通过该方法得到的生物和产物。
背景技术
有史以来,人类一直在尝试改变生物的遗传性状。在出现所谓的遗传工程之前,已经尝试用杂交育种等来得到具有需要的性状的生物,或者,已经由辐射随机地造成突变,和已经分离出具有改变的遗传性状的突变生物。
新发展起来的遗传工程更大程度地促进了获取具有改变的遗传性状的生物。遗传工程已经广泛地用于生产遗传地修饰的生物,其中外源基因被导入生物中。但是,仅仅向其中导入了外源基因的生物并不总能获得需要的遗传性状。与自然进化过程不同的操作可能导致意外的结果。因此,政府当局对源自遗传地修饰的生物(GMO)的食物的管理比常规食物更严格。
因此,本领域日益需要符合自然进化地将需要的遗传性状赋予生物的方法和生产这样的生物的方法。
迄今为止,已经出现了下面的已知的诱变方法。
(1)自然突变:生物在通常的环境下正常生长时发生的突变称作自然突变。认为自然突变的主要原因是DNA复制的错误和内源诱变物(核苷酸类似物)(Maki,“Shizenheni To Shufukukiko[NaturalMutation And Repair Mechanism]”,Saibo Kogaku[CellEngineering],Vol.13,No.8,pp.663-672,1994)。
(2)用辐射、诱变物等处理:通过辐射处理,例如紫外光、X-射线等,或用人工诱变物处理,例如烷化剂等,会损害DNA。这样的损害可能在DNA复制的过程中作为突变固定下来。
(3)使用PCR(聚合酶链反应):在PCR中,由于DNA是进行体外扩增,所以PCR系统缺少一部分胞内突变抑制机制。因此,可以高频率地诱导突变。如果将DNA改组(shuffling)(Stemmer,Nature,Vol.370,pp.389-391,Aug.1994)与PCR结合,则可以避免有害突变的积累,且可以在基因中积累许多有益的突变。
(4)使用突变因子(或增变株):在几乎所有的生物中,通过突变抑制机制来将自然突变的频率维持在相当低的速度。突变抑制机制包括许多涉及10个或更多个基因的阶段。突变在其中破坏了一个或多个基因的生物中高频率地发生。这些生物称作增变株。这些基因称作增变基因(Maki,同上,和Horst等,Trends in Microbiology,Vol.7,No.1,pp.29-36,Jan.1999)。
使用增变株的方法是不一致的方法(Furusawa M.和Doi H.,J.Theor.Biol.157,pp.127-133,1992和Furusawa M.和Doi H.,Genetica 103,pp.333-347,1998;日本专利公开8-163986;日本专利公开8-163987;日本专利公开9-23882;WO00/28015)。在该不一致的方法中,尚未阐明实际上生成的生物(更具体地,高等生物(例如,真核生物)是否能表现出正常的生长曲线。另外,尚未证实该不一致的方法能加速自然进化。
在模仿“高等生物”(例如,真核生物),例如具有二倍体或更多套含有多个复制位点的染色体的真核生物的不平衡突变模型时,可能发生致死的突变。尚不清楚该不一致的方法是否可以用于实际的情形中。
在模仿不平衡突变模型时,将突变随机地导入例如具有较低复制精确度的不连续链中。尚不清楚这样的突变是否有助于进化。
在尝试使用具有导入的增变基因的大肠杆菌(E.coli)突变株的抗药性实验中,已经得到了抗药的菌株。但是,仍没有提示可以任意地改变或控制进化速度的系统。
尚无实验能通过可提供进化速度测量的基因组水平的分析,来确定是否以不均衡的方式实际上插入了突变。考虑到可以容易地实现测序技术本身,可以认为还没有报道鉴别出了突变位点的实例。
发明内容
本发明的发明人已经解决了上述问题,他们发现生物的进化速度不是时间的函数,且可以通过调节生物的倾向于错误的频率来调节,并证实了具有改变的进化速度的真实生物能以与自然进化的生物基本上相同的速度增殖。根据本发明,可以证实错误阈值不会显著影响生物的进化。
在本发明的另一方面,发明人研究了具有不同复制精确度的准种(quasispecies)的错误阈值。发明人证实了无错误的和倾向于错误的聚合酶的共存会增加错误阈值,而不破坏性地遗失遗传信息。发明人还指出复制子(replicores)(复制剂)会影响错误阈值。结果,发明人发现,具有不同复制精确度的准种会降低参与生成各种突变体的选择性进化的遗传成本。
适当的进化需要遗传多样性和有利突变体的稳定繁殖。基因组的精确复制能保证稳定的繁殖,尽管在复制过程中的错误会生成遗传多样性。因此,进化的一个关键是复制精确度所固有的。复制精确度依赖于核苷酸聚合酶。认为胞内聚合酶具有相似的复制精确度。进化模型的大多数研究还已经以相似的复制精确度为基础。但是,已经证实无错误的和倾向于错误的聚合酶在自然产生的生物中共存。本发明因此能与自然相容。
本发明提供了下述内容。
1.调节细胞的遗传性状的转化率的方法,包括下述步骤:
(a)调节细胞的基因复制的倾向于错误的频率。
2.根据项目1的方法,其中存在至少2种在基因复制中起作用的倾向于错误的频率的试剂。
3.根据项目2的方法,其中至少约30%的倾向于错误的频率的试剂具有更少的倾向于错误的频率。
4.根据项目1的方法,其中在基因复制中起作用的试剂具有不同的倾向于错误的频率。
5.根据项目1的方法,其中具有更少的倾向于错误的频率的试剂基本上是无错误的。
6.根据项目2的方法,其中该倾向于错误的频率彼此存在至少101的不同。
7.根据项目2的方法,其中该倾向于错误的频率彼此存在至少102的不同。
8.根据项目2的方法,其中该倾向于错误的频率彼此存在至少103的不同。
9.根据项目1的方法,其中调节倾向于错误的频率的步骤包含调节至少一种选自下述的试剂的倾向于错误的频率:能去除异常碱基的修复试剂和能修复错配的碱基对的修复试剂,该试剂存在于细胞中。
10.根据项目1的方法,其中调节倾向于错误的频率的步骤包含提供细胞中的双链基因组DNA的一条链和另一条链之间的错误数目的差异。
11.根据项目1的方法,其中调节倾向于错误的频率的步骤包含调节细胞的DNA聚合酶的倾向于错误的频率。
12.根据项目11的方法,其中该DNA聚合酶具有校对功能。
13.根据项目11的方法,其中该DNA聚合酶包含至少一种选自下述的聚合酶:真核细胞的DNA聚合酶α、DNA聚合酶β、DNA聚合酶γ、DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。
14.根据项目1的方法,其中调节倾向于错误的频率的步骤包含调节至少一种选自下述的聚合酶的校对活性:真核细胞的DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。
15.根据项目1的方法,其中调节倾向于错误的频率包含调节原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的校对活性。
16.根据项目1的方法,其中调节倾向于错误的频率包含将DNA聚合酶变体导入细胞中。
17.根据项目16的方法,其中通过选自同源重组和使用基因导入或质粒的转化的方法,将DNA聚合酶变体导入细胞中。
18.根据项目1的方法,其中调节倾向于错误的频率包含导入原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的变体。
19.根据项目18的方法,其中该原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的变体包含缺失了其校对活性的突变。
20.根据项目1的方法,其中调节倾向于错误的频率的步骤包含将倾向于错误的频率提高到高于野生型细胞的频率。
21.根据项目12的方法,其中该DNA聚合酶的校对功能低于野生型DNA聚合酶。
22.根据项目12的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,至少1个错配的碱基的数目比野生型DNA聚合酶至少大1。
23.根据项目12的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基。
24.根据项目12的方法,其中该DNA聚合酶的校对功能能提供至少2个错配的碱基。
25.根据项目12的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,其比率为10-6
26.根据项目12的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,其比率为10-3
27.根据项目12的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,其比率为10-2
28.根据项目1的方法,其中该细胞是革兰氏阳性的或真核的细胞。
29.根据项目1的方法,其中该细胞是真核细胞。
30.根据项目1的方法,其中该细胞是单细胞的或多细胞的生物。
31.根据项目1的方法,其中该细胞是动物、植物、真菌或酵母细胞。
32.根据项目1的方法,其中该细胞是哺乳动物细胞。
33.根据项目1的方法,其中在遗传性状转化后,该细胞基本上具有与野生型细胞相同的生长。
34.根据项目1的方法,其中该细胞天然地具有至少2种聚合酶。
35.根据项目1的方法,其中该细胞天然地具有至少2种聚合酶,这至少2种聚合酶具有不同的倾向于错误的频率。
36.根据项目1的方法,其中该细胞具有至少2种聚合酶,这至少2种聚合酶中的一种参与后随链的倾向于错误的频率,且至少2种聚合酶中的另一种参与前导链的倾向于错误的频率。
37.根据项目1的方法,其中该细胞具有对环境的抗性,且转化之前的细胞不具有该抗性。
38.根据项目37的方法,其中作为参数的环境包含至少一种选自下述的因素:温度,湿度,pH,盐浓度,营养物,金属,气体,有机溶剂,压力,大气压力,粘度,流速,光强度,光波长,电磁波,辐射,重力,张力,声波,该细胞以外的细胞,化学试剂,抗生素,天然物质,心理应激和机体应激,或其组合。
39.根据项目1的方法,其中该细胞包括癌细胞。
40.根据项目1的方法,其中该细胞构成组织。
41.根据项目1的方法,其中该细胞构成生物。
42.根据项目1的方法,还包括:
在转化细胞的遗传性状后,使细胞分化成组织或生物。
43.根据项目1的方法,其中在预定条件下调节倾向于错误的频率。
44.根据项目43的方法,其中通过调节至少一种选自下述的因素来调节倾向于错误的频率:温度,湿度,pH,盐浓度,营养物,金属,气体,有机溶剂,压力,大气压力,粘度,流速,光强度,光波长,电磁波,辐射,重力,张力,声波,该细胞以外的细胞,化学试剂,抗生素,天然物质,心理应激和机体应激,或其组合。
45.生产具有受调节的遗传性状的细胞的方法,包括下述步骤:
(a)调节细胞的基因复制的倾向于错误的频率;和
(b)繁殖得到的细胞。
46.根据项目45的方法,还包括:
筛选具有需要的性状的繁殖细胞。
47.根据项目45的方法,其中存在至少2种在基因复制中起作用的倾向于错误的频率的试剂。
48.根据项目45的方法,其中至少约30%的倾向于错误的频率的试剂具有更少的倾向于错误的频率。
49.根据项目45的方法,其中在基因复制中起作用的试剂具有不同的倾向于错误的频率。
50.根据项目45的方法,其中具有更低的倾向于错误的频率的试剂基本上是无错误的。
51.根据项目45的方法,其中该倾向于错误的频率彼此存在至少101的不同。
52.根据项目45的方法,其中该倾向于错误的频率彼此存在至少102的不同。
53.根据项目45的方法,其中该倾向于错误的频率彼此存在至少103的不同。
54.根据项目45的方法,其中调节倾向于错误的频率的步骤包含调节至少一种选自下述的试剂的倾向于错误的频率:能去除异常碱基的修复试剂和能修复错配的碱基对的修复试剂,该试剂存在于细胞中。
55.根据项目45的方法,其中调节倾向于错误的频率的步骤包含提供细胞中的双链基因组DNA的一条链和另一条链之间的错误数目的差异。
56.根据项目45的方法,其中调节倾向于错误的频率的步骤包含调节细胞的DNA聚合酶的倾向于错误的频率。
57.根据项目56的方法,其中该DNA聚合酶具有校对功能。
58.根据项目56的方法,其中该DNA聚合酶包含至少一种选自下述的聚合酶:真核细胞的DNA聚合酶α、DNA聚合酶β、DNA聚合酶γ、DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。
59.根据项目45的方法,其中调节倾向于错误的频率的步骤包含调节至少一种选自下述的聚合酶的校对活性:真核细胞的DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。
60.根据项目45的方法,其中调节倾向于错误的频率包含调节原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的校对活性。
61.根据项目45的方法,其中调节倾向于错误的频率包含将DNA聚合酶变体导入细胞中。
62.根据项目61的方法,其中通过选自同源重组和使用基因导入或质粒的转化的方法,将DNA聚合酶变体导入细胞中。
63.根据项目45的方法,其中调节倾向于错误的频率包含导入原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的变体。
64.根据项目63的方法,其中该原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的变体包含仅仅缺失了其校对活性的突变。
65.根据项45的方法,其中调节倾向于错误的频率的步骤包含将倾向于错误的频率提高到高于野生型细胞的频率。
66.根据项目57的方法,其中该DNA聚合酶的校对功能低于野生型DNA聚合酶。
67.根据项目57的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,至少1个错配的碱基的数目比野生型DNA聚合酶至少大1。
68.根据项57的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基。
69.根据项目57的方法,其中该DNA聚合酶的校对功能能提供至少2个错配的碱基。
70.根据项目57的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,其比率为10-6
71.根据项目57的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,其比率为10-3
72.根据项目57的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,其比率为10-2
73.根据项目45的方法,其中该细胞是革兰氏阳性的或真核的细胞。
74.根据项目45的方法,其中该细胞是真核细胞。
75.根据项目45的方法,其中该细胞是单细胞的或多细胞的生物。
76.根据项目45的方法,其中该细胞是动物、植物、真菌或酵母细胞。
77.根据项目45的方法,其中该细胞是哺乳动物细胞。
78.根据项目45的方法,其中在遗传性状转化后,该细胞基本上具有与野生型细胞相同的生长。
79.根据项目45的方法,其中该细胞天然地具有至少2种聚合酶。
80.根据项目45的方法,其中该细胞天然地具有至少2种聚合酶,这至少2种聚合酶具有不同的倾向于错误的频率。
81.根据项目45的方法,其中该细胞具有至少2种聚合酶,这至少2种聚合酶中的一种参与后随链的倾向于错误的频率,且至少2种聚合酶中的另一种参与前导链的倾向于错误的频率。
82.根据项目45的方法,其中该细胞具有对环境的抗性,且转化之前的细胞不具有该抗性。
83.根据项目82的方法,其中作为参数的环境包含至少一种选自下述的因素:温度,湿度,pH,盐浓度,营养物,金属,气体,有机溶剂,压力,大气压力,粘度,流速,光强度,光波长,电磁波,辐射,重力,张力,声波,该细胞以外的细胞,化学试剂,抗生素,天然物质,心理应激和机体应激,或其组合。
84.根据项目45的方法,其中该细胞包括癌细胞。
85.根据项目45的方法,其中该细胞构成组织。
86.根据项目45的方法,其中该细胞构成生物。
87.根据项目45的方法,还包括:
在转化细胞的遗传性状后,使细胞分化成组织或生物。
88.根据项目45的方法,其中在预定条件下调节倾向于错误的频率。
89.根据项目88的方法,其中通过调节至少一种选自下述的因素来调节倾向于错误的频率:温度,湿度,pH,盐浓度,营养物,金属,气体,有机溶剂,压力,大气压力,粘度,流速,光强度,光波长,电磁波,辐射,重力,张力,声波,该细胞以外的细胞,化学试剂,抗生素,天然物质,心理应激和机体应激,或其组合。
90.生产具有受调节的遗传性状的生物的方法,包括下述步骤:
(a)调节生物的基因复制的倾向于错误的频率;和
(b)繁殖得到的生物。
91.通过根据项目90的方法生产的具有受调节的遗传性状的细胞。
92.根据项目91的细胞,其中该细胞基本上具有与野生型细胞相同的生长。
93.通过根据项目90的方法生产的具有受调节的遗传性状的生物。
94.根据项目93的生物,其中该生物基本上具有与野生型生物相同的生长。
95.生产能编码具有受调节的遗传性状的基因的核酸分子的方法,包括下述步骤:
(a)改变生物的基因复制的倾向于错误的频率;
(b)繁殖得到的生物;
(c)鉴别生物中的突变;和
(d)生产能编码具有鉴别出的突变的基因的核酸分子。
96.通过根据项目95的方法生产出的核酸分子。
97.生产由具有受调节的遗传性状的基因编码的多肽的方法,包括下述步骤:
(a)改变生物的基因复制的倾向于错误的频率;
(b)繁殖得到的生物;
(c)鉴别生物中的突变;和
(d)生产由具有鉴别出的突变的基因编码的多肽。
98.通过根据项目97的方法生产出的多肽。
99.生产具有受调节的遗传性状的生物的代谢物的方法,包括下述步骤:
(a)改变生物的基因复制的倾向于错误的频率;
(b)繁殖得到的生物;
(c)鉴别生物中的突变;和
(d)生产具有鉴别出的突变的代谢物。
100.通过根据项目99的方法生产出的代谢物。
101.用于调节生物的遗传性状的核酸分子,包含:能编码具有受调节的倾向于错误的频率的DNA聚合酶的核酸序列。
102.根据项目101的核酸分子,其中该DNA聚合酶是真核生物的DNA聚合酶δ或ε,或革兰氏阳性的细菌的与其对应的DNA聚合酶。
103.根据项目101的核酸分子,其中该DNA聚合酶是真核生物的DNA聚合酶δ或ε,或革兰氏阳性的细菌的与其对应的DNA聚合酶的变体,该变体包含仅仅缺失了其校对活性的突变。
104.根据项目101的核酸分子,其中该DNA聚合酶是真核生物的DNA聚合酶δ,或革兰氏阳性的细菌的与其对应的DNA聚合酶的变体,该变体包含仅仅缺失了其校对活性的突变。
105.载体,其包含根据项目101的核酸分子。
106.细胞,其包含根据项目101的核酸分子。
107.根据项目106的细胞,其中该细胞是真核细胞。
108.根据项目107的细胞,其中该真核细胞选自植物、动物和酵母。
109.根据项目106的细胞,其中该细胞是革兰氏阳性的细菌细胞。
110.根据项目106的细胞,其中该细胞用于调节遗传性状的转化率。
111.生物,其包含根据项目101的核酸分子。
112.通过根据项目106的细胞或其一部分生产的产物物质。
113.核酸分子,其包含在根据项目106的细胞或其一部分中。
114.根据项目113的核酸分子,其能编码涉及受调节的遗传性状的基因。
115.测试药物的方法,包括下述步骤:
使用根据项目106的细胞作为疾病模型,测试药物的效果;
使用野生型细胞作为对照,测试药物的效果;和
对比疾病模型和对照。
116.测试药物的方法,包括下述步骤:
使用根据项目111的生物作为疾病模型,测试药物的效果;
使用野生型生物作为对照,测试药物的效果;和
对比疾病模型和对照。
117.用于调节生物的遗传性状的转化率的至少2种聚合酶的组,其中该聚合酶具有不同的倾向于错误的频率。
118.根据项目117的组,其中至少2种聚合酶中的一种参与后随链的倾向于错误的频率,且至少2种聚合酶中的另一种参与前导链的倾向于错误的频率。
119.根据项目117的组,其中该聚合酶的组源自相同的物种。
120.用于生产具有受调节的遗传性状的生物的至少2种聚合酶的组,其中该聚合酶具有不同的倾向于错误的频率。
121.根据项目120的组,其中至少2种聚合酶中的一种参与后随链的倾向于错误的频率,且至少2种聚合酶中的另一种参与前导链的倾向于错误的频率。
122.根据项目121的组,其中该聚合酶的组源自相同的生物物种。
123.至少2种聚合酶在调节生物的遗传性状的转化率中的用途,其中该聚合酶具有不同的倾向于错误的频率。
124.至少2种聚合酶在生产具有受调节的遗传性状的生物中的用途,其中聚合酶具有不同的倾向于错误的频率。
因而,本文所述的发明使得提供符合自然进化地将需要的遗传性状赋予生物的方法的优点成为可能。
在阅读和理解了下面参考附图的详细描述后,本领域的技术人员能明白本发明的这些和其它的优点。
附图简述
图1表明,本发明实施例1的突变体和其野生型具有基本上相同的生长曲线。
图2显示了被赋予了高温抗性的本发明的实施例1。
图3A显示了被赋予了高温抗性的本发明的实施例1的照片。从po13突变株(缺少外切核酸酶的DNA聚合酶δ)分离出了能在高温生长的突变株。标记*指示亲本株(AMY128-1),且7个其它的菌落是高温抗性株。
图3B显示了被赋予了高温抗性的本发明的实施例1的另一张照片。从po12突变株(缺少外切核酸酶的DNA聚合酶ε)分离出了能在高温生长的突变株。标记*指示亲本株(AMY2-6),且7个其它的菌落是高温抗性株。
图4A显示了被赋予了高温抗性的本发明的实施例1的照片。箭标指示死亡的、且具有泡的细胞。对高温抗性株1和2进行单独的实验。在亲本株中,没有细胞能在41℃存活。通过本发明的方法得到的高温抗性株可以在41℃存活。
图4B显示了被赋予了高温抗性的本发明的实施例1的另一张照片。从啤酒糖酵母(S.cerevisiae)的po12突变株(缺少外切核酸酶活性的DNA聚合酶ε)中,分离出了能在被认为酵母不能存活的41℃高温生长的突变株。顶部显示了亲本株(AMY2-6),且其它的7个菌落是高温抗性的突变株。
图5显示了具有类似的复制精确度和不同的复制精确度的准种的实例。
图6显示了错误的突然大变动(catastrophe)。
图7显示了在各种数目的复制剂时,作为无错误的聚合酶的相对浓度的函数的错误阈值。
图8显示了基于大肠杆菌的参数的可允许的错误率的实例。
图9示意性地显示了要导入转基因小鼠中的载体。
图10显示了用于确认外源基因的PCR方法。从左依次是:有mPGK2Tg,无mPGK2Tg,有Fthl17Tg,mPGK2Tg载体,和仅仅pBluescript(对照)(对于每个,都是转基因小鼠#1),和无#2小鼠Tg,有#2小鼠Tg,#2Tg载体,和pBluescript(对于每个,都是转基因小鼠#2)。标记显示在右端。
图11显示了Cre重组酶在小鼠睾丸中的表达。a显示了mPGK2,b显示了Fthl17,且c显示了对照。线条代表50μm。
图12显示了mPGK2启动子的表达区。
图13显示了Fthl17启动子的表达区。
图14示意性地显示了靶向载体。
图15示意性地显示了组织特异性的重组反应。
图16示意性地显示了使用愈伤组织的筛选方法。
图17示意性地显示了在实施例8的ES细胞的实验中使用的载体。
图18示意性地显示了使用Cre重组酶的重组(靶向)载体。
(序列的描述)
SEQ ID NO.1:酵母DNA聚合酶δ核酸序列
SEQ ID NO.2:酵母DNA聚合酶δ氨基酸序列
SEQ ID NO.3:酵母DNA聚合酶ε核酸序列
SEQ ID NO.4:酵母DNA聚合酶ε氨基酸序列
SEQ ID NO.5:DnaQ部分序列(大肠杆菌)
SEQ ID NO.6:DnaQ部分序列(流感嗜血菌(Haemophilusinfluenzae))
SEQ ID NO.7:DnaQ部分序列(鼠伤寒沙门氏菌(Salmonellatyphimurium))
SEQ ID NO.8:DnaQ部分序列(霍乱弧菌(Vibrio cholerae))
SEQ ID NO.9:DnaQ部分序列(铜绿假单胞菌(Pseudomonasaeruginosa))
SEQ ID NO.10:DnaQ部分序列(脑膜炎奈瑟氏球菌(Neisseriameningitides))
SEQ ID NO.11:DnaQ部分序列(砂眼衣原体(Chlamydiatrachomatis))
SEQ ID NO.12:DnaQ部分序列(天蓝色链霉菌(streptomycescoelicolor))
SEQ ID NO.13:DnaQ部分序列(弗氏志贺氏菌(Shigellaflexneri)2a菌株301)
SEQ ID NO.14:PolC部分序列(金黄色葡萄球菌(Staphylococcusaureus))
SEQ ID NO.15:PolC部分序列(枯草芽孢杆菌(Bacillussubtilis))
SEQ ID NO.16:PolC部分序列(肺枝原体(Mycoplasmapulmonis))
SEQ ID NO.17:PolC部分序列(生殖道枝原体(Mycoplasmagenitalium))
SEQ ID NO.18:PolC部分序列(肺炎枝原体(Mycoplasmapneumoniae))
SEQ ID NO.19:Pol III部分序列(啤酒糖酵母)
SEQ ID NO.20:Pol II部分序列(啤酒糖酵母)
SEQ ID NO.21:Polδ部分序列(小鼠)
SEQ ID NO.22:Polε部分序列(小鼠)
SEQ ID NO.23:Polδ部分序列(人)
SEQ ID NO.24:Polε部分序列(人)
SEQ ID NO.25:Polδ部分序列(稻)
SEQ ID NO.26:Polδ部分序列(拟南芥(Arabidopsis thaliana))
SEQ ID NO.27:Polε部分序列(拟南芥)
SEQ ID NO.28:Polδ部分序列(大鼠)
SEQ ID NO.29:Polδ部分序列(牛)
SEQ ID NO.30:Polδ部分序列(大豆)
SEQ ID NO.31:Polδ部分序列(果蝇)
SEQ ID NO.32:Polε部分序列(果蝇)
SEQ ID NO.33:Polδ酵母改变的核酸序列
SEQ ID NO.34:Polδ酵母改变的氨基酸序列
SEQ ID NO.35:Polε酵母改变的核酸序列
SEQ ID NO.36:Polε酵母改变的氨基酸序列
SEQ ID NO.37:Polδ正向引物
SEQ ID NO.38:Polδ反向引物
SEQ ID NO.39:Polε正向引物
SEQ ID NO.40:Polε反向引物
SEQ ID NO.41:大肠杆菌DnaQ核酸序列
SEQ ID NO.42:大肠杆菌DnaQ氨基酸序列
SEQ ID NO.43:枯草芽孢杆菌PolC核酸序列
SEQ ID NO.44:枯草芽孢杆菌PolC氨基酸序列
SEQ ID NO.45:拟南芥Polδ氨基酸序列
SEQ ID NO.46:拟南芥Polε氨基酸序列
SEQ ID NO.47:稻Polδ核酸序列
SEQ ID NO.48:稻Polδ氨基酸序列
SEQ ID NO.49:大豆Polδ核酸序列
SEQ ID NO.50:大豆Polδ氨基酸序列
SEQ ID NO.51:人Polδ核酸序列
SEQ ID NO.52:人Polδ氨基酸序列
SEQ ID NO.53:人Polε核酸序列
SEQ ID NO.54:人Polε氨基酸序列
SEQ ID NO.55:小鼠Polδ核酸序列
SEQ ID NO.56:小鼠Polδ氨基酸序列
SEQ ID NO.57:小鼠Polε核酸序列
SEQ ID NO.58:小鼠Polε氨基酸序列
SEQ ID NO.59:大鼠Polδ核酸序列
SEQ ID NO.60:大鼠Polδ氨基酸序列
SEQ ID NO.61:牛Polδ核酸序列
SEQ ID NO.62:牛Polδ氨基酸序列
SEQ ID NO.63:果蝇Polδ核酸序列
SEQ ID NO.64:果蝇Polδ氨基酸序列
SEQ ID NO.65:果蝇Polε核酸序列
SEQ ID NO.66:果蝇Polε氨基酸序列
SEQ ID NO.67:Pold1基因的5′末端引物SpeI-5′Pold1
SEQ ID NO.68:Pold1基因的3′末端引物EcoRI-3′Pold1
SEQ ID NO.69:用于将突变导入Pold1基因的引物序列(实施例4)
SEQ ID NO.70:Pold1基因的突变的cDNA序列(实施例4)
SEQ ID NO.71:mPGK2的5′mPGK2-sacII引物
SEQ ID NO.72:mPGK2的3′mPGK2-SpeI引物
SEQ ID NO.73:Fthl17的5′Fthl17-sacII引物
SEQ ID NO.74:Fthl17的3′Fthl17-SpeI引物
SEQ ID NO.75:转基因小鼠#1的Cre-F引物
SEQ ID NO.76:转基因小鼠#1的Cre-R引物
SEQ ID NO.77:转基因小鼠#2的Neo-F引物
SEQ ID NO.78:转基因小鼠#2的Neo-R引物
SEQ ID NO.79:用于在实施例4中确认mRNA的表达的Neo-F引物
SEQ ID NO.80:用于在实施例4中确认mRNA的表达的Neo--R引物
SEQ ID NO.81:Fthl17k游的约5.7kbp序列
SEQ ID NO.82:用于扩增源自拟南芥的Polδ的Xba1-42120-F
SEQ ID NO.83:用于扩增源自拟南芥的Polδ的2g42120-Sacl-R
SEQ ID NO.84:用于扩增突变体polδ基因Polδ(D316A)的2g42120-D316A-F
SEQ ID NO.85:用于扩增突变体polδ基因Polδ(D316A)的2g42120R
SEQ ID NO.86:含有源自小鼠睾丸的Kozak序列的Pold1基因(核酸序列)
SEQ ID NO.87:含有源自小鼠睾丸的Kozak序列的Pold1基因(氨基酸序列)
SEQ ID NO.88:小鼠Polδ基因突变体(D400A)的核酸序列
SEQ ID NO.89:小鼠Polδ基因突变体(D400A)的氨基酸序列
SEQ ID NO.90:Polδ(Atlg42120)的核酸序列
SEQ ID NO.91:Polδ(Atlg42120)的氨基酸序列
SEQ ID NO.92:突变体polδ基因Polδ(D316A)(核酸序列)
SEQ ID NO.93:突变体polδ基因Polδ(D316A)(氨基酸序列)
SEQ ID NO.94:455-bp mPGK2启动子片段
SEQ ID NO.95:Fthl17基因上游的5725-bp DNA片段
实施本发明的最佳模式
(发明详述)
在下文中,将参考附图,以解释性的实例描述本发明。
应当理解,在本说明书中,单数形式的“一个(a)”、“一种(an)”和“该(the)”包括复数的指示物,除非上下文另有清楚的说明。还应当理解,如本文所用的术语具有本领域一般使用的定义,除非另有说明。
(术语)
在本说明书和下面的权利要求书中,将提及许多术语,它们应当定义为具有下述的含义:
术语“生物”在这里使用其在本领域最广泛的含义,指能实现生命过程的机体,其具有各种性质,例如,代表性地,细胞结构,增殖(自我繁殖),生长,调节,代谢,修复能力,等。一般地,生物具有基本性质,例如由核酸控制的遗传和其中涉及蛋白控制的代谢的增殖。生物包括病毒,原核生物,真核生物(例如,单细胞生物(例如,酵母,等)和多细胞生物(例如,植物,动物,等)),等。应当明白,本发明的方法可以应用于任何生物,包括高等生物,例如革兰氏阳性的细菌,真核生物,等。
术语“真核生物”在这里使用其普通含义,指具有带有核膜的明显核结构的生物。真核生物的实例包括但不限于:单细胞生物(例如,酵母,等),植物(例如,稻,小麦,玉米,大豆,等),动物(例如,小鼠,大鼠,牛,马,猪,猴,等),昆虫(例如,蝇,蚕,等),等。酵母、线虫、果蝇、蚕、稻、小麦、大豆、玉米、拟南芥、人、小鼠、大鼠、牛、马、猪、蛙、鱼(例如,斑马鱼,等)可以在这里用作模型,但是用途不限于此。
如本文所使用的,术语“原核生物”在这里使用其普通含义,指由不具有明显的核结构的细胞构成的生物。原核生物的实例包括革兰氏阴性的细菌(例如,大肠杆菌,沙门氏菌属(Salmonella),等),革兰氏阳性的细菌(例如,枯草芽孢杆菌,放线菌,葡萄球菌属(Staphylococcus),等),蓝细菌,氢细菌,等。代表性地,除了大肠杆菌以外,革兰氏阳性的细菌可以用在这里,但是用途不限于此。
术语“单细胞生物”在这里使用其普通含义,指由单个细胞组成的生物。单细胞生物包括真核生物和原核生物。单细胞生物的实例包括但不限于:细菌(例如,大肠杆菌,枯草芽孢杆菌,等),酵母,蓝细菌,等。
如本文所使用的,术语“多细胞生物”指由多个细胞(一般地,多个不同类型的细胞)组成的单个生物。由于多细胞生物是由不同类型的细胞组成的,所以维持该生物的生命需要高水平的与单细胞生物不同的稳态机制。大多数真核生物是多细胞生物。多细胞生物包括动物,植物,昆虫,等。应当指出,本发明可以令人惊奇地应用于多细胞生物。
术语“动物”在这里使用其最广泛的含义,指脊椎动物和无脊椎动物(例如,节肢动物)。动物的实例包括但不限于:任何哺乳纲(Mammalia),鸟纲(Aves),爬行纲(Reptilia),两栖纲(Amphibia),鱼纲(Pisces),昆虫纲(Insecta),蠕虫纲(Vermes),等。优选地,动物可以是但不限于:脊椎动物(例如,盲鳗目(Myxiniformes),七鳃鳗目(Petronyzoniformes),软骨鱼纲(Chondrichthyes),硬骨鱼纲(Osteichthyes),两栖动物,爬行动物,鸟类,哺乳动物,等)。在特定的实施方案中,动物可以是但不限于:哺乳动物(例如,单孔目(monotremata),有袋目(marsupialia),无齿类动物(edentate),皮翼目(dermoptera),翼手目(chiroptera),食肉动物,食虫动物,长鼻目(proboscidae),奇蹄目(perissodactyla),偶蹄目(artiodactyla),管齿目(tubulidentata),鳞甲目(pholidota),海牛目(sirenia),鲸类动物,灵长目(primates),啮齿目(rodentia),兔形目(lagomorpha),等)。更优选地,动物可以是但不限于:灵长目(例如,黑猩猩,日本猴,人)或任何可以用作模型动物的物种(例如,奇蹄目,偶蹄目,啮齿目(小鼠,等),兔形目,等)。本发明首次证实了本发明的方法可以应用于任何生物。应当明白,任何生物都可以用于本发明。
如本文所使用的,术语“植物”指属于植物界(Plantae)的特征如下的任何生物:叶绿素,硬细胞壁,存在丰富的永久的未成熟组织,和没有移动能力。代表性地,术语“植物”指能形成细胞壁和通过叶绿素进行同化的开花植物。术语“植物”指任何单子叶植物和双子叶植物。优选的植物包括但不限于:有用的植物,例如稻科的单子叶植物(例如,小麦,玉米,稻,大麦,高粱,等)。优选的植物的实例包括烟草,青椒,茄子,瓜,番茄,甘薯,卷心菜,韭菜,椰菜,胡萝卜,黄瓜,柑桔,大白菜,莴苣,桃子,马铃薯,和苹果。优选的植物不限于农作物,还包括开花植物,树,草坪,野草,等。除非另有说明,术语“植物”指任意的植物体,植物器官,植物组织,植物细胞和种子。植物器官的实例包括根、叶、茎、花等。植物细胞的实例包括愈伤组织、悬浮培养的细胞等。本发明首次证实了本发明的方法可以应用于任何生物。应当明白,任何生物都可以用于本发明。
在特定的实施方案中,可以用于本发明中的植物种类的实例包括但不限于下述科的植物:茄科(Solanaceae),禾本科(Poaceae),十字花科(Brassicaceae),蔷薇科(Rosaceae),豆科(Leguminosae),葫芦科(Cucurbitaceae),唇形科(Lamiaceae),百合科(Liliaceae),藜科(Chenopodiaceae)和伞形科(Umbelliferae)。
如本文所使用的,术语“遗传性状”也称作基因型,指基因控制的生物的形态要素。遗传性状的实例包括但不限于:对环境参数的抗性,所述参数例如,温度,湿度,pH,盐浓度,营养物,金属,气体,有机溶剂,压力,大气压力,粘度,流速,光强度,光波长,电磁波,辐射,重力,张力,声波,其它生物,化学试剂,抗生素,天然物质,心理应激,机体应激,等。
如本文所使用的,术语“基因”指具有预定长度的序列的细胞中存在的核酸。基因可以定义或不定义遗传性状。如本文所使用的,术语“基因”一般指存在于基因组中的序列,且可以指染色体外的序列、线粒体中的序列等。基因一般排列在染色体上的特定序列中。能定义蛋白的初级结构的基因称作结构基因。能调节结构基因的表达的基因称作调节基因(例如,启动子)。除非另有说明,本文中的基因包括结构基因和调节基因。因此,例如,术语“DNA聚合酶基因”一般指DNA聚合酶的结构基因和它的转录和/或翻译调节序列(例如,启动子)。在本发明中,应当明白,转录和/或翻译的调节序列以及结构基因可以用作本发明靶向的基因。如本文所使用的,“基因”可以指“多核苷酸”、“寡核苷酸”、“核酸”和“核酸分子”和/或“蛋白”、“多肽”、“寡肽”和“肽”。如本文所使用的,“基因产物”包括“多核苷酸”、“寡核苷酸”、“核酸”和“核酸分子”和/或由基因表达的“蛋白”、“多肽”、“寡肽”和“肽”。本领域的技术人员根据上下文能够明白基因产物是什么。
如本文所使用的,与基因有关的术语“复制”是指遗传材料、DNA或RNA再生它自身的拷贝,其中亲本核酸链(DNA或RNA)用作形成新的具有与亲本核酸相同的结构和功能的核酸分子(分别是DNA或RNA)的模板。在真核细胞中,会形成包含复制酶(DNA聚合酶α)的复制起始复合物,以在双链DNA分子的许多复制起点处启动复制,且复制反应从复制起点向相反的反向进行。根据细胞周期控制复制的起始。在酵母中,将自主复制序列视作复制起点。在原核细胞(例如大肠杆菌等)中,复制起点(ori)存在于基因组的双链环状DNA分子上。复制起始复合物在ori形成,且反应从ori向相反的反向进行。复制起始复合物具有包含10个或更多个蛋白元件(包括复制酶(DNA聚合酶III))的复杂结构。在复制反应中,部分地重绕双链DNA的螺旋结构;合成短的DNA引物;从引物的3′-OH基延伸新的DNA链;在互补链模板上合成冈崎片段;连接冈崎片段;进行校对,以比较新复制的链和模板链;等。因而,通过许多反应步骤进行复制反应。
储存着生物的遗传信息的基因组DNA的复制机制详细地描述在例如Kornberg A.和Baker T.,“DNA Replication”,New York,Freeman,1992中。一般地,将能使用DNA的一条链作为模板合成互补链、形成双链DNA的酶称作DNA聚合酶(DNA复制酶)。DNA复制需要至少2种DNA聚合酶。这是因为,一般地,同时合成前导链和后随链。从DNA上的称作复制起点(ori)的预定位置处开始DNA复制。例如,细菌在它们的环状基因组DNA上具有至少一个双向复制起点。因而,一般地,在其复制过程中,需要4种DNA聚合酶同时作用于一个基因组DNA上。在本发明中,优选地,可以仅仅在前导链和后随链中的一条上有利地调节复制错误,或者,这2条链之间的复制错误的频率可以有利地存在差异。
如本文所使用的,术语“复制错误”指在基因(DNA,等)复制过程中导入错误的核苷酸。一般地,复制错误的频率低至108至1012配对中出现一个。复制错误频率较低的原因是,复制过程中的核苷酸添加是由模板DNA和导入的核苷酸之间的互补碱基配对决定的;酶(例如DNA聚合酶δ、ε等)的3′→5′外切核酸酶活性(校对功能)能识别和去除错配的与模板不互补的核苷酸;等。因此,在本发明中,通过破坏特定的碱基对的形成、校对功能等,可以调节复制中的倾向于错误的频率。
如本文所使用的,与遗传性状有关的术语“转化率”指在原始生物繁殖或分裂后,原始生物和其祖先之间的遗传性状之间发生差异的比率。这样的转化率可以例如由在每次分裂或每代中具有遗传性状变化的生物的数目代表。这样的遗传性状的转化在本文中可替换地称作“进化”。
如本文所使用的,与遗传性状的转化率有关的术语“调节”是指,通过人工操作,而不是通过自然产生的因素,改变遗传性状的转化率。因此,调节遗传性状的转化率包括减慢和加速遗传性状的转化率。通过减慢生物的遗传性状的转化率,该生物基本上不改变遗传性状。换言之,通过减慢该生物的遗传性状的转化率,使该生物的进化速度变慢。相反地,通过加速生物的遗传性状的转化率,该生物比正常水平更频繁地改变遗传性状。换言之,通过加速生物的遗传性状的转化率,使该生物的进化速度变快。
如本文所使用的,术语“无错误的”指在基因(DNA,等)的复制中存在较少的或基本上没有错误的性质。校对酶(例如,DNA聚合酶δ和ε,等)的校对功能的精确度会影响无错误的水平。
如本文所使用的,术语“倾向于错误的”指在基因(DNA,等)的复制中可能发生错误的性质(即,可能发生复制错误)。校对酶(例如,DNA聚合酶δ和ε,等)的校对功能的精确度会影响倾向于错误的水平。
倾向于错误的状态和无错误的状态可以绝对地分开(即,可以用倾向于错误的频率的水平等决定),或者,可以相对地分开(即,当在基因复制中起作用的2个或更多个试剂是分开的时,将具有更高的倾向于错误的频率的试剂归类为倾向于错误的基因,而将具有更低的倾向于错误的频率的试剂归类为无错误的试剂)。
如本文所使用的,术语“倾向于错误的频率”指倾向于错误的性质的水平。倾向于错误的频率可以由例如基因序列中的突变的绝对数目(突变本身的数目)或基因序列中的突变的相对数目(突变的数目与全长的比率)来表示。或者,当提及特定的生物或酶时,倾向于错误的频率可以由每次繁殖或分裂时基因序列中的突变的绝对或相对数目来表示。除非另有说明,倾向于错误的频率是由一次复制过程中基因序列中的错误数目来表示的。倾向于错误的频率在本文中可以称作“精确度”,作为相反的量度。一致的倾向于错误的频率是指,当提及在许多基因的复制中起作用的试剂(聚合酶,等)时,它们的倾向于错误的频率基本上彼此相等。相反地,不同的倾向于错误的频率是指,在许多基因的复制中起作用的许多试剂(聚合酶,等)中存在显著的倾向于错误的频率的差异。
如本文所使用的,与倾向于错误的频率有关的术语“调节”是指,改变倾向于错误的频率。这样调节倾向于错误的频率包括增加和减少倾向于错误的频率。调节倾向于错误的频率的方法的实例包括但不限于:修饰具有校对功能的DNA聚合酶,插入能抑制或阻抑复制过程中的聚合或延伸反应的试剂,抑制或阻抑能促进这些反应的因素,缺失一个或多个碱基,缺失双链体DNA修复酶,修饰能去除异常碱基的修复试剂,修饰能修复错配的碱基对的修复试剂,降低复制本身的精确度,等。可以在双链DNA的2条链或1条链上调节倾向于错误的频率。优选地,可以有利地在1条链上调节倾向于错误的频率。这是因为,会减少不利的突变发生。
如本文所使用的,术语“DNA聚合酶”或“Po1”指能从4个脱氧核糖核苷5′-三磷酸释放出焦磷酸、从而聚合DNA的酶。DNA聚合酶反应需要模板DNA、引物分子、Mg2+等。将互补的核苷酸依次添加到引物的3′-OH末端,以延伸分子链。
已知大肠杆菌具有至少3种DNA聚合酶I、II和III。DNA聚合酶I参与修复受损的DNA、基因重组和DNA复制。认为DNA聚合酶II和III具有辅助功能。这些酶的每种都具有包含几个蛋白的亚基结构,且根据结构分成核心酶或全酶。核心酶由α、ε和θ亚基组成。全酶除了α、ε和θ亚基以外,包含τ、γ、δ和β组分。已知真核细胞具有许多DNA聚合酶。在高等生物中,存在许多DNA聚合酶α、β、γ、δ、ε等。在动物中,存在已知的聚合酶:DNA聚合酶α,它参与核DNA的复制,并在细胞生长期的DNA复制中起作用;DNA聚合酶β,它参与核中的DNA修复,并在生长期和静止期的受损DNA的修复中起作用,等;DNA聚合酶γ,它参与复制和修复线粒体DNA,且具有外切核酸酶活性);DNA聚合酶δ,它参与DNA延长,且具有外切核酸酶活性;DNA聚合酶ε,它参与复制后随链之间的缺口,且具有外切核酸酶活性;等。
在革兰氏阳性的细菌、革兰氏阴性的细菌、真核生物等中具有校对功能的DNA聚合酶中,认为具有ExoI基序的氨基酸序列在3′→5′外切核酸酶活性中心起作用,且会影响校对功能的精确度。
SEQ ID NO.5:DnaQ:8-QIVLDTETTGMN-19(大肠杆菌);
SEQ ID NO.6:DnaQ:7-QIVLDTETTGMN-18(流感嗜血菌);
SEQ ID NO.7:DnaQ:8-QIVLDTETTGMN-19(鼠伤寒沙门氏菌);
SEQ ID NO.8:DnaQ:12-IVVLDTETTGMN-23(霍乱弧菌);
SEQ ID NO.9:DnaQ:3-SVVLDTETTGMP-14(铜绿假单胞菌);
SEQ ID NO.10:DnaQ:5-QI ILDTETTGLY-16(脑膜炎奈瑟氏球菌);
SEQ ID NO.11:DnaQ:9-FVCLDCETTGLD-20(砂眼衣原体);
SEQ ID NO.12:DnaQ:9-LAAFDTETTGVD-20(天蓝色链霉菌);
SEQ ID NO.13:dnaQ:11-QIVLDTETTGMN-22(弗氏志贺氏菌2a菌株301);
SEQ ID NO.14:PolC:420-YVVFDVETTGLS-431(金黄色葡萄球菌)
SEQ ID NO.15:PolC:421-YVVFDVETTGLS-432(枯草芽孢杆菌);
SEQ ID NO.16:PolC:404-YVVYDIETTGLS-415(肺枝原体);
SEQ ID NO.17:PolC:416-FVIFDIETTGLH-427(生殖道枝原体);
SEQ ID NO.18:PolC:408-FVIFDIETTGLH-419(肺炎枝原体);
SEQ ID NO.19:PolIII:317-IMSFDIECAGRI-328(啤酒糖酵母);
SEQ ID NO.20:PolII:286-VMAFDIETTKPP-297(啤酒糖酵母);
SEQ ID NO.21:Polδ:310-VLSFDIECAGRK-321(小鼠);
SEQ ID NO.22:Polε:271-VLAFDIETTKLP-282(小鼠);
SEQ ID NO.23:Polδ:312-VLSFDIECAGRK-323(人);
SEQ ID NO.24:Polε:271-VLAFDIETTKLP-282(人);
SEQ ID NO.25:Polδ:316-ILSFDIECAGRK-327(稻);
SEQ ID NO.26:Polδ:306-VLSFDIECAGRK-317(拟南芥);
SEQ ID NO.27:Polε:235-VCAFDIETVKLP-246(拟南芥);
SEQ ID NO.28:Polδ:308-VLSFDIECAGRK-319(大鼠);
SEQ ID NO.29:Polδ:311-VLSFDIECAGRK-322(牛);
SEQ ID NO.30:Polδ:273-ILSFDIECAGRK-284(大豆);
SEQ ID NO.31:Polδ:296-ILSFDIECAGRK-307(果蝇);和
SEQ ID NO.32:Polε:269-VLAFDIETTKLP-280(果蝇)。
显然,具有校对功能的DNA聚合酶具有相当保守的天冬氨酸(例如,在人DNA聚合酶δ的位置316)和谷氨酸(例如,在人DNA聚合酶δ的位置318)。含有这样的天冬氨酸和谷氨酸的区域在本文中可以视作校对功能的活性部位。
在革兰氏阴性细菌(例如大肠杆菌)中,存在2种DNA聚合酶蛋白,即具有外切核酸酶活性的分子和具有DNA合成活性的分子。因此,通过调节外切核酸酶活性,可以调节校对功能。
但是,在革兰氏阳性细菌(例如,枯草芽孢杆菌,等)和真核生物(例如,酵母,动物,植物,等)中,一种DNA聚合酶具有DNA合成活性和外切核酸酶活性。因此,需要能在调节外切核酸酶活性的同时保留正常的DNA合成活性的分子来调节校对功能。本发明提供了各种真核生物和革兰氏阳性细菌的DNA聚合酶,其能在调节外切核酸酶活性的同时保留正常的DNA合成活性,且其可以用于生物的进化中。由此,得到了与大肠杆菌不同的且意外的效果。因此,可以认为,通过发现上述的校对功能的活性部位在真核生物和革兰氏阳性细菌、特别是在真核生物中被出乎意料地确定,本发明部分地得以实现。而且,本发明的重大作用是获得遗传性状,其在下面的实例中予以出乎意料地显示。
已经在细菌等以及人中发现了许多倾向于错误的DNA聚合酶。许多复制的DNA聚合酶一般具有校对功能,即,通过3′→5′外切核酸酶活性去除错误,以进行无错误的复制。但是,倾向于错误的DNA聚合酶不具有校对功能,且不能绕过DNA损害,从而导致突变。倾向于错误的DNA聚合酶的存在会参与癌症的发作、进化、抗体进化等。许多DNA聚合酶具有变成倾向于错误的可能性。通过破坏它们的校对功能,可以使这些DNA聚合酶倾向于错误。因此,通过修饰上述的校对功能的活性部位,可以调节复制的精确度。通过使用该模型,一旦得到了新的性质,就可以有利地无畸形地进化。在这方面,与原始的不一致模型相比,本发明可以得到意外的不利和效果。
在准种理论中,Eigen提出了一个进化模型,其中仅仅考虑了倾向于错误的复制(M.Eigen,Naturwissenschaften 58,465(1971),等)。该准种理论使用各种修饰。可以将准种定义为最适序列的稳定的系统,且其突变体有选择地分布在序列空间中的最适序列周围。自然选择不是发生在单一序列中,而是在整个准种分布中。如下发生准种的进化:具有比主序列更高的适合度的突变体出现在准种中,该突变体有选择地替换旧的主序列,然后新的准种分布围绕着突变体组织。
准种理论认为和总结出,存在维持遗传信息的错误阈值。因此,常规地,认为准种仅仅可以在该阈值之下进化(M.Eigen等,Adv.Chem.Phys.75,149(1989))。这意味着,进化速度的上限受到错误阈值的上限的限制。准种理论在RNA病毒的研究中似乎得到了证实,其以接近错误阈值的高速度进化。但是,认为在突变试剂的表型中具有增加的错误率的试剂在该过程中起重要作用。
尽管细菌的基因组具有单一的复制起点,但真核生物的基因组具有许多复制起点。这意味着,基因组的序列含有许多复制单元(复制剂,复制子)。因此,许多聚合酶同时参与基因组的复制。在本发明中,可以考虑许多复制剂对错误阈值的影响。
在一个优选的实施方案中,通过将能破坏3′→5′外切核酸酶活性的突变导入到能编码DNA聚合酶的基因(DNA聚合酶基因)中,可以提供能编码具有降低的校对功能(即,更高的倾向于错误的频率)的DNA聚合酶的核酸分子和多肽。注意到在单一的DNA聚合酶基因(PolC,POL2,CDC2,等)中,3′→5′外切核酸酶活性(校对功能)是包含在具有DNA聚合活性的分子中的(例如,真核生物,革兰氏阳性细菌,等),或者是由与能编码DNA聚合活性的基因(例如,dnaE)不同的基因(例如,dnaQ)编码的(例如,革兰氏阴性细菌,等)(Kornberg A.和Baker T.,“DNA Replication”,New York,Freeman,1992)。基于对上述性质的理解,本领域的技术人员可以根据本发明调节倾向于错误的频率。例如,在真核生物中,优选地将能改变校对功能而基本上不改变DNA聚合活性的突变导入DNA聚合酶中。在该情况中,改变了2个与上述的校对功能有关的酸性氨基酸(优选地,不保守的取代(例如,丙氨酸、缬氨酸等的取代))(Derbyshire等,EMBO J.10,pp.17-24,Jan.1991;Fijalkowska和Schaaper,“Mutants in theExo I motif of Escherichia coli dnaQ:Defective proofreadingand inviability due to error catastrophe”,Proc.Natl.Acad.Sci.USA,Vol.93,pp.2856-2861,Apr.1996)。本发明不限于此。
如本文所使用的,术语“校对功能”指检测和修复细胞DNA中的损伤和/或错误的功能。通过在脱嘌呤位点或脱嘧啶位点插入碱基,或者,用脱嘌呤-脱嘧啶(A-P)内切核酸酶切割一条链,然后用5′→3′外切核酸酶去除该位点,可以实现这样的功能。在去除的部分,用DNA聚合酶合成和补充DNA,并通过DNA连接酶将合成的DNA与正常的DNA相连接。该反应称作切除修复。对于由烷化剂、异常的碱基、辐射、紫外光等的化学修饰造成的受损DNA,通过上述的反应,在修复之前用DNA糖苷酶去除受损的部分(期外DNA合成)。具有这样的校对功能的DNA聚合酶的实例包括但不限于真核生物等的DNA聚合酶δ、DNA聚合酶ε等。如本文所使用的,术语“保真性”也可以用于代表校对功能的水平。术语“保真性”指DNA复制精确度。普通的DNA聚合酶一般具有高水平的保真性。由于修饰具有降低的校对功能的DNA聚合酶可能具有低水平的保真性。
DNA聚合酶的上述校对功能描述在,例如,Kunkel,T.A.:J.Biol.Chem.,260,12866-12874(1985);Kunkel,T.A.,Sabotino,R.D.& Bambara,R.A.:Proc.Natl.Acad.Sci.USA,84,4865-4869(1987);Wu,C.I.& Maeda,N.:Nature,327,167-170(1987);Roberts,J.D.& Kunkel,T.A.:Proc.Natl.Acad.Sci.USA,85,7064-7068(1988);Thomas,D.C.,Fitzgerald,M.P.& Kunkel,T.A.:Basic Life Sciences,52,287-297(1990);Trinh,T.Q.& Siden,R.R.,Nature,352,544-547(1991);Weston-Hafer,K.& Berg,D.E.,Genetics,127,649-655(1991);Veaute,X.& Fuchs,R.P.P.:Science,261,598-600(1993);Roberts,J.D.,Izuta,S.,Thomas,D.C.& Kunkel,T.A.:J.Biol.Chem.,269,1711-1717(1994);Roche,W.A.,Trinh,T.Q.& Siden,R.R.,J.Bacteriol.,177,4385-4391(1995);Kang,S.,Jaworski,A.,Ohshirna,K.& Wells,Nat.Genet.,10,213-218(1995);Fijalkowska,I.J.,Jonczyk,P.,Maliszewska-Tkaczyk,M.,Bialoskorska,M.& Schaaper,R.M.,Proc.Natl.Acad.Sci.USA.,95,10020-10025(1998);Maliszewska-Tkaczyk,M.,Jonezyk,P.,Bialoskorska,M.,Schaaper,M.& Fijalkowska,I.:Proc.Natl.Acad.Sci.USA,97,12678-12683(2000);Gwel,D.,Jonezyk,P.,Bialoskorska,M.,Schaaper,R.M.& Fijalkowska,I.J.:Mutation Research,501,129-136(2002);Roberts,J.D.,Thomas,D.C.& Kunkel,T.A.:Proc.Natl.Acad.Sci.USA,88,3465-3469(1991);Roberts,J.D.,Nguyen,D.&Kunkel,T.A.:Biochemistry,32,4083-4089(1993);Francino,M.P.,Chac,L.,Riley,M.A.& Ochman,H.:Science,272,107-109(1996);A.Boulet,M.Simon,G.Faye,G.A.Bauer &P.M.Burgers,EMBO J.,8,1849-1854,(1989);Morrison A.,ArakiH.,Clark A.B.,Hamatake R.K.,& Sugino A.,Cell,62(6),1143-1151(1990),等。
如本文所使用的,术语真核生物的“DNA聚合酶δ”指参与DNA延长的酶,认为其具有产生校对功能的外切核酸酶活性。代表性的DNA聚合酶δ具有如SEQ ID NO.1和2所述的序列(分别是核酸序列和氨基酸序列;Polδ:X61920 gi/171411/gb/M61710.1/YSCDPB2[171411])。通过修饰如SEQ ID NO.2所述的氨基酸序列的位置322处的氨基酸,可以调节该DNA聚合酶δ的校对功能。DNA聚合酶δ描述在Simon,M.等,EMBO J.,10,2163-2170,1991中,其内容在这里引作参考。DNA聚合酶δ的实例包括但不限于下述的:拟南芥(SEQID NO.45),稻(SEQ ID NO.47和48),大豆(SEQ ID NO.49和50),人(SEQ ID NO.51和52),小鼠(SEQ ID NO.55和56),大鼠(SEQ IDNO.59和60),牛(SEQ ID NO.61和62),果蝇(SEQ ID NO.63和64),等。
如本文所使用的,术语真核生物的“DNA聚合酶ε”指参与复制后随链之间的缺口的酶,认为其具有产生校对功能的外切核酸酶活性。代表性的DNA聚合酶ε具有如SEQ ID NO.3和4所述的序列(分别是核酸序列和氨基酸序列;Polε:M60416gi/171408/gb/M60416.1/YSCDNA POL[171408])。通过修饰如SEQ IDNO.4所述的氨基酸序列的位置391处的氨基酸,可以调节该DNA聚合酶ε的校对功能。DNA聚合酶ε描述在,例如,Morrison,A.等,MGG.242,289-296,1994;Araki H.,等.Nucleic Acids Res.19,4857-4872,1991;和Ohya T.,等,Nucleic Acids Res.28,3846-3852,2000,其内容在这里引作参考。DNA聚合酶ε的实例包括但不限于下述的:拟南芥(SEQ ID NO.46),人(SEQ ID NO.53和54),小鼠(SEQID NO.57和58),果蝇(SEQ ID NO.65和66),等。
根据HUGO分类,将DNA聚合酶δ和ε分别称作POLD1/POL3和POLE/POL2。在本文中可以使用两种命名。
其它的DNA聚合酶描述在,例如,Lawrence C.W.等,J.Mol.Biol.,122,1-21,1978;Lawrence C.W.等,Genetics 92,397-408;Lawrence C.W.等,MGG,195,487-490,1984;Lawrence G.W.等,MGG.200,86-91,1985(DNA聚合酶β和DNA聚合酶ζ);Maher V.M.等,Nature 261,593-595,1976;McGregor,W.G.等,Mol.Cell.Biol.19,147-154,1999(DNA聚合酶η);Strand M.等,Nature 365,275-276,1993;Prolla T.A.等,Mol.Cell.Biol.15,407-415,1994;Kat A.等,Proc.Natl.Acad.Sci.USA 90,6424-6428;Bhattacharyya N.P.等,Proc.Natl.Acad.Sci.USA 91,6319-6323,1994;Faber F.A.等,Hum.Mol.Genet.3,253-256,1994;Eshleman,J.R.等,Oncogene 10,33-37,1995;Morrison A.等,Proc.Natl.Acad.Sci.USA 88,9473-9477,1991;Morrison A.等,EMBO J.12,1467-1473,1993;Foury F.等,EMBO J.11,2717-2726,1992(DNA聚合酶λ,DNA聚合酶μ,等);等,其内容在这里引作参考。
如本文所使用的,与能编码DNA聚合酶等的基因和生物(例如,酵母,等)有关的术语“野生型”以其最广泛的含义指,具有自然产生的能编码DNA聚合酶等的基因和生物(例如,酵母,等)所来源的物种的大多数成员的特征的类型。因此,一般地,可以认为在某些物种中首先鉴别出的能编码DNA聚合酶等的基因和生物(例如,酵母,等)的类型是野生型。野生型也称作“自然的标准型”。野生型DNA聚合酶δ具有如SEQ ID NO.1和2所述的序列。野生型DNA聚合酶ε具有如SEQ ID NO.3和44所述的序列。具有如SEQ ID NO.41-66所述的序列的DNA聚合酶也是野生型。野生型生物可能具有正常的酶活性、正常的性状、正常的行为、正常的生理学、正常的繁殖和正常的基因组。
如本文所使用的,与酶的校对功能等有关的术语“低于野生型”是指,该酶的校对功能低于野生型酶的校对功能(即,在该酶校对加工后保留的突变的数目大于野生型酶的)。通过相对的或绝对的表达,可以进行与野生型的对比。使用倾向于错误的频率等,可以进行这样的对比。
如本文所使用的,与基因有关的术语“突变”是指改变了该基因的序列,或者指改变的该基因的核酸或氨基酸序列的状态。例如,术语“突变”在本文中指会导致校对功能的改变的基因的序列中的改变。除非另有定义,术语“突变”和“变异”在本说明书中具有相同的含义。
为了生产它们的有用的突变体,最常见地对生物进行诱变。术语“突变”一般指能编码基因的碱基序列中的变化,包含DNA序列中的变化。根据其对具有突变的个体的影响,将突变大致分成下面的3组:A)中性的突变(大多数突变都归入这组中,且基本上对生物的生长和代谢没有影响);B)有害的突变(它的频率低于中性的突变的。这类突变会抑制生物的生长和代谢。有害的突变包括会破坏对于生长必须的基因的致死的突变。在微生物的情况中,有害的突变的比例一般是总突变的约1/10至1/100,尽管因物种而异);和C)有益的突变(该突变对于生物的育种是有益的。其发生频率明显低于中性的突变。因此,需要大量的生物和较长的时间段来得到具有有益的突变的个别生物。通过单一突变难以得到足以对生物进行育种的效果,且经常需要积累许多有益的突变)。
如本文所使用的,与某种生物有关的术语“生长”指个体生物的量上的增加。通过测量值(例如身体大小(身高)、体重等)的量上的增加,可以识别出生物的生长。个体的量上的增加依赖于每个细胞的增大和细胞数目的增加。
如本文所使用的,与生物有关的术语“基本上相同的生长”是指,该生物的生长速度与参考生物(例如,转化前的生物)相比基本上没有变化。认为不是显著改变的生长速度的示例性的范围包括但不限于一般生长的统计分布中的1个偏差的范围。在本发明的生物中,术语“基本上相同的生长”是指,例如,(1)祖先的数目没有显著变化;(2)尽管形态学有所变化,但基本上没有产生与一般的人工突变不同的紊乱。尽管有相当高的突变率,但认为外观是“漂亮的”(尽管该特征与生长无直接关系,但该特征是通过本发明的方法建立的突变体特有的);和(3)一旦获得就不会退化的性状、基因型或表型。
如本文所使用的,术语“抗药性”是指对药物(包括生理活性物质,例如噬菌体,细菌素,等)的耐受性或抗性。当改变了它的药物受体时,或者改变了许多参与药物作用的过程中的一个或多个时,敏感的宿主就会获得抗药性。或者,当敏感的宿主获得使抗生素本身失活的能力时,就可以获得抗药性。在抗药的生物中,染色体DNA中的突变可能改变药物发生作用的酶和/或核糖体蛋白,从而使得通常浓度的药物不再有效。或者,生物可能获得来自其它生物的抗药的质粒(例如,R质粒),从而获得使药物失活的酶活性。或者,可能降低药物的膜渗透性,以得到对药物的抗性。本发明不限于此。
如本文所使用的,术语“癌细胞”具有与术语“恶性肿瘤细胞”(包括肉瘤)相同的含义,指具有永久增殖能力的且不灭的细胞。癌细胞会获得永久增殖能力,且以以下方式变得不灭。正常的细胞会在基因水平上发生某些不可逆的变化。结果,正常的细胞转化成了异常的细胞,即癌细胞。
如本文所使用的,与生物有关的术语“生产”是指生成了个体生物。
如本文所使用的,与生物有关的术语“繁殖”是指,从亲本个体生成了下一代的新个体。繁殖包括但不限于:自然倍增,增殖,等;通过人工技术进行的人工倍增,增殖,等,例如克隆技术(核移植,等)。繁殖技术的实例包括但不限于:在植物的情况下,单个细胞的培养;插条的嫁接;插条的生根;等。繁殖的生物一般具有源自它们的亲本的遗传性状。有性繁殖的生物一般具有源自两性的遗传性状。一般地,这些遗传性状以基本上相等的比例源自两性。无性繁殖的生物具有源自它们的亲本的遗传性状。
术语“细胞”在本文中使用其在本领域最广泛的含义,指多细胞生物的组织的结构单元,其能自我复制,具有遗传信息和表达它的机制,且被膜结构围绕,该膜结构将活体与外界分离开。这里使用的细胞可以是自然产生的细胞或人工修饰的细胞(例如,融合细胞,遗传修饰的细胞,等)。细胞来源的实例包括但不限于:正常生长的转基因动物的单细胞培养物、胚胎、血液或身体组织,细胞混合物,例如来自正常生长的细胞系的细胞,等。
用于本发明的细胞可以源自任意的生物(例如,任意的单细胞生物(例如,细菌,酵母,等)或任意的多细胞生物(例如,动物(例如,脊椎动物,无脊椎动物),植物(例如,单子叶植物,双子叶植物,等),等))。例如,使用源自脊椎动物(例如,盲鳗目,七鳃鳗目,软骨鱼纲,硬骨鱼纲,两栖动物,爬行动物,鸟类,哺乳动物,等)的细胞。更具体地,使用源自哺乳动物(例如,单孔目,有袋目,无齿类动物,皮翼目,翼手目,食肉动物,食虫动物,长鼻目,奇蹄目,偶蹄目,管齿目,鳞甲目,海牛目,鲸类动物,灵长目,啮齿目,兔形目,等)的细胞。在一个实施方案中,可以使用源自灵长目(例如,黑猩猩,日本猴,人,等),特别是人的细胞。本发明不限于此。用于本发明的细胞可以是干细胞或体细胞。上述的细胞可以用于移植目的。可以使用源自开花植物(单子叶植物或双子叶植物)的细胞。优选地,使用双子叶植物细胞。更优选地,使用源自禾本科(Gramineae)、茄科、葫芦科、十字花科(Cruciferae)、伞形科、蔷薇科、豆科和紫草科(Boraginaceae)的细胞。优选地,使用源自小麦、玉米、稻、大麦、高粱、烟草、青椒、茄子、瓜、番茄、草莓、甘薯、芸苔属(Brassica)、卷心菜、韭菜、椰菜、大豆、苜蓿、亚麻、胡萝卜、黄瓜、柑桔、大白菜、莴苣、桃子、马铃薯、紫草(Lithospermumeythrohizon)、黄连根茎(Coptis Rhizom)、白杨和苹果的细胞。植物细胞可以是一部分植物体、器官、组织、培养细胞等。转化细胞、组织、器官或个体的技术是本领域众所周知的。这些技术详细地描述在本文引用的文献等中。可以将核酸分子短暂地或稳定地导入生物细胞中。用于短暂地或稳定地导入基因的技术是本领域众所周知的。用于分化用于本发明的细胞、从而生成转化的植物的技术也是本领域众所周知的。应当明白,这些技术详细地描述在本文引用的文献等中。用于从转化的植物得到种子的技术也是本领域众所周知的。这些技术描述在本文提及的文献中。
如本文所使用的,术语“干细胞”指能自我复制和具有多能性的细胞。一般地,干细胞可以再生受伤的组织。这里使用的干细胞可以是但不限于:胚胎干(ES)细胞或组织干细胞(也称作组织性干细胞,组织特异性的干细胞,或体干细胞)。干细胞可以是人工生产的细胞,只要它能具有上述的能力。术语“胚胎干细胞”指源自早期胚胎的多能干细胞。与胚胎干细胞不同,组织干细胞的分化方向受到限制。胚胎干细胞位于组织中的特定位置,且具有未分化的胞内结构。因此,组织干细胞具有低水平的多能性。在组织干细胞中,核/胞质比率较高,且有很少的胞内细胞器。组织干细胞一般具有多能性,细胞周期较长,且可以维持超过个体寿命的增殖能力。这里使用的干细胞可以是胚胎干细胞或组织干细胞,只要它们能调节基因复制的倾向于错误的频率。
可以将组织干细胞分类为细胞来源的位点的种类,例如皮系统、消化系统、骨髓系统、神经系统等。皮系统中的组织干细胞包括表皮干细胞,毛囊干细胞,等。消化系统中的组织干细胞包括胰腺(普通的)干细胞,肝干细胞,等。骨髓系统中的组织干细胞包括造血干细胞,间充质干细胞,等。神经系统中的组织干细胞包括神经干细胞,视网膜干细胞,等。
如本文所使用的,术语“体细胞”指生殖细胞(例如卵细胞,精子等)以外的任意细胞,其不能将其DNA转移到下一代中。一般地,体细胞具有有限的或没有多能性。这里使用的体细胞可以是自然产生的或遗传修饰的,只要它们能调节基因复制的倾向于错误的频率。
将干细胞的来源分成外胚层、内胚层或中胚层。外胚层来源的干细胞大多存在于脑中,包括神经干细胞。内胚层来源的干细胞大多存在于骨髓中,包括血管干细胞,造血干细胞,间充质干细胞,等。中胚层来源的干细胞大多存在于器官中,包括肝干细胞,胰腺干细胞,等。如本文所使用的体细胞可以源自任意的胚层,只要它们能调节基因复制的倾向于错误的频率。
如本文所使用的,术语“分离的”表示减少了、优选地基本上排除了至少一种一般环境中的天然伴随物。因此,术语“分离的细胞”指基本上不含有一般环境中的天然伴随物(例如,其它细胞,蛋白,核酸,等)的细胞。与核酸或多肽有关的术语“分离的”指核酸或多肽,例如,当通过重组DNA技术生产时,其基本上不含有细胞物质或培养基,或者当化学合成时,其基本上不含有前体化学物质或其它化学物质。优选地,分离的核酸不含有天然地在生物中的核酸侧翼的序列(核酸的5′或3′末端)。
如本文所使用的,与细胞有关的术语“建立”指其中维持了细胞的特定性质(多能性),且该细胞在培养条件下会经历稳定的增殖的细胞状态。因此,建立的干细胞会维持多能性。
如本文所使用的,术语“分化的细胞”指具有专门功能和形式的细胞(例如,肌肉细胞,神经元,等)。与干细胞不同,分化的细胞没有或具有很少的多能性。分化的细胞的实例包括表皮细胞,胰腺实质细胞,胰管细胞,肝细胞,血细胞,心肌细胞,骨骼肌细胞,成骨细胞,骨骼成肌细胞,神经元,血管内皮细胞,色素细胞,平滑肌细胞,脂肪细胞,骨细胞,软骨细胞,等。这里使用的细胞可以是任意的上述细胞,只要它们能调节基因复制的倾向于错误的频率。如本文所使用的,术语“分化”或“细胞分化”指,在源自单个细胞分裂的子代细胞群体中发生在形态和/或功能上具有定性差异的2种或更多种细胞的现象。因此,“分化”包括这样的过程,其中一群(家族树)原始地不具有特定的可检测的特征的细胞获得了特征,例如生成特定的蛋白,等。
如本文所使用的,与细胞、生物等有关的术语“状态”指细胞、生物等的参数(例如,细胞周期、对外源试剂的反应、信号转导、基因表达、基因转录等)的状况或模式。这样的状态的实例包括但不限于:分化的状态,未分化的状态,细胞对外源试剂的反应,细胞周期,增殖状态,等。在这里可以使用目标生物对下述参数(特征是生物的环境)的反应性或抗性作为生物状态的量度:温度,湿度(例如,绝对湿度,相对湿度,等),pH,盐浓度(例如,所有盐或特定盐的浓度),营养物(例如,碳水化合物的量,等),金属(例如,所有金属或特定金属(例如,重金属,等)的量或浓度),气体(例如,所有气体或特定气体的量),有机溶剂(例如,所有有机溶剂或特定有机溶剂(例如,乙醇,等)的量),压力(例如,局部的或总的压力,等),大气压力,粘度,流速(例如,存在生物的介质的流速,等),光强度(例如,特定波长的光的量,等),光波长(例如,可见光,紫外光,红外光,等),电磁波,辐射,重力,张力,声波,目标生物以外的其它生物(例如,寄生物,病原性细菌,等),化学试剂(例如,药物,等),抗生素,自然产生的物质,心理应激,机体应激,等。
如本文所使用的,与实体有关的术语“环境”(或德语中的“Umgebung”)指围绕着该实体的环境。在环境中,识别出了多种组分和一定量的状态,它们称作环境因素。环境因素的实例包括上述的参数。环境因素一般大致分成非生物的环境因素和生物的环境因素。非生物的环境因素(无机环境因素)可以分成物理因素和化学因素,或者,气候因素和土壤因素。各种环境因素不总是独立地作用于生物,而是可以与另一种相关联。因此,在这里可以逐个地或作为整体地(各种参数的整体)观察环境因素。
如本文所使用的,术语“组织”指多细胞生物中的具有基本上相同的功能和/或形式的细胞的聚集体。“组织”一般是相同来源的细胞的聚集体,但是可以是不同来源的细胞的聚集体,只要这些细胞具有相同的功能和/或形式。因此,当本发明的干细胞用于再生组织时,该组织可以由2种或更多种不同来源的细胞的聚集体组成。一般地,组织构成器官的一部分。在形态的、功能的或发育的基础上,可以将动物组织分成表皮组织,结缔组织,肌肉组织,神经组织,等。根据构成组织的细胞的发育状态,可以将植物组织大致分成分生组织和永久组织。或者,根据构成组织的细胞的类型,可以将组织分成单一组织和复合组织。因而,可以将组织分成各种类别。这里可以使用任意的组织,只要其中能调节基因复制的倾向于错误的频率。
任意的器官或其一部分都可以用于本发明。要在本发明中注射的组织或细胞可以源自任意的器官。如本文所使用的,术语“器官”指位于发挥特定功能的个体生物的特定部分中的形态上独立的结构。在多细胞生物(例如,动物,植物)中,器官由空间上以特定方式排列的几种组织组成,每种组织由许多细胞组成。这样的器官的实例包括与血管系统有关的器官。在一个实施方案中,本发明靶向的器官包括但不限于:皮肤,血管,角膜,肾,心,肝,脐带,肠,神经,肺,胎盘,胰腺,脑,外周肢(peripheral limb),视网膜,等。任意的器官或其一部分都可以用于本发明,只要其中能调节基因复制的倾向于错误的频率。
如本文所使用的,术语“产物物质”指目标生物或其一部分生成的物质。这样的产物物质的实例包括但不限于:基因的表达产物、代谢物、粪便等。根据本发明,通过调节遗传性状的转化率,可以使目标生物改变产物物质的类型和/或量。应当明白,本发明包括这样改变的产物物质。优选地,产物物质可以是但不限于代谢物。
如本文所使用的,与生物有关的术语“疾病模型”指可以在其中重建对生物特异性的疾病、症状、紊乱、状况等的生物模型。通过本发明的方法,可以生成这样的疾病模型。这样的疾病模型的实例包括但不限于:癌症的动物模型,心脏病(例如,心肌梗塞,等)的动物模型,心血管病(例如,动脉硬化,等)的动物模型,中枢神经病(例如,痴呆,脑梗塞,等)的动物模型,等。
(普通生物化学和分子生物学)
(一般技术)
如本文所使用的分子生物学技术、生物化学技术、微生物学技术和细胞生物学技术是本领域众所周知的和常用的,且描述在,例如,Sambrook J.等(1989),Molecular Cloning:A Laboratory Manual,Cold Spring Harbor和其第3版.(20D1);Ausubel,F.M.(1987),Current Protocols in Molecular Biology,Greene Pub.Associatesand Wiley-Interscience;Ausubel,F.M.(1989),Short Protocolsin Molecular Biology:A Compendium of Methods from CurrentProtocols in Molecular Biology,Greene Pub.Associates andWiley-Interscience;Innis,M.A.(1990),PCR Protocols:A Guideto Methods and Applications,Academic Press;Ausubel,F.M.(1992),Short Protocols in Molecular Biology:A Compendiumof Methods from Current Protocols in Molecular Biology,GreenePub.Associates;Ausubel,F.M.(1995),Short Protocols inMolecular Biology:A Compendium of Methods from CurrentProtocols in Molecular Biology,Greene Pub.Associates;Innis,M.A.等(1995),PCR Strategies,Academic Press;Ausubel,F.M.(1999),Short Protocols in Molecular Biology:ACompendium of Methods from Current Protocols in MolecularBiology,Wiley,and annual updates;Sninsky,J.J.等(1999),PCR Applications:Protocols for Functional Genomics,AcademicPress;Special issue,Jikken Igaku[Experimental Medicine]“Idenshi Donyu & Hatsugen Kaiseki Jikkenho[ExperimentalMethods for Gene Introduction & Expression Analysis]”,Yodo-sha,1997,等。这些出版物中的每一篇的相关部分(或可能是整体)均在这里引作参考。
用于制备人工合成的基因的DNA合成技术和核酸化学描述在,例如,Gait,M.J.(1985),Oligonucleotide Synthesis:A PracticalApproach,IRL Press;Gait,M.J.(1990),OligonucleotideSynthesis:A Practical Approach,IRL Press;Eckstein,F.(1991),Oligonucleotides and Analogues:A Practical Approac,IRL Press;Adams,R.L.等(1992),The Biochemistry of the Nucleic Acids,Chapman & Hall;Shabarova,Z.等(1994),Advanced OrganicChemistry of Nucleic Acids,Weinheim;Blackburn,G.M.等(1996),Nucleic Acids in Chemistry and Biology,Oxford UniversityPress;Hermanson,G.T.(1996),Bioconjugate Techniques,Academic Press;等,其相关部分在这里引作参考。
如本文所使用的术语“蛋白”、“多肽”、“寡肽”和“肽”具有相同的含义,是指具有任意长度的氨基酸聚合物。该聚合物可以是直链、分支或环状链。氨基酸可以是自然产生的或非自然产生的氨基酸,或变体氨基酸。该术语可以包括组装进许多多肽链的复合物中的那些。该术语还包括自然产生的或人工改变的氨基酸聚合物。这样的修饰包括,例如,二硫键形成,糖基化,脂化(lipidation),乙酰化,磷酸化,或任意的其它操作或修饰(例如,与标记部分缀合)。该定义包括例如含有至少一种氨基酸类似物(例如,非自然产生的氨基酸,等)的多肽、肽样化合物(例如,类肽)和本领域已知的其它变体。本发明的基因产物一般是多肽形式。多肽形式的本发明的产物物质可以用作药物组合物等。
如本文所使用的术语“多核苷酸”、“寡核苷酸”和“核酸”具有相同的含义,是指具有任意长度的核苷酸聚合物。该术语还包括“寡核苷酸衍生物”或“多核苷酸衍生物”。“寡核苷酸衍生物”或“多核苷酸衍生物”包括核苷酸衍生物,或指具有与一般连接不同的核苷酸间连接的寡核苷酸或多核苷酸,它们可互换地使用。这样的寡核苷酸的实例具体地包括2′-O-甲基-核糖核苷酸,其中的寡核苷酸的磷酸二酯键被转化成硫代磷酸酯键的寡核苷酸衍生物,其中的寡核苷酸的磷酸二酯键被转化成N3′-P5′氨基磷酸酯键的寡核苷酸衍生物,其中的寡核苷酸的核糖和磷酸二酯键被转化成肽-核酸键的寡核苷酸衍生物,其中的寡核苷酸的尿嘧啶被取代为C-5丙炔基尿嘧啶的寡核苷酸衍生物,其中的寡核苷酸的尿嘧啶被取代为C-5噻唑尿嘧啶的寡核苷酸衍生物,其中的寡核苷酸的胞嘧啶被取代为C-5丙炔基胞嘧啶的寡核苷酸衍生物,其中的寡核苷酸的胞嘧啶被取代为吩噁嗪修饰的胞嘧啶的寡核苷酸衍生物,其中的DNA的核糖被取代为2′-O-丙基核糖的寡核苷酸衍生物,和其中的寡核苷酸的核糖被取代为2′-甲氧基乙氧基核糖的寡核苷酸衍生物。除非另有说明,特定的核酸序列还隐含地包括其保守地修饰的变体(例如简并的密码子取代)和互补的序列以及明确指出的序列。具体地,通过生成其中的一个或多个选定的(或全部)密码子的第3位取代为混合碱基和/或去氧肌苷残基的序列,可以生成简并的密码子取代(Batzer等,Nucleic Acid Res.19:5081(1991);Ohtsuka等,J.Biel.Chem.260:2605-2608(1985);Rossolini等,Mol.Cell.Probes 8:91-98(1994))。本发明的基因一般是多核苷酸形式。多核苷酸形式的本发明的基因或基因产物可以用于本发明的方法。
如本文所使用的,术语“核酸分子”还与术语“核酸”、“寡核苷酸”和“多核苷酸”可互换地使用,包括cDNA、mRNA、基因组DNA等。如本文所使用的,核酸和核酸分子可以包含在术语“基因”的概念中。能编码给定基因的序列的核酸分子包括“剪接突变体(变体)”。类似地,由核酸编码的特定蛋白包括由该核酸的剪接变体编码的任意蛋白。如其名字所暗示的,“剪接突变体”是基因的可变剪接的产物。转录后,可以剪接初始的核酸转录物,从而使得不同的(可变的)核酸剪接产物能编码不同的多肽。生成剪接变体的机制可以有变化,但是包括外显子的可变剪接。该定义还包括通过连读转录源自相同核酸的可变多肽。该定义包括剪接反应的任意产物,包括剪接产物的重组形式。因此,本发明的基因可以包括这里的剪接突变体。
如本文所使用的,基因(例如,核酸序列,氨基酸序列,等)的“同源性”指2个或更多个基因序列之间的同一性的比例。如本文所使用的,序列(核酸序列,氨基酸序列,等)的同一性指2个或更多个可比较的序列之间的相同序列(单个的核酸,氨基酸,等)的比例。因此,2个特定的基因之间的同源性越大,它们的序列之间的同一性或相似性越大。通过直接比较它们的序列,或者通过在严格条件下的杂交方法,可以确定2个基因是否具有同源性。当将2个基因序列直接彼此对比时,如果基因的DNA序列代表性地彼此具有至少50%的同一性,优选地至少70%的同一性,更优选地至少80%,90%,95%,96%,97%,98%或99%的同一性,则这些基因具有同源性。如本文所使用的,当保守取代在上述的同源性中视作正的(相同的)时,基因(例如,核酸序列,氨基酸序列,等)的“相似性”指2个或更多个序列之间的同一性的比例。因此,同源性和相似性在存在保守取代时彼此不同。如果不存在保守取代,则同源性和相似性具有相同的值。
这里使用默认参数的PSI-BLAST(序列分析工具),对比氨基酸序列和碱基序列的相似性、同一性和同源性。另外,可以使用FASTA(使用默认参数)代替PSI-BLAST。
如本文所使用的,术语“氨基酸”可以指自然产生的或非自然产生的氨基酸,只要它能满足本发明的目的。术语“氨基酸衍生物”或“氨基酸类似物”指与自然产生的氨基酸不同的氨基酸,且其具有与原始氨基酸类似的功能。这样的氨基酸衍生物和氨基酸类似物是本领域众所周知的。
术语“自然产生的氨基酸”指自然产生的氨基酸的L-异构体。自然产生的氨基酸是甘氨酸,丙氨酸,缬氨酸,亮氨酸,异亮氨酸,丝氨酸,甲硫氨酸,苏氨酸,苯丙氨酸,酪氨酸,色氨酸,半胱氨酸,脯氨酸,组氨酸,天冬氨酸,天冬酰胺,谷氨酸,谷氨酰胺,γ-羧基谷氨酸,精氨酸,鸟氨酸和赖氨酸。除非另有说明,如本文所使用的所有氨基酸是L-异构体,尽管使用D-氨基酸的实施方案也在本发明的范围内。术语“非自然产生的氨基酸”指通常在自然界不会发现的氨基酸。非自然产生的氨基酸的实例包括正亮氨酸,对硝基苯丙氨酸,高苯丙氨酸(homophenylalanine),对氟苯丙氨酸,3-氨基-2-苯偶酰丙酸,D-或L-高精氨酸和D-苯丙氨酸。术语“氨基酸类似物”指具有与氨基酸类似的物理性质和/或功能的非氨基酸的分子。氨基酸类似物的实例包括,例如,乙硫氨酸,刀豆氨酸,2-甲基谷氨酰胺等。氨基酸模仿物指具有与氨基酸的一般化学结构不同的结构、但是以与自然产生的氨基酸类似的方式起作用的化合物。
如本文所使用的,术语“核苷酸”可以是自然产生的或非自然产生的。术语“核苷酸衍生物”或“核苷酸类似物”指与自然产生的核苷酸不同、且具有与原始核苷酸类似的功能的核苷酸。这样的核苷酸衍生物和核苷酸类似物是本领域众所周知的。这样的核苷酸衍生物和核苷酸类似物的实例包括但不限于:硫代磷酸酯,氨基磷酸酯,甲基膦酸酯,手性的-甲基膦酸酯,2-O-甲基核糖核苷酸,和肽-核酸(PNA)。
在本文中可以用它们的普遍知道的三字母符号或IUPAC-IUB生物化学命名委员会(Biochemical Nomenclature Commission)推荐的单字母符号来指示氨基酸。同样地,可以用它们的普遍接受的单字母编码来指示核苷酸。
如本文所使用的,术语“对应的”氨基酸或核酸指特定的多肽或多核苷酸分子中的氨基酸或核苷酸,其具有或预期其具有与作为对比参考的多肽或多核苷酸中的预定的氨基酸或核苷酸类似的功能。具体地,在酶分子的情况下,该术语指存在于活性部位(例如,提供DNA聚合酶的校对功能的范围)的相似位置的氨基酸,且类似地提供催化活性。例如,在反义分子的情况下,该术语指与反义分子的特定部分相对应的直向同源体(ortholog)中的相似部分。使用本领域已知的比对技术,可以鉴别出对应的氨基酸和核酸。这样的比对技术描述在,例如,Needleman,S.B.和Wunsch,C.D.,J.Mol.Biol.48,443-453,1970中。
如本文所使用的,术语“对应的”基因(例如,多肽或多核苷酸分子)指给定物种中的基因(例如,多肽或多核苷酸分子),其具有或预期其具有与作为对比参考的物种中的预定的基因类似的功能。当存在许多具有这样的功能的基因时,该术语指具有相同的进化起源的基因。因此,与特定的基因相对应的基因可以是特定的基因的直向同源体。因此,可以在其它的动物(人,大鼠,猪,牛,等)中发现与小鼠DNA聚合酶基因等相对应的基因。通过本领域熟知的技术,可以鉴别出这样对应的基因。因此,例如,使用参考基因(例如,小鼠DNA聚合酶基因等)的序列作为查询序列,通过搜索动物(例如,人,大鼠)的序列数据库,可以发现特定的动物中的对应的基因。
如本文所使用的,术语“核苷酸”可以是自然产生的或非自然产生的。术语“核苷酸衍生物”或“核苷酸类似物”指与自然产生的核苷酸不同、且具有与原始核苷酸相似的功能的核苷酸。这样的核苷酸衍生物和核苷酸类似物是本领域众所周知的。这样的核苷酸衍生物和核苷酸类似物的实例包括但不限于:硫代磷酸酯,氨基磷酸酯,甲基膦酸酯,手性的-甲基膦酸酯,2-O-甲基核糖核苷酸和肽-核酸(PNA)。
如本文所使用的,术语“片段”指相对于参考多肽或多核苷酸的全长(长度n)具有1至n-1的序列长度的多肽或多核苷酸。片段的长度可以根据目的相应地改变。例如,在多肽的情况中,片段长度的下限包括3,4,5,6,7,8,9,10,15,20,25,30,40,50或更多的核苷酸。这里没有指出的整数(例如,11等)代表的长度可以是适当的下限。例如,在多核苷酸的情况下,片段长度的下限包括5,6,7,8,9,10,15,20,25,30,40,50,75,100或更多的核苷酸。这里没有指出的整数(例如,11等)代表的长度可以是适当的下限。如本文所使用的,多肽或多核苷酸的长度可以分别由氨基酸或核酸的数目表示。但是,上述的数字不是绝对的。上述的作为上限或下限的数字意在包括一些更大的或更小的数字(例如,±10%),只要能维持相同的功能即可。为了该目的,可以在数字前加上“约”。但是,应当明白,数字的解释不受本说明书中是否存在“约”的影响。根据是否维持了作为片段参考的全长蛋白的功能中的至少一种功能(例如,与其它分子的特异性相互作用,等),可以决定有用片段的长度。
如本文所使用的,术语能与生物试剂(例如多核苷酸、多肽等)“特异性地相互作用的试剂”指具有对生物试剂(例如多核苷酸、多肽等)的亲和力的试剂,其代表性地比对其它不相关的生物试剂(例如多核苷酸、多肽等)(更具体地,具有低于30%的同一性的那些)的亲和力更高或相等,优选地显著(例如,统计上显著地)更高。使用例如杂交实验、结合实验等,可以检测这样的亲和力。如本文所使用的,“试剂”可以是任意的物质或其它因素(例如,能量,例如光,辐射,热,电,等),只要可以实现想要的目的即可。这样的物质的实例包括但不限于:蛋白,多肽,寡肽,肽,多核苷酸,寡核苷酸,核苷酸,核酸(例如,DNA,例如cDNA,基因组DNA,等;和RNA,例如mRNA),多糖,寡糖,脂类,小分子量的有机分子(例如,激素,配体,信息传递物质,通过组合化学合成的分子,小分子量的分子(例如,药学上可接受的小分子量的配体等),等),和这些分子的组合。对多核苷酸特异性的试剂的实例包括但不限于:代表性地,与具有预定的序列同源性(例如,70%或更高的序列同一性)的多核苷酸的序列具有互补性的多核苷酸,多肽,例如能结合启动子区的转录试剂,等。对多肽特异性的试剂的实例包括但不限于:代表性地,特异性地针对多肽或其衍生物或类似物的抗体(例如,单链抗体);当该多肽是受体或配体时,特异性的配体或受体;当多肽是酶时的底物等。这些试剂在这里可以用于调节生物的倾向于错误的频率。
如本文所使用的,术语“小分子量的有机分子”指具有相对较小的分子量的有机分子;通常,小分子量的有机分子指约1,000或更小的分子量,或可以指大于1,000的分子量。通过本领域已知的方法或其组合,可以一般地合成小分子量的有机分子。生物可以生成这些小分子量的有机分子。小分子量的有机分子的实例包括但不限于:激素,配体,信息传递物质,通过组合化学合成的分子,药学上可接受的小分子量的分子(例如,小分子量的配体等),等。这些试剂在这里可以用于调节生物的倾向于错误的频率。
如本文所使用的,术语“抗体”包括多克隆抗体,单克隆抗体,人抗体,人源化的抗体,多功能抗体,嵌合抗体,和抗独特型抗体,和其片段(例如,F(ab′)2和Fab片段),和其它重组缀合物。这些抗体可以通过共价键或通过重组与酶(例如,碱性磷酸酶,辣根过氧化物酶,α-半乳糖酶,等)融合。
如本文所使用的,术语“抗原”指抗体分子可以特异性地结合的任意底物。如本文所使用的,术语“免疫原”指能启动淋巴细胞的抗原-特异性的免疫反应的活化的抗原。
如本文所使用的,术语“单链抗体”指通过肽交联剂连接Fv区的重链片段和轻链片段形成的单链多肽。
如本文所使用的,术语“复合分子”指这样的分子,其中许多分子,例如多肽、多核苷酸、脂类、糖、小分子量的分子等连接在一起。这样的复合分子的实例包括但不限于:糖脂,糖肽,等。这些分子在这里可以用作基因或其产物(例如,DNA聚合酶,等)或本发明的试剂,只要该分子具有与该基因或其基因产物(例如,DNA聚合酶,等)或本发明的试剂基本上相同的功能。
如本文所使用的,术语“分离的”生物试剂(例如,核酸,蛋白,等)指基本上与自然产生的生物的细胞中的其它生物试剂(例如,在核酸的情况下,核酸以外的试剂和具有与目标核酸不同的核酸序列的核酸;和在蛋白的情况下,蛋白以外的试剂和具有与目标蛋白不同的氨基酸序列的蛋白)分离或纯化的生物试剂。“分离的”核酸和蛋白包括通过标准纯化方法纯化出的核酸和蛋白。分离的核酸和蛋白还包括化学合成的核酸和蛋白。
如本文所使用的,术语“纯化的”生物试剂(例如,核酸,蛋白,等)指从中去除了至少一部分天然伴随的试剂的试剂。因此,通常,纯化的生物试剂的纯度高于正常状态的生物试剂(即,浓缩的)。
如本文所使用的,术语“纯化的”和“分离的”是指,存在优选地至少75重量%、更优选地至少85重量%、甚至更优选地至少95重量%和最优选地至少98重量%的相同类型的生物试剂。
如本文所使用的,术语基因产物(例如基因,多核苷酸,多肽,等)的“表达”是指,该基因等受到预定的体内作用的影响以改变成其它形式。优选地,术语“表达”是指,将基因、多核苷酸等转录和翻译成多肽。在本发明的一个实施方案中,基因可以转录成mRNA。更优选地,这些多肽可以具有翻译后的加工修饰。
如本文所使用的,术语基因、多核苷酸、多肽等的“表达的减少”是指,在存在本发明的试剂的作用时,表达水平比没有该试剂的作用时显著降低。优选地,表达的减少包括多肽(例如,DNA聚合酶等)的表达量的减少。如本文所使用的,术语基因、多核苷酸、多肽等的“表达的增加”是指,在存在本发明的试剂的作用时,表达水平比没有该试剂的作用时显著增加。优选地,表达的增加包括多肽(例如,DNA聚合酶等)的表达量的增加。如本文所使用的,术语基因的“表达的诱导”是指,通过将特定的试剂应用到特定的细胞,增加基因的表达量。因此,表达的诱导包括:当不能观察到基因的表达时,使基因表达,和当能观察到基因的表达时,增加基因的表达量。这些基因或基因产物(多肽或多核苷酸)的增加或减少可以用于调节例如,在本发明中复制中倾向于错误的频率。
如本文所使用的,在基因的情况下的术语“特异性地表达”是指,基因在特定位点表达或表达特定的时间段,其水平与在其它位点或时间段的不同(优选地更高)。术语“特异性地表达”是指,基因可以仅仅在给定的位点(特定位点)表达或可以在其它位点表达。优选地,术语“特异性地表达”是指,基因仅仅在给定的位点表达。因此,根据本发明的一个实施方案,DNA聚合酶可以特异性地或局部地在需要的部分表达。
如本文所使用的,术语“生物活性”是指生物内的试剂(例如,多核苷酸,蛋白,等)所具有的活性,包括表现出各种功能的活性(例如,转录促进活性)。例如,当2种试剂彼此相互作用时(例如,DNA聚合酶结合特异性的序列),生物活性包括DNA聚合酶和特异性的序列之间的连接,连接造成的生物变化(例如,特异性的核苷酸聚合反应;发生复制错误;去除核苷酸的能力;识别错配的碱基对;等)。例如,当特定的试剂是酶时,其生物活性包括其酶促活性。在其它的实例中,当特定的试剂是配体时,其生物活性包括该试剂与该配体的受体的结合。使用本领域众所周知的技术,可以测量这样的生物活性。
如本文所使用的,术语“反义(活性)”是指允许特异性地阻抑或减少靶基因的表达的活性。通常,使用与靶基因(例如,DNA聚合酶等)的核酸序列互补的、具有至少8个邻接核苷酸的长度的核酸序列来实现该反义活性。这样的核酸序列优选地具有至少9个邻接核苷酸的长度,更优选地至少10个邻接核苷酸的长度,且甚至更优选地至少11个邻接核苷酸的长度,至少12个邻接核苷酸的长度,至少13个邻接核苷酸的长度,至少14个邻接核苷酸的长度,至少15个邻接核苷酸的长度,至少20个邻接核苷酸的长度,至少30个邻接核苷酸的长度,至少40个邻接核苷酸的长度,和至少50个邻接核苷酸的长度。这些核酸序列包括与其具有至少70%、更优选地至少80%、甚至更优选地至少90%、且再更优选地至少95%同源性的核酸序列。反义活性优选地与靶基因的核酸序列的5′末端序列互补。这样的反义核酸序列包括具有一个或几个、或至少一个核苷酸取代、添加和/或缺失的上述序列。具有这样的反义活性的分子在这里可以用于调节生物的倾向于错误的频率。
如本文所使用的,术语“RNAi”是RNA干扰的缩写,是指下述现象:将用于造成RNAi的试剂、例如双链RNA(也称作dsRNA)导入细胞中,并特异性地降低与其同源的mRNA,从而抑制基因产物的合成,和使用该现象的技术。如本文所使用的,RNAi可以具有与能造成RNAi的试剂相同的含义。
如本文所使用的,术语“能造成RNAi的试剂”指能造成RNAi的任意试剂。如本文所使用的,“能造成基因的RNA i的试剂”是指试剂能造成与该基因有关的RNAi和达到RNAi的效果(例如,抑制该基因的表达,等)。这样的能造成RNAi试剂的实例包括但不限于:与靶基因的核酸序列具有至少约70%同源性的序列或可在严格条件下杂交的序列,含有具有至少10个核苷酸长度的双链部分的RNA或其变体。在这里,该试剂可以优选地是含有3′突出端的DNA,且更优选地该3′突出端具有2个或更多个核苷酸的长度(例如,2-4个核苷酸的长度)。RNAi在这里可以用于调节生物的倾向于错误的频率。
如本文所使用的,“在严格条件下杂交的多核苷酸”指常用的且本领域众所周知的条件。通过使用从本发明的多核苷酸中选择出的多核苷酸,通过进行菌落杂交、噬菌斑杂交、DNA印迹杂交等,可以得到这样的多核苷酸。具体地,在有0.7-1.0M NaCl存在的情况下,使用在其上面固定了源自菌落或噬菌斑的DNA的滤器在65℃进行杂交。此后,在65℃,使用0.1-2倍浓度的SSC(盐水-柠檬酸钠)溶液(1-倍浓度的SSC溶液由150mM氯化钠和15mM柠檬酸钠组成)洗涤滤器。将通过该方法鉴别出的多核苷酸称作“在严格条件下杂交的多核苷酸”。可以根据描述在下述文献中的方法进行杂交,例如,Molecular Cloning第2版,Current Protocols in MolecularBiology,Supplement 1-38,DNA Cloning 1:Core Techniques,APractical Approach,第2版,0xford University Press(1995)等。在这里,在严格条件下杂交的序列优选地排除仅仅含有A(腺嘌呤)或T(胸腺嘧啶)的序列。“可杂交的多核苷酸”是指可以在上述的杂交条件下与其它多核苷酸杂交的多核苷酸。具体地,可杂交的多核苷酸至少包括与能编码具有本文具体公开的氨基酸序列的多肽的DNA的碱基序列具有至少60%同源性的多核苷酸,优选具有至少80%同源性的多核苷酸,且更优选具有至少95%同源性的多核苷酸。
术语“高度严格的条件”指用于使序列高度互补的DNA链进行杂交、且能排除明显错配的DNA的杂交的条件。杂交严格性主要由温度、离子强度、变性剂(例如甲酰胺)的浓度决定。用于杂交和洗涤的“高度严格的条件”的实例是0.0015M氯化钠,0.0015M柠檬酸钠,在65-68℃,或0.015M氯化钠,0.0015M柠檬酸钠,和50%甲酰胺,在42℃。见Sambrook,Fritsch & Maniatis,Molecular Cloning:A Laboratory Manual(第2版,Cold Spring Harbor Laboratory,N.Y.,1989);Anderson等,Nucleic Acid Hybridization:APractical Approach Ch.4(IRL Press Limited)(Oxford Express)。可以任选地使用更严格的条件(例如更高的温度,更低的离子强度,更高的甲酰胺或其它变性剂)。为了减少非特异性的和/或背景杂交的目的,在杂交和洗涤缓冲液中可以包含其它试剂。实例是0.1%牛血清清蛋白,0.1%聚乙烯吡咯烷酮,0.1%焦磷酸钠,0.1%十二烷基硫酸钠(NaDodSO4或SDS),Ficoll,Denhardt氏溶液,超声波处理的鲑精DNA(或另一种非互补的DNA)和葡聚糖硫酸酯,尽管还可以使用其它合适的试剂。可以改变这些添加剂的浓度和类型,而基本上不影响杂交条件的严格性。杂交实验通常在pH6.8-7.4进行;但是,在一般的离子强度条件下,杂交速度几乎与pH无关。见Anderson等,Nucleic Acid Hybridization:A Practical Approach Ch.4(IRLPress Limited,Oxford,英国)。
能影响DNA双链体的稳定性的因素包括碱基组成、长度和碱基对错配的程度。本领域的技术人员可以调节杂交条件,以使这些变量适应,并使不同序列相关性的DNA形成杂交物。通过下面的方程,可以估计出较好地配对的DNA双链体的解链温度:
Tm(℃)=81.5+16.6(log[Na+])+0.41(%G+C)-600/N-0.72(%甲酰胺)
其中N是形成的双链体的长度,[Na+]是杂交或洗涤溶液中的钠离子的摩尔浓度,%G+C是杂交物中的(鸟嘌呤+胞嘧啶)碱基百分比。对于较不好地配对的杂交物,每1%的错配,解链温度会降低约1℃。
术语“中等严格的条件”指能形成具有比“高度严格的条件”下发生的碱基对错配更大的程度的DNA双链体的条件。一般的“中等严格的条件”的实例是0.015M氯化钠,0.0015M柠檬酸钠,在50-65℃,或0.015M氯化钠,0.0015M柠檬酸钠,和20%甲酰胺,在37-50℃。作为实例,在0.015M钠离子中、50℃的“中等严格的条件”允许约21%错配。
本领域的技术人员能够明白,“高度严格的条件”和“中等严格的条件”之间没有绝对的区别。例如,在0.015M钠离子(无甲酰胺)时,较好地配对的长DNA的解链温度是约71℃。在65℃(在相同的离子强度)洗涤时,会允许约6%错配。为了捕获相关性更差的序列,本领域的技术人员可以简单地降低温度或升高离子强度。
通过下式可以较好地估计最高达约20个核苷酸的寡核苷酸探针在1M NaCl中的解链温度:
Tm=(2℃/A-T碱基对)+(4℃/G-C碱基对)。
应当注意6X盐柠檬酸钠(SSC)中的钠离子浓度是1M。见Suggs等,Developmental Biology Using Purified Genes 683(Brown和Fox,编,1981)。
从具有PCR引物和杂交探针(其含有例如SEQ ID NO.1,3,41,43,47,49,51,53,55,57,59,61,63,65,等所示的核酸序列的一部分)的cDNA文库中,容易地分离出了能编码DNA聚合酶蛋白的自然产生的核酸。在基本上含有1%牛血清清蛋白(BSA)、500mM磷酸钠(NaPO4)、1mM EDTA和7%SDS、在42℃的杂交缓冲液和基本上含有2xSSC(600mM NaCl;60mM柠檬酸钠)和0.1%SDS、在50℃的洗涤缓冲液定义的低严格条件下;更优选地在基本上含有1%牛血清清蛋白(BSA)、500mM磷酸钠(NaPO4)、15%甲酰胺、1mM EDTA和7%SDS、在50℃的杂交缓冲液和基本上含有1xSSC(300mM NaCl;30mM柠檬酸钠)和1%SDS、在50℃的洗涤缓冲液定义的低严格条件下;最优选地在基本上含有1%牛血清清蛋白(BSA)、200mM磷酸钠(NaPO4)、15%甲酰胺、1mM EDTA和7%SDS、在50℃的杂交缓冲液和基本上含有0.5xSSC(150mM NaCl;15mM柠檬酸钠)和0.1%SDS、在65℃的洗涤缓冲液定义的低严格条件下,优选的能编码DNA聚合酶的核酸或其变体或片段等可与如SEQ ID NO.1,3,41,43,47,49,51,53,55,57,59,61,63,65,等所述序列中的全部或部分杂交。
如本文所使用的,术语“探针”指在生物实验中用于搜索的物质,例如体外和/或体内筛选等,包括但不限于,例如,具有特定的碱基序列的核酸分子或含有特定的氨基酸序列的肽。
作为普通探针的核酸分子的实例包括具有至少8个邻接的核苷酸的长度的核酸序列的、且与目标基因的核酸序列同源或互补的核酸分子。这样的核酸序列可以优选地是具有至少9个邻接的核苷酸的长度、更优选地至少10个邻接的核苷酸的长度、且更优选地至少11个邻接的核苷酸的长度、至少12个邻接的核苷酸的长度、至少13个邻接的核苷酸的长度、至少14个邻接的核苷酸的长度、至少15个邻接的核苷酸的长度、至少20个邻接的核苷酸的长度、至少25个邻接的核苷酸的长度、至少30个邻接的核苷酸的长度、至少40个邻接的核苷酸的长度或至少50个邻接的核苷酸的长度的核酸序列。用作探针的核酸序列包括与上述序列具有至少70%、更优选地至少80%、且更优选地至少90%或至少95%同源性的核酸序列。
如本文所使用的,术语“搜索”是指,使用特定的核酸序列来电子地或生物地,或使用其它的方法发现具有特定的功能和/或性质的其它核酸碱基序列。电子搜索的实例包括但不限于:BLAST(Altschul等,J.Mol.Biol.215:403-410(1990)),FASTA(Pearson & Lipman,Proc.Natl.Acad.Sci.,USA 85:2444-2448(1988)),Smith和Waterman方法(Smith和Waterman,J.Mol.Biol.147:195-197(1981)),和Needleman和Wunsch方法(Needleman和Wunsch,J.Mol.Biol.48:443-453(1970)),等。生物搜索的实例包括但不限于:其中使基因组DNA附着到尼龙膜等上的微阵列,或其中在严格杂交、PCR和原位杂交中使基因组DNA附着到玻璃板上的微阵列(微测定),等。这里意味着,在本发明中使用的DNA聚合酶等包括通过这样的电子的或生物的搜索鉴定出的对应基因。
如本文所使用的,通过在对比窗口中对比2个最佳比对的序列,可以确定“(氨基酸,核苷酸,等)序列同一性、同源性或相似性的百分比”,其中,在与用于2个序列的最佳比对的参考序列(其不包含添加或缺失(如果其它序列包含添加,则可能产生缺口))相比时,对比窗口中的部分多核苷酸或多肽序列可以包含添加或缺失(即缺口)。通过测定2个序列中出现相同核酸碱基或氨基酸残基的位置的数目,以得到匹配位置的数目,用匹配位置的数目除以参考序列中的位置的总数(即窗口大小),将结果乘以100,得到序列同一性的百分比,可以计算出百分比。当在搜索中使用时,通过选自本领域众所周知的各种序列对比算法和程序的合适技术,可以评价同源性。这样的算法和程序的实例包括但不限于:TBLASTN,BLASTP,FASTA,TFASTA和CLUSTALW(Pearson和Lipman,1988,Proc.Natl.Acad.Sci.USA85(8):2444-2448,Altschul等,1990,J.Mol.Biol.215(3):403-410,Thompson等,1994,Nucleic acid Res.22(2):4673-4680,Higgins等,1996,Methods Enzymol.266:383-402,Altschul等,1990,J.Mol.Biol.215(3):403-410,Altschul等,1993,Nature Genetics 3:266-272)。在一个特别优选的实施方案中,使用本领域众所周知的基础的局部比对搜索工具(BasicLocal Alignment Search Tool)(BLAST),评价了蛋白或核酸序列的同源性(例如,见Karlin和Altschul,1990,Proc.Natl.Acad.Sci.USA 87:2267-2268,Altschul等,1990,J.Mol.Biol.215:403-410,Altschul等,1993,Nature Genetics 3:266-272,Altschul等,1997,Nuc.Acids Res.25:3389-3402)。具体地,5个特化的-BLAST程序可以用于执行下述的任务,以实现对比或搜索:
(1)使用BLASTP和BLAST3,对比氨基酸查询序列和蛋白序列数据库;
(2)使用BLASTN,对比核苷酸查询序列和核苷酸序列数据库;
(3)使用BLASTX,对比概念地翻译的产物(其中核苷酸查询序列(两条链)被转变(convert)了超过6个阅读框)和蛋白序列数据库;
(4)使用TBLASTN,对比所有被转变了超过6个阅读框的蛋白查询序列(两条链)和核苷酸序列数据库;和
(5)使用TBLASTX,对比被转变了超过6个阅读框的核苷酸查询序列和核苷酸序列数据库。
通过指定氨基酸查询序列或核酸查询序列和优选地从蛋白序列数据库或核酸序列数据库得到的实验序列之间的称作“高分片段对”的类似的片段,BLAST程序能鉴定出同源序列。使用本领域众所周知的评分矩阵,可以优选地鉴定(比对)大量的高分片段对。优选地,评分矩阵是BLOSUM62矩阵(Gonnet等,1992,Science 256:1443-1445,Henikoff和Henikoff,1993,Proteins 17:49-61)。可以使用PAM或PAM250矩阵,尽管它们不是象BLOSUM62矩阵一样优选的(例如,见,Schwartz和Dayhoff,编,1978,Matrices for DetectingDistance Relationships:Atlas of Protein Sequence andStructure,Washington:National Biomedical ResearchFoundation)。BLAST程序能评价所有鉴定出的高分片段对的统计显著性,并优选地选择能满足使用者独立地定义的显著性阈值水平的片段,例如,使用者设定的同源性。优选地,使用Karlin公式评价高分片段对的统计显著性(见Karlin和Altschul,1990,Proc.Natl.Acad.Sci.USA 87:2267-2268)。
如本文所使用的,术语“引物”指能在大分子合成酶促反应中起始要合成的大分子化合物的反应所需的物质。在合成核酸分子的反应中,可以使用与要合成的大分子化合物的一部分互补的核酸分子(例如,DNA,RNA,等)。
经常用作引物的核酸分子包括具有至少8个邻接的核苷酸的长度的核酸序列、且与目标基因的核酸序列互补的核酸分子。这样的核酸序列优选地具有至少9个邻接的核苷酸的长度,更优选地至少10个邻接的核苷酸的长度,甚至更优选地至少11个邻接的核苷酸的长度,至少12个邻接的核苷酸的长度,至少13个邻接的核苷酸的长度,至少14个邻接的核苷酸的长度,至少15个邻接的核苷酸的长度,至少16个邻接的核苷酸的长度,至少17个邻接的核苷酸的长度,至少18个邻接的核苷酸的长度,至少19个邻接的核苷酸的长度,至少20个邻接的核苷酸的长度,至少25个邻接的核苷酸的长度,至少30个邻接的核苷酸的长度,至少40个邻接的核苷酸的长度,和至少50个邻接的核苷酸的长度。用作引物的核酸序列包括与上述序列具有至少70%、更优选地至少80%、甚至更优选地至少90%和最优选地至少95%同源性的核酸序列。作为引物的合适序列可以根据要合成(扩增)的序列的性质而变化。本领域的技术人员可以根据目标序列设计出合适的引物。这样的引物设计是本领域众所周知的,且可以手工地或使用计算机程序(例如,LASERGENE,Primer Select,DNAStar)进行。
如本文所使用的,术语“表位”指其详细结构尚未被必要地定义的抗原决定簇,只要它能引起抗原-抗体反应即可。因此,术语“表位”包括一组氨基酸残基,其能参与特定免疫球蛋白的识别,或者在T细胞的情形中,这些残基是T细胞受体蛋白和/或主要组织相容性复合体(MHC)受体的识别所必需的。该术语也与“抗原决定簇”或“抗原决定簇位点”可互换地使用。在免疫学领域,体内地或体外地,表位是分子的特征(例如,初级、二级和三级肽结构和电荷),其形成能被免疫球蛋白、T细胞受体或HLA分子识别的位点。包括肽的表位包含3个或更多个氨基酸,其空间构象是该表位所独有的。通常,表位由至少5个这样的氨基酸组成,更常见地,由至少6,7,8,9或10个这样的氨基酸组成。表位的长度越大,表位与原始肽的相似性越大,即,更长的表位一般是优选的。当考虑构象时,情况未必是这样的。确定氨基酸的空间构象的方法是本领域已知的,且包括,例如,X-射线结晶学和二维核磁共振光谱学。而且,使用本领域众所周知的技术,可以容易地鉴定出特定蛋白中的表位。还参见,Geysen等,Proc.Natl.Acad.Sci.USA(1984)81:3998(general method forrapidly synthesizing peptides to determine the location ofimmunogenic epitopes in a given antigen);美国专利号4,708,871(procedures for identifying and chemically synthesizingepitopes of antigens);和Geysen等,Molecular Immunology(1986)23:709(technique for identifying peptides with high affinityfor a given antibody)。在简单的免疫测定中,可以鉴别出能识别相同表位的抗体。因而,测定包含肽的表位的方法是本领域众所周知的。如果提供了表位的初级核酸或氨基酸序列,则使用本领域的技术人员众所周知的常见技术,可以测定出这样的表位。
因此,包含肽的表位需要具有至少3个氨基酸、优选地至少4个氨基酸、更优选地至少5个氨基酸、至少6个氨基酸、至少7个氨基酸、至少8个氨基酸、至少9个氨基酸、至少10个氨基酸、至少15个氨基酸、至少20个氨基酸和至少25个氨基酸的长度的序列。表位可以是线性的或构象的。
(基因的修饰)
在特定的蛋白分子(例如,DNA聚合酶,等)中,包含在序列中的特定的氨基酸可以被蛋白结构中的另一个氨基酸取代,例如阳离子区或底物分子结合位点,而不显著减少或损失相互作用的结合能力。蛋白的相互作用能力或其它性质决定了蛋白的特定的生物功能。因此,可以在氨基酸序列中或在DNA编码序列水平进行特定氨基酸取代,以在取代后生成能维持原始性质的蛋白。因此,可以对如本文所公开的肽和能编码这种肽的DNA进行各种修饰,而不显著损失生物有效性。或者,可以修饰能编码DNA聚合酶的核酸序列,从而修饰DNA聚合酶的校对功能。
当设计上述的修饰时,可以考虑氨基酸的疏水性指数。疏水氨基酸指数在为蛋白提供相互作用的生物功能中起重要作用,这是本领域普遍公认的(Kyte.J和Doolittle,R.F.,J.Mol.Biol.157(1):105-132,1982)。氨基酸的疏水性质有助于蛋白的二级结构,从而调节蛋白和其它分子(例如,酶,底物,受体,DNA,抗体,抗原,等)之间的相互作用。基于其疏水性和电荷性质,为每种氨基酸指定如下的疏水性指数:异亮氨酸(+4.5);缬氨酸(+4.2);亮氨酸(+3.8);苯丙氨酸(+2.8);半胱氨酸/胱氨酸(+2.5);甲硫氨酸(+1.9);丙氨酸(+1.8);甘氨酸(-0.4);苏氨酸(-0.7);丝氨酸(-0.8);色氨酸(-0.9);酪氨酸(-1.3);脯氨酸(-1.6);组氨酸(-3.2);谷氨酸(-3.5);谷氨酰胺(-3.5);天冬氨酸(-3.5);天冬酰胺(-3.5);赖氨酸(-3.9)和精氨酸(-4.5)。
众所周知,如果特定的氨基酸被具有相似的疏水性指数的另一种氨基酸取代,得到的蛋白仍然可能具有与原始蛋白相似的生物功能(例如,具有等价酶活性的蛋白)。对于这样的氨基酸取代,疏水性指数优选地在±2内,更优选地在±1内,且甚至更优选地在±0.5内。本领域认为,这样的基于疏水性的氨基酸取代是有效的。
在修饰本发明的基因时,可以考虑亲水性指数。如美国专利号4,554,101所述,为氨基酸残基指定下面的亲水性指数:精氨酸(+3.0);赖氨酸(+3.0);天冬氨酸(+3.0±1);谷氨酸(+3.0±1);丝氨酸(+0.3);天冬酰胺(+0.2);谷氨酰胺(+0.2);甘氨酸(0);苏氨酸(-0.4);脯氨酸(-0.5±1);丙氨酸(-0.5);组氨酸(-0.5);半胱氨酸(-1.0);甲硫氨酸(-1.3);缬氨酸(-1.5);亮氨酸(-1.8);异亮氨酸(-1.8);酪氨酸(-2.3);苯丙氨酸(-2.5)和色氨酸(-3.4)。应当明白,氨基酸可以被具有相似亲水性指数的另一种氨基酸取代,且仍然可以提供生物等价物。对于这样的氨基酸取代,亲水性指数优选地在±2内,更优选地±1,且甚至更优选地±0.5。
如本文所使用的术语“保守取代”指氨基酸取代,其中被取代的氨基酸和取代氨基酸具有相似的亲水性指数或/和疏水性指数。例如,在亲水性或疏水性指数在±2内、优选地在±1内,且更优选地在±0.5内的氨基酸之间进行保守取代。保守取代的实例包括但不限于在每种下述的残基对内的取代:精氨酸和赖氨酸;谷氨酸和天冬氨酸;丝氨酸和苏氨酸;谷氨酰胺和天冬酰胺;和缬氨酸、亮氨酸和异亮氨酸,这是本领域的技术人员众所周知的。
如本文所使用的,术语“变体”指部分地与原始物质不同的物质,例如多肽、多核苷酸等。这样的变体的实例包括取代变体、添加变体、缺失变体、截短的变体、等位基因的变体,等。这样的变体的实例包括但不限于:相对于参考核酸分子或多肽具有一个或几个取代、添加和/或缺失的核苷酸或多肽,或具有至少一个取代、添加和/或缺失的核苷酸或多肽。变体可以具有或不具有参考分子(例如,野生型分子,等)的生物活性。根据目的,可以给变体赋予其它的生物活性,或者缺失部分生物活性。使用本领域众所周知的技术,可以进行这样的设计。或者,通过从生物中分离,以生产变体,可以得到已知其性质的变体,且可以扩增该变体的核酸序列,以得到序列信息。因此,对于宿主细胞,将源自异源物种的对应基因或其产物视作“变体”。
如本文所使用的,术语“等位基因”指位于与对应的基因等同的基因座处的遗传变体,这2个基因在这里彼此区别开。因此,本文所使用的术语“等位基因变体”指与特定的基因具有等位基因关系的变体。这样的等位基因变体通常具有与对应的等位基因相同或非常相似的序列,或者通常具有几乎相同的生物活性,尽管它很少具有不同的生物活性。如本文所使用的术语“物种同系物”或“同系物”指与特定物种的特定基因具有氨基酸或核苷酸同源性的物质(优选地至少60%同源性,更优选地至少80%、至少85%、至少90%和至少95%同源性)。从本说明书的描述中,可以清楚地明白得到这样的物种同系物的方法。术语“直向同源体”(也称作直向同源基因)指源自共同祖先的不同物种中的基因(由于物种形成)。例如,在具有多基因结构的血红蛋白基因家族的情况下,人和小鼠α-血红蛋白基因是直向同源体,而人α-血红蛋白基因和人β-血红蛋白基因是共生同源体(paralog)(由基因复制生成的基因)。直向同源体可以用于估计分子进化系统树。通常,在不同物种中的直向同源体可以具有与原始物种相似的功能。因此,本发明的直向同源体可以用于本发明。
如本文所使用的,术语“保守的(或保守地修饰的)变体”应用于氨基酸和核酸序列。关于特定的核酸序列,保守地修饰的变体指那些能编码相同的或基本上相同的氨基酸序列的核酸。因为遗传密码的简并性,大量的功能上相同的核酸可以编码任意的特定蛋白。例如,密码子GCA、GCC、GCG和GCU都能氨基酸丙氨酸。因而,在用密码子限定丙氨酸的每个位点,可以将密码子改成所述的对应密码予中的任一个,而不改变编码的多肽。这样的核酸变异是“沉默变异”,其代表着保守地修饰的变异的一个种类。能编码多肽的每个核酸序列在这里也描述了该核酸的每个可能的沉默变异。本领域的技术人员能够认识到,可以修饰核酸中的每个密码子(AUG除外,它通常是甲硫氨酸的唯一密码子;TGG除外,它通常是色氨酸的唯一密码子),以生成功能上相同的分子。因此,在每个所述的序列中,都暗示着能编码多肽的核酸的每个沉默变异。优选地,可以进行这样的修饰,同时避免取代半胱氨酸,后者是能极大地影响多肽的高级结构的氨基酸。这样修饰碱基序列的方法的实例包括使用限制酶切割等;通过使用DNA聚合酶、克列诺(Klenow)片段、DNA连接酶等处理进行连接等;和使用合成的寡核苷酸进行位点特异性的碱基取代的方法(特异性的定位诱变;Mark Zoller和Michael Smith,Methods in Enzymology,100,468-500(1983))。使用分子生物学领域常用的方法,可以进行修饰。
为了制备功能上等同的多肽,除了氨基酸取代以外,可以进行氨基酸添加、缺失和/或修饰。氨基酸取代指将原始肽链的至少一个氨基酸替换为不同的氨基酸,例如用不同的氨基酸替换1-10个氨基酸,优选地1-5个氨基酸,更优选地1-3个氨基酸。氨基酸添加指向原始肽链添加至少一个氨基酸,例如向原始肽链添加1-10个氨基酸,优选地1-5个氨基酸,和更优选地1-3个氨基酸。氨基酸缺失指缺失至少一个氨基酸,例如缺失1-10个氨基酸,优选地1-5个氨基酸,和更优选地1-3个氨基酸。氨基酸修饰包括但不限于:酰胺化,羧基化,硫酸化,卤化,烷化,糖基化,磷酸化,羟基化,酰化(例如,乙酰化),等。要取代的或添加的氨基酸可以是自然产生的或非自然产生的氨基酸或氨基酸类似物。自然产生的氨基酸是优选的。
如本文所使用的,术语“肽类似物”或“肽衍生物”指与肽不同、但是具有至少一种与该肽等同的化学或生物功能的化合物。因此,肽类似物包括相对于原始肽具有至少一种氨基酸类似物或氨基酸衍生物添加或取代的那些。肽类似物具有上述的添加或取代,从而使其功能基本上与原始肽的功能相同(例如,相似的pKa值,相似的官能团,相似的与其它分子的结合方式,相似的水溶性,等)。使用本领域众所周知的技术,可以制备出这样的肽类似物。因此,肽类似物可以是含有氨基酸类似物的聚合物。
类似地,如本文所使用的,术语“多核苷酸类似物”或“核酸类似物”指与多核苷酸或核酸不同、但是具有至少一种与多核苷酸或核酸等同的化学或生物功能的化合物。因此,多核苷酸或核酸类似物包括相对于原始多核苷酸或核酸具有至少一种核苷酸类似物或核苷酸衍生物添加或取代的那些。
如本文所使用的核酸分子包括这样的核酸分子,其中缺失了该核酸的一部分序列,或者被其它碱基取代,或者插入了其它的核酸序列,只要该核酸表达的多肽基本上具有与如上所述的自然产生的多肽相同的活性即可。或者,可以将其它核酸连接到该核酸的5′末端和/或3′末端。核酸分子可以包括可在严格的条件下与能编码多肽的基因杂交、且能编码具有基本上相同功能的多肽的那些。这样的基因是本领域已知的,且可以用于本发明。
通过众所周知的PCR方法(即,化学合成),可以得到上述的核酸。该方法可以与例如定位诱变、杂交等组合。
如本文所使用的,关于多肽或多核苷酸的术语“取代”、“添加”或“缺失”指氨基酸或其取代基或核苷酸或其取代基分别相对于原始多肽或多核苷酸的取代、添加或缺失。这可以通过本领域众所周知的技术来实现,包括定位诱变技术等。多肽或多核苷酸可以具有任意数目(>0)的取代、添加或缺失。该数目可以与具有这样数目的取代、添加或缺失的变体一样大,所述变体维持目的功能(例如激素和细胞因子的信息传递功能,等)。例如,这样的数目可以是1个或几个,优选地在全长的20%或10%内,或不超过100,不超过50,不超过25,等。
(遗传工程)
通过遗传工程技术,可以生产出如本文所使用的蛋白(例如DNA聚合酶和其片段和变体等),并导入细胞中。
当在本文中提及基因时,术语“载体”或“重组载体”指能将目标多核苷酸序列转移到靶细胞中的载体。这样的载体能自我复制或整合进宿主细胞(例如,原核细胞,酵母,动物细胞,植物细胞,昆虫细胞,个体动物,和个体植物,等)的染色体中,且含有位于适合转录本发明的多核苷酸的位点处的启动子。将适用于克隆的载体称作“克隆载体”。这样的克隆载体通常含有包含许多限制位点的多克隆位点。限制位点和多克隆位点是本领域众所周知的,且可以根据目的适当地或任选地使用。该技术描述在如这里所述的文献中(例如,Sambrook等(同上))。这样的载体包括例如质粒。
如本文所使用的,术语“质粒”指存在于染色体外、且能自主复制的遗传因子。当特别提出时,将包含在细胞核的线粒体、叶绿体等中的DNA一般地称作细胞器DNA,且不同于质粒,即不包括在质粒中。
质粒的实例包括但不限于:
大肠杆菌:pET(TAKARA),pUC(TOYOBO),pBR322(TOYOBO),pBluescriptII(TOYOBO);
酵母:pAUR(TAKARA),pESP(TOYOBO),pESC(TOYOBO);
枯草芽孢杆菌:pHY300PLK(TAKARA);
真菌病:pPRTI(TAKARA),pAUR316(TAKARA);
动物细胞:pCMV(TOYOBO),pBK-CMV(TOYOBO);等。
如本文所使用的,术语“表达载体”指包含结构基因和用于调节其表达的启动予以及各种调节元件的核酸序列,所述调节元件的状态允许它们在宿主细胞中运行。调节元件可以优选地包括终止子,选择性标记例如抗药性基因,和沉默予和/或增强子。本领域的技术人员熟知,生物(例如,植物)表达载体的类型和调节元件的类型可以依赖于宿主细胞而异。通过将特定的启动子导入细胞,可以在特定条件下调节细胞的倾向于错误的频率。
如本文所使用的,用于原核细胞的“重组载体”包括,例如,pcDNA3(+),pBluescript-SK(+/-),pGEM-T,pEF-BOS,pEGFP,pHAT,pUC18,pFT-DESTTM,42GATEWAY(Invitrogen),等。
如本文所使用的,用于动物细胞的“重组载体”包括,例如,pcDNAI/Amp,pcDNA I,pCDM8(都商业上购自Funakoshi,Tokyo,日本),pAGE107[日本公开号3-229(Invitrogen)],pAGE103[J.Biochem.,101,1307(1987)],pAMo,pAMoA[J.Biol.Chem.,268,22782-22787(1993)],基于鼠干细胞病毒(MSCV)的逆转录病毒表达载体,pEF-BOS,pEGFP,等。
用于植物细胞的重组载体的实例包括Ti质粒,烟草花叶病毒载体,花椰菜花叶病毒载体,双生病毒组载体,等。
用于昆虫细胞的重组载体的实例包括杆状病毒载体,等。
如本文所使用的,术语“终止子”指位于基因的蛋白编码区的下游的序列,且其参与在DNA转录成mRNA时的转录的终止和聚腺苷酸(poly A)序列的添加。已知终止子有助于mRNA的稳定性,且对基因表达的量有影响。
如本文所使用的,术语“启动子”指能决定基因转录的起始位点的碱基序列,它是能直接调节转录频率的DNA区。结合到启动子上的RNA聚合酶会启动转录。因此,起启动子作用的特定基因的一部分在本文中称作“启动子部分”。启动子区通常位于推定的蛋白编码区的第一个外显子上游约2kbp内。因此,使用DNA分析软件,通过预测基因组的碱基序列中的蛋白编码区,可以估计启动子区。推定的启动子区通常位于结构基因的上游,但是依赖于结构基因,即推定的启动子区可能位于结构基因的下游。优选地,推定的启动子区位于第一个外显子的翻译起始位点上游约2kbp。
如本文所使用的,术语“增强子”指用于增强目标基因的表达效率的序列。这样的增强子是本领域众所周知的。可以使用1个或多个增强子,也可以不使用增强子。
如本文所使用的,术语“沉默子”指具有抑制或终止基因表达的功能的序列。在本发明中,可以使用任意的具有这样的功能的沉默子,也可以不使用沉默子。
如本文所使用的,术语“可操作地连接”是指设置需要的序列的位置,使其表达(运行)在转录和翻译调节序列(例如,启动子,增强子,等)或翻译调节序列的控制下。为了使启动子可操作地连接到基因上,一般使启动子紧邻该基因的上游。启动子无需临近结构基因。
在本文中可以使用任意的技术将能编码具有修饰的校对功能等的DNA聚合酶的核酸分子导入细胞中,包括,例如,转化,转导,转染,等。这样的核酸分子导入技术是本领域众所周知的和常用的,且描述在,例如,Ausubel F.A.等,编,(1988),Current Protocolsin Molecular Biology,Wiley,New York,NY;Sambrook.J.等(1987)Molecular Cloning:A Laboratory Manual,第2版和其第3版.(2001),Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY;Special issue,Jikken Igaku[Experimental Medicine]″Experimental Method for Gene Introduction & ExpressionAnalysis″,Yodo-sha,1997等。通过本文所述的方法,例如RNA印迹分析和蛋白印迹分析或其它众所周知的常见技术,可以确认基因导入。
任一种上述的将DNA导入细胞的方法都可以用作载体导入方法,包括,例如,转染,转导,转化,等(例如,磷酸钙方法,脂质体方法,DEAE葡聚糖方法,电穿孔方法,粒子枪(基因枪)方法,等)。
如本文所使用的,术语“转化体”指通过转化得到的生物的全部或部分(例如细胞)。转化体的实例包括原核细胞、酵母、动物细胞、植物细胞、昆虫细胞等。根据受试者,可以将转化体称作转化的细胞、转化的组织、转化的宿主等。这里使用的细胞可以是转化体。
当这里使用原核细胞进行遗传操作等时,原核细胞可以是,例如,埃希氏菌属(Escherichia),沙雷氏菌属(Serratia),芽孢杆菌属(Bacillus),短杆菌属(Brevibacterium),棒杆菌属(Corynebacterium),微杆菌属(Microbacterium),假单胞菌属(Pseudomonas),等。更具体地,原核细胞可以是,例如,大肠杆菌XL1-Blue,大肠杆菌XL2-Blue,大肠杆菌DHl,等。
如本文所使用的动物细胞的实例包括小鼠骨髓瘤细胞,大鼠骨髓瘤细胞,小鼠杂交瘤细胞,中国仓鼠卵巢(CHO)细胞,幼仓鼠肾(BHK)细胞,非洲绿猴肾细胞,人白血病细胞,HBT5637(日本公开号63-299),人结肠癌细胞系,等。小鼠骨髓瘤细胞包括ps20,NSO,等。大鼠骨髓瘤细胞包括YB2/0等。人胚胎肾细胞包括HEK293(ATCC:CRL-1573)等。人白血病细胞包括BALL-1等。非洲绿猴肾细胞包括COS-1,COS-7,等。人结肠癌细胞系包括HCT-15,等。人成神经细胞瘤包括SK-N-SH,SK-N-SH-5Y,等。小鼠成神经细胞瘤包括Neuro2A,等。
用于导入DNA的任何方法在这里都可以用作导入重组载体的方法,包括,例如,氯化钙方法,电穿孔方法(Methods.Enzymol.,194,182(1990)),脂转染方法,原生质球方法(Proc.Natl.Acad.Sci.USA,84,1929(1978)),醋酸锂方法(J.Bacteriol.,153,163(1983)),Proc.Natl.Acad.Sci.USA,75,1929(1978)所述的方法,等。
如本文所使用的逆转录病毒感染方法是本领域众所周知的,描述在,例如,Current Protocols in Molecular Biology(同上)(更具体地,第9.9-9.14单元),等。具体地,例如,用胰蛋白酶将胚胎干细胞处理成单细胞悬浮液,随后与能生产病毒的细胞(包装细胞系)的培养物上清液共培养1-2小时,由此得到足够量的感染细胞。
当本发明应用于植物时,使用本领域众所周知的方法,例如使用土壤杆菌(Agrobacterium)的方法和直接插入方法,可以将植物表达载体导入植物细胞中。使用土壤杆菌的方法的实例可以包括记载在例如Nagel等(1990),Microbiol.Lett.,67,325)中的方法。在该方法中,例如,通过电穿孔将适用于植物的表达载体插入土壤杆菌中,且通过描述在例如Gelvin等,编,(1994),Plant MolecularBiology Manual(Kluwer Academic Press Publishers))中的方法,将转化的土壤杆菌导入植物细胞中。将植物表达载体直接导入细胞的方法的实例包括电穿孔(Shimamoto等(1989),Nature,338:274-276;和Rhodes等(1989),Science,240:204-207),粒子枪方法(Christou等(1991),Bio/Technology 9:957-962),和聚乙二醇方法(PEG)方法(Datta等(1990),Bio/Technology 8:736-740)。这些方法是本领域众所周知的,其中,可以合适地选择适用于要转化的植物的方法。
在本发明中,可以将目标核酸分子(导入的基因)导入或不导入转化体的染色体中。优选地,将目标核酸分子(导入的基因)导入转化体的染色体中,更优选地导入一对染色体中。
通过本领域众所周知的方法,可以使转化的细胞分化成植物组织,植物器官,和/或植物体。
使用本领域已知的技术和培养基,培养、分化和繁殖植物细胞、植物组织和植物体。培养基的实例包括但不限于:Murashige-Skoog(MS)培养基,Gamborg B5(B)培养基,White培养基,Nitsch & Nitsch培养基,等。这些培养基一般补充了适当量的植物生长调节物质(植物激素)等。
如本文所使用的,与植物有关的术语“再分化”指一种现象,其中从个体植物的一部分恢复整个植物。例如,组织片段,例如细胞、叶子、根等,可以再分化成器官或植物体。
使转化体再分化成植物体的方法是本领域众所周知的。这些方法描述在,例如,Rogers等,Methods in Enzymology 118:627-640(1986);Tabata等,Plant Cell Physiol.,28:73-82(1987);Shaw,Plant Molecular Biology:A practical approach,IRL press(1988);Shimamoto等,Nature 338:274(1989);Maliga等,Methodsin Plant Molecular Biology:A laboratory course,Cold SpringHarbor Laboratory Press(1995);等。因此,根据转化的目标植物,本领域的技术人员可以适当地选择和采用上述的众所周知的方法以再分化植物。转化的植物具有导入的目标基因。通过本文所述的方法和其它众所周知的普通技术,例如RNA印迹,蛋白印迹分析,等,可以确认导入的基因。
可以从转化的植物得到种子。通过RNA印迹或PCR,可以检测导入的基因的表达。如果需要,通过例如蛋白印迹,可以确认基因产物蛋白的表达。
已经证实,本发明可以应用于任何生物,且特别适用于植物。本发明还可以应用于其它生物。用于本发明的分子生物学技术是本领域众所周知的和常用的,且描述在,例如,Ausubel F.A.,等,编(1988),Current Protocols in Molecular Biology,Wiley,NewYork,NY;Sambrook J.,等(1987),Molecular Cloning:ALaboratory Manual,第2版和第3版,Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY;Special issue,Jikken Igaku[Experimental Medicine]″Idenshi Donyu & HatsugenKaiseki Jikkenho[Experimental Methods for Gene Introduction& Expression Analysis]″,Yodo-sha,1997;等。
通过合适的方法,包括mRNA测量和免疫学的测量方法,可以“检测”或“定量”基因表达(例如,mRNA表达,多肽表达)。分子生物学的测量方法的实例包括RNA印迹方法,斑点印迹方法,PCR方法,等。免疫学的测量方法的实例包括ELISA方法,RIA方法,荧光抗体方法,蛋白印迹方法,免疫组织学染色方法,等,其中可以使用微量滴定板。定量方法的实例包括ELISA方法,RIA方法,等。可以使用应用阵列(例如,DNA阵列、蛋白阵列等)的基因分析方法。在Shujun-sha编的Saibo-Kogaku[Cell Engineering],specialissue,″DNA Microarray and Up-to-date PCR Method″中广泛地综述了DNA阵列。蛋白阵列详细描述在Nat genet.2002 Dec;32 Suppl:526-32中。分析基因表达的方法的实例除上述技术之外包括但不限于:RT-PCR方法,RACE方法,SSCP方法,免疫沉淀方法,双杂交物系统,体外翻译方法,等。其它分析方法描述在,例如,″Genome AnalysisExperimental Method,Yusuke Nakamura′s Labo-Manual,YusukeNakamura编,Yodo-sha(2002),等中。所有上述的出版物都在这里引作参考。
如本文所使用的,术语“表达量”指在受试者细胞中表达的多肽或mRNA的量。表达量包括,通过使用本发明的抗体的任意的适当方法,包括免疫学的测量方法(例如,ELISA方法,RIA方法,荧光抗体方法,蛋白印迹方法,免疫组织学染色方法,等)评价的本发明的多肽在蛋白水平上的表达量,或通过任意的适当方法,包括分子生物学的测量方法(例如,RNA印迹方法,斑点印迹方法,PCR方法,等)评价的本发明的多肽在mRNA水平上的表达量。术语“表达量的变化”是指通过适当方法,包括上述的免疫学测量方法或分子生物学测量方法评价的本发明的多肽在蛋白或mRNA水平上的表达量的增加或减少。因而,根据本发明,通过改变某些试剂(例如,DNA聚合酶,等)的表达量,可以调节倾向于错误的频率。
如本文所使用的,关于多核苷酸的术语“上游”是指,该位置比特定的参考点更临近5′末端。
如本文所使用的,关于多核苷酸的术语“下游”是指,该位置比特定的参考点更临近3′末端。
如本文所使用的,术语“碱基配对”和“沃森-克里克(Watson &Crick)碱基配对”具有相同的含义,指可以通过氢键结合到一起的核苷酸,这基于下述的序列同一性:腺嘌呤残基(A)通过2个氢键结合胸腺嘧啶残基(T)或尿嘧啶残基(U),胞嘧啶残基(C)通过3个氢键结合鸟嘌呤残基(G),如在双链DNA中所见到的(见Stryer,L.,Biochemistry,第4版,1995)。
如本文所使用的,术语“互补的”和“互补体”指多核苷酸序列,其整个互补区能与另一个特定的多核苷酸进行沃森-克里克碱基配对。在本发明中,当第一个多核苷酸的每个碱基与对应的互补碱基配对时,将第一个多核苷酸视作与第二个多核苷酸互补。互补的碱基通常是A和T(或A和U)或C和G。如本文所使用的,术语“互补体”作为术语“互补的多核苷酸”、“互补的核酸”和“互补的核苷酸序列”的同义词使用。这些术语适用于一对基于序列的多核苷酸,但不是实际上结合到一起的2个多核苷酸的特定组。
通过胚胎干(ES)细胞的同源重组生产和分析转基因动物和敲除(knockout)的动物,能提供重要的手段。通过例如使用同源重组的阳性-阴性选择方法(见,美国专利号5,464,764;美国专利号5,487,992;美国专利号5,627,059;Proc.Natl.Acad.Sci.USA,Vol.86,8932-8935,1989;Nature,Vol.342,435-438,1989;等),可以生成转基因动物或敲除的哺乳动物。敲除的动物(也称作基因靶向)的生产综述在,例如,Masami Murayama,Masashi Yamamoto,编Jikken Igaku Bessatsu[Special Issue of ExperimanetalMedicine],″Shintei Idenshi Kogaku Handobukku[Newly RevisedGenetic Engineering Handbook]″,Ver.3,1999,Yodo-sha,particularly pp.239-256;Shinichi Aizawa,(1995),JikkenIgaku Bessatsu [Special Issue of ExperimanetalMedicine],″Jintagettingu-ES Saibo Wo Motiita Heni Mausu NoSakusei[Gene Targeting-Production of Mutant Mouse Using ESCell];等。转基因动物或敲除的哺乳动物已经被广泛使用。在本发明中,如果需要,采用上述的方法。
例如,在高等生物的情况下,通过使用新霉素抗性基因的阳性选择和使用HSV的胸苷激酶基因或白喉毒素基因的阴性选择,可以有效地筛选出重组体。使用敲除PCR或DNA印迹来筛选同源重组体。具体地,对于阳性选择,将一部分靶基因取代为新霉素抗性基因等,将用于阴性选择的HSVTK基因等连接到其末端,从而生成靶向载体。通过电穿孔,将该靶向载体导入ES细胞。在有G418和丙氧鸟苷存在的情况下,筛选ES细胞。分离存活的菌落,随后进行PCR或DNA印迹,以筛选同源重组体。
在上述的方法中,破坏靶向的内源基因,以得到转基因或敲除(靶基因重组体,破坏的基因)的小鼠,其缺少或具有低水平的对应功能。该方法可以用于分析基因功能,因为突变仅仅导入了目标基因中。
筛选出了需要的同源重组体后,通过胚泡注射方法或聚集体嵌合方法(aggregation chimera method),将得到的重组ES细胞与正常的胚胎混合,以生成ES细胞和宿主胚胎的嵌合小鼠。在胚泡注射方法中,使用玻璃移液管,将ES细胞注射进胚泡中。在聚集体嵌合方法中,ES细胞块附着到8-细胞期的无透明带的胚胎上。将具有导入的ES细胞的胚泡植入假孕代孕母亲的子宫中,以得到嵌合小鼠。ES细胞具有全能性,且可以体内地分化成任意种类的细胞,包括生殖细胞。如果将具有源自ES细胞的生殖细胞的嵌合小鼠与正常小鼠杂交,杂合地得到具有ES细胞的染色体的小鼠。将得到的小鼠彼此杂交,得到具有纯合的修饰的ES细胞染色体的敲除小鼠。为了从嵌合小鼠纯合地得到具有修饰的染色体的敲除小鼠,将雄性嵌合小鼠与雌性野生型小鼠杂交,以生成F1杂合小鼠。使得到的雄性和雌性杂合小鼠杂交,并选择F2纯合小鼠。使用常用的方法,例如DNA印迹,PCR,碱基测序,等,以及关于重组ES细胞的测定,可以确定需要的基因突变是否导入了F1和F2中。
作为用于克服不能选择性地分析各种基因功能的问题的另一种技术,有条件的敲除技术已经引起注意,其中将Cre重组酶的细胞类型-特异性的表达与Cre-loxP的位点-特异性的重组相结合。为了使用Cre-loxP得到有条件的敲除小鼠,将新霉素抗性基因导入不能抑制靶基因的表达的位点;将靶向载体导入ES细胞中,其中loxP序列以下述的方式整合:以后将要去除的外显子打断loxP序列;此后,分离同源重组体。从分离的克隆得到嵌合小鼠。因而,生成了遗传地修饰的小鼠。接着,使其中以组织特异性的方式表达大肠杆菌的源自P1噬菌体的位点-特异性的重组酶Cre的转基因小鼠与该小鼠杂交。在该情况下,仅仅在能表达Cre的组织中破坏了基因(Cre能特异性地识别loxP序列(34bp),且使2个loxP序列之间的序列进行重组,并被破坏)。通过与具有连接到器官-特异性的启动子上的Cre基因的转基因小鼠杂交,或者通过使用具有Cre基因的病毒载体,可以表达Cre(Stanford W.L.,等,Nature Genetics 2:756-768(2001))。
因而,可以生成本发明的生物。
(多肽生产方法)
根据普通的培养方法,培养通过本发明的方法生产的源自微生物、动物细胞等的转化体。生成并积累本发明的多肽。从培养物中收集本发明的多肽,由此可能生产本发明的多肽。
根据培养宿主细胞的普通方法,可以在培养基上培养本发明的转化体。用于从作为宿主的原核生物(例如,大肠杆菌)或真核生物(例如,酵母)得到的转化体的培养基可以是自然产生的培养基或合成的培养基,只要培养基含有本发明的生物可以同化的碳源、氮源、无机盐等、且培养基能有效地培养转化体即可。
碳源包括生物可以被生物同化的任意的碳源,例如碳水化合物(例如,葡萄糖,果糖,蔗糖,含有它们的糖蜜,淀粉,淀粉水解物,等),有机酸(例如,醋酸,丙酸,等),醇(例如,乙醇,丙醇,等),等。
氮源包括无机酸或有机酸的铵盐(例如,氨,氯化铵,硫酸铵,醋酸铵,磷酸铵,等),和其它含氮的物质(例如,蛋白胨,肉提取物,酵母提取物,玉米浆,酪蛋白水解物,大豆饼,和大豆饼水解物,各种发酵细菌和其消化产物),等。
可以使用无机酸的盐,例如磷酸钾(I),磷酸钾(II),磷酸镁,氯化钠,硫酸铁(I),硫酸锰,硫酸铜,碳酸钙,等。对于振荡培养、深通气搅拌培养等,在通气条件下进行培养。
培养温度优选地是15-40℃,且可以使用其它温度。具体地,如果根据本发明生产温度抗性的生物或细胞,则其它温度可以是最合适的。培养时间通常是5小时至7天。培养基的pH维持在3.0-9.0。具体地,如果根据本发明生产酸或碱抗性的生物或细胞,则其它pH可以是最合适的。使用无机酸或有机酸、碱溶液,脲,碳酸钙,氨,等调节pH。在培养过程中,可以将抗生素例如氨苄青霉素、四环素等任选地加入培养基中。
当培养已经使用含有诱导型启动子的表达载体转化的微生物时,可以给培养基任选地补充诱导物。例如,当培养已经使用含有lac启动子的表达载体转化的微生物时,可以向培养基中加入异丙基-β-D-硫代吡喃型半乳糖苷等。当培养已经使用含有trp启动子的表达载体转化的微生物时,可以向培养基中加入吲哚丙烯酸等。可以使用发酵罐大规模地培养已经向其中导入了基因的细胞或器官。培养基的实例包括但不限于:常用的MurashigeMurashige-Skoog(MS)培养基,White培养基,或添加了植物激素(例如生长素,细胞因子等)的这些培养基。
例如,当使用动物细胞时,用于培养细胞的本发明的培养基包括常用的RPMI1640培养基(The Journal of the American MedicalAssociation,199,519(1967)),Eagle′s MEM培养基(Science,122,501(1952)),DMEM培养基(Virology,8,396(1959)),199培养基(Proceedings of the Society for the Biological Medicine,73,1(1950))或补充了胎牛血清的这些培养培养基等。
培养一般在例如25-40℃、5%CO2的气氛下,在pH6-8的培养基中进行1-7天。在培养过程中,可以任选地向培养基中加入抗生素,例如卡那霉素、青霉素、链霉素等。
使用本领域众所周知的和常用的分离或纯化酶的普通方法,可以从已经转化了能编码多肽的核酸序列的转化体的培养物中分离或纯化出本发明的多肽。例如,当本发明的多肽分泌到用于生产多肽的转化体外时,对培养物进行离心等,以得到可溶的级分。通过如下技术,例如溶剂提取,用硫酸铵等进行盐析/脱盐,用有机溶剂进行沉淀,用树脂(例如,二乙氨乙基(DEAE)-琼脂糖,DIAION HPA-75(Mitsubishi Chemical Corporation),等)进行阴离子交换层析,用树脂(例如,S-琼脂糖FF(Pharmacia),等)进行阳离子交换层析,用树脂(例如,丁基琼脂糖,苯基琼脂糖,等)进行疏水层析,具有分子筛的凝胶过滤,亲和层析,层析聚焦,电泳(例如,等电聚焦电泳,等)等,可以从可溶级分得到纯化样品。
当本发明的多肽以溶解形式积累在用于生产多肽的本发明的转化体细胞中时,离心培养物,以收集培养物中的细胞。洗涤细胞,然后使用超声波粉碎机、弗氏压碎器、MANTON GAULIN匀浆器、Dinomil,等来粉碎细胞,以得到无细胞的提取液。通过离心无细胞的提取液,或通过如下技术,例如溶剂提取,用硫酸铵等进行盐析/脱盐,用有机溶剂进行沉淀,用树脂(例如,二乙氨乙基(DEAE)-琼脂糖,DIAIONHPA-75(Mitsubishi Chemical Corporation),等)进行阴离子交换层析,用树脂(例如,S-琼脂糖FF(Pharmacia),等)进行阳离子交换层析,用树脂(例如,丁基琼脂糖,苯基琼脂糖,等)进行疏水层析,具有分子筛的凝胶过滤,亲和层析,层析聚焦,电泳(例如,等电聚焦电泳,等)等,可以从上清液得到纯化样品。
当本发明的多肽已经表达、且已经在细胞内形成不溶体时,收获细胞,粉碎,并离心。使用常用的方法,从得到沉淀级分中,收集本发明的多肽。使用多肽变性剂,使不溶的多肽溶解。稀释得到的溶解液,或在无变性剂的溶液或稀释溶液(其中多肽变性剂的浓度很低,不会使多肽变性)中透析。使本发明的多肽形成正常的三维结构,并通过如上所述的分离和纯化,得到纯化样品。
可以根据常用的蛋白纯化方法进行纯化(J.Evan.Sadler等:Methods in Enzymology,83,458)。或者,可以将本发明的多肽与其它蛋白融合,以生成融合蛋白,并使用对融合蛋白具有亲和力的物质,通过亲和层析纯化融合蛋白(Akio Yamakawa,ExperimentalMedicine,13,469-474(1995))。例如,根据Lowe等,Proc.Natl.Acad.Sci.,USA,86,8227-8231(1989),Genes Develop.,4,1288(1990))所述的方法,生产本发明的多肽与A蛋白的融合蛋白,然后用使用免疫球蛋白G的亲和层析进行纯化。
生产本发明的多肽与FLAG肽的融合蛋白,然后通过使用抗-FLAG抗体的亲和层析进行纯化(Proc.Natl.Acad.Sci.,USA,86,8227(1989),Genes Develop.,4,1288(1990))。
通过使用能结合多肽的抗体的亲和层析,可以纯化本发明的多肽。根据已知的方法,可以使用体外转录/翻译系统生产本发明的多肽(J.Biomolecular NMR,6,129-134;Science,242,1162-1164;J.Biochem.,110,166-168(1991))。
还可以通过化学合成方法,例如Fmoc方法(芴基甲氧基羰基方法)、tBoc方法(叔丁氧基羰基方法),等,基于其氨基酸信息,生产本发明的多肽。可以使用肽合成仪(由下述公司生产:AdvancedChemTech,Applied Biosystems,Pharmacia Biotech,ProteinTechnology Instrument,Synthecell-Vega,PerSeptive,Shimazu,等)化学地合成肽。
通过蛋白化学中常用的方法(见,例如,Hisashi Hirano.″Protein Structure Analysis for Gene Cloning″,Tokyo KagakuDojin出版,1993),可以分析纯化的本发明的多肽的结构。通过已知的测量技术(Cell,75,1389(1993);J.Cell Bio.,1146,233(1999);Cancer Res.58,1238(1998);Neuron 17,1157(1996);Science 289,1197(2000);等),可以测量本发明的新的ps20-样肽的生理活性。
(筛选)
如本文所使用的,术语“筛选”指使用特异性的操作/评价方法,从含有许多元素的群体中,选择具有给定的特定目标性质的靶,例如生物、物质等。为了筛选,可以使用本发明的试剂(例如,抗体)、多肽或核酸分子。可以使用体外地、体内地等(利用使用真实物质的系统)或者计算机地(in silico)(利用使用计算机的系统)得到的文库进行筛选。应当明白,本发明包括通过筛选得到的具有需要的活性的化合物。本发明还意在提供基于本发明的公开内容、通过计算机建模生成的药物。
筛选或鉴定方法是本领域众所周知的,且可以用例如微量滴定板、分子(例如DNA、蛋白等)的阵列或芯片等实现。要筛选的含有样品的受试者的实例包括但不限于基因文库、使用组合文库合成的化合物文库等。
因此,在本发明的一个优选的实施方案中,提供了用于鉴别能调节障碍或疾病的试剂的方法。这样的调节试剂可以用作用于该疾病的药物或其前体。本发明包括这样的调节剂、含有调节剂的药物和使用它们的疗法。
因此,认为本发明提供了根据本发明的公开内容、通过计算机建模得到的药物。
在本发明的另一个实施方案中,本发明包括通过计算机辅助的定量结构活性关系(QSAR)建模技术得到的化合物,该技术用作筛选具有有效调节活性的本发明的化合物的工具。在这里,计算机技术包括通过计算机制备出的几种底物模板、药效团、本发明的活性部分的同源性模型,等。一般地,基于体外得到的数据,为能与另一种物质相互作用的物质的一般的特征组建模的方法包括近来的CATALYSTTM药效团方法(Ekins等,Pharmacogenetics,9:477-489,1999;Ekins等,J.Pharmacol.& Exp.Ther.,288:21-29,1999;Ekins等,J.Pharmacol.& Exp.Ther.,290:429-438,1999;Ekins等,J.Pharmacol.& Exp.Ther.,291:424-433,1999),可比较的分子场分析(CoMFA)(Jones等,Drug Metabolism & Disposition,24:1-6,1996),等。在本发明中,可以使用分子建模软件(例如,CATALYSTTM第4版(Molecular Simulations,Inc.,San Diego,CA),等)进行计算机建模。
使用本领域已知的各种计算机建模技术中的任一种,可以进行化合物关于活性部位的匹配。使用程序,例如QUANTA(MolecularSimulations,Burlington,MA,1992),SYBYL(Molecular ModelingSoftware,Tripos Associates,Inc.,St.Louis,MO,1992),AMBER(Weiner等,J.Am.Chem.Soc.,106:765-784,1984),CHARMM(Brooks等,J.Comp.Chem.,4:187-217,1983),等,可以进行化合物的关于活性部位的视觉检查和手工操作。另外,使用标准力场,例如CHARMM,AMBER,等,可以进行能量最小化。其它的专业的计算机建模方法的实例包括GRID(Goodford等,J.Med.Chem.,28:849-857,1985),MCSS(Miranker和Karplus,Function andGenetics,11:29-34,1991),AUTODOCK(Goodsell和Olsen,Proteins:Structure,Function and Genetics,8:195 to202,1990),DOCK(Kuntz等,J.Mol.Biol.,161:269to 288,1982),等。而且,利用计算机程序,例如LUDI(Bohm,J.Comp.Aid.Molec.Design,6:61 to 78,1992),LEGEND(Nishibata和Itai,Tetrahedron,47:8985,1991),LeapFrog(Tripos Associates,St.Louis,MO)等,使用空的活性部位、已知的小分子化合物的活性部位,可以新构建出结构化合物。上述的建模方法是本领域常用的。基于本说明书的公开内容,本领域的技术人员可以适当地设计出本发明包括的化合物。
(疾病)
本发明可以靶向目标生物可能患有的疾病和障碍(例如,模型动物的生产,等)。
在一个实施方案中,本发明靶向的疾病和障碍可能与循环系统(血液细胞,等)有关。疾病或障碍的实例包括但不限于:贫血(例如,再生障碍性贫血(具体地,严重的再生障碍性贫血),肾贫血,癌性贫血,继发性贫血,难治性贫血,等),癌症或肿瘤(例如,白血病);和为此进行化学治疗后的,造血失败,血小板减少,急性髓细胞性白血病(具体地,首次缓和(高危组),二次缓和和其后),急性淋巴细胞性白血病(具体地,首次缓和,二次缓和和其后),慢性髓细胞性白血病(具体地,慢性阶段,迁移阶段),恶性淋巴瘤(具体地,首次缓和(高危组),二次缓和和其后),多发性骨髓瘤(具体地,发作后的早期阶段),等。
在另一个实施方案中,本发明靶向的疾病和障碍可能与神经系统有关。这样的疾病或障碍的实例包括但不限于:痴呆,脑中风和其后遗症,脑肿瘤,脊髓损伤,等。
在另一个实施方案中,本发明靶向的疾病和障碍可能与免疫有关。这样的疾病或障碍的实例包括但不限于:T-细胞缺陷综合征,白血病,等。
在另一个实施方案中,本发明靶向的疾病和障碍可能与运动器官和骨骼系统有关。这样的疾病或障碍的实例包括但不限于:骨折,骨质疏松症,关节脱位,半脱位,扭伤,韧带损伤,骨关节炎,骨肉瘤,尤因肉瘤,故生成缺陷,骨软骨发育不良,等。
在另一个实施方案中,本发明靶向的疾病和障碍可能与皮肤系统有关。这样的疾病或障碍的实例包括但不限于:毛发缺乏,黑素瘤,cutis matignant lympoma,血管肉瘤,组织细胞增多病,水疱病,脓疱病,皮炎,湿疹,等。
在另一个实施方案中,本发明靶向的疾病和障碍可能与内分泌系统有关。这样的疾病或障碍的实例包括但不限于:下丘脑/垂体病,甲状腺病,副甲状腺(甲状旁腺)病,肾上腺皮质/髓质病,糖代谢异常,脂代谢异常,蛋白代谢异常,核酸代谢异常,先天性代谢错误(苯丙酮酸尿,半乳糖血症,高胱氨酸尿,枫糖尿症),无清蛋白血,缺少抗坏血酸合成能力,高胆红素血,高胆红素尿,激肽释放酶缺乏,肥大细胞缺乏,尿崩症,血管升压素分泌异常,侏儒,Wolman氏病(酸性脂肪酶缺乏)),黏多糖贮积病VI,等。
在另一个实施方案中,本发明靶向的疾病和障碍可能与呼吸系统有关。这样的疾病或障碍的实例包括但不限于:肺病(例如,肺炎,肺癌,等),支气管病,等。
在另一个实施方案中,本发明靶向的疾病和障碍可能与消化系统有关。这样的疾病或障碍的实例包括但不限于:食道病(例如,食道癌,等),胃/十二指肠病(例如,胃癌,十二指肠癌,等),小肠病/大肠病(例如,结肠息肉,结肠癌,直肠癌,等),胆管病,肝病(例如,肝硬化,肝炎(甲型、乙型、丙型、丁型、戊型等),暴发型肝炎,慢性肝炎,原发型肝癌,酒精性肝病,药物诱导的肝障碍,等),胰腺病(急性胰腺炎,慢性胰腺炎,胰腺癌,囊性胰腺病,等),腹膜/腹壁/隔膜病(疝,等),Hirschsprung氏病,等。
在另一个实施方案中,本发明靶向的疾病和障碍可能与泌尿系统有关。这样的疾病或障碍的实例包括但不限于:肾病(例如,肾衰竭,原发性肾小球病,肾血管障碍,肾小管功能异常,间质肾病,由于全身病引起的肾病,肾癌,等),膀胱病(例如,膀胱炎,膀胱癌,等),等。
在另一个实施方案中,本发明靶向的疾病和障碍可能与生殖系统有关。这样的疾病或障碍的实例包括但不限于:雄性生殖器官病(例如,雄性不育,前列腺肥大,前列腺癌,睾丸癌,等),雌性生殖器官病(例如,雌性不育,卵巢功能障碍,子宫肌瘤,子宫内膜异位,子宫癌,子宫内膜炎,卵巢癌,长柔毛性病,等),等。
在另一个实施方案中,本发明靶向的疾病和障碍可能与循环系统有关。这样的疾病或障碍的实例包括但不限于:心衰竭,心绞痛(angina pectoris),心肌梗塞,心律失常,心瓣炎,心肌/心包病,先天性心脏病(例如,房间隔缺损,动脉管不闭合(arterial canalpatency),Fallot四联症,等),动脉病(例如,动脉硬化,动脉瘤),静脉病(例如,静脉曲张,等),淋巴管病(例如,淋巴水肿,等),等。
本发明靶向的疾病(损害)和障碍可以包括植物的疾病和障碍。疾病和障碍的实例包括但不限于:稻瘟病,寒冷天气导致的障碍,等。
当根据本发明得到的产物物质等用作药物时,该药物还可以包含药学上可接受的载体。任意的本领域已知的药学上可接受的载体可以用在本发明的药物中。
药学上可接受的载体或合适的制剂材料的实例包括但不限于:抗氧化剂,防腐剂,着色剂,调味剂,稀释剂,乳化剂,悬浮剂,溶剂,填充剂,增量剂(bulky agent),缓冲液,送递载体,和/或药物佐剂。代表性地,以组合物的形式施用本发明的药物,该组合物包含脂联素(adiponectin)或其变体或片段,或其变体或衍生物和至少一种生理上可接受的载体、赋形剂或稀释剂。例如,适当的载体可以是注射液、生理溶液或人工脑脊液,其可以补充常用于肠胃外送递的组合物中的其它物质。
这里使用的可接受的载体、赋形剂或稳定剂优选地是对受体无毒的,且优选地在采用的剂量和浓度是惰性的,优选地包括磷酸盐,柠檬酸盐,或其它有机酸;抗坏血酸,α-生育酚;小分子量的多肽;蛋白(例如,血清清蛋白,明胶或免疫球蛋白);亲水的聚合物(例如,聚乙烯吡咯烷酮);氨基酸(例如,甘氨酸,谷氨酰胺,天冬酰胺,精氨酸或赖氨酸);单糖,二糖,和其它碳水化合物(葡萄糖,甘露糖,或糊精);螯合剂(例如,EDTA);糖醇(例如,甘露醇或山梨醇);成盐平衡离子(例如,钠);和/或非离子型表面活性剂(例如,Tween,普流罗尼类(pluronics)或聚乙二醇(PEG))。
适当的载体的实例包括中性的缓冲盐水或与血清清蛋白混合的盐水。优选地,使用适当的赋形剂(例如,蔗糖),将产物制成冻干剂。根据需要,可以包含其它标准载体、稀释剂和赋形剂。其它示例性的组合物包含约pH7.0-8.5的Tris缓冲液或约pH4.0-5.5的醋酸盐缓冲液,其还可以包含山梨醇或其合适的替代品。
在下文中,将描述本发明的药物的常用的制备方法。应当注意,使用已知的制备方法,可以制备出动物药物组合物、类药品(quasi-drug)、海洋药物组合物、食品组合物、化妆品组合物等。
可以将本发明的产物等与药学上可接受的载体混合,并可以作为固体制剂(例如,片剂,胶囊,颗粒,强散剂,粉末,栓剂,等)或液体制剂(例如,糖浆,注射剂,悬浮液,溶液,喷雾剂,等)经口地或肠胃外地施用。药学上可接受的载体的实例包括固体制剂中的赋形剂,润滑剂,粘合剂,崩解剂,崩解抑制剂,吸收促进剂,吸附剂,湿润剂,增溶剂,稳定剂等;和液体制剂中的溶剂,增溶剂,悬浮剂,等渗剂,缓冲剂,光滑剂等。可以任选地使用制剂的添加剂,例如防腐剂,抗氧化剂,着色剂,增甜剂,等。可以将本发明的组合物与本发明的产物物质等以外的物质混合。肠胃外的施用途径的的实例包括但不限于:静脉内注射,肌内注射,鼻内的,直肠,阴道,经皮,等。
固体制剂中的赋形剂的实例包括葡萄糖,乳糖,蔗糖,D-甘露醇,结晶纤维素,淀粉,碳酸钙,轻硅酸酐,氯化钠,高岭土,脲,等。
固体制剂中的润滑剂的实例包括但不限于:硬脂酸镁,硬脂酸钙,硼酸粉末,胶态二氧化硅,滑石,聚乙二醇,等。
固体制剂中的粘合剂的实例包括但不限于:水,乙醇,丙醇,蔗糖,D-甘露醇,结晶纤维素,葡聚糖,甲基纤维素,羟丙基纤维素,羟丙基甲基纤维素,羧甲基纤维素,淀粉溶液,明胶溶液,聚乙烯吡咯烷酮,磷酸钙,磷酸钾,虫胶,等。
固体制剂中的崩解剂的实例包括但不限于:淀粉,羧甲基纤维素,羧甲基纤维素钙,琼脂粉,昆布多糖粉,交联甲羧纤维素钠,羧甲基淀粉钠,藻酸钠,碳酸氢钠,碳酸钙,聚氧乙烯山梨聚糖脂肪酸酯,月桂基硫酸钠,淀粉,单硬脂酸甘油酯,乳糖,甘醇酸纤维素钙,等。
固体制剂中的崩解抑制剂的实例包括但不限于:加氢油,蔗糖,硬脂精,可可脂,氢化油,等。
固体制剂中的吸收促进剂的实例包括但不限于:季铵盐,月桂基硫酸钠,等。
固体制剂中的吸收剂的实例包括但不限于:淀粉,乳糖,高岭土,膨润土,胶态二氧化硅,等。
固体制剂中的湿润剂的实例包括但不限于:甘油,淀粉,等。
固体制剂中的增溶剂的实例包括但不限于:精氨酸,谷氨酸,天冬氨酸,等。
固体制剂中的稳定剂的实例包括但不限于:人血清清蛋白,乳糖,等。
当制作片剂、丸剂等作为固体制剂时,它们可以任选地包被可溶于胃或肠中的物质膜(蔗糖,明胶,羟丙基纤维素,邻苯二甲酸羟丙基甲基纤维素酯,等)。片剂包括任选地带有一般的包衣的那些(例如,糖衣片,明胶包衣的片剂,肠溶衣包衣的片剂,薄膜包衣的片剂或双片剂,多层片剂,等)。胶囊包括硬胶囊和软胶囊。当将片剂制成栓剂的形式时,除了上述的添加剂以外,可以加入高级醇、高级醇酯、半合成的甘油酯等。本发明不限于此。
优选的液体制剂中的溶液的实例包括注射液,醇,丙二醇,聚乙二醇,芝麻油,玉米油,等。
优选的液体制剂中的增溶剂的实例包括但不限于:聚乙二醇,丙二醇,D-甘露醇,苯甲酸苄酯,乙醇,trisaminomethane,胆固醇,三乙醇胺,碳酸钠,柠檬酸钠,等。
优选的液体制剂中的悬浮剂的实例包括表面活性剂(例如,硬脂酰三乙醇胺,月桂基硫酸钠,月桂基氨基丙酸,卵磷脂,苯扎氯铵,苄索氯铵,单硬脂酸甘油酯,等),亲水的大分子(例如,聚乙烯醇,聚乙烯吡咯烷酮,羧甲基纤维素钠,甲基纤维素,羟甲基纤维素,羟乙基纤维素,羟丙基纤维素,等),等。
优选的液体制剂中的等渗剂的实例包括但不限于:氯化钠,甘油,D-甘露醇,等。
优选的液体制剂中的缓冲剂的实例包括但不限于:磷酸盐,醋酸盐,碳酸盐,柠檬酸盐,等。
优选的液体制剂中的光滑剂的实例包括但不限于:苯甲醇,苯扎氯铵,盐酸普鲁卡因,等。
优选的液体制剂中的防腐剂的实例包括但不限于:对羟基苯甲酸酯,氯丁醇,苯甲醇,2-苯乙醇,脱氢醋酸,山梨酸,等。
优选的液体制剂中的抗氧化剂的实例包括但不限于:亚硫酸盐,抗坏血酸,α-生育酚,半胱氨酸,等。
当制备液体试剂和悬浮液作为注射剂时,它们是灭过菌的,且优选地与血液等渗。一般地,通过使用截留细菌的过滤器等的过滤、与杀细菌剂混合或辐射等,使这些试剂无菌。在这些处理后,通过冻干等可以将这些试剂制成固体。在即将使用之前,可以加入无菌水或无菌注射稀释剂(盐酸利多卡因水溶液,生理盐水,葡萄糖水溶液,乙醇或其混合溶液,等)。
本发明的药物组合物还可以包含着色剂、防腐剂、调味剂、芳香化合物、增甜剂或其它药物。
本发明的药物可以经口地或肠胃外地施用。或者,本发明的药物可以静脉内地或皮下地施用。当全身施用时,用于本发明的药物可以是无致热原的药学上可接受的水溶液形式。制备这样的药学上可接受的组合物(适当考虑pH,等渗性,稳定性等)在本领域的技术范围内。施用方法在这里可以包括经口施用和肠胃外施用(例如,静脉内的,肌内的,皮下的,皮内的,粘膜的,直肠内的,阴道的,对于作用位点、皮肤局部的,等)。可以以任意的制剂形式提供用于这样的施用的处方。这样的制剂形式包括液体制剂、注射剂、持续的制剂等。
通过将具有需要的纯度的糖链组合物与任选的生理上可接受的载体、赋形剂或稳定剂混合,可以制备便于以冻干饼或水溶液的形式储存的本发明的药物(Japanese Pharmacopeia第14版或最新版;Remington′s Pharmaceutical Sciences,第18版,A.R.Gennaro,编,Mack Publishing Company,1990;等)
各种送递系统是已知的,且可以用于施用本发明的化合物(例如,脂质体,微粒,微胶囊)。导入方法包括但不限于:皮内的,肌内的,腹膜内的,静脉内的,皮下的,鼻内的,硬膜外的,和经口的途径。化合物或组合物可以通过任意的方便途径施用(例如,通过输注或快速灌注,通过经表皮的或粘膜皮肤衬层(例如,口腔粘膜,直肠和肠粘膜,等)的吸收,且可以与其它生物活性剂一起施用。施用可以是全身的或局部的。另外,通过任意的合适途径(包括心室内的和鞘内的注射;心室内的注射可以由心室内导管促进,例如,该导管附着到贮器,例如奥马耶贮器),可以理想地将本发明的药物化合物或组合物导入中枢神经系统。还可以采用肺部施用,例如,通过施用吸入器或喷雾器,或与喷雾剂配制。
在一个具体的实施方案中,可以理想地将本发明的产物物质或包含它的组合物局部地施用于需要治疗的区域(例如,中枢神经系统,脑,等);这可以通过例如但不限于手术过程中的局部的输注、局部应用(例如,与手术后的伤口敷料结合),通过注射,通过导管,通过栓剂,或通过植入物(该植入物是多孔的、无孔的或胶质材料,包括膜,例如sialastic膜,或纤维)来实现。优选地,当施用本发明的蛋白(包括抗体)时,必须小心地使用该蛋白不会吸收于其上的材料。
在另一个实施方案中,可以在小泡(特别是脂质体)中送递化合物或组合物(见Langer,Science 249:1527-1533(1990);Treat等,Liposomes in the Therapy of Infectious Disease and Cancer,Lopez-Berestein和Fidler(编),Liss,New York,第353-365第(1989);Lopez-Berestein,同上,第317-327第;一般地见同上)。
在另一个实施方案中,可以在控释系统中送递化合物或组合物。在一个实施方案中,可以使用泵(见Langer,同上;Sefton,CRC Crit.Ref.Biomed.Eng.14:201(1987);Buchwald等,Surgery 88:507(1980);Saudek等,N.Engl.J.Med.321:574(1989))。在另一个实施方案中,可以使用聚合物材料(见Medical Applications ofControlled Release,Langer和Wise(编.),CRC Pres.,Boca Raton,Florida(1974);Controlled Drug Bioavailability,Drug ProductDesign and Performance,Smolen和Ball(编.),Wiley,New York(1984);Ranger和Peppas,J.,Macromol.Sci.Rev.Macromol.Chem.23:61(1983);也见Levy等,Science 228:190(1985);During等,Ann.Neurol.25:351(1989);Howard等,J.Neurosurg.71:105(1989))。
在另一个实施方案中,可以将控释系统置于治疗靶(即脑)附近,因而仅仅需要全身剂量的一部分(见,例如,Goodson,in MedicalApplications of Controlled Release,同上,vol.2,pp.115-138(1984))。
Langer(Science 249:1527-1533(1990))的综述中讨论了其它的控释系统。
根据使用目的、靶疾病(类型、严重性等)、患者的年龄、体重、性别和病史、细胞的形式或类型等,本领域的技术人员可以容易地确定在本发明的治疗方法中使用的化合物的量。根据使用目的、靶疾病(类型、严重性等)、患者的年龄、体重、性别和病史、治疗的进程等,本领域的技术人员也可以确定应用于受试者(患者)的本发明的治疗方法的频率。频率的实例包括每天一次至数月一次(例如,每周一次至每月一次)。优选地,根据进程,每周一次至每月一次地进行施用。
本发明的产物物质等的剂量随受试者的年龄、体重和状况或施用方法等而异,通常包括但不限于,在成年人经口施用的情况下,每天0.01mg-10g,优选地0.1mg-1g,1mg-100mg,0.1mg-10mg,等;在肠胃外施用的情况下,0.01mg-1g,优选地0.01mg-100mg,0.1mg-100mg,1mg-100mg,0.1mg-10mg,等。本发明不限于此。
如本文所使用的,术语“施用”指使本发明多肽、多核苷酸等或含有它们的药物组合物单独地或于其它治疗剂组合地整合进生物的细胞组织中。可以伴随地(例如,作为混合物)、分开地但是同时地或并发地、或顺序地施用组合。这包括将组合的试剂一起作为治疗混合物施用的表现形式,也包括分开地但是同时地施用组合的试剂的方法(例如,经分开的静脉内衬层进入相同的个体)。“组合”施用还包括分开施用特定的化合物或试剂中的一种,然后施用第二种。
如本文所使用的,“说明书”为施用或受用该药物等的人或诊断或受诊的人(例如,医生,患者等)描述了施用本发明的药物的方法、诊断的方法等。说明书描述了指示施用本发明的诊断、药物等的适当方法的状态。根据本发明所应用的国家的主管部门(例如,日本的Health,Labor and Welfare Ministry,美国的Food and DrugAdministration(FDA),等)限定的格式,制备了说明书,其明确地记述到,说明书得到了主管部门的批准。说明书是所谓的包装插页,且一般提供在纸介质上。说明书不限于此,且可以以电子介质的形式提供(例如,因特网上提供的网站和电子邮件)。
使用可商业上获得的测定或设备进行的标准临床实验室的结果或表征目标疾病的临床症状的消失,可以支持使用本发明的方法治疗结束的判断。目标疾病复发后,可以恢复治疗。
本发明还提供了药物包或试剂盒,其包含一个或多个装有一种或多种药物组合物的容器。可以将由管理药物产品或生物产品的生产、使用或销售的政府机关规定的形式的说明任意地贴在这样的容器上,表明关于施用于人的生产、使用或销售的政府机关的批准。
(本发明的优选实施方案的描述)
在下文中,将通过实施例描述本发明。下面描述的实施例仅仅用于解释目的。因此,本发明的范围除了如所附的权利要求书所示之外不受限制。
在本发明的一个方面,提供了调节生物或细胞的遗传性状的转化率的方法。该方法包括下述步骤:(a)调节生物或细胞的基因在复制中倾向于错误的频率。在该情况下,可以通过调节DNA聚合酶的校对功能来调节倾向于错误的频率,例如,或者可选择地,通过增加DNA聚合酶的聚合反应中的错误。使用本领域众所周知的技术,可以实现这样的倾向于错误的频率的调节。倾向于错误的频率的调节,可以提供快速诱变,其程度不能常规地实现,且接近自然的进化。另外,与本领域已知的使用UV、化学物质等的任意的诱变方法相比,可以基本上减少比有益突变更频率地发生的有害突变。这是因为,在发明的方法中,导入的突变是与自然产生的进化现象相同的现象。
在本发明的使细胞或生物进化的方法中,可以分开进行调节倾向于错误的频率的步骤和筛选得到的细胞或生物的需要的性状的步骤。通过分开进行2个步骤,可以在不施加选择压力的条件下调节倾向于错误的频率(或进化速度);可以使个体的数目增加至特定的数目;并筛选和鉴别变体。类似地在第2次和此后重复这些步骤,从而可以经济地和有效地得到进化的细胞或目标生物。
在常规方法中,有益突变的发生频率随着生物或细胞的突变频率的增加而增加。但是,同时也会发生有害突变。一般地,有害突变的发生频率较高,以致与本领域已知的使用UV、化学物质等的任意的诱变方法提供的有害突变的发生频率相比,有益突变的发生频率显著降低。因此,在常规方法中,不可能诱导生物或细胞中的许多有益的突变,同时使与本领域已知的使用UV、化学物质等的任意的诱变方法相比,有害突变的发生频率可以显著降低。
在一些常规的诱变方法中,采用自然突变。但是,在该情况下,自然突变的发生频率相当低(例如,对于大肠杆菌,10-10突变(每个碱基,每次复制),等)。因此,自然突变的速度难以进行实践。另外,有益的突变很少自然发生。因此,依赖于自然突变的育种需要大量的生物群体和较长的时间段。与使用自然突变的方法不同,本发明的方法只需要少量的生物群体和与约1代至数代相对应的时间。本发明的效果是巨大的。
在定位诱变中,仅仅可以诱导预定的突变。尽管可靠性良好,但定位诱变还是不适用于大规模使用,且突变的性质也不是对整个生物都有影响。因而,定位诱变不一定造成有益的突变。因此,不能认为定位诱变是模仿自然进化,且其具有缺点,因为与其伴随着由于基因重组造成的负作用。本发明可以提供与自然诱变基本上相同的诱变,但不是人工诱变。
作为其它的诱变方法,还有使用辐射、诱变物等的方法。这些方法可以以比自然突变更高的频率产生突变。但是,有效剂量的辐射或有效浓度的诱变物可能杀死大多数处理的细胞。换言之,有害的突变对生物是致死的。在使用诱变物的方法中,不能无有害突变地诱导诱变。通过本发明的方法,与上述例如UV、化学物质等的方法相比,有害突变的发生频率可以显著降低。本发明的方法只需要少量的生物群体和与约1代至数代相对应的时间。
在根据本发明使用不一致理论调节遗传性状的转化率的方法中,通过使用具有受调节的校对功能的DNA聚合酶,在双链基因组DNA的一条链中比在另一条链中导入了更大量的突变。本发明首次在实验水平证实,可以积累许多有益的突变,而不积累有害的突变。因此,本发明驳斥了不一致理论,所述理论认为预期许多突变导入了生物中,但是不能维持生物的正常生长(代谢,等)。因而,本发明是划时代的发明。具体地,真核生物具有许多双向复制起点。如果基因组DNA具有双向复制起点,那么不一致方法不能积累许多有益的突变,而不积累有害的突变。根据本发明的方法,证实了即使在真核生物中,也可以积累许多有益的突,而不积累有害的突变。
在一个优选的实施方案中,可以有利地将具有改变的校对功能的DNA聚合酶仅仅导入后随链和前导链中的一条。
认为通过本发明实现的令人满意的育种,能实现高速度的生物进化。高速度的生物进化一般需要群体的大量的遗传多样性和有益突变株的稳定扩展。通过精确的DNA复制,可以实现稳定扩展,同时在DNA复制过程中由错误造成的突变会产生遗传多样性。
本发明的效果是,即使在真核生物中也可以实现高速度的进化。真核生物具有明确的核结构,且它们的基因组由许多染色体组成,这与大肠杆菌不同。因此,可以认为本发明具有从常规技术不能预见到的效果。即使在大肠杆菌中可以调节进化速度,也不能预见到在真核生物或革兰氏阳性的细菌中可以调节进化速度,直到这被本文的实例所证实。
在一个优选的实施方案中,在基因复制中起作用的试剂包括至少2种倾向于错误的频率的试剂。这2种倾向于错误的频率的试剂优选地是DNA聚合酶。这些DNA聚合酶具有不同的倾向于错误的频率。在一个优选的实施方案中,倾向于错误的频率的试剂可以有利地包括至少约30%的具有更低的倾向于错误的频率的试剂,更优选地至少约20%,且甚至更优选地至少约15%。利用该特征,存在渐增的由急剧进化生成突变体、同时进行稳定复制的可能。
在另一个优选的实施方案中,根据本发明在基因复制中起作用的试剂(例如,DNA聚合酶,等)有利地具有不同的倾向于错误的频率。不一致的倾向于错误的频率会增加与常规技术相比的进化速度和去除错误阈值的上限。
在一个优选的实施方案中,具有较低的倾向于错误的频率的试剂基本上是无错误的。但是,可以优选地使用具有倾向于错误的频率,以致于每个基因组基本上无错误的试剂。
因此,在一个优选的实施方案中,至少2种倾向于错误的频率一般彼此相差至少101,优选地至少102,且更优选地至少103。利用这样的频率差异,可以有效地调节进化速度。
在本发明的一个实施方案中,调节倾向于错误的频率的步骤包含调节生物的DNA聚合酶的倾向于错误的频率。通过直接修饰存在于生物中的DNA聚合酶,或者通过将外部地具有修饰的倾向于错误的频率的DNA聚合酶导入生物中,可以调节目标生物的DNA聚合酶的倾向于错误的频率。通过本领域众所周知的生物技术,可以这样修饰DNA聚合酶。该技术描述在本说明书的其它部分。在一个非限制性的实例中,通过使其中已经导入了突变的生物品系进行杂交,可以直接修饰DNA聚合酶。
在另一个实施方案中,DNA聚合酶具有校对功能。在目标生物中,一般存在具有校对功能的DNA聚合酶。这样的具有校对功能的DNA聚合酶的实例包括但不限于:DNA聚合酶δ和ε,DnaQ,具有修复功能的DNA聚合酶β,θ和λ,等。通过直接修饰存在于生物中的DNA聚合酶,或者通过将外部地具有修饰的校对功能的DNA聚合酶导入生物中,可以调节DNA聚合酶的校对功能。通过本领域众所周知的生物技术,可以这样修饰DNA聚合酶。该技术描述在本说明书的其它部分。在一个非限制性的实例中,通过使其中已经导入了突变的生物品系进行杂交,可以直接修饰DNA聚合酶。优选地,使能编码修饰的DNA聚合酶的核酸分子整合进质粒中,并将该质粒导入生物中,从而使该核酸分子暂时地表达。由于质粒等的暂时表达性质等,质粒等会消失。因而,当不再需要调节遗传性状的转化率后,可以恢复与野生型相同的转化率。
在另一个实施方案中,本发明的DNA聚合酶包括至少一种选自下述的聚合酶:真核生物的DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。在另一个优选的实施方案中,仅仅可以修饰一种用于本发明的DNA聚合酶,其选自真核生物的DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。通过修饰仅仅一种DNA聚合酶的倾向于错误的频率,可以保留曾经出现的基因型(包括野生型);可以允许高速度的突变;可以改善基因组中的广范围(基因);可以保证原始性状,且可以增加多样性;可以使进化加速至超过常规水平的速度;且突变的性状是稳定的。
在本发明的另一个实施方案中,调节倾向于错误的频率的步骤包含调节至少一种选自下述的聚合酶:真核生物的DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。通过修饰例如聚合酶的3′→5′外切核酸酶活性中心(或者,ExoI基序,校对功能的活性部位)(例如,在位置316处的天冬氨酸和在位置318处的谷氨酸和在人DNA聚合酶δ附近的位点),可以调节这样的校对活性。本发明不限于此。
在本发明的一个优选的实施方案中,调节倾向于错误的频率的步骤包含使倾向于错误的频率增加至高于野生型的水平。通过使倾向于错误的频率增加至高于野生型的水平,可以提高生物的遗传性状转化率(即,进化速度),而不负面影响生物。不能常规地预见到这样的改进。本发明具有极好的效果。
在另一个优选的实施方案中,用于本发明的DNA聚合酶具有低于野生型的校对功能。这样的DNA聚合酶可以是自然产生的,或者,可以是修饰的DNA聚合酶。
在一个实施方案中,(修饰的)用于本发明的DNA聚合酶有利地具有能提供错配的碱基(突变)的校对功能,其数目比野生型DNA聚合酶大至少1。通过提供错配的碱基(突变),其数目比野生型DNA聚合酶大至少1,可以提高生物的遗传性状转化率(即,进化速度),而不负面影响生物。如果突变的碱基的数目大于野生型DNA聚合酶的,则遗传性状转化率趋向于增加。因此,为了提高转化率,优选地进一步降低校对功能。用于测定校对功能的方法是本领域已知的。例如,对通过适当的适用于目标DNA聚合酶的测定系统(通过对复制的产物进行测序来确定;通过测量校对活性来确定)得到的产物直接或间接地进行测序(例如,通过测序仪或DNA芯片)。
在另一个优选的实施方案中,用于本发明的DNA聚合酶有利地具有这样的校对功能,其能提供至少1个错配的碱基(突变)。一般地,野生型DNA聚合酶经常在得到的产物的碱基序列中不提供突变。因此,在这样的情况下,用于本发明的DNA聚合酶变体可能需要具有更低水平的校对功能,其能提供至少1个错配的碱基(突变)。通过上述的测定系统,可以测量这样的校对功能。更优选地,用于本发明的DNA聚合酶具有这样的校对功能,其能提供至少2个错配的碱基(突变),更优选地至少3,4,5,6,7,8,9和10个错配的碱基,更优选地至少15,20,25,50和100个错配的碱基。认为生物的遗传性状转化率(即,进化速度)随着校对功能水平的降低而增加,即碱基序列中错配的碱基(突变)数目的增加。
在另一个实施方案中,用于本发明的DNA聚合酶具有这样的校对功能,其能在碱基序列中提供错配的碱基(突变),其比率为10-6。一般地,在自然产生的生物中以10-12至10-8的比率诱导了突变。因此,在本发明中,优选地采用具有显著降低的校对功能的DNA聚合酶。更优选地,用于本发明的DNA聚合酶具有这样的校对功能,其能在碱基序列中提供错配的碱基(突变),其比率为10-3,甚至更优选地,其比率为10-2。认为生物的遗传性状转化率(即,进化速度)随着校对功能水平的降低而增加,即碱基序列中错配的碱基(突变)数目的增加。
在特定的实施方案中,本发明靶向的生物可以是真核生物。真核生物具有赋予校对功能的机制,其与大肠杆菌的不同。因此,以与大肠杆菌用作模型时不同的方式讨论或解释进化速度。意外地,本发明证实了可以修饰所有生物(包括真核生物)的遗传性状转化率(即,进化速度)。因此,本发明提供了通过常规技术不能预见到的效果。具体地,由于本发明可以调节真核生物的进化速度,所以可以实现下述的各种应用:阐明进化的机制;阐明基因组和性状之间的关系;改良各种高等生物,包括动物和植物;研究现存生物的进化能力;预测将来的生物;生产疾病的动物模型;等。本发明靶向的真核生物的实例包括但不限于:单细胞生物(例如,酵母,等)和多细胞生物(例如,动物和植物)。这样的生物的实例包括但不限于:盲鳗目,七鳃鳗目,软骨鱼纲,硬骨鱼纲,哺乳纲(例如,单孔目,有袋目,无齿类动物,皮翼目,翼手目,食肉动物,食虫动物,长鼻目,奇蹄目,偶蹄目,管齿目,鳞甲目,海牛目,鲸类动物,灵长目,啮齿目,兔形目,等),鸟纲,爬行纲,两栖纲,鱼纲,昆虫纲,蠕虫纲,双子叶植物,单子叶植物(例如、禾本科,例如小麦,玉米,稻,大麦,高粱,等),蕨类植物,苔藓植物,真菌,蓝细菌,等。优选地,本发明靶向的生物可以是多细胞生物。在另一个优选的实施方案中,本发明靶向的生物可以是单细胞生物。在另一个优选的实施方案中,本发明靶向的生物可以是动物、植物或酵母。在一个更优选的实施方案中,本发明靶向的生物可以是但不限于哺乳动物。
在另一个实施方案中,用于本发明的生物或细胞自然地具有至少2种聚合酶。如果存在至少2种聚合酶,则可以容易地提供会产生不同的倾向于错误的频率的环境。更优选地,有利的是,生物或细胞天然地具有至少2种聚合酶,且其倾向于错误的频率彼此不同。这样的生物或细胞可以用于提供修饰的生物或细胞。
在一个优选的实施方案中,在已经转化了需要的性状后,通过本发明的方法得到的修饰的生物或细胞具有与野生型基本上相同的生长。该特征只有在本发明无负作用地调节遗传性状的转化率后才能得到。该特征不能通过常规的诱变方法得到。因而,该特征是本发明提供的有利的效果。可以以与野生型相同的方式处理具有与野生型基本上相同的生长的生物或细胞。
在另一个实施方案中,通过本发明的方法修饰的生物或细胞具有对环境的抗性,修饰前的(即,野生型)生物或细胞对该环境没有抗性。这样的环境的实例包括作为参数的至少一种因素,其选自:温度,湿度,pH,盐浓度,营养物,金属,气体,有机溶剂,压力,大气压力,粘度,流速,光强度,光波长,电磁波,辐射,重力,张力,声波,该生物以外的其它生物(例如,寄生物,等),化学试剂,抗生素,天然物质,心理应激,和机体应激,和其任意组合。因而,可以使用这些因素的任意组合。可以组合任意的2种或更多种因素。
温度的实例包括但不限于:高温,低温,非常高的温度(例如,95℃,等),非常低的温度(例如,-80℃,等),大范围的温度(例如,150至-270℃,等),等。
湿度的实例包括但不限于:100%的相对湿度,0%的相对湿度,0%至100%的任意点,等。
pH的实例包括但不限于:0至14的任意点,等。
盐浓度的实例包括但不限于:NaCl浓度(例如,3%,等),0至100%的其它盐浓度的任意点,等。
营养物的实例包括但不限于:蛋白,葡萄糖,脂类,维生素,无机盐,等。
金属的实例包括但不限于:重金属(例如,汞,镉,等),铅,金,铀,银,等。
气体的实例包括但不限于:氧,氮,二氧化碳,一氧化碳,和其混合物,等。
有机溶剂的实例包括但不限于:乙醇,甲醇,二甲苯,丙醇,等。
压力的实例包括但不限于:0至10吨/cm2的任意点,等。
大气压力的实例包括但不限于:0至100大气压力的任意点,等。
粘度的实例包括但不限于:任意流体(例如,水,甘油,等)或其混合物的粘度,等。
流速的实例包括但不限于:0至光速的任意点。
光强度的实例包括但不限于:黑暗和日光水平之间的点。
光波长的实例包括但不限于:可见光,紫外光(UV-A,UV-B,UV-C,等),红外光(远红外光,近红外光,等),等。
电磁波的实例包括具有任意波长的。
辐射的实例包括具有任意强度的。
重力的实例包括但不限于:任意的地球重力,或从0重力至地球重力的任意点,或大于或等于地球重力的任意重力。
张力的实例包括具有任意强度的。
声波的实例包括具有任意强度和波长的。
目标生物以外的其它生物的实例包括但不限于:寄生物,病原性细菌,昆虫,线虫,等。
化学物质的实例包括但不限于:盐酸,硫酸,氢氧化钠,等。
抗生素的实例包括但不限于:青霉素,卡那霉素,链霉素,喹啉,等。
自然产生的物质的实例包括但不限于:河豚毒素,蛇毒,生物碱,等。
心理应激的实例包括但不限于:饥饿,密度,狭窄的空间,高空,等。
机体应激的实例包括但不限于:振动,噪音,电,冲击,等。
在另一个实施方案中,本发明的方法靶向的生物或细胞具有癌细胞。通过本发明实现的癌症的生物或细胞模型会根据与自然产生的癌症相同的机制产生癌症,这与常规方法不同。因而,癌症的生物或细胞模型可以视作癌症的精确生物或细胞模型。因此,癌症的生物或细胞模型对于开发药物特别有用。
在本发明的另一方面,提供了生产具有受调节的遗传性状的生物或细胞的方法。该方法包含下述步骤:(a)调节或改变生物或细胞中的基因复制的倾向于错误的频率;和(b)繁殖得到的生物或细胞。在该情况下,与调节遗传性状的转化率有关的技术如上所述。因此,上述的技术可以用于改变生物或细胞中的基因复制的倾向于错误的频率的步骤。与调节遗传性状的转化率的方法有关的如上所述的生物或细胞可以用于调节倾向于错误的频率的步骤。
如果生物或细胞具有受调节的遗传性状,则使用本领域已知的任意方法,可以进行繁殖得到的生物或细胞的步骤。繁殖技术包括但不限于:自然现象,例如繁殖,增殖,等;人工技术,例如克隆技术;从培养细胞向个体植物的繁殖;等。通过例如,通过测定碱基序列来证实;鉴别抗原性等;当使用载体时,检测载体;性状恢复实验;和证实突变的高速度和未破坏的相容性,可以确定是否使用这样的技术。基于本说明书,本领域的技术人员可以容易地进行这些实验。
在一个优选的实施方案中,本发明的生物或细胞繁殖方法还包含筛选繁殖的生物或细胞中的具有需要的性状的个体。基于生物或细胞的遗传性状(例如,对上述的各种环境的抗性,等),或在基因或代谢物水平,可以筛选出这样的具有需要的性状的个体。可以通过各种技术确定筛选的结果,包括但不限于肉眼检查、测序、各种生化实验、显微镜观察、染色、免疫测定、行为分析,等。这些技术是本领域已知的,且本领域的技术人员根据本说明书能容易地实现。
在本发明的另一方面,提供了根据本发明生产的、调节了其遗传性状的生物或细胞。以常规技术不能实现的高进化速度得到了该生物或细胞。因此,该生物或细胞的存在本身显然是新颖的。该生物或细胞的特征在于,例如:突变的高速度和无破坏的相容性;SNP(单核苷酸多态性)的偏分布;依赖于个体,突变倾向于甚至在基因组的相同区域中以不同方式积累(具体地,该趋势在没有选择压力的区域更明显);在相同个体的基因组的特定区域(具体地,丰余区)中的突变分布不是随机的,而是明显偏倚的;等。本发明的生物或细胞优选地具有与野生型基本上相同的生长。一般地,已经经历了快速诱变的生物不可能具有与野生型相同的生长。但是,本发明的生物或细胞可以具有与野生型基本上相同的生长。因此,本发明具有这样显著的效果。确认这样的性质的实验是本领域已知的,且本领域的技术人员根据本说明书能容易地实现。
在本发明的另一方面,提供了用于生产能编码具有受调节的遗传性状的基因的核酸分子的方法。该方法包含下述步骤:(a)改变生物或细胞的基因复制的倾向于错误的频率;(b)繁殖得到的生物或细胞;(c)鉴别生物或细胞中的突变;和(d)生产能编码含有鉴别出的突变的基因的核酸分子。在该情况下,用于改变倾向于错误的频率和用于繁殖得到的生物或细胞的技术如上所述,且本领域的技术人员根据本说明书能适当地实现。使用这些技术可以实现本发明的实施方案。
使用本领域众所周知的技术,可以鉴定出生物或细胞中的突变。鉴定技术的实例包括但不限于:分子生物学技术(例如,测序,PCR,DNA印迹,等),免疫化学技术(例如,蛋白印迹,等),显微镜观察,肉眼观察,等。
一旦鉴定出了携带突变的基因,则使用本领域众所周知的技术,本领域的技术人员可以生产出能编码鉴定出的携带突变的基因的核酸分子。生产方法的实例包括但不限于:使用核苷酸合成仪的合成;半合成方法(例如,PCR,等);等。使用本领域众所周知的技术,通过测序或DNA芯片,可以确定是否合成的核酸分子具有目标序列。
因此,本发明提供了通过本发明的方法生成的核酸分子。这些核酸分子是源自以不能通过常规技术实现的进化速度得到的生物或细胞的基因。因此,能编码该基因的核酸分子的存在本身显然是新颖的。核酸分子的特征在于但不限于:SNP的分布是偏倚的;具有大量积累的突变的区域和其它区域倾向于以镶嵌模式分布在基因组中;依赖于个体,突变倾向于甚至在基因组的相同区域中以不同方式积累(具体地,该趋势在没有选择压力的区域更明显);在相同个体的基因组的特定区域(具体地,丰余区)中的突变分布不是随机的,而是明显偏倚的;等。确认这样的性质的实验是本领域已知的,且本领域的技术人员根据本说明书能容易地实现。
在本发明的另一方面,提供了用于生产由具有受调节的遗传性状的基因编码的多肽的方法。该方法包含下述步骤:(a)改变生物或细胞的基因复制的倾向于错误的频率;(b)繁殖得到的生物或细胞;(c)鉴别生物或细胞中的突变;和(d)生产由含有鉴别出的突变的基因编码的多肽。在该情况下,用于改变倾向于错误的频率和用于繁殖得到的生物或细胞的技术如上所述,且本领域的技术人员根据本说明书能适当地实现。使用这些技术可以实现本发明的实施方案。
使用本领域众所周知的技术,可以鉴别出生物或细胞中的突变。鉴别技术的实例包括但不限于:分子生物学技术(例如,测序,PCR,DNA印迹,等),免疫化学技术(例如,蛋白印迹,等),显微镜观察,肉眼观察,等。
一旦鉴别出了携带突变的基因,则使用本领域众所周知的技术,本领域的技术人员可以生产出由鉴别出的携带突变的基因编码的多肽。生产方法的实例包括但不限于:使用肽合成仪的合成;使用基因操纵技术合成能编码上述基因的核酸分子,使用该核酸分子转化细胞,表达基因,并回收表达产物;从修饰的生物或细胞纯化多肽;等。使用本领域众所周知的技术,通过测序、蛋白芯片等,可以确定得到的多肽是否具有目标序列。
在本发明的另一方面,提供了通过本发明的方法生产的多肽。这些多肽是由源自以不能通过常规技术实现的进化速度得到的生物或细胞的基因编码的。因此,由该基因编码的多肽的存在本身显然是新颖的。多肽的特征在于,例如氨基酸序列具有下述遗传性状:SNP的分布是偏倚的;具有大量积累的突变的区域和其它区域倾向于以镶嵌模式分布在基因组中;依赖于个体,突变倾向于甚至在基因组的相同区域中以不同方式积累(具体地,该趋势在没有选择压力的区域更明显);在相同个体的精子基因组的特定区域(具体地,丰余区)中的突变分布不是随机的,而是明显偏倚的;等。本发明不限于此。确认这样的性质的实验是本领域已知的,且本领域的技术人员根据本说明书能容易地实现。
在本发明的另一方面,提供了生产具有受调节的遗传性状的生物的代谢物的方法。该方法包含下述步骤:(a)改变生物或细胞的基因复制的倾向于错误的频率;(b)繁殖得到的生物或细胞;(c)鉴别生物或细胞中的突变;和(d)生产含有鉴别出的突变的代谢物。在该情况下,用于改变倾向于错误的频率和用于繁殖得到的生物或细胞的技术如上所述,且本领域的技术人员根据本说明书能适当地实现。使用这些技术可以实现本发明的实施方案。
如本文所使用的,术语“代谢物”指细胞为了存活通过活性(代谢)得到的分子。代谢物的实例包括但不限于:化合物,例如氨基酸,脂肪酸和其衍生物,类固醇,单糖,嘌呤,嘧啶,核苷酸,核酸,蛋白,等。另外,通过水解这些聚合化合物或氧化碳水化合物或脂肪酸得到的物质也称作代谢物。代谢物可以存在于细胞中,或者可以从细胞分泌。
在本发明的方法中,使用本领域众所周知的技术,可以鉴别出生物或细胞中的突变。鉴别技术的实例包括但不限于:鉴别代谢物(成分分析),分子生物学技术(例如,测序,PCR,DNA印迹,等),免疫化学技术(例如,蛋白印迹,等),显微镜观察,肉眼观察,等。根据代谢物,本领域的技术人员可以适当地选择代谢物鉴别技术。
在本发明的另一方面,提供了通过本发明的方法生产的代谢物。这些代谢物也源自以不能通过常规技术实现的进化速度得到的生物或细胞,且代谢物的存在本身显然是新颖的。代谢物的特征在于但不限于:对自身毒性较低;优先于自然进化的代谢物;等。确认这样的性质的实验是本领域已知的,且本领域的技术人员根据本说明书能容易地实现。
在本发明的另一方面,提供了用于调节生物或细胞的遗传性状的核酸分子。该核酸分子包含能编码具有修饰的倾向于错误的频率的DNA聚合酶的核酸序列。该DNA聚合酶可以是至少一种选自下述的聚合酶:真核生物的DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶,其校对活性受到调节。通过修饰例如聚合酶的3′→5′外切核酸酶活性中心(或者,ExoI基序,校对功能的活性部位)(例如,在位置316处的天冬氨酸和在位置318处的谷氨酸和在人DNA聚合酶δ附近的位点),可以调节这样的校对活性。本发明不限于此。
优选地,能编码包含在本发明的核酸分子中的DNA聚合酶的序列有利地编码DNA聚合酶δ或ε。这是因为,这些DNA聚合酶自然地具有校对功能,且能相对容易地修饰该功能。
在本发明的另一方面,提供了包含用于根据本发明调节生物或细胞的遗传性状的核酸分子的载体。该载体可以是质粒载体。如果需要,该载体可以优选地包含启动子序列、增强子序列等。该载体可以整合进用于调节生物或细胞的遗传性状的试剂盒中,或可以销售。
在本发明的另一方面,提供了包含用于根据本发明调节生物或细胞的遗传性状的核酸分子的细胞。本发明的核酸分子可以以载体形式整合进细胞中。本发明不限于此。该细胞可以整合进用于调节生物或细胞的遗传性状的试剂盒中,或可以销售。在一个优选的实施方案中,该细胞可以有利地是但不限于真核细胞。如果细胞仅仅用于扩增核酸分子,则可以优选地使用原核细胞。
在本发明的另一方面,提供了包含用于根据本发明调节生物或细胞的遗传性状的核酸分子的生物或细胞。该生物可以整合进用于调节生物或细胞的遗传性状的试剂盒中。
在另一方面,本发明提供了由通过本发明的方法得到的生物或细胞或其一部分(例如,器官,组织,细胞,等)生产的产物物质。通过常规方法不能得到通过本发明得到的生物或其部分,且它们的产物物质可以包括新物质。
在本发明的另一方面,提供了测试药物的方法,其包含下述步骤:使用作为疾病模型的本发明的生物或细胞,测试药物的效果;使用野生型生物或细胞作为对照,测试药物的效果;和对比疾病模型和对照。这样的疾病模型是通过常规方法不能实现的自发的疾病进程模型。因此,通过在测试药物的方法中使用这样的疾病模型,实验结果接近于通过常规方法不能实现的自然条件下进行的实验,从而导致高水平的实验可靠性。因此,可能缩短药物等的开发时间。或者,可能在实验结果中得到更准确的信息,例如副作用等。
在另一方面,本发明涉及一组至少2种聚合酶,其用于调节生物或细胞的遗传性状的转化率,其中聚合酶具有不同的倾向于错误的频率。这样的一组聚合酶尚未常规地用于上述的方法中,且是非常新颖的。可以使用任意的聚合酶,只要它们能在导入的生物或细胞中发挥功能即可。因此,聚合酶可以源自2个或更多个物种,优选地源自相同的动物物种。通过基因导入,可以将用于上述用途的聚合酶导入生物或细胞。
在本发明的另一方面,提供了一组至少2种聚合酶,其用于生产具有修饰的遗传性状的生物或细胞,其中聚合酶具有不同的倾向于错误的频率。这样的一组聚合酶尚未常规地用于上述的方法中,且是非常新颖的。可以使用任意的聚合酶,只要它们能在导入的生物或细胞中发挥功能即可。因此,聚合酶可以源自2个或更多个物种,优选地源自相同的动物物种。通过基因导入,可以将用于上述用途的聚合酶导入生物或细胞。
在另一方面,本发明涉及一组至少2种聚合酶在调节生物或细胞的遗传性状的转化率中的用途,其中聚合酶具有不同的倾向于错误的频率。用于上述用途的聚合酶如上所述,且在下面的实施例中使用和生产。
在另一方面,本发明涉及一组至少2种聚合酶在生产具有修饰的遗传性状的生物或细胞中的用途,其中聚合酶具有不同的倾向于错误的频率。用于上述用途的聚合酶如上所述,且在下面的实施例中使用和生产。
(不一致准种杂合体模型)
A.具有不同复制精确度的准种的突变分布
在本发明的另一方面,准种由大量基因组组成,假定每个基因组由长度为n的二重碱基序列表示,其具有2n种可能的基因型(或序列空间)。这里将具有最佳适合度的序列称作“主序列”。选择非常大和稳定的群体大小。一个模板序列的复制会生成一个直接拷贝序列,因而通一个步骤将复制错误固定到突变。仅仅发生碱基取代,因而序列长度是恒定的。忽略序列降解。为了易于处理,发明人将主序列(I0)的所有i-错误突变体的总和归入突变体类Ii(i=0,1,...,n)。对应的相对浓度的总和表示为xi。xi中的变化的速度表示为:
x i = ( A i Q ii - f ) x i + Σ j = 1 A j Q ij x j - - - ( 1 )
其中Ai是突变体类Ii的复制速度常数(或适合度);f保持总浓度恒定;且从而是∑iAjXi;Qii是复制精确度,或通过Ij的完全无错误的复制生成Ii的可能性;且Qij是通过Ij的错误复制生成Ii的可能性。
聚合酶复制基因组序列。Ek表示p种具有不同精确度(k=1,2,...,p)的聚合酶。Ek的相对浓度表示为Ck。聚合酶Ek的单碱基精确度表示为0≤qk≤1,所以每个碱基的错误率是1-qk。因为相同的聚合酶一致地复制一个序列,所以每个碱基的错误率Ek是n(1-qk)。准种的每个基因组的平均错误率表示为n∑kCk(1-qk)=m。通过转化均一的复制精确度(例如,M.Eigen,1971(同上)),可以通过下式得到不同的复制精确度:
Q ij - Σ k c k q k n Σ h = 0 i ( 1 - q k q k ) 2 h + | j - i | ( h + 1 2 ( | j - i | - j + i ) n - j )
× ( h + 1 2 ( | j - i | + j - i ) j ) , - - - ( 2 )
l = [ 1 2 ( min { i + i , 2 n - ( j + i ) } - | j - i | ) ] . - - - ( 3 )
静态突变分布,limt→∞Xi=Yi,是准种。这由矩阵W={AjQij}的特征向量表示。图5显示了具有均一和不同复制精确度的准种的实例。在这里,使用了简单的单峰适合度空间。将复制速度常数A0指定给主序列,且所有其它突变体类具有相同的适合度。
具有低于错误阈值的均一复制精确度的同等准种位于主序列周围(图5的(a))。在接近m=2.3的错误阈值,过渡非常尖锐,主序列的相对浓度降低了超过约10个量级(在c=0,图6)。这样的现象称作错误的突然大变动。在高于错误阈值时,准种的位置被替换为一致的分布,其中各个浓度都非常小(例如,Yi=8.88×10-16)。在现实的有限的群体中,更难以随着错误的积累,通过选择来维持主序列的遗传信息。仅仅在低于错误阈值时,准种才能进化,且进化速度似乎达到了它的接近错误阈值的最大值。
假定本发明的不一致模型(图5中的(b)至(d))具有2种聚合酶,每种具有不同的精确度。聚合酶E1是无错误的,q1=1,E2是倾向于错误的,0≤q2≤1;每种以c和1-c的相对浓度存在。假定完全无错误的聚合酶似乎不是现实的,但是,基于DNA的微生物中的校对聚合酶的错误率非常小,每个基因组每次复制0.003个错误,因而在该情况下可以忽略。
当无错误的聚合酶的相对浓度较低时,0<c<1,随着c的增加,错误阈值转换成更高的平均错误率,且错误的突然大变动的量级降低(图5的(b)和图6)。在c=0.1,错误阈值成为0(图5的(c))。主序列的相对浓度逐渐降低,且最终在比同等一致的分布高107倍的浓度稳定(在c=0.1,图6)。当c>0.1时,独立于平均错误率,主序列以足够的浓度存在(图5的(d)和图6)。图6显示了在Ccrit=0.1附近的准种动力学的急剧变化。在不一致准种模型中,远离主序列的突变体可以存在,而不引起准种位置的损失。这意味着,进化速度可以增加,而无错误的突然大变动。
B.具有许多复制剂的准种的错误阈值
考虑到不一致模型的错误阈值,发明人遇到了下面的2个困难:(i)基因组大小实际上过大,病毒:n>103,细菌:n>106,以致于难以精确计算;和(ii)基因组复制实际上分配在超过一个单元(复制试剂)中,且超过一种聚合酶同时参与。多种复制剂似乎会影响错误阈值。通过使用主序列的相对静态浓度的近似值,发明人计算了错误阈值。
y 0 = A 0 Q 00 - A i ≠ 0 A 0 - A i ≠ 0 , - - - ( 4 )
其中A0是主序列的复制速度常数,Ai≠0是其它突变序列的总平均值;Q00是主序列的完全无错误复制的复制精确度。该近似值依赖于考虑表达式(1)中的从突变体至主序列的回复突变的忽略。与精确解的一致随着基因组大小的增加而增加。对于能满足下式的临界错误率,主序列的相对静态浓度成为0:
( Q 00 ) min = A i ≠ 0 A 0 = s - 1 , - - - ( 5 )
其中s是主序列的选择优势。为了使用许多复制剂得到不一致模型的Q00,发明人假定存在2种聚合酶E1和E2,每种以c和1-c的相对浓度存在。校对聚合酶的错误率非常小,且是可以忽略的。因而,聚合酶E1是无错误的,q1=1,且E2是倾向于错误的,0≤q2≤1。那么每个基因组的平均错误率是:
m=n(1-c)(1-q2).    (6)
通过二项式分布,得到了倾向于错误的聚合酶E2复制基因组的可能性。从泊松近似值,得到了倾向于错误的聚合酶E2的无错误的可能性,其中假设基因组大小与复制剂的数目相比非常大。使它们相乘,得到:
Q 00 = Σ b = 0 a a b c a - b ( 1 - c ) b e - mb / a ( 1 - c )
= [ c + ( 1 - c ) e - m / a ( 1 - c ) ] a , - - - ( 7 )
其中a是基因组中的所有复制剂的数目。组合表达式(5)和(7),得到不一致模型的错误阈值:
m max = c ( 1 - c ) ln ( 1 - c s - 1 / s - c ) . - - - ( 8 )
图7显示了错误阈值,其是无错误的聚合酶在各种数目的复制剂时的相对浓度的函数。同等模型(c=0)的错误阈值不受复制剂数目的影响。在不一致模型(c>0)中,在无错误的聚合酶的临界浓度发生的异常,
c crit = s - 1 / m , - - - ( 9 )
导致错误阈值的非常急剧的增加。这意味着,在c≥ccrit,错误阈值成为0。ccrit随着复制剂数目的增加而增加。
因而,从表达式(6)和(8)得到了可允许的错误率:
m pms = < c ( 1 - c ) ln ( 1 - c s - 1 / s - c ) , c < z &le; n ( 1 - c ) ( 1 - q min ) , c &GreaterEqual; z , - - - ( 10 )
z = exp ( n q min / a ) - exp ( n / a ) s - 2 / s exp ( n q min / a ) - exp ( n / a ) = s - 2 / s
当c≥ccrit时,有2个约束条件:(i)基因组大小n是有限的;和(ii)倾向于错误的聚合酶在真实的生物中具有非零的精确度qmin。假设大肠杆菌的完全无校对的DNA聚合酶的错误率是1-qmin=10-5。图8显示了基于大肠杆菌的参数的可允许的错误率的实例。该图的形状类似于λ过渡。对于s=10,大肠杆菌的mpms的最大值变成每个基因组每次复制31个错误。与同等模型的错误阈值相比,该错误率足够高(1n(s)=2.3)。
发明人提供了不一致-准种杂合体模型,其中存在无错误的和倾向于错误的聚合酶。结果,证实了不仅通过错误率,而且通过具有不同精确度的聚合酶的比例和通过能改变基因组的复制剂的数目,可以确定准种的动力学。形成的一个值得注意的发现是,与常规的同等模型相比,无错误的和倾向于错误的聚合酶的共存可以显著增加准种的错误阈值。这是常规技术未能揭示的本发明的效果。
许多生物实质上生活在不断改变的环境中。对于避开宿主免疫系统的微生物病原体和癌细胞,这是特别正确的。因为突变体数目的大幅度增加,和由此引起的可能的具有较大距离的候选物,所以发现有利突变体的机会随着主序列的Hamming距离的增加而增加。
简单的错误率的均一增加会导致有害突变的相当可观的成本,即使它是暂时的。同等准种的错误阈值如此小,以致于突变体的分布范围限于离主序列较短的距离。同等准种会陷入局部的低峰,且永远不会达到远离主序列的更高峰。另一方面,不一致准种会增加错误阈值,而不损失遗传信息,由此生成大量的远离主序列的有利突变体。不一致准种可以在序列空间中搜索较长的距离,并最终发现更高峰。
倾向于错误的聚合酶的持续合成能力似乎低于具有校对能力的主要复制性聚合酶。利用许多复制剂的不一致模型考虑了该发现。在该模型中,错误集中在许多复制剂的区域,其中有倾向于错误的聚合酶参与。如果倾向于错误的复制限制在特定的基因区域内,那么在将其它基因的成本保持在最小时,该区域的错误率极大地增加。
因此,根据本发明,证实了如果在生物中提供能实现至少2种倾向于错误的频率的DNA复制剂(例如,聚合酶),那么该生物可以表现出与常规技术相比显著增加的进化速度,同时保持个体生物正常。这样的效果尚未常规地实现。
在本文中提及的所有专利、专利申请、期刊文章和其它参考文献,都整体引作参考。
此前,参考优选的实施方案描述了本发明,以利于理解本发明。在下文中,将通过实施例描述本发明。下面描述的实施例仅仅用于解释目的。因此,本发明的范围除了如所附权利要求书所示之外不受限制。
(实施例)
在下文中,将通过实施例更详细地描述本发明。本发明不限于下面的实施例。在下面的实施例中使用的试剂、支持物等购自Sigma(St.Louis,美国),Wako Pure Chemical Industries(Osaka,日本),等,有一些例外。根据日本大学(Japanese Universities)制定的规则,处理和测试动物。
(实施例1:生产酵母的抗药株和抗高温株)
在实施例1中,酵母用作代表性的真核生物,以证实根据本发明可以调节不一致突变酵母中的遗传性状的转化率。
为了证实不一致突变在育种领域的有用性,生产了具有抗药性和/或高温抗性的酵母。
将突变导入DNA聚合酶δ和DNA聚合酶ε的校对功能,以调节校对功能(Alan Morrison & Akio Sugino,Mol.Gen.genet.(1994)242:289-296)。
(材料)
在实施例1中,酵母(啤酒糖酵母)用作目标生物。使用AMY52-3D:MATα,ura3-52leu2-1ade2-1his1-7hom3-10trp1-289canR(从Sugino教授(Osaka University)得到)作为正常株。
作为正常的酵母株,从美国典型培养物保藏中心(ATCC)得到了MYA-868(CG378)。
通过改变DNA聚合酶δ或ε的校对功能,可以调节倾向于错误的频率。通过生产不一致突变株,其具有DNA聚合酶δ或ε的校对部分的缺失,改变了校对功能。为了生产突变株,使用普通技术(Sambrook等,Molecular Cloning:A Laboratory Manual,第2版,Cold SpringHarbor Laboratory(Cold Spring Harbor,N.Y.,1989),同上),使用定位诱变来在正常株的DNA聚合酶Polδ或Polε的特定位点进行碱基取代(Morrison A.& Sugino A.,Mol.Gen.Genet.(1994)242:289-296)。具体地,在下述位置进行转化:在Polδ中,322(D)→(A),和324(E)→(A);和在Polε中,291(D)→(A)和293(E)→(A)。这些突变体是DNA聚合酶δ突变株(AMY128-1:Pol3-01MATα,ura3-52 leu2-1 lys1-1 ade2-1 his1-7 hom3-10 trp1-289 canR;从Sugino教授(Osaka University)得到,和DNA聚合酶ε突变株(AMY2-6:pol2-4MATα,ura3-52 leu2-1 lys1-1 ade2-6 his1-7hom3-10 try1-289 canR;从Sugino教授(Osaka University)得到。应当明白,使用定位诱变来诱导突变,例如在Polδ中,322(D)→(A)和324(E)→(A);和在Polε中,291(D)→(A)和293(E)→(A),本领域的技术人员可以生产出这些株的等同物。
(生产抗药株的方法)
将上述的3株铺平板到含有完全培养基(YPD培养基:10g酵母提取物(Difco),20g BactoPepton(Difco),和20g葡萄糖(wako))的琼脂平板上。为每株随机收集5个单个菌落。将菌株接种到3ml YPD液体培养基中,随后在30℃振荡培养至约1×106的终浓度。
稀释菌株,并接种到含有1mg/L放线菌酮(Sigma,St.Louis,MO,美国)的YPD平板上。作为对照,将菌株接种到不含药物的YPD平板上。将菌株在30℃培养2天。计数得到的菌落。
(得到抗高温株的方法)
将上述的3株从单个菌落转移到液体培养基中,随后进行适应培养,同时逐渐升高培养温度。适应培养规程如下:
37℃,2天→28℃,1天→38℃,2天→28℃,1天→39℃,2天→28℃,1天→40℃,2天→28℃,1天;冷冻保藏最后的培养物(“适应培养”)。
如下继续进行适应培养:
37℃,2天→28℃,1天→38℃,2天→28℃,1天→39℃,2天→28℃,1天→40℃,2天→28℃,1天→41℃,2天→28℃,1天;冷冻保藏最后的培养物(“适应培养II”)。
(测量生长曲线)
在完全液体培养基(YPD)中进行振荡培养。基于在530nm的光密度(OD),测量生长(即,细胞密度)。使用分光光度计(Hitachi),测定光密度。在28℃测试正常株和抗药突变体,得到生长曲线,同时在38.5℃测试抗高温株。
(抗药株的结果)
在DNA聚合酶δ和DNA聚合酶ε突变体中,当细胞在没有任何药物的培养基中生长时,出现了放线菌酮抗性的细菌,但是在野生型中没有。
                表1:放线菌酮抗性的菌落的数目
  菌落数目*  平均值*
  polδ   60   81   81   111   744  215
  polyε   3   39   138   0   0  36
  WT   0   0   0   0   0  0
*单位:×106
发现从Polδ突变体得到的抗性株能在最高达10ml/L放线菌酮下生长。
对比了野生型和突变体的生长特征。基本上没有发现生长速度的差异(表2和图1)。
     表2:Polδ和polε突变体的生长曲线
  生长时间   polδ   polε   WT
  0   0.13   0.13   0.13
  2   0.9   0.8   0.9
  4   2.2   2.1   2.1
  6   4.1   4.0   4.1
  8   5.9   5.7   6.0
  10   7.9   7.8   8.1
  12   10.5   10.8   11.1
  22   20.1   19.8   21.7
  32   19.6   19.5   20.3
  44   18.9   19.2   19.8
(小时)                              OD:530nm
(抗高温株的结果)
在40℃进行适应培养2天,然后接种到琼脂平板上,随后在38.5℃培养。尽管亲本株不能在高温生长,但证实了突变体能在高温下生长(图3A和3B(照片))。
对比了野生型株和突变体在高温条件下的生长特征。证实了野生型株的生长已经停止(表3和图2)。
而且,在41℃继续适应培养。结果,发现会产生能在41℃生长的突变体(图4A和4B)。
            表3:抗高温株的生长曲线
  生长时间   克隆1   克隆2   WT
  0   0.131   0.125   0.134
  2   0.154   0.174   0.177
  4   0.203   0.227   0.264
  6   0.258   0.314   0.327
  8   0.327   0.447   0.365
  10   0.462   0.6   0.358
  12   0.93   1.12   0.352
  22   1.463   1.486   0.346
(小时)                          OD:530nm
克隆1:源自Polδ的抗性株
克隆2:源自Polε的抗性株
酵母具有与革兰氏阴性的细菌(例如大肠杆菌)不同的基因复制机制。因此,尚不清楚是否可以根据本发明通过调节遗传性状的转化率来调节酵母的倾向于错误的频率,而不影响该生物的存活。
在实施例1中,证实了可以通过调节遗传性状的转化率来调节酵母(即,一种真核生物)的倾向于错误的频率,而不影响该生物的存活。
(实施例2:使用质粒导入突变)
在实施例2,证实了使用质粒载体可以调节真核生物的遗传性状的转化率(“不一致诱变质粒”)。
类似于实施例1,通过将突变导入DNA聚合酶δ和DNA聚合酶ε的校对功能,来调节校对功能(Alan Morrison & Akio Sugino,Mol.Gen.Genet.(1994)242:289-296)。
生产了能表达突变的DNA聚合酶(pol)δ或DNA聚合酶ε的质粒载体。通过用该载体转染,转化了酵母细胞,以生产突变的细胞。在含有药物例如放线菌酮等的平板培养基中培养突变体。计数出现的抗药菌落。
(材料)
在实施例2中,酵母(酿酒酵母)用作目标生物。使用AMY52-3D:MATα,ura3-52 leu2-1 ade2-1 his1-7 hom3-10 trp1-289 canR(ATCC,同上)作为正常株。通过将突变的DNA聚合酶δ或ε导入野生型正常株,来调节酵母的倾向于错误的频率。
使用如实施例1所使用的DNA聚合酶δ突变株(AMY128-1:Pol3-01 MATα,ura3-52 leu2-1 lys1-1 ade2-1 his1-7 hom3-10trpl-289 canR)或DNA聚合酶ε突变株(AMY2-6:pol2-4 MATα,ura3-52 leu2-1 lys1-1 ade2-6 his1-7 hom3-10 try1-289 canR)),生产了能编码突变的DNA聚合酶δ或ε的序列。
该质粒载体含有启动子Gal和分别编码突变的DNA聚合酶δ和ε的核酸序列(SEQ ID NO.33和35)。该核酸序列可操作地连接到启动子上。
(方法)
(生产载体)
这里使用的分子生物学技术记载在,例如,Sambrook,J.,等(同上)中。通过PCR,扩增Polδ和Polε突变株(DNA聚合酶δ突变株(AMY128-1:Pol3-01 MATα,ura3-52 leu2-1 lys1-1 ade2-1 his1-7hom3-10 trp1-289 canR)和DNA聚合酶ε突变株(AMY2-6:pol2-4MATα,ura3-52 leu2-1 lys1-1 ade2-6 his1-7 hom3-10 try-289 canR))的pol位点,并回收Polδ和polε。用于回收pol位点的引物具有下面的序列:
polδ(正向):
SEQ ID NO.37:5′-CCCGAGCTCATGAGTGAAAAAAGATCCCTT-′3(δ);
pol3(反向):
SEQ ID NO.38:5′-CCCGCGGCCGCTTACCATTTGCTTAATTGT-′3(δ);
Polε(正向):
SEQ ID NO.39:5′-CCCGAGCTCATGATGTTTGGCAAGAAAAAA-′3(ε);和
pol2(反向):
SEQ ID NO.40:5′-CCCGCGGCCGCTCATATGGTCAAATCAGCA-′3(8)。
将PCR产物整合进具有GAL启动子的载体中。
(转化)
使用磷酸钾方法,用质粒载体转染正常的酵母株。
(突变导入)
在振荡时,在28℃、含有半乳糖的液体培养基中培养转化的酵母48-72小时。
(确认抗药性)
在28℃,在含有放线菌酮的平板培养基(补充了半乳糖)中培养细胞24小时。计数生长的菌落。
(结果)
在DNA聚合酶δ和DNA聚合酶ε突变体中,当细胞在没有任何药物的培养基中生长时,出现了放线菌酮抗性的细菌,但是在野生型中没有。
(实施例3:生产突变的生物,包括小鼠等动物)
在实施例3中,使用小鼠(动物)作为代表性的真核生物来生产不一致突变的生物。
使用基因靶向技术,生产了具有复制复合物(具有不同DNA复制校对能力)的小鼠。
通过调节DNA聚合酶δ(SEQ ID NO.55(核酸序列)和56(氨基酸序列))和/或DNA聚合酶ε(SEQ ID NO.57(核酸序列)和58(氨基酸序列))的校对功能,来调节复制校对功能。如下进行突变:在polδ中,315(D)→(A),317(E)→(A);在polε中,275(D)→(A),277(E)→(A)。
(基因靶向技术)
基因靶向技术描述在,例如,Yagi T.等,Proc.Natl.Acad.Sci.USA,87:9918-9922,1990;″Gintagettingu no Saishingijyutsu[Up-to-date Gene Targeting Technology]″,Takeshi Yagi,编,Special issue,Jikken Igaku[Experimental Medicine],2000,4。使用具有突变体pol的靶向载体,生产了同源重组小鼠ES细胞。
将重组ES细胞导入小鼠早期胚胎中,以形成胚泡。将胚泡植入假孕的小鼠中,以生产嵌合小鼠。
使嵌合小鼠杂交。选择已经导入了突变的具有生殖细胞的小鼠。继续杂交,直到得到具有同源突变的小鼠。
在实施例3中,选择目标性状作为癌症发作的量度。
(方案)
(1.制备ES细胞)
使用饲养细胞(小鼠胎儿成纤维细胞;从Osaka University的Yagi教授得到)在补充了20-30%牛胎儿血清的Dulbecco氏改进的Eagle培养基(DMEM)中,在37℃、5%CO2中,培养从胚胎(从Centerfor Animal Resources and Development,Kumamoto University,Kumamoto,日本得到)中的细胞块制备出的小鼠ES细胞。
使用描述在例如“Gintagettingu no Saishingijyutsu[Up-to-date Gene Targeting Technology]”,Takeshi Yagi,编,Specialissue,Jikken Igaku[Experimental Medicine,2000,4中的技术,制备饲养细胞。从小鼠胎儿成纤维细胞的原代培养物得到了饲养细胞。
(2.使用靶向载体同源重组pol基因)
通过正/负方法(positive/negative method)(Evans,M.J.,Kaufman,M.H.,Nature,292,154-156(1981)),制备了靶向载体,以有效地得到同源重组ES细胞(Capecchi,M.R.,Science 244:1288-1292(1989))。
制备靶向载体:通过描述在例如,Molecular Cloning,第2版,Sambrook,J.,等,同上,和Ausubel,F.M.,Current Protocols inMolecular Biology,Green Publishing Associates and Wiley-Interscience,NY,1987,同上中的技术,制备了靶向载体。
在靶向载体中,将突变Polδ和/或polε基因插入正基因和负基因之间。新霉素抗性基因用作正基因,而白喉毒素用作负基因。
对于Pol突变,将一个碱基的突变导入Polδ和Polε的校对活性位点中(SEQ ID NO.55和56(δ);SEQ ID NO.57和58(ε)),以缺失校对活性:在Polδ中,315(D)→(A),317(E)→(A);在Polε中,275(D)→(A),277(E)→(A)(Morrison A.& Sugino A.,Mol.Gen.Genet.242:289-296,1994;Goldsby R.E.,等,Proc.Natl.Acad.Sci.USA,99:15560-15565,2002)。
(3.将载体导入ES细胞)
通过电穿孔将载体导入ES细胞中。使用含有G418(Sigma,St.Louis,MO,美国)的DMEM培养基(Flow Laboratory)进行培养。
(4.回收重组ES细胞)
在有G418存在的情况下培养后,将出现的菌落转移到平板(DMEM培养基;Flow Laboratory)。
(5.确认同源重组体)
从ES细胞提取基因组DNA。通过DNA印迹和/或PCR,确定突变体pol是否成功地导入了ES细胞。
(6.制备嵌合小鼠-将重组ES细胞导入胚胎)
通过显微注射方法,将上述的重组细胞导入胚泡中。通过描述在例如,″Gintagettingu no Saishingijyutsu[Up-to-date GeneTargeting Technology]″,Takeshi Yagi,编,Special issue,Jikken Igaku[Experimental Medicine],2000,4中的普通方法,选择与ES细胞不同的宿主小鼠胚胎作为胚泡。
(7.生产嵌合小鼠-将胚胎移植进假孕的小鼠)
当ES细胞源自129-系小鼠时,将ES细胞注射进C57BL/6小鼠的胚泡中。当ES细胞是TT-2细胞时,将ES细胞注射进ICR小鼠的8-细胞期的胚胎中,以生产假孕的小鼠。将具有注射的ES细胞的小鼠胚胎植入代孕母亲的子宫或输卵管中,以生产嵌合小鼠。
(8.生产嵌合小鼠-使小鼠杂交)
使嵌合小鼠杂交。通过PCR和/或DNA测序等,确定突变体pol是否成功地导入了生殖细胞。继续杂交,直到得到具有同源突变体pol的小鼠。
(结果)
从在实施例3中制备的小鼠中,选择患有癌症的小鼠。该小鼠以比常规技术明显更高的速度自然地生成癌症。修饰的细胞具有与自然产生的细胞基本上相同的生长速度,但是,修饰的细胞的突变率是每代2个或更多个,这与常规的突变显著不同。
(其它性状)
类似地,关于糖尿病,高血压,动脉硬化,肥胖,痴呆,神经障碍,等进行筛选。本发明可以提供这样的模型,其中极大地加速了这些疾病的发作,但是每种疾病都自然地产生。因此,本发明的方法可以应用于动物。
(其它动物)
接着,使用大鼠作为模型进行了相似的实验。通过将突变导入polδ(在如SEQ ID NO.60所述的氨基酸序列中,在位置315处的D和在位置317处的E被取代为丙氨酸),可以快速地制备出癌症的大鼠模型。
(实施例4:使用其它方法生产突变的生物)
接着,使用另一个小鼠模型来确定是否可以生成突变的生物。使用的方法如下所述。
(材料和方法)
<制备Pold1的cDNA>
使用TRIzol试剂(Invitrogen),从4周龄的新生C57BL/6小鼠(Charles River日本)的睾丸中提取mRNA。使用SuperScript III(Invitrogen)和Oligo-dT引物,通过逆转录提取的mRNA,生产小鼠睾丸的总cDNA。利用总cDNA,使用Pold1基因(SEQ ID NO.86(核酸序列)和SEQ ID NO.87(氨基酸序列))的5′-末端引物SpeI-5′Pold1(GACTAGTGGCTATCTTGTGGCGGGAA)(SEQ ID NO.67)和3′-末端引物EcoRI-3′Pold1(GGAATTCCTTGTCCCGTGTCAGGTCA)(SEQ ID NO.68),它们设计成含有Kozak序列,通过PCR扩增Pold1基因的cDNA片段。在该方式中,得到了野生型Pold1的cDNA。将突变(D400A)导入cDNA中,以从Pold1基因(SEQ ID NO.88(核酸序列)和SEQ ID NO.89(氨基酸序列))缺失3′-5′外切核酸酶活性。为了实现该目的,对能导入突变的引物序列(CAGAACTTTGCCCTCCCATACCTC)(SEQ ID NO.69)和与其互补的引物进行PCR连接,以生成Pold1突变体的cDNA。使用ABI3100测序仪(Applied Biosystems,CA,美国)阅读cDNA的全长序列(SEQ ID NO.70),并与数据库对比,以发现相同的序列。该cDNA用于所有的实验。使用KOD DNA聚合酶(TOYOBO,Osaka,日本),进行制备野生型和突变型Pold1 cDNA的PCR。
<克隆启动子序列>
使用C57BL/6小鼠的基因组DNA的5′mPGK2-sacII引物(TCCCCGCGGCTGCAGAGGATTTTCCACAG)(SEQ ID NO.71)和3′mPGK2-SpeI引物(GGACTAGTATGGTATGCACAACAGCCTC)(SEQ ID NO.72),克隆了mPGK2:455-bp的mPGK2启动子片段(SEQ ID NO.94)。使用KOD DNA聚合酶(TOYOBO,Osaka,日本),进行PCR。
使用5′Fthl17-sacII引物(TCCCCGCGGAGTGGTTGTGGGAGACTTAC)(SEQ ID NO.73)和3′Fthl17-SpeI引物(GGACTAGTCAGTCCCACAGTCCCAAAGT)(SEQ ID NO.74),克隆了DNA片段(SEQ ID NO.95),它是Fthl17:5725-bp的上游序列。使用LA Taq聚合酶(TAKARA)和GC缓冲液(由生产商提供),进行PCR。
<生产转基因小鼠>
使用显微操作器,将制备的用于生产转基因小鼠的载体DNA(2ng/μl)注射进C57BL/6小鼠的受精卵的原核中。在导入了基因的受精卵中,将2-细胞期(次日)的胚胎移植进假孕的雌性ICR小鼠的输卵管中,由此生产转基因小鼠。
<确认是否存在转基因>
将小鼠的尾巴切成小块,将其依次置于含有蛋白酶K(NacaliTesque)的增溶缓冲液(50mM Tris-HCl,10mM EDTA,200mM NaCl,1%SDS)中,并在55℃温育过夜。此后,通过进行2次苯酚/氯仿提取和乙醇沉淀,制备出小鼠的基因组DNA。对于每只小鼠的基因组DNA,通过PCR确定是否存在转基因:对于转基因小鼠#1,使用Cre-F引物(CTGAGAGTGATGAGGTTC)(SEQ ID NO.75)和Cre-R  引物(CTAATCGCCATCTTCCAGCAG)(SEQ ID NO.76),对于转基因小鼠#2,使用Neo-F引物(GCTCGACGTTGTCACTGAAG)(SEQ ID NO.77)和Neo-R引物(CCAACGCTATGTCCTGATAG)(SEQ ID NO.78)。使用Ex-Taq聚合酶(TAKARA,Kyoto,日本),进行PCR。
<免疫染色>
使用mPGK2(出生后14周龄)和Fthl17(出生后13周龄)的F0-代转基因小鼠进行实验。用戊巴比妥(50mg/ml,DainipponPharmaceutical)麻醉小鼠,进行剖腹术。最初,切除2个附睾中的1个。此后,用4%仲甲醛灌注固定小鼠。提取2个附睾,并在4%仲甲醛中浸泡4小时。用PBS(NaCl 8g,Na2HPO4 1.15g,KCl 0.2g,和KH2PO4 0.2g,溶解在水中;终体积:1L)简单地洗涤附睾,并浸入20%蔗糖磷酸盐缓冲液(0.1M磷酸盐(钠)缓冲液(pH7.3),20%蔗糖)中在4℃过夜。此后,将组织浸入OCT化合物(Tissue-Tek,Sakura Fineteck日本)中,并立即冷却。使用恒冷切片机将组织切成5-μm厚的切片。将切片在含有20%Blocking One(Nacali Tesque)和0.05%Tween20的PBS中温育。此后,将切片与4000倍稀释的小鼠抗-Cre重组酶单克隆抗体(MAB3120,Chemicon)一起温育。使用生物素化的抗-小鼠IgG抗体(Vector Laboratories Inc.)作为第二抗体。使用3,3-二氨基联苯胺(DAB)(Dojindo Laboratories)和过氧化物酶(Nacali Tesque),进行显色。用DAB显色后,使用甲基绿(Merck)进行对比染色。
<人工授精>
将怀孕母马的血清促性腺激素(PMSG)(CALBIOCHEM)腹膜内地注射进雌性C57BL/6小鼠(Charles River日本)(5IU/小鼠)。46-48小时后,类似于PMSG,将人绒毛膜促性腺素(hCG)(Teikoku HormoneMFG.)腹膜内地注射进小鼠(5IU/小鼠)。12小时后,通过颈脱位法处死小鼠,取出卵块。将取出的卵块在含有0.3mg/ml透明质酸酶(SIGMA)的M2培养基中在37℃温育10分钟,收集未受精卵。在灌注固定前,从用于免疫染色的mPGK2和Fthl17的转基因小鼠提取附睾。从附睾的尾部收集精子。将收集的精子置于37℃、5%CO2培养箱中的TYH培养基(体外受精培养基)中,并进行活化。此后,将精子加入含有未受精卵的TYH培养基中。使混合物在相同的5%CO2培养箱中静置6小时。此后,洗涤卵,并转移至胚胎培养基WM,随后在37℃、5%CO2培养箱中温育过夜。次日,仅将处于2-细胞期的卵移植进假孕的ICR小鼠的输卵管中。
<使用mRNA确认基因表达>
使用TRIzol试剂(Invitrogen),从转基因小鼠#2的尾巴提取mRNA。使用SuperScript III(Invitrogen)和Oligo-dT引物,通过逆转录提取的mRNA,得到cDNA,随后使用Neo-F引物(GCTCGACGTTGTCACTGAAG)(SEQ ID NO.79)和Neo-R引物(CCAACGCTATGTCCTGATAG)(SEQ ID NO.80)进行PCR。由此,确定是否存在mRNA表达。使用Ex-Taq聚合酶(TAKARA)进行PCR。
<使用Cre重组酶分析重组效率>
利用pBluescript II,生产了lox66和lox71之间的区域的序列作为靶向载体(图18)。在有1mg/ml BSA存在的情况下,使生产的200ng载体与Cre重组酶(BD Biosciences)在Cre反应缓冲液(BDBiosciences)中在室温反应2小时。反应后,在70℃温育5分钟,以灭活Cre重组酶。对反应溶液进行热激,以将细胞转化成感受态细胞。将转化的细胞铺平板到LB-Amp平板(将1.5%琼脂粉(NacaliTesque)加入LB培养基中,随后高压灭菌,然后补充100μg/mL氨苄青霉素(SIGMA))上。次日,挑取菌落。在LB-Amp培养基中培养菌落,然后提取质粒。使用ABI测序仪3100,基于质粒的测序结果,确认重组。
生产转基因小鼠的一个目的是,确定对精子发生阶段特异性的突变型Pold1的超表达是否可以调节进化速度。
而且,认为通表达Cre重组酶,可以在具有loxP序列的小鼠中控制对精子发生阶段特异性的表达。因此,尝试生产了2种转基因小鼠:转基因小鼠#1,其可以特异性地在精子发生阶段表达突变型Pold1和Cre重组酶,和转基因小鼠#2,其利用loxP序列,允许组织-特异性地超表达突变型Pold1(图9)。
(a)转基因小鼠#1
转基因小鼠#1特异性地在精子发生阶段表达突变型Pold1和Cre重组酶。为了生产这样的小鼠,重要的是选择能在精予发生阶段引起基因表达的启动子。已经表明,在小鼠的睾丸中,DNA聚合酶δ是在精原细胞阶段表达的,且从初级精母细胞阶段直到减数分裂的前半部分时(Dia Kamel,等,(1997)Biology of Reproduction,57,1367-1374)。
因此,设想利用能在精原细胞阶段或初级精母细胞阶段引起表达的启动子。小鼠磷酸甘油酸激酶2(mPGK2)基因启动子经常用于初级精母细胞中的超表达(Nadia A.Higgy,等,(1995)Dev.Genetics,16,190-200)。mPGK2启动予用作能特异性地在精子发生阶段引起表达的启动子的候选物。还设想利用能促进比mPGK2启动子更早的精子发生的精原细胞阶段的表达的启动子。但是,基本上没有报道能实现精原细胞阶段或初级精母细胞阶段特异性地表达的启动子。因此,通过PCR克隆已经报道能特异性地在精原细胞中表达的基因上游的序列,尝试开发对精子发生阶段特异性的新启动子。在已经通过cDNA扣除方法(P.Jeremy Wang,等,(2001),Nature Genetics,27,422-426)发现的能特异性地在精原细胞中表达的基因中,选择了铁蛋白重型多肽样17(Fthl17)基因。使用位于该基因上游的约5.7kbp的序列(SEQID NO.81)作为能特异性地在精原细胞阶段表达的启动子。使用上述的2个对精子发生阶段特异性的启动子来为转基因小鼠#1生产载体。图9示意性地显示了实际生产的载体。生产了这样的载体,其中突变型Pold1基因和Cre重组酶通过IRES(内部核糖体进入位点)的序列相连,且该基因由预期会特异性地在精子发生阶段引起表达的启动子同时表达。
将生产的载体的DNA显微注射进受精卵的原核中,以生成转基因小鼠。使用对Cre重组酶特异性的引物,通过PCR确定在新生的小鼠中是否存在转基因(图10)。结果,对于mPGK2启动子,存在2个转基因小鼠系(在46个新生儿中),而对于Fthl17上游的序列,存在一个转基因小鼠系(在27个新生儿中)。从它们的外观,不能将新生的转基因小鼠与正常的小鼠区分开。为了分析启动子的表达区,提取mPGK2(出生后14周龄)和Fthl17(出生后13周龄)的F0代中的转基因小鼠的睾丸,随后使用小鼠抗-Cre重组酶单克隆抗体进行免疫染色(图11)。在图11中,使用DAB进行第二抗体的显色(黑褐色),随后用甲基绿进行对比染色,以对细胞中的RNA染色(蓝绿色)。同样在对照中,在生精小管的基板中观察到了强烈的黑褐色显色。这是背景色,因为第一抗体是小鼠的。在该免疫染色的结果中,生精小管内的黑褐色显色指示着外源Cre重组酶的表达位点。根据图儿,确认了Cre重组酶在使用mPGK2启动子的转基因小鼠和使用Fthl17上游的序列的转基因小鼠的睾丸的生精小管中表达。因而,这暗示着Fthl17上游的5.7-kbp区序列具有启动子活性的可能性。另外,在使用Fthl17上游的序列的转基因小鼠的睾丸中的Cre重组酶的染色结果中,显色比使用mPGK2启动子时弱。因而暗示着,Fthl17上游的序列具有低于mPGK2启动子的启动子活性(表达能力)。Russel等进行了小鼠、大鼠和狗的睾丸的组织学分析,并总结出了将精子发生阶段彼此区别开的标准(Russell LD,Ettlin RA,Hikim APS,Cleggand ED.(1990),Histological and HistopathologicalEvaluation of Testis.,Clearwater,FL:Cache River Press)。据此,进行了深入分析,以确定在精子发生的什么阶段,上述的2个启动子在转基因小鼠#1的染色图像中表达。在mPGK2启动子的情况下,主要在初级精母细胞的第二阶段观察到表达(图12)。在与常规考虑区不同的区域,观察到了表达。在Fthl17上游的序列用作启动子的情况下,从初级精母细胞阶段至精原细胞阶段观察到了表达(图13)。根据染色的结果,难以将精原细胞中的表达与背景(染色的基板)区分开,所以不能确定是否存在表达。
上述的新生的F0代包括使用mPGK2启动子的转基因小鼠(雄性1,雌性2)和使用Fthl17上游的序列的转基因小鼠(雄性1)。将每只雄性的睾丸用作免疫染色的样品。F0代雄性用于从出生后9周龄开始繁殖交配的免疫染色。实际交配的结果总结在表4(A)中。
                        表4(A)
  交配的雌性的数目   怀孕的雌性的数目   怀孕率
  mPGK2   10   0   0%
  Fthl17   10   6   60%
在表4(A)中,将腹部变大的雌性记作怀孕的雌性。在使用mPGK2启动子的雄性转基因小鼠的情况下,尽管确定了有些雌性在交配后怀孕,但该雌性最终没有产下新生儿。当进一步进行免疫染色时,麻醉转基因小鼠,并在灌注固定前提取其附睾。使用从附睾得到的精子进行人工授精(表4(B))。
                        表4(B)
  未受精卵的数目   2-细胞期的数目   新生儿的数目
  mPGK2   23   0   0
  Fthl17   22   8   ?
从任一种小鼠收集的精子都能侵入未受精卵。在观察的任何精子中,都没有发现异常。在使用Fthl17上游的序列的转基因小鼠的情况下,有些卵在人工授精后以低于通常的速度发展到2-细胞期。确认了新生儿是由已经移植进了卵的替代母亲所生。但是,在使用mPGK2启动子的转基因小鼠的情况下,有些受精卵在人工授精后发展到原核期,但是没有卵在人工授精后达到2-细胞期。因此,暗示着使用用于免疫染色的mPGK2启动子的雄性转基因小鼠在精子发生中具有异常的可能性。应当注意,在以与正常的小鼠类似的方式生育新生儿的使用mPGK2启动子的F0代雌性中没有特别地发现异常。
(b)转基因小鼠#2
通过与能以组织特异性的方式表达Cre重组酶的小鼠交配,得到了转基因小鼠#2,从而使突变型Pold1以组织特异性的方式超表达。为此,生产了这样的载体,其序列包含用于全身超表达的CAG启动子、被2个loxP序列夹在中间的新霉素抗性基因和与其相连的突变型Pold1(图9)。将指示着转录终止的聚腺苷酸信号添加到新霉素抗性基因的末端。因此,通过Cre重组酶的组织-特异性的表达,可以启动突变型Pold1的表达。如在转基因小鼠#1中那样,生产转基因小鼠#2。利用PCR,使用对新霉素抗性基因特异性的引物(图10),确认了4个系(在20个新生儿中)是转基因小鼠。在4个转基因小鼠系中,3个系的F0代小鼠表现出与正常的小鼠类似的生长。因此,可以认为在小鼠中基本上没有发生异常,即使根据本发明调节了遗传性状的转化率。
从转基因小鼠#2的3个存活系的尾巴提取mRNA,随后使用对新霉素抗性基因特异性的引物,进行RT-PCR。结果,确认了新霉素抗性基因的表达。
(生产靶向小鼠)
尝试生产有条件的靶向小鼠,其中正常的Pold1基因被以组织-或时间-特异性的方式替换为突变型Pold1基因,且尽可能地维持原始DNA聚合酶δ的表达方式。在使用Cre重组酶的重组情况下,如果连接了2个loxP序列,从而使它们彼此相向,则在这2个loxP序列之间会发生重组,从而使被loxP序列夹在中间的区域可以反转,即替换为反向区。但是,如果这2个loxP序列仅仅彼此相向,则替换是可逆的反应过程。为了使重组反应过程不可逆,可以将突变导入loxP序列-(lox66,lox71)的一部分,如Kimi Araki,等,(1997),Nucleic Acids Res.,25,868-872所述。
使用突变的loxP序列,生产了有条件的靶向小鼠。提供了lox66和lox71,并使其彼此相向。将正常的外显子10的序列和与含有突变型Pold1的突变位点的突变型外显子10互补的序列连接到序列中(图14)。使用这样的载体来生产靶向小鼠。预期,如果由于Cre重组酶的表达,在2个lox序列之间发生重组,那么在剪接中使用的外显子10会从正常型变成突变型(图15)。由此,由于Cre重组酶的表达,正常型内源DNA聚合酶δ会被替换为突变型。当生产靶向载体时,制备了外显子10,从而使位于其相对末端的内含子部分含有剪接所必需的序列。
但是,lox66和lox71序列含有突变。因此,认为由于Cre重组酶造成的重组效率低于使用正常的loxP序列时的重组效率。为了研究当lox66和lox71序列彼此相向时,是否适当地发生反应,使用Cre重组酶自身进行重组。为此,利用pBluescript II生产了含有位于lox66和lox71(称作lox66-71重组体序列)之间的2个外显子10的序列。通过使序列与Cre重组酶反应,研究了重组效率。使用用于转基因小鼠#2的载体序列作为关于反应发生的阳性对照实验。结果,使用Cre重组酶的反应在15分钟内造成了50%的质粒的重组,在2小时内为100%。当反应相对于lox66-71重组体序列进行了2小时时,确认了正常的重组处于较低的频率(1/3)。因而,确信重组发生在lox66-71重组体序列中。
(调节遗传性状的转化率)
当使这些小鼠暴露于转化遗传性状的步骤(例如,高温,高湿度,高盐浓度,等)时,与正常的小鼠相比,能适应环境的个体的数目显著增加。
根据该实施例的方法,揭示了通过缺失DNA聚合酶δ的校对活性,可以使不均衡突变积累在前导的和后随的DNA链。还揭示了通特异性地在精子发生阶段表达具有突变的DNA聚合酶,可以尽可能多地降低小鼠全身发生突变的速度。还揭示了可以尽可能多地抑制遗传操纵等造成的二次影响。在该实施例中,实现了能满足上述要求的不均衡进化小鼠。
在转基因小鼠#1的情况下,可能研究特异性地在精子发生阶段表达的启动子。大多数目前已知特异性地在精子发生阶段表达的启动子是特异性地在减数分裂后的精子细胞阶段表达的。在该实施例中,意在使用特异性地在复制DNA链的精原细胞阶段或初级精母细胞阶段的雄性生殖细胞中表达的启动子。mPGK2启动子是能满足该条件的唯一启动子。因此,在该实施例中,尝试使用Fthl17基因上游的序列作为新的启动子。结果,确认至少在初级精母细胞阶段表达。对于精原细胞,使转基因小鼠#1与可得到的CAG-CAT-GFP转基因小鼠(使用具有与这里生产的转基因小鼠#2相似的结构的载体,生产的转基因小鼠;且在该小鼠中,GFP的表达是由Cre重组酶的表达启动的)交配,以便认为GFP能在表达Cre重组酶的转基因小鼠#1的区域表达。因此,结合GFP表达区和Cre重组酶表达区的结果,可能分析该实施例的启动子的表达区。应当指出,Fthl17上游的序列不含有基础转录因子结合序列,例如TATA盒等。
在mPGK2启动子的表达中,没有观察到在与常规报告相比较迟阶段的精子发生阶段后的表达。
暗示着用转基因小鼠#1生产的2种转基因小鼠具有不同的表达区。因此,认为为了调节转化率,使用这些小鼠来对比各区域的表达效率是有用的。生产能特异性地在精子发生阶段表达Cre重组酶的转基因小鼠,使利用以组织特异性的方式发生的loxP序列的重组得到调节基因缺陷型小鼠成为可能。因此,这样的小鼠可以用作研究生殖细胞的材料。
可以使转基因小鼠#2与能以组织特异性的方式表达Cre重组酶的小鼠交配,以实现以组织特异性的方式超表达突变型Pold1。在转基因小鼠#1中,当启动子的表达停止时,突变型Pold1的表达不再发生。通过上述的交配,突变型Pold1的表达可以在启动子的表达结束后继续进行。另外,通过与转基因小鼠(其中特异性地在组织例如脑、肝等中表达Cre重组酶)交配,可以在体细胞水平研究超表达的影响。
根据该实施例的结果,应当明白可以在敲除的小鼠中调节遗传性状的转化率。
(实施例5:使用稻作为植物,生产突变的生物)
接着,在实施例5中,使用稻(植物)作为代表性的真核生物来生产不一致突变的生物。
基因靶向技术描述在,例如,Yagi T.等,Proc.Natl.Acad.Sci.USA,87:9918-9922,1990;″Gintagettingu no Saishingijyutsu[Up-to-date Gene Targeting Technology]″,Takeshi Yagi,编,Special issue,Jikken Igaku[Experimental Medicine],2000,4。在实施例4中,生产了含有具有不一致DNA复制校对能力的复制复合物的植物(Morrison,A.,等,Mol.Gen.Genet.,242:289-296,1994)。
要修饰的遗传性状是疾病抗性(稻瘟病)和低温抗性。
(基因靶向技术)
制备了具有突变的DNA聚合酶(pol)的靶向载体(Morrison,A.,等,Mol.Gen.Genet.,242:289-296,1994)。使植物细胞(例如愈伤组织等)进行关于植物细胞的pol基因的同源重组。此后,使细胞分化成植物体。
(方案)
(1.制备愈伤组织细胞)
以描述在例如Plant Tissue Culture:Theory and Practice,Bhojwani,S.S.和Razdan,N.K.,Elsevier,Amsterdam,1983中的众所周知的技术,制备了愈伤组织细胞。具体地,从植物体制备了愈伤组织细胞(Davies,R.,1981,Nature,291:531-532和Luo,Z.,等,Plant Mol.Bio.Rep.,7:69-77,1989)。
(2.pol基因的同源重组)
为了有效地得到同源重组细胞,使用用于小鼠的基因靶向方法(即,正/负方法)进行同源重组(Yagi,T.,等,Proc.Natl.Acad.Sci.USA,87:9918-9922,1990;Capecchi M.R.,Science,244(16),1288-1292,1989)。
制备靶向载体:通过描述在例如Molecular Cloning,第2版,Sambrook,J.,等,同上,和Ausubel,F.M.,Current Protocols inMolecular Biology,Green Publishing Associates and Wiley-Interscience,NY,1987,同上中的技术,制备了靶向载体。
在靶向载体中,将突变Polδ和/或polε基因插入在正基因和负基因之间。将潮霉素抗性基因用作正基因,而将白喉毒素用作负基因(Terada R.,等,Nature Biotech.,20:1030-1034,2002)。
对于Pol突变,将碱基突变导入Polδ的校对活性位点,以缺失校对活性(在SEQ ID NO.48的位置320处的D和在位置322处的E被取代为丙氨酸(A))(Morrison A.& Sugino Al,Mol.Gen.Genet.242:289-296,1994;Goldsby R.E.,等,Pro.Natl.Acad.Sci.USA,99:15560-15565,2002)。
(3.将载体导入愈伤组织细胞)
通过描述在例如“Shokubutsu BaiotekunorojiII[PlantBiotechnology II]”,Yasuyuki & Kanji Ooyama,编,TokyoKagakudojin,1991中的技术,将载体导入愈伤组织细胞。在实施例5中,通过电穿孔方法、土壤杆菌方法等,将载体导入愈伤组织细胞。在含有潮霉素(100μg/ml,Invitrogen)的DMEM培养基(FlowLaboratory)中进行培养。
(4.回收重组细胞)
在有潮霉素存在的情况下培养后,回收重组细胞(Terada R.,等,Nature Biotech.,20:1030-1034,2002)。
(5.确认同源重组体)
从重组体提取基因组DNA。通过DNA印迹和/或PCR,确定突变体pol是否成功地导入了ES细胞(″Gintagettingu noSaishingijyutsu[Up-to-date Gene Targeting Technology]″,Takeshi Yagi,编,Special issue,Jikken Igaku[ExperimentalMedicine],2000,4)。
(6.生产植物体)
以描述在例如“Shokubutsu Baiotekunoroji II[PlantBiotechnology II]”,Yasuyuki & Kanji Ooyama,编,TokyoKagakudojin,1991;和″Shokubutsu Soshikibaiyo no Gijyutsu[Plant Tissue Culture Technique]″,Masayuki Takeuti,TetsuoNakajima,& Riki Kotani,编,Asakura Shoten,1988中的方法,生产了植物体。在实施例5中,使愈伤组织分化成植物体。此后,使用源自花药、种子等的单倍体细胞和/或通过杂交植物制备出的同型二倍体细胞,使用本领域众所周知的技术(Maki,H.等,J.Bacteriology,153(3),1361-1367,1983;Miller,J.H.,1992,A Short course in bacterial genetics,Cold Spring HarberLaboratory Press,Cold Spring Harber,N.Y.),确认pol突变(增变株突变)的性质。
(结果)
发现在实施例5中得到的具有突变的植物与通过常规技术得到的植物相比可以迅速获得低温抗性和疾病抗性(例如,稻瘟病,等)。修饰的细胞具有与自然产生的细胞基本上相同的生长速度,但是,修饰的细胞的突变率是每代2个或更多个,这与常规的突变显著不同。
(实施例6:在拟南芥中示范)
接着,使用拟南芥生产突变的生物。
(方法和材料)
(PolδcDNA克隆)
使用下列来自源自拟南芥根的总mRNA的引物,通过PCR扩增polδ(Atlg42120)(SEQ ID NO.90(核酸序列)和SEQ ID NO.91(氨基酸序列)),并亚克隆进pBluescript SK2(TOYOBO)。
Xba1-42120-F:5′-CTGAGTCTAGATTTCCCGCCATGGAAATCG-3′(SEQID NO.:82)
2g42120-Sac1-R:5′-AGCAACGAGCTCTTATGATTGGTTTATCTG-3′(SEQ ID NO.:83)
(生产突变型Polδ基因Polδ(D316A)(SEQ ID NO.92(核酸序列)和SEQ ID NO.93(氨基酸序列)))
使用下列引物,导入点突变,以将polδcDNA中氨基酸316从D改变至A。
2g42120-D316A-F:5′-ATTTGCTGTCGATAATATCAGATTTCTTGG-3′(SEQ ID NO.:84)
2g42120R:5′-GAGTGAGGATTTGTACATGATCTGAAGG-3′(SEQ IDNO.:85)
(生产用于转化的载体)
通过修饰pBI121(CLONTECH),生产了能在植物中始终如一地表达基因的二元质粒。使用限制酶XbaI和SacI,提取pBI121的β-葡糖醛酸糖苷酶基因,并取代为Polδ(D316A)(下文称作Polδ(D316A))。
生产了上述的pBIl21(下文称作GUS)和含有取代5-葡糖醛酸糖苷酶基因的GTP的pBIl21(下文称作GTP),作为转化对照的载体。
(生产愈伤组织)
在发芽培养基上散布拟南芥(副本:Columbia)的种子,随后在4℃低温处理2或3天。此后,将平板转移进培养箱(22℃)。使种子在暗处生长10天。将伸长的下胚轴切成约1-cm长的片段,依次将其置于CIM培养基上10天。得到愈伤组织。
(使用土壤杆菌转化愈伤组织)
将含有具有GUS或GTP或Polδ(D316A)的二元质粒的土壤杆菌pMP90接种到补充了50mg/L卡那霉素的LB培养基中,随后在28℃振荡培养2天。在台式离心机中离心1.4ml土壤杆菌培养物(OD600=约0.8)5分钟,以收集细菌。将细菌悬浮到1ml AIM(下述)中。将愈伤组织化的下胚轴片段转移到含有5ml AIM的60-mm培养皿中。向培养皿中加入1ml土壤杆菌悬浮液,随后在室温振荡培养约20分钟。将愈伤组织置于无菌滤器上,以除去多余的水分,此后,转移到新的CIM平板上。3天后,将转化的愈伤组织转移到含有AIM的60-mm培养皿中。将培养皿在60rpm旋转25分钟,随后洗涤5次。
洗涤后,将愈伤组织置于滤器上,以去除水分,并在含有50mg/L羧苄青霉素和50mg/L卡那霉素的CIM培养基中生长(下述)(CIM培养基由发明人制备)。
应当指出,愈伤组织的转化率是95%或更高(仅测量了其中导入了GTP的愈伤组织;并检查了GTP荧光是否存在)。
(传代培养愈伤组织和筛选突变体)
每10天将愈伤组织转入新的CIM平板。在该情况下,一块愈伤组织被分成2块。一半置于CIM平板中进行传代培养,而另一半则置于平板中,用于在各种条件下筛选抗性突变体。
将200mM或300mM NaCl加入筛选平板。每10天进行传代培养和筛选。
(培养基的组成)
发芽培养基(1升):
Murashige最低有机培养基(GIBCO BRL)                   1/2包
蔗糖                                                 10g
Gelllan Gum(Wako Pure Chemical Industries)           5g
(CIM(1升))
Gamborg氏B5培养基盐混合物(Nihon Pharmaceutical)      1包
葡萄糖                                               20g
肌醇                                                 100mg
5%Mes-KOH(pH5.7)                                    10ml
Gelllan Gum                                          5g
高压灭菌后,加入下列物质:
盐酸硫胺素       20mg
烟酸             1mg
盐酸吡哆醇       1mg
生物素           10mg
2,4-D           0.5mg
激动素           0.05mg
(AIM(1升))
Gamborg氏B5培养基盐混合物(Nihon Pharmaceutical)      1包
葡萄糖                                               20g
5%Mes-KOH(pH5.7)                                    10ml
(结果)
结果,使用的上述基因(GFP,GUS(转化对照),polδ(D316A))中的每一种都有95%或更高的转化率(仅测量了其中导入了GTP的个体;并检查了GTP荧光是否存在)。
(进化条件)
使在该实施例中得到的植物暴露于用于改变下列遗传性状的条件。
在下述条件下,筛选突变体。
1)37℃,将平板置于37℃的培养箱中。
2)200mM NaCl,将200mM NaCl加入培养基中,并使植物在22℃生长。
3)300mM NaCl,将300mM NaCl加入培养基中,并使植物在22℃生长。
(筛选突变体的结果)
下面将描述每种处理的结果。下表中从左向右的数字表示:像未处理的愈伤组织一样生长的愈伤组织的数目(抗性的)/不能良好生长但是也不会死亡的愈伤组织的数目(弱抗性的)/死亡的愈伤组织的数目(易感的)。
  处理   GFP   polδ
  37℃200mM NaCl300mM NaCl   0/24/270/20/1450/0/165   1/18/100/58/1120/4/146
如上所述,对高温抗性的植物的数目有所增加。另外,对于盐浓度,对200mM NaCl抗性的愈伤组织(polδ)的数目大于对照。因此,表明本发明的方法可以赋予植物对高盐浓度的抗性。具体地,在300mM NaCl的情况下,对照不能获得抗性,而本发明的方法能赋予抗性。
(实施例7:使用拟南芥的系列抗性实验)
接着,确定了遗传性状(例如抗性)是否能在数代中传递。进行该实验的条件与在实施例6中使用的相同。
下面描述了个体的数目。
   表5使用拟南芥愈伤组织的盐抗性实验的结果
           <实验的愈伤组织的数目>
  质粒的类型   200mM NaCl   300mM NaCl
  突变体polδ   75   75
  GTP   96   95
  GUS   75   68
<筛选方法>
生产了愈伤组织。将生长至一定程度的愈伤组织分成2半。一半在正常培养基中生长至原始大小,而在选择性培养基中培养另一半,以测试抗性的获得。当在正常培养基中的愈伤组织生长良好时,将一半转移到正常培养基中,而将另一半转移到选择性培养基中,进行第二次筛选。共进行6次筛选。在300mM NaCl的情况下,没有得到抗性愈伤组织。因此,所有实验都是关于200mM NaCl进行的。
图16示意性地显示了实验。
<不连续实验>
计数在6次筛选中不连续发生的抗性愈伤组织的数目。将曾经获得抗性但会丢失的愈伤组织视作假阳性的。
            表6不连续实验的结果
 质粒的类型   200mM NaCl抗性愈伤组织的数目
 突变体polδ   8
 GTP   6
 GUS   6
<连续实验>
为了去除假阳性结果,计数连续获得抗性的愈伤组织的数目。在高达第6次筛选中具有抗性的愈伤组织的数目如下表所示。
                    表7
  质粒的类型   200mM NaCl抗性愈伤组织的数目
  突变体polδ   1
  GTP   0
  GUS   0
因而,仅仅具有突变体polδ的株连续表现出抗性。该株维持抗性超过了第6代。这表明本发明在稳定性以及遗传性状的转化率方面优于常规技术。
(实施例8:使用ES细胞的实验)
接着,确定了本发明是否可以应用于ES细胞。方法如下所述。
<制备ES细胞>
培养源自C57BL/6和CBA F1小鼠胚胎的ES细胞系(TT-2细胞)(由Osaka University的Yagi实验室根据一般方案制备),并在ES细胞培养基(ESM)(含有20%FBS、0.1mM NEAA、1mM丙酮酸、LIF(ESGRO_,Amrad)和巯基乙醇的DMEM)中、在饲养细胞上繁殖。
如下所述制备导入的载体(图17)。将突变体pold1、正常的Pold1或EGTP基因的cDNA整合进pcDNA 3.1(+)中,后者是蛋白表达载体。进行限制酶消化,以得到线性的DNA片段,后者再用于要导入的基因。使用0.25%胰蛋白酶溶液,取出繁殖的ES细胞。将ES细胞置于比色皿(cuvette)中,其比率为2.0×106ES细胞/比色皿。使细胞与100μl 25nM载体DNA溶液混合,随后通过电穿孔进行基因导入。
电穿孔后,使用ESM培养细胞48小时。此后,在补充了G418(终浓度:200μg/mL)(SIGMA)的ESM培养基中培养细胞。由此,将导入了基因的细胞分组。在明胶包被的平板上进行培养。此后,在有青霉素-链霉素(可商业上获得的产品(GIBCO)的100倍稀释物)存在的情况下,培养ES细胞。
<6TG测定>
将繁殖的和胰蛋白酶(2.5%,GIBCO)处理过的ES细胞散布到10-cm培养皿上,达到5.0×106细胞/培养皿。在有6-TG(终浓度:2μg/ml;Sigma,测试的杂交瘤)和G418存在的情况下,将抗性菌落分组。在该分组中,在明胶包被的培养皿(将0.1%明胶溶液置于FALCON353003细胞培养皿中,随后在37℃温育30分钟(明胶可从SIGMA得到))上培养细胞。每2天更换一次培养基。将散布细胞的当天当作第0天。在第11天计数菌落数目。只计数繁殖良好且生长的菌落。
<实验结果>
有指定为#1和#2的2批突变体pold1,对它们分别进行电穿孔。在每种情况下,使用6个10-cm培养皿,并记录抗性菌落的外观。菌落的数目如下所示(0×6代表着其上面没有出现菌落的6个培养皿)。
突变体pold1               3×1,1×2,0×9
野生型Pold1               0×6
EGTP对照                  0×6
根据该实施例的结果,仅仅在突变体Pold1的情况下观察到了生长的菌落。对于得到的菌落,可以对HGPRT基因(它是突变的靶)进行部分测序,以确认突变的导入。
因而,表明突变体Pold1基因的超表达有利于将突变导入小鼠ES细胞。因此,证实了可能调节ES细胞的遗传性状的转化率,并增加比率和稳定性。
(实施例9:革兰氏阳性的细菌)
在该实施例中,作为示例性的革兰氏阳性的细菌,将枯草芽孢杆菌用作导入突变的宿主细胞。在突变中,分别位于位置425和427的天冬氨酸和谷氨酸在如SEQ ID NO.15所述的聚合酶C中突变。通过质粒(pHY300PLK,TAKARA),将该聚合酶C突变体导入枯草芽孢杆菌中。此后,在进化条件下,暴露细菌。
生产突变体后,例如,将中等高温(例如,42℃)逐渐增加到50℃或更高。
枯草芽孢杆菌是一种已经得到充分研究的土壤细菌。其生长温度是20-50℃(该细菌在pH6-7、30分钟倍增)。
如上所述,在进化条件下,该实施例的有些芽孢杆菌株可以在高达55℃存活。该株能在传代培养中维持该性质。
因此,表明可可能节具有与大肠杆菌不同的DNA复制机制的细菌的进化速度。
(实施例10:分离基因)
在实施例10中,分离了在改变遗传性状中起作用的基因。分离了实施例1的获得抗药性的生物。此后,在修饰前的原始生物和修饰的生物中,确定了参与抗药性的基因的序列。结果,发现修饰了促旋酶(或拓扑异聚合酶(topoisopolmerase)II)亚基A和拓扑异构酶IV基因。使用合适的引物,通过PCR扩增这些序列,并分离全长基因。从原始的和修饰的基因中,合成了多肽,并测量了其活性。结果,发现的确改变了活性。因而,已经证实,本发明的方法可以在基因水平迅速导入突变。
(实施例11:分离新产物物质)
在实施例11中,分离了通过修饰得到的新产物物质。分离了实施例1的获得抗药性的生物。此后,通过色谱分析(例如,HPLC,等),鉴别出在修饰前的原始生物中不存在、但是在修饰的生物中存在的物质。分离新产物物质。结果,发现促旋酶(或拓扑异聚合酶II)亚基A和拓扑异构酶IV基因产物是新产物物质。因而,已经证实,本发明的方法实际上可以用于生产新产物物质。
(实施例12:修饰倾向于错误的频率的其它方法)
除了上述的突变外,可能导入会削弱聚合酶δ和ε的聚合酶部分的活性的突变,以减少DNA复制的精确度。
(实施例13:倾向于错误的频率和进化速度之间的关系)
作为对照,在如实施例1所述的酵母获得抗药性、乙醇抗性和高温抗性的实验中,进行了导入突变的常规方法(辐射,化学处理,等)。结果,本发明的抗性获得速度显著高于常规技术。当同时开始2个实验时,通过本发明可以比常规技术更早地获得抗性株。
在实施例13中,使用包含逐步改变的突变率的方法来对比获得抗性所需的时间。结果,可以得到进化速度。
尽管本文已经描述了某些优选的实施方案,但并不意味着这些实施方案可以用于限制本发明的范围,除了如所附的权利要求书所述的之外。在阅读本说明书后,各种其它修饰和等同方案对本领域的技术人员而言是显然的,且能容易地实现,而不脱离本发明的范围和精神。本文引用的所有专利、公开的专利申请和出版物都引作参考,如同在本文中完整描述。
工业适用性
根据本发明,与常规方法相比,可以将需要的性状迅速地赋予生物,且基本上没有副作用。另外,根据本发明,通过简单的操作可以修饰生物的遗传性状。由此,可能有效地获得通过常规方法不能得到的有用的生物、基因、基因产物、代谢物等。
                        序列表
<110>Neo-Morgan Laboratories Inc。
     FURUSAWA,Mitsuru
<120>用于将需要的性状迅速赋予生物的方法和系统
<130>NE0001PCT
<150>JP 2003-92898
<151>2003-03-28
<150>US 10/684,141
<151>2003-10-10
<160>95
<170>PatentIn Ver.2.1
<210>1
<211>3551
<212>DNA
<213>啤酒糖酵母(Saccharomyces cerevisiae)
<400>1
acgcgtaact ttttattcta taaaatgttc aatgaggaca tctgctattc gcttatgaag 60
aacaaacact cagtactact gatctaaggc aattttcaag gataaaggaa aatagatatt 120
gagcacttgc tattaagcat taatctttat acatatacgc acagcaatga gtgaaaaaag 180
atcccttccc atggttgatg tgaagatcga tgacgaggat actccccagt tggaaaagaa 240
aatcaaacgg caatcaatag atcatggtgt tggaagtgaa cctgtttcaa caatagagat 300
tattccgagt gattcttttc gaaaatataa tagtcaaggc ttcaaagcaa aggatacaga 360
tttaatgggt acgcaattag agtctacttt tgaacaagag ctatcgcaaa tggaacatga 420
tatggccgac caagaagagc atgacctgtc atcattcgag cgtaagaaac ttccaaccga 480
ttttgaccca agtttgtatg atatttcttt ccaacaaatt gatgcggaac agagcgtact 540
gaatggtatc aaagatgaaa atacatctac cgtggtaagg ttttttggtg tcactagtga 600
aggacactct gtactttgta atgttacagg gttcaagaac tatctttacg tcccagcgcc 660
caattcttcc gacgctaacg atcaggagca aatcaacaag tttgtgcact atttaaacga 720
aacatttgac cacgctattg attcgattga agttgtatct aaacagtcta tctggggtta 780
ttccggagat accaaattac cattctggaa aatatacgtc acctatccgc atatggtcaa 840
caaactgcgt actgcgtttg aaagaggtca tctttcattc aactcgtggt tttctaacgg 900
cacgactact tatgataaca ttgcctacac tttaaggtta atggtagatt gtggaattgt 960
cggtatgtcc tggataacat taccaaaagg aaagtattcg atgattgagc ctaataacag 1020
agtttcctct tgtcagttgg aagtttcaat taattatcgt aacctaatag cacatcctgc 1080
tgagggtgat tggtctcata cagctccatt gcgtatcatg tcctttgata tcgagtgtgc 1140
tggtaggatt ggcgtctttc cggaacctga atacgatccc gtcatccaaa ttgccaacgt 1200
tgtgagtatt gctggcgcta agaaaccatt cattcgtaat gtgtttactc tgaatacatg 1260
ctcacccata acaggttcaa tgattttttc ccacgccact gaagaggaaa tgttgagcaa 1320
ttggcgtaac tttatcatca aagttgatcc tgatgttatc attggttata atactacaaa 1380
ttttgatatc ccttatcttt taaaccgtgc aaaggcgcta aaggtgaatg atttcccata 1440
ttttggaagg ttaaaaaccg ttaagcaaga aattaaagag tctgtgttct cttcgaaggc 1500
ttatggtaca agagaaacca aaaatgtcaa tattgacggc cgattacagt tggatctttt 1560
gcaatttatt cagcgtgagt ataaactaag atcctacacg ttgaatgcag tctctgcgca 1620
ctttttaggt gaacagaagg aggatgtaca ttatagcatc atttctgatc tacaaaatgg 1680
cgatagtgaa acaagaagaa ggttggccgt ttactgtttg aaagacgcct acctgccttt 1740
aaggcttatg gaaaaactaa tggcgttagt taactataca gaaatggctc gtgttacagg 1800
tgtgccattt tcatatttac tagctcgtgg tcaacaaatt aaagttgttt ctcaactatt 1860
tcgaaagtgc ctggagattg atactgtgat acctaacatg caatctcagg cctctgatga 1920
ccaatatgag ggtgccactg ttattgagcc tattcgtggt tattacgatg taccgattgc 1980
aactttggat ttcaattctt tatatccaag tattatgatg gcgcacaacc tatgttatac 2040
aacactttgt aacaaagcta ctgtagagag attgaatctt aaaattgacg aagactacgt 2100
cataacacct aatggagatt attttgttac cacaaaaaga aggcgtggta tattaccaat 2160
tattctggat gaattaataa gtgctagaaa acgcgctaaa aaagatctga gagatgagaa 2220
ggatccattc aaaagagatg ttttaaatgg tagacaattg gctttgaaga tttcagctaa 2280
ctctgtctat ggttttacag gagcgacggt gggtaaattg ccatgtttag ccatttcttc 2340
atctgttact gcttatggtc gtaccatgat tttaaaaact aaaaccgcag tccaagaaaa 2400
atattgtata aagaatggtt ataagcacga tgccgttgtg gtttacggtg acactgattc 2460
cgttatggta aagtttggta caacagattt aaaggaagct atggatcttg gtaccgaagc 2520
tgccaaatat gtctccactc tattcaaaca tccgattaac ttagaatttg aaaaagcata 2580
cttcccttac cttttgataa ataaaaagcg ttatgcaggt ttattctgga ctaatcctga 2640
caagtttgac aagttggacc aaaaaggcct tgcttctgtc cgtcgtgatt cctgttcctt 2700
ggtttctatt gttatgaata aagttttaaa gaaaatttta attgaaagaa atgtagatgg 2760
tgctttagct tttgtcagag aaactatcaa tgatattctg cataatagag tagatatttc 2820
aaagttgatt atatcaaaga cgttagcccc aaattacaca aatccacagc cgcacgccgt 2880
tttggctgaa cgtatgaaga ggagagaggg cgttggtcca aatgttggtg atcgtgtgga 2940
ctatgtcatt atcggtggta atgataaact ttacaataga gcagaagatc cattatttgt 3000
actagaaaac aatattcaag tggattcgcg ctattattta actaatcaat tacaaaatcc 3060
aatcattagt attgttgcac ctattattgg cgacaaacag gcgaacggta tgttcgttgt 3120
gaaatccatt aaaattaaca caggctctca aaaaggaggc ttgatgagct ttattaaaaa 3180
agttgaggct tgtaaaagtt gtaaaggtcc gttgaggaaa ggtgaaggcc ctctttgttc 3240
aaactgtcta gcaaggtctg gagaattata cataaaggca ttatacgatg tcagagattt 3300
agaggaaaaa tactcaagat tatggacaca atgccaaagg tgcgctggta acttacatag 3360
tgaagttttg tgttcaaata agaactgtga cattttttat atgcgggtta aggttaaaaa 3420
agagctgcag gagaaagtag aacaattaag caaatggtaa aaaacgatag ggtggcacat 3480
catattagga ttaagaaagg ctaacaactt tttgcatgtt ggtggatata tatgtatata 3540
taaatagata c                                                      3551
<210>2
<211>1097
<212>PRT
<213>啤酒糖酵母(Saccharomyces cerevisiae)
<400>2
Met Ser Glu Lys Arg Ser Leu Pro Met Val Asp Val Lys Ile Asp Asp
  1               5                  10                  15
Glu Asp Thr Pro Gln Leu Glu Lys Lys Ile Lys Arg Gln Ser Ile Asp
             20                  25                  30
His Gly Val Gly Ser Glu Pro Val Ser Thr Ile Glu Ile Ile Pro Ser
         35                  40                  45
Asp Ser Phe Arg Lys Tyr Asn Ser Gln Gly Phe Lys Ala Lys Asp Thr
     50                  55                  60
Asp Leu Met Gly Thr Gln Leu Glu Ser Thr Phe Glu Gln Glu Leu Ser
 65                  70                  75                  80
Gln Met Glu His Asp Met Ala Asp Gln Glu Glu His Asp Leu Ser Ser
                 85                  90                  95
Phe Glu Arg Lys Lys Leu Pro Thr Asp Phe Asp Pro Ser Leu Tyr Asp
            100                 105                 110
Ile Ser Phe Gln Gln Ile Asp Ala Glu Gln Ser Val Leu Asn Gly Ile
        115                 120                 125
Lys Asp Glu Asn Thr Ser Thr Val Val Arg Phe Phe Gly Val Thr Ser
    130                 135                 140
Glu Gly His Ser Val Leu Cys Asn Val Thr Gly Phe Lys Asn Tyr Leu
145                 150                 155                 160
Tyr Val Pro Ala Pro Asn Ser Ser Asp Ala Asn Asp Gln Glu Gln Ile
                165                 170                 175
Asn Lys Phe Val His Tyr Leu Asn Glu Thr Phe Asp His Ala Ile Asp
            180                 185                 190
Ser Ile Glu Val Val Ser Lys Gln Ser Ile Trp Gly Tyr Ser Gly Asp
        195                 200                 205
Thr Lys Leu Pro Phe Trp Lys Ile Tyr Val Thr Tyr Pro His Met Val
    210                 215                 220
Asn Lys Leu Arg Thr Ala Phe Glu Arg Gly His Leu Ser Phe Asn Ser
225                 230                 235                 240
Trp Phe Ser Asn Gly Thr Thr Thr Tyr Asp Asn Ile Ala Tyr Thr Leu
                245                 250                 255
Arg Leu Met Val Asp Cys Gly Ile Val Gly Met Ser Trp Ile Thr Leu
            260                 265                 270
Pro Lys Gly Lys Tyr Ser Met Ile Glu Pro Asn Asn Arg Val Ser Ser
        275                 280                 285
Cys Gln Leu Glu Val Ser Ile Asn Tyr Arg Asn Leu Ile Ala His Pro
    290                 295                 300
Ala Glu Gly Asp Trp Ser His Thr Ala Pro Leu Arg Ile Met Ser Phe
305                 310                 315                 320
Asp Ile Glu Cys Ala Gly Arg Ile Gly Val Phe Pro Glu Pro Glu Tyr
                325                 330                 335
Asp Pro Val Ile Gln Ile Ala Asn Val Val Ser Ile Ala Gly Ala Lys
            340                 345                 350
Lys Pro Phe Ile Arg Asn Val Phe Thr Leu Asn Thr Cys Ser Pro Ile
        355                 360                 365
Thr Gly Ser Met Ile Phe Ser His Ala Thr Glu Glu Glu Met Leu Ser
    370                 375                 380
Asn Trp Arg Asn Phe Ile Ile Lys Val Asp Pro Asp Val Ile Ile Gly
385                 390                 395                 400
Tyr Asn Thr Thr Asn Phe Asp Ile Pro Tyr Leu Leu Asn Arg Ala Lys
                405                 410                 415
Ala Leu Lys Val Asn Asp Phe Pro Tyr Phe Gly Arg Leu Lys Thr Val
            420                 425                 430
Lys Gln Glu Ile Lys Glu Ser Val Phe Ser Ser Lys Ala Tyr Gly Thr
        435                 440                 445
Arg Glu Thr Lys Asn Val Asn Ile Asp Gly Arg Leu Gln Leu Asp Leu
    450                 455                 460
Leu Gln Phe Ile Gln Arg Glu Tyr Lys Leu Arg Ser Tyr Thr Leu Asn
465                 470                 475                 480
Ala Val Ser Ala His Phe Leu Gly Glu Gln Lys Glu Asp Val His Tyr
                485                 490                 495
Ser Ile Ile Ser Asp Leu Gln Asn Gly Asp Ser Glu Thr Arg Arg Arg
            500                 505                 510
Leu Ala Val Tyr Cys Leu Lys Asp Ala Tyr Leu Pro Leu Arg Leu Met
        515                 520                 525
Glu Lys Leu Met Ala Leu Val Asn Tyr Thr Glu Met Ala Arg Val Thr
    530                 535                 540
Gly Val Pro Phe Ser Tyr Leu Leu Ala Arg Gly Gln Gln Ile Lys Val
545                 550                 555                 560
Val Ser Gln Leu Phe Arg Lys Cys Leu Glu Ile Asp Thr Val Ile Pro
                565                 570                 575
Asn Met Gln Ser Gln Ala Ser Asp Asp Gln Tyr Glu Gly Ala Thr Val
            580                 585                 590
Ile Glu Pro Ile Arg Gly Tyr Tyr Asp Val Pro Ile Ala Thr Leu Asp
        595                 600                 605
Phe Asn Ser Leu Tyr Pro Ser Ile Met Met Ala His Asn Leu Cys Tyr
    610                 615                 620
Thr Thr Leu Cys Asn Lys Ala Thr Val Glu Arg Leu Asn Leu Lys Ile
 625                630                 635                 640
Asp Glu Asp Tyr Val Ile Thr Pro Asn Gly Asp Tyr Phe Val Thr Thr
                645                 650                 655
Lys Arg Arg Arg Gly Ile Leu Pro Ile Ile Leu Asp Glu Leu Ile Ser
            660                 665                 670
Ala Arg Lys Arg Ala Lys Lys Asp Leu Arg Asp Glu Lys Asp Pro Phe
        675                 680                 685
Lys Arg Asp Val Leu Asn Gly Arg Gln Leu Ala Leu Lys Ile Ser Ala
   690                 695                 700
Asn Ser Val Tyr Gly Phe Thr Gly Ala Thr Val Gly Lys Leu Pro Cys
705                 710                 715                 720
Leu Ala Ile Ser Ser Ser Val Thr Ala Tyr Gly Arg Thr Met Ile Leu
                725                 730                 735
Lys Thr Lys Thr Ala Val Gln Glu Lys Tyr Cys Ile Lys Asn Gly Tyr
            740                 745                 750
Lys His Asp Ala Val Val Val Tyr Gly Asp Thr Asp Ser Val Met Val
        755                 760                 765
Lys Phe Gly Thr Thr Asp Leu Lys Glu Ala Met Asp Leu Gly Thr Glu
    770                 775                 780
Ala Ala Lys Tyr Val Ser Thr Leu Phe Lys His Pro Ile Asn Leu Glu
785                 790                 795                 800
Phe Glu Lys Ala Tyr Phe Pro Tyr Leu Leu Ile Asn Lys Lys Arg Tyr
                805                 810                 815
Ala Gly Leu Phe Trp Thr Asn Pro Asp Lys Phe Asp Lys Leu Asp Gln
            820                 825                 830
Lys Gly Leu Ala Ser Val Arg Arg Asp Ser Cys Ser Leu Val Ser Ile
        835                 840                 845
Val Met Asn Lys Val Leu Lys Lys Ile Leu Ile Glu Arg Asn Val Asp
    850                 855                 860
Gly Ala Leu Ala Phe Val Arg Glu Thr Ile Asn Asp Ile Leu His Asn
865                 870                 875                 880
Arg Val Asp Ile Ser Lys Leu Ile Ile Ser Lys Thr Leu Ala Pro Asn
                885                 890                 895
Tyr Thr Asn Pro Gln Pro His Ala Val Leu Ala Glu Arg Met Lys Arg
            900                 905                 910
Arg Glu Gly Val Gly Pro Asn Val Gly Asp Arg Val Asp Tyr Val Ile
        915                 920                 925
Ile Gly Gly Asn Asp Lys Leu Tyr Asn Arg Ala Glu Asp Pro Leu Phe
    930                 935                 940
Val Leu Glu Asn Asn Ile Gln Val Asp Ser Arg Tyr Tyr Leu Thr Asn
945                 950                 955                 960
Gln Leu Gln Asn Pro Ile Ile Ser Ile Val Ala Pro Ile Ile Gly Asp
                965                 970                 975
Lys Gln Ala Asn Gly Met Phe Val Val Lys Ser Ile Lys Ile Asn Thr
            980                 985                 990
Gly Ser Gln Lys Gly Gly Leu Met Ser Phe Ile Lys Lys Val Glu Ala
        995                1000                1005
Cys Lys Ser Cys Lys Gly Pro Leu Arg Lys Gly Glu Gly Pro Leu Cys
   1010                1015                1020
Ser Asn Cys Leu Ala Arg Ser Gly Glu Leu Tyr Ile Lys Ala Leu Tyr
1025               1030                1035                1040
Asp Val Arg Asp Leu Glu Glu Lys Tyr Ser Arg Leu Trp Thr Gln Cys
               1045                1050                1055
Gln Arg Cys Ala Gly Asn Leu His Ser Glu Val Leu Cys Ser Asn Lys
           1060                1065                1070
Asn Cys Asp Ile Phe Tyr Met Arg Val Lys Val Lys Lys Glu Leu Gln
       1075                1080                1085
Glu Lys Val Glu Gln Leu Ser Lys Trp
   1090                1095
<210>3
<211>7505
<212>DNA
<213>啤酒糖酵母(Saccharomyces cerevisiae)
<400>3
cgctctgccc tagttggaat gccatcgaac cacgaggatc ttggaatgga aaaccaccgc 60
cactgccatt tacgtttgca ttcatattcg cattaccttg gccattcacg ggcgtgttcc 120
tcggaatttg cattggtcgt tgctgttgtg gagtgtggga aaagcgatcg ttaacgccat 180
tctgctcact tgttgcatat gcgtacggat tataagacat cttggtatgg gcctttggtt 240
ttcgttttct gctattgata ctcagtagcg aggtcttaca atcgaaaagt caaaaagatg 300
agttgtagta taaaacaaca gctctggtgt gcaatatgga tcttgataca gagtctcgga 360
tatgctgttt tagcactgag aaaaagtaat agtaacactg tcagtgttcg tcaaaggccc 420
aagtttattg tcatttgaat tgtcagaatg gtttattttc aggtagggta accagaacgc 480
gtaagtttct tgcatctttt accattttaa ctggaagagg acctatcaaa aagagcatat 540
gatgatgaaa gagcacattc tatcaagata acactctcag gggacaagta tatgatgttt 600
ggcaagaaaa aaaacaacgg aggatcttcc actgcaagat attcagctgg caacaagtac 660
aacacactct caaataatta tgcgcttagc gcgcaacagc tcttaaatgc tagtaagatc 720
gatgacatcg attcgatgat gggatttgaa agatacgtac cgccgcaata caatggcagg 780
tttgatgcga aggatataga tcagattcca ggccgcgtag ggtggctgac gaacatgcac 840
gcaacgctgg tctctcagga aaccttatcc agtggtagta atggcggcgg caattcgaat 900
gacggagaac gtgtaacgac caaccaaggt atttccggag ttgacttcta ctttttagat 960
gaagagggtg ggagcttcaa gtcgacagtt gtctatgacc catacttctt tattgcgtgt 1020
aacgatgaat caagagtaaa tgatgtggag gaactagtga aaaaatatct ggaatcttgt 1080
ctcaaaagct tacaaatcat tagaaaggaa gatcttacca tggacaatca ccttttaggg 1140
ctgcagaaga cacttattaa gttatcattt gtaaattcca atcagttatt cgaggccagg 1200
aaactcctga ggccaatctt gcaggataat gccaataata atgtgcaaag aaatatatat 1260
aacgttgctg caaatggctc ggaaaaagtt gacgccaaac atctgatcga agatatcagg 1320
gaatatgatg tgccgtatca tgtccgagta tctatagaca aggacattag agtcggtaaa 1380
tggtataagg taactcaaca gggattcatt gaagatacta ggaaaattgc atttgccgac 1440
cctgtggtaa tggcatttga tatagaaacc acgaagccgc ctttaaaatt cccggattcc 1500
gccgtagatc aaataatgat gatttcgtat atgatcgatg gggaaggttt tttgataaca l560
aatagggaga taatctctga ggatattgaa gactttgagt atacaccgaa accggagtat 1620
cctggttttt tcaccatatt taacgaaaac gatgaagtgg cgcttctaca aaggtttttt 1680
gaacatataa gagatgtacg acccactgtt atatccacct tcaatggtga ctttttcgat 1740
tggcctttta tacataacag aagtaagatt cacggcttgg acatgttcga tgaaattggt 1800
ttcgctccag atgctgaagg tgagtacaag tcctcatact gctctcacat ggattgtttc 1860
cgttgggtga agcgtgattc ttatttacca caaggttccc agggtttaaa agctgttact 1920
caatctaagc taggttataa cccaattgaa ctggatcccg aattaatgac gccgtatgca 1980
tttgaaaagc cacagcacct ttccgaatat tctgtttccg atgcagtcgc tacgtattac 2040
ctttacatga aatatgttca tccttttatc ttttcccttt gtactattat tcctttgaac 2100
ccggatgaaa cattgagaaa gggtaccggt actttgtgtg aaatgttgtt gatggttcaa 2160
gcttatcaac ataatattct tctaccaaat aagcatacag atcccattga gaggttctat 2220
gatggacatc ttctagaatc cgagacttac gtgggtggac atgtggagtc attagaagct 2280
ggtgttttta ggagtgattt gaagaatgaa ttcaagatag atccttctgc cattgatgaa 2340
ttattacaag aattaccaga agctttgaaa tttagtgtgg aagttgaaaa taagtccagt 2400
gtagataaag taacgaattt tgaggaaata aaaaaccaga taacgcagaa attattagag 2460
ttgaaggaaa acaatataag aaacgaacta cctttgatct atcatgtaga tgtcgcctct 2520
atgtacccaa acatcatgac tacaaataga ctacaaccag atagtatcaa agcagagcgc 2580
gattgtgcta gttgcgattt taatagaccc ggaaaaacct gtgcaagaaa gttaaaatgg 2640
gcttggagag gagaattctt tcccagtaag atggatgagt ataacatgat caagcgtgca 2700
ttacaaaatg agacttttcc caacaaaaac aagttttcta aaaagaaagt tttgacattt 2760
gatgaactaa gttacgcaga ccaagttatc cacataaaaa aacgtttaac tgaatattca 2820
aggaaagttt atcatagggt taaagtatca gaaattgtcg aacgagaagc cattgtctgc 2880
caaagagaaa atccattcta cgtcgatacc gtgaaatcct ttcgtgatag gcgttacgaa 2940
ttcaaaggtt tagccaagac ttggaaggga aatctgtcca aaattgaccc atctgataag 3000
catgcgagag acgaggccaa aaagatgatt gtgctttatg actcattaca attagctcac 3060
aaagttattt tgaattcgtt ttatgggtat gttatgagga aaggctctcg ttggtattcc 3120
atggaaatgg cggggattac gtgtttaaca ggtgccacga tcattcaaat ggcgagagct 3180
ttagtagaaa gggtaggaag accattagaa ttagatactg atggtatttg gtgtatctta 3240
ccaaaatctt tccctgaaac ttactttttt acattagaaa atggtaaaaa gctttatctc 3300
tcctacccat gttccatgct gaattacaga gttcaccaaa agtttacgaa tcaccaatac 3360
caagaattaa aagacccatt gaactatata tatgagacgc acagtgaaaa cacgattttt 3420
ttcgaagttg acggaccata taaggccatg attttgccta gttccaagga agaaggaaaa 3480
ggtataaaga aaagatatgc tgtcttcaat gaagacggct cacttgctga actgaaaggt 3540
tttgaattga agaggcgtgg tgaattacaa ctaataaaaa attttcaaag tgatattttc 3600
aaggtctttt tggaaggtga tacattagaa ggatgttaca gtgctgtagc aagcgtatgt 3660
aaccgttggt tagatgttct tgattcacat ggtcttatgt tagaagatga agacttggtc 3720
agtttgattt gtgaaaatag aagtatgtca aaaactttaa aggaatatga agggcaaaaa 3780
tctacttcta ttacgacggc aaggagattg ggggattttt tgggtgaaga tatggtaaaa 3840
gataaaggtc tacaatgtaa atatattatt agttcaaaac ctttcaatgc acctgttact 3900
gaacgagcca ttccagtcgc aatattttca gcggacattc ccatcaaaag gtcttttctg 3960
aggcgatgga cattagatcc atctttggaa gatctggata tcagaaccat aatcgattgg 4020
ggttattata gagaaagact tggatctgct atacaaaaga taattactat tccagcagca 4080
ttacaagggg tttccaatcc tgttccaagg gttgaacatc cagattggct aaaaagaaaa 4140
atcgctacaa aggaggataa gtttaagcag acttcactaa ccaaattttt ttcgaagaca 4200
aagaatgtac caacaatggg caagataaaa gatatcgagg atttgtttga accaactgta 4260
gaagaagata acgccaaaat taaaattgca agaactacta aaaagaaagc cgtatccaag 4320
aggaaaagaa atcagcttac aaatgaagaa gatccactag tattgccctc ggagattcct 4380
tccatggacg aggactatgt tgggtggcta aattatcaaa aaattaaatg gaaaatccaa 4440
gcaagagata gaaagcgtcg agaccaatta tttggtaata caaacagctc ccgtgaaaga 4500
agtgcactag gaagtatgat taggaagcaa gctgaatcat atgcgaactc cacttgggag 4560
gtcttacaat acaaggattc cggtgagcca ggggttttgg aagtatttgt aacaattaat 4620
ggcaaagtcc agaacatcac cttccatata ccaaaaacta tttatatgaa attcaaatct 4680
caaacaatgc cgctacaaaa gattaagaat tgccttattg aaaaatcttc tgcatcgtta 4740
ccaaataatc ccaaaacgtc taatccagca ggcggtcagc tattcaaaat tactctaccg 4800
gaatctgtct ttctggaaga aaaggaaaac tgcactagta tcttcaacga tgaaaatgta 4860
cttggtgtat ttgagggcac tatcactcct catcaaagag cgatcatgga tttgggagct 4920
tcggtaacgt tccgctcaaa agcaatgggt gcgttaggca agggaataca gcagggtttt 4980
gaaatgaagg atctttcaat ggcggaaaat gaaaggtatc tgagtggatt ttcaatggac 5040
attggctatt tactacattt cccaacatca attgggtatg aatttttttc attattcaag 5l00
tcatggggag atactattac tatattagtt ttgaaaccat ccaaccaggc tcaggaaata 5160
aatgcctcat cattaggaca aatatacaaa caaatgtttg aaaaaaagaa aggtaaaata 5220
gaaacatatt cttacttggt tgatattaaa gaagatatca attttgagtt tgtatatttt 5280
acagatatct caaaattgta cagaagacta tcacaggaaa ctactaaatt aaaagaagaa 5340
agaggtctgc agtttttact cttgttacaa tctccgttta tcactaagct cttaggcaca 5400
atccggcttc taaaccagat gcccattgtt aagctttcct tgaatgaagt tcttctaccc 5460
caattgaact ggcaaccgac attattgaag aaacttgtta accacgtttt atccagtggt 5520
tcgtggattt ctcacttgat caagttatcc cagtatagta acattccaat ctgtaatttg 5580
aggctggata gtatggatta tattattgat gttctttatg caagaaaact aaaaaaagag 5640
aacatcgtgc tttggtggaa tgagaaagct ccacttccag atcatggagg cattcaaaat 5700
gattttgatt taaatacatc atggataatg aatgattcag aatttcccaa aattaataac 5760
tcaggtgtgt atgacaatgt agttctcgat gttggtgttg ataatttaac agtgaacaca 5820
attttgacat cagcattaat caatgatgct gaaggcagtg atctagttaa caataatatg 5880
ggtatagatg acaaagatgc cgttattaac tcgccatctg aattcgtgca cgacgccttt 5940
tctaatgacg ctttgaatgt tttaagaggt atgttaaagg agtggtggga tgaggcccta 6000
aaagaaaatt caaccgcaga tttgttggta aattccctgg caagttgggt tcaaaacccg 6060
aatgcgaaac tattcgacgg attactaaga tatcacgttc ataacttaac aaaaaaagcc 6120
ttacttcaat tagtaaatga atttagtgca cttggctcaa ctattgtata tgcagacagg 6180
aatcaaattc taataaagac aaacaagtac tcacctgaaa actgttacgc ctacagccaa 6240
tatatgatga aggcagttag aacaaatcca atgtttagtt atctggactt aaatatcaaa 6300
cgttattggg atctgctaat atggatggat aagtttaatt ttagtggatt agcatgtatt 6360
gaaatagagg aaaaggaaaa tcaggattat accgctgttt cgcaatggca actaaagaag 6420
tttctgtcac caatatatca gcccgaattt gaggattgga tgatgatcat attggatagt 6480
atgctaaaga caaagcagag ctatctaaaa ttgaattcag ggacgcaaag acctacccaa 6540
atagttaatg taaaaaaaca agataaggaa gatagtgttg aaaactcgtt gaacggattt 6600
tctcaccttt tttccaaacc actaatgaaa agagtcaaaa agctttttaa aaaccagcaa 6660
gagttcattt tagatcctca gtatgaggca gactatgtta ttcctgttct tcctggttcc 6720
catctgaatg tgaaaaatcc ccttctagaa cttgtcaaat cactctgcca tgtcatgtta 6780
ctttcaaaga gtacaatttt agaaatcagg accctgagaa aagaactgct gaagatattt 6840
gaattgcgtg agtttgctaa agtagcggaa ttcaaagatc caagtttgag tctcgtggtg 6900
ccggattttt tatgtgaata ctgttttttc atttctgata ttgacttttg taaggcagct 6960
cctgaatcta ttttttcatg cgtcagatgt cacaaagcct ttaatcaagt attgttgcaa 7020
gaacacctga ttcaaaaact acgttctgat atcgaatcct atttaattca agatttgaga 7080
tgctccagat gtcataaagt gaaacgtgac tatatgagtg cccactgtcc atgtgccggc 7140
gcgtgggaag gaactctccc cagagaaagc attgttcaaa agttaaatgt gtttaagcaa 7200
gtagccaagt attacggttt tgatatatta ttgagttgta ttgctgattt gaccatatga 7260
gtaagcagta tataacgcga ggttcaatgg cctctttacc atgaaaaaaa aaaaaaaaaa 7320
aaaaaaaagg taaggaaaaa gagtattttc aattcgtttc tgaacatata aatataaata 7380
accgaaaaat tagcccttga acataattaa cactcttctt tgatatttaa atcacaagta 7440
cttttctttt attttcttct taatactttt ggaaataaaa tgaatgtgac cactccggaa 7500
gttgc                                                             7505
<210>4
<211>2222
<212>PRT
<213>啤酒糖酵母(Saccharomyces cerevisiae)
<400>4
Met Met Phe Gly Lys Lys Lys Asn Asn Gly Gly Ser Ser Thr Ala Arg
  1               5                  10                  15
Tyr Ser Ala Gly Asn Lys Tyr Asn Thr Leu Ser Asn Asn Tyr Ala Leu
             20                  25                  30
Ser Ala Gln Gln Leu Leu Asn Ala Ser Lys Ile Asp Asp Ile Asp Ser
         35                  40                 45
Met Met Gly Phe Glu Arg Tyr Val Pro Pro Gln Tyr Asn Gly Arg Phe
     50                  55                  60
Asp Ala Lys Asp Ile Asp Gln Ile Pro Gly Arg Val Gly Trp Leu Thr
 65                  70                  75                  80
Asn Met His Ala Thr Leu Val Ser Gln Glu Thr Leu Ser Ser Gly Ser
                 85                  90                  95
Asn Gly Gly Gly Asn Ser Asn Asp Gly Glu Arg Val Thr Thr Asn Gln
            100                 105                 110
Gly Ile Ser Gly Val Asp Phe Tyr Phe Leu Asp Glu Glu Gly Gly Ser
        115                 120                 125
Phe Lys Ser Thr Val Val Tyr Asp Pro Tyr Phe Phe Ile Ala Cys Asn
    130                 135                 140
Asp Glu Ser Arg Val Asn Asp Val Glu Glu Leu Val Lys Lys Tyr Leu
145                 150                 155                 160
Glu Ser Cys Leu Lys Ser Leu Gln Ile Ile Arg Lys Glu Asp Leu Thr
                165                 170                 175
Met Asp Asn His Leu Leu Gly Leu Gln Lys Thr Leu Ile Lys Leu Ser
            180                 185                 190
Phe Val Asn Ser Asn Gln Leu Phe Glu Ala Arg Lys Leu Leu Arg Pro
        195                 200                 205
Ile Leu Gln Asp Asn Ala Asn Asn Asn Val Gln Arg Asn Ile Tyr Asn
    210                 215                 220
Val Ala Ala Asn Gly Ser Glu Lys Val Asp Ala Lys His Leu Ile Glu
225                 230                 235                 240
Asp Ile Arg Glu Tyr Asp Val Pro Tyr His Val Arg Val Ser Ile Asp
                245                 250                 255
Lys Asp Ile Arg Val Gly Lys Trp Tyr Lys Val Thr Gln Gln Gly Phe
            260                 265                 270
Ile Glu Asp Thr Arg Lys Ile Ala Phe Ala Asp Pro Val Val Met Ala
        275                 280                 285
Phe Asp Ile Glu Thr Thr Lys Pro Pro Leu Lys Phe Pro Asp Ser Ala
    290                 295                 300
Val Asp Gln Ile Met Met Ile Ser Tyr Met Ile Asp Gly Glu Gly Phe
305                 310                 315                 320
Leu Ile Thr Asn Arg Glu Ile Ile Ser Glu Asp Ile Glu Asp Phe Glu
                325                 330                 335
Tyr Thr Pro Lys Pro Glu Tyr Pro Gly Phe Phe Thr Ile Phe Asn Glu
            340                 345                 350
Asn Asp Glu Val Ala Leu Leu Gln Arg Phe Phe Glu His Ile Arg Asp
        355                 360                 365
Val Arg Pro Thr Val Ile Ser Thr Phe Asn Gly Asp Phe Phe Asp Trp
    370                 375                 380
Pro Phe Ile His Ash Arg Ser Lys Ile His Gly Leu Asp Met Phe Asp
385                 390                 395                 400
Glu Ile Gly Phe Ala Pro Asp Ala Glu Gly Glu Tyr Lys Ser Ser Tyr
                405                 410                 415
Cys Ser His Met Asp Cys Phe Arg Trp Val Lys Arg Asp Ser Tyr Leu
            420                 425                 430
Pro Gln Gly Ser Gln Gly Leu Lys Ala Val Thr Gln Ser Lys Leu Gly
        435                 440                 445
Tyr Asn Pro Ile Glu Leu Asp Pro Glu Leu Met Thr Pro Tyr Ala Phe
    450                 455                 460
Glu Lys Pro Gln His Leu Ser Glu Tyr Ser Val Ser Asp Ala Val Ala
465                 470                 475                 480
Thr Tyr Tyr Leu Tyr Met Lys Tyr Val His Pro Phe Ile Phe Ser Leu
                485                 490                 495
Cys Thr Ile Ile Pro Leu Asn Pro Asp Glu Thr Leu Arg Lys Gly Thr
            500                 505                 510
Gly Thr Leu Cys Glu Met Leu Leu Met Val Gln Ala Tyr Gln His Asn
        515                 520                 525
Ile Leu Leu Pro Asn Lys His Thr Asp Pro Ile Glu Arg Phe Tyr Asp
    530                 535                 540
Gly His Leu Leu Glu Ser Glu Thr Tyr Val Gly Gly His Val Glu Ser
545                 550                 555                 560
Leu Glu Ala Gly Val Phe Arg Ser Asp Leu Lys Asn Glu Phe Lys Ile
                565                 570                 575
Asp Pro Ser Ala Ile Asp Glu Leu Leu Gln Glu Leu Pro Glu Ala Leu
            580                 585                 590
Lys Phe Ser Val Glu Val Glu Asn Lys Ser Ser Val Asp Lys Val Thr
        595                 600                 605
Asn Phe Glu Glu Ile Lys Asn Gln Ile Thr Gln Lys Leu Leu Glu Leu
    610                 615                 620
Lys Glu Asn Asn Ile Arg Asn Glu Leu Pro Leu Ile Tyr His Val Asp
625                 630                 635                 640
Val Ala Ser Met Tyr Pro Asn Ile Met Thr Thr Asn Arg Leu Gln Pro
                645                 650                 655
Asp Ser Ile Lys Ala Glu Arg Asp Cys Ala Ser Cys Asp Phe Asn Arg
            660                 665                 670
Pro Gly Lys Thr Cys Ala Arg Lys Leu Lys Trp Ala Trp Arg Gly Glu
        675                 680                 685
Phe Phe Pro Ser Lys Met Asp Glu Tyr Asn Met Ile Lys Arg Ala Leu
    690                 695                 700
Gln Asn Glu Thr Phe Pro Asn Lys Asn Lys Phe Ser Lys Lys Lys Val
705                 710                 715                 720
Leu Thr Phe Asp Glu Leu Ser Tyr Ala Asp Gln Val Ile His Ile Lys
                725                 730                 735
Lys Arg Leu Thr Glu Tyr Ser Arg Lys Val Tyr His Arg Val Lys Val
            740                 745                 750
Ser Glu Ile Val Glu Arg Glu Ala Ile Val Cys Gln Arg Glu Asn Pro
        755                 760                 765
Phe Tyr Val Asp Thr Val Lys Ser Phe Arg Asp Arg Arg Tyr Glu Phe
    770                 775                 780
Lys Gly Leu Ala Lys Thr Trp Lys Gly Asn Leu Ser Lys Ile Asp Pro
785                 790                 795                 800
Ser Asp Lys His Ala Arg Asp Glu Ala Lys Lys Met Ile Val Leu Tyr
                805                 810                 815
Asp Ser Leu Gln Leu Ala His Lys Val Ile Leu Asn Ser Phe Tyr Gly
            820                 825                 830
Tyr Val Met Arg Lys Gly Ser Arg Trp Tyr Ser Met Glu Met Ala Gly
        835                 840                 845
Ile Thr Cys Leu Thr Gly Ala Thr Ile Ile Gln Met Ala Arg Ala Leu
     850                 855                 860
Val Glu Arg Val Gly Arg Pro Leu Glu Leu Asp Thr Asp Gly Ile Trp
865                 870                 875                 880
Cys Ile Leu Pro Lys Ser Phe Pro Glu Thr Tyr Phe Phe Thr Leu Glu
                885                 890                 895
Asn Gly Lys Lys Leu Tyr Leu Ser Tyr Pro Cys Ser Met Leu Asn Tyr
            900                 905                 910
Arg Val His Gln Lys Phe Thr Asn His Gln Tyr Gln Glu Leu Lys Asp
        915                 920                 925
Pro Leu Asn Tyr Ile Tyr Glu Thr His Ser Glu Asn Thr Ile Phe Phe
    930                 935                 940
Glu Val Asp Gly Pro Tyr Lys Ala Met Ile Leu Pro Ser Ser Lys Glu
945                 950                 955                 960
Glu Gly Lys Gly Ile Lys Lys Arg Tyr Ala Val Phe Asn Glu Asp Gly
                965                 970                 975
Ser Leu Ala Glu Leu Lys Gly Phe Glu Leu Lys Arg Arg Gly Glu Leu
            980                 985                 990
Gln Leu Ile Lys Asn Phe Gln Ser Asp Ile Phe Lys Val Phe Leu Glu
        995                1000                1005
Gly Asp Thr Leu Glu Gly Cys Tyr Ser Ala Val Ala Ser Val Cys Asn
   1010                1015                1020
Arg Trp Leu Asp Val Leu Asp Ser His Gly Leu Met Leu Glu Asp Glu
1025               1030                1035                1040
Asp Leu Val Ser Leu Ile Cys Glu Asn Arg Ser Met Ser Lys Thr Leu
               1045                 1050                1055
Lys Glu Tyr Glu Gly Gln Lys Ser Thr Ser Ile Thr Thr Ala Arg Arg
           1060                1065                1070
Leu Gly Asp Phe Leu Gly Glu Asp Met Val Lys Asp Lys Gly Leu Gln
       1075                1080                1085
Cys Lys Tyr Ile Ile Ser Ser Lys Pro Phe Asn Ala Pro Val Thr Glu
   1090                1095                1100
Arg Ala Ile Pro Val Ala Ile Phe Ser Ala Asp Ile Pro Ile Lys Arg
1105               1110                1115                1120
Ser Phe Leu Arg Arg Trp Thr Leu Asp Pro Ser Leu Glu Asp Leu Asp
               1125                1130                1135
Ile Arg Thr Ile Ile Asp Trp Gly Tyr Tyr Arg Glu Arg Leu Gly Ser
           1140                1145                1150
Ala Ile Gln Lys Ile Ile Thr Ile Pro Ala Ala Leu Gln Gly Val Ser
       1155                1160                1165
Asn Pro Val Pro Arg Val Glu His Pro Asp Trp Leu Lys Arg Lys Ile
   1170                1175                1180
Ala Thr Lys Glu Asp Lys Phe Lys Gln Thr Ser Leu Thr Lys Phe Phe
1185               1190                1195                1200
Ser Lys Thr Lys Asn Val Pro Thr Met Gly Lys Ile Lys Asp Ile Glu
               1205                1210                1215
Asp Leu Phe Glu Pro Thr Val Glu Glu Asp Asn Ala Lys Ile Lys Ile
           1220                1225                1230
Ala Arg Thr Thr Lys Lys Lys Ala Val Ser Lys Arg Lys Arg Asn Gln
       1235                1240                1245
Leu Thr Asn Glu Glu Asp Pro Leu Val Leu Pro Ser Glu Ile Pro Ser
   1250                1255                1260
Met Asp Glu Asp Tyr Val Gly Trp Leu Asn Tyr Gln Lys Ile Lys Trp
1265               1270                1275                1280
Lys Ile Gln Ala Arg Asp Arg Lys Arg Arg Asp Gln Leu Phe Gly Asn
               1285                1290                1295
Thr Asn Ser Ser Arg Glu Arg Ser Ala Leu Gly Ser Met Ile Arg Lys
           1300                1305                1310
Gln Ala Glu Ser Tyr Ala Asn Ser Thr Trp Glu Val Leu Gln Tyr Lys
       1315                1320                1325
Asp Ser Gly Glu Pro Gly Val Leu Glu Val Phe Val Thr Ile Asn Gly
   1330                1335                1340
Lys Val Gln Asn Ile Thr Phe His Ile Pro Lys Thr Ile Tyr Met Lys
1345               1350                1355                1360
Phe Lys Ser Gln Thr Met Pro Leu Gln Lys Ile Lys Asn Cys Leu Ile
               1365                1370                1375
Glu Lys Ser Ser Ala Ser Leu Pro Asn Asn Pro Lys Thr Ser Asn Pro
           1380                1385                1390
Ala Gly Gly Gln Leu Phe Lys Ile Thr Leu Pro Glu Ser Val Phe Leu
       1395                1400                1405
Glu Glu Lys Glu Asn Cys Thr Ser Ile Phe Asn Asp Glu Asn Val Leu
   1410                1415                1420
Gly Val Phe Glu Gly Thr Ile Thr Pro His Gln Arg Ala Ile Met Asp
1425               1430                1435                1440
Leu Gly Ala Ser Val Thr Phe Arg Ser Lys Ala Met Gly Ala Leu Gly
               1445                1450                1455
Lys Gly Ile Gln Gln Gly Phe Glu Met Lys Asp Leu Ser Met Ala Glu
           1460                1465                1470
Asn Glu Arg Tyr Leu Ser Gly Phe Ser Met Asp Ile Gly Tyr Leu Leu
       1475                1480                1485
His Phe Pro Thr Ser Ile Gly Tyr Glu Phe Phe Ser Leu Phe Lys Ser
   1490                1495                1500
Trp Gly Asp Thr Ile Thr Ile Leu Val Leu Lys Pro Ser Asn Gln Ala
1505              1510                 1515                1520
Gln Glu Ile Asn Ala Ser Ser Leu Gly Gln Ile Tyr Lys Gln Met Phe
               1525                1530                1535
Glu Lys Lys Lys Gly Lys Ile Glu Thr Tyr Ser Tyr Leu Val Asp Ile
           1540                1545                1550
Lys Glu Asp Ile Asn Phe Glu Phe Val Tyr Phe Thr Asp Ile Ser Lys
       1555                1560                1565
Leu Tyr Arg Arg Leu Ser Gln Glu Thr Thr Lys Leu Lys Glu Glu Arg
   1570                1575                1580
Gly Leu Gln Phe Leu Leu Leu Leu Gln Ser Pro Phe Ile Thr Lys Leu
1585               1590                1595                1600
Leu Gly Thr Ile Arg Leu Leu Asn Gln Met Pro Ile Val Lys Leu Ser
               1605                1610                1615
Leu Asn Glu Val Leu Leu Pro Gln Leu Asn Trp Gln Pro Thr Leu Leu
           1620                1625                1630
Lys Lys Leu Val Asn His Val Leu Ser Ser Gly Ser Trp Ile Ser His
       1635                1640                1645
Leu Ile Lys Leu Ser Gln Tyr Ser Asn Ile Pro Ile Cys Asn Leu Arg
   1650                1655                1660
Leu Asp Ser Met Asp Tyr Ile Ile Asp Val Leu Tyr Ala Arg Lys Leu
1665               1670                1675                1680
Lys Lys Glu Asn Ile Val Leu Trp Trp Asn Glu Lys Ala Pro Leu Pro
               1685                1690                1695
Asp His Gly Gly Ile Gln Asn Asp Phe Asp Leu Asn Thr Ser Trp Ile
           1700                1705                1710
Met Asn Asp Ser Glu Phe Pro Lys Ile Asn Asn Ser Gly Val Tyr Asp
       1715                1720                1725
Asn Val Val Leu Asp Val Gly Val Asp Asn Leu Thr Val Asn Thr Ile
   1730                1735                1740
Leu Thr Ser Ala Leu Ile Asn Asp Ala Glu Gly Ser Asp Leu Val Asn
1745               1750                1755                1760
Asn Asn Met Gly Ile Asp Asp Lys Asp Ala Val Ile Asn Ser Pro Ser
               1765                1770                1775
Glu Phe Val His Asp Ala Phe Ser Asn Asp Ala Leu Asn Val Leu Arg
           1780                1785                1790
Gly Met Leu Lys Glu Trp Trp Asp Glu Ala Leu Lys Glu Asn Ser Thr
       1795                1800                1805
Ala Asp Leu Leu Val Asn Ser Leu Ala Ser Trp Val Gln Asn Pro Asn
   1810                1815                1820
Ala Lys Leu Phe Asp Gly Leu Leu Arg Tyr His Val His Asn Leu Thr
1825               1830                1835                1840
Lys Lys Ala Leu Leu Gln Leu Val Asn Glu Phe Ser Ala Leu Gly Ser
               1845                1850                1855
Thr Ile Val Tyr Ala Asp Arg Asn Gln Ile Leu Ile Lys Thr Asn Lys
           1860                1865                1870
Tyr Ser Pro Glu Asn Cys Tyr Ala Tyr Ser Gln Tyr Met Met Lys Ala
       1875                1880                1885
Val Arg Thr Asn Pro Met Phe Ser Tyr Leu Asp Leu Asn Ile Lys Arg
   1890                1895                1900
Tyr Trp Asp Leu Leu Ile Trp Met Asp Lys Phe Asn Phe Ser Gly Leu
1905               1910                1915                1920
Ala Cys Ile Glu Ile Glu Glu Lys Glu Asn Gln Asp Tyr Thr Ala Val
               1925                1930                1935
Ser Gln Trp Gln Leu Lys Lys Phe Leu Ser Pro Ile Tyr Gln Pro Glu
           1940                1945                1950
Phe Glu Asp Trp Met Met Ile Ile Leu Asp Ser Met Leu Lys Thr Lys
       1955                1960                1965
Gln Ser Tyr Leu Lys Leu Asn Ser Gly Thr Gln Arg Pro Thr Gln Ile
   1970                1975                1980
Val Asn Val Lys Lys Gln Asp Lys Glu Asp Ser Val Glu Asn Ser Leu
1985               1990                1995                2000
Asn Gly Phe Ser His Leu Phe Ser Lys Pro Leu Met Lys Arg Val Lys
               2005                2010                2015
Lys Leu Phe Lys Asn Gln Gln Glu Phe Ile Leu Asp Pro Gln Tyr Glu
           2020                2025                2030
Ala Asp Tyr Val Ile Pro Val Leu Pro Gly Ser His Leu Asn Val Lys
       2035                2040                2045
Asn Pro Leu Leu Glu Leu Val Lys Ser Leu Cys His Val Met Leu Leu
   2050                2055                2060
Ser Lys Ser Thr Ile Leu Glu Ile Arg Thr Leu Arg Lys Glu Leu Leu
2065               2070                2075                2080
Lys Ile Phe Glu Leu Arg Glu Phe Ala Lys Val Ala Glu Phe Lys Asp
               2085                2090                2095
Pro Ser Leu Ser Leu Val Val Pro Asp Phe Leu Cys Glu Tyr Cys Phe
           2100                2105                2110
Phe Ile Ser Asp Ile Asp Phe Cys Lys Ala Ala Pro Glu Ser Ile Phe
       2115                2120                2125
Ser Cys Val Arg Cys His Lys Ala Phe Asn Gln Val Leu Leu Gln Glu
   2130                2135                2140
His Leu Ile Gln Lys Leu Arg Ser Asp Ile Glu Ser Tyr Leu Ile Gln
2145               2150                2155                2160
Asp Leu Arg Cys Ser Arg Cys His Lys Val Lys Arg Asp Tyr Met Ser
               2165                2170                2175
Ala His Cys Pro Cys Ala Gly Ala Trp Glu Gly Thr Leu Pro Arg Glu
           2180                2185                2190
Ser Ile Val Gln Lys Leu Asn Val Phe Lys Gln Val Ala Lys Tyr Tyr
       2195                2200                2205
Gly Phe Asp Ile Leu Leu Ser Cys Ile Ala Asp Leu Thr Ile
   2210                2215                2220
<210>5
<211>12
<212>PRT
<213>大肠杆菌(Escherichia coli)
<400>5
Gln Ile Val Leu Asp Thr Glu Thr Thr Gly Met Asn
  1               5                  10
<210>6
<211>12
<212>PRT
<213>流感嗜血菌(Haemophilus influenzae)
<400>6
Gln Ile Val Leu Asp Thr Glu Thr Thr Gly Met Asn
  1               5                  l0
<210>7
<211>12
<212>PRT
<213>鼠伤寒沙门氏菌(Salmonella typhimurium)
<400>7
Gln Ile Val Leu Asp Thr Glu Thr Thr Gly Met Asn
  1               5                  10
<210>8
<211>12
<212>PRT
<213>霍乱弧菌(Vibrio cholerae)
<400>8
Ile Val Val Leu Asp Thr Glu Thr Thr Gly Met Asn
  1               5                  10
<210>9
<211>12
<212>PRT
<213>铜绿假单胞菌(Pseudomonas aeruginosa)
<400>9
Ser Val Val Leu Asp Thr Glu Thr Thr Gly Met Pro
  1               5                  10
<210>10
<211>12
<212>PRT
<213>脑膜炎奈瑟氏球菌(Neisseria meningitidis)
<400>10
Gln Ile Ile Leu Asp Thr Glu Thr Thr Gly Leu Tyr
  1               5                  10
<210>11
<211>12
<212>PRT
<213>砂眼衣原体(Chlamydia trachomatis)
<400>11
Phe Val Cys Leu Asp Cys Glu Thr Thr Gly Leu Asp
  1               5                  10
<210>12
<211>12
<212>PRT
<213>天蓝色链霉菌(Streptomyces coelicolor)
<400>12
Leu Ala Ala Phe Asp Thr Glu Thr Thr Gly Val Asp
  1               5                  10
<210>13
<211>12
<212>PRT
<213>弗氏志贺氏菌(Shigella flexneri)2a菌株301
<400>13
Gln Ile Val Leu Asp Thr Glu Thr Thr Gly Met Asn
  1               5                  10
<210>14
<211>12
<212>PRT
<213>金黄色葡萄球菌(Staphylococcus aureus)
<400>14
Tyr Val Val Phe Asp Val Glu Thr Thr Gly Leu Ser
  1               5                  10
<210>15
<211>12
<212>PRT
<213>枯草芽孢杆菌(Bacillus subtilis)
<400>15
 Tyr Val Val Phe Asp Val Glu Thr Thr Gly Leu Ser
  1               5                  10
<210>16
<211>12
<212>PRT
<213>肺枝原体(Mycoplasma pulmonis)
<400>16
Tyr Val Val Tyr Asp Ile Glu Thr Thr Gly Leu Ser
  1               5                  10
<210>17
<211>12
<212>PRT
<213>生殖道枝原体(Mycoplasma genitalium)
<400>17
Phe Val Ile Phe Asp Ile Glu Thr Thr Gly Leu His
  1               5                  10
<210>18
<211>12
<212>PRT
<213>肺炎枝原体(Mycoplasma pneumoniae)
<400>18
Phe Val Ile Phe Asp Ile Glu Thr Thr Gly Leu His
  1               5                  10
<210>19
<211>12
<212>PRT
<213>啤酒糖酵母(Saccharomyces cerevisiae)
<400>19
Ile Met Ser Phe Asp Ile Glu Cys Ala Gly Arg Ile
  1               5                  10
<210>20
<211>12
<212>PRT
<213>啤酒糖酵母(Saccharomyces cerevisiae)
<400>20
Val Met Ala Phe Asp Ile Glu Thr Thr Lys Pro Pro
  1               5                  10
<210>21
<211>12
<212>PRT
<213>小鼠(Mus musculus)
<400>21
Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys
  1               5                  10
<210>22
<211>12
<212>PRT
<213>小鼠(Mus musculus)
<400>22
Val Leu Ala Phe Asp Ile Glu Thr Thr Lys Leu Pro
  1               5                  10
<210>23
<211>12
<212>PRT
<213>智人(Homo sapiens)
<400>23
Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys
  1               5                  10
<210>24
<211>12
<212>PRT
<213>智人(Homo sapiens)
<400>24
Val Leu Ala Phe Asp Ile Glu Thr Thr Lys Leu Pro
  1               5                  10
<210>25
<211>12
<212>PRT
<213>稻(Oryza sativa)
<400>25
Ile Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys
  1               5                  10
<210>26
<211>12
<212>PRT
<213>拟南芥(Arabidopsis thaliana)
<400>26
Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys
  1               5                  10
<210>27
<211>12
<212>PRT
<213>拟南芥(Arabidopsis thaliana)
<400>27
Val Cys Ala Phe Asp Ile Glu Thr Val Lys Leu Pro
  1               5                  10
<210>28
<211>12
<212>PRT
<213>大鼠(Rattus norvegicus)
<400>28
Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys
  1               5                  10
<210>29
<211>12
<212>PRT
<213>牛(Bos taurus)
<400>29
Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys
  1           5                      10
<210>30
<211>12
<212>PRT
<213>大豆(Glycine max)
<400>30
Ile Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys
  1               5                  10
<210>31
<211>12
<212>PRT
<213>黑腹果蝇(Drosophila melanogaster)
<400>31
Ile Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys
  1               5                  10
<210>32
<211>12
<212>PRT
<213>黑腹果蝇(Drosophila melanogaster)
<400>32
Val Leu Ala Phe Asp Ile Glu Thr Thr Lys Leu Pro
  1               5                  10
<210>33
<211>36
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:突变的polδ
<400>33
atcatgtcct ttgctatcgc ttgtgctggt aggatt                              36
<210>34
<211>12
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:突变的polδ
<400>34
Ile Met Ser Phe Ala Ile Ala Cys Ala Gly Arg Ile
  1               5                  10
<210>35
<211>36
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:突变的polε
<400>35
gtaatggcat ttgctatagc taccacgaag ccgcct                              36
<210>36
<211>12
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:突变的polε
<400>36
Val Met Ala Phe Ala Ile Ala Thr Thr Lys Pro Pro
1               5                  10
<210>37
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:引物
<400>37
CCCGAGCTCA TGAGTGAAAA AAGATCCCTT                                     30
<210>38
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:引物
<400>38
CCCGCGGCCG CTTACCATTT GCTTAATTGT                                     30
<210>39
<21l>30
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:引物
<400>39
CCCGAGCTCA TGATGTTTGG CAAGAAAAAA                                     30
<210>40
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:引物
<400>40
CCCGCGGCCG CTCATATGGT CAAATCAGCA                                   30
<210>41
<211>1592
<212>DNA
<213>大肠杆菌(Escherichia coli)
<400>41
gaattcaaat acaaaaaaac cgcaaaatta aaaatcttgc ggctctctga actcattttc 60
atgagtgaat agtggcggaa cggacgggac tcgaacccgc gaccccctgc gtgacaggca 120
ggtattcaac cgactgaact accgctccgc gttgtgttcc gttgggaacg aggcgaatag 180
ttacgaattg cctcgacctc gtcaacggtt tttctatctt ttgaatcgtt tgctgcaaaa 240
atcgcccaag tcgctatttt tagcgccttt cacaggtatt tatgctcgcc agaggcaact 300
tccgcctttc ttctgcacca gatcgagacg ggcttcatga gctgcaatct cttcatctgt 360
cgcaaaaaca acgcgtaact tacttgcctg acgtacaatg cgctgaattg ttgcttcacc 420
ttgttgctgt tgtgtctctc cttccatcgc aaaagccatc gacgtttgac caccggtcat 480
cgccagataa acttccgcaa ggatctgggc atcgagtaat gccccgtgca gcgttcgttt 540
actgttatct atttcgtagc gagcacataa cgcatcgagg ctgttgcgct taccgggaaa 600
cattttcctc gccaccgcaa ggctatcggt gaccttacag aaagtattgg tcttcggaat 660
atcgcgctta agcaacgaaa actcgtagtc cataaagccg atatcgaacg ctgcgttatg 720
gatcaccaac tccgcgccgc gaatatagtc catgaactca tcggctactt cggcaaacgt 780
gggcttatcg agcaaaaatt catcggcaat accatgtacg ccaaaggctt ccggatccac 840
cagccgatcg ggtttgagat aaacatggaa gttattgccc gtcaggcgac ggttcaccac 900
ttcaacggca ccaatctcaa tgatcttgtg gccttcatag tgcgcaccaa tctggttcat 960
accggtggtt tcggtatcga gaacgatctg gcgtgtaatt gcagtgctca tagcggtcat 1020
ttatgtcaga cttgtcgttt tacagttcga ttcaattaca ggaagtctac cagagatgct 1080
taaacaggta gaaattttca ccgatggttc gtgtctgggc aatccaggac ctgggggtta 1140
cggcgctatt ttacgctatc gcggacgcga gaaaaccttt agcgctggct acacccgcac 1200
caccaacaac cgtatggagt tgatggccgc tattgtcgcg ctggaggcgt taaaagaaca 1260
ttgcgaagtc attttgagta ccgacagcca gtatgtccgc cagggtatca cccagtggat 1320
ccataactgg aaaaaacgtg gctggaaaac cgcagacaaa aaaccagtaa aaaatgtcga 1380
tctctggcaa cgtcttgatg ctgcattggg gcagcatcaa atcaaatggg aatgggttaa 1440
aggccatgcc ggacacccgg aaaacgaacg ctgtgatgaa ctggctcgtg ccgcggcgat 1500
gaatcccaca ctggaagata caggctacca agttgaagtt taagcctgtg gtttacgaca 1560
ttgccgggtg gctccaaccg cctagcgaat tc                               1592
<210>42
<211>243
<212>PRT
<213>大肠杆菌(Escherichia coli)
<400>42
Met Ser Thr Ala Ile Thr Arg Gln Ile Val Leu Asp Thr Glu Thr Thr
  1               5                  10                  15
Gly Met Asn Gln Ile Gly Ala His Tyr Glu Gly His Lys Ile Ile Glu
             20                  25                  30
Ile Gly Ala Val Glu Val Val Asn Arg Arg Leu Thr Gly Asn Asn Phe
         35                  40                  45
His Val Tyr Leu Lys Pro Asp Arg Leu Val Asp Pro Glu Ala Phe Gly
      50                 55                  60
Val His Gly Ile Ala Asp Glu Phe Leu Leu Asp Lys Pro Thr Phe Ala
 65                  70                  75                  80
Glu Val Ala Asp Glu Phe Met Asp Tyr Ile Arg Gly Ala Glu Leu Val
                 85                  90                  95
Ile His Asn Ala Ala Phe Asp Ile Gly Phe Met Asp Tyr Glu Phe Ser
            100                 105                 110
Leu Leu Lys Arg Asp Ile Pro Lys Thr Asn Thr Phe Cys Lys Val Thr
        115                 120                 125
Asp Ser Leu Ala Val Ala Arg Lys Met Phe Pro Gly Lys Arg Asn Ser
    130                 135                 140
Leu Asp Ala Leu Cys Ala Arg Tyr Glu Ile Asp Asn Ser Lys Arg Thr
145                 150                 155                 160
Leu His Gly Ala Leu Leu Asp Ala Gln Ile Leu Ala Glu Val Tyr Leu
                165                 170                 175
Ala Met Thr Gly Gly Gln Thr Ser Met Ala Phe Ala Met Glu Gly Glu
            180                 185                 190
Thr Gln Gln Gln Gln Gly Glu Ala Thr Ile Gln Arg Ile Val Arg Gln
        195                 200                 205
Ala Ser Lys Leu Arg Val Val Phe Ala Thr Asp Glu Glu Ile Ala Ala
    210                 215                 220
His Glu Ala Arg Leu Asp Leu Val Gln Lys Lys Gly Gly Ser Cys Leu
225                 230                 235                 240
Trp Arg Ala
<210>43
<211>4866
<212>DNA
<213>枯草芽孢杆菌(Bacillus subtilis)
<400>43
ggtaccgctt cacttatgat gtttttaggg agggatactg tcttaatgga acagttatca 60
gtaaacagaa ggcagtttca aattcttctg cagcagatta atatgacaga tgataccttc 120
atgacatact ttgaacatgg cgagattaaa aagctgacaa ttcacaaagc ttctaagtct 180
tggcattttc attttcaatt taaatctttg ctgccttttc aaatatatga cacattaaca 240
acgaggctga cgcaatcgtt tgcccacata gcaaaagtga catcttcaat tgaagttcag 300
gatgccgagg tcagtgaaag tatcgttcaa gactactggt cacgctgcat tgaagaactg 360
cagggcattt cgccgccgat tatcagtctt ttaaaccagc aaaaaccgaa gctgaagggc 420
aataaactga ttgtcaaaac caaaacagat acagaagcgg ctgcgctaaa gaacaaatac 480
agttccatga ttcaagcaga ataccgtcaa tttggctttc cggatcttca gcttgatgct 540
gaaatatttg tatccgagca agaagttcaa aagtttcggg agcaaaagct tgcggaagac 600
caagagcggg ctatgcaggc cttgattgaa atggagaaga aagataaaga aagtgatgaa 660
gaccaagcac catctggtcc tcttgttatc ggttatcaaa ttaaagataa cgaggaaatc 720
cgaacacttg acagcatcat ggacgaagaa cggagaatta cggtccaagg ttatgtgttt 780
gatgtggaga cgcgcgagct gaagagcggg cgcacgctgt gtatcttcaa aattacagac 840
tatacaaata gtattttgat caaaatgttt gcacgtgaaa aagaagatgc ggcgctgatg 900
aagtctctga aaaaaggaat gtgggtaaaa gcacgcggaa gcattcaaaa tgatacattt 960
gtcagagacc ttgtcatgat cgcaaatgac gtaaacgaaa taaaagcaaa aacccgtgaa 1020
gattcagcac ctgaaggaga aaaaagagtg gaattgcatc ttcattcccc aatgagccaa 1080
atggatgctg ttacgggtat cggaaagctt gtcgaacagg cgaaaaaatg ggggcatgag 1140
gccatcgctt tgaccgacca tgctgtcgtt caatccttcc ctgatgcgta ttctgcggcc 1200
aaaaagcatg gaattaaaat gatttacggg atggaagcga atctcgtgga tgatggcgtg 1260
ccaattgctt ataatgccgc acatcgtctg ctcgaagaag aaacatatgt tgtttttgac 1320
gttgagacga caggattgtc tgctgtatac gataccatta ttgagctggc tgcagtaaaa 1380
gtaaaaggcg gagaaattat tgataaattt gaggcgtttg cgaacccgca tcgtccgctt 1440
tccgccacaa tcatagagct gacagggatc acagatgata tgctacaaga cgctccggat 1500
gtcgtagatg taataagaga tttcagagaa tggattggcg atgatattct tgtcgctcat 1560
aatgcaagct ttgatatggg attcttaaat gtagcctata aaaaacttct tgaagtcgaa 1620
aaagctaaaa acccagtcat tgatacgctt gaacttggac gttttctcta tccggaattt 1680
aagaaccacc ggttgaacac actttgtaaa aagtttgata tcgagctcac acagcatcac 1740
cgtgcgatct atgatactga ggcaaccgct tatttgcttc tgaaaatgct gaaagacgca 1800
gctgaaaaag gtattcagta ccatgatgag ttgaatgaaa atatgggtca gtccaatgct 1860
tatcaaagat caagaccgta tcatgcaaca ttacttgccg tgaacagcac gggacttaaa 1920
aatttattta agcttgtgtc actttctcat attcattatt tttacagagt gccgcgtatt 1980
ccgagatctc agcttgagaa atacagggaa gggcttctga tcggttctgc ttgtgacagg 2040
ggagaggttt ttgagggaat gatgcaaaaa tcgcctgaag aggtggaaga tatcgcgtca 2100
ttctatgatt accttgaggt tcagccgcct gaagtgtatc gtcacttgct ggagcttgaa 2160
ctggtccgtg atgaaaaagc gctgaaagaa attattgcga atatcacgaa gctgggggaa 2220
aagcttaata aaccggttgt tgctacggga aatgttcatt acttgaatga tgaggataaa 2280
atctacagaa agattttaat atcctcacaa ggcggggcaa atccgctgaa taggcatgaa 2340
ctgccgaaag tgcatttcag aacgacagac gaaatgcttg aagctttttc tttcttaggt 2400
gaagaaaaag cgaaggagat cgtagtcacc aatacccaaa aggttgcttc tttagttgat 2460
gacatcaagc cgattaaaga tgatttatat acgccgaaaa tcgaaggcgc tgatgaagag 2520
atcagagaaa tgagctatca gcgtgcaaga agcatttacg gggaagagct gcctgaaatt 2580
gtcgaagcgc ggattgaaaa agagttaaag agtattattg gccacggatt tgctgttatt 2640
tacttgatct ctcacaaact tgtaaaacgt tcactagatg acgggtatct cgttggttcc 2700
cgtggttccg taggatcttc attagttgcg acacttactg agattactga ggtaaacccg 2760
ctgccgccgc actatgtttg tcctgagtgc cagcattctg agttctttaa tgacggttct 2820
gtcggttctg gttttgacct gcctgacaag acatgccctc attgcggaac gcctttgaaa 2880
aaagacggcc atgatattcc atttgaaacg ttcttaggat ttaaagggga caaagtacct 2940
gatatcgatt tgaacttctc aggggaatat cagccgcaag cacacaatta cacaaaagta 3000
ttgttcggag aagacaatgt atatcgtgcg ggaacaatag gcacggtggc agaaaaaaca 3060
gcctacggtt atgtaaaagg ctatgccgga gacaacaatc ttcatatgcg cggtgccgaa 3120
atagatcggc tcgtacaggg atgcacaggt gtaaaacgta caactggaca gcaccctggc 3180
ggtattatcg tagttccgga ttatatggat atttatgatt tttcaccgat ccagttcccg 3240
gcagatgcca caggttcaga gtggaaaacg actcattttg atttccactc catccatgac 3300
aacctgttaa aacttgatat tctcggacac gatgacccga ctgttattcg gatgcttcaa 3360
gacttaagcg gaatagatcc gaaaacaatt ccgacggatg atcctgaagt gatgaagatc 3420
ttccagggaa ccgaatcact cggtgtgact gaagaacaga ttggctgtaa aacgggcact 3480
cttggaattc ctgaattcgg aacccgattt gtccggcaga tgcttgaaga tacaaagccg 3540
accacttttt ctgagctcgt tcagatttca ggcttgtctc acggaactga tgtatggctt 3600
ggcaatgcac aggagctcat ccacaataat atttgtgagc tgagtgaggt tatcggctgc 3660
cgtgatgaca ttatggttta tttaatctat caaggccttg agccgtccct tgcctttaaa 3720
atcatggaat tcgtgcgtaa aggaaaagga ttaacgcctg aatgggaaga agaaatgaaa 3780
aataacaatg tcccagactg gtatattgat tcctgtaaaa agattaaata catgttcccg 3840
aaagcccacg ccgcggcata tgtcttaatg gcagtccgca ttgcttactt taaagtgcat 3900
catgctcttt tgtattatgc ggcttatttt accgttcgtg cagatgactt tgatattgat 3960
acaatgatca agggctctac agcaatcaga gcggtaatgg aggatataaa cgctaaagga 4020
cttgatgctt caccgaagga aaagaacctt ctgactgttt tagaattagc gcttgagatg 4080
tgtgagagag gctattcatt ccaaaaagtc gatttatatc gctccagcgc cacagagttt 4140
attattgacg gcaacagtct tattccgccg tttaactcta ttccagggtt agggacgaac 4200
gctgctttga acattgtaaa agctcgcgaa gaaggcgaat tcctctcaaa agaagatttg 4260
caaaagagag ggaaagtatc aaaaacgatt ttagagtact tagatcgcca tggctgtctg 4320
gagtcactgc ctgatcaaaa ccaattgtca ctgttctaat atggaaagca gaatttctca 4380
gaaattctgc ttctatgcat acataagcgc aaaaagtgcc atcgtaatat tagagtttct 4440
gtcacttgct taggtatgaa ggtaagcgta tatccatttg caataaaaat atggttatgg 4500
tatagtttta ttggaaatgc taacgattac cgaggcaaag agtggggaaa cccgctcttt 4560
tgtattgaac aggagaattt tgtctcgaca tgttcatcgt ttacttttta gcccctgctc 4620
ttttgaagca gggtttttat gcagagtgac gagacgaata tgagatcgac agcacaagga 4680
ggaagaacat gagcaaaaaa gtgactgaca ccgttcaaga aatggctcag ccaatcgtag 4740
acagccttca gctggaactc gttgacattg aatttgtcaa agagggccaa agctggttcc 4800
ttcgcgtgtt tattgattcc gatgacggtg tggatattga ggaatgtgcc aaagtaagcg 4860
aagctt                                                            4866
<210>44
<211>1437
<212>PRT
<213>枯草芽孢杆菌(Bacillus subtilis)
<400>44
Met Glu Gln Leu Ser Val Asn Arg Arg Gln Phe Gln Ile Leu Leu Gln
  1               5                  10                  15
Gln Ile Asn Met Thr Asp Asp Thr Phe Met Thr Tyr Phe Glu His Gly
             20                  25                  30
Glu Ile Lys Lys Leu Thr Ile His Lys Ala Ser Lys Ser Trp His Phe
         35                  40                  45
His Phe Gln Phe Lys Ser Leu Leu Pro Phe Gln Ile Tyr Asp Thr Leu
     50                  55                  60
Thr Thr Arg Leu Thr Gln Ser Phe Ala His Ile Ala Lys Val Thr Ser
 65                  70                  75                  80
Ser Ile Glu Val Gln Asp Ala Glu Val Ser Glu Ser Ile Val Gln Asp
                 85                  90                  95
Tyr Trp Ser Arg Cys Ile Glu Glu Leu Gln Gly Ile Ser Pro Pro Ile
            100                 105                 110
Ile Ser Leu Leu Asn Gln Gln Lys Pro Lys Leu Lys Gly Asn Lys Leu
        115                 120                 125
Ile Val Lys Thr Lys Thr Asp Thr Glu Ala Ala Ala Leu Lys Asn Lys
    130                 135                 140
Tyr Ser Ser Met Ile Gln Ala Glu Tyr Arg Gln Phe Gly Phe Pro Asp
145                 150                 155                 160
Leu Gln Leu Asp Ala Glu Ile Phe Val Ser Glu Gln Glu Val Gln Lys
                165                 170                 175
Phe Arg G1u Gln Lys Leu Ala Glu Asp Gln Glu Arg Ala Met Gln Ala
            180                 185                 190
Leu Ile Glu Met Glu Lys Lys Asp Lys Glu Ser Asp Glu Asp Gln Ala
        195                 200                 205
Pro Ser Gly Pro Leu Val Ile Gly Tyr Gln Ile Lys Asp Asn Glu Glu
    210                 215                 220
Ile Arg Thr Leu Asp Ser Ile Met Asp Glu Glu Arg Arg Ile Thr Val
225                 230                 235                 240
Gln Gly Tyr Val Phe Asp Val Glu Thr Arg Glu Leu Lys Ser Gly Arg
                245                 250                 255
Thr Leu Cys Ile Phe Lys Ile Thr Asp Tyr Thr Asn Ser Ile Leu Ile
            260                 265                 270
Lys Met Phe Ala Arg Glu Lys Glu Asp Ala Ala Leu Met Lys Ser Leu
        275                 280                 285
Lys Lys Gly Met Trp Val Lys Ala Arg Gly Ser Ile Gln Asn Asp Thr
    290                 295                 300
Phe Val Arg Asp Leu Val Met Ile Ala Asn Asp Val Asn Glu Ile Lys
305                 310                 315                 320
Ala Lys Thr Arg Glu Asp Ser Ala Pro Glu Gly Glu Lys Arg Val Glu
                325                 330                 335
Leu His Leu His Ser Pro Met Ser Gln Met Asp Ala Val Thr Gly Ile
            340                 345                 350
Gly Lys Leu Val Glu Gln Ala Lys Lys Trp Gly His Glu Ala Ile Ala
        355                 360                 365
Leu Thr Asp His Ala Val Val Gln Ser Phe Pro Asp Ala Tyr Ser Ala
    370                 375                 380
Ala Lys Lys His Gly Ile Lys Met Ile Tyr Gly Met Glu Ala Asn Leu
385                 390                 395                 400
Val Asp Asp Gly Val Pro Ile Ala Tyr Asn Ala Ala His Arg Leu Leu
                405                 410                 415
Glu Glu Glu Thr Tyr Val Val Phe Asp Val Glu Thr Thr Gly Leu Ser
            420                 425                 430
Ala Val Tyr Asp Thr Ile Ile Glu Leu Ala Ala Val Lys Val Lys Gly
        435                 440                 445
Gly Glu Ile Ile Asp Lys Phe Glu Ala Phe Ala Asn Pro His Arg Pro
    450                 455                 460
Leu Ser Ala Thr Ile Ile Glu Leu Thr Gly Ile Thr Asp Asp Met Leu
465                 470                 475                 480
Gln Asp Ala Pro Asp Val Val Asp Val Ile Arg Asp Phe Arg Glu Trp
                485                 490                 495
Ile Gly Asp Asp Ile Leu Val Ala His Asn Ala Ser Phe Asp Met Gly
            500                 505                 510
Phe Leu Asn Val Ala Tyr Lys Lys Leu Leu Glu Val Glu Lys Ala Lys
        515                 520                 525
Asn Pro Val Ile Asp Thr Leu Glu Leu Gly Arg Phe Leu Tyr Pro Glu
    530                 535                 540
Phe Lys Asn His Arg Leu Asn Thr Leu Cys Lys Lys Phe Asp Ile Glu
545                 550                 555                 560
Leu Thr Gln His His Arg Ala Ile Tyr Asp Thr Glu Ala Thr Ala Tyr
                565                 570                 575
Leu Leu Leu Lys Met Leu Lys Asp Ala Ala Glu Lys Gly Ile Gln Tyr
            580                 585                 590
His Asp Glu Leu Asn Glu Asn Met Gly Gln Ser Asn Ala Tyr Gln Arg
        595                 600                 605
Ser Arg Pro Tyr His Ala Thr Leu Leu Ala Val Asn Ser Thr Gly Leu
    610                 615                 620
Lys Asn Leu Phe Lys Leu Val Ser Leu Ser His Ile His Tyr Phe Tyr
625                 630                 635                 640
Arg Val Pro Arg Ile Pro Arg Ser Gln Leu Glu Lys Tyr Arg Glu Gly
                645                 650                 655
Leu Leu Ile Gly Ser Ala Cys Asp Arg Gly Glu Val Phe Glu Gly Met
            660                 665                 670
Met Gln Lys Ser Pro Glu Glu Val Glu Asp Ile Ala Ser Phe Tyr Asp
        675                 680                 685
Tyr Leu Glu Val Gln Pro Pro Glu Val Tyr Arg His Leu Leu Glu Leu
    690                 695                 700
Glu Leu Val Arg Asp Glu Lys Ala Leu Lys Glu Ile Ile Ala Asn Ile
705                 710                 715                 720
Thr Lys Leu Gly Glu Lys Leu Asn Lys Pro Val Val Ala Thr Gly Asn
                725                 730                 735
Val His Tyr Leu Asn Asp Glu Asp Lys Ile Tyr Arg Lys Ile Leu Ile
            740                 745                 750
Ser Ser Gln Gly Gly Ala Asn Pro Leu Asn Arg His Glu Leu Pro Lys
        755                 760                 765
Val Hys Phe Arg Thr Thr Asp Glu Met Leu Glu Ala Phe Ser Phe Leu
    770                 775                 780
GIy Glu Glu Lys Ala Lys Glu Ile Val Val Thr Asn Thr Gln Lys Val
785                 790                 795                 800
Ala Ser Leu Val Asp Asp Ile Lys Pro Ile Lys Asp Asp Leu Tyr Thr
                805                 810                 815
Pro Lys Ile Glu Gly Ala Asp Glu Glu Ile Arg Glu Met Ser Tyr Gln
            820                 825                 830
Arg Ala Arg Ser Ile Tyr Gly Glu Glu Leu Pro Glu Ile ValGlu Ala
        835                 840                 845
Arg Ile Glu Lys Glu Leu Lys Ser Ile Ile Gly His Gly Phe Ala Val
     850                855                 860
Ile Tyr Leu Ile Ser His Lys Leu Val Lys Arg Ser Leu Asp Asp Gly
865                 870                 875                 880
Tyr Leu Val Gly Ser Arg Gly Ser Val Gly Ser Ser Leu Val Ala Thr
                885                 890                 895
Leu Thr Glu Ile Thr Glu Val Asn Pro Leu Pro Pro His Tyr Val Cys
            900                 905                 910
Pro Glu Cys Gln His Ser Glu Phe Phe Asn Asp Gly Ser Val Gly Ser
        915                 920                 925
Gly Phe Asp Leu Pro Asp Lys Thr Cys Pro His Cys Gly Thr Pro Leu
    930                 935                 940
Lys Lys Asp Gly His Asp Ile Pro Phe Glu Thr Phe Leu Gly Phe Lys
945                 950                 955                 960
Gly Asp Lys Val Pro Asp Ile Asp Leu Asn Phe Ser Gly Glu Tyr Gln
                965                 970                 975
Pro Gln Ala His Asn Tyr Thr Lys Val Leu Phe Gly Glu Asp Asn Val
            980                 985                 990
Tyr Arg Ala Gly Thr Ile Gly Thr Val Ala Glu Lys Thr Ala Tyr Gly
        995                1000                1005
Tyr Val Lys Gly Tyr Ala Gly Asp Asn Asn Leu His Met Arg Gly Ala
   1010                1015                1020
Glu Ile Asp Arg Leu Val Gln Gly Cys Thr Gly Val Lys Arg Thr Thr
1025               1030                1035                1040
Gly Gln His Pro Gly Gly Ile Ile Val Val Pro Asp Tyr Met Asp Ile
               1045                1050                1055
Tyr Asp Phe Ser Pro Ile Gln Phe Pro Ala Asp Ala Thr Gly Ser Glu
           1060                1065                1070
Trp Lys Thr Thr His Phe Asp Phe His Ser Ile His Asp Asn Leu Leu
       1075                1080                1085
Lys Leu Asp Ile Leu Gly His Asp Asp Pro Thr Val Ile Arg Met Leu
   1090                1095                1100
Gln Asp Leu Ser Gly Ile Asp Pro Lys Thr Ile Pro Thr Asp Asp Pro
1105               1110                1115                1120
Glu Val Met Lys Ile Phe Gln Gly Thr Glu Ser Leu Gly Val Thr Glu
               1125                1130                1135
Glu Gln Ile Gly Cys Lys Thr Gly Thr Leu Gly Ile Pro Glu Phe Gly
           1140                1145                1150
Thr Arg Phe Val Arg Gln Met Leu Glu Asp Thr Lys Pro Thr Thr Phe
       1155                1160                1165
Ser Glu Leu Val Gln Ile Ser Gly Leu Ser His Gly Thr Asp Val Trp
   1170                1175                1180
Leu Gly Asn Ala Gln Glu Leu Ile His Asn Asn Ile Cys Glu Leu Ser
1185                1190               1195                1200
Glu Val Ile Gly Cys Arg Asp Asp Ile Met Val Tyr Leu Ile Tyr Gln
               1205                1210                1215
Gly Leu Glu Pro Ser Leu Ala Phe Lys Ile Met Glu Phe Val Arg Lys
           1220                1225                 1230
Gly Lys Gly Leu Thr Pro Glu Trp Glu Glu Glu Met Lys Asn Asn Asn
       1235                1240                1245
Val Pro Asp Trp Tyr Ile Asp Ser Cys Lys Lys Ile Lys Tyr Met Phe
   1250                1255                1260
Pro Lys Ala His Ala Ala Ala Tyr Val Leu Met Ala Val Arg Ile Ala
1265               1270                1275                1280
Tyr Phe Lys Val His His Ala Leu Leu Tyr Tyr Ala Ala Tyr Phe Thr
               1285                1290                1295
Val Arg Ala Asp Asp Phe Asp Ile Asp Thr Met Ile Lys Gly Ser Thr
           1300                1305                1310
Ala Ile Arg Ala Val Met Glu Asp Ile Asn Ala Lys Gly Leu Asp Ala
       1315                1320                1325
Ser Pro Lys Glu Lys Asn Leu Leu Thr Val Leu Glu Leu Ala Leu Glu
   1330                1335                1340
Met Cys Glu Arg Gly Tyr Ser Phe Gln Lys Val Asp Leu Tyr Arg Ser
1345               1350                1355                1360
Ser Ala Thr G1u Phe Ile Ile Asp Gly Asn Ser Leu Ile Pro Pro Phe
               1365                1370                1375
Asn Ser Ile Pro Gly Leu Gly Thr Asn Ala Ala Leu Asn Ile Val Lys
           1380                1385                1390
Ala Arg Glu Glu Gly Glu Phe Leu Ser Lys Glu Asp Leu Gln Lys Arg
       1395                1400                1405
Gly Lys Val Ser Lys Thr Ile Leu Glu Tyr Leu Asp Arg His Gly Cys
   1410                1415                1420
Leu Glu Ser Leu Pro Asp Gln Asn Gln Leu Ser Leu Phe
1425               1430                1435
<210>45
<211>1081
<212>PRT
<213>拟南芥(Arabidopsis thaliana)
<400>45
Met Asn Arg Ser Gly Ile Ser Lys Lys Arg Pro Pro Pro Ser Asn Thr
  1               5                  10                  15
Pro Pro Pro Ala Gly Lys His Arg Ala Thr Gly Asp Ser Thr Pro Ser
             20                  25                  30
Pro Ala Ile Gly Thr Leu Asp Asp Glu Phe Met Met Glu Glu Asp Val
         35                  40                  45
Phe Leu Asp Glu Thr Leu Leu Tyr Gly Asp Glu Asp Glu Glu Ser Leu
     50                  55                  60
Ile Leu Arg Asp Ile Glu Glu Arg Glu Ser Arg Ser Ser Ala Trp Ala
 65                  70                  75                  80
Arg Pro Pro Leu Ser Pro Ala Tyr Leu Ser Asn Ser Gln Ile Phe Gln
                85                   90                  95
Gln Leu Glu Ile Asp Ser Ile Ile Ala Glu Ser His Lys Glu Leu Leu
            100                 105                 110
Pro Gly Ser Ser Gly Gln Ala Pro Ile Ile Arg Met Phe Gly Val Thr
        115                 120                 125
Arg Glu Gly Asn Ser Val Cys Cys Phe Val His Gly Phe Glu Pro Tyr
    130                 135                 140
Phe Tyr Ile Ala Cys Pro Pro Gly Met Gly Pro Asp Asp Ile Ser Asn
145                 150                 155                 160
Phe His Gln Ser Leu Glu Gly Arg Met Arg Glu Ser Asn Lys Asn Ala
                165                 170                 175
Lys Val Pro Lys Phe Val Lys Arg Ile Glu Met Val Gln Lys Arg Ser
            180                 185                 190
Ile Met Tyr Tyr Gln Gln Gln Lys Ser Gln Thr Phe Leu Lys Ile Thr
        195                 200                 205
Val Ala Leu Pro Thr Met Val Ala Ser Cys Arg Gly Ile Leu Asp Arg
    210                 215                 220
Gly Leu Gln Ile Asp Gly Leu Gly Met Lys Ser Phe Gln Thr Tyr Glu
225                 230                 235                 240
Ser Asn Ile Leu Phe Val Leu Arg Phe Met Val Asp Cys Asp Ile Val
                245                 250                 255
Gly Gly Asn Trp Ile Glu Val Pro Thr Gly Lys Tyr Lys Lys Asn Ala
            260                 265                 270
Arg Thr Leu Ser Tyr Cys Gln Leu Glu Phe His Cys Leu Tyr Ser Asp
        275                 280                 285
Leu Ile Ser His Ala Ala Glu Gly Glu Tyr Ser Lys Met Ala Pro Phe
    290                 295                 300
Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys Gly His Phe
305                 310                 315                 320
Pro Glu Ala Lys His Asp Pro Val Ile Gln Ile Ala Asn Leu Val Thr
                325                 330                 335
Leu Gln Gly Glu Asp His Pro Phe Val Arg Asn Val Met Thr Leu Lys
            340                 345                 350
Ser Cys Ala Pro Ile Val Gly Val Asp Val Met Ser Phe Glu Thr Glu
        355                 360                 365
Arg Glu Val Leu Leu Ala Trp Arg Asp Leu Ile Arg Asp Val Asp Pro
    370                 375                 380
Asp Ile Ile Ile Gly Tyr Asn Ile Cys Lys Phe Asp Leu Pro Tyr Leu
385                 390                 395                 400
Ile Glu Arg Ala Ala Thr Leu Gly Ile Glu Glu Phe Pro Leu Leu Gly
                405                 410                 415
Arg Val Lys Asn Ser Arg Val Arg Val Arg Asp Ser Thr Phe Ser Ser
            420                 425                 430
Arg Gln Gln Gly Ile Arg Glu Ser Lys Glu Thr Thr Ile Glu Gly Arg
        435                 440                 445
Phe Gln Phe Asp Leu Ile Gln Ala Ile His Arg Asp His Lys Leu Ser
    450                 455                 460
Ser Tyr Ser Leu Asn Ser Val Ser Ala His Phe Leu Ser Glu Gln Lys
465                 470                 475                 480
Glu Asp Val His His Ser Ile Ile Thr Asp Leu Gln Asn Gly Asn Ala
                485                 490                 495
Glu Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys Asp Ala Tyr Leu
            500                 505                 510
Pro Gln Arg Leu Leu Asp Lys Leu Met Phe Ile Tyr Asn Tyr Val Glu
        515                 520                 525
Met Ala Arg Val Thr Gly Val Pro Ile Ser Phe Leu Leu Ala Arg Gly
    530                 535                 540
Gln Ser Ile Lys Val Leu Ser Gln Leu Leu Arg Lys Gly Lys Gln Lys
545                 550                 555                 560
Ash Leu Val Leu Pro Asn Ala Lys Gln Ser Gly Ser Glu Gln Gly Thr
                565                 570                 575
Tyr Glu Gly Ala Thr Val Leu Glu Ala Arg Thr Gly Phe Tyr Glu Lys
            580                 585                 590
Pro Ile Ala Thr Leu Asp Phe Ala Ser Leu Tyr Pro Ser Ile Met Met
        595                 600                 605
Ala Tyr Asn Leu Cys Tyr Cys Thr Leu Val Thr Pro Glu Asp Val Arg
    610                 615                 620
Lys Leu Asn Leu Pro Pro Glu His Val Thr Lys Thr Pro Ser Gly Glu
625                 630                 635                 640
Thr Phe Val Lys Gln Thr Leu Gln Lys Gly Ile Leu Pro Glu Ile Leu
                645                 650                 655
Glu Glu Leu Leu Thr Ala Arg Lys Arg Ala Lys Ala Asp Leu Lys Glu
            660                 665                 670
Ala Lys Asp Pro Leu Glu Lys Ala Val Leu Asp Gly Arg Gln Leu Ala
        675                 680                 685
Leu Lys Ile Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala Thr Val
    690                 695                 700
Gly Gln Leu Pro Cys Leu Glu Ile Ser Ser Ser Val Thr Ser Tyr Gly
705                 710                 715                 720
Arg Gln Met Ile Glu Gln Thr Lys Lys Leu Val Glu Asp Lys Phe Thr
                725                 730                 735
Thr Leu Gly Gly Tyr Gln Tyr Ash Ala Glu Val Ile Tyr Gly Asp Thr
            740                 745                 750
Asp Ser Val Met Val Gln Phe Gly Val Ser Asp Val Glu Ala Ala Met
        755                 760                 765
Thr Leu Gly Arg Glu Ala Ala Glu His Ile Ser Gly Thr Phe Ile Lys
    770                 775                 780
Pro Ile Lys Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu Leu Ile
785                 790                 795                 800
Asn Lys Lys Arg Tyr Ala Gly Leu Leu Trp Thr Asn Pro Gln Gln Phe
                805                 810                 815
Asp Lys Met Asp Thr Lys Gly Ile Glu Thr Val Arg Arg Asp Asn Cys
            820                 825                 830
Leu Leu Val Lys Asn Leu Val Thr Glu Ser Leu Asn Lys Ile Leu Ile
        835                 840                 845
Asp Arg Asp Val Pro Gly Ala Ala Glu Asn Val Lys Lys Thr Ile Ser
    850                 855                 860
Asp Leu Leu Met Asn Arg Ile Asp Leu Ser Leu Leu Val Ile Thr Lys
865                 870                 875                 880
Gly Leu Thr Lys Thr Gly Asp Asp Tyr Glu Val Lys Ser Ala His Gly
                885                 890                 895
Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Ala Ala Thr Ala Pro Asn
            900                 905                 910
Val Gly Asp Arg Val Pro Tyr Val Ile Ile Lys Ala Ala Lys Gly Ala
        915                 920                 925
Lys Ala Tyr Glu Arg Ser Glu Asp Pro Ile Tyr Val Leu Gln Asn Asn
    930                 935                 940
Ile Pro Ile Asp Pro Asn Tyr Tyr Leu Glu Asn Gln Ile Ser Lys Pro
945                 950                 955                 960
Leu Leu Arg Ile Phe Glu Pro Val Leu Lys Asn Ala Ser Lys Glu Leu
                965                 970                 975
Leu His Gly Ser His Thr Arg Ser Ile Ser Ile Thr Thr Pro Ser Asn
            980                 985                 990
Ser Gly Ile Met Lys Phe Ala Lys Lys Gln Leu Ser Cys Val Gly Cys
        995               1000                 1005
Lys Val Pro Ile Arg Tyr Phe Val Gln Trp Asn Thr Met Arg Lys Leu
   1010                1015                1020
Gln Gly Lys Arg Ser Arg Val Ile Leu Gln Lys Arg Val Ser Arg Tyr
1025               1030                1035                1040
Ala Ala Trp Leu Ser Leu Lys Arg Phe Leu Gly Gly Cys Gly His Ser
               1045                1050                1055
Ala Arg Ser Val Lys Ala Leu Phe Ile Lys Met Ser Cys Ala Pro Val
           1060                1065                1070
Glu Ile Val Gln Tyr Phe Thr Gly Glu
       1075                1080
<210>46
<211>2154
<212>PRT
<213>拟南芥(Arabidopsis thaliana)
<400>46
Met Ser Gly Arg Arg Cys Asp Arg Arg Leu Asn Val Gln Lys Val Ser
  1               5                  10                  15
Ala Ala Asp Glu Leu Glu Thr Lys Leu Gly Phe Gly Leu Phe Ser Gln
             20                  25                  30
Gly Glu Thr Arg Leu Gly Trp Leu Leu Thr Phe Ala Ser Ser Ser Trp
         35                  40                  45
Glu Asp Ala Asp Thr Gly Lys Thr Phe Ser Cys Val Asp Leu Phe Phe
     50                  55                  60
Val Thr Gln Asp Gly Ser Ser Phe Lys Thr Lys Tyr Lys Phe Arg Pro
 65                  70                  75                  80
Tyr Leu Tyr Ala Ala Thr Lys Asp Asn Met Glu Leu Glu Val Glu Ala
                 85                  90                  95
Tyr Leu Arg Arg Arg Tyr Glu Arg Gln Val Ala Asp Ile Gln Ile Val
            100                 105                 110
His Lys Glu Asp Leu Tyr Leu Lys Asn His Leu Ser Gly Leu Gln Lys
        115                 120                 125
Lys Tyr Leu Lys Val Ser Phe Asp Thr Val Gln Gln Leu Val Glu Val
    130                 135                 140
Lys Arg Asp Leu Leu His Ile Val Glu Arg Asn Leu Ala Lys Phe Asn
145                 150                 155                 160
Ala Leu Glu Ala Tyr Glu Ser Ile Leu Ser Gly Lys Arg Glu Gln Arg
                165                 170                 175
Pro Gln Asp Cys Leu Asp Ser Val Val Asp Leu Arg Glu Tyr Asp Val
            180                 185                 190
Pro Tyr His Val Arg Phe Ala Ile Asp Asn Asp Val Arg Ser Gly Gln
        195                 200                 205
Trp Tyr Asn Val Ser Ile Ser Ser Thr Asp Val Ile Leu Glu Lys Arg
    210                 215                 220
Thr Asp Leu Leu Gln Arg Ala Glu Val Arg Val Cys Ala Phe Asp Ile
225                 230                 235                 240
Glu Thr Val Lys Leu Pro Leu Lys Phe Pro Asp Ala Glu Tyr Asp Gln
                245                 250                 255
Ile Met Met Ile Ser Tyr Met Val Asp Gly Gln Gly Phe Leu Ile Thr
            260                 265                 270
Asn Arg Glu Cys Val Gly Lys Asp Ile Glu Asp Leu Glu Tyr Thr Pro
        275                 280                 285
Lys Pro Glu Phe Glu Gly Tyr Phe Lys Val Thr Asn Val Thr Asn Glu
    290                 295                 300
Val Glu Leu Leu Arg Lys Trp Phe Ser His Met Gln Glu Leu Lys Pro
305                 310                 315                 320
Gly Ile Tyr Val Thr Tyr Asn Gly Asp Phe Phe Asp Trp Pro Phe Ile
                325                 330                 335
Glu Arg Arg Ala Ser His His Gly Ile Lys Met Asn Glu Glu Leu Gly
            340                 345                 350
Phe Arg Cys Asp Gln Asn Gln Gly Glu Cys Arg Ala Lys Phe Val Cys
        355                 360                 365
His Leu Asp Cys Phe Ser Trp Val Lys Arg Asp Ser Tyr Leu Pro Gln
    370                 375                 380
Gly Ser Gln Gly Leu Lys Ala Val Thr Lys Val Lys Leu Gly Tyr Asp
385                 390                 395                 400
Pro Leu Glu Val Asn Pro Glu Asp Met Val Arg Phe Ala Met Glu Lys
                405                 410                 415
Pro Gln Thr Met Ala Ser Tyr Ser Val Ser Asp Ala Val Ala Thr Tyr
            420                 425                 430
Tyr Leu Tyr Met Thr Tyr Val His Pro Phe Val Phe Ser Leu Ala Thr
        435                 440                 445
Ile Ile Pro Met Val Pro Asp Glu Val Leu Arg Lys Gly Ser Gly Thr
     450                455                 460
Leu Cys Glu Met Leu Leu Met Val Glu Ala Tyr Lys Ala Asn Val Val
465                 470                 475                 480
Cys Pro Asn Lys Asn Gln Ala Asp Pro Glu Lys Phe Tyr Gln Gly Lys
                485                 490                 495
Leu Leu Glu Ser Glu Thr Tyr Ile Gly Gly His Val Glu Cys Leu Gln
            500                 505                 510
Ser Gly Val Phe Arg Ser Asp Ile Pro Thr Ser Phe Lys Leu Asp Ala
        515                 520                 525
Ser Ala Tyr Gln Gln Leu Ile Asp Asn Leu Gly Arg Asp Leu Glu Tyr
    530                 535                 540
Ala Ile Thr Val Glu Gly Lys Met Arg Met Asp Ser Val Ser Asn Phe
545                 550                 555                 560
Asp Glu Val Lys Glu Val Ile Arg Glu Lys Leu Glu Lys Leu Arg Asp
                565                 570                 575
Asp Pro Ile Arg Glu Glu Gly Pro Leu Ile Tyr His Leu Asp Val Ala
            580                 585                 590
Ala Met Tyr Pro Asn Ile Ile Leu Thr Asn Arg Leu Gln Pro Pro Ser
        595                 600                 605
Ile Val Thr Asp Glu Val Cys Thr Ala Cys Asp Phe Asn Gly Pro Glu
    610                 615                 620
Lys Thr Cys Leu Arg Lys Leu Glu Trp Val Trp Arg Gly Val Thr Phe
625                 630                 635                 640
Lys Gly Asn Lys Ser Glu Tyr Tyr His Leu Lys Lys Gln Ile Glu Ser
                645                 650                 655
Glu Ser Val Asp Ala Gly Ala Asn Met Gln Ser Ser Lys Pro Phe Leu
            660                 665                 670
Asp Leu Pro Lys Val Glu Gln Gln Ser Lys Leu Lys Glu Arg Leu Lys
        675                 680                 685
Lys Tyr Cys Gln Lys Ala Tyr Ser Arg Val Leu Asp Lys Pro Ile Thr
    690                 695                 700
Glu Val Arg Glu Ala Gly Ile Cys Met Arg Glu Asn Pro Phe Tyr Val
705                 710                 715                 720
Asp Thr Val Arg Ser Phe Arg Asp Arg Arg Tyr Glu Tyr Lys Thr Leu
                725                 730                 735
Asn Lys Val Trp Lys Gly Lys Leu Ser Glu Ala Lys Ala Ser Gly Asn
            740                 745                 750
Leu Ile Lys Ile Gln Glu Ala His Asp Met Val Val Val Tyr Asp Ser
        755                 760                 765
Leu Gln Leu Ala His Lys Cys Ile Leu Asn Ser Phe Tyr Gly Tyr Val
    770                 775                 780
Met Arg Lys Gly Ala Arg Trp Tyr Ser Met Glu Met Ala Gly Val Val
785                 790                 795                 800
Thr Tyr Thr Gly Ala Lys Ile Ile Gln Asn Ala Arg Leu Leu Ile Glu
                805                 810                 815
Arg Ile Gly Lys Pro Leu Glu Leu Asp Thr Asp Gly Ile Trp Cys Ala
            820                 825                 830
Leu Pro Gly Ser Phe Pro Glu Asn Phe Thr Phe Lys Thr Ile Asp Met
        835                 840                 845
Lys Lys Phe Thr Ile Ser Tyr Pro Cys Val Ile Leu Asn Val Asp Val
    850                 855                 860
Ala Lys Asn Asn Ser Asn Asp Gln Tyr Gln Thr Leu Val Asp Pro Val
865                 870                 875                 880
Arg Lys Thr Tyr Asn Ser Arg Ser Glu Cys Ser Ile Glu Phe Glu Val
                885                 890                 895
Asp Gly Pro Tyr Lys Ala Met Ile Ile Pro Ala Ser Lys Glu Glu Gly
            900                 905                 910
Ile Leu Ile Lys Lys Arg Tyr Ala Val Phe Asn His Asp Gly Thr Ile
        915                 920                 925
Ala Glu Leu Lys Gly Phe Glu Met Lys Arg Arg Gly Glu Leu Lys Leu
    930                 935                 940
Ile Lys Val Phe Gln Ala Glu Leu Phe Asp Lys Phe Leu His Gly Ser
945                 950                 955                 960
Thr Leu Glu Glu Cys Tyr Ser Ala Val Ala Ala Val Ala Asn Arg Trp
                965                 970                 975
Leu Asp Leu Leu Glu Gly Gln Gly Lys Asp Ile Ala Asp Ser Glu Leu
            980                 985                 990
Leu Asp Tyr Ile Ser Glu Ser Ser Thr Met Ser Lys Ser Leu Ala Asp
        995                1000                1005
Tyr Gly Gln Gln Lys Ser Cys Ala Val Thr Thr Ala Lys Arg Leu Ala
   1010                1015                1020
Asp Phe Leu Gly Asp Thr Met Val Lys Asp Lys Gly Leu Arg Cys Gln
1025               1030                1035                1040
Tyr Ile Val Ala Arg Glu Pro Glu Gly Thr Pro Val Ser Glu Arg Ala
               1045                1050                1055
Val Pro Val Ala Ile Phe Gln Thr Asp Asp Pro Glu Lys Lys Phe Tyr
           1060                1065                1070
Leu Gln Lys Trp Cys Lys Ile Ser Ser Tyr Thr Gly Ile Arg Ser Ile
       1075                1080                1085
Ile Asp Trp Met Tyr Tyr Lys Gln Arg Leu His Ser Ala Ile Gln Lys
   1090                1095                1100
Val Ile Thr Ile Pro Ala Ala Met Gln Lys Val Ala Asn Pro Val Leu
1105               1110                1115                1120
Arg Val Arg His Pro Tyr Trp Leu Glu Lys Lys Val Cys Asp Lys Phe
               1125                1130                1135
Arg Gln Gly Lys Ile Val Asp Met Phe Ser Ser Ala Asn Lys Asp His
           1140                1145                1150
Ser Thr Thr Gln Asp Asn Val Val Ala Asp Ile Glu Glu Phe Cys Lys
       1155                1160                1165
Glu Asn Arg Pro Ser Val Lys Gly Pro Lys Pro Val Ala Arg Ser Phe
   1170                1175                1180
Glu Val Asp Arg Asn His Ser Glu Gly Lys Gln Gln Glu Ser Trp Asp
1185               1190                1195                1200
Pro Glu Phe His Asp Ile Ser Leu Gln Asn Val Asp Lys Asn Val Asp
               1205                1210                1215
Tyr Gln Gly Trp Leu Glu Leu Glu Lys Arg Lys Trp Lys Met Thr Leu
           1220                1225                1230
Thr Asn Lys Lys Lys Arg Arg Phe Asp Asp Leu Lys Pro Cys Asn Gln
       1235                1240                1245
Ile Asp Ala His Lys Ile Asn Lys Lys Val Cys Lys Gly Arg Val Gly
   1250                1255                1260
Val Gly Ser Tyr Phe Arg Arg Pro Glu Glu Ala Leu Thr Ser Ser Tyr
1265               1270                1275                1280
Leu Gln Ile Ile Gln Leu Val Gln Ser Pro Gln Ser Gly Gln Phe Phe
               1285                1290                1295
Ala Trp Val Val Val Glu Gly Leu Met Leu Lys Ile Pro Leu Thr Ile
           1300                1305                1310
Pro Arg Val Phe Tyr Ile Asn Ser Lys Ala Ser Ile Ala Gly Asn Phe
       1315                1320                1325
Thr Gly Lys Cys Ile Asn Lys Ile Leu Pro His Gly Lys Pro Cys Tyr
   1330                1335                1340
Asn Leu Met Glu Ala Arg His Leu His Asn Thr His Ile Leu Leu Leu
1345               1350                1355                1360
Val Asn Ile Gln Glu Asp Gln Phe Ile Lys Glu Ser Lys Lys Leu Ala
               1365                1370                1375
Ala Leu Leu Ala Asp Pro Glu Ile Glu Gly Ile Tyr Glu Thr Lys Met
           1380                1385                1390
Pro Leu Glu Phe Ser Ala Ile Cys Gln Ile Gly Cys Val Cys Lys Ile
       1395                1400                1405
Glu Asp Thr Ala Lys His Arg Asn Thr Gln Asp Gly Trp Lys Leu Gly
   1410                1415                1420
Glu Leu His Arg Ile Thr Thr Thr Glu Cys Arg Tyr Leu Glu Asn Ser
1425               1430                1435                1440
Ile Pro Leu Val Tyr Leu Tyr His Ser Thr Ser Thr Gly Arg Ala Val
               1445                1450                1455
Tyr Val Leu Tyr Cys His Ala Ser Lys Leu Met Ser Val Val Val Val
           1460                1465                1470
Asn Pro Tyr Gly Asp Lys Glu Leu Leu Ser Ser Ala Leu Glu Arg Gln
       1475                1480                1485
Phe Arg Asp Arg Cys Gln Glu Leu Ser Pro Glu Pro Phe Ser Trp Asp
   1490                1495                1500
Gly Ile Leu Phe Gin Val Glu Tyr Val Asp His Pro Glu Ala Ala Thr
1505               1510                1515                1520
Lys Phe Leu Gln Lys Ala Leu Cys Glu Tyr Arg Glu Glu Asn Cys Gly
               1525                1530                1535
Ala Thr Val Ala Val Ile Glu Cys Pro Asp Phe Asn Thr Thr Lys Glu
           1540                1545                1550
Gly Val Lys Ala Leu Glu Asp Phe Pro Cys Val Arg Ile Pro Phe Asn
       1555                1560                1565
Asp Asp Asp Asn Ser Tyr Gln Pro Val Ser Trp Gln Arg Pro Ala Ala
   1570                1575                1580
Lys Ile Ala Val Leu Arg Cys Ala Ser Ala Ile Gln Trp Leu Asp Arg
1585               1590                1595                1600
Arg Ile Ala Gln Ser Arg Tyr Ala His Val Pro Leu Gly Asn Phe Gly
               1605                1610                1615
Arg Asp Trp Leu Thr Phe Thr Val Asp Ile Phe Leu Ser Arg Ala Leu
           1620                1625                1630
Arg Asp Gln Gln Gln Val Leu Trp Val Ser Asp Asn Gly Val Pro Asp
       1635                1640                1645
Leu Gly Asp Ile Asn Asn Glu Glu Thr Phe Leu Ala Asp Glu Leu Gln
   1650                1655                1660
Glu Thr Ser Leu Leu Phe Pro Gly Ala Tyr Arg Lys Val Ser Val Glu
1665               1670                1675                1680
Leu Lys Val His Arg Leu Ala Val Asn Ala Leu Leu Lys Ser Asp Leu
               1685                1690                1695
Val Ser Glu Met Glu Gly Gly Gly Phe Leu Gly Val Asn Ser Arg Gly
           1700                1705                1710
Ser Ser Leu Asn Asp Asn Gly Ser Phe Asp Glu Asn Asn Gly Cys Ala
       1715                1720                1725
Gln Ala Phe Arg Val Leu Lys Gln Leu Ile Lys Arg Leu Leu His Asp
   1730                1735                1740
Ala Cys Asn Ser Gly Asn Ile Tyr Ala Asp Ser Ile Leu Gln His Leu
1745               1750                1755                1760
Ser Trp Trp Leu Arg Ser Pro Ser Ser Lys Leu His Asp Pro Ala Leu
               1765                1770                1775
His Leu Met Leu His Lys Val Met Gln Lys Val Phe Ala Leu Leu Leu
           1780                1785                1790
Thr Asp Leu Arg Arg Leu Gly Ala Ile Ile Ile Tyr Ala Asp Phe Ser
       1795                1800                1805
Lys Val Ile Ile Asp Thr Gly Lys Phe Asp Leu Ser Ala Ala Lys Thr
   1810                1815                1820
Tyr Cys Glu Ser Leu Leu Thr Val Met Gly Ser Arg Asp Ile Phe Lys
1825               1830                1835                1840
Leu Ile Leu Leu Glu Pro Val His Tyr Trp His Ser Leu Leu Phe Met
               1845                1850                1855
Asp Gln His Asn Tyr Ala Gly Ile Arg Ala Thr Gly Asp Glu Ile Ser
           1860                1865                1870
Gly Asn Glu Val Thr Ile Glu Pro Lys Trp Ser Val Ala Arg His Leu
       1875                1880                1885
Pro Glu Tyr Ile Gln Lys Asp Phe Ile Ile Ile Val Ala Thr Phe Ile
   1890                1895                1900
Phe Gly Pro Trp Lys Phe Ala Leu Glu Lys Lys Arg Gly Ser Ala Glu
1905               1910                1915                1920
Ser Leu Glu Ala Glu Met Val Glu Tyr Leu Lys Glu Gln Ile Gly Thr
               1925                1930                1935
Arg Phe Ile Ser Met Ile Val Glu Lys Ile Gly Asn Ile Arg Ser His
           1940                1945                1950
Ile Lys Asp Ile Asn Val Ser Asp Ala Ser Trp Ala Ser Gly Gln Ala
       1955                1960                1965
Pro Lys Gly Asp Tyr Thr Phe Glu Phe Ile Gln Ile Ile Thr Ala Val
   1970                1975                1980
Leu Ala Leu Asp Gln Asn Val Gln Gln Asp Val Leu Val Met Arg Lys
1985               1990                1995                2000
Ile Leu Leu Lys Tyr Ile Lys Val Lys Glu Cys Ala Ala Glu Ala Glu
               2005                2010                2015
Phe Ile Asp Pro Gly Pro Ser Phe Ile Leu Pro Asn Val Ala Cys Ser
           2020                2025                2030
Asn Cys Gly Ala Tyr Arg Asp Leu Asp Phe Cys Arg Asp Ser Ala Leu
       2035                2040                2045
Leu Thr Glu Lys Glu Trp Ser Cys Ala Asp Pro Gln Cys Val Lys Ile
   2050                2055                2060
Tyr Asp Lys Glu Gln Ile Glu Ser Ser Ile Ile Gln Met Val Arg Gln
2065               2070                2075                2080
Arg Glu Arg Met Tyr Gln Leu Gln Asp Leu Val Cys Asn Arg Cys Asn
               2085                2090                2095
Gln Val Lys Ala Ala His Leu Thr Glu Gln Cys Glu Cys Ser Gly Ser
           2100                2105                2110
Phe Arg Cys Lys Glu Ser Gly Ser Asp Phe His Lys Arg Ile Glu Ile
       2115                2120                2125
Phe Leu Asp Ile Ala Lys Arg Gln Lys Phe Arg Leu Leu Glu Glu Cys
   2130                2135                2140
Ile Ser Trp Ile Leu Phe Ala Thr Ser Cys
2145               2150
<210>47
<211>3706
<212>DNA
<213>稻(Oryza sativa)
<400>47
ctctcttccc gcgttcccct ctccctcccc ctcccccctc tccggcgatg agctcaggcg 60
gacgcggcgg caagcggcga ggggcgccgc ccccggggcc atccggggcg gcggcgaagc 120
gggcccaccc cggtggcacc ccgcagccgc ctccgcccgc cgcgacggcg gcggcgcccg 180
tggcggagga ggaggacatg atggacgagg acgtcttcct cgacgagacc atcctggcgg 240
aggacgagga ggcgttgctg ctgctcgacc gggacgaggc cctcgcctca cgcctctccc 300
gctggaggcg ccccgcgctc cccgccgacc tagcgtccgg ctgctcgcgc aatgttgctt 360
ttcagcagct ggagaragat tatgttattg gtgagagcca caaagtactg ctccccaact 420
catctggtcc tgcagctata ctcaggatat ttggcgtaac tagagaaggt cacagtgtat 480
gctgccaagt gcatggattt gagccatatt tttacatcag ttgtccaatg gggatgggcc 540
ctgatgatat ttcacgcttc caccaaacac tagaggggag gatgaaggat tcaaatagga 600
acagcaacgt gccaaggttt gtgaagagaa tcgaacttgt gcagaagcag acaatcatgc 660
attaccaacc acagcaatct cagcctttcc tcaagatagt ggttgctttg ccaacaatgg 720
ttgctagttg tcgcggcatc ctggaaaggg gcataacaat tgaaggcctt ggttcgaaga 780
gttttctgac atatgaaagc aacattcttt ttgcacttcg cttcatgatt gactgcaata 840
ttgttggtgg taattggatt gaagttcctg ccggaaagta tatgaaggca gctcgtatca 900
tgtcctattg tcagctagag ttggattgcc tatattcgga tttggtaagc catgctgctg 960
aaggagaaca ttctaagatg gctccatttc gcatattaag ttttgatatt gaatgtgccg 1020
gtcgcaaagg tcacttccca gaaccaactc atgatcccgt tattcagata gctaacttgg 1080
tcacccttca aggagaagga caaccttttg tacgcaatgt tatgacgctt aaatcatgtt 1140
ctcccattgt tggagttgat gttatgtcat ttgacacaga gagggatgtt ctacttgctt 1200
ggagggattt catacgtgaa gtggaccctg atattattat tggatacaat atctgcaaat 1260
ttgacttacc ctatcttatt gagagagctg aagttcttaa gatagtagag tttccaatac 1320
ttggacgaat cagaaatagt cgtgttcgtg tccgtgacac aactttctct tcaaggcaat 1380
atggtatgcg tgaaagtaaa gatgtagcag tggaaggaag agtacaattt gatcttctgc 1440
aggctatgca acgggattac aagcttagtt cttattcatt aaactctgta tctgcacatt 1500
tcctcgggga gcaaaaagag gatgttcatc actcaattat atctgatctt caaaatggga 1560
attcagagac acgaagacgg cttgcggttt attgtttgaa ggatgcctat cttccacaac 1620
gactgctaga taagttgatg tatatctaca actatgtgga aatggcaaga gtcactggag 1680
ttcccatttc atttcttctt tcaaggggac agagcattaa ggtcctctca cagctactca 1740
ggaaagcaaa acagaaaaac cttgttatac caaatataaa gggtcaagcg tctggacagg 1800
atacctttga aggtgcaact gttttggagg caagggctgg attttatgag aaacccattg 1860
cgactttgga ctttgcttcg ttgtatccat ccatcatgat ggcatataac ctatgctact 1920
gtactttggt cccccctgag gatgcccgca aactcaacct gcctccagaa agtgtcaaca 1980
aaaccccatc tggtgaaaca tttgtgaaac cagatgtgca aaagggtata cttcctgaaa 2040
tccttgaaga attgttggct gctcggaaaa gggcgaaagc agatttgaag gaagcaaagg 2100
atccatttga aagggccgtt cttgatggtc gtcagcttgc cctaaaaata agcgcaaact 2160
ctgtctatgg ttttactgga gcgactgttg gtcaattacc ttgtttagaa atttcttcaa 2220
gtgtgaccag ctatggtcga cagatgattg aacatacaaa aaagcttgtt gaagataaat 2280
tcacgacact tggaggctat gagcacaatg cagaggtcat ctatggagat actgattctg 2340
taatggtaca gttcggtgtt tctactgttg aggacgcaat gaagctagga agagaagctg 2400
cagactacat tagtggaaca tttattaagc ccatcaagct tgagtttgag aagatctatt 2460
tcccttatct actgattagc aagaagagat atgctggttt gtactggaca aatcctgaga 2520
aatttgacaa aatggacacg aaaggtattg aaacagtgag aagggacaac tgtttattag 2580
taaagaacct ggttactgag tgccttcata aaatactagt ggacagagat gttcctggtg 2640
cagttcaata tgtcaagaac accatttctg atctactaat gaaccgtgta gacttatctc 2700
ttctagttat aacaaagggt ttgactaaaa caggagagga ttatgctgtc aaagctgccc 2760
atgtggagct tgctgagaga atgcgaaaga gggacgctgc tactgctcct actgttggtg 2820
accgggttcc ttatgttata atcaaagcag caaaaggggc aaaggcatat gagaggtcag 2880
aagatcctat ttatgttttg gataataaca taccaataga tccccaatac taccttgaga 2940
accaaatcag caaaccactt ttgaggatct ttgagccgat tctgaagaat gccagtagag 3000
agctgcttca tggaagtcac accagggctg tttcaatctc aactccttca aatagtggaa 3060
taatgaaatt tgcaaagaaa caattgacat gcctcggatg caaagcagtt ataagtggtt 3120
ccaatcaaac gctttgcttt cattgcaagg gaagagaagc agagttatac tgcaaaactg 3180
taggaaacgt ttctgagctg gagatgctct ttgggaggct ctggacgcag tgccaggagt 3240
gccaaggctc ccttcatcag gacgttctct gcacaagccg ggattgtcct attttctacc 3300
gccgaagaaa ggcgcagaag gatatggctg aagctagagt acagcttcaa cgttgggact 3360
tctgagtcct ctcatactga cggagtacta ctttccccaa atattgcgaa accattactg 3420
tgaggcacgc cattgcggga tcatgtgatt gcatcttcat gcatgatggc tctggcttgt 3480
ttagttggat cggctgaaat agctttgttc tacggtcagt ttgttgtatt tttaggtggt 3540
aggttatctg tacctctagc cgctaacagg gtaatctagt tgcttccctt ggtgcattga 3600
tgcagccatg tgtaaggtag ataaacaatt ttttttcatc atcttttaac ttcatgaggt 3660
gattgaggct gagaagcacc cattcaagaa aaaaaaaaaa aaaaaa                3706
<210>48
<211>1105
<212>PRT
<213>稻(Oryza sativa)
<400>48
Met Ser Ser Gly Gly Arg Gly Gly Lys Arg Arg Gly Ala Pro Pro Pro
  1               5                  10                  15
Gly Pro Ser Gly Ala Ala Ala Lys Arg Ala His Pro Gly Gly Thr Pro
             20                  25                  30
Gln Pro Pro Pro Pro Ala Ala Thr Ala Ala Ala Pro Val Ala Glu Glu
         35                  40                  45
Glu Asp Met Met Asp Glu Asp Val Phe Leu Asp Glu Thr Ile Leu Ala
     50                  55                  60
Glu Asp Glu Glu Ala Leu Leu Leu Leu Asp Arg Asp Glu Ala Leu Ala
 65                  70                  75                  80
Ser Arg Leu Ser Arg Trp Arg Arg Pro Ala Leu Pro Ala Asp Leu Ala
                 85                  90                  95
Ser Gly Cys Ser Arg Asn Val Ala Phe Gln Gln Leu Glu Ile Asp Tyr
            100                 105                 110
Val Ile Gly Glu Ser His Lys Val Leu Leu Pro Asn Ser Ser Gly Pro
        115                 120                 125
Ala Ala Ile Leu Arg Ile Phe Gly Val Thr Arg Glu Gly His Ser Val
    130                 135                 140
Cys Cys Gln Val His Gly Phe Glu Pro Tyr Phe Tyr Ile Ser Cys Pro
145                 150                 155                 160
Met Gly Met Gly Pro Asp Asp Ile Ser Arg Phe His Gln Thr Leu Glu
                165                 170                 175
Gly Arg Met Lys Asp Ser Asn Arg Asn Ser Asn Val Pro Arg Phe Val
            180                 185                 190
Lys Arg Ile Glu Leu Val Gln Lys Gln Thr Ile Met His Tyr Gln Pro
        195                 200                 205
Gln Gln Ser Gln Pro Phe Leu Lys Ile Val Val Ala Leu Pro Thr Met
    210                 215                 220
Val Ala Ser Cys Arg Gly Ile Leu Glu Arg Gly Ile Thr Ile Glu Gly
225                 230                 235                 240
Leu Gly Ser Lys Ser Phe Leu Thr Tyr Glu Ser Asn Ile Leu Phe Ala
                245                 250                 255
Leu Arg Phe Met Ile Asp Cys Asn Ile Val Gly Gly Asn Trp Ile Glu
            260                 265                 270
Val Pro Ala Gly Lys Tyr Met Lys Ala Ala Arg Ile Met Ser Tyr Cys
        275                 280                 285
Gln Leu Glu Leu Asp Cys Leu Tyr Ser Asp Leu Val Ser His Ala Ala
    290                 295                 300
Glu Gly Glu His Ser Lys Met Ala Pro Phe Arg Ile Leu Ser Phe Asp
305                 310                 315                 320
Ile Glu Cys Ala Gly Arg Lys Gly His Phe Pro Glu Pro Thr His Asp
                325                 330                 335
Pro Val Ile Gln Ile Ala Asn Leu Val Thr Leu Gln Gly Glu Gly Gln
            340                 345                 350
Pro Phe Val Arg Asn Val Met Thr Leu Lys Ser Cys Ser Pro Ile Val
        355                 360                 365
Gly Val Asp Val Met Ser Phe Asp Thr Glu Arg Asp Val Leu Leu Ala
     370                375                 380
Trp Arg Asp Phe Ile Arg Glu Val Asp Pro Asp Ile Ile Ile Gly Tyr
385                 390                 395                 400
Asn Ile Cys Lys Phe Asp Leu Pro Tyr Leu Ile Glu Arg Ala Glu Val
                405                 410                 415
Leu Lys Ile Val Glu Phe Pro Ile Leu Gly Arg Ile Arg Asn Ser Arg
            420                 425                 430
Val Arg Val Arg Asp Thr Thr Phe Ser Ser Arg Gln Tyr Gly Met Arg
        435                 440                 445
Glu Ser Lys Asp Val Ala Val Glu Gly Arg Val Gln Phe Asp Leu Leu
    450                 455                 460
Gln Ala Met Gln Arg Asp Tyr Lys Leu Ser Ser Tyr Ser Leu Asn Ser
465                 470                 475                 480
Val Ser Ala His Phe Leu Gly Glu Gln Lys Glu Asp Val His His Ser
                485                 490                 495
Ile Ile Ser Asp Leu Gln Asn Gly Asn Ser Glu Thr Arg Arg Arg Leu
            500                 505                 510
Ala Val Tyr Cys Leu Lys Asp Ala Tyr Leu Pro Gln Arg Leu Leu Asp
        515                 520                 525
Lys Leu Met Tyr Ile Tyr Asn Tyr Val Glu Met Ala Arg Val Thr Gly
    530                 535                 540
Val Pro Ile Ser Phe Leu Leu Ser Arg Gly Gln Ser Ile Lys Val Leu
545                 550                 555                 560
Ser Gln Leu Leu Arg Lys Ala Lys Gln Lys Asn Leu Val Ile Pro Asn
                565                 570                 575
Ile Lys Gly Gln Ala Ser Gly Gln Asp Thr Phe Glu Gly Ala Thr Val
            580                 585                 590
Leu Glu Ala Arg Ala Gly Phe Tyr Glu Lys Pro Ile Ala Thr Leu Asp
        595                 600                 605
Phe Ala Ser Leu Tyr Pro Ser Ile Met Met Ala Tyr Asn Leu Cys Tyr
     610                615                 620
Cys Thr Leu Val Pro Pro Glu Asp Ala Arg Lys Leu Asn Leu Pro Pro
625                 630                 635                 640
Glu Ser Val Asn Lys Thr Pro Ser Gly Glu Thr Phe Val Lys Pro Asp
                645                 650                 655
Val Gln Lys Gly Ile Leu Pro Glu Ile Leu Glu Glu Leu Leu Ala Ala
            660                 665                 670
Arg Lys Arg Ala Lys Ala Asp Leu Lys Glu Ala Lys Asp Pro Phe Glu
        675                 680                 685
Arg Ala Val Leu Asp Gly Arg Gln Leu Ala Leu Lys Ile Ser Ala Asn
    690                 695                 700
Ser Val Tyr Gly Phe Thr Gly Ala Thr Val Gly Gln Leu Pro Cys Leu
705                 710                 715                 720
Glu Ile Ser Ser Ser Val Thr Ser Tyr Gly Arg Gln Met Ile Glu His
                725                 730                 735
Thr Lys Lys Leu Val Glu Asp Lys Phe Thr Thr Leu Gly Gly Tyr Glu
            740                 745                 750
His Asn Ala Glu Val Ile Tyr Gly Asp Thr Asp Ser Val Met Val Gln
        755                 760                 765
Phe Gly Val Ser Thr Val Glu Asp Ala Met Lys Leu Gly Arg Glu Ala
    770                 775                 780
Ala Asp Tyr Ile Ser Gly Thr Phe Ile Lys Pro Ile Lys Leu Glu Phe
785                 790                 795                 800
Glu Lys Ile Tyr Phe Pro Tyr Leu Leu Ile Ser Lys Lys Arg Tyr Ala
                805                 810                 815
Gly Leu Tyr Trp Thr Asn Pro Glu Lys Phe Asp Lys Met Asp Thr Lys
            820                 825                 830
Gly Ile Glu Thr Val Arg Arg Asp Asn Cys Leu Leu Val Lys Asn Leu
        835                 840                 845
Val Thr Glu Cys Leu His Lys Ile Leu Val Asp Arg Asp Val Pro Gly
    850                 855                 860
Ala Val Gln Tyr Val Lys Asn Thr Ile Ser Asp Leu Leu Met Asn Arg
865                 870                 875                 880
Val Asp Leu Ser Leu Leu Val Ile Thr Lys Gly Leu Thr Lys Thr Gly
                885                 890                 895
Glu Asp Tyr Ala Val Lys Ala Ala His Val Glu Leu Ala Glu Arg Met
            900                 905                 910
Arg Lys Arg Asp Ala Ala Thr Ala Pro Thr Val Gly Asp Arg Val Pro
        915                 920                 925
Tyr Val Ile Ile Lys Ala Ala Lys Gly Ala Lys Ala Tyr Glu Arg Ser
    930                 935                 940
Glu Asp Pro Ile Tyr Val Leu Asp Asn Asn Ile Pro Ile Asp Pro Gln
945                 950                 955                 960
Tyr Tyr Leu Glu Asn Gln Ile Ser Lys Pro Leu Leu Arg Ile Phe Glu
                965                 970                 975
Pro Ile Leu Lys Asn Ala Ser Arg Glu Leu Leu His Gly Ser His Thr
            980                 985                 990
Arg Ala Val Ser Ile Ser Thr Pro Ser Asn Ser Gly Ile Met Lys Phe
        995                1000                1005
Ala Lys Lys Gln Leu Thr Cys Leu Gly Cys Lys Ala Val Ile Ser Gly
   1010                1015                1020
Ser Asn Gln Thr Leu Cys Phe His Cys Lys Gly Arg Glu Ala Glu Leu
1025              1030                 1035                1040
Tyr Cys Lys Thr Val Gly Asn Val Ser Glu Leu Glu Met Leu Phe Gly
               1045                1050                1055
Arg Leu Trp Thr Gln Cys Gln Glu Cys Gln Gly Ser Leu His Gln Asp
           1060                1065                1070
Val Leu Cys Thr Ser Arg Asp Cys Pro Ile Phe Tyr Arg Arg Arg Lys
       1075                1080                1085
Ala Gln Lys Asp Met Ala Glu Ala Arg Val Gln Leu Gln Arg Trp Asp
   1090                1095                1100
Phe
1105
<210>49
<211>3427
<212>DNA
<213>大豆(Glycine max)
<400>49
tgattaccct cccactccac actctccgct gtctctccct cccaattccg atgagcaaca 60
acgcctcccg gaagcgcgcg ccgccgcctc cgtcccaacc tccgccggcg aacaagccct 120
aatgactcag gaagaagagt tcatggacga agacgtgttc ataaacgaaa ccctcgtctc 180
cgaggacgaa gaatccctca ttctccgcga cattgagcag cgccaggccc tcgccaaccg 240
cctctccaag tggacacgtc ctcctctctc cgccggctac gtcgcccaat ctcgtagcgt 300
cctttttcag cagctagaga ttgattacgt gattgcagag agtcacgggg agttgctgcc 360
gaactcgtct ggacctgtcg ccattatcag aatatttgga gttactaagg aaggacacag 420
tgtttgttgc aatgttcatg ggtttgaacc atatttctac atctgttgcc ctcctggaat 480
gggtccagat gatatctccc attttcatca aactctcgag ggaaggatga gagaagccaa 540
tagaaacagt aatgtgggaa aattcgttcg ccgtattgaa atggtgcaga gaaggagtat 600
tatgtactat cagcaatcca attcccaacc ctttctcaaa attgtagttg cactcccaac 660
aatggttgcc agctgccgtg gtattcttga taggggtatt caacttgatg gtctgggaat 720
gaagagcttc ttgacttatg aaagcaatgt actttttgcc cttcgcttca tgattgattg 780
taacatagtt ggtggaaatt ggattgggat tcctgccgga aaatataaga aaacagcgaa 840
aagcttgtct tactgccagt tagagtttga ttgcttgtat tctgaattga ttagtcatgc 900
tccagaaggg gaatattcaa agatggctcc gtttcgcatt ttgagttttg acatcgagtg 960
tgctggtcgt aaaggtcatt ttcctgagcc tacccatgat cctgttatcc agattgctaa 1020
tttggttact ttacaaggag aagaccagcc atttattcgt aatgtgatga cccttaaatc 1080
atgttctcct atcgttggtg ttgatgtgat gccatttgaa acagaaagag aagtcctgct 1140
ggcttggagg gattttattc gtgaagtgga ccctgatatt attattggat acaacatttg 1200
caaatttgac ttgccatatc ttattgagag agctttgaac ctgaagatag cagaatttcc 1260
aattctgggt cgtatcagga acagtagagt tcgagtaaag gatacaactt tctcatcaag 1320
gcagtacgga accagggaaa gtaaagaagt tgcagtagaa gggagagtta cgtttgattt 1380
actccaggtt atgcaaagag actacaaatt aagttcttat tcactgaatt ctgtgtcatc 1440
acacttcctt tctgagcaga aagaggatgt tcatcattca attatatccg atcttcagaa 1500
tggaaatgca gaaactagga ggcgccttgc tgtgtattgt ttgaaggatg catatctccc 1560
tcagcggctt ttggataaat tgatgttcat ttacaattat gtggagatgg ctcgagtaac 1620
aggtgtccca atttcttttc tactttccag aggccaaagc attaaggtac tttctcaact 1680
tcttaggagg gcaaggcaga agaatctggt cattcctaat gccaaacagg ctgggtctga 1740
acaaggaaca tttgaaggtg ccactgtatt ggaggcaagg gctggatttt atgaaaaacc 1800
aattgctact ttagattttg catccttgta tccatctatt atgatggcct ataacttatg 1860
ttattgcact ctggtgatcc ctgaagatgc tcgcaagctc aacatacctc cagagtctgt 1920
gaacagaact ccatctggtg aaacatttgt taaatcaaat ttgcagaagg gaatacttcc 1980
tgaaatactt gaagagctat taacagcccg taaaagggca aaagcagact taaaggaggc 2040
caaggatccc ctggagaagg cagtgctaga tggtagacag ctagccctga agattagtgc 2100
caattctgtg tatgggttta caggggctac cattggtcag ttaccatgtt tagagatatc 2160
atcgagtgta acaagctatg gtcgacaaat gatcgagcac acgaaaaaac ttgtggaaga 2220
taaatttacg acacttaatg gctatgaaca caatgccgag gtaatatatg gagacacaga 2280
ttcagtcatg gtacaatttg gtgtttctgc tgtagaagag gctatgaact tggggagaga 2340
agctgctgaa catattagtg gaactttcac aaaacccatc aaactagaat ttgagaaggt 2400
ttactatcca tatctcctga ttagcaagaa gagatatgct ggtttgtttt ggacaaaacc 2460
agacaacttt gacaaaatgg acactaaagg tattgaaaca gttcgaagag acaattgttt 2520
attggtcaaa aacctggtga acgattgcct tcacaaaata ttgattgaca gggacattcc 2580
tggggcagtc cagtatgtca agaatgcaat ttcagatctt ctcatgaatc gtatggactt 2640
atcacttctg gttattacaa agggtttaac gaagacagga gatgattacg aagtaaaggc 2700
agctcatgtt gaacttgctg aaaggatgcg caagcgagat gctgccactg ctccaaatgt 2760
tggagacaga gtaccatatg ttattattaa agctgcaaaa ggtgcaaagg catatgagag 2820
atcagaggat cctatctatg tgctagagaa caacataccc atagatcctc attactatct 2880
tgagaatcaa attagcaagc caattctgag aatttttgag ccaattctga agaatgctag 2940
caaagagctt ctccatggaa gtcatacaag atctatttct atttctacac cgtcaaacag 3000
tggcatattg agatttgcta agaaacagct acctgcattg gttgtaaagc tttacttggc 3060
aagggttatc acactctctg ttcacattgc aaaggaaggg aggctgagct gtactgtaaa 3120
acagtatctc aagtgtctga gctggagatg ctttttggga ggttgtggac acagtgtcag 3180
gagtgccaag gttcacttca tcaggatgtt ctctgcacca gtcgggattg tccaattttc 3240
tatcgacgaa aaaaggcaca gaaagatatg ggtgaagcaa agttgcaatt ggacagatgg 3300
aacttctaag ttttgccaag aatttgacct tgcggatctc ttcgaaccaa tggacacaaa 3360
tacaatctgg tgtttgccac aatcctgaca tttgtaatgt gagtaaaagc ccacaatttg 3420
tttactg                                                           3427
<210>50
<211>1088
<212>PRT
<213>大豆(Glycine max)
<400>50
Met Thr Gln Glu Glu Glu Phe Met Asp Glu Asp Val Phe Ile Asn Glu
  1               5                  10                  15
Thr Leu Val Ser Glu Asp Glu Glu Ser Leu Ile Leu Arg Asp Ile Glu
             20                  25                  30
Gln Arg Gln Ala Leu Ala Asn Arg Leu Ser Lys Trp Thr Arg Pro Pro
         35                  40                  45
Leu Ser Ala Gly Tyr Val Ala Gln Ser Arg Ser Val Leu Phe Gln Gln
     50                  55                  60
Leu Glu Ile Asp Tyr Val Ile Ala Glu Ser His Gly Glu Leu Leu Pro
 65                  70                  75                  80
Asn Ser Ser Gly Pro Val Ala Ile Ile Arg Ile Phe Gly Val Thr Lys
                 85                  90                  95
Glu Gly His Ser Val Cys Cys Asn Val His Gly Phe Glu Pro Tyr Phe
            100                 105                 110
Tyr Ile Cys Cys Pro Pro Gly Met Gly Pro Asp Asp Ile Ser His Phe
        115                 120                 125
His Gln Thr Leu Glu Gly Arg Met Arg Glu Ala Asn Arg Asn Ser Asn
    130                 135                 140
Val Gly Lys Phe Val Arg Arg Ile Glu Met Val Gln Arg Arg Ser Ile
145                 150                 155                 160
Met Tyr Tyr Gln Gln Ser Asn Ser Gln Pro Phe Leu Lys Ile Val Val
                165                 170                 175
Ala Leu Pro Thr Met Val Ala Ser Cys Arg Gly Ile Leu Asp Arg Gly
            180                 185                 190
Ile Gln Leu Asp Gly Leu Gly Met Lys Ser Phe Leu Thr Tyr Glu Ser
        195                 200                 205
Asn Val Leu Phe Ala Leu Arg Phe Met Ile Asp Cys Asn Ile Val Gly
     210                215                 220
Gly Asn Trp Ile Gly Ile Pro Ala Gly Lys Tyr Lys Lys Thr Ala Lys
225                 230                 235                 240
Ser Leu Ser Tyr Cys Gln Leu Glu Phe Asp Cys Leu Tyr Ser Glu Leu
                245                 250                 255
Ile Ser His Ala Pro Glu Gly Glu Tyr Ser Lys Met Ala Pro Phe Arg
            260                 265                 270
Ile Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys Gly His Phe Pro
        275                 280                 285
Glu Pro Thr His Asp Pro Val Ile Gln Ile Ala Asn Leu Val Thr Leu
    290                 295                 300
Gln Gly Glu Asp Gln Pro Phe Ile Arg Asn Val Met Thr Leu Lys Ser
305                 310                 315                 320
Cys Ser Pro Ile Val Gly Val Asp Val Met Pro Phe Glu Thr Glu Arg
                325                 330                 335
Glu Val Leu Leu Ala Trp Arg Asp Phe Ile Arg Glu Val Asp Pro Asp
            340                 345                 350
Ile Ile Ile Gly Tyr Ash Ile Cys Lys Phe Asp Leu Pro Tyr Leu Ile
        355                 360                 365
Glu Arg Ala Leu Asn Leu Lys Ile Ala Glu Phe Pro Ile Leu Gly Arg
    370                 375                 380
lle Arg Asn Ser Arg Val Arg Val Lys Asp Thr Thr Phe Ser Ser Arg
385                 390                 395                 400
Gln Tyr Gly Thr Arg Glu Ser Lys Glu Val Ala Val Glu Gly Arg Val
                405                 410                 415
Thr Phe Asp Leu Leu Gln Val Met Gln Arg Asp Tyr Lys Leu Ser Ser
            420                 425                 430
Tyr Ser Leu Asn Ser Val Ser Ser His Phe Leu Ser Glu Gln Lys Glu
        435                 440                 445
Asp Val His His Ser Ile Ile Ser Asp Leu Gln Asn Gly Asn Ala Glu
    450                 455                 460
Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys Asp Ala Tyr Leu Pro
465                 470                 475                 480
Gln Arg Leu Leu Asp Lys Leu Met Phe Ile Tyr Asn Tyr Val Glu Met
                485                 490                 495
Ala Arg Val Thr Gly Val Pro Ile Ser Phe Leu Leu Ser Arg Gly Gln
            500                 505                 510
Ser Ile Lys Val Leu Ser Gln Leu Leu Arg Arg Ala Arg Gln Lys Asn
        515                 520                 525
Leu Val Ile Pro Asn Ala Lys Gln Ala Gly Ser Glu Gln Gly Thr Phe
    530                 535                 540
Glu Gly Ala Thr Val Leu Glu Ala Arg Ala Gly Phe Tyr Glu Lys Pro
545                 550                 555                 560
Ile Ala Thr Leu Asp Phe Ala Ser Leu Tyr Pro Ser Ile Met Met Ala
                565                 570                 575
Tyr Asn Leu Cys Tyr Cys Thr Leu Val Ile Pro Glu Asp Ala Arg Lys
            580                 585                 590
Leu Asn Ile Pro Pro Glu Ser Val Asn Arg Thr Pro Ser Gly Glu Thr
        595                 600                 605
Phe Val Lys Ser Asn Leu Gln Lys Gly Ile Leu Pro Glu Ile Leu Glu
    610                 615                 620
Glu Leu Leu Thr Ala Arg Lys Arg Ala Lys Ala Asp Leu Lys Glu Ala
625                 630                 635                 640
Lys Asp Pro Leu Glu Lys Ala Val Leu Asp Gly Arg Gln Leu Ala Leu
                645                 650                 655
Lys Ile Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala Thr Ile Gly
            660                 665                 670
Gln Leu Pro Cys Leu Glu Ile Ser Ser Ser Val Thr Ser Tyr Gly Arg
        675                 680                 685
Gln Met Ile Glu His Thr Lys Lys Leu Val Glu Asp Lys Phe Thr Thr
    690                 695                 700
Leu Asn Gly Tyr Glu His Asn Ala Glu Val Ile Tyr Gly Asp Thr Asp
705                 710                 715                 720
Ser Val Met Val Gln Phe Gly Val Ser Ala Val Glu Glu Ala Met Asn
                725                 730                 735
Leu Gly Arg Glu Ala Ala Glu His Ile Ser Gly Thr Phe Thr Lys Pro
            740                 745                 750
Ile Lys Leu Glu Phe Glu Lys Val Tyr Tyr Pro Tyr Leu Leu Ile Ser
        755                 760                 765
Lys Lys Arg Tyr Ala Gly Leu Phe Trp Thr Lys Pro Asp Asn Phe Asp
    770                 775                 780
Lys Met Asp Thr Lys Gly Ile Glu Thr Val Arg Arg Asp Asn Cys Leu
785                 790                 795                 800
Leu Val Lys Asn Leu Val Asn Asp Cys Leu His Lys Ile Leu Ile Asp
                805                 810                 815
Arg Asp Ile Pro Gly Ala Val Gln Tyr Val Lys Asn Ala Ile Ser Asp
            820                 825                 830
Leu Leu Met Asn Arg Met Asp Leu Ser Leu Leu Val Ile Thr Lys Gly
        835                 840                 845
Leu Thr Lys Thr Gly Asp Asp Tyr Glu Val Lys Ala Ala His Val Glu
     850                855                 860
Leu Ala Glu Arg Met Arg Lys Arg Asp Ala Ala Thr Ala Pro Asn Val
865                 870                 875                 880
Gly Asp Arg Val Pro Tyr Val Ile Ile Lys Ala Ala Lys Gly Ala Lys
                885                 890                 895
Ala Tyr Glu Arg Ser Glu Asp Pro Ile Tyr Val Leu Glu Asn Asn Ile
            900                 905                 910
Pro Ile Asp Pro His Tyr Tyr Leu Glu Asn Gln Ile Ser Lys Pro Ile
        915                 920                 925
Leu Arg Ile Phe Glu Pro Ile Leu Lys Asn Ala Ser Lys Glu Leu Leu
    930                 935                 940
His Gly Ser His Thr Arg Ser Ile Ser Ile Ser Thr Pro Ser Asn Ser
945                 950                 955                 960
Gly Ile Leu Arg Phe Ala Lys Lys Gln Leu Pro Ala Leu Val Val Lys
                965                 970                 975
Leu Tyr Leu Ala Arg Val Ile Thr Leu Ser Val His Ile Ala Lys Glu
            980                 985                 990
Gly Arg Leu Ser Cys Thr Val Lys Gln Tyr Leu Lys Cys Leu Ser Trp
        995                1000                1005
Arg Cys Phe Leu Gly Gly Cys Gly His Ser Val Arg Ser Ala Lys Val
   1010                1015                1020
His Phe Ile Arg Met Phe Ser Ala Pro Val Gly Ile Val Gln Phe Ser
1025               1030                1035                1040
Ile Asp Glu Lys Arg His Arg Lys Ile Trp Val Lys Gln Ser Cys Asn
               1045                1050                1055
Trp Thr Asp Gly Thr Ser Lys Phe Cys Gln Glu Phe Asp Leu Ala Asp
           1060                1065                1070
Leu Phe Glu Pro Met Asp Thr Asn Thr Ile Trp Cys Leu Pro Gln Ser
       1075                1080                1085
<210>51
<211>3435
<212>DNA
<213>智人(Homo sapiens)
<400>51
acggcggcgt aggctgtggc gggaaacgct gtttgaagcg ggatggatgg caagcggcgg 60
ccaggcccag ggcccggggt gcccccaaag cgggcccgtg ggggcctctg ggatgatgat 120
gatgcacctc ggccatccca attcgaggag gacctggcac tgatggagga gatggaggca 180
gaacacaggc tgcaggagca ggaggaggag gagctgcagt cagtcctgga gggggttgca 240
gacgggcagg tcccaccatc agccatagat cctcgctggc ttcggcccac accaccagcg 300
ctggaccccc agacagagcc cctcatcttc caacagttgg agattgacca ttatgtgggc 360
ccagcgcagc ctgtgcctgg ggggccccca ccatcccacg gctccgtgcc tgtgctccgc 420
gccttcgggg tcaccgatga ggggttctct gtctgctgcc acatccacgg cttcgctccc 480
tacttctaca ccccagcgcc ccctggtttc gggcccgagc acatgggtga cctgcaacgg 540
gagctgaact tggccatcaa ccgggacagt cgcgggggga gggagctgac tgggccggcc 600
gtgctggctg tggaactgtg ctcccgagag agcatgtttg ggtaccacgg gcacggcccc 660
tccccgttcc tgcgcatcac cgtggcgctg ccgcgcctcg tggccccggc ccgccgtctc 720
ctggaacagg gcatccgtgt ggcaggcctg ggcacgccca gcttcgcgcc ctacgaggcc 780
aacgtcgact ttgagatccg gttcatggtg gacacggaca tcgtcggctg caactggctg 840
gagctcccag ccgggaaata cgccctgagg ctgaaggaga aggctacgca gtgccagctg 900
gaggcggaeg tgctgtggtc tgacgtggtc agtcacccac cggaagggcc atggcagcgc 960
attgcgccct tgcgcgtgct cagcttcgat atcgagtgcg ccggccgcaa aggcatcttc 1020
cctgagcctg agcgggaccc tgtcatccag atctgctcgc tgggcctgcg ctggggggag 1080
ccggagccct tcctacgcct ggcgctcacc ctgcggccct gtgcccccat cctgggtgcc 1140
aaggtgcaga gctacgagaa ggaggaggac ctgctgcagg cctggtccac cttcatccgt 1200
atcatggacc ccgatgtgat caccggttac aacatccaga acttcgacct tccgtacctc 1260
atctctcggg cccagaccct caaggtacaa acattccctt tcctgggccg tgtggccggc 1320
ctttgctcca acatccggga ctcttcattc cagtccaagc agacgggccg gcgggacacc 1380
aaggttgtca gcatggtggg ccgcgtgcag atggacatgc tgcaggtgct gctgcgggag 1440
tacaagctcc gctcctacac gctcaatgcc gtgagcttcc acttcctggg cgagcagaag 1500
gaggacgtgc agcacagcat catcaccgac ctgcagaatg ggaacgacca gacccgccgc 1560
cgcctggctg tgtactgcct aaaggatgct tacctgccac tgcggctgct ggagcggctc 1620
atggtgctgg tgaacgccgt ggagatggcg agggtcactg gcgtgcccct cagctacctg 1680
ctcagtcgtg gccagcaggt caaggtcgta tcccagctgt tgcggcaggc catgcacgag 1740
gggctgctga tgcccgtggt gaagtcagag ggcggcgagg actacacggg agccactgtc 1800
attgagcccc tcaaagggta ctacgacgtc cccatcgcca ccctggactt ctcctcgctg 1860
tacccgtcca tcatgatggc ccacaacctg tgttacacca cactccttcg gcccgggact 1920
gcacagaaac tgggcctgac tgaggatcag ttcatcagga cccccaccgg ggacgagttt 1980
gtgaagacct cagtgcgtaa ggggctgctg ccccagatcc tggagaacct gctcagtgcc 2040
cggaagaggg ccaaggccga gctggccaag gagacagacc ccctccggcg ccaggtcctg 2100
gatggacggc agctggcgct gaaggtgagc gccaactccg tatacggctt cactggcgcc 2160
caggtgggca agttgccgtg cctggagatc tcacagagcg tcacggggtt cggacgtcag 2220
atgatcgaga aaaccaagca gctggtggag tctaagtaca cagtggagaa tggctacagc 2280
accagcgcca aggtggtgta tggtgacact gactccgtca tgtgccgatt cggcgtgtcc 2340
tcggtggctg aggcgatggc cctgggcggg gaggccgcgg actgggtgtc aggtcacttc 2400
ccgtcgccca tccggctgga gtttgagaag gtctacttcc catacctgct tatcagcaag 2460
aagcgctacg cgggcctgct cttctcctcc cggcccgacg cccacgaccg catggactgc 2520
aagggcctgg aggcggtgcg cagggacaac tgccccctcg tggccaacct ggtcactgcc 2580
tcactgcgcc gcctgctcat cgaccgagac cctgagggcg cggtggctca cgcacaggac 2640
gtcatctcgg acctgctgtg caaccgcatc gatatctccc agctggtcat caccaaggag 2700
ctgacccgcg cggcctccga ctatgccggc aagcaggccc acgtggagct ggccgagagg 2760
atgaggaagc gggaccccgg gagtgcgccc agcctgggcg accgcgtccc ctacgtgatc 2820
atcagtgccg ccaagggtgt ggccgcctac atgaagtcgg aggacccgct gttcgtgctg 2880
gagcacagcc tgcccattga cacgcagtac tacctggagc agcagctggc caagcccctc 2940
ctgcgcatct tcgagcccat cctgggcgag ggccgtgccg aggctgtgct actgcggggg 3000
gaccacacgc gctgcaagac ggtgctcacg ggcaaggtgg gcggcctcct ggccttcgcc 3060
aaaegccgca actgctgcat tggctgccgc acagtgctca gccaccaggg agccgtgtgt 3120
gagttctgcc agccccggga gtctgagctg tatcagaagg aggtatccca tctgaatgcc 3180
ctggaggagc gcttctcgcg cctctggacg cagtgccagc gctgccaggg cagcctgcac 3240
gaggacgtca tctgcaccag ccgggactgc cccatcttct acatgcgcaa gaaggtgcgg 3300
aaggacctgg aagaccagga gcagctcctg cggcgcttcg gaccccctgg acctgaggcc 3360
tggtgacctt gcaagcatcc catggggcgg gggcgggacc agggagaatt aataaagttc 3420
tggacttttg ctaca                                                  3435
<210>52
<211>1107
<212>PRT
<213>智人(Homo sapiens)
<400>52
Met Asp Gly Lys Arg Arg Pro Gly Pro Gly Pro Gly Val Pro Pro Lys
  1               5                  10                  15
Arg Ala Arg Gly Gly Leu Trp Asp Asp Asp Asp Ala Pro Arg Pro Ser
             20                  25                  30
Gln Phe Glu Glu Asp Leu Ala Leu Met Glu Glu Met Glu Ala Glu His
         35                  40                  45
Arg Leu Gln Glu Gln Glu Glu Glu Glu Leu Gln Ser Val Leu Glu Gly
     50                  55                  60
Val Ala Asp Gly Gln Val Pro Pro Ser Ala Ile Asp Pro Arg Trp Leu
 65                  70                  75                  80
Arg Pro Thr Pro Pro Ala Leu Asp Pro Gln Thr Glu Pro Leu Ile Phe
                 85                  90                  95
Gln Gln Leu Glu Ile Asp His Tyr Val Gly Pro Ala Gln Pro Val Pro
            100                 105                 110
Gly Gly Pro Pro Pro Ser His Gly Ser Val Pro Val Leu Arg Ala Phe
        115                 120                 125
Gly Val Thr Asp Glu Gly Phe Ser Val Cys Cys His Ile His Gly Phe
    130                 135                 140
Ala Pro Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Pro Glu His
145                 150                 155                 160
Met Gly Asp Leu Gln Arg Glu Leu Asn Leu Ala Ile Asn Arg Asp Ser
                165                 170                 175
Arg Gly Gly Arg Glu Leu Thr Gly Pro Ala Val Leu Ala Val Glu Leu
            180                 185                 190
Cys Ser Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro
        195                 200                 205
Phe Leu Arg Ile Thr Val Ala Leu Pro Arg Leu Val Ala Pro Ala Arg
    210                 215                 220
Arg Leu Leu Glu Gln Gly Ile Arg Val Ala Gly Leu Gly Thr Pro Ser
225                 230                 235                 240
Phe Ala Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val
                245                 250                 255
Asp Thr Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys
            260                 265                 270
Tyr Ala Leu Arg Leu Lys Glu Lys Ala Thr Gln Cys Gln Leu Glu Ala
        275                 280                 285
Asp Val Leu Trp Ser Asp Val Val Ser His Pro Pro Glu Gly Pro Trp
    290                 295                 300
Gln Arg Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala
305                 310                 315                 320
Gly Arg Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln
                325                 330                 335
Ile Cys Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg
            340                 345                 350
Leu Ala Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val
        355                 360                 365
Gln Ser Tyr Glu Lys Glu Glu Asp Leu Leu Gln Ala Trp Ser Thr Phe
    370                 375                 380
Ile Arg Ile Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn
385                 390                 395                 400
Phe Asp Leu Pro Tyr Leu Ile Ser Arg Ala Gln Thr Leu Lys Val Gln
                405                 410                 415
Thr Phe Pro Phe Leu Gly Arg Val Ala Gly Leu Cys Ser Asn Ile Arg
            420                 425                 430
Asp Ser Ser Phe Gln Ser Lys Gln Thr Gly Arg Arg Asp Thr Lys Val
        435                 440                 445
Val Ser Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu
    450                 455                 460
Arg Glu Tyr Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His
465                 470                 475                 480
Phe Leu Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp
                485                 490                 495
Leu Gln Ash Gly Asn Asp Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys
            500                 505                 510
Leu Lys Asp Ala Tyr Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val
        515                 520                 525
Leu Val Asn Ala Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Ser
    530                 535                 540
Tyr Leu Leu Ser Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu
545                 550                 555                 560
Arg Gln Ala Met His Glu Gly Leu Leu Met Pro Val Val Lys Ser Glu
                565                 570                 575
Gly Gly Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly
            580                 585                 590
Tyr Tyr Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro
        595                 600                 605
Ser Ile Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro
    610                 615                 620
Gly Thr Ala Gln Lys Leu Gly Leu Thr Glu Asp Gln Phe Ile Arg Thr
625                 630                 635                 640
Pro Thr Gly Asp Glu Phe Val Lys Thr Ser Val Arg Lys Gly Leu Leu
                645                 650                 655
Pro Gln Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala
            660                 665                 670
Glu Leu Ala Lys Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly
        675                 680                 685
Arg Gln Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr
    690                 695                 700
Gly Ala Gln Val Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val
705                 710                 715                 720
Thr Gly Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu
                725                 730                 735
Ser Lys Tyr Thr Val Glu Asn Gly Tyr Ser Thr Ser Ala Lys Val Val
            740                 745                 750
Tyr Gly Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val
        755                 760                 765
Ala Glu Ala Met Ala Leu Gly Gly Glu Ala Ala Asp Trp Val Ser Gly
    770                 775                 780
His Phe Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro
785                 790                 795                 800
Tyr Leu Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser
                805                 810                 815
Arg Pro Asp Ala His Asp Arg Met Asp Cys Lys Gly Leu Glu Ala Val
            820                 825                 830
Arg Arg Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ala Ser Leu
        835                 840                 845
Arg Arg Leu Leu Ile Asp Arg Asp Pro Glu Gly Ala Val Ala His Ala
    850                 855                 860
Gln Asp Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln
865                 870                 875                 880
Leu Val Ile Thr Lys Glu Leu Thr Arg Ala Ala Ser Asp Tyr Ala Gly
                885                 890                 895
Lys Gln Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro
            900                 905                 910
Gly Ser Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Ser
        915                 920                 925
Ala Ala Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe
    930                 935                 940
Val Leu Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln
945                 950                 955                 960
Gln Leu Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu
                965                 970                 975
Gly Arg Ala Glu Ala Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys
            980                 985                 990
Thr Val Leu Thr Gly Lys Val Gly Gly Leu Leu Ala Phe Ala Lys Arg
        995                1000                1005
Arg Asn Cys Cys Ile Gly Cys Arg Thr Val Leu Ser His Gln Gly Ala
   1010                1015                1020
Val Cys Glu Phe Cys Gln Pro Arg Glu Ser Glu Leu Tyr Gln Lys Glu
1025               1030                1035                1040
Val Ser His Leu Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr
               1045                1050                1055
Gln Cys Gln Arg Cys Gln Gly Ser Leu His Glu Asp Val Ile Cys Thr
           1060                1065                1070
Ser Arg Asp Cys Pro Ile Phe Tyr Met Arg Lys Lys Val Arg Lys Asp
       1075                1080                1085
Leu Glu Asp Gln Glu Gln Leu Leu Arg Arg Phe Gly Pro Pro Gly Pro
   1090                1095                1100
Glu Ala Trp
1105
<210>53
<211>6912
<212>DNA
<213>智人(Homo sapiens)
<400>53
cgccaaattt ctcccctgaa gcagaggtgg tagccaacgg ctccatgtct ctgaggagcg 60
gcgggcggcg gcgcgcggac ccaggcgcgg atggcgaggc cagcagggat gatggcgcca 120
cttcctcagt ttcggcactc aagcgcctgg aacggagtca gtggacggat aagatggatt 180
tgcggtttgg ttttgagcgg ctgaaggagc ctggtgagaa gacaggctgg ctcattaaca 240
tgcatcctac cgagatttta gatgaagata agcgcttagg cagtgcagtg gattactact 300
ttattcaaga tgacggaagc agatttaagg tggctttgcc ctataaaccg tatttctaca 360
ttgcgaccag aaagggttgt gagcgagaag tttcatcttt tctctccaag aagtttcagg 420
gcaaaattgc aaaagtggag actgtcccca aagaggatct ggacttgcca aatcacttgg 480
tgggtttgaa gcgaaattac atcaggctgt ccttccacac tgtggaggat cttgtcaaag 540
tgaggaagga gatctcccct gccgtgaaga agaacaggga gcaggatcac gccagcgacg 600
cgtacacagc tctgctttcc agtgttctgc agaggggcgg tgtcattact gatgaagagg 660
aaacctctaa gaagatagct gaccagttgg acaacattgt ggacatgcgc gagtacgatg 720
ttccctacca catccgcctc tccattgacc tgaagatcca cgtggctcat tggtacaatg 780
tcagataccg aggaaatgct tttccggtag aaatcacccg ccgagatgac cttgttgaac 840
gacctgaccc tgtggttttg gcatttgaca ttgagacgac caaactgccc ctcaagtttc 900
ctgatgctga gacagaccag attatgatga tttcctacat gatcgatggc cagggctacc 960
tcatcaccaa cagggagatt gtttcagaag atattgaaga ttttgagttc acccccaagc 1020
cagaatatga aggccccttt tgtgtcttca atgaacccga tgaggctcat ctgatccaaa 1080
ggtggtttga acacgtccag gagaccaaac ccaccatcat ggtcacctac aacggggact 1140
tttttgactg gccatttgtg gaggcccggg cagcagtcca cggtctgagc atgcagcagg 1200
agataggctt ccagaaggac agccaggggg agtacaaggc gccccagtgc atccacatgg 1260
actgcctcag gtgggtgaag agggacagtt accttcctgt gggcagtcat aatctcaagg 1320
cggccgccaa ggccaagcta ggctatgatc ccgtggagct agacccggag gacatgtgcc 1380
ggatggccac ggagcagccc cagactctgg ccacgtattc tgtgtcagat gctgtcgcca 1440
cttactacct gtacatgaag tacgtccacc cattcatctt tgctctgtgc accattattc 1500
ccatggagcc cgacgaggtg ctgcggaagg gctctggcac tctgtgtgag gccttgctga 1560
tggtgcaggc cttccacgcc aacatcatct tccccaacaa gcaagagcag gagttcaata 1620
agctgacgga cgacggacac gtgctggact ctgagaccta cgtcgggggc cacgtggagg 1680
ccctcgagtc tggggttttc cgcagcgata tcccttgccg gtttaggatg aatcctgccg 1740
cctttgactt cctgctgcag cgggttgaga agaccttgcg ccacgccctt gaggaagagg 1800
agaaagtgcc tgtggagcaa gtcaccaact ttgaagaggt gtgtgatgag attaagagca 1860
agcttgcctc cctgaaggac gttcccagcc gcatcgagtg tccactcatc taccacctgg 1920
acgtgggggc catgtacccc aacatcatcc tgaccaaccg cctgcagccc tctgccatgg 1980
tggacgaagc cacctgtgct gcctgtgact tcaataagcc tggagcaaac tgccagcgga 2040
agatggcctg gcagtggagg ggcgagttca tgccagccag tcgcagcgaa taccatcgga 2100
tccagcacca gctggagtca gagaagttcc cccccttgtt cccagagggg ccagctcggg 2160
cctttcatga actgtcccgc gaggaacagg cgaaatacga gaagagaagg ctggcggatt 2220
actgccggaa agcctacaag aagatccaca tcaccaaggt ggaagagcgt ctcaccacca 2280
tctgccagcg ggaaaactcc ttctacgtgg acaccgtgcg tgccttccgg gacaggcgtt 2340
acgagttcaa agggctccac aaggtgtgga aaaagaagct ctcggcggcc gtggaggtgg 2400
gcgacgcggc tgaggtgaag cgctgcaaga acatggaggt gctgtatgac tcgctgcagc 2460
tggcccacaa gtgcatcctg aactccttct atggctatgt catgcgcaag ggggctcgct 2520
ggtactccat ggagatggct ggcatcgtct gcttcacagg ggccaacatc atcacccagg 2580
cacgggagct gatcgagcag attgggaggc ccttagagct ggacacagat ggtatatggt 2640
gcgtcctgcc caacagcttc ccagaaaatt ttgtcttcaa gacgaccaat gtgaagaagc 2700
ccaaagtgac catctcctac ccaggcgcca tgttgaacat catggtcaag gaaggcttca 2760
ccaatgacca gtaccaggag ctggctgagc cgtcctcact cacctacgtc acccgctcag 2820
agaacagcat cttttttgag gttgatgggc cctaccttgc catgattctt ccagcctcca 2880
aggaagaagg caagaaattg aagaagaggt atgctgtgtt caatgaagac ggttctctgg 2940
ctgagctcaa gggctttgag gtcaaacgcc gcggggaact gcagctgatt aagatcttcc 3000
aatcctcggt gtttgaggcc ttcctcaagg gcagcacgct ggaagaggtg tatggctctg 3060
tagccaaggt ggctgactac tggctggacg tgctgtacag caaggcagcc aacatgcctg 3120
actctgagct attcgagctc atctctgaga accgttccat gtctcggaag ctggaagatt 3180
acggggagca gaagtctaca tccatcagca cagcaaagcg cctggccgag ttcctgggag 3240
accagatggt caaggatgca gggctgagtt gccgctacat catctcccgc aagcccgagg 3300
gctcccctgt cacggagagg gccatcccac ttgccatttt ccaagcagag cccacggtga 3360
ggaagcactt tctccggaaa tggctcaaga gctcttccct tcaagacttt gatattcgag 3420
caattctgga ttgggactac tacattgagc ggctgggaag cgccatccag aagatcatca 3480
ccatccctgc ggccctgcag caggtaaaga acccagtgcc acgtgtcaaa caccccgact 3540
ggctgcacaa aaaactgctg gagaagaatg atgtctacaa gcagaagaag atcagtgagc 3600
tcttcaccct ggagggcagg agacaggtca cgatggccga ggcctcagaa gacagtccga 3660
ggccaagtgc tcctgacatg gaggacttcg gcctcgtaaa gctgcctcac ccagcagccc 3720
ctgtcactgt gaagaggaag cgagttcttt gggagagcca ggaggagtcc caggacctca 3780
cgccgactgt gccctggcag gaaatcttgg ggcagcctcc cgccctggga accagccagg 3840
aggaatggct tgtctggctc cggttccaca agaagaagtg gcagctgcag gcccggcagc 3900
gcctcgcccg caggaagagg cagcgtctgg agtcggcaga gggtgtgctc aggcccgggg 3960
ccatccggga tggtcctgcc acggggctgg ggagcttctt gcgaagaact gcccgcagca 4020
tcctggacct tccgtggcag attgtgcaga tcagcgagac cagccaggcc ggcctgttca 4080
ggctgtgggc gctcgttggc agtgacttgc actgcatcag gctgagcatc ccccgtgtgt 4140
tctacgtgaa ccagcgagtc gctaaagcgg aggagggtgc ttcgtatcgc aaggtaaatc 4200
gggtccttcc tcgctccaac atggtctaca atctctatga gtattcagtg ccagaggaca 4260
tgtaccagga acacatcaac gagatcaacg ctgagctgtc agcgccagac atcgagggcg 4320
tatatgagac tcaggttccg ttactgttcc gggccctggt gcacctgggc tgtgtgtgtg 4380
tggtcaataa acagctggtg aggcaccttt caggctggga agcagagacc tttgctcttg 4440
agcacctgga gatgcgctct ctggcccagt tcagctacct ggaaccaggg agtatccgcc 4500
atatctacct gtaccaccac gcacaggccc acaaagcgct cttcgggatc ttcatcccct 4560
cacagcgcag ggcatccgtc tttgtgctgg acactgtgcg cagcaaccag atgcccagcc 4620
ttggcgccct gtactcagca gagcacggcc tcctcctgga gaaggtgggc cctgagctcc 4680
tgccaccccc caaacacacc ttcgaagttc gggcagaaac tgacctgaag accatctgca 4740
gagccatcca gcgattcctg ctcgcctaca aggaggagcg ccgggggccc acactcatcg 4800
ctgttcagtc cagctgggag ctgaagaggc tggccagtga aattcctgtc ttggaggaat 4860
tcccactggt gcctatctgt gtggctgaca agatcaacta tggggtcctg gactggcagc 4920
gccatggagc ccggcgcatg atccgtcact acctcaacct ggacacctgc ctgtcgcagg 4980
ccttcgagat gagcaggtac tttcacattc ccattgggaa cctaccagag gacatctcca 5040
cattcggctc cgacctcttc tttgcccgcc acctccagcg ccacaaccac ctgctctggc 5100
tgtcccctac agcccgccct gacctgggtg gaaaggaggc tgatgacaac tgtcttgtca 5160
tggagttcga tgaccaagcc actgttgaga tcaacagttc aggctgttac tccacagtgt 5220
gtgtggagct ggaccttcag aacctggccg tcaacaccat tctccagtct caccatgtca 5280
acgacatgga gggggccgac agcatgggga tcagcttcga cgtgatccag caggcctccc 5340
tggaggacat gatcacgggt ggtcaggctg ccagtgcccc ggccagctac gatgagacag 5400
ccctgtgctc taacaccttc aggatcctga agagcatggt cgtgggctgg gtgaaggaga 5460
tcacccagta ccacaacatc tatgcagaca accaggtgat gcacttctac cgctggcttc 5520
ggtcgccatc ctctctgctt catgaccctg ccctgcaccg cacactccac aacatgatga 5580
agaagctctt cctgcagctc atcgctgagt tcaagcgcct ggggtcatca gtcatctacg 5640
ccaacttcaa ccgcatcatc ctctgtacaa agaagcgccg tgtggaagat gccatcgctt 5700
acgtggagta catcaccagc agcatccatt caaaggagac cttccattct ctgacaattt 5760
ctttctctcg atgctgggaa tttcttctct ggatggatcc atctaactat ggcggaatca 5820
aaggaaaagt ttcatctcgt attcactgtg gactgcaaga ctcccagaaa gcagggggag 5880
cagaggatga gcaggaaaat gaggacgatg aggaggaaag agatggggag gaggaggaag 5940
aggcggagga atccaacgtg gaggatttac tggaaaacaa ctggaacatt ttgcagtttt 6000
tgccacaggc agcctcctgc cagaactact tcctcatgat tgtttcagcg tacatcgtgg 6060
ccgtgtacca ctgcatgaag gacgggctga ggcgcagtgc tccagggagc acccccgtga 6120
ggaggagggg ggccagccag ctctcccagg aggccgaggg ggcggtcgga gcccttcccg 6180
gaatgatcac cttctctcag gattatgtcg caaatgagct cactcagagc ttcttcacca 6240
tcactcagaa gattcagaag aaagtcacag gctctcggaa ctccactgag ctctcagaga 6300
tgtttcctgt cctccccggt tcccacttgc tgctcaataa ccctgccctg gagttcatca 6360
aatacgtgtg caaggtgctg tccctggaca ccaacatcac aaaccaggtg aataagctga 6420
accgagacct gcttcgcctg gtggatgtcg gcgagttctc cgaggaggcc cagttccgag 6480
acccctgccg ctcctacgtg cttcctgagg tcatctgccg cagctgtaac ttctgccgcg 6540
acctggacct gtgtaaagac tcttccttct cagaggatgg ggcggtcctg cctcagtggc 6600
tctgctccaa ctgtcaggcg ccctacgact cctctgccat cgagatgacg ctggtggaag 6660
ttctacagaa gaagctgatg gccttcaccc tgcaggacct ggtctgcctg aagtgccgcg 6720
gggtgaagga gaccagcatg cctgtgtact gcacgtgcgc gggagacttc gccctcacca 6780
tccacaccca ggtcttcatg gaacagatcg gaatattccg gaacattgcc cagcactacg 6840
gcatgtcgta cctcctggag accctggagt ggctgctgca gaagaaccca cagctgggcc 6900
attagccagc cc                                                     6912
<210>54
<211>2286
<212>PRT
<213>智人(Homo sapiens)
<400>54
Met Ser Leu Arg Ser Gly Gly Arg Arg Arg Ala Asp Pro Gly Ala Asp
  1               5                  10                  15
Gly Glu Ala Ser Arg Asp Asp Gly Ala Thr Ser Ser Val Ser Ala Leu
             20                  25                  30
Lys Arg Leu Glu Arg Ser Gln Trp Thr Asp Lys Met Asp Leu Arg Phe
         35                  40                  45
Gly Phe Glu Arg Leu Lys Glu Pro Gly Glu Lys Thr Gly Trp Leu Ile
     50                  55                  60
Asn Met His Pro Thr Glu Ile Leu Asp Glu Asp Lys Arg Leu Gly Ser
 65                  70                  75                  80
Ala Val Asp Tyr Tyr Phe Ile Gln Asp Asp Gly Ser Arg Phe Lys Val
                 85                  90                  95
Ala Leu Pro Tyr Lys Pro Tyr Phe Tyr Ile Ala Thr Arg Lys Gly Cys
            100                 105                 110
Glu Arg Glu Val Ser Ser Phe Leu Ser Lys Lys Phe Gln Gly Lys Ile
        115                 120                 125
Ala Lys Val Glu Thr Val Pro Lys Glu Asp Leu Asp Leu Pro Asn His
    130                 135                 140
Leu Val Gly Leu Lys Arg Asn Tyr Ile Arg Leu Ser Phe His Thr Val
145                 150                 155                 160
Glu Asp Leu Val Lys Val Arg Lys Glu Ile Ser Pro Ala Val Lys Lys
                165                 170                 175
Asn Arg Glu Gln Asp His Ala Ser Asp Ala Tyr Thr Ala Leu Leu Ser
            180                 185                 190
Ser Val Leu Gln Arg Gly Gly Val Ile Thr Asp Glu Glu Glu Thr Ser
        195                 200                 205
Lys Lys Ile Ala Asp Gln Leu Asp Asn Ile Val Asp Met Arg Glu Tyr
     210                215                 220
Asp Val Pro Tyr His Ile Arg Leu Ser Ile Asp Leu Lys Ile His Val
225                 230                 235                 240
Ala His Trp Tyr Asn Val Arg Tyr Arg Gly Asn Ala Phe Pro Val Glu
                245                 250                 255
Ile Thr Arg Arg Asp Asp Leu Val Glu Arg Pro Asp Pro Val Val Leu
            260                 265                 270
Ala Phe Asp Ile Glu Thr Thr Lys Leu Pro Leu Lys Phe Pro Asp Ala
        275                 280                 285
Glu Thr Asp Gln Ile Met Met Ile Ser Tyr Met Ile Asp Gly Gln Gly
    290                 295                 300
Tyr Leu lle Thr Asn Arg Glu Ile Val Ser Glu Asp Ile Glu Asp Phe
305                 310                 315                 320
Glu Phe Thr Pro Lys Pro Glu Tyr Glu Gly Pro Phe Cys Val Phe Asn
                325                 330                 335
Glu Pro Asp Glu Ala His Leu Ile Gln Arg Trp Phe Glu His Val Gln
            340                 345                 350
Glu Thr Lys Pro Thr Ile Met Val Thr Tyr Asn Gly Asp Phe Phe Asp
        355                 360                 365
Trp Pro Phe Val Glu Ala Arg Ala Ala Val His Gly Leu Ser Met Gln
    370                 375                 380
Gln Glu Ile Gly Phe Gln Lys Asp Ser Gln Gly Glu Tyr Lys Ala Pro
385                 390                 395                 400
Gln Cys Ile His Met Asp Cys Leu Arg Trp Val Lys Arg Asp Ser Tyr
                405                 410                 415
Leu Pro Val Gly Ser His Asn Leu Lys Ala Ala Ala Lys Ala Lys Leu
            420                 425                 430
Gly Tyr Asp Pro Val Glu Leu Asp Pro Glu Asp Met Cys Arg Met Ala
        435                 440                 445
Thr Glu Gln Pro Gln Thr Leu Ala Thr Tyr Ser Val Ser Asp Ala Val
    450                 455                 460
Ala Thr Tyr Tyr Leu Tyr Met Lys Tyr Val His Pro Phe Ile Phe Ala
465                 470                 475                 480
Leu Cys Thr lle Ile Pro Met Glu Pro Asp Glu Val Leu Arg Lys Gly
                485                 490                 495
Ser Gly Thr Leu Cys Glu Ala Leu Leu Met Val Gln Ala Phe His Ala
            500                 505                 510
Asn Ile Ile Phe Pro Asn Lys Gln Glu Gln Glu Phe Asn Lys Leu Thr
        515                 520                 525
Asp Asp Gly His Val Leu Asp Ser Glu Thr Tyr Val Gly Gly His Val
    530                 535                 540
Glu Ala Leu Glu Ser Gly Val Phe Arg Ser Asp Ile Pro Cys Arg Phe
545                 550                 555                 560
Arg Met Asn Pro Ala Ala Phe Asp Phe Leu Leu Gln Arg Val Glu Lys
                565                 570                 575
Thr Leu Arg His Ala Leu Glu Glu Glu Glu Lys Val Pro Val Glu Gln
            580                 585                 590
Val Thr Asn Phe Glu Glu Val Cys Asp Glu Ile Lys Ser Lys Leu Ala
        595                 600                 605
Ser Leu Lys Asp Val Pro Ser Arg Ile Glu Cys Pro Leu Ile Tyr His
    610                 615                 620
Leu Asp Val Gly Ala Met Tyr Pro Asn Ile Ile Leu Thr Asn Arg Leu
625                 630                 635                 640
Gln Pro Ser Ala Met Val Asp Glu Ala Thr Cys Ala Ala Cys Asp Phe
                645                 650                 655
Asn Lys Pro Gly Ala Asn Cys Gln Arg Lys Met Ala Trp Gln Trp Arg
            660                 665                 670
Gly Glu Phe Met Pro Ala Ser Arg Ser Glu Tyr His Arg Ile Gln His
        675                 680                 685
Gln Leu Glu Ser Glu Lys Phe Pro Pro Leu Phe Pro Glu Gly Pro Ala
    690                 695                 700
Arg Ala Phe His Glu Leu Ser Arg Glu Glu Gln Ala Lys Tyr Glu Lys
705                 710                 715                 720
Arg Arg Leu Ala Asp Tyr Cys Arg Lys Ala Tyr Lys Lys Ile His Ile
                725                 730                 735
Thr Lys Val Glu Glu Arg Leu Thr Thr Ile Cys Gln Arg Glu Asn Ser
            740                 745                 750
Phe Tyr Val Asp Thr Val Arg Ala Phe Arg Asp Arg Arg Tyr Glu Phe
        755                 760                 765
Lys Gly Leu His Lys Val Trp Lys Lys Lys Leu Ser Ala Ala Val Glu
    770                 775                 780
Val Gly Asp Ala Ala Glu Val Lys Arg Cys Lys Asn Met Glu Val Leu
785                 790                 795                 800
Tyr Asp Ser Leu Gln Leu Ala His Lys Cys Ile Leu Asn Ser Phe Tyr
                805                 810                 815
Gly Tyr Val Met Arg Lys Gly Ala Arg Trp Tyr Ser Met Glu Met Ala
            820                 825                 830
Gly Ile Val Cys Phe Thr Gly Ala Asn Ile Ile Thr Gln Ala Arg Glu
        835                 840                 845
Leu Ile Glu Gln Ile Gly Arg Pro Leu Glu Leu Asp Thr Asp Gly Ile
    850                 855                 860
Trp Cys Val Leu Pro Asn Ser Phe Pro Glu Asn Phe Val Phe Lys Thr
865                 870                 875                 880
Thr Asn Val Lys Lys Pro Lys Val Thr Ile Ser Tyr Pro Gly Ala Met
                885                 890                 895
Leu Asn Ile Met Val Lys Glu Gly Phe Thr Asn Asp Gln Tyr Gln Glu
            900                 905                 910
Leu Ala Glu Pro Ser Ser Leu Thr Tyr Val Thr Arg Ser Glu Asn Ser
        915                 920                 925
Ile Phe Phe Glu Val Asp Gly Pro Tyr Leu Ala Met Ile Leu Pro Ala
    930                 935                 940
Ser Lys Glu Glu Gly Lys Lys Leu Lys Lys Arg Tyr Ala Val Phe Asn
945                 950                 955                 960
Glu Asp Gly Ser Leu Ala Glu Leu Lys Gly Phe Glu Val Lys Arg Arg
                965                 970                 975
Gly Glu Leu Gln Leu Ile Lys Ile Phe Gln Ser Ser Val Phe Glu Ala
            980                 985                 990
Phe Leu Lys Gly Ser Thr Leu Glu Glu Val Tyr Gly Ser Val Ala Lys
        995                1000                1005
Val Ala Asp Tyr Trp Leu Asp Val Leu Tyr Ser Lys Ala Ala Asn Met
   1010                1015                1020
Pro Asp Ser Glu Leu Phe Glu Leu Ile Ser Glu Asn Arg Ser Met Ser
1025               1030                1035                1040
Arg Lys Leu Glu Asp Tyr Gly Glu Gln Lys Ser Thr Ser Ile Ser Thr
               1045                1050                1055
Ala Lys Arg Leu Ala Glu Phe Leu Gly Asp Gln Met Val Lys Asp Ala
           1060                1065                1070
Gly Leu Ser Cys Arg Tyr Ile Ile Ser Arg Lys Pro Glu Gly Ser Pro
       1075                1080                1085
Val Thr Glu Arg Ala Ile Pro Leu Ala Ile Phe Gln Ala Glu Pro Thr
   1090                1095                1100
Val Arg Lys His Phe Leu Arg Lys Trp Leu Lys Ser Ser Ser Leu Gln
1105               1110                1115                1120
Asp Phe Asp Ile Arg Ala Ile Leu Asp Trp Asp Tyr Tyr Ile Glu Arg
               1125                1130                1135
Leu Gly Ser Ala Ile Gln Lys Ile Ile Thr Ile Pro Ala Ala Leu Gln
           1140                1145                1150
Gln Val Lys Asn Pro Val Pro Arg Val Lys His Pro Asp Trp Leu His
       1155                1160                1165
Lys Lys Leu Leu Glu Lys Asn Asp Val Tyr Lys Gln Lys Lys Ile Ser
   1170                1175                1180
Glu Leu Phe Thr Leu Glu Gly Arg Arg Gln Val Thr Met Ala Glu Ala
1185               1190                1195                1200
Ser Glu Asp Ser Pro Arg Pro Ser Ala Pro Asp Met Glu Asp Phe Gly
               1205                1210                1215
Leu Val Lys Leu Pro His Pro Ala Ala Pro Val Thr Val Lys Arg Lys
           1220                1225                1230
Arg Val Leu Trp Glu Ser Gln Glu Glu Ser Gln Asp Leu Thr Pro Thr
       1235                1240                1245
Val Pro Trp Gln Glu Ile Leu Gly Gln Pro Pro Ala Leu Gly Thr Ser
   1250                1255                1260
Gln Glu Glu Trp Leu Val Trp Leu Arg Phe His Lys Lys Lys Trp Gln
1265               1270                1275                1280
Leu Gln Ala Arg Gln Arg Leu Ala Arg Arg Lys Arg Gln Arg Leu Glu
               1285                1290                1295
Ser Ala Glu Gly Val Leu Arg Pro Gly Ala Ile Arg Asp Gly Pro Ala
           1300                1305                1310
Thr Gly Leu Gly Ser Phe Leu Arg Arg Thr Ala Arg Ser Ile Leu Asp
       1315                1320                1325
Leu Pro Trp Gln Ile Val Gln Ile Ser Glu Thr Ser Gln Ala Gly Leu
   1330                1335                1340
Phe Arg Leu Trp Ala Leu Val Gly Ser Asp Leu His Cys lle Arg Leu
1345               1350                1355                1360
Ser Ile Pro Arg Val Phe Tyr Val Asn Gln Arg Val Ala Lys Ala Glu
               1365                1370                1375
Glu Gly Ala Ser Tyr Arg Lys Val Asn Arg Val Leu Pro Arg Ser Asn
           1380                1385                1390
Met Val Tyr Asn Leu Tyr Glu Tyr Ser Val Pro Glu Asp Met Tyr Gln
       1395                1400                1405
Glu His Ile Asn Glu Ile Asn Ala Glu Leu Ser Ala Pro Asp Ile Glu
   1410                1415                1420
Gly Val Tyr Glu Thr Gln Val Pro Leu Leu Phe Arg Ala Leu Val His
1425               1430                1435                1440
Leu Gly Cys Val Cys Val Val Asn Lys Gln Leu Val Arg His Leu Ser
               1445                1450                1455
Gly Trp Glu Ala Glu Thr Phe Ala Leu Glu His Leu Glu Met Arg Ser
           1460                1465                1470
Leu Ala Gln Phe Ser Tyr Leu Glu Pro Gly Ser Ile Arg His Ile Tyr
       1475                1480                1485
Leu Tyr His His Ala Gln Ala His Lys Ala Leu Phe Gly Ile Phe lle
   1490                1495                1500
Pro Ser Gln Arg Arg Ala Ser Val Phe Val Leu Asp Thr Val Arg Ser
1505               1510                1515                1520
Asn Gln Met Pro Ser Leu Gly Ala Leu Tyr Ser Ala Glu His Gly Leu
               1525                1530                1535
Leu Leu Glu Lys Val Gly Pro Glu Leu Leu Pro Pro Pro Lys His Thr
           1540                1545                1550
Phe Glu Val Arg Ala Glu Thr Asp Leu Lys Thr Ile Cys Arg Ala Ile
       1555                1560                1565
Gln Arg Phe Leu Leu Ala Tyr Lys Glu Glu Arg Arg Gly Pro Thr Leu
   1570                1575                1580
Ile Ala Val Gln Ser Ser Trp Glu Leu Lys Arg Leu Ala Ser Glu Ile
1585               1590                1595                1600
Pro Val Leu Glu Glu Phe Pro Leu Val Pro Ile Cys Val Ala Asp Lys
               1605                1610                1615
Ile Asn Tyr Gly Val Leu Asp Trp Gln Arg His Gly Ala Arg Arg Met
           1620                1625                1630
Ile Arg His Tyr Leu Asn Leu Asp Thr Cys Leu Ser Gln Ala Phe Glu
       1635                1640                1645
Met Ser Arg Tyr Phe His Ile Pro Ile Gly Asn Leu Pro Glu Asp Ile
   1650                1655                1660
Ser Thr Phe Gly Ser Asp Leu Phe Phe Ala Arg His Leu Gln Arg His
1665               1670                1675                1680
Asn His Leu Leu Trp Leu Ser Pro Thr Ala Arg Pro Asp Leu Gly Gly
               1685                1690                1695
Lys Glu Ala Asp Asp Asn Cys Leu Val Met Glu Phe Asp Asp Gln Ala
           1700                1705                1710
Thr Val Glu Ile Asn Ser Ser Gly Cys Tyr Ser Thr Val Cys Val Glu
       1715                1720                1725
Leu Asp Leu Gln Asn Leu Ala Val Asn Thr Ile Leu Gln Ser His His
   1730                1735                1740
Val Asn Asp Met Glu Gly Ala Asp Ser Met Gly Ile Ser Phe Asp Val
1745               1750                1755                1760
Ile Gln Gln Ala Ser Leu Glu Asp Met Ile Thr Gly Gly Gln Ala Ala
               1765                1770                1775
Ser Ala Pro Ala Ser Tyr Asp Glu Thr Ala Leu Cys Ser Asn Thr Phe
           1780                1785                1790
Arg Ile Leu Lys Ser Met Val Val Gly Trp Val Lys Glu Ile Thr Gln
       1795                1800                1805
Tyr His Asn Ile Tyr Ala Asp Asn Gln Val Met His Phe Tyr Arg Trp
   1810                1815                1820
Leu Arg Ser Pro Ser Ser Leu Leu His Asp Pro Ala Leu His Arg Thr
1825               1830                1835                1840
Leu His Asn Met Met Lys Lys Leu Phe Leu Gln Leu Ile Ala Glu Phe
               1845                1850                1855
Lys Arg Leu Gly Ser Ser Val Ile Tyr Ala Asn Phe Asn Arg Ile Ile
           1860                1865                1870
Leu Cys Thr Lys Lys Arg Arg Val Glu Asp Ala Ile Ala Tyr Val Glu
       1875                1880                1885
Tyr Ile Thr Ser Ser Ile His Ser Lys Glu Thr Phe His Ser Leu Thr
   1890                1895                1900
Ile Ser Phe Ser Arg Cys Trp Glu Phe Leu Leu Trp Met Asp Pro Ser
1905               1910                1915                1920
Asn Tyr Gly Gly Ile Lys Gly Lys Val Ser Ser Arg Ile His Cys Gly
               1925                1930                1935
Leu Gln Asp Ser Gln Lys Ala Gly Gly Ala Glu Asp Glu Gln Glu Asn
           1940                1945                1950
Glu Asp Asp Glu Glu Glu Arg Asp Gly Glu Glu Glu Glu Glu Ala Glu
       1955                1960                1965
Glu Ser Asn Val Glu Asp Leu Leu Glu Asn Asn Trp Asn Ile Leu Gln
   1970                1975                1980
Phe Leu Pro Gln Ala Ala Ser Cys Gln Asn Tyr Phe Leu Met Ile Val
1985               1990                1995                2000
Ser Ala Tyr Ile Val Ala Val Tyr His Cys Met Lys Asp Gly Leu Arg
               2005                2010                2015
Arg Ser Ala Pro Gly Ser Thr Pro Val Arg Arg Arg Gly Ala Ser Gln
           2020                2025                2030
Leu Ser Gln Glu Ala Glu Gly Ala Val Gly Ala Leu Pro Gly Met Ile
       2035                2040                2045
Thr Phe Ser Gln Asp Tyr Val Ala Asn Glu Leu Thr Gln Ser Phe Phe
   2050                2055                2060
Thr Ile Thr Gln Lys Ile Gln Lys Lys Val Thr Gly Ser Arg Asn Ser
2065               2070                2075                2080
Thr Glu Leu Ser Glu Met Phe Pro Val Leu Pro Gly Ser His Leu Leu
               2085                2090                2095
Leu Asn Asn Pro Ala Leu Glu Phe Ile Lys Tyr Val Cys Lys Val Leu
           2100                2105                2110
Ser Leu Asp Thr Asn Ile Thr Asn Gln Val Asn Lys Leu Asn Arg Asp
       2115                2120                2125
Leu Leu Arg Leu Val Asp Val Gly Glu Phe Ser Glu Glu Ala Gln Phe
   2130                2135                2140
Arg Asp Pro Cys Arg Ser Tyr Val Leu Pro Glu Val Ile Cys Arg Ser
2145               2150                2155                2160
Cys Asn Phe Cys Arg Asp Leu Asp Leu Cys Lys Asp Ser Ser Phe Ser
               2165                2170                2175
Glu Asp Gly Ala Val Leu Pro Gln Trp Leu Cys Ser Asn Cys Gln Ala
           2180                2185                2190
Pro Tyr Asp Ser Ser Ala Ile Glu Met Thr Leu Val Glu Val Leu Gln
       2195                2200                2205
Lys Lys Leu Met Ala Phe Thr Leu Gln Asp Leu Val Cys Leu Lys Cys
   2210                2215                2220
Arg Gly Val Lys Glu Thr Ser Met Pr0 Val Tyr Cys Thr Cys Ala Gly
2225               2230                2235                2240
Asp Phe Ala Leu Thr Ile His Thr Gln Val Phe Met Glu Gln Ile Gly
               2245                2250                2255
Ile Phe Arg Asn Ile Ala Gln His Tyr Gly Met Ser Tyr Leu Leu Glu
           2260                2265                2270
Thr Leu Glu Trp Leu Leu Gln Lys Asn Pro Gln Leu Gly His
       2275                2280                2285
<210>55
<211>3390
<212>DNA
<213>小鼠(Mus musculus)
<400>55
atcttgtggc gggaaaagct gtttgaggcg atggattgta agcggcgaca aggaccaggc 60
cctggggtgc ccccaaagcg ggctcgaggg cacctctggg atgaggacga gccttcgccg 120
tcgcagtttg aggcgaacct ggcactgctg gaggaaatag aggctgagaa ccggctgcag 180
gaggcagagg aggagctgca gctgccccca gagggcaccg tgggtgggca gttttccact 240
gcagacattg accctcggtg gcggcggccc accctacgtg ccctggaccc cagcacggag 300
cccctcatct tccagcagct ggagattgac cactatgtgg gctcagcacc acccctgcca 360
gaacggcccc tgccatcccg gaactcagtg cccatactga gggcctttgg ggtcaccgat 420
gaaggcttct ccgtctgctg ccacatacag ggctttgccc cctacttcta cacccccgcg 480
cctcctggtt ttggggccga gcacctgagt gagctgcagc aggagctgaa cgcagccatc 540
agccgggacc agcgcggtgg gaaggagctc tcagggccgg cagtgctggc aatagagcta 600
tgctcccgtg agagcatgtt tgggtaccac ggtcatggcc cttctccatt tctccgcatc 660
accctggcac taccccgcct tatggcacca gcccgccgcc ttctggaaca gggtgtccga 720
gtgccaggcc tgggcacccc gagcttcgca ccctacgaag ccaacgtgga ctttgagatc 780
cggttcatgg tggatgctga cattgtggga tgcaactggt tggagctgcc agctggaaag 840
tacgttcgga gggcggagaa gaaggccacc ctgtgtcagc tggaggtgga cgtgctgtgg 900
tcagatgtga tcagtcaccc accggagggg cagtggcagc gcattgcacc cctgcgtgtg 960
cttagcttcg acatcgagtg tgctggccga aaaggcatct tccctgagcc tgagcgtgac 1020
cccgtgatcc agatctgttc tctggggctg cgctgggggg agccggagcc attcttgcgt 1080
ctggcactca cgctgcggcc ctgtgccccc atcctgggtg ccaaagtgca gagctatgag 1140
cgggaagaag acctgctcca ggcctgggcc gacttcatcc ttgccatgga ccctgacgtg 1200
atcaccggct acaacattca gaactttgac ctcccatacc tcatctctcg ggcacaggcc 1260
ctaaaggtgg accgcttccc tttcctgggc cgcgtgactg gtctccgctc caacatccgt 1320
gactcctcct tccaatcaag gcaggtcggc cggcgggaca gtaaggtgat cagcatggtg 1380
ggtcgcgttc agatggatat gctgcaggtg ctgcttcggg aacacaagct ccgctcctac 1440
acgctcaacg ctgtgagttt ccacttcctg ggcgagcaga aggaggacgt tcagcacagc 1500
atcatcaccg acctgcagaa tgggaacgaa cagacgcgcc gccgcctggc cgtgtactgc 1560
ctgaaggacg cctttctgcc actccgacta ctagagcgcc ttatggtgct ggtgaacaat 1620
gtggagatgg cgcgtgtcac cggtgtaccc cttgggtacc tgctcacccg gggccagcag 1680
gtcaaggtcg tgtctcagct gctgcgccag gccatgcgcc aggggctgct gatgcctgtg 1740
gtgaagaccg agggcggtga ggactacacg ggagccacag tcattgagcc cctcaaaggg 1800
tactatgacg tccccattgc caccctggac ttctcctcct tgtacccatc catcatgatg 1860
gcccataatc tgtgctacac cacgctgctc cgacctgggg ctgcccagaa gctgggcctt 1920
aaaccagatg agttcatcaa gacacccact ggggatgagt ttgtgaagtc atctgtacgg 1980
aagggcctcc tgccccagat cctggagaat ctgctgagtg cccgcaagag ggccaaggct 2040
gagctggctc aggagacgga ccccctgcgg cgacaggtct tggacggccg gcaactggca 2100
ctaaaagtga gtgccaactc cgtatatggc ttcactggtg cccaggtggg caagctgcca 2160
tgtttggaaa tctcccagag tgtcactggg ttcgggcggc agatgattga gaaaaccaag 2220
cagcttgtgg agtccaagta caccgtggaa aatggctacg atgccaacgc caaggtagtc 2280
tacggtgaca cggactctgt gatgtgccgg tttggcgtct cctctgtggc tgaagcaatg 2340
tctctggggc gggaggctgc aaactgggta tccagtcact tcccatcacc catccggctg 2400
gagttcgaga aggtttactt cccatacctg ctcatcagca agaagcgcta tgctggcctg 2460
ctcttctcct cccgctctga tgcccatgac aaaatggact gcaagggcct ggaggctgtg 2520
cgcagggaca actgtcccct ggtggccaac ctcgttacat cctccctgcg ccggatcctc 2580
gtggaccggg accctgatgg ggcagtagcc catgccaagg acgtcatctc ggacctgctg 2640
tgcaaccgca tagacatctc ccagctggtc atcaccaaag agttgacccg cgcagcagca 2700
gactatgctg gcaagcaggc tcacgtggag ctggctgaga ggatgaggaa gcgcgacccc 2760
ggcagtgcgc ccagcctggg tgaccgagtc ccctatgtga tcattggtgc tgctaagggt 2820
gtggccgcct acatgaagtc ggaggacccc ctgtttgtgc tggagcacag cctgcccatc 2880
gacactcagt actacctgga gcagcagctg gccaagccgc tcttgcgcat ctttgagccc 2940
atcctgggtg agggccgtgc agagtctgtg ctgctgcgcg gtgaccacac acgatgcaag 3000
actgtgctca ccagcaaggt gggcggcctc ttggccttca ccaagcgccg caactgttgc 3060
attggctgcc gctccgtaat cgaccatcaa ggagccgtgt gtaagttctg tcagccacgg 3120
gagtcggagc tctctcagaa ggaggtgtca cacctgaatg ccttggaaga acggttctct 3180
cgcctctgga cacagtgtca acgctgccag ggcagcttgc atgaggacgt catctgtacc 3240
agccgtgact gtcccatctt ctacatgcgc aagaaggtgc gcaaggacct ggaagaccag 3300
gaacggctgc tgcagcgctt tggaccgccc ggccctgagg cctggtgacc tgacacggga 3360
caaggaataa agttcagatc tttgctaaaa                                  3390
<210>56
<211>1105
<212>PRT
<213>小鼠(Mus musculus)
<400>56
Met Asp Cys Lys Arg Arg Gln Gly Pro Gly Pro Gly Val Pro Pro Lys
  1               5                  10                  15
Arg Ala Arg Gly His Leu Trp Asp Glu Asp Glu Pro Ser Pro Ser Gln
             20                  25                  30
Phe Glu Ala Asn Leu Ala Leu Leu Glu Glu Ile Glu Ala Glu Asn Arg
         35                  40                  45
Leu Gln Glu Ala Glu Glu Glu Leu Gln Leu Pro Pro Glu Gly Thr Val
     50                  55                  60
Gly Gly Gln Phe Ser Thr Ala Asp Ile Asp Pro Arg Trp Arg Arg Pro
 65                  70                  75                  80
Thr Leu Arg Ala Leu Asp Pro Ser Thr Glu Pro Leu Ile Phe Gln Gln
                 85                  90                  95
Leu Glu Ile Asp His Tyr Val Gly Ser Ala Pro Pro Leu Pro Glu Arg
            100                 105                  110
Pro Leu Pro Ser Arg Asn Ser Val Pro Ile Leu Arg Ala Phe Gly Val
        115                 120                 125
Thr Asp Glu Gly Phe Ser Val Cys Cys His Ile Gln Gly Phe Ala Pro
    130                 135                 140
Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Ala Glu His Leu Ser
145                 150                 155                 160
Glu Leu Gln Gln Glu Leu Asn Ala Ala Ile Ser Arg Asp Gln Arg Gly
                165                 170                 175
Gly Lys Glu Leu Ser Gly Pro Ala Val Leu Ala Ile Glu Leu Cys Ser
            180                 185                 190
Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe Leu
        195                 200                 205
Arg Ile Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg Leu
    210                 215                 220
Leu Glu Gln Gly Val Arg Val Pro Gly Leu Gly Thr Pro Ser Phe Ala
225                 230                 235                 240
Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val Asp Ala
                245                 250                 255
Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr Val
            260                 265                 270
Arg Arg Ala Glu Lys Lys Ala Thr Leu Cys Gln Leu Glu Val Asp Val
        275                 280                 285
Leu Trp Ser Asp Val Ile Ser His Pro Pro Glu Gly Gln Trp Gln Arg
    290                 295                 300
Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg
305                 310                 315                 320
Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile Cys
                325                 330                 335
Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu Ala
            340                 345                 350
Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln Ser
        355                 360                 365
Tyr Glu Arg Glu Glu Asp Leu Leu Gln Ala Trp Ala Asp Phe Ile Leu
    370                 375                 380
Ala Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe Asp
385                 390                 395                 400
Leu Pro Tyr Leu Ile Ser Arg Ala Gln Ala Leu Lys Val Asp Arg Phe
                405                 410                 415
Pro Phe Leu Gly Arg Val Thr Gly Leu Arg Ser Asn Ile Arg Asp Ser
            420                 425                 430
Ser Phe Gln Ser Arg Gln Val Gly Arg Arg Asp Ser Lys Val Ile Ser
        435                 440                 445
Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg Glu
    450                 455                 460
His Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe Leu
465                 470                 475                 480
Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu Gln
                485                 490                 495
Asn Gly Asn Glu Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys
            500                 505                 510
Asp Ala Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu Val
        515                 520                 525
Asn Asn Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr Leu
    530                 535                 540
Leu Thr Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg Gln
545                 550                 555                 560
Ala Met Arg Gln Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly Gly
                565                 570                 575
Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr Tyr
            580                 585                 590
Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser Ile
        595                 600                 605
Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly Ala
    610                 615                 620
Ala Gln Lys Leu Gly Leu Lys Pro Asp Glu Phe Ile Lys Thr Pro Thr
625                 630                 635                 640
Gly Asp Glu Phe Val Lys Ser Ser Val Arg Lys Gly Leu Leu Pro Gln
                645                 650                 655
Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu Leu
            660                 665                 670
Ala Gln Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg Gln
        675                 680                 685
Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala
    690                 695                 700
Gln Val Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr Gly
705                 710                 715                 720
Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Ser Lys
                725                 730                 735
Tyr Thr Val Glu Asn Gly Tyr Asp Ala Asn Ala Lys Val Val Tyr Gly
            740                 745                 750
Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala Glu
        755                 760                 765
Ala Met Ser Leu Gly Arg Glu Ala Ala Asn Trp Val Ser Ser His Phe
    770                 775                 780
Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu
785                 790                 795                 800
Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg Ser
                805                 810                 815
Asp Ala His Asp Lys Met Asp Cys Lys Gly Leu Glu Ala Val Arg Arg
            820                 825                 830
Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ser Ser Leu Arg Arg
        835                 840                 845
Ile Leu Val Asp Arg Asp Pro Asp Gly Ala Val Ala His Ala Lys Asp
    850                 855                 860
Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu Val
865                 870                 875                 880
Ile Thr Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys Gln
                885                 890                 895
Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly Ser
            900                 905                 910
Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Gly Ala Ala
        915                 920                 925
Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val Leu
    930                 935                 940
Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln Leu
945                 950                 955                 960
Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly Arg
                965                 970                 975
Ala Glu Ser Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr Val
            980                 985                 990
Leu Thr Ser Lys Val Gly Gly Leu Leu Ala Phe Thr Lys Arg Arg Asn
        995                1000                1005
Cys Cys Ile Gly Cys Arg Ser Val Ile Asp His Gln Gly Ala Val Cys
   1010                1015                1020
Lys Phe Cys Gln Pro Arg Glu Ser Glu Leu Ser Gln Lys Glu Val Ser
1025               1030                1035                1040
His Leu Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr Gln Cys
               1045                1050                1055
Gln Arg Cys Gln Gly Ser Leu His Glu Asp Val Ile Cys Thr Ser Arg
           1060                1065                1070
Asp Cys Pro Ile Phe Tyr Met Arg Lys Lys Val Arg Lys Asp Leu Glu
       1075                1080                1085
Asp Gln Glu Arg Leu Leu Gln Arg Phe Gly Pro Pro Gly Pro Glu Ala
   1090                1095                1100
Trp
1105
<210>57
<211>7119
<212>DNA
<213>小鼠(Mus musculus)
<400>57
gccaaattct ccccggagcc tgagggagct ttggagcgtc gcaatggtcc tgaggaacag 60
tggacggagg caccccgagc cgggcgcgga tggcgaaggc agccgggatg atggtccctc 120
ttcctcagtc tcagcactca agcgtctgga acggagccag tggacagaca agatggactt 180
acggtttggt ttcgaaaggc tgaaagagcc tggagaaagg actggctggc tgatcaacat 240
gcaccctact gagatcttag atgaagacaa acgcttagtc agcgcggtgg attactactt 300
cattcaagat gatggaagca gatttaaggt ggccttgccc tatatgccgt atttctacat 360
tgcagcgaga aagggttgtg atcgagaagt ttcatctttt ctatccaaga agtttcaggg 420
aaaaattgca aagttagaga atgtgcccaa agaagatctg gacttgccaa atcacttggt 480
gggcttgaag cggagttaca tcaagctgtc cttccacact gtggaggacc ttgtcaaagt 540
gagaaaggag atctctcctg ctgtgaagaa gaaccgagag caggaccatg ctagtgatga 600
gtatacaaca atgctctcca gtattctgca aggtggcagt gtaattactg atgaggagga 660
aacctctaag aagatagctg accaattgga caacatagtg gacatgcggg agtatgatgt 720
tccctaccac attcgcctct ccattgacct cagaatccat gtggcccact ggtacaatgt 780
tagatttcga ggaaatgctt ttcctgtgga aatcacccga cgagatgatc ttgtggaacg 840
acctgaccct gtggttttgg catttgacat cgagacgacc aaactgcctc tcaaattccc 900
tgatgctgag accgatcaga tcatgatgat ctcctatatg attgatggcc agggctacct 960
catcactaac agggagattg tttcagaaga tattgaagat tttgagttca cccctaagcc 1020
agaatatgaa gggccctttt gtgttttcaa tgaacccgac gaggtccatc tgatccagag 1080
atggtttgag catatccagg agaccaaacc taccattatg gtcacctaca atggggattt 1140
ttttgactgg ccatttgtgg aggctagggc agcaattcat ggcctcagca tgtaccagga 1200
gataggcttc cagaaggata gccaggggga atataaggca ccacagtgca tccacatgga 1260
ctgcctcagg tgggtgaaga gggacagtta ccttcctgtg ggcagtcata atctcaaggc 1320
agctgccaag gccaaacttg gctatgaccc tgtagagctg gaccctgagg acatgtgtcg 1380
tatggccact gaacagcccc agactctggc cacttactca gtgtcagatg ctgtggctac 1440
ttactacctg tacatgaaat acgtccaccc cttcatattc gccctgtgca ccattattcc 1500
catggaacct gatgaggtgc tgcggaaggg ctccgggaca ctgtgtgaag ccttgctgat 1560
ggtgcaagct ttccatgcca acattatctt ccccaataag caagagcagg agttcaacaa 1620
gctgacagat gatggccacg tgctagatgc tgagacctac gttgggggcc acgtggaggc 1680
actagagtct ggtgtcttca gaagtgatat cccctgccgg tttaggatga atcctgcagc 1740
ctttgatttc ctgctgcaac gagtcgagaa gactatgcgc cacgccattg aagaagaaga 1800
gaaggtgcct gtggaacaag ccaccaactt tcaagaggtg tgtgagcaga ttaagaccaa 1860
gctcacctcc ctaaaagatg ttcctaacag aattgaatgt cctctaatct atcatctaga 1920
tgtgggggcc atgtatccta acataattct taccaaccgc ctacagcctt ctgccatagt 1980
ggatgaggcc acctgtgctg cctgtgactt caataagcct ggagcaagtt gtcagaggaa 2040
gatggcctgg cagtggaggg gagaattcat gccagccagt cgcagtgaat accatcggat 2100
tcagcatcag ctggagtcgg agaagtttcc ccctttgttt ccagaggggc cagcacgggc 2160
ctttcacgag ctgtcccgtg aagaacaggc taaatatgag aagaggaggc tggcagatta 2220
ttgccggaaa gcctataaga agatccatgt gaccaaggta gaagaacgtc taactaccat 2280
ctgccagcgg gaaaactcat tttatgtgga cacagtgcgg gccttcagag acaggcgcta 2340
tgagttcaaa ggactgcaca aggtgtggaa gaagaagctc tcggcagctg tagaggtggg 2400
cgatgcatca gaggtgaagc gctgcaagaa catggagatc ctttacgatt cactgcagct 2460
ggctcacaag tgcatcctga actccttcta cggctatgtc atgcgcaaag gagctcgctg 2520
gtattccatg gagatggctg gtatcgtctg ctttacagga gccaacatca tcacccaagc 2580
aagagaactg attgagcaga tcgggaggcc tttagaattg gacacggacg gaatatggtg 2640
cgtcctaccc aatagctttc ctgaaaattt tgtcatcaag acaaccaatg cgaagaaacc 2700
caaactgacc atctcctatc ctggtgccat gttgaacatc atggtcaagg aaggctttac 2760
caaccaccag taccaggaac taacagagcc ttcgtctctc acctatgtca cccactctga 2820
gaatagtatc ttttttgaag tcgatggacc ataccttgct atgatccttc cagcctccaa 2880
ggaagaaggc aagaagctga agaaaagata tgctgtgttc aatgaagatg gttccttggc 2940
tgaactgaaa ggttttgagg tgaaacgccg aggggagttg cagctgatta aaatattcca 3000
gtcctcagtt tttgaggcct tcctcaaggg cagcacactg gaggaagtgt atggctcggt 3060
ggccaaagtg gctgactact ggctagatgt gctctatagc aaggctgcta atatgcccga 3120
ttctgaattg tttgagctga tttctgagaa ccgctccatg tctcggaagc tggaagatta 3180
cggggagcag aagtctacat ccatcagcac agcaaagcgc ctggctgagt tcctgggaga 3240
ccagatggtc aaagatgctg gactgagctg ccgctatatc atctcccgaa agccagaggg 3300
gtctcctgtc actgagaggg ccattccact tgccattttc caagcagagc ctacagtgag 3360
gaaacatttt ctccggaaat ggctaaagag ttcatcactt caagactttg atattcggac 3420
aattctggac tgggactact acatagagag gctggggagt gccatccaga aaatcatcac 3480
catccccgca gctctgcagc aggtgaagaa cccagttcca cgtgtcaaac atccagactg 3540
gctacacaaa aaactactag agaagaatga tatctacaaa cagaagaaga tcagtgagct 3600
ctttgtgctt gaaggaaaga gacagattgt gatggcccag gcttcagaaa acagtctgag 3660
tctctgcact ccagacatgg aggacattgg actcacaaag ccacaccact ctacagtccc 3720
agttgctact aagaggaagc gagtctggga gacccaaaag gagtctcagg atattgcact 3780
aactgtgccc tggcaagagg tcttagggca gcctccctcc cttggaacca cacaggaaga 3840
gtggttggtc tggctccagt tccacaagaa aaagtggcag ctgcaggccc aacagcgcct 3900
agccctcagg aagaagcaac gcttagagtc agcagaagat atgccaaggc ttgggcctat 3960
ccgagaggag ccttccacag gactggggag ctttttgcga aggactgccc gcagcatcat 4020
ggaccttcca tggcagataa tacagatcag tgagaccaga caggctggtc tgttccggct 4080
gtgggctatc attggcaatg acttgcactg catcaagctg agtatccctc gagtattcta 4140
tgtaaaccag cgggttgcca aagcagagga tggacctgca tatcggaagg tgaatcgggg 4200
gctcttcctt cgttccaaca ttgtctacaa tctctatgag tattcagtac cagaggacat 4260
gtaccaagaa cacatcaacg agatcaacac tgagttgtca gtaccagaca ttgagggcgt 4320
gtatgagaca caggtcccat tgttattccg ggccctcgtg cagctgggct gtgtgtgtgt 4380
ggtcaacaag cagctgacaa ggcacctttc gggctgggaa gctgaaactt ttgccctcga 4440
gcaccttgaa atgcgttctc tggcccagtt cagctacttg gaaccaggga gtatccgcca 4500
tatctacctg taccatcaca ctcagggcca caaggcactc tttggggtct ttatcccctc 4560
acagcgaaga gcatctgtgt ttgtgttgga tactgtacga agcaaccaaa tgccagggct 4620
cagtgccctg tactcatcag aacacagcct gctgctggac aaggtggacc ccaagctcct 4680
gcctccccca aaacacacct ttgaagttcg tgctgaaacc aacctggaga ctatctgcag 4740
agccatccag cgcttcctgc ttgcctacaa ggaagagcgc cgagggccca cactcatcgc 4800
tgtccagtct agctgggagc tgtgtaggct gaccagtgag attccagtct tagaagagtt 4860
cccactagtg cctatccgag tggctgacaa gatcagctat gcagtcctag actggcagcg 4920
ccatggagct cgccgaatga tccggcacta cctcaattta gacttgtgcc tgtcgcaggc 4980
ctttgagatg agcaggtact tccacatccc tgttggaaac ctgccggaag acatctccat 5040
ctttggctca gacctctttt ttgcacgcca cctccagcac cataaccacc tgctttggct 5100
atcccctacc tctcggcctg acctgggtgg gaaggaagct gatgacaacc gccttgtcat 5160
ggagtttgat gaccgagcca ctgtggagat caatagttct ggctgttact ctactgtgtg 5220
cgtggaactg gacattcaaa atctggcagt caacaccatc ctccagtccc atcatgtcaa 5280
tgacatggag ggggctggca gcatgggcat cagcttcgat gtgatccagc aggcctccct 5340
agaggacatg gtaacaggca atcaagctgc cagtgccctg gccaactacg atgagacagc 5400
cctctgctct agtaccttca ggatcctgaa gagcatggtg gttggctggg taaaggaaat 5460
cacacagtac cacaacatct atgctgacaa ccaggtaatg cacttctacc gctggctcca 5520
gtcaccgtgc tctctgctcc acgacccagc ccttcaccgg acgctgcaca atatgatgaa 5580
gaagctcttc ctgcagctca ttgctgagtt caagcgcctg gggtcatcag tcgtctatgc 5640
caacttcaat cgcatcattc tctgtacaaa gaagcgccga atagaggatg cccttgccta 5700
tgtggaatat attaccaaca gcatccattc taaagagatc ttccattccc tgaccatctc 5760
tttctctcga tgctgggaat tccttctctg gatggatcca tccaactatg gtggaatcaa 5820
aggaaaagtt ccatctagta ttcactgtgg acaggtaaaa gagcaagact cccaggcaag 5880
agaggaaact gatgaagagg aggaggacaa ggaaaaggac gaggaggaag agggcatggg 5940
agagtccgag gttgaggact tactggagaa caactggaac attctacagt tcttgcccca 6000
ggcagcctct tgccagagct acttcctcat gattgtttca gcatacatcg tagctgtgta 6060
ccaaagcatg aaggaggagt tgagacacag tgccccgggc agtacccctg tgaagaggaa 6120
gggggccagc cagttctccc aggagtctga aggggcaact ggatctcttc ctggaatgat 6180
cactttctct caagattatg tggcaaatga gctcactcag agcttcttca ccattactca 6240
gaaaattcag aagaaagtca caggttctcg gaacaccact gagccctcag agatgttccc 6300
cgtcctccct ggttcacact tgctgctcaa taatcctgct ctggagttca tcaaatatgt 6360
gtgcaaggta ctatctcagg atacaaacat cacaaatcag gtgaataagc tgaacagaga 6420
ccttcttcgc ctggtagacg ttggtgaatt ctctgaggag gcccagttca gagacccctg 6480
ccactcctac gtgctccctg aggtaatctg ccacagctgt aatttctgcc gagacctgga 6540
cctgtgcaaa gattcctctt tctctcagga tggagccatc ctgcctcagt ggctctgctc 6600
caattgtcaa gccccctatg actcctctgc cattgagtca gccttggtgg aagccctgca 6660
gaggaaactg atggccttca cacttcagga cctggtatgc ctcaagtgcc gtggtatgaa 6720
agagacccat atgcctgtgt actgcagctg cgcaggggac tttactctca ccatccgcac 6780
tgaggtcttc atggaacaga ttagaatctt ccagaacatt gccaagtact acagcatgtc 6840
atatctccag gagaccatag aatggctgtt acagacaagc cctgtatcaa actgttagca 6900
agcctaggct aaagacactt tggtatccca cacctactgc ctgctccaaa aggcagaacc 6960
actgaccacc ttgcttttcc aaactcatga gcacagccca gaaggaacag aagacttctg 7020
ctaacgtcat catgccataa acagacagaa gcagggaatg gctctatccc tagctgcctg 7080
ctaagtaaac acggttttga agcgtctgaa aaaaaaaaa                        7119
<210>58
<211>2284
<212>PRT
<213>小鼠(Mus musculus)
<400>58
Met Val Leu Arg Asn Ser Gly Arg Arg His Pro Glu Pro Gly Ala Asp
  1               5                  10                  15
Gly Glu Gly Ser Arg Asp Asp Gly Pro Ser Ser Ser Val Ser Ala Leu
             20                  25                  30
Lys Arg Leu Glu Arg Ser Gln Trp Thr Asp Lys Met Asp Leu Arg Phe
         35                  40                  45
Gly Phe Glu Arg Leu Lys Glu Pro Gly Glu Arg Thr Gly Trp Leu Ile
     50                  55                  60
Asn Met His Pro Thr Glu Ile Leu Asp Glu Asp Lys Arg Leu Val Ser
 65                  70                  75                  80
Ala Val Asp Tyr Tyr Phe Ile Gln Asp Asp Gly Ser Arg Phe Lys Val
                 85                  90                  95
Ala Leu Pro Tyr Met Pro Tyr Phe Tyr Ile Ala Ala Arg Lys Gly Cys
            100                 105                 110
Asp Arg Glu Val Ser Ser Phe Leu Ser Lys Lys Phe Gln Gly Lys Ile
        115                 120                 125
Ala Lys Leu Glu Asn Val Pro Lys Glu Asp Leu Asp Leu Pro Asn His
    130                 135                 140
Leu Val Gly Leu Lys Arg Ser Tyr Ile Lys Leu Ser Phe His Thr Val
145                 150                 155                 160
Glu Asp Leu Val Lys Val Arg Lys Glu Ile Ser Pro Ala Val Lys Lys
                165                 170                 175
Asn Arg Glu Gln Asp His Ala Ser Asp Glu Tyr Thr Thr Met Leu Ser
            180                 185                 190
Ser Ile Leu Gln Gly Gly Ser Val Ile Thr Asp Glu Glu Glu Thr Ser
        195                 200                 205
Lys Lys Ile Ala Asp Gln Leu Asp Asn Ile Val Asp Met Arg Glu Tyr
    210                 215                 220
Asp Val Pro Tyr His Ile Arg Leu Ser Ile Asp Leu Arg Ile His Val
225                 230                 235                 240
Ala His Trp Tyr Asn Val Arg Phe Arg Gly Asn Ala Phe Pro Val Glu
                245                 250                 255
Ile Thr Arg Arg Asp Asp Leu Val Glu Arg Pro Asp Pro Val Val Leu
            260                 265                 270
Ala Phe Asp Ile Glu Thr Thr Lys Leu Pro Leu Lys Phe Pro Asp Ala
        275                 280                 285
Glu Thr Asp Gln Ile Met Met Ile Ser Tyr Met Ile Asp Gly Gln Gly
    290                 295                 300
Tyr Leu Ile Thr Asn Arg Glu Ile Val Ser Glu Asp Ile Glu Asp Phe
305                 310                 315                 320
Glu Phe Thr Pro Lys Pro Glu Tyr Glu Gly Pro Phe Cys Val Phe Asn
                325                 330                 335
Glu Pro Asp Glu Val His Leu Ile Gln Arg Trp Phe Glu His Ile Gln
            340                 345                 350
Glu Thr Lys Pro Thr Ile Met Val Thr Tyr Asn Gly Asp Phe Phe Asp
        355                 360                 365
Trp Pro Phe Val Glu Ala Arg Ala Ala Ile His Gly Leu Ser Met Tyr
    370                 375                 380
Gln Glu Ile Gly Phe Gln Lys Asp Ser Gln Gly Glu Tyr Lys Ala Pro
385                 390                 395                 400
Gln Cys Ile His Met Asp Cys Leu Arg Trp Val Lys Arg Asp Ser Tyr
                405                 410                 415
Leu Pro Val Gly Ser His Asn Leu Lys Ala Ala Ala Lys Ala Lys Leu
            420                 425                 430
Gly Tyr Asp Pro Val Glu Leu Asp Pro Glu Asp Met Cys Arg Met Ala
        435                 440                 445
Thr Glu Gln Pro Gln Thr Leu Ala Thr Tyr Ser Val Ser Asp Ala Val
    450                 455                 460
Ala Thr Tyr Tyr Leu Tyr Met Lys Tyr Val His Pro Phe Ile Phe Ala
465                 470                 475                 480
Leu Cys Thr Ile Ile Pro Met Glu Pro Asp Glu Val Leu Arg Lys Gly
                485                 490                 495
Ser Gly Thr Leu Cys Glu Ala Leu Leu Met Val Gln Ala Phe His Ala
            500                 505                 510
Asn Ile Ile Phe Pro Asn Lys Gln Glu Gln Glu Phe Asn Lys Leu Thr
        515                 520                 525
Asp Asp Gly His Val Leu Asp Ala Glu Thr Tyr Val Gly Gly His Val
    530                 535                 540
Glu Ala Leu Glu Ser Gly Val Phe Arg Ser Asp Ile Pro Cys Arg Phe
545                 550                 555                 560
Arg Met Asn Pro Ala Ala Phe Asp Phe Leu Leu Gln Arg Val Glu Lys
                565                 570                 575
Thr Met Arg His Ala Ile Glu Glu Glu Glu Lys Val Pro Val Glu Gln
            580                 585                 590
Ala Thr Asn Phe Gln Glu Val Cys Glu Gln Ile Lys Thr Lys Leu Thr
        595                 600                 605
Ser Leu Lys Asp Val Pro Asn Arg Ile Glu Cys Pro Leu Ile Tyr His
    610                 615                 620
Leu Asp Val Gly Ma Met Tyr Pro Asn Ile Ile Leu Thr Asn Arg Leu
625                630                 635                 640
Gln Pro Ser Ala Ile Val Asp Glu Ala Thr Cys Ala Ala Cys Asp Phe
                645                 650                655
Asn Lys Pro Gly Ala Ser Cys Gln Arg Lys Met Ala Trp Gln Trp Arg
            660                 665                 670
Gly Glu Phe Met Pro Ala Ser Arg Ser Glu Tyr His Arg Ile Gln His
        675                 680                 685
Gln Leu Glu Ser Glu Lys Phe Pro Pro Leu Phe Pro Glu Gly Pro Ala
    690                 695                 700
Arg Ala Phe His Glu Leu Ser Arg Glu Glu Gln Ala Lys Tyr Glu Lys
705                 710                 715                 720
Arg Arg Leu Ala Asp Tyr Cys Arg Lys Ala Tyr Lys Lys Ile His Val
                725                 730                 735
Thr Lys Val Glu Glu Arg Leu Thr Thr Ile Cys Gln Arg Glu Asn Ser
            740                 745                 750
Phe Tyr Val Asp Thr Val Arg Ala Phe Arg Asp Arg Arg Tyr Glu Phe
        755                 760                 765
Lys Gly Leu His Lys Val Trp Lys Lys Lys Leu Ser Ala Ala Val Glu
    770                 775                 780
Val Gly Asp Ala Ser Glu Val Lys Arg Cys Lys Asn Met Glu Ile Leu
785                 790                795                 800
Tyr Asp Ser Leu Gln Leu Ala His Lys Cys Ile Leu Asn Ser Phe Tyr
                805                 810                 815
Gly Tyr Val Met Arg Lys Gly Ala Arg Trp Tyr Ser Met Glu Met Ala
            820                 825                 830
Gly Ile Val Cys Phe Thr Gly Ala Asn Ile Ile Thr Gln Ala Arg Glu
        835                 840                 845
Leu Ile Glu Gln Ile Gly Arg Pro Leu Glu Leu Asp Thr Asp Gly Ile
    850                 855                 860
Trp Cys Val Leu Pro Asn Ser Phe Pro Glu Asn Phe Val Ile Lys Thr
865                 870                 875                 880
Thr Asn Ala Lys Lys Pro Lys Leu Thr Ile Ser Tyr Pro Gly Ala Met
                885                 890                 895
Leu Asn Ile Met Val Lys Glu Gly Phe Thr Asn His Gln Tyr Gln Glu
            900                 905                 910
Leu Thr Glu Pro Ser Ser Leu Thr Tyr Val Thr His Ser Glu Asn Ser
        915                 920                 925
Ile Phe Phe Glu Val Asp Gly Pro Tyr Leu Ala Met Ile Leu Pro Ala
    930                 935                 940
Ser Lys Glu Glu Gly Lys Lys Leu Lys Lys Arg Tyr Ala Val Phe Asn
945                 950                 955                 960
Glu Asp Gly Ser Leu Ala Glu Leu Lys Gly Phe Glu Val Lys Arg Arg
                965                 970                 975
Gly Glu Leu Gln Leu Ile Lys Ile Phe Gln Ser Ser Val Phe Glu Ala
            980                 985                 990
Phe Leu Lys Gly Ser Thr Leu Glu Glu Val Tyr Gly Ser Val Ala Lys
        995                1000                1005
Val Ala Asp Tyr Trp Leu Asp Val Leu Tyr Ser Lys Ala Ala Asn Met
   1010                1015                1020
Pro Asp Ser Glu Leu Phe Glu Leu Ile Ser Glu Asn Arg Ser Met Ser
1025               1030                1035                1040
Arg Lys Leu Glu Asp Tyr Gly Glu Gln Lys Ser Thr Ser Ile Ser Thr
               1045                1050                1055
Ala Lys Arg Leu Ala Glu Phe Leu Gly Asp Gln Met Val Lys Asp Ala
           1060                1065                1070
Gly Leu Ser Cys Arg Tyr Ile Ile Ser Arg Lys Pro Glu Gly Ser Pro
       1075                1080                1085
Val Thr Glu Arg Ala Ile Pro Leu Ala Ile Phe Gln Ala Glu Pro Thr
   1090                1095                1100
Val Arg Lys His Phe Leu Arg Lys Trp Leu Lys Ser Ser Ser Leu Gln
1105               1110                1115                1120
Asp Phe Asp Ile Arg Thr Ile Leu Asp Trp Asp Tyr Tyr Ile Glu Arg
               1125                1130                1135
Leu Gly Ser Ala Ile Gln Lys Ile Ile Thr Ile Pro Ala Ala Leu Gln
           1140                1145                1150
Gln Val Lys Asn Pro Val Pro Arg Val Lys His Pro Asp Trp Leu His
       1155                1160                1165
Lys Lys Leu Leu Glu Lys Asn Asp Ile Tyr Lys Gln Lys Lys Ile Ser
   1170                1175                1180
Glu Leu Phe Val Leu Glu Gly Lys Arg Gln Ile Val Met Ala Gln Ala
1185               1190                1195                1200
Ser Glu Asn Ser Leu Ser Leu Cys Thr Pro Asp Met Glu Asp Ile Gly
               1205                1210                1215
Leu Thr Lys Pro His His Ser Thr Val Pro Val Ala Thr Lys Arg Lys
           1220                1225                1230
Arg Val Trp Glu Thr Gln Lys Glu Ser Gln Asp Ile Ala Leu Thr Val
       1235                1240                1245
Pro Trp Gln Glu Val Leu Gly Gln Pro Pro Ser Leu Gly Thr Thr Gln
   1250                1255                1260
Glu Glu Trp Leu Val Trp Leu Gln Phe His Lys Lys Lys Trp Gln Leu
1265               1270                1275                1280
Gln Ala Gln Gln Arg Leu Ala Leu Arg Lys Lys Gln Arg Leu Glu Ser
               1285                1290                1295
Ala Glu Asp Met Pro Arg Leu Gly Pro Ile Arg Glu Glu Pro Ser Thr
           1300                1305                1310
Gly Leu Gly Ser Phe Leu Arg Arg Thr Ala Arg Ser Ile Met Asp Leu
       1315                1320                1325
Pro Trp Gln Ile Ile Gln Ile Ser Glu Thr Arg Gln Ala Gly Leu Phe
   1330                1335                1340
Arg Leu Trp Ala Ile Ile Gly Asn Asp Leu His Cys Ile Lys Leu Ser
1345               1350                1355                1360
Ile Pro Arg Val Phe Tyr Val Asn Gln Arg Val Ala Lys Ala Glu Asp
               1365                1370                1375
Gly Pro Ala Tyr Arg Lys Val Asn Arg Gly Leu Phe Leu Arg Ser Asn
           1380                1385                1390
Ile Val Tyr Asn Leu Tyr Glu Tyr Ser Val Pro Glu Asp Met Tyr Gln
       1395                1400                1405
Glu His Ile Asn Glu Ile Asn Thr Glu Leu Ser Val Pro Asp Ile Glu
   1410                1415                1420
Gly Val Tyr Glu Thr Gln Val Pro Leu Leu Phe Arg Ala Leu Val Gln
1425               1430                1435                1440
Leu Gly Cys Val Cys Val Val Asn Lys Gln Leu Thr Arg His Leu Ser
               1445                1450                1455
Gly Trp Glu Ala Glu Thr Phe Ala Leu Glu His Leu Glu Met Arg Ser
           1460                1465                1470
Leu Ala Gln Phe Ser Tyr Leu Glu Pro Gly Ser Ile Arg His Ile Tyr
       1475                1480                1485
Leu Tyr His His Thr Gln Gly His Lys Ala Leu Phe Gly Val Phe Ile
   1490                1495                1500
Pro Ser Gln Arg Arg Ala Ser Val Phe Val Leu Asp Thr Val Arg Ser
1505               1510                1515                1520
Asn Gln Met Pro Gly Leu Ser Ala Leu Tyr Ser Ser Glu His Ser Leu
               1525                1530                1535
Leu Leu Asp Lys Val Asp Pro Lys Leu Leu Pro Pro Pro Lys His Thr
           1540                1545                1550
Phe Glu Val Arg Ala Glu Thr Asn Leu Glu Thr Ile Cys Arg Ala Ile
       1555                1560                1565
Gln Arg Phe Leu Leu Ala Tyr Lys Glu Glu Arg Arg Gly Pro Thr Leu
   1570                1575                1580
Ile Ala Val Gln Ser Ser Trp Glu Leu Cys Arg Leu Thr Ser Glu Ile
1585               1590                1595                1600
Pro Val Leu Glu Glu Phe Pro Leu Val Pro Ile Arg Val Ala Asp Lys
               1605                 1610                1615
Ile Ser Tyr Ala Val Leu Asp Trp Gln Arg His Gly Ala Arg Arg Met
           1620                1625                1630
Ile Arg His Tyr Leu Asn Leu Asp Leu Cys Leu Ser Gln Ala Phe Glu
       1635                1640                1645
Met Ser Arg Tyr Phe His Ile Pro Val Gly Asn Leu Pro Glu Asp Ile
   1650                1655                1660
Ser Ile Phe Gly Ser Asp Leu Phe Phe Ala Arg His Leu Gln His His
1665               1670                1675                1680
Asn His Leu Leu Trp Leu Ser Pro Thr Ser Arg Pro Asp Leu Gly Gly
               1685                1690                1695
Lys Glu Ala Asp Asp Asn Arg Leu Val Met Glu Phe Asp Asp Arg Ala
           1700                1705                1710
Thr Val Glu Ile Asn Ser Ser Gly Cys Tyr Ser Thr Val Cys Val Glu
       1715                1720                1725
Leu Asp Ile Gln Asn Leu Ala Val Asn Thr lle Leu Gln Ser His His
   1730                1735                1740
Val Asn Asp Met Glu Gly Ala Gly Ser Met Gly Ile Ser Phe Asp Val
1745               1750                1755                1760
Ile Gln Gln Ala Ser Leu Glu Asp Met Val Thr Gly Asn Gln Ala Ala
               1765                1770                1775
Ser Ala Leu Ala Asn Tyr Asp Glu Thr Ala Leu Cys Ser Ser Thr Phe
           1780                1785                1790
Arg Ile Leu Lys Ser Met Val Val Gly Trp Val Lys Glu Ile Thr Gln
       1795                1800                1805
Tyr His Asn lle Tyr Ala Asp Asn Gln Val Met His Phe Tyr Arg Trp
   1810                1815                1820
Leu Gln Ser Pro Cys Ser Leu Leu His Asp Pro Ala Leu His Arg Thr
1825               1830                1835                1840
Leu His Asn Met Met Lys Lys Leu Phe Leu Gln Leu Ile Ala Glu Phe
               1845                1850                1855
Lys Arg Leu Gly Ser Ser Val Val Tyr Ala Asn Phe Asn Arg Ile Ile
           1860                1865                1870
Leu Cys Thr Lys Lys Arg Arg Ile Glu Asp Ala Leu Ala Tyr Val Glu
       1875                1880                1885
Tyr Ile Thr Asn Ser Ile His Ser Lys Glu Ile Phe His Ser Leu Thr
   1890                1895                1900
Ile Ser Phe Ser Arg Cys Trp Glu Phe Leu Leu Trp Met Asp Pro Ser
1905               1910                1915                1920
Asn Tyr Gly Gly Ile Lys Gly Lys Val Pro Ser Ser Ile His Cys Gly
               1925                1930                1935
Gln Val Lys Glu Gln Asp Ser Gln Ala Arg Glu Glu Thr Asp Glu Glu
           1940                1945                1950
Glu Glu Asp Lys Glu Lys Asp Glu Glu Glu Glu Gly Met Gly Glu Ser
       1955                1960                1965
Glu Val Glu Asp Leu Leu Glu Asn Asn Trp Asn Ile Leu Gln Phe Leu
   1970                1975                1980
Pro Gln Ala Ala Ser Cys Gln Ser Tyr Phe Leu Met Ile Val Ser Ala
1985               1990                1995                2000
Tyr Ile Val Ala Val Tyr Gln Ser Met Lys Glu Glu Leu Arg His Ser
               2005                2010                2015
Ala Pro Gly Ser Thr Pro Val Lys Arg Lys Gly Ala Ser Gln Phe Ser
           2020                2025                2030
Gln Glu Ser Glu Gly Ala Thr Gly Ser Leu Pro Gly Met Ile Thr Phe
       2035                2040                2045
Ser Gln Asp Tyr Val Ala Asn Glu Leu Thr Gln Ser Phe Phe Thr Ile
   2050                2055                2060
Thr Gln Lys Ile Gln Lys Lys Val Thr Gly Ser Arg Asn Thr Thr Glu
2065               2070                2075                2080
Pro Ser Glu Met Phe Pro Val Leu Pro Gly Ser His Leu Leu Leu Asn
               2085                2090                2095
Asn Pro Ala Leu Glu Phe Ile Lys Tyr Val Cys Lys Val Leu Ser Gln
           2100                2105                2110
Asp Thr Asn Ile Thr Asn Gln Val Asn Lys Leu Asn Arg Asp Leu Leu
       2115                2120                2125
Arg Leu Val Asp Val Gly Glu Phe Ser Glu Glu Ala Gln Phe Arg Asp
   2130                2135                2140
Pro Cys His Ser Tyr Val Leu Pro Glu Val Ile Cys His Ser Cys Asn
2145               2150                2155                2160
Phe Cys Arg Asp Leu Asp Leu Cys Lys Asp Ser Ser Phe Ser Gln Asp
               2165                2170                2175
Gly Ala Ile Leu Pro Gln Trp Leu Cys Ser Asn Cys Gln Ala Pro Tyr
           2180                2185                2190
Asp Ser Ser Ala Ile Glu Ser Ala Leu Val Glu Ala Leu Gln Arg Lys
       2195                2200                2205
Leu Met Ala Phe Thr Leu Gln Asp Leu Val Cys Leu Lys Cys Arg Gly
   2210                2215                2220
Met Lys Glu Thr His Met Pro Val Tyr Cys Ser Cys Ala Gly Asp Phe
2225               2230                2235                2240
Thr Leu Thr Ile Arg Thr Glu Val Phe Met Glu Gln Ile Arg Ile Phe
               2245                2250                2255
Gln Asn Ile Ala Lys Tyr Tyr Ser Met Ser Tyr Leu Gln Glu Thr Ile
           2260                2265                2270
Glu Trp Leu Leu Gln Thr Ser Pro Val Ser Asn Cys
       2275                2280
<210>59
<211>3325
<212>DNA
<213>大鼠(Rattus norvegicus)
<400>59
aggcgatgga tggtaaacgg cggcaagcgc ccagctctgg ggtgccccca aagcgggctt 60
gcaagggcct ctgggatgaa gatgagccgt cacagtttga ggagaacctg gcgctgctgg 120
aggagataga ggccgagaat cggctgcagg aggccgagga ggagctgcag ctgccccctg 180
agggcattgt gggtgggcag ttttccactg cagacattga cccacggtgg ctgcggccca 240
ccccacttgc cctggacccc agcacggagc ccctcatctt ccagcagctg gagattgacc 300
actatgtggg cacatcacct cccctgccag aaggaccccc cgcatctcgt aactcagtgc 360
ccatactgag ggcctttggg gtcaccgatg agggcttctc cgtctgctgc cacatccacg 420
gctttgcccc ctacttctac acccctgcac ctccgggttt tggggctgag cacctgagtg 480
aactacagcg ggagctgaat gcagccatca gccgggacca gcgtggtgga aaggagctct 540
cggggccggc agtgctagct atagagctgt gctcccgtga gagcatgttt gggtaccatg 600
gccacggccc ttctcccttt ctccgcatca ccctggcact accccgcctg atggcgccag 660
cccgccgcct cctggaacag ggtatccgag tgccaggcct gggcaccccg agctttgcac 720
cctatgaagc caatgtggac tttgagatcc ggttcatggt ggatgctgac attgtgggat 780
gcaactggtt ggagctccca gctggaaagt acgttcggag ggcagagaag aaggctacac 840
tgtgtcagct ggaggtggat gtgctgtggt cagacgtgat cagtcaccca ccagaagggc 900
agtggcagcg catcgcaccc ctgcgtgtgc ttagcttcga catcgagtgc gctggccgaa 960
aaggcatctt ccctgagcct gagcgtgacc ccgtgatcca gatctgttct ctggggctgc 1020
gctggggtga gccagagccc ttcttgcgcc tagcactcac gctgcggcct tgcgccccca 1080
tcctgggtgc caaagtacag agctatgaac gggaagaaga cctgctccag gcctgggcca 1140
ctttcatcct cgccatggac cctgacgtga tcaccggcta caacattcag aactttgacc 1200
tcccctacct catctctcgg gcacaaacct taaaggtgga ccgattccct ttcctgggcc 1260
gtgtgactgg tctccgctcc aacatccgtg actcctcctt ccaatcaagg caggtgggcc 1320
ggcgggacag taaggtggtc agcatggtgg gtcgcgttca gatggatatg ctgcaggtgc 1380
tgcttcggga gtacaagctc cgctcctaca cgctcaacgc tgtgagcttc cacttcctgg 1440
gtgagcagaa ggaggacgta cagcacagca tcatcactga cctacagaat gggaatgaac 1500
agacgcgtcg ccgcctggcc gtgtactgcc tgaaggatgc ctttctgcct cttcgcctac 1560
tcgagcgcct tatggtgctg gtgaacaatg tggagatggc gcgtgtcact ggtgtacccc 1620
ttgggtacct gctcagccga ggccagcagg tcaaggtcgt gtctcagctg ctgcgccagg 1680
ccatgcgcga ggggctgctg atgcctgtgg tgaagacgga gggaggtgag gactacacgg 1740
gagccactgt cattgagccc ctcaaagggt actatgatgt ccccattgcc accctggact 1800
tctcctctct gtacccatcc atcatgatgg cccacaatct gtgctacacc acattgctac 1860
ggcctggggc tgcccagaag ttgggcctta aaccagatga gttcatcaag acacccactg 1920
gggatgagtt tgtgaaggca tctgtgcgga agggcctcct gccccaaatc ctggagaatc 1980
tgctgagtgc ccggaagagg gccaaggctg agctggctca ggagacggac cccctgcggc 2040
gacaggtctt ggatggacgg cagctggcac taaaagtgag tcccaactct gtgtatggct 2100
tcactggtgc ccaggtgggc aagctgccgt gtttggagat ctcccagagt gtcactgggt 2160
tcgggcggca gatgattgag aaaaccaagc agctagtgga gaccaagtac actctggaaa 2220
atggctacga tgctaatgcc aaggtggtct acggtgacac tgactctgtg atgtgccgat 2280
ttggtgtctc ctctgtggct gaggcaatgt ctctggggcg ggaggctgca aactgggtat 2340
ccagtcactt cccatcaccc atccggctgg agttcgagaa ggtttacttt ccctacctgc 2400
tcatcagcaa gaagcgctat gccggcctac tcttctcctc ccgctctgat gcccatgaca 2460
gaatggactg caagggcctg gaggctgtgc gtagggacaa ctgtcccctg gtggccaacc 2520
ttgtcacatc ctctctgcgc agaatcctcg tggatcggga ccctgatggt gcagtagccc 2580
atgcaaagga tgtcatctcg gacctgctgt gcaaccgcat agacatctcc caactggtca 2640
tcaccaaaga gttgacccgc gcagcagcag actacgcggg caagcaggct catgtggagc 2700
tggctgagag gatgaggaag cgtgaccccg gcagtgcgcc caacttgggc gaccgagtac 2760
cctacgtgat cattggtgct gccaagggtg tggccgccta catgaagtcg gaggaccccc 2820
tgtttgtgct ggagcacagc ctgcccattg atactcagta ctacctggag cagcagctgg 2880
ccaagccgct attgcgcatc tttgagccca ttctgggtga gggccgcgcg gagtcagtgc 2940
tgctgcgcgg tgaccacaca cgctgcaaaa ccgtgctcac cagcaaggtg ggcggccttc 3000
tggccttcac caagcgccga aactcttgta ttggctgccg ctccgtaatc gaccatcaag 3060
gagccgtgtg taagttctgt cagccacggg agtctgagct ctatcagaag gaggtgtcac 3120
acctgaatgc cctggaggaa cgtttctcgc gcctctggac acagtgccag cgctgccagg 3180
gcagcttgca cgaggatgtc atctgtacca gccgcgactg tcccatcttc tacatgcgca 3240
agaaggtgcg caaggacctg gaggaccagg aacggctgct gcagcgcttt ggacctcctg 3300
gccctgaggc ctggtgacct gacaa                                       3325
<210>60
<211>1103
<212>PRT
<213>大鼠(Rattus norvegicus)
<400>60
Met Asp Gly Lys Arg Arg Gln Ala Pro Ser Ser Gly Val Pro Pro Lys
  1               5                  10                  15
Arg Ala Cys Lys Gly Leu Trp Asp Glu Asp Glu Pro Ser Gln Phe Glu
             20                  25                  30
Glu Asn Leu Ala Leu Leu Glu Glu Ile Glu Ala Glu Asn Arg Leu Gln
         35                  40                  45
Glu Ala Glu Glu Glu Leu Gln Leu Pro Pro Glu Gly Ile Val Gly Gly
     50                  55                  60
Gln Phe Ser Thr Ala Asp Ile Asp Pro Arg Trp Leu Arg Pro Thr Pro
 65                  70                  75                  80
Leu Ala Leu Asp Pro Ser Thr Glu Pro Leu Ile Phe Gln Gln Leu Glu
                 85                  90                  95
Ile Asp His Tyr Val Gly Thr Ser Pro Pro Leu Pro Glu Gly Pro Pro
            100                 105                 110
Ala Ser Arg Asn Ser Val Pro Ile Leu Arg Ala Phe Gly Val Thr Asp
        115                 120                 125
Glu Gly Phe Ser Val Cys Cys His Ile His Gly Phe Ala Pro Tyr Phe
    130                 135                 140
Tyr Thr Pro Ala Pro Pro Gly Phe Gly Ala Glu His Leu Ser Glu Leu
145                 150                 155                 160
Gln Arg Glu Leu Asn Ala Ala Ile Ser Arg Asp Gln Arg Gly Gly Lys
                165                 170                 175
Glu Leu Ser Gly Pro Ala Val Leu Ala Ile Glu Leu Cys Ser Arg Glu
            180                 185                 190
Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe Leu Arg Ile
        195                 200                 205
Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg Leu Leu Glu
    210                 215                 220
Gln Gly Ile Arg Val Pro Gly Leu Gly Thr Pro Ser Phe Ala Pro Tyr
225                 230                 235                 240
Glu Ala Ash Val Asp Phe Glu Ile Arg Phe Met Val Asp Ala Asp Ile
                245                 250                 255
Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr Val Arg Arg
            260                 265                 270
Ala Glu Lys Lys Ala Thr Leu Cys Gln Leu Glu Val Asp Val Leu Trp
        275                 280                 285
Ser Asp Val Ile Ser His Pro Pro Glu Gly Gln Trp Gln Arg Ile Ala
    290                 295                 300
Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys Gly
305                 310                 315                 320
Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile Cys Ser Leu
                325                 330                 335
Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu Ala Leu Thr
            340                 345                 350
Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln Ser Tyr Glu
        355                 360                 365
Arg Glu Glu Asp Leu Leu Gln Ala Trp Ala Thr Phe Ile Leu Ala Met
    370                 375                 380
Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe Asp Leu Pro
385                 390                 395                 400
Tyr Leu Ile Ser Arg Ala Gln Thr Leu Lys Val Asp Arg Phe Pro Phe
                405                 410                 415
Leu Gly Arg Val Thr Gly Leu Arg Ser Asn Ile Arg Asp Ser Ser Phe
            420                 425                 430
Gln Ser Arg Gln Val Gly Arg Arg Asp Ser Lys Val Val Ser Met Val
        435                 440                 445
Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg Glu Tyr Lys
    450                 455                 460
Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe Leu Gly Glu
465                 470                 475                 480
Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu Gln Asn Gly
                485                 490                 495
Asn Glu Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys Asp Ala
            500                 505                 510
Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu Val Asn Asn
        515                 520                 525
Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr Leu Leu Ser
    530                 535                 540
Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg Gln Ala Met
545                 550                 555                 560
Arg Glu Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly Gly Glu Asp
                565                 570                 575
Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr Tyr Asp Val
            580                 585                 590
Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser Ile Met Met
        595                 600                 605
Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly Ala Ala Gln
    610                 615                 620
Lys Leu Gly Leu Lys Pro Asp Glu Phe Ile Lys Thr Pro Thr Gly Asp
625                 630                 635                 640
Glu Phe Val Lys Ala Ser Val Arg Lys Gly Leu Leu Pro Gln Ile Leu
                645                 650                 655
Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu Leu Ala Gln
            660                 665                 670
Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg Gln Leu Ala
        675                 680                 685
Leu Lys Val Ser Pro Asn Ser Val Tyr Gly Phe Thr Gly Ala Gln Val
    690                 695                 700
Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr Gly Phe Gly
705                 710                 715                 720
Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Thr Lys Tyr Thr
                725                 730                 735
Leu Glu Asn Gly Tyr Asp Ala Asn Ala Lys Val Val Tyr Gly Asp Thr
            740                 745                 750
Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala Glu Ala Met
        755                 760                 765
Ser Leu Gly Arg Glu Ala Ala Asn Trp Val Ser Ser His Phe Pro Ser
    770                 775                 780
Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu Leu Ile
785                 790                 795                 800
Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg Ser Asp Ala
                805                 810                 815
His Asp Arg Met Asp Cys Lys Gly Leu Glu Ala Val Arg Arg Asp Asn
            820                 825                 830
Cys Pro Leu Val Ala Asn Leu Val Thr Ser Ser Leu Arg Arg Ile Leu
        835                 840                 845
Val Asp Arg Asp Pro Asp Gly Ala Val Ala His Ala Lys Asp Val Ile
    850                 855                 860
Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu Val Ile Thr
865                 870                 875                 880
Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys Gln Ala His
                885                 890                 895
Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly Ser Ala Pro
            900                 905                 910
Asn Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Gly Ala Ala Lys Gly
        915                 920                 925
Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val Leu Glu His
    930                 935                 940
Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln Leu Ala Lys
945                 950                 955                 960
Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly Arg Ala Glu
                965                 970                 975
Ser Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr Val Leu Thr
            980                 985                 990
Ser Lys Val Gly Gly Leu Leu Ala Phe Thr Lys Arg Arg Asn Ser Cys
        995                1000                1005
Ile Gly Cys Arg Ser Val Ile Asp His Gln Gly Ala Val Cys Lys Phe
   1010                1015                1020
Cys Gln Pro Arg Glu Ser Glu Leu Tyr Gln Lys Glu Val Ser His Leu
1025               1030                1035                1040
Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr Gln Cys Gln Arg
               1045                1050                1055
Cys Gln Gly Ser Leu His Glu Asp Val Ile Cys Thr Ser Arg Asp Cys
           1060                1065                1070
Pro Ile Phe Tyr Met Arg Lys Lys Val Arg Lys Asp Leu Glu Asp Gln
       1075                1080                1085
Glu Arg Leu Leu Gln Arg Phe Gly Pro Pro Gly Pro Glu Ala Trp
   1090                1095                1100
<210>61
<211>3451
<212>DNA
<213>牛(Bos taurus)
<400>61
agtcaggggt cacggcggcg tgggctgtgg cgggaaacac tgtttgaagc gggatggatg    60
gtaagcggcg accaggcccg gggcctgggg tgcccccaaa gcgggcccgt gggggcctct    120
gggatgagga tgaggcatac cggccctcgc agttcgagga ggagctggcg ctgatggagg    180
agatggaagc agagcgcagg ctgcaggagc aggaggagga ggagctgcag tcggccctgg    240
aggcggcgga cgggcaattc tccccaacgg ccatagatgc ccgctggctt cggcccgccc    300
cgcccgcctt ggacccccag atggagcctc tcatcttcca gcagttggag atcgaccatt    360
acgtggcccc agcgcggccc ctgcctgggg cgcccccgcc atcccaggac tcagttccca    420
tcctccgcgc cttcggggtc accaacgagg gggtctccgt ctgctgccac atccatggct    480
ttgcacccta cttctacacc ccagcgcccc ctggttttgg acctgagcac ctgagcgagc    540
tgcagcggga gctgagtgca gccatcagcc gggaccagcg cgggggcaag gagctcaccg    600
ggccggccgt gctggcggta gagctgtgct cccgggagag catgttcggg taccatgggc    660
acggcccctc cccgtttctg cgtatcacct tggcactgcc ccgcctcatg gcacctgccc    720
gccgcctcct ggagcagggc atccgcctgg ccggcctcgg cacccccagc tttgcgccct    780
acgaggccaa cgttgacttt gagatccggt tcatggtgga cacggacatc gtgggctgca    840
actggctgga gctcccagcc gggaaataca tcctgaggcc ggaggggaag gccactctgt    900
gtcagctgga ggccgacgtg ctgtggtcag acgtgatcag ccacccgccg gaaggagagt    960
ggcagcgaat cgcccctctg cgcgtgctca gcttcgacat cgagtgcgct ggtcgcaaag    1020
gcatcttccc tgagcccgag cgggaccccg tgatccagat ctgctcactg ggcctgcgct    1080
ggggcgagcc ggagcccttc ctgcgcctgg cgctcaccct gcggccctgc gcccccatcc    1140
tgggcgccaa ggtgcagagc tatgagcggg aggaggacct gctccaggcc tggtcgacct    1200
tcatccgcat catggatccc gatgtgatca ccggctacaa tatccagagc tttgaccttc    1260
cctacctcat ctcccgggcc cagaccctca aggtgccagg cttccccttg ctgggccgtg    1320
tgattggcct ccgctccaac atccgggagt cgtccttcca gtccaggcag actggccggc    1380
gggacagcaa ggtggtcagc atggtgggcc gcgtgcagat ggacatgctg caggtgctgc    1440
tgcgggagta caagctccgg tcctacacgc tcaatgccgt gagcttccac  ttcctgggcg   1500
agcagaagga ggacgtgcag cacagcatca tcacagacct gcagaacggt aacgaccaga    1560
cgcgccgccg cctggccgtg tactgcctca aggacgcctt cctacccctg cggctgctgg    1620
agcggctcat ggtgctggtg aacgccatgg agatggcgcg cgtcaccggc gtgcccctcg    1680
gctacctgct cagccgcggc cagcaggtca aggtcgtgtc ccagctgctg cgacaggcca    1740
tgcgccaggg gctgttgatg cccgtggtga agacggaggg tggtgaggac tataccgggg    1800
ccacggtcat cgagccgctg aaagggtact acgacgttcc catcgccacc ttggacttct    1860
cctcgctgta cccgtccatc atgatggccc acaacctgtg ctacaccaca ctcctgcggc    1920
ccggggccgc ccagaaactg ggcctgaccg aggatcagtt catcaagacg cccacggggg    1980
acgagtttgt gaaggcatcg gtgcggaagg ggctgctccc ccagatcctg gaaaacctgc    2040
tcagcgcccg gaagagggcc aaggccgagc tggccaagga gacagacccc ctacggcggc    2100
aagtgttgga cgggcgccag ctggcgctga aagtgagtgc taactctgtg tacggcttca    2160
ctggcgccca ggtgggcagg ctcccgtgcc tggaaatctc acagagtgtc accgggttcg    2220
ggcgccagat gattgagaag acaaagcagc ttgtggagac caagtacacg gtggaaaacg    2280
gctacagcac cagcgccaag gtggtgtatg gtgacacaga ctcggtcatg tgccgctttg    2340
gcgtctcatc cgtggctgag gcgatggctt tgggacggga ggctgcagac tgggtgtccg    2400
gccacttccc ctcgcccatc cggctagagt ttgagaaagt ctacttcccc tacctgctca    2460
tcagcaagaa gcgttacgca ggcctgctct tctcctcccg gccggacgcc cacgaccgca    2520
tggactgcaa gggcctggag gccgtgcgca gggacaactg ccccctggtg gccaacctcg    2580
tcaccgcctc gctgcgccgc ctgctcatcg accgagaccc ctcgggcgcc gtggctcatg    2640
cacaggacgt catctccgat ctgctgtgta atcgcattga catctcgcag ctggtcatta    2700
ccaaggagct gactcgcgct gccgccgatt acgcgggcaa gcaggcccac gtggagctgg    2760
ccgagaggat gaggaagcgg gaccccggga gcgcgcccag cctgggcgac cgcgtcccct    2820
acgtgatcat cagcgctgcc aagggcgtgg ccgcctacat gaagtccgag gaccccctgt    2880
tcgtactgga gcacagcctg cccatcgaca cgcagtacta cctggagcag cagctcgcca    2940
agccgctcct gcgcatcttc gagcccatcc tgggcgaggg ccgtgccgag gctgtgctgc    3000
tgcgcgggga ccacactcgc tgcaagacgg tgctcacggg gaaggtgggc ggcctcctgg    3060
ccttcgccaa acgccggaac tgctgcatcg gctgccgcac tgtcctcagc caccagggag    3120
ccgtgtgcaa gttctgccag ccccgggagt cagagctgta ccagaaggag gtgtcccacc    3180
tgagtgccct ggaggagcga ttctcacgcc tgtggacgca gtgccagcgc tgccagggca    3240
gcctgcacga ggacgtcatc tgcaccagcc gggactgtcc catcttctac atgcgcaaga    3300
aggtgcggaa ggacctggag gaccaggagc ggctgctgcg gcgctttgga ccccccggcc    3360
cagaggcttg gtgacctctg acctcaacga acttcccacc ttgggggcgc gggggggaca    3420
gacggggaat taataaagct caggcctttt g                                   3451
<210>62
<211>1106
<212>PRT
<213>牛(Bos taurus)
<400>62
Met Asp Gly Lys Arg Arg Pro Gly Pro Gly Pro Gly Val Pro Pro Lys
  1               5                  10                 15
Arg Ala Arg Gly Gly Leu Trp Asp Glu Asp Glu Ala Tyr Arg Pro Ser
             20                  25                  30
Gln Phe Glu Glu Glu Leu Ala Leu Met Glu Glu Met Glu Ala Glu Arg
         35                  40                  45
Arg Leu Gln Glu Gln Glu Glu Glu Glu Leu Gln Ser Ala Leu Glu Ala
     50                  55                  60
Ala Asp Gly Gln Phe Ser Pro Thr Ala Ile Asp Ala Arg Trp Leu Arg
 65                  70                  75                  80
Pro Ala Pro Pro Ala Leu Asp Pro Gln Met Glu Pro Leu Ile Phe Gln
                 85                  90                  95
Gln Leu Glu Ile Asp His Tyr Val Ala Pro Ala Arg Pro Leu Pro Gly
            100                 105                 110
Ala Pro Pro Pro Ser Gln Asp Ser Val Pro Ile Leu Arg Ala Phe Gly
        115                 120                 125
Val Thr Asn Glu Gly Val Ser Val Cys Cys His Ile His Gly Phe Ala
    130                 135                 140
Pro Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Pro Glu His Leu
145                 150                 155                 160
Ser Glu Leu Gln Arg Glu Leu Ser Ala Ala Ile Ser Arg Asp Gln Arg
                165                 170                 175
Gly Gly Lys Glu Leu Thr Gly Pro Ala Val Leu Ala Val Glu Leu Cys
            180                 185                 190
Ser Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe
        195                 200                 205
Leu Arg Ile Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg
    210                 215                 220
Leu Leu Glu Gln Gly Ile Arg Leu Ala Gly Leu Gly Thr Pro Ser Phe
225                 230                 235                 240
Ala Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val Asp
                245                 250                 255
Thr Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr
            260                 265                 270
Ile Leu Arg Pro Glu Gly Lys Ala Thr Leu Cys Gln Leu Glu Ala Asp
        275                 280                 285
Val Leu Trp Ser Asp Val Ile Ser His Pro Pro Glu Gly Glu Trp Gln
    290                 295                 300
Arg Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly
305                 310                 315                 320
Arg Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile
                325                 330                 335
Cys Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu
            340                 345                 350
Ala Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln
        355                 360                 365
Ser Tyr Glu Arg Glu Glu Asp Leu Leu Gln Ala Trp Ser Thr Phe Ile
    370                 375                 380
Arg Ile Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe
385                 390                 395                 400
Asp Leu Pro Tyr Leu Ile Ser Arg Ala Gln Thr Leu Lys Val Pro Gly
                405                 410                 415
Phe Pro Leu Leu Gly Arg Val Ile Gly Leu Arg Ser Asn Ile Arg Glu
            420                 425                 430
Ser Ser Phe Gln Ser Arg Gln Thr Gly Arg Arg Asp Ser Lys Val Val
        435                 440                 445
Ser Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg
    450                 455                 460
Glu Tyr Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe
465                 470                 475                 480
Leu Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu
                485                 490                 495
Gln Asn Gly Asn Asp Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu
            500                 505                 510
Lys Asp Ala Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu
        515                 520                 525
Val Asn Ala Met Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr
    530                 535                 540
Leu Leu Ser Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg
545                 550                 555                 560
Gln Ala Met Arg Gln Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly
                565                 570                 575
Gly Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr
            580                 585                 590
Tyr Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser
        595                 600                 605
Ile Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly
    610                 615                 620
Ala Ala Gln Lys Leu Gly Leu Thr Glu Asp Gln Phe Ile Lys Thr Pro
625                 630                 635                 640
Thr Gly Asp Glu Phe Val Lys Ala Ser Val Arg Lys Gly Leu Leu Pro
                645                 650                 655
Gln Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu
            660                 665                 670
Leu Ala Lys Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg
        675                 680                 685
Gln Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly
    690                 695                 700
Ala Gln Val Gly Arg Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr
705                 710                 715                 720
Gly Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Thr
                725                 730                 735
Lys Tyr Thr Val Glu Asn Gly Tyr Ser Thr Ser Ala Lys Val Val Tyr
            740                 745                 750
Gly Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala
        755                 760                 765
Glu Ala Met Ala Leu Gly Arg Glu Ala Ala Asp Trp Val Ser Gly His
    770                 775                 780
Phe Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr
785                 790                 795                 800
Leu Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg
                805                 810                 815
Pro Asp Ala His Asp Arg Met Asp Cys Lys Gly Leu Glu Ala Val Arg
            820                 825                 830
Arg Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ala Ser Leu Arg
        835                 840                 845
Arg Leu Leu Ile Asp Arg Asp Pro Ser Gly Ala Val Ala His Ala Gln
    850                 855                 860
Asp Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu
865                 870                 875                 880
Val Ile Thr Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys
                885                 890                 895
Gln Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly
            900                 905                 910
Ser Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Ser Ala
        915                 920                 925
Ala Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val
    930                 935                 940
Leu Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln
945                 950                 955                 960
Leu Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly
                965                 970                 975
Arg Ala Glu Ala Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr
            980                 985                 990
Val Leu Thr Gly Lys Val Gly Gly Leu Leu Ala Phe Ala Lys Arg Arg
        995                 1000                1005
Asn Cys Cys Ile Gly Cys Arg Thr Val Leu Ser His Gln Gly Ala Val
   1010                1015                1020
Cys Lys Phe Cys Gln Pro Arg Glu Ser Glu Leu Tyr Gln Lys Glu Val
1025               1030                1035                1040
Ser His Leu Ser Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr Gln
               1045                1050                1055
Cys Gln Arg Cys Gln Gly Ser Leu His Glu Asp Val Ile Cys Thr Ser
           1060                1065                1070
Arg Asp Cys Pro Ile Phe Tyr Met Arg Lys Lys Val Arg Lys Asp Leu
       1075                1080                1085
Glu Asp Gln Glu Arg Leu Leu Arg Arg Phe Gly Pro Pro Gly Pro Glu
   1090                1095                1100
Ala Trp
1105
<210>63
<211>3457
<212>DNA
<213>黑腹果蝇(Drosophila melanogaster)
<400>63
ctctaacgtg cctaccaaca aaagcgcgcc ttattttttg gcatcgctct tgtcttatgg    60
atttgcaagt aacatttcac caaggtaccc agaatggatg gcaagcgcaa gtttaatgga    120
acctccaatg gacatgccaa gaagcccagg aatcctgatg acgatgagga aatgggcttt    180
gaggcggagc tggccgcctt cgagaactcc gaggacatgg accagactct gctaatgggc    240
gatggacccg agaaccaaac gaccagtgag cgttggtccc gtccgccgcc cccagaacta    300
gatccctcca agcacaactt ggagtttcag cagctggacg tggaaaacta tttgggacag    360
ccgttgccgg gaatgccagg tgcccaaata ggacccgtgc cggtggtccg aatgtttggt    420
gtcaccatgg agggtaactc tgtgtgctgc catgtgcatg gtttctgtcc atacttctac    480
atagaggcgc ccagtcaatt cgaggagcac cattgcgaga aactacaaaa agccttggat    540
caaaaggtta ttgccgatat tcgcaacaac aaagataatg tccaggaggc tgtgcttatg    600
gtggaactgg tggagaagct gaacatccat ggatacaatg gagacaagaa gcagaggtac    660
atcaaaatat cggttacgct gcccagattt gtggctgcgg cctcacgtct cctcaaaaag    720
gaagtgatca tgtcggagat tgacttccag gactgtcgcg cctttgagaa taacatagac    780
tttgacattc gcttcatggt ggacactgat gtggtgggtt gcaattggat agagcttccc    840
atgggtcact ggcgaataag gaacagtcac agcaagccgt tgcctgaatc ccgctgccag    900
attgaagtag acgtggcctt cgacagattt atatcccacg agcccgaagg tgaatggtcc    960
aaggtggctc ccttccggat cctctccttt gatattgaat gcgctggtcg caaaggaata    1020
tttccggaag ccaaaataga tccagtcatc cagatagcca atatggtgat aaggcaggga    1080
gaacgagaac ctttcattag gaatgtcttt accctaaatg aatgcgctcc aatcataggc    1140
agccaggtgt tgtgccacga caaggagacc cagatgctgg acaagtggtc tgcctttgtc    1200
cgggaagttg acccggatat tttgaccgga tataatatca acaactttga cttcccctat    1260
ttgcttaacc gagcagctca cttgaaggtc aggaactttg agtatttggg caggattaag    1320
aacattcgtt cggtgatcaa ggaacagatg ttgcagtcga agcagatggg tcgcagggaa    1380
aaccagtacg ttaattttga gggtagagtt cccttcgatc tcctctttgt cctgctgcgc    1440
gactacaaac tacgctcgta cactctcaac gctgtgagct atcactttct gcaggagcaa    1500
aaggaggatg tgcatcatag cattatcaca gatcttcaga atggagacga gcagacacgt    1560
cgccgttcgg ccatgtactg cctaaaggat gcctacttac cgcttagatt gctggagaag    1620
ttaatggcca ttgttaacta catggagatg gccagggtga cgggtgtgcc actggagtcc    1680
ttgctcaccc gcggacaaca gataaaggtt ttaagtcaat tgctgcgcaa ggccaaaacc    1740
aagggattca tcatgccctc gtacacctct cagggatcgg atgaacagta tgaaggagcg    1800
actgtgattg aaccaaaacg tggctactat gcggacccca tctccacgct ggatttcgcc    1860
tctctgtatc caagtataat gatggcgcat aatttgtgct acaccacctt ggttttgggt    1920
ggaactcgtg agaagctgcg gcagcaggag aacctgcagg acgatcaagt ggaacgtacg    1980
cctgcaaaca actactttgt gaagtctgag gtgcgtcgtg gtctgctccc tgagattctg    2040
gaatctcttt tggcggccag aaagcgtgcc aaaaatgacc taaaagtgga aacagatccg    2100
tttaaaagaa aggtcctgga tggcagacag ctggcgctga agatttcggc taattccgtg    2160
tacggattta ctggcgcaca ggttggaaag ttgccatgct tagagatctc gggcagcgtc    2220
accgcctacg gtcgtaccat gatcgagatg acgaaaaacg aagtggaatc ccattacaca    2280
caggccaatg gctacgagaa caatgcagtg gtcatctacg gcgacactga ttctgtgatg    2340
gttaatttcg gagtaaaaac tctggagcgc agcatggagc tgggacgcga ggctgccgaa    2400
ctggtcagtt ccaagttcgt gcatcctatt aaattggaat tcgagaaagt ttactatcct    2460
tacctgctga ttaacaagaa acgctatgcg ggattatact ttacgcgccc agatacctac    2520
gataaaatgg attgcaaggg catagaaacc gtgaggagag ataactctcc gctggtggcc    2580
aacctgatga actcctgcct gcagaaacta ctcatcgaaa gggatcccga tggtgcagtt    2640
gcctatgtga aacaggtgat agccgatctc ctctgcaatc gcatcgacat ctcgcacttg    2700
gtcataacca aggagttggc caaaacggat tacgcagcca aacaggcaca cgttgagctg    2760
gccgccaaga tgaagaaaag agatcccggt acggcgccca aactggggga tcgagttccc    2820
tatgtgatct gtgcggcagc caaaaacaca cccgcttacc agaaggccga ggatccgctg    2880
tatgtgctgg aaaacagcgt gcccatcgat gccacttact acctggaaca gcagctgtct    2940
aagccgctgc taaggatctt tgaacctatt ttgggcgaca atgccgagtc aattttgtta    3000
aaaggagaac acacgcgcac acgaactgtg gtaacatcca aagtgggtgg acttgctgga    3060
tttatgacca agaaaacgtc gtgtttgggc tgcaaatccc tgatgcccaa gggctacgaa    3120
caggcctgtc tgtgtccaca ctgcgagcca cgaatgagtg agctgtatca gaaggaggtg    3180
ggtgcgaaga gggaactgga ggagaccttc tctcgcctgt ggaccgagtg ccagcgatgc    3240
caggaatcct tgcacgagga ggttatctgc tccaacagag attgccccat cttctacatg    3300
cgacagaagg ttcgcatgga tctggacaat caggagaagc gggtgttgcg attcggcctg    3360
gccgagtggt aaccattgca tgagtttact gaattgttta atcctataat ttaataatta    3420
tattactaga agttattaaa aaaaaaaaaa aaaaaaa                             3457
<210>64
<211>1092
<212>PRT
<213>黑腹果蝇(Drosophila melanogaster)
<400>64
Met Asp Gly Lys Arg Lys Phe Asn Gly Thr Ser Asn Gly His Ala Lys
  1               5                  10                  15
Lys Pro Arg Asn Pro Asp Asp Asp Glu Glu Met Gly Phe Glu Ala Glu
             20                  25                  30
Leu Ala Ala Phe Glu Asn Ser Glu Asp Met Asp Gln Thr Leu Leu Met
         35                  40                  45
Gly Asp Gly Pro Glu Asn Gln Thr Thr Ser Glu Arg Trp Ser Arg Pro
     50                  55                  60
Pro Pro Pro Glu Leu Asp Pro Ser Lys His Asn Leu Glu Phe Gln Gln
 65                  70                  75                  80
Leu Asp Val Glu Asn Tyr Leu Gly Gln Pro Leu Pro Gly Met Pro Gly
                 85                  90                  95
Ala Gln Ile Gly Pro Val Pro Val Val Arg Met Phe Gly Val Thr Met
            100                 105                 110
Glu Gly Asn Ser Val Cys Cys His Val His Gly Phe Cys Pro Tyr Phe
        115                 120                 125
Tyr Ile Glu Ala Pro Ser Gln Phe Glu Glu His His Cys Glu Lys Leu
    130                 135                 140
Gln Lys Ala Leu Asp Gln Lys Val Ile Ala Asp Ile Arg Asn Asn Lys
145                 150                 155                 160
Asp Asn Val Gln Glu Ala Val Leu Met Val Glu Leu Val Glu Lys Leu
                165                 170                 175
Asn Ile His Gly Tyr Asn Gly Asp Lys Lys Gln Arg Tyr Ile Lys Ile
            180                 185                 190
Ser Val Thr Leu Pro Arg Phe Val Ala Ala Ala Ser Arg Leu Leu Lys
        195                 200                 205
Lys Glu Val Ile Met Ser Glu Ile Asp Phe Gln Asp Cys Arg Ala Phe
    210                 215                 220
Glu Asn Asn Ile Asp Phe Asp Ile Arg Phe Met Val Asp Thr Asp Val
225                 230                 235                 240
Val Gly Cys Asn Trp Ile Glu Leu Pro Met Gly His Trp Arg Ile Arg
                245                 250                 255
Asn Ser His Ser Lys Pro Leu Pro Glu Ser Arg Cys Gln Ile Glu Val
            260                 265                 270
Asp Val Ala Phe Asp Arg Phe Ile Ser His Glu Pro Glu Gly Glu Trp
        275                 280                 285
Ser Lys Val Ala Pro Phe Arg Ile Leu Ser Phe Asp Ile Glu Cys Ala
    290                 295                 300
Gly Arg Lys Gly Ile Phe Pro Glu Ala Lys Ile Asp Pro Val Ile Gln
305                 310                 315                 320
Ile Ala Asn Met Val Ile Arg Gln Gly Glu Arg Glu Pro Phe Ile Arg
                325                 330                 335
Asn Val Phe Thr Leu Asn Glu Cys Ala Pro Ile Ile Gly Ser Gln Val
            340                 345                 350
Leu Cys His Asp Lys Glu Thr Gln Met Leu Asp Lys Trp Ser Ala Phe
        355                 360                 365
Val Arg Glu Val Asp Pro Asp Ile Leu Thr Gly Tyr Asn Ile Asn Asn
    370                 375                 380
Phe Asp Phe Pro Tyr Leu Leu Asn Arg Ala Ala His Leu Lys Val Arg
385                 390                 395                 400
Asn Phe Glu Tyr Leu Gly Arg Ile Lys Asn Ile Arg Ser Val Ile Lys
                405                 410                 415
Glu Gln Met Leu Gln Ser Lys Gln Met Gly Arg Arg Glu Asn Gln Tyr
            420                 425                 430
Val Asn Phe Glu Gly Arg Val Pro Phe Asp Leu Leu Phe Val Leu Leu
        435                 440                 445
Arg Asp Tyr Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Tyr His
    450                 455                 460
Phe Leu Gln Glu Gln Lys Glu Asp Val His His Ser Ile Ile Thr Asp
465                 470                 475                 480
Leu Gln Asn Gly Asp Glu Gln Thr Arg Arg Arg Ser Ala Met Tyr Cys
                485                 490                 495
Leu Lys Asp Ala Tyr Leu Pro Leu Arg Leu Leu Glu Lys Leu Met Ala
            500                 505                 5l0
Ile Val Asn Tyr Met Glu Met Ala Arg Val Thr Gly Val Pro Leu Glu
        515                 520                 525
Ser Leu Leu Thr Arg Gly Gln Gln Ile Lys Val Leu Ser Gln Leu Leu
    530                 535                 540
Arg Lys Ala Lys Thr Lys Gly Phe Ile Met Pro Ser Tyr Thr Ser Gln
545                 550                 555                 560
Gly Ser Asp Glu Gln Tyr Glu Gly Ala Thr Val Ile Glu Pro Lys Arg
                565                 570                 575
Gly Tyr Tyr Ala Asp Pro Ile Ser Thr Leu Asp Phe Ala Ser Leu Tyr
            580                 585                 590
Pro Ser Ile Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Val Leu
        595                 600                 605
Gly Gly Thr Arg Glu Lys Leu Arg Gln Gln Glu Asn Leu Gln Asp Asp
    610                 615                 620
Gln Val Glu Arg Thr Pro Ala Asn Asn Tyr Phe Val Lys Ser Glu Val
625                 630                 635                 640
Arg Arg Gly Leu Leu Pro Glu Ile Leu Glu Ser Leu Leu Ala Ala Arg
                645                 650                 655
Lys Arg Ala Lys Asn Asp Leu Lys Val Glu Thr Asp Pro Phe Lys Arg
            660                 665                 670
Lys Val Leu Asp Gly Arg Gln Leu Ala Leu Lys Ile Ser Ala Asn Ser
        675                 680                 685
Val Tyr Gly Phe Thr Gly Ala Gln Val Gly Lys Leu Pro Cys Leu Glu
    690                 695                 700
Ile Ser Gly Ser Val Thr Ala Tyr Gly Arg Thr Met Ile Glu Met Thr
705                 710                 715                 720
Lys Asn Glu Val Glu Ser His Tyr Thr Gln Ala Asn Gly Tyr Glu Asn
                725                 730                 735
Asn Ala Val Val Ile Tyr Gly Asp Thr Asp Ser Val Met Val Asn Phe
            740                 745                 750
Gly Val Lys Thr Leu Glu Arg Ser Met Glu Leu Gly Arg Glu Ala Ala
        755                 760                 765
Glu Leu Val Ser Ser Lys Phe Val His Pro Ile Lys Leu Glu Phe Glu
    770                 775                 780
Lys Val Tyr Tyr Pro Tyr Leu Leu Ile Asn Lys Lys Arg Tyr Ala Gly
785                 790                 795                 800
Leu Tyr Phe Thr Arg Pro Asp Thr Tyr Asp Lys Met Asp Cys Lys Gly
                805                 810                 815
Ile Glu Thr Val Arg Arg Asp Asn Ser Pro Leu Val Ala Asn Leu Met
            820                 825                 830
Asn Ser Cys Leu Gln Lys Leu Leu Ile Glu Arg Asp Pro Asp Gly Ala
        835                 840                 845
Val Ala Tyr Val Lys Gln Val Ile Ala Asp Leu Leu Cys Asn Arg Ile
    850                 855                 860
Asp Ile Ser His Leu Val Ile Thr Lys Glu Leu Ala Lys Thr Asp Tyr
865                 870                 875                 880
Ala Ala Lys Gln Ala His Val Glu Leu Ala Ala Lys Met Lys Lys Arg
                885                 890                 895
Asp Pro Gly Thr Ala Pro Lys Leu Gly Asp Arg Val Pro Tyr Val Ile
            900                 905                 910
Cys Ala Ala Ala Lys Asn Thr Pro Ala Tyr Gln Lys Ala Glu Asp Pro
        915                 920                 925
Leu Tyr Val Leu Glu Asn Ser Val Pro Ile Asp Ala Thr Tyr Tyr Leu
    930                 935                 940
Glu Gln Gln Leu Ser Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu
945                 950                 955                 960
Gly Asp Asn Ala Glu Ser Ile Leu Leu Lys Gly Glu His Thr Arg Thr
                965                 970                 975
Arg Thr Val Val Thr Ser Lys Val Gly Gly Leu Ala Gly Phe Met Thr
            980                 985                 990
Lys Lys Thr Ser Cys Leu Gly Cys Lys Ser Leu Met Pro Lys Gly Tyr
        995                1000                1005
Glu Gln Ala Cys Leu Cys Pro His Cys Glu Pro Arg Met Ser Glu Leu
   1010                1015                1020
Tyr Gln Lys Glu Val Gly Ala Lys Arg Glu Leu Glu Glu Thr Phe Ser
1025               1030                1035                1040
Arg Leu Trp Thr Glu Cys Gln Arg Cys Gln Glu Ser Leu His Glu Glu
               1045                1050                1055
Val Ile Cys Ser Asn Arg Asp Cys Pro Ile Phe Tyr Met Arg Gln Lys
           1060                1065                1070
Val Arg Met Asp Leu Asp Asn Gln Glu Lys Arg Val Leu Arg Phe Gly
       1075                1080                1085
Leu Ala Glu Trp
    1090
<210>65
<211>9064
<212>DNA
<213>黑腹果蝇(Drosophila melanogaster)
<400>65
ctgcagcttg ggaaaatact tttggacacc ccaaaaaaag ttaagcgcga tattttccca    60
ccgtgaccat gacaaccact gtgcgttcga aaggctctct ctctctctct ctctttcgcg    120
caaatcaaaa acacaaacag gtttatgtgt gcggagagtg tgtgcgacag agagcggcga    180
tatggaactg aaacgactgc aatgttttta tattccggca acgcatttcg cataaattac    240
aaattacaca gcataagtga atgcaagtgc aggggcggca gtcaaatggc cagctgcacc    300
cagaaaaagg gcaataagat tcgggataac aaaacttgat ggcgttcccg attttcccgg    360
acaagggagc gtatatgtat gtacacacaa aaaaaaaact taaccagcct tgcataacga    420
aacacgtgca ataaaaatat gactgattgt caacctctgc tgcaacttaa ttgctgccgc    480
agaggtaaaa ctgaaaaaca taaaaggggg gcgacaagtg cagcaagcga aaaaataaag    540
aactcaaaga gcgcatgcgc gccgctctcc cactctctct ccctctctct ctgtcgctcc    600
actgcgctgg aatcttacaa ctcgtgtagg tgagccggat ttttatgatg atgcgcctgt    660
gtgcgtgact gcatgatgcc attgcagcgg agaactagta gaaaaaagtt cacatttcag    720
cagttggaaa acacatggcc aacaggccaa ctcaagtggc cagcagctgt ccttatattg    780
tcagcaaata ggtcatttaa tgcccattac acgaaaatta tagctaaaat ggtcaagctg    840
tgatgaaata aacataaata ttatatttta tgatttcatc agatttttag catttttttt    900
tttaatttgt gttaggtaga actacaaagc taagaataat tgaggatttc taggtaaaac    960
ttatattctt aaaaccattt aataattttc ttgttttctt ttatttgtag taacatttta    1020
aaattggcgc caaacgtgtt actttacagt gctgtgcaac agccaaatgt cagcattctc    1080
tgcaacgcgt tagcacattt ctgagacgtt tgcagatttt tggcggcaac aagttattta    1140
catttattta ttttatttct gctaaacagc acggaaatgt ccgactccgg caaaggcaaa    1200
gtgctgcaaa atacgggtaa attcgtcagc gagaatcgca cagaaggcgt gagtggtcaa    1260
agttcgtgga tttcacgctg aacaagggat ttttcaatct tatccacagg acgacttctt    1320
caatgaggcg ggctatcgtc aatcccggga gaacgataaa atcgattcga aatatggctt    1380
cgatcgggtt aaggacagcc aggagcggac gggctacctc atcaacatgc attcggtaag    1440
ttaggaagcc cataaaacgt tgaaaatcat atccaataat ggctatgcca attgcagaac    1500
gaagttttgg atgaggacag aagattgatt gctgccttgg acctgttctt catccaaatg    1560
gatggttccc gcttcaaatg cacggtggcc tatcagccat atttactcat ccgaccagag    1620
gataatatgc atctggaagt ggcgcgattt ctgggtcgca agtattccgg ccagatttct    1680
ggactggagc acataaccaa agaagatttg gatctgccca atcatctatc cggtttgcag    1740
cagcagtaca taaaactttc gtttctcaat cagacagcca tgaccaaggt tagaagggaa    1800
ctcatgtccg cggtgaagag aaatcaggag cgacagaaat ccaacacata ctacatgcaa    1860
atgctggcca cctcgctggc ccaatcctcc gcaggttccg aggatgccac attgggtaag    1920
aggcagcagg attacatgga ttgtattgtg gacataaggg agcatgatgt gccttaccac    1980
gtcagagtgt ccatcgattt gcgcatcttt tgtggacagt ggtacaatat caggtgcaga    2040
agtggcgtgg aattgcctac gatcacctgc cgaccggata ttctggacag acccgaaccc    2100
gtggtcctgg cctttgatat agaaaccact aagctgcccc ttaagtttcc cgatgcccag    2160
acggatcagg ttatgatgat ctcgtacatg atcgatggtc agggttatct gataaccaat    2220
cgtgagatta tatcatccaa tgtggacgat tttgagtaca ctcccaagcc ggaattcgag    2280
ggtaacttta tagtattcaa cgaagagaac gagatgcagc tgctccagcg cttcttcgat    2340
cacatcatgg aggtgcgtcc ccacatcatt gttacataca acggcgactt cttcgattgg    2400
cccttcgtgg agacgcgtgc tgcagtgtac gatctggaca tgaagcaaga gattggcttc    2460
tccaagctac gggatggcaa ttatctaagt cgccctgcca tacacatgga ttgcctatgt    2520
tgggtgaaac gagattctta tttacctgtt ggatctcaag gcttaaaggc ggtggccaag    2580
gctaaattac gctatgatcc tgtggaactc gatccggagg atatgtgccg catggccgtg    2640
gaacagcccc aagtgctggc caattactct gtatccgatg cggtggccac atactatctg    2700
tacatgaagt atgtgcatcc atttatcttc gccctaaata cgattattcc catggaaccc    2760
gatgagatcc taagaaaggg ttccggcaca ctctgtgaaa cgttgctgat ggtggaggct    2820
taccatgccc agattgtgta tcccaacaag catcagagtg agctgaataa gctctccaac    2880
gagggacacg tactggattc ggaaacctat gtgggtggtc atgtggaggc tttggaatcg    2940
ggtgttttcc gggcggacat accatgccgt tttcgtctag atcctgctat ggtcaagcaa    3000
ctgcaggagc aggttgatgc agttctgcgc cacgctatcg aagtggagga aggcataccg    3060
ctcgagaagg tcttgaatct ggatgaagtg cggcaggaga ttgtgcaggg gctacagggt    3120
ctgcacgata tacccaatcg cttggagcag ccggtcatct atcacttgga tgtgggtgcc    3180
atgtacccca acattatttt gaccaatcgc ctgcagccct cggcaatggt tagtgactta    3240
gattgtgccg cctgtgactt caacaagcca ggagttcggt gcaaacgttc catggactgg    3300
ttgtggcgcg gcgagatgtt gcccgcctcc aggaacgagt ttcagcgcat tcagcagcag    3360
ctggagaccg agaagtttcc accccttttc cctggcggac cacagcgagc ctttcacgag    3420
ctctccaagg aggatcaggc ggcgtacgag aagaaacgtc tgacggatta ctgccgcaag    3480
gcttacaaga agaccaagct aaccaaattg gaaacgcgca cttcgaccat ctgccagaag    3540
gagaacagct tctatgtgga cacggtgcga gcttttcgcg atcgtcgcta cgagtacaaa    3600
ggactaacca aagtggcaaa agcatcggtg aatgctgcgg tggcttcggg agacgcggca    3660
gagatcaagg cagccaaggg cagggaggtg ctctacgatt ccctgcagtt ggcccacaag    3720
tgcatcctga actccttcta tggctacgtg atgaggagag gagcccgttg gcattccatg    3780
cctatggccg gcattgtgtg cctcacgggc tcgaatatta tcaccaaggc gagggaaatt    3840
atcgagcgag ttggtcgacc actcgaattg gacactgatg gtatatggtg catattgcct    3900
ggctcctttc cgcaggagtt taccattcac acgagtcatg agaagaaaaa gaagattaac    3960
atatcatatc cgaatgcagt gctaaacact atggttaaag atcattttac caacgatcag    4020
taccacgagt tgaggaagga taaggaaaac aatctaccca aatacgatat tcgagatgag    4080
aactctatat tcttcgaggt ggatggaccc taccttgcca tggtgttacc cgctgccaaa    4140
gaggagggca agaagctgaa gaaaagatat gcggtcttta atttcgatgg cacactggct    4200
gaactcaagg gattcgaggt gaagcgacgc ggtgaactgc agctgatcaa aaatttccag    4260
agttccgtct tcgaagcttt cctcgctggt agcacacttg aggaatgcta tgcatctgtg    4320
gccaaggtgg cggattactg gcttgatgta ctctacagca gaggatcaaa tctacccgac    4380
tcggagctat tcgaacttat ttcggagaac aagagcatgt ccaagaagct tgaggagtat    4440
ggcgcccaaa agagtacgtc catctccacg gccaagcgat tggctgagtt cctgggcgag    4500
cagatggtaa aggatgcggg tctggcttgt aagtacatta tttcgaagaa acccgaagga    4560
gcacccgtca ccgagagagc tattcccttg gccattttcc aatccgaacc gagcgtgagg    4620
cgacatcacc tgcgtcgctg gcttaaggac aacaccatgg gcgatgcgga tatacgcgat    4680
gtgctcgatt ggaactacta catagagaga ttgggtggga ccattcagaa gatcataacc    4740
ataccggcgg cactgcaggg actggccaat ccagtgccca gagttcagca tccggattgg    4800
ttgcacaaga aaatgctgga gaagaacgat gtgctcaagc agcgtcgcat caatgagatg    4860
ttcaccagca gacccaaacc gaaacctcta gccacagagg aggacaagct ggccgatatg    4920
gaagatttgg ctggtaaaga tggcggtgag ggtgctgcag gctgtccgat agtcaccaag    4980
agaaagagaa tccagctgga ggagcacgat gaggaggagg cacagccgca ggccaccact    5040
tggcgtcagg ccttgggcgc tccaccgccc atcggtgaaa ccagaaagac catcgttgag    5100
tgggtgagat ttcagaagaa gaaatggaaa tggcagcagg atcagcgcca gcgtaatcgc    5160
caggcgagca agcgaactcg aggcgaggat ccacgctaca ctgggcggtt ccttagacgt    5220
gcacaacgca ccctgttgga ccagccgtgg cagatcgtac agttggtgcc cgtcgacgac    5280
ctgggccact tcactgtgtg ggccttaatc ggcgaagagt tgcacaagat caagttgacg    5340
gtaccgagga ttttctatgt taatcagcga agtgctgctc ctccagagga gggtcaactt    5400
tggcgcaagg tcaatcgagt tctgccacga tccagacctg ttttcaatct ctatcgatat    5460
agtgtgcccg aacagctctt ccgggataac tcgctgggca tgctggcgga tctggcgacg    5520
cccgacattg agggcatata cgagacgcag atgacgttgg aatttcgcgc cctcatggac    5580
atgggctgca tttgcggtgt ccagcgcgag gaggcacgtc gcttggccca attggccacc    5640
aaggatctgg aaacatttag catcgagcag ctggaacagg gccccagact caggtcaaat    5700
atttggctag cgccaacaat cgattgcgca aaatctactt gtatcagcat aacacaccga    5760
cggccaagaa ggagatctgt gtcactgatc ccaatgccta gcaagaaggc atttgttttt    5820
gccttggaca cagtgcgtgc caatcaaatg ccgaacatga ggcaattgta taccgccgag    5880
cgtttggccc tgctcaagaa tctgacggca gaggagcaag ataaaattcc tgtagaggat    5940
tacacatttg aggttctcat tgaggtggat gtcaaacaaa tttaccggca catacagcgg    6000
gcactgacca cctacaaaca ggagcatcag ggaccaccca ccattctgtg ccttcaaacg    6060
gcgctgtcgg cgcgtaaact cagcctggcc atgccgatcc tgctggagtt tccccaggct    6120
cagattcata tctccgatga cgctagtttg ctttctggcc ttgattggca gcgacagggc    6180
tccagggcag tgatacgcca ctttctgaat ctgaacaatg ttcttgattt gatgttggat    6240
cagtgtcgct actttcatgt gcccattggc aatatgccgc cggatactgt gcttttcgga    6300
gcggatcttt tcttcgctcg cttgctgcag cggcataact ttgtgctgtg gtggtcggcg    6360
agtaccagac cagatttggg tggccgggag gcggacgaca gccggctgtt ggcggaattc    6420
gaggagagca ttagtgtggt gcaaaacaag gccggtttct atccggatgt ttgcgtggag    6480
ctggctctgg atagcctggc ggtgagtgcc ctgctccaat cgactaggat tcaggaaatg    6540
gaaggcgcct catctgccat tacgttcgat gtgatgccgc aggtctcgct ggaggagatg    6600
attggcactg ttccggcggc caccttgccg agttatgatg aaacggccct ctgttccgcc    6660
gccttccgcg ttatgcgctc catggtgaat ggttggttgc gagaggtatc catcaatagg    6720
aacatcttct cggacttcca gatcgtgcac ttctatcgat gggtgcgctc cagtaatgca    6780
ctactctatg atcctgcttt gagaagatct ctgaataatc tgatgaggaa gatgttcttg    6840
cgcattatag cagagttcaa gagattgggc gccaccatta tctatgcgga ctttaacagg    6900
attatcctta gttcgggtaa gaaaaccgtt tccgatgccc tgggctatgt ggactacatt    6960
gtgcaaagct tgaggaacaa ggagatgttc cactccatcc aactgagctt cgagcaatgc    7020
tggaacttta tgctctggat ggaccaggca aatttctcgg gaattagggg aaagctacca    7080
aagggaatcg atgagacagt gtcgtcaata gtttccacta ccatgatacg ggattctgaa    7140
cgcaatcaag atgacgacga ggatgaagaa gaggattcgg aaaaccgtga tccagtggag    7200
agcaacgagg ccgagcagga tcaagaggat gagctgtccc tggagctcaa ctggacaatt    7260
ggcgaacatc tgcccgatga aaacgagtgc cgcgaaaagt ttgaatccct gctgaccctc    7320
tttatgcaat ctttggccga aaagaagacc accgagcagg ccatcaagga tatctcgcac    7380
tgcgcgttcg actttatcct gaaactgcac aaaaactacg gcaagggcaa gcccagcccg    7440
ggcctagaac ttatccgcac tctgatcaag gcgttgagtg tggacaaaac gctggcggag    7500
cagatcaacg agttgcgccg aaatatgctg cgtctggtgg ggattggtga gttctcggac    7560
ttggctgagt gggaggatcc ctgcgacagt cacatcatca acgaggtcat ctgcaaagcg    7620
tgtaatcact gcagggacct ggatctctgc aaggacaagc atcgcgccat gaaagatgga    7680
gtgtgagtta cacaaatcag tacacataat ttaccacaaa taattgatta atgttggatt    7740
tttcagaccc gtttggctgt gtgcccagtg ctatgtggcc tatgataacg aggagatcga    7800
aatgagaatg ctggatgcac tgcagcgcaa gatgatgtcc tatgtgctgc aggatttgcg    7860
ctgttcgcgc tgcagcgaga tcaagcgcga gaatctggca gagttctgca cttgcgctgg    7920
caactttgtg cccctcatca gcgggaagga catccagaca ctgctgggca cattcaacaa    7980
ggtggctgcc aaccacaaga tgcagttgct ccagcagact gttcatcagg cgctgaccac    8040
gccacgctag gacctagttt gttgttgttt tctagatcgt agggcttaaa tatattgtat    8100
ttataatgga atttaattcg attttaatga gttttgagtt tatgatgtcg cacaagacga    8160
atgtctgtgt taaggaatgg acgcgcttta taattcaatg agattcacac acttttagtg    8220
gctttcgcat acgaatcgct tgttgttttc ccgattttat tggttttttt tgttgacttg    8280
cccgcggttt ttgggggcgc acaggcgaaa tcagcagctg aacttaaagc aattagacta    8340
actcattcgc gaagagcgat ctctactgtg gggcctgggt gatgggatcg accttaacat    8400
cggggaactg gaattcgggg aacttcagca tgtcggtctt gccatcgctg ccaaactgct    8460
tggccacacg gtccagttcg gtcttcagct cccgctcaat atcgggattg gagtccacca    8520
gcttgccacc gctgcaggtg agcaaaacaa ggattatgtc gaggcacacc aacggatgaa    8580
ggagccagaa cttacgcgct cttctgcttg tactcgcgca ctttgtccag aaacagctgc    8640
tggatgggat cggaggcctt gttcagggca ggggcaacga ttccgaagtt acgacgggcc    8700
tctgtgcgca ggacacgcat gccactcagc agggattgcg acagcatctg gaattgatag    8760
atccatgtta gaatagcaat aaacggcctt cttcatatgt aaccttaaaa aggttatgta    8820
atacaattgt ttgtttcgac gtttcccaat cggttttcaa gccgactttg ctagcaacta    8880
tatcttgtat tcaaattgta ttccctcaat cgatttttat gtattttaaa tcttgttttc    8940
accttatttt cctttgcaaa tgctaacttt cgtgcggaaa agtgacaatt gtcagttcac    9000
aatggcagtt ggtgttagtg atgtgcgcgt gatgggtgta tgcgatacta tcgtatgtaa    9060
gctt                                                                 9064
<210>66
<211>2220
<212>PRT
<213>黑腹果蝇(Drosophila melanogaster)
<400>66
Met Ser Asp Ser Gly Lys Gly Lys Val Leu Gln Asn Thr Gly Lys Phe
  1               5                  10                  15
Val Ser Glu Asn Arg Thr Glu Gly Asp Asp Phe Phe Asn Glu Ala Gly
             20                  25                  30
Tyr Arg Gln Ser Arg Glu Asn Asp Lys Ile Asp Ser Lys Tyr Gly Phe
         35                  40                  45
Asp Arg Val Lys Asp Ser Gln Glu Arg Thr Gly Tyr Leu Ile Asn Met
     50                  55                  60
His Ser Asn Glu Val Leu Asp Glu Asp Arg Arg Leu Ile Ala Ala Leu
 65                  70                  75                  80
Asp Leu Phe Phe Ile Gln Met Asp Gly Ser Arg Phe Lys Cys Thr Val
                 85                  90                  95
Ala Tyr Gln Pro Tyr Leu Leu Ile Arg Pro Glu Asp Asn Met His Leu
            100                 105                 110
Glu Val Ala Arg Phe Leu Gly Arg Lys Tyr Ser Gly Gln Ile Ser Gly
        115                 120                 125
Leu Glu His Ile Thr Lys Glu Asp Leu Asp Leu Pro Asn His Leu Ser
    130                 135                 140
Gly Leu Gln Gln Gln Tyr Ile Lys Leu Ser Phe Leu Asn Gln Thr Ala
145                 150                 155                 160
Met Thr Lys Val Arg Arg Glu Leu Met Ser Ala Val Lys Arg Asn Gln
                165                 170                 175
Glu Arg Gln Lys Ser Asn Thr Tyr Tyr Met Gln Met Leu Ala Thr Ser
            180                 185                 190
Leu Ala Gln Ser Ser Ala Gly Ser Glu Asp Ala Thr Leu Gly Lys Arg
        195                 200                 205
Gln Gln Asp Tyr Met Asp Cys Ile Val Asp Ile Arg Glu His Asp Val
    210                 215                 220
Pro Tyr His Val Arg Val Ser Ile Asp Leu Arg Ile Phe Cys Gly Gln
225                 230                 235                 240
Trp Tyr Asn Ile Arg Cys Arg Ser Gly Val Glu Leu Pro Thr Ile Thr
                245                 250                 255
Cys Arg Pro Asp Ile Leu Asp Arg Pro Glu Pro Val Val Leu Ala Phe
            260                 265                 270
Asp Ile Glu Thr Thr Lys Leu Pro Leu Lys Phe Pro Asp Ala Gln Thr
        275                 280                 285
Asp Gln Val Met Met Ile Ser Tyr Met Ile Asp Gly Gln Gly Tyr Leu
    290                 295                 300
Ile Thr Asn Arg Glu Ile Ile Ser Ser Asn Val Asp Asp Phe Glu Tyr
305                 310                 315                 320
Thr Pro Lys Pro Glu Phe Glu Gly Asn Phe Ile Val Phe Asn Glu Glu
                325                 330                 335
Asn Glu Met Gln Leu Leu Gln Arg Phe Phe Asp His Ile Met Glu Val
            340                 345                 350
Arg Pro His Ile Ile Val Thr Tyr Asn Gly Asp Phe Phe Asp Trp Pro
        355                 360                 365
Phe Val Glu Thr Arg Ala Ala Val Tyr Asp Leu Asp Met Lys Gln Glu
    370                 375                 380
Ile Gly Phe Ser Lys Leu Arg Asp Gly Asn Tyr Leu Ser Arg Pro Ala
385                 390                 395                 400
Ile His Met Asp Cys Leu Cys Trp Val Lys Arg Asp Ser Tyr Leu Pro
                405                 410                 415
Val Gly Ser Gln Gly Leu Lys Ala Val Ala Lys Ala Lys Leu Arg Tyr
            420                 425                 430
Asp Pro Val Glu Leu Asp Pro Glu Asp Met Cys Arg Met Ala Val Glu
        435                 440                 445
Gln Pro Gln Val Leu Ala Asn Tyr Ser Val Ser Asp Ala Val Ala Thr
    450                 455                 460
Tyr Tyr Leu Tyr Met Lys Tyr Val His Pro Phe Ile Phe Ala Leu Asn
465                 470                 475                 480
Thr Ile Ile Pro Met Glu Pro Asp Glu Ile Leu Arg Lys Gly Ser Gly
                485                 490                 495
Thr Leu Cys Glu Thr Leu Leu Met Val Glu Ala Tyr His Ala Gln Ile
            500                 505                 510
Val Tyr Pro Asn Lys His Gln Ser Glu Leu Asn Lys Leu Ser Asn Glu
        515                 520                 525
Gly His Val Leu Asp Ser Glu Thr Tyr Val Gly Gly His Val Glu Ala
    530                 535                 540
Leu Glu Ser Gly Val Phe Arg Ala Asp Ile Pro Cys Arg Phe Arg Leu
545                 550                 555                 560
Asp Pro Ala Met Val Lys Gln Leu Gln Glu Gln Val Asp Ala Val Leu
                565                 570                 575
Arg His Ala Ile Glu Val Glu Glu Gly Ile Pro Leu Glu Lys Val Leu
            580                 585                 590
Asn Leu Asp Glu Val Arg Gln Glu Ile Val Gln Gly Leu Gln Gly Leu
        595                 600                 605
His Asp Ile Pro Asn Arg Leu Glu Gln Pro Val Ile Tyr His Leu Asp
    610                 615                 620
Val Gly Ala Met Tyr Pro Asn Ile Ile Leu Thr Asn Arg Leu Gln Pro
625                 630                 635                 640
Ser Ala Met Val Ser Asp Leu Asp Cys Ala Ala Cys Asp Phe Asn Lys
                645                 650                 655
Pro Gly Val Arg Cys Lys Arg Ser Met Asp Trp Leu Trp Arg Gly Glu
            660                 665                 670
Met Leu Pro Ala Ser Arg Asn Glu Phe Gln Arg Ile Gln Gln Gln Leu
        675                 680                 685
Glu Thr Glu Lys Phe Pro Pro Leu Phe Pro Gly Gly Pro Gln Arg Ala
    690                 695                 700
Phe His Glu Leu Ser Lys Glu Asp Gln Ala Ala Tyr Glu Lys Lys Arg
705                 710                 715                 720
Leu Thr Asp Tyr Cys Arg Lys Ala Tyr Lys Lys Thr Lys Leu Thr Lys
                725                 730                 735
Leu Glu Thr Arg Thr Ser Thr Ile Cys Gln Lys Glu Asn Ser Phe Tyr
            740                 745                 750
Val Asp Thr Val Arg Ala Phe Arg Asp Arg Arg Tyr Glu Tyr Lys Gly
        755                 760                 765
Leu Thr Lys Val Ala Lys Ala Ser Val Asn Ala Ala Val Ala Ser Gly
    770                 775                 780
Asp Ala Ala Glu Ile Lys Ala Ala Lys Gly Arg Glu Val Leu Tyr Asp
785                 790                 795                 800
Ser Leu Gln Leu Ala His Lys Cys Ile Leu Asn Ser Phe Tyr Gly Tyr
                805                 810                 815
Val Met Arg Arg Gly Ala Arg Trp His Ser Met Pro Met Ala Gly Ile
            820                 825                 830
Val Cys Leu Thr Gly Ser Asn Ile Ile Thr Lys Ala Arg Glu Ile Ile
        835                 840                 845
Glu Arg Val Gly Arg Pro Leu Glu Leu Asp Thr Asp Gly Ile Trp Cys
    850                 855                 860
Ile Leu Pro Gly Ser Phe Pro Gln Glu Phe Thr Ile His Thr Ser His
865                 870                 875                 880
Glu Lys Lys Lys Lys Ile Asn Ile Ser Tyr Pro Asn Ala Val Leu Asn
                885                 890                 895
Thr Met Val Lys Asp His Phe Thr Asn Asp Gln Tyr His Glu Leu Arg
            900                 905                 910
Lys Asp Lys Glu Asn Asn Leu Pro Lys Tyr Asp Ile Arg Asp Glu Asn
        915                 920                 925
Ser Ile Phe Phe Glu Val Asp Gly Pro Tyr Leu Ala Met Val Leu Pro
    930                 935                 940
Ala Ala Lys Glu Glu Gly Lys Lys Leu Lys Lys Arg Tyr Ala Val Phe
945                 950                 955                 960
Asn Phe Asp Gly Thr Leu Ala Glu Leu Lys Gly Phe Glu Val Lys Arg
                965                 970                 975
Arg Gly Glu Leu Gln Leu Ile Lys Asn Phe Gln Ser Ser Val Phe Glu
            980                 985                 990
Ala Phe Leu Ala Gly Ser Thr Leu Glu Glu Cys Tyr Ala Ser Val Ala
        995                1000                1005
Lys Val Ala Asp Tyr Trp Leu Asp Val Leu Tyr Ser Arg Gly Ser Asn
   1010                1015                1020
Leu Pro Asp Ser Glu Leu Phe Glu Leu Ile Ser Glu Asn Lys Ser Met
1025               1030                1035                1040
Ser Lys Lys Leu Glu Glu Tyr Gly Ala Gln Lys Ser Thr Ser Ile Ser
               1045                1050                1055
Thr Ala Lys Arg Leu Ala Glu Phe Leu Gly Glu Gln Met Val Lys Asp
           1060                1065                1070
Ala Gly Leu Ala Cys Lys Tyr Ile Ile Ser Lys Lys Pro Glu Gly Ala
       1075                1080                1085
Pro Val Thr Glu Arg Ala Ile Pro Leu Ala Ile Phe Gln Ser Glu Pro
   1090                1095                1100
Ser Val Arg Arg His His Leu Arg Arg Trp Leu Lys Asp Asn Thr Met
1105               1110                1115                1120
Gly Asp Ala Asp Ile Arg Asp Val Leu Asp Trp Asn Tyr Tyr Ile Glu
               1125                1130                1135
Arg Leu Gly Gly Thr Ile Gln Lys Ile Ile Thr Ile Pro Ala Ala Leu
           1140                1145                1150
Gln Gly Leu Ala Asn Pro Val Pro Arg Val Gln His Pro Asp Trp Leu
       1155                1160                1165
His Lys Lys Met Leu Glu Lys Asn Asp Val Leu Lys Gln Arg Arg Ile
   1170                1175                1180
Asn Glu Met Phe Thr Ser Arg Pro Lys Pro Lys Pro Leu Ala Thr Glu
1185               1190                1195                1200
Glu Asp Lys Leu Ala Asp Met Glu Asp Leu Ala Gly Lys Asp Gly Gly
               1205                1210                1215
Glu Gly Ala Ala Gly Cys Pro Ile Val Thr Lys Arg Lys Arg Ile Gln
           1220                1225                1230
Leu Glu Glu His Asp Glu Glu Glu Ala Gln Pro Gln Ala Thr Thr Trp
       1235                1240                1245
Arg Gln Ala Leu Gly Ala Pro Pro Pro Ile Gly Glu Thr Arg Lys Thr
   1250                1255                1260
Ile Val Glu Trp Val Arg Phe Gln Lys Lys Lys Trp Lys Trp Gln Gln
1265               1270                1275                1280
Asp Gln Arg Gln Arg Asn Arg Gln Ala Ser Lys Arg Thr Arg Gly Glu
               1285                1290                1295
Asp Pro Arg Tyr Thr Gly Arg Phe Leu Arg Arg Ala Gln Arg Thr Leu
           1300                1305                1310
Leu Asp Gln Pro Trp Gln Ile Val Gln Leu Val Pro Val Asp Asp Leu
       1315                1320                1325
Gly His Phe Thr Val Trp Ala Leu Ile Gly Glu Glu Leu His Lys Ile
   1330                1335                1340
Lys Leu Thr Val Pro Arg Ile Phe Tyr Val Asn Gln Arg Ser Ala Ala
1345               1350                1355                1360
Pro Pro Glu Glu Gly Gln Leu Trp Arg Lys Val Asn Arg Val Leu Pro
               1365                1370                1375
Arg Ser Arg Pro Val Phe Asn Leu Tyr Arg Tyr Ser Val Pro Glu Gln
           1380                1385                1390
Leu Phe Arg Asp Asn Ser Leu Gly Met Leu Ala Asp Leu Ala Thr Pro
       1395                1400                1405
Asp Ile Glu Gly Ile Tyr Glu Thr Gln Met Thr Leu Glu Phe Arg Ala
   1410                1415                1420
Leu Met Asp Met Gly Cys Ile Cys Gly Val Gln Arg Glu Glu Ala Arg
1425               1430                1435                1440
Arg Leu Ala Gln Leu Ala Thr Lys Asp Leu Glu Thr Phe Ser Ile Glu
               1445                1450                1455
Gln Leu Glu Gln Gly Pro Arg Leu Arg Ser Asn Ile Trp Leu Ala Pro
           1460                1465                1470
Thr Ile Asp Cys Ala Lys Ser Thr Cys Ile Ser Ile Thr His Arg Arg
       1475                1480                1485
Pro Arg Arg Arg Ser Val Ser Leu Ile Pro Met Pro Ser Lys Lys Ala
   1490                1495                1500
Phe Val Phe Ala Leu Asp Thr Val Arg Ala Asn Gln Met Pro Asn Met
1505               1510                1515                1520
Arg Gln Leu Tyr Thr Ala Glu Arg Leu Ala Leu Leu Lys Asn Leu Thr
               1525                1530                1535
Ala Glu Glu Gln Asp Lys Ile Pro Val Glu Asp Tyr Thr Phe Glu Val
           1540                1545                1550
Leu Ile Glu Val Asp Val Lys Gln Ile Tyr Arg His Ile Gln Arg Ala
       1555                1560                1565
Leu Thr Thr Tyr Lys Gln Glu His Gln Gly Pro Pro Thr Ile Leu Cys
   1570                1575                1580
Leu Gln Thr Ala Leu Ser Ala Arg Lys Leu Ser Leu Ala Met Pro Ile
1585               1590                1595                1600
Leu Leu Glu Phe Pro Gln Ala Gln Ile His Ile Ser Asp Asp Ala Ser
               1605                1610                1615
Leu Leu Ser Gly Leu Asp Trp Gln Arg Gln Gly Ser Arg Ala Val Ile
           1620                1625                1630
Arg His Phe Leu Asn Leu Asn Asn Val Leu Asp Leu Met Leu Asp Gln
       1635                1640                1645
Cys Arg Tyr Phe His Val Pro Ile Gly Asn Met Pro Pro Asp Thr Val
   1650                1655                1660
Leu Phe Gly Ala Asp Leu Phe Phe Ala Arg Leu Leu Gln Arg His Asn
1665               1670                1675                1680
Phe Val Leu Trp Trp Ser Ala Ser Thr Arg Pro Asp Leu Gly Gly Arg
               1685                1690                1695
Glu Ala Asp Asp Ser Arg Leu Leu Ala Glu Phe Glu Glu Ser Ile Ser
           1700                1705                1710
Val Val Gln Asn Lys Ala Gly Phe Tyr Pro Asp Val Cys Val Glu Leu
       1715                1720                1725
Ala Leu Asp Ser Leu Ala Val Ser Ala Leu Leu Gln Ser Thr Arg Ile
   1730                1735                1740
Gln Glu Met Glu Gly Ala Ser Ser Ala Ile Thr Phe Asp Val Met Pro
1745               1750                1755                1760
Gln Val Ser Leu Glu Glu Met Ile Gly Thr Val Pro Ala Ala Thr Leu
               1765                1770                1775
Pro Ser Tyr Asp Glu Thr Ala Leu Cys Ser Ala Ala Phe Arg Val Met
           1780                1785                1790
Arg Ser Met Val Asn Gly Trp Leu Arg Glu Val Ser Ile Asn Arg Asn
       1795                1800                1805
Ile Phe Ser Asp Phe Gln Ile Val His Phe Tyr Arg Trp Val Arg Ser
   1810                1815                1820
Ser Asn Ala Leu Leu Tyr Asp Pro Ala Leu Arg Arg Ser Leu Asn Asn
1825               1830                1835                1840
Leu Met Arg Lys Met Phe Leu Arg Ile Ile Ala Glu Phe Lys Arg Leu
               1845                1850                1855
Gly Ala Thr Ile Ile Tyr Ala Asp Phe Asn Arg Ile Ile Leu Ser Ser
           1860                1865                1870
Gly Lys Lys Thr Val Ser Asp Ala Leu Gly Tyr Val Asp Tyr Ile Val
       1875                1880                1885
Gln Ser Leu Arg Asn Lys Glu Met Phe His Ser Ile Gln Leu Ser Phe
   1890                1895                1900
Glu Gln Cys Trp Asn Phe Met Leu Trp Met Asp Gln Ala Asn Phe Ser
1905               1910                1915                1920
Gly Ile Arg Gly Lys Leu Pro Lys Gly Ile Asp Glu Thr Val Ser Ser
               1925                1930                1935
Ile Val Ser Thr Thr Met Ile Arg Asp Ser Glu Arg Asn Gln Asp Asp
           1940                1945                1950
Asp Glu Asp Glu Glu Glu Asp Ser Glu Asn Arg Asp Pro Val Glu Ser
       1955                1960                1965
Asn Glu Ala Glu Gln Asp Gln Glu Asp Glu Leu Ser Leu Glu Leu Asn
   1970                1975                1980
Trp Thr Ile Gly Glu His Leu Pro Asp Glu Asn Glu Cys Arg Glu Lys
1985               1990                1995                2000
Phe Glu Ser Leu Leu Thr Leu Phe Met Gln Ser Leu Ala Glu Lys Lys
               2005                2010                2015
Thr Thr Glu Gln Ala Ile Lys Asp Ile Ser His Cys Ala Phe Asp Phe
           2020                2025                2030
Ile Leu Lys Leu His Lys Asn Tyr Gly Lys Gly Lys Pro Ser Pro Gly
       2035                2040                2045
Leu Glu Leu Ile Arg Thr Leu Ile Lys Ala Leu Ser Val Asp Lys Thr
   2050                2055                2060
Leu Ala Glu Gln Ile Asn Glu Leu Arg Arg Asn Met Leu Arg Leu Val
2065               2070                2075                2080
Gly Ile Gly Glu Phe Ser Asp Leu Ala Glu Trp Glu Asp Pro Cys Asp
               2085                2090                2095
Ser His Ile Ile Asn Glu Val Ile Cys Lys Ala Cys Asn His Cys Arg
           2100                2105                2110
Asp Leu Asp Leu Cys Lys Asp Lys His Arg Ala Met Lys Asp Gly Cys
       2115                2120                2125
Tyr Val Ala Tyr Asp Asn Glu Glu Ile Glu Met Arg Met Leu Asp Ala
   2130                2135                2140
Leu Gln Arg Lys Met Met Ser Tyr Val Leu Gln Asp Leu Arg Cys Ser
2145               2150                2155                2160
Arg Cys Ser Glu Ile Lys Arg Glu Asn Leu Ala Glu Phe Cys Thr Cys
               2165                2170                2175
Ala Gly Asn Phe Val Pro Leu Ile Ser Gly Lys Asp Ile Gln Thr Leu
           2180                2185                2190
Leu Gly Thr Phe Asn Lys Val Ala Ala Asn His Lys Met Gln Leu Leu
       2195                2200                2205
Gln Gln Thr Val His Gln Ala Leu Thr Thr Pro Arg
   2210                2215                2220
<210>67
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物
<400>67
gactagtggc tatcttgtgg cgggaa                                     26
<210>68
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物
<400>68
ggaat tcctt gtcccgtgtc aggtca                                    26
<210>69
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>69
cagaactttg ccctcccata cctc                                           24
<210>70
<211>3318
<212>DNA
<213>小鼠(Mus musculus)
<400>70
atggattgta agcggcgaca aggaccaggc cctggggtgc ccccaaagcg ggctcgaggg    60
cacctctggg atgaggacga gccttcgccg tcgcagtttg aggcgaacct ggcactgctg    120
gaggaaatag aggctgagaa ccggctgcag gaggcagagg aggagctgca gctgccccca    180
gagggcaccg tgggtgggca gttttccact gcagacattg accctcggtg gcggcggccc    240
accctacgtg ccctggaccc cagcacggag cccctcatct tccagcagct ggagattgac    300
cactatgtgg gctcagcacc acccctgcca gaagggcccc tgccatcccg gaactcagtg    360
cccatactga gggcctttgg ggtcaccgat gaaggcttct ccgtctgctg ccacatacag    420
ggctttgccc cctacttcta cacccccgcg cctcctggtt ttggggccga gcacctgagt    480
gagctgcagc aggagctgaa cgcagccatc agccgggacc agcgcggtgg gaaggagctc    540
tcagggccgg cagtgctggc aatagagcta tgctcccgtg agagcatgtt tgggtaccac    600
ggtcatggcc cttctccatt tctccgcatc accctggcac taccccgcct tatggcacca    660
gcccgccgcc ttctggaaca gggtgtccga gtgccaggcc tgggcacccc gagcttcgca    720
ccctacgaag ccaacgtgga ctttgagatc cggttcatgg tggatgctga cattgtggga    780
tgcaactggt tggagctgcc agctggaaag tacgttcgga gggcggagaa gaaggccacc    840
ctgtgtcagc tggaggtgga cgtgctgtgg tcagatgtga tcagtcaccc accggagggg    900
cagtggcagc gcattgcacc cctgcgtgtg cttagcttcg acatcgagtg tgctggccga    960
aaaggcatct tccctgagcc tgagcgtgac cccgtgatcc agatctgttc tctggggctg    1020
cgctgggggg agccggagcc attcttgcgt ctggcactca cgctgcggcc ctgtgccccc    1080
atcctgggtg ccaaagtgca gagctatgag cgggaagaag acctgctcca ggcctgggcc    1140
gacttcatcc ttgccatgga ccctgacgtg atcaccggct acaacattca gaactttgcc    1200
ctcccatacc tcatctctcg ggcacaggcc ctaaaggtgg accgcttccc tttcctgggc    1260
cgcgtgactg gtctccgctc caacatccgt gactcctcct tccaatcaag gcaggtcggc    1320
cggcgggaca gtaaggtgat cagcatggtg ggtcgcgttc agatggatat gctgcaggtg    1380
ctgcttcggg aacacaagct ccgctcctac acgctcaacg ctgtgagttt ccacttcctg    1440
ggcgagcaga aggaggacgt tcagcacagc atcatcaccg acctgcagaa tgggaacgaa    1500
cagacgcgcc gccgcctggc cgtgtactgc ctgaaggacg cctttctgcc actccgacta    1560
ctagagcgcc ttatggtgct ggtgaataat gtggagatgg cgcgtgtcac gggtgtaccc    1620
cttgggtacc tgctcacccg gggccagcag gtcaaggtcg tgtctcagct gctgcgccag    1680
gccatgcgcc aggggctgct gatgcctgtg gtgaagaccg agggcagtga ggactacacg    1740
ggagccacag tcattgagcc cctcaaaggg tactatgacg tccccattgc caccctggac    1800
ttctcctcct tgtacccatc catcatgatg gcccataatc tgtgctacac cacgctgctc    1860
cgacctgggg ctgcccagaa gctgggcctt aaaccagatg agttcatcaa gacacccact    1920
ggggatgagt ttgtgaagtc atctgtacgg aagggcctcc tgccccagat cctggagaat    1980
ctgctgagtg cccgcaagag ggccaaggct gagctggctc aggagacgga ccccctgcgg    2040
cgacaggtct tggacggccg gcaactggca ctaaaagtga gtgccaactc cgtatatggc    2100
ttcactggtg cccaggtggg caagctgcca tgtttggaga tctcccagag tgtcactggg    2160
ttcgggcggc agatgattga gaaaaccaag cagcttgtgg agtccaagta caccgtggaa    2220
aatggctacg atgccaacgc caaggtagtc tacggtgaca cggactctgt gatgtgccgg    2280
tttggcgtct cctctgtggc tgaagcaatg tctctggggc gggaggctgc aaactgggta    2340
tccagtcact tcccatcacc catccggctg gagttcgaga aggtttactt cccatacctg    2400
ctcatcagca agaagcgcta tgctggcctg ctcttctcct cccgctctga tgcccatgac    2460
aaaatggact gcaagggcct ggaggctgtg cgcagggaca actgtcccct ggtggccaac    2520
ctcgttacat cctctctgcg ccggatcctc gtggaccggg accctgatgg ggcagtagcc    2580
catgccaagg acgtcatctc ggacctgctg tgcaaccgca tagacatctc ccagctggtc    2640
atcaccaaag agttgacccg cgcagcagca gactatgctg gcaagcaggc tcacgtggag    2700
ctggctgaga ggatgaggaa gcgcgacccc ggcagtgcgc ccagcctggg tgaccgagtc    2760
ccctatgtga tcattggtgc tgctaagggt gtggccgcct acatgaagtc ggaggacccc    2820
ctgtttgtgc tggagcacag cctgcccatc gacactcagt actacctgga gcagcagctg    2880
gccaagccgc tcttgcgcat ctttgagccc atcctgggtg agggccgtgc agagtctgtg    2940
ctgctgcgcg gtgaccacac acgatgcaag actgtgctca ccagcaaggt gggcggcctc    3000
ttggccttca ccaagcgccg caactgttgc attggctgcc gctccgtaat cgaccatcaa    3060
ggagccgtgt gtaagttctg tcagccacgg gagtcggagc tctatcagaa ggaggtgtca    3120
cacctgaatg ccttggaaga acggttctct cgcctctgga cacagtgtca acgctgccag    3180
ggcagcttgc atgaggacgt catctgtacc agccgtgact gtcccatctt ctacatgcgc    3240
aagaaggtgc gcaaggacct ggaagaccag gaacggctgc tgcagcgctt tggaccgccc    3300
ggccctgagg cctggtga                                                  3318
<210>71
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物
<400>71
tccccgcggc tgcagaggat tttccacag                                      29
<210>72
<211>28
<212>DNA
<213>人工序列
<220>
<223>引物
<400>72
ggactagtat ggtatgcaca acagcctc                                       28
<210>73
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物
<400>73
tccccgcgga gtggttgtgg gagacttac                                      29
<210>74
<211>28
<212>DNA
<213>人工序列
<220>
<223>引物
<400>74
ggac tagtca gtcccacagt cccaaagt                                      28
<210>75
<211>18
<212>DNA
<213>人工序列
<220>
<223>引物
<400>75
ctgagagtga tgaggttc                                                  18
<210>76
<211>21
<212>DNA
<213>人工序列
<220>
<223>引物
<400>76
ctaatcgcca tcttccagca g                                              21
<210>77
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>77
gctcgacgtt gtcactgaag                                                20
<210>78
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>78
ccaacgctat gtcctgatag                                                20
<210>79
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>79
gctcgacgtt gtcactgaag                                                20
<210>80
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>80
ccaacgctat gtcctgatag                                                20
<210>81
<211>5725
<212>DNA
<213>小鼠(Mus musculus)
<400>81
agtggttgtg ggagacttac cgtcctcttg tctctggaga gtgccttcta ccatgtcatc    60
agaagggctg tcatcttggt ccccgatttc ttccacatca ttgtcctgag catcagcagc    120
gtctccaatg gggcagttta atttgaggca atacttactc ttcaactggc cgttactttc    180
acctggacta gacacatcgc gcttctgaga acacacttta tccaaaaacc ggataccgaa    240
atcctgcccg gactacatca tcaagttgat gtcctccttt ttcacgaaaa tctttgtggt    300
gtacctgtag ttcagcacct cttcaaatat gtgggagcag atgaaatcta tctctatgat    360
ggacaagctg tccagttcta gcttcttgaa aagtttcttt tttttttctt tcaatttttt    420
attaggtatt tagctcattt acatttccaa tgctatacca aaagtccccc atacccaccc    480
acccccactc ccctacccgc tcactccacc tttttggccc tggcgttccc ctgttctggg    540
gcatataaag tttgtgtgtc caatgggcct ctctttccag tgatggccga ctaggccatc    600
ttttgataca tatgcagcta gagtcaagag ctccggggta ctggttagtt cataatgttg    660
atccacctat agggttgcag atccctttag ctccttgggt actttctcta gctcctccat    720
tgggagccct gtgatccatc cattagctga ctgtgggcat ccacttctgt gtttgctagg    780
ccccggcata gtctcacaag agacagctac atctgggtcc tttcgataaa atcttgctag    840
tgtatgcaat ggtgtcagcg tttggatgct gattatgggg tggatccctg gataaggcag    900
tctctacatg gtccatcctt tcatctcagc tccaaacttt gtctctgtaa ctccttccaa    960
gggtgttttg ttcccacttc taaggagggg catagtgtcc acacttcagt cttctttttt    1020
catgagtttc atgtgtttag gaaattgtat cttatatctt gggtatccta ggttttgggc    1080
taatatccac ttatcagcga gtacatattg tgtgagttcc tttgtgaatg tgttacctca    1140
ctcaggaaga tgccctccag gtccatccat ttggctagga atttcataaa ttcattcttt    1200
ttaatagctg agtagtactc cattgtgtag atgtaccaca ttttctgtat ccattcctct    1260
gttgaggggc atctgggttc tttccagctt ctggctatta taaataaggc tgctatgaac    1320
atagtggagc atgtgtcctt cttaccagtt ggggcatctc ctggatatat gcccaggaga    1380
ggtattcctg gatcctccgg tagtactatg tccaattttc taaggaaccg ccagatggat    1440
ttccagagtg gttgtacaag cctgcaatcc caccaacaat ggaggagtgt tcctctttct    1500
ccacatcctc gccagcatct gctgtcacct gaatttttga tcttagccat tctgactggt    1560
gtgaggtgga atctcagggt tgttttgatt tgcatttccc tgatgattaa ggatgttgaa    1620
cattttttca ggtgcttctc tgccattcgg tattcctcag gtgagaattc tttgttcagt    1680
tctgagcccc atttttttaa tggggttatt tgattttctg aagtccacct tcttgagttc    1740
tttatatatg ttggatatta gtcccctatc tgatttagga taggtaaaga tcctttccca    1800
atctgttggt ggtctctttg tcttattgac agtgtctttt gccttgcaga aactttggag    1860
tttcattagg tcccatttgt caattctcga tcttacagca caagccattg ctgttctgtt    1920
caggaatttt tcccctgtgc ccatatcttc aaggcttttc cccactttct cctctataag    1980
tttcagtgtc tctggtttta tgtgaagttc tttgatccat ttagatttga ccttagtaca    2040
aggagataag tatggatcga ttcgcattct tctacatgat aacaaccagt tgtgccagca    2100
ccatttgttg aaaatgctgt ctttcttcca ctggatggtt ttagctccct tgtcgaagat    2160
caagtgacca taggtgtgtg ggttcatttc tgggtcttca attctattcc attggtctac    2220
ttgtctgtct ctataccagt accatgcagt ttttaccaca attgctctgt agtaaagctt    2280
taggtcaggc atggtgattc caccagaggt tcttttatcc ttgagaagag tttttgctat    2340
cctaggtttt ttgttattcc agatgaattt gcaaattgct ccttctaatt cgttgaagaa    2400
ttgagttgga attttgatgg ggattgcatt gaatctgtag attgcttttg gcaagatagc    2460
catttttaca atattgatcc tgccaatcca tgagcatggg agatctttcc atcttctgag    2520
atcttcttta atttctttct tcagagactt gaagttttta tcatacatat ctttcacttc    2580
ctcagttaga gtcacgccga gatattttat attatttgtg actattgaga agggtgttgt    2640
ttccctaatt tctttctcag actgtttatt ctttgtgtag agaaaggcca ttgacttgtt    2700
tgagttaatt ttatatccag ctacttcacc aaagctgttt atcaggttta ggagttctct    2760
ggtggaattt ttagggtcac ttatatatac tatcatatca tctgcgaaaa gtgatatttt    2820
gacttcctct tttccaattt gtatcccctt gatctccttt tgttgtcgaa ttgctcagca    2880
ctgcagtatt cttaacaaag ttgattctca ttagaaaata aagctgccat atgaccatct    2940
aacacttagt aactgggaaa atttgatttg atctggtgat ttgtcacagc aataacaaag    3000
taactatcac aatggctgaa acaagtctgc tcacttggaa tcaacacttt ttgtcccagg    3060
agcaacagag tcttcagtat caggggccta aatttagaga tgaaggtttg gacctgtagc    3120
ctgaacctct tgcagaagtg atgtattaaa aggctgatca acaatggtcg ctacaagagt    3180
actccaggcc agccaatcca acaagcccaa taccttgaag gatgaaaccc atgcccaaga    3240
tcacttcctg tgcctggtgg ctgggcctct actgagtgcc acaaagtaga agaaaaaact    3300
ctagatgcta gtgttcctct aagcatgaat aactgatata tattcatgct gctctacctc    3360
agatattcag acttttcccc ctggttttca gtaaatcaag ttggatcact ccactcttct    3420
ctctcctcct cttctcattt cctctgttca gcctcccctc ccagattctc cagtctgacc    3480
acgtttctaa acagtttgct aatttatctt ggcagctgag gcagctatgg gagccacagc    3540
aggcagagag cacaggagac tcagggttct cagcagggct ctcagcaggg ctctcagcag    3600
ggctgttgtg ggtgatcctt ggattctcta tcctccagga acagtttcac tgttccagaa    3660
gatggtgatg attctgacga ctgagatgca cgtgtggtgg tgtctctgga ggctaaagtg    3720
caggtgccaa gtggttccaa atagctgggt gcagtttgtc tcaggggcac ctctagaggg    3780
tcagcctgtt tctttcagcc tctagagggc agagatgagt cccagacctt gctctctaca    3840
ttatcctagc ctttctgtgc cctttgtgag gcgcctgcag ttaagaacgt gtccagcagg    3900
gggcgcagtg tacatgggtg ttctccagta acagtcttgg ctgggaagga gagctagatt    3960
ccaggttctt aaaatactgt tttcctgtac atacctaagt aatctttaca ttggaaaaca    4020
aacaaatagt aaagctctgt tgttgttgtt gataagtagc aaattaattt agggggagca    4080
gtttgggggg ctgatgggtc ttgttctgcc attcaggctg ggctgaagct cctagggtct    4140
gaagatgctc ctgtctcaga ctccaaagca tgggactgca tacagaagcg tgcaacagtg    4200
ctaggcttcc aatcaggttt cacattttgc ttctagacag aaatataatt tcctgaaacc    4260
tttcgttttg aaatgatgtc attattgggc ccccgcactc attgctgctg acgcccccct    4320
cccactatcc ctcgggctga aatgtcctga ttgggtgtca acgctcattt gcactgatgc    4380
tcccccctta atccctggag ctgaaatgtc ctgattgggt gccaaaattt tttccactga    4440
tgcctctccc atcccattag cactaggact gaaatgtcat gattgggcgc aaaaactaat    4500
ttccaattat gcccggcccc tccgattatc cctggtgctg agatgtcatg attggggcca    4560
acactcattt ctgctgatgg ccctcctctc ccattagacc tggacctgaa tccgtgtcat    4620
gattggacgc caacactcat ttccactgat gccccggccc tcccattagt cctgaggctg    4680
aacccctgtc atgattgggc tccaatcctc atttcaggtg atgctcagct cctcccatca    4740
gccctgtggc tgaatctctg tcacgattgg gccccaaccc tcatttctgc tgaggcccag    4800
cccctcccat tagccctggg gctgcatccc tgtcaccact agacaccaac actcatttct    4860
gctgatgccc cgcccatgcc attacccttg ggcctaaatc cctgtcatga ttgaactcca    4920
acccacattt ctcctgatac cctgactccc attatcctta ggcttaatcc gtgtcataat    4980
tgggcgccaa cactgatttc ctctgatgcc ctgcccctcc cattagcccg ggactgaatc    5040
cctgtcataa ttggacttga accctcattt ttgctgaggc ccagcgcctc ccatttgtcc    5100
tcgggctgat ccctgtcatg attgggcccc aaccctcatt tcggctgagg ccccactcct    5160
ccaattagcc ctgaggctga atccatgtca tgagtaggca ccaactctca ttaacactga    5220
tgcgctgccc cttacattag ccctggggct gaatccctgt catgattggg ccccaacact    5280
catttctgct gatggccctc ctctcccatt agacctgagg ctgaatccgt gtcatgattg    5340
ggcaccaaac cgcaattcca ctaaagcccc acccctccca ttaccatcct gccgaaacca    5400
tgtcttgtca tgattgggcc ccaaccctcc tttccactga tgcccccccc tcccttaagc    5460
cctcctgctg agaccacatc ttgattgggc actaacactc atttccgctg atgcccacca    5520
ctcccatttg ccctgggact taaaccctgt cgtgattggg tgtcaaccct catttccggt    5580
gatgccccgc ctcttcctat aaatcctggc gctcaaatac tgtggtcggt gggcaggaac    5640
agccatttgg atcactgcct gcagcctagc ggttgagctg ctctggcgat catctgttct    5700
gaggtacttt gggactgtgg gactg                                          5725
<210>82
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>82
ctgagtctag atttcccgcc atggaaatcg                                     30
<210>83
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>83
agcaacgagc tcttatgatt ggtttatctg                                     30
<210>84
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>84
atttgctgtc gataatatca gatttcttgg                                     30
<210>85
<211>28
<212>DNA
<213>人工序列
<220>
<223>引物
<400>85
gagtgaggat ttgtacatga tctgaagg                                       28
<210>86
<211>3357
<212>DNA
<213>小鼠(Mus musculus)
<220>
<221>CDS
<222>(24)..(3341)
<400>86
ggcgggaaaa gctgtttgag gcg atg gat tgt aag cgg cga caa gga cca ggc    53
                          Met Asp Cys Lys Arg Arg Gln Gly Pro Gly
                          1               5                   10
cct ggg gtg ccc cca aag cgg gct cga ggg cac ctc tgg gat gag gac      101
Pro Gly Val Pro Pro Lys Arg Ala Arg Gly His Leu Trp Asp Glu Asp
                15                  20                  25
gag cct tcg ccg tcg cag ttt gag gcg aac ctg gca ctg ctg gag gaa      149
Glu Pro Ser Pro Ser Gln Phe Glu Ala Asn Leu Ala Leu Leu Glu Glu
            30                  35                  40
ata gag gct gag aac cgg ctg cag gag gca gag gag gag ctg cag ctg      197
Ile Glu Ala Glu Asn Arg Leu Gln Glu Ala Glu Glu Glu Leu Gln Leu
        45                  50                  55
ccc cca gag ggc acc gtg ggt ggg cag ttt tcc act gca gac att gac      245
Pro Pro Glu Gly Thr Val Gly Gly Gln Phe Ser Thr Ala Asp Ile Asp
    60                  65                  70
cct cgg tgg cgg cgg ccc acc cta cgt gcc ctg gac ccc agc acg gag      293
Pro Arg Trp Arg Arg Pro Thr Leu Arg Ala Leu Asp Pro Ser Thr Glu
75                  80                  85                  90
ccc ctc atc ttc cag cag ctg gag att gac cac tat gtg ggc tca gca    341
Pro Leu Ile Phe Gln Gln Leu Glu Ile Asp His Tyr Val Gly Ser Ala
                95                  100                 105
cca ccc ctg cca gaa ggg ccc ctg cca tcc cgg aac tca gtg ccc ata    389
Pro Pro Leu Pro Glu Gly Pro Leu Pro Ser Arg Asn Ser Val Pro Ile
            110                 115                 120
ctg agg gcc ttt ggg gtc acc gat gaa ggc ttc tcc gtc tgc tgc cac    437
Leu Arg Ala Phe Gly Val Thr Asp Glu Gly Phe Ser Val Cys Cys His
        125                 130                 135
ata cag ggc ttt gcc ccc tac ttc tac acc ccc gcg cct cct ggt ttt    485
Ile Gln Gly Phe Ala Pro Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe
    140                 145                 150
ggg gcc gag cac ctg agt gag ctg cag cag gag ctg aac gca gcc atc    533
Gly Ala Glu His Leu Ser Glu Leu Gln Gln Glu Leu Asn Ala Ala Ile
155                 160                 165                 170
agc cgg gac cag cgc ggt ggg aag gag ctc tca ggg ccg gca gtg ctg    581
Ser Arg Asp Gln Arg Gly Gly Lys Glu Leu Ser Gly Pro Ala Val Leu
                175                 180                 185
gca ata gag cta tgc tcc cgt gag agc atg ttt ggg tac cac ggt cat    629
Ala Ile Glu Leu Cys Ser Arg Glu Ser Met Phe Gly Tyr His Gly His
            190                 195                 200
ggc cct tct cca ttt ctc cgc atc acc ctg gca cta ccc cgc ctt atg    677
Gly Pro Ser Pro Phe Leu Arg Ile Thr Leu Ala Leu Pro Arg Leu Met
        205                 210                 215
gca cca gcc cgc cgc ctt ctg gaa cag ggt gtc cga gtg cca ggc ctg    725
Ala Pro Ala Arg Arg Leu Leu Glu Gln Gly Val Arg Val Pro Gly Leu
    220                 225                 230
ggc acc ccg agc ttc gca ccc tac gaa gcc aac gtg gac ttt gag atc    773
Gly Thr Pro Ser Phe Ala Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile
235                 240                 245                 250
cgg ttc atg gtg gat gct gac att gtg gga tgc aac tgg ttg gag ctg    821
Arg Phe Met Val Asp Ala Asp Ile Val Gly Cys Asn Trp Leu Glu Leu
                255                 260                 265
cca gct gga aag tac gtt cgg agg gcg gag aag aag gcc acc ctg tgt    869
Pro Ala Gly Lys Tyr Val Arg Arg Ala Glu Lys Lys Ala Thr Leu Cys
            270                 275                 280
cag ctg gag gtg gac gtg ctg tgg tca gat gtg atc agt cac cca ccg    917
Gln Leu Glu Val Asp Val Leu Trp Ser Asp Val Ile Ser His Pro Pro
        285                 290                 295
gag ggg cag tgg cag cgc att gca ccc ctg cgt gtg ctt agc ttc gac    965
Glu Gly Gln Trp Gln Arg Ile Ala Pro Leu Arg Val Leu Ser Phe Asp
    300                 305                 310
atc gag tgt gct ggc cga aaa ggc atc ttc cct gag cct gag cgt gac    1013
Ile Glu Cys Ala Gly Arg Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp
315                 320                 325                 330
ccc gtg atc cag atc tgt tct ctg ggg ctg cgc tgg ggg gag ccg gag    1061
Pro Val Ile Gln Ile Cys Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu
                335                 340                 345
cca ttc ttg cgt ctg gca ctc acg ctg cgg ccc tgt gcc ccc atc ctg    1109
Pro Phe Leu Arg Leu Ala Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu
            350                 355                 360
ggt gcc aaa gtg cag agc tat gag cgg gaa gaa gac ctg ctc cag gcc    1157
Gly Ala Lys Val Gln Ser Tyr Glu Arg Glu Glu Asp Leu Leu Gln Ala
        365                 370                 375
tgg gcc gac ttc atc ctt gcc atg gac cct gac gtg atc acc ggc tac    1205
Trp Ala Asp Phe Ile Leu Ala Met Asp Pro Asp Val Ile Thr Gly Tyr
    380                 385                 390
aac att cag aac ttt gac ctc cca tac ctc atc tct cgg gca cag gcc    1253
Asn Ile Gln Asn Phe Asp Leu Pro Tyr Leu Ile Ser Arg Ala Gln Ala
395                 400                 405                 410
cta aag gtg gac cgc ttc cct ttc ctg ggc cgc gtg act ggt ctc cgc    1301
Leu Lys Val Asp Arg Phe Pro Phe Leu Gly Arg Val Thr Gly Leu Arg
                415                 420                 425
tcc aac atc cgt gac tcc tcc ttc caa tca agg cag gtc ggc cgg cgg    1349
Ser Asn Ile Arg Asp Ser Ser Phe Gln Ser Arg Gln Val Gly Arg Arg
            430                 435                 440
gac agt aag gtg atc agc atg gtg ggt cgc gtt cag atg gat atg ctg    1397
Asp Ser Lys Val Ile Ser Met Val Gly Arg Val Gln Met Asp Met Leu
        445                 450                 455
cag gtg ctg ctt cgg gaa cac aag ctc cgc tcc tac acg ctc aac gct    1445
Gln Val Leu Leu Arg Glu His Lys Leu Arg Ser Tyr Thr Leu Asn Ala
    460                 465                 470
gtg agt ttc cac ttc ctg ggc gag cag aag gag gac gtt cag cac agc    1493
Val Ser Phe His Phe Leu Gly Glu Gln Lys Glu Asp Val Gln His Ser
475                 480                 485                 490
atc atc acc gac ctg cag aat ggg aac gaa cag acg cgc cgc cgc ctg    1541
Ile Ile Thr Asp Leu Gln Asn Gly Asn Glu Gln Thr Arg Arg Arg Leu
                495                 500                 505
gcc gtg tac tgc ctg aag gac gcc ttt ctg cca ctc cga cta cta gag    1589
Ala Val Tyr Cys Leu Lys Asp Ala Phe Leu Pro Leu Arg Leu Leu Glu
            510                 515                 520
cgc ctt atg gtg ctg gtg aat aat gtg gag atg gcg cgt gtc acg ggt    1637
Arg Leu Met Val Leu Val Asn Asn Val Glu Met Ala Arg Val Thr Gly
        525                 530                 535
gta ccc ctt ggg tac ctg ctc acc cgg ggc cag cag gtc aag gtc gtg    1685
Val Pro Leu Gly Tyr Leu Leu Thr Arg Gly Gln Gln Val Lys Val Val
    540                 545                 550
tct cag ctg ctg cgc cag gcc atg cgc cag ggg ctg ctg atg cct gtg    1733
Ser Gln Leu Leu Arg Gln Ala Met Arg Gln Gly Leu Leu Met Pro Val
555                 560                 565                 570
gtg aag acc gag ggc agt gag gac tac acg gga gcc aca gtc att gag    1781
Val Lys Thr Glu Gly Ser Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu
                575                 580                 585
ccc ctc aaa ggg tac tat gac gtc ccc att gcc acc ctg gac ttc tcc    1829
Pro Leu Lys Gly Tyr Tyr Asp Val Pro Ile Ala Thr Leu Asp Phe Ser
            590                 595                 600
tcc ttg tac cca tcc atc atg atg gcc cat aat ctg tgc tac acc acg    1877
Ser Leu Tyr Pro Ser Ile Met Met Ala His Asn Leu Cys Tyr Thr Thr
        605                 610                 615
ctg ctc cga cct ggg gct gcc cag aag ctg ggc ctt aaa cca gat gag    1925
Leu Leu Arg Pro Gly Ala Ala Gln Lys Leu Gly Leu Lys Pro Asp Glu
    620                 625                 630
ttc atc aag aca ccc act ggg gat gag ttt gtg aag tca tct gta cgg    1973
Phe Ile Lys Thr Pro Thr Gly Asp Glu Phe Val Lys Ser Ser Val Arg
635                 640                 645                 650
aag ggc ctc ctg ccc cag atc ctg gag aat ctg ctg agt gcc cgc aag    2021
Lys Gly Leu Leu Pro Gln Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys
                655                 660                 665
agg gcc aag gct gag ctg gct cag gag acg gac ccc ctg cgg cga cag    2069
Arg Ala Lys Ala Glu Leu Ala Gln Glu Thr Asp Pro Leu Arg Arg Gln
            670                 675                 680
gtc ttg gac ggc cgg caa ctg gca cta aaa gtg agt gcc aac tcc gta    2117
Val Leu Asp Gly Arg Gln Leu Ala Leu Lys Val Ser Ala Asn Ser Val
        685                 690                 695
tat ggc ttc act ggt gcc cag gtg ggc aag ctg cca tgt ttg gag atc    2165
Tyr Gly Phe Thr Gly Ala Gln Val Gly Lys Leu Pro Cys Leu Glu Ile
    700                 705                 710
tcc cag agt gtc act ggg ttc ggg cgg cag atg att gag aaa acc aag    2213
Ser Gln Ser Val Thr Gly Phe Gly Arg Gln Met Ile Glu Lys Thr Lys
715                 720                 725                 730
cag ctt gtg gag tcc aag tac acc gtg gaa aat ggc tac gat gcc aac    2261
Gln Leu Val Glu Ser Lys Tyr Thr Val Glu Asn Gly Tyr Asp Ala Asn
                735                 740                 745
gcc aag gta gtc tac ggt gac acg gac tct gtg atg tgc cgg ttt ggc    2309
Ala Lys Val Val Tyr Gly Asp Thr Asp Ser Val Met Cys Arg Phe Gly
            750                 755                 760
gtc tcc tct gtg gct gaa gca atg tct ctg ggg cgg gag gct gca aac    2357
Val Ser Ser Val Ala Glu Ala Met Ser Leu Gly Arg Glu Ala Ala Asn
        765                 770                 775
tgg gta tcc agt cac ttc cca tca ccc atc cgg ctg gag ttc gag aag    2405
Trp Val Ser Ser His Phe Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys
    780                 785                 790
gtt tac ttc cca tac ctg ctc atc agc aag aag cgc tat gct ggc ctg    2453
Val Tyr Phe Pro Tyr Leu Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu
795                 800                 805                 810
ctc ttc tcc tcc cgc tct gat gcc cat gac aaa atg gac tgc aag ggc    2501
Leu Phe Ser Ser Arg Ser Asp Ala His Asp Lys Met Asp Cys Lys Gly
                815                 820                 825
ctg gag gct gtg cgc agg gac aac tgt ccc ctg gtg gcc aac ctc gtt    2549
Leu Glu Ala Val Arg Arg Asp Asn Cys Pro Leu Val Ala Asn Leu Val
            830                 835                 840
aca tcc tct ctg cgc cgg atc ctc gtg gac cgg gac cct gat ggg gca    2597
Thr Ser Ser Leu Arg Arg Ile Leu Val Asp Arg Asp Pro Asp Gly Ala
        845                 850                 855
gta gcc cat gcc aag gac gtc atc tcg gac ctg ctg tgc aac cgc ata    2645
Val Ala His Ala Lys Asp Val Ile Ser Asp Leu Leu Cys Asn Arg Ile
    860                 865                 870
gac atc tcc cag ctg gtc atc acc aaa gag ttg acc cgc gca gca gca    2693
Asp Ile Ser Gln Leu Val Ile Thr Lys Glu Leu Thr Arg Ala Ala Ala
875                 880                 885                 890
gac tat gct ggc aag cag gct cac gtg gag ctg gct gag agg atg agg    2741
Asp Tyr Ala Gly Lys Gln Ala His Val Glu Leu Ala Glu Arg Met Arg
                895                 900                 905
aag cgc gac ccc ggc agt gcg ccc agc ctg ggt gac cga gtc ccc tat    2789
Lys Arg Asp Pro Gly Ser Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr
            910                 915                 920
gtg atc att ggt gct gct aag ggt gtg gcc gcc tac atg aag tcg gag    2837
Val Ile Ile Gly Ala Ala Lys Gly Val Ala Ala Tyr Met Lys Ser Glu
        925                 930                 935
gac ccc ctg ttt gtg ctg gag cac agc ctg ccc atc gac act cag tac    2885
Asp Pro Leu Phe Val Leu Glu His Ser Leu Pro Ile Asp Thr Gln Tyr
    940                 945                 950
tac ctg gag cag cag ctg gcc aag ccg ctc ttg cgc atc ttt gag ccc    2933
Tyr Leu Glu Gln Gln Leu Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro
955                 960                 965                 970
atc ctg ggt gag ggc cgt gca gag tct gtg ctg ctg cgc ggt gac cac    2981
Ile Leu Gly Glu Gly Arg Ala Glu Ser Val Leu Leu Arg Gly Asp His
                975                 980                 985
aca cga tgc aag act gtg ctc acc agc aag gtg ggc ggc ctc ttg gcc    3029
Thr Arg Cys Lys Thr Val Leu Thr Ser Lys Val Gly Gly Leu Leu Ala
            990                 995                 1000
ttc acc aag  cgc cgc aac tgt tgc  att ggc tgc cgc tcc  gta atc     3074
Phe Thr Lys  Arg Arg Asn Cys Cys  Ile Gly Cys Arg Ser  Val Ile
        1005                 1010                 1015
gac cat caa  gga gcc gtg tgt aag  ttc tgt cag cca cgg  gag tcg     3119
Asp His Gln  Gly Ala Val Cys Lys  Phe Cys Gln Pro Arg  Glu Ser
        1020                 1025                 1030
gag ctc tat  cag aag gag gtg tca  cac ctg aat gcc ttg  gaa gaa     3164
Glu Leu Tyr  Gln Lys Glu Val Ser  His Leu Asn Ala Leu  Glu Glu
        1035                 1040                 1045
cgg ttc tct  cgc ctc tgg aca cag  tgt caa cgc tgc cag  ggc agc     3209
Arg Phe Ser  Arg Leu Trp Thr Gln  Cys Gln Arg Cys Gln  Gly Ser
        1050                 1055                 1060
ttg cat gag  gac gtc atc tgt acc  agc cgt gac tgt ccc  atc ttc     3254
Leu His Glu  Asp Val Ile Cys Thr  Ser Arg Asp Cys Pro  Ile Phe
        1065                 1070                 1075
tac atg cgc  aag aag gtg cgc aag  gac ctg gaa gac cag  gaa cgg     3299
Tyr Met Arg  Lys Lys Val Arg Lys  Asp Leu Glu Asp Gln  Glu Arg
        1080                 1085                 1090
ctg ctg cag  cgc ttt gga ccg ccc  ggc cct gag gcc tgg  tga         3341
Leu Leu Gln  Arg Phe Gly Pro Pro  Gly Pro Glu Ala Trp
        1095                 1100                 1105
cctgacacgg gacaag                                                  3357
<210>87
<211>1105
<212>PRT
<213>小鼠(Mus musculus)
<400>87
Met Asp Cys Lys Arg Arg Gln Gly Pro Gly Pro Gly Val Pro Pro Lys
1               5                   10                  15
Arg Ala Arg Gly His Leu Trp Asp Glu Asp Glu Pro Ser Pro Ser Gln
            20                  25                  30
Phe Glu Ala Asn Leu Ala Leu Leu Glu Glu Ile Glu Ala Glu Asn Arg
        35                  40                  45
Leu Gln Glu Ala Glu Glu Glu Leu Gln Leu Pro Pro Glu Gly Thr Val
    50                  55                  60
Gly Gly Gln Phe Ser Thr Ala Asp Ile Asp Pro Arg Trp Arg Arg Pro
65                  70                  75                  80
Thr Leu Arg Ala Leu Asp Pro Ser Thr Glu Pro Leu Ile Phe Gln Gln
                85                  90                  95
Leu Glu Ile Asp His Tyr Val Gly Ser Ala Pro Pro Leu Pro Glu Gly
            100                 105                 110
Pro Leu Pro Ser Arg Asn Ser Val Pro Ile Leu Arg Ala Phe Gly Val
        115                 120                 125
Thr Asp Glu Gly Phe Ser Val Cys Cys His Ile Gln Gly Phe Ala Pro
    130                 135                 140
Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Ala Glu His Leu Ser
145                 150                 155                 160
Glu Leu Gln Gln Glu Leu Asn Ala Ala Ile Ser Arg Asp Gln Arg Gly
                165                 170                 175
Gly Lys Glu Leu Ser Gly Pro Ala Val Leu Ala Ile Glu Leu Cys Ser
            180                 185                 190
Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe Leu
        195                 200                 205
Arg Ile Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg Leu
    210                 215                 220
Leu Glu Gln Gly Val Arg Val Pro Gly Leu Gly Thr Pro Ser Phe Ala
225                 230                 235                 240
Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val Asp Ala
                245                 250                 255
Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr Val
            260                 265                 270
Arg Arg Ala Glu Lys Lys Ala Thr Leu Cys Gln Leu Glu Val Asp Val
        275                 280                 285
Leu Trp Ser Asp Val Ile Ser His Pro Pro Glu Gly Gln Trp Gln Arg
    290                 295                 300
Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg
305                 310                 315                 320
Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile Cys
                325                 330                 335
Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu Ala
            340                 345                 350
Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln Ser
        355                 360                 365
Tyr Glu Arg Glu Glu Asp Leu Leu Gln Ala Trp Ala Asp Phe Ile Leu
    370                 375                 380
Ala Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe Asp
385                 390                 395                 400
Leu Pro Tyr Leu Ile Ser Arg Ala Gln Ala Leu Lys Val Asp Arg Phe
                405                 410                 415
Pro Phe Leu Gly Arg Val Thr Gly Leu Arg Ser Asn Ile Arg Asp Ser
            420                 425                 430
Ser Phe Gln Ser Arg Gln Val Gly Arg Arg Asp Ser Lys Val Ile Ser
        435                 440                 445
Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg Glu
    450                 455                 460
His Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe Leu
465                 470                 475                 480
Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu Gln
                485                 490                 495
Asn Gly Asn Glu Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys
            500                 505                 510
Asp Ala Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val  Leu Val
        515                 520                 525
Asn Asn Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr Leu
    530                 535                 540
Leu Thr Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg Gln
545                 550                 555                 560
Ala Met Arg Gln Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly Ser
                565                 570                 575
Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr Tyr
            580                 585                 590
Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser Ile
        595                 600                 605
Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly Ala
    610                 615                 620
Ala Gln Lys Leu Gly Leu Lys Pro Asp Glu Phe Ile Lys Thr Pro Thr
625                 630                 635                 640
Gly Asp Glu Phe Val Lys Ser Ser Val Arg Lys Gly Leu Leu Pro Gln
                645                 650                 655
Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu Leu
            660                 665                 670
Ala Gln Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg Gln
        675                 680                 685
Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala
    690                 695                 700
Gln Val Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr Gly
705                 710                 715                 720
Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Ser Lys
                725                 730                 735
Tyr Thr Val Glu Asn Gly Tyr Asp Ala Asn Ala Lys Val Val Tyr Gly
            740                 745                 750
Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala Glu
        755                 760                 765
Ala Met Ser Leu Gly Arg Glu Ala Ala Asn Trp Val Ser Ser His Phe
    770                 775                 780
Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu
785                 790                 795                 800
Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg Ser
                805                 810                 815
Asp Ala His Asp Lys Met Asp Cys Lys Gly Leu Glu Ala Val Arg Arg
            820                 825                 830
Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ser Ser Leu Arg Arg
        835                 840                 845
Ile Leu Val Asp Arg Asp Pro Asp Gly Ala Val Ala His Ala Lys Asp
    850                 855                 860
Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu Val
865                 870                 875                 880
Ile Thr Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys Gln
                885                 890                 895
Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly Ser
            900                 905                 910
Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Gly Ala Ala
        915                 920                 925
Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val Leu
    930                 935                 940
Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln Leu
945                 950                 955                 960
Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly Arg
                965                 970                 975
Ala Glu Ser Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr Val
            980                 985                 990
Leu Thr Ser Lys Val Gly Gly Leu  Leu Ala Phe Thr Lys  Arg Arg Asn
        995                 1000                 1005
Cys Cys  Ile Gly Cys Arg Ser  Val Ile Asp His Gln  Gly Ala Val
    1010                 1015                 1020
Cys Lys  Phe Cys Gln Pro Arg  Glu Ser Glu Leu Tyr  Gln Lys Glu
    1025                 1030                 1035
Val Ser  His Leu Asn Ala Leu  Glu Glu Arg Phe Ser  Arg Leu Trp
    1040                 1045                 1050
Thr Gln  Cys Gln Arg Cys Gln  Gly Ser Leu His Glu  Asp Val Ile
    1055                 1060                 1065
Cys Thr  Ser Arg Asp Cys Pro  Ile Phe Tyr Met Arg  Lys Lys Val
    1070                 1075                 1080
Arg Lys  Asp Leu Glu Asp Gln  Glu Arg Leu Leu Gln  Arg Phe Gly
    1085                 1090                 1095
Pro Pro  Gly Pro Glu Ala Trp
    1100                 1105
<210>88
<211>3318
<212>DNA
<213>小鼠(Mus musculus)
<220>
<221>CDS
<222>(1)..(3318)
<400>88
atg gat tgt aag cgg cga caa gga cca ggc cct ggg gtg ccc cca aag    48
Met Asp Cys Lys Arg Arg Gln Gly Pro Gly Pro Gly Val Pro Pro Lys
1               5                   10                  15
cgg gct cga ggg cac ctc tgg gat gag gac gag cct tcg ccg tcg cag    96
Arg Ala Arg Gly His Leu Trp Asp Glu Asp Glu Pro Ser Pro Ser Gln
            20                  25                  30
ttt gag gcg aac ctg gca ctg ctg gag gaa ata gag gct gag aac cgg    144
Phe Glu Ala Asn Leu Ala Leu Leu Glu Glu Ile Glu Ala Glu Asn Arg
        35                  40                  45
ctg cag gag gca gag gag gag ctg cag ctg ccc cca gag ggc acc  gtg   192
Leu Gln Glu Ala Glu Glu Glu Leu Gln Leu Pro Pro Glu Gly Thr Val
    50                  55                  60
ggt ggg cag ttt tcc act gca gac att gac cct cgg tgg cgg cgg ccc    240
Gly Gly Gln Phe Ser Thr Ala Asp Ile Asp Pro Arg Trp Arg Arg Pro
65                  70                  75                  80
acc cta cgt gcc ctg gac ccc agc acg gag ccc ctc atc ttc cag cag    288
Thr Leu Arg Ala Leu Asp Pro Ser Thr Glu Pro Leu Ile Phe Gln Gln
                85                  90                  95
ctg gag att gac cac tat gtg ggc tca gca cca ccc ctg cca gaa ggg    336
Leu Glu Ile Asp His Tyr Val Gly Ser Ala Pro Pro Leu Pro Glu Gly
            100                 105                 110
ccc ctg cca tcc cgg aac tca gtg ccc ata ctg agg gcc ttt ggg gtc    384
Pro Leu Pro Ser Arg Asn Ser Val Pro Ile Leu Arg Ala Phe Gly Val
        115                 120                 125
acc gat gaa ggc ttc tcc gtc tgc tgc cac ata cag ggc ttt gcc ccc    432
Thr Asp Glu Gly Phe Ser Val Cys Cys His Ile Gln Gly Phe Ala Pro
    130                 135                 140
tac ttc tac acc ccc gcg cct cct ggt ttt ggg gcc gag cac ctg agt    480
Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Ala Glu His Leu Ser
145                 150                 155                 160
gag ctg cag cag gag ctg aac gca gcc atc agc cgg gac cag cgc ggt    528
Glu Leu Gln Gln Glu Leu Asn Ala Ala Ile Ser Arg Asp Gln Arg Gly
                165                 170                 175
ggg aag gag ctc tca ggg ccg gca gtg ctg gca ata gag cta tgc tcc    576
Gly Lys Glu Leu Ser Gly Pro Ala Val Leu Ala Ile Glu Leu Cys Ser
            180                 185                 190
cgt gag agc atg ttt ggg tac cac ggt cat ggc cct tct cca ttt ctc    624
Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe Leu
        195                 200                 205
cgc atc acc ctg gca cta ccc cgc ctt atg gca cca gcc cgc cgc ctt    672
Arg Ile Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg Leu
    210                 215                 220
ctg gaa cag ggt gtc cga gtg cca ggc ctg ggc acc ccg agc ttc gca    720
Leu Glu Gln Gly Val Arg Val Pro Gly Leu Gly Thr Pro Ser Phe Ala
225                 230                 235                 240
ccc tac gaa gcc aac gtg gac ttt gag atc cgg ttc atg gtg gat gct    768
Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val Asp Ala
                245                 250                 255
gac att gtg gga tgc aac tgg ttg gag ctg cca gct gga aag tac gtt    816
Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr Val
            260                 265                 270
cgg agg gcg gag aag aag gcc acc ctg tgt cag ctg gag gtg gac gtg    864
Arg Arg Ala Glu Lys Lys Ala Thr Leu Cys Gln Leu Glu Val Asp Val
        275                 280                 285
ctg tgg tca gat gtg atc agt cac cca ccg gag ggg cag tgg cag cgc    912
Leu Trp Ser Asp Val Ile Ser His Pro Pro Glu Gly Gln Trp Gln Arg
    290                 295                 300
att gca ccc ctg cgt gtg ctt agc ttc gac atc gag tgt gct ggc cga    960
Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg
305                 310                 315                 320
aaa ggc atc ttc cct gag cct gag cgt gac ccc gtg atc cag atc tgt    1008
Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile Cys
                325                 330                 335
tct ctg ggg ctg cgc tgg ggg gag ccg gag cca ttc ttg cgt ctg gca    1056
Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu Ala
            340                 345                 350
ctc acg ctg cgg ccc tgt gcc ccc atc ctg ggt gcc aaa gtg cag agc    1104
Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln Ser
        355                 360                 365
tat gag cgg gaa gaa gac ctg ctc cag gcc tgg gcc gac ttc atc ctt    1152
Tyr Glu Arg Glu Glu Asp Leu Leu Gln Ala Trp Ala Asp Phe Ile Leu
    370                 375                 380
gcc atg gac cct gac gtg atc acc ggc tac aac att cag aac ttt gcc    1200
Ala Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe Ala
385                 390                 395                 400
ctc cca tac ctc atc tct cgg gca cag gcc cta aag gtg gac cgc ttc    1248
Leu Pro Tyr Leu Ile Ser Arg Ala Gln Ala Leu Lys Val Asp Arg Phe
                405                 410                 415
cct ttc ctg ggc cgc gtg act ggt ctc cgc tcc aac atc cgt gac tcc    1296
Pro Phe Leu Gly Arg Val Thr Gly Leu Arg Ser Asn Ile Arg Asp Ser
            420                 425                 430
tcc ttc caa tca agg cag gtc ggc cgg cgg gac agt aag gtg atc agc    1344
Ser Phe Gln Ser Arg Gln Val Gly Arg Arg Asp Ser Lys Val Ile Ser
        435                 440                 445
atg gtg ggt cgc gtt cag atg gat atg ctg cag gtg ctg ctt cgg gaa    1392
Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg Glu
    450                 455                 460
cac aag ctc cgc tcc tac acg ctc aac gct gtg agt ttc cac ttc ctg    1440
His Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe Leu
465                 470                 475                 480
ggc gag cag aag gag gac gtt cag cac agc atc atc acc gac ctg cag    1488
Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu Gln
                485                 490                 495
aat ggg aac gaa cag acg cgc cgc cgc ctg gcc gtg tac tgc ctg aag    1536
Asn Gly Asn Glu Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys
            500                 505                 510
gac gcc ttt ctg cca ctc cga cta cta gag cgc ctt atg gtg ctg gtg    1584
Asp Ala Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu Val
        515                 520                 525
aat aat gtg gag atg gcg cgt gtc acg ggt gta ccc ctt ggg tac ctg    1632
Asn Asn Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr Leu
    530                 535                 540
ctc acc cgg ggc cag cag gtc aag gtc gtg tct cag ctg ctg cgc cag    1680
Leu Thr Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg Gln
545                 550                 555                 560
gcc atg cgc cag ggg ctg ctg atg cct gtg gtg aag acc gag ggc agt    1728
Ala Met Arg Gln Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly Ser
                565                 570                 575
gag gac tac acg gga gcc aca gtc att gag ccc ctc aaa ggg tac tat    1776
Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr Tyr
            580                 585                 590
gac gtc ccc att gcc acc ctg gac ttc tcc tcc ttg tac cca tcc atc    1824
Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser Ile
        595                 600                 605
atg atg gcc cat aat ctg tgc tac acc acg ctg ctc cga cct ggg gct    1872
Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly Ala
    610                 615                 620
gcc cag aag ctg ggc ctt aaa cca gat gag ttc atc aag aca ccc act    1920
Ala Gln Lys Leu Gly Leu Lys Pro Asp Glu Phe Ile Lys Thr Pro Thr
625                 630                 635                 640
ggg gat gag ttt gtg aag tca tct gta cgg aag ggc ctc ctg ccc cag    1968
Gly Asp Glu Phe Val Lys Ser Ser Val Arg Lys Gly Leu Leu Pro Gln
                645                 650                 655
atc ctg gag aat ctg ctg agt gcc cgc aag agg gcc aag gct gag ctg    2016
Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu Leu
            660                 665                 670
gct cag gag acg gac ccc ctg cgg cga cag gtc ttg gac ggc cgg caa    2064
Ala Gln Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg Gln
        675                 680                 685
ctg gca cta aaa gtg agt gcc aac tcc gta tat ggc ttc act ggt gcc    2112
Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala
    690                 695                 700
cag gtg ggc aag ctg cca tgt ttg gag atc tcc cag agt gtc act ggg    2160
Gln Val Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr Gly
705                 710                 715                 720
ttc ggg cgg cag atg att gag aaa acc aag cag ctt gtg gag tcc aag    2208
Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Ser Lys
                725                 730                 735
tac acc gtg gaa aat ggc tac gat gcc aac gcc aag gta gtc tac ggt    2256
Tyr Thr Val Glu Asn Gly Tyr Asp Ala Asn Ala Lys Val Val Tyr Gly
            740                 745                 750
gac acg gac tct gtg atg tgc cgg ttt ggc gtc tcc tct gtg gct gaa    2304
Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala Glu
        755                 760                 765
gca atg tct ctg ggg cgg gag gct gca aac tgg gta tcc agt cac ttc    2352
Ala Met Ser Leu Gly Arg Glu Ala Ala Asn Trp Val Ser Ser His Phe
    770                 775                 780
cca tca ccc atc cgg ctg gag ttc gag aag gtt tac ttc cca tac ctg    2400
Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu
785                 790                 795                 800
ctc atc agc aag aag cgc tat gct ggc ctg ctc  ttc tcc tcc cgc tct   2448
Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg Ser
                805                 810                 815
gat gcc cat gac aaa atg gac tgc aag ggc ctg gag gct gtg cgc agg    2496
Asp Ala His Asp Lys Met Asp Cys Lys Gly Leu Glu Ala Val Arg Arg
            820                 825                 830
gac aac tgt ccc ctg gtg gcc aac ctc gtt aca tcc tct ctg cgc cgg    2544
Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ser Ser Leu Arg Arg
        835                 840                 845
atc ctc gtg gac cgg gac cct gat ggg gca gta gcc cat gcc aag gac    2592
Ile Leu Val Asp Arg Asp Pro Asp Gly Ala Val Ala His Ala Lys Asp
    850                 855                 860
gtc atc tcg gac ctg ctg tgc aac cgc ata gac atc tcc cag ctg gtc    2640
Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu Val
865                 870                 875                 880
atc acc aaa gag ttg acc cgc gca gca gca gac tat gct ggc aag cag    2688
Ile Thr Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys Gln
                885                 890                 895
gct cac gtg gag ctg gct gag agg atg agg aag cgc gac ccc ggc agt    2736
Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly Ser
            900                 905                 910
gcg ccc agc ctg ggt gac cga gtc ccc tat gtg atc att ggt gct gct    2784
Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Gly Ala Ala
        915                 920                 925
aag ggt gtg gcc gcc tac atg aag tcg gag gac ccc ctg ttt gtg ctg    2832
Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val Leu
    930                 935                 940
gag cac agc ctg ccc atc gac act cag tac tac ctg gag cag cag ctg    2880
Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln Leu
945                 950                 955                 960
gcc aag ccg ctc ttg cgc atc ttt gag ccc atc ctg ggt gag ggc cgt    2928
Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly Arg
                965                 970                 975
gca gag tct gtg ctg ctg cgc ggt gac cac aca cga tgc aag act gtg    2976
Ala Glu Ser Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr Val
            980                 985                 990
ctc acc agc aag gtg ggc ggc ctc  ttg gcc ttc acc aag  cgc cgc aac  3024
Leu Thr Ser Lys Val Gly Gly Leu  Leu Ala Phe Thr Lys  Arg Arg Asn
        995                 1000                 1005
tgt tgc  att ggc tgc cgc tcc  gta atc gac cat caa  gga gcc gtg     3069
Cys Cys  Ile Gly Cys Arg Ser  Val Ile Asp His Gln  Gly Ala Val
    1010                 1015                 1020
tgt aag  ttc tgt cag cca cgg  gag tcg gag ctc tat  cag aag gag     3114
Cys Lys  Phe Cys Gln Pro Arg  Glu Ser Glu Leu Tyr  Gln Lys Glu
    1025                 1030                 1035
gtg tca  cac ctg aat gcc ttg  gaa gaa cgg ttc tct  cgc ctc tgg     3159
Val Ser  His Leu Asn Ala Leu  Glu Glu Arg Phe Ser  Arg Leu Trp
    1040                 1045                 1050
aca cag  tgt caa cgc tgc cag  ggc agc ttg cat gag  gac gtc atc     3204
Thr Gln  Cys Gln Arg Cys Gln  Gly Ser Leu His Glu  Asp Val Ile
    1055                 1060                 1065
tgt acc  agc cgt gac tgt ccc  atc ttc tac atg cgc  aag aag gtg     3249
Cys Thr  Ser Arg Asp Cys Pro  Ile Phe Tyr Met Arg  Lys Lys Val
    1070                 1075                 1080
cgc aag  gac ctg gaa gac cag  gaa cgg ctg ctg cag  cgc ttt gga     3294
Arg Lys  Asp Leu Glu Asp Gln  Glu Arg Leu Leu Gln  Arg Phe Gly
    1085                 1090                 1095
ccg ccc  ggc cct gag gcc tgg  tga                                  3318
Pro Pro  Gly Pro Glu Ala Trp
    1100                 1105
<210>89
<211>1105
<212>PRT
<213>小鼠(Mus musculus)
<400>89
Met Asp Cys Lys Arg Arg Gln Gly Pro Gly Pro Gly Val Pro Pro Lys
1               5                   10                  15
Arg Ala Arg Gly His Leu Trp Asp Glu Asp Glu Pro Ser Pro Ser Gln
            20                  25                  30
Phe Glu Ala Asn Leu Ala Leu Leu Glu Glu Ile Glu Ala Glu Asn Arg
        35                  40                  45
Leu Gln Glu Ala Glu Glu Glu Leu Gln Leu Pro Pro Glu Gly Thr Val
    50                  55                  60
Gly Gly Gln Phe Ser Thr Ala Asp Ile Asp Pro Arg Trp Arg Arg Pro
65                  70                  75                  80
Thr Leu Arg Ala Leu Asp Pro Ser Thr Glu Pro Leu Ile Phe Gln Gln
                85                  90                  95
Leu Glu Ile Asp His Tyr Val Gly Ser Ala Pro Pro Leu Pro Glu Gly
            100                 105                 110
Pro Leu Pro Ser Arg Asn Ser Val Pro Ile Leu Arg Ala Phe Gly Val
        115                 120                 125
Thr Asp Glu Gly Phe Ser Val Cys Cys His Ile Gln Gly Phe Ala Pro
    130                 135                 140
Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Ala Glu His Leu Ser
145                 150                 155                 160
Glu Leu Gln Gln Glu Leu Asn Ala Ala Ile Ser Arg Asp Gln Arg Gly
                165                 170                 175
Gly Lys Glu Leu Ser Gly Pro Ala Val Leu Ala Ile Glu Leu Cys Ser
            180                 185                 190
Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe Leu
        195                 200                 205
Arg Ile Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg Leu
    210                 215                 220
Leu Glu Gln Gly Val Arg Val Pro Gly Leu Gly Thr Pro Ser Phe Ala
225                 230                 235                 240
Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val Asp Ala
                245                 250                 255
Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr Val
            260                 265                 270
Arg Arg Ala Glu Lys Lys Ala Thr Leu Cys Gln Leu Glu Val Asp Val
        275                 280                 285
Leu Trp Ser Asp Val Ile Ser His Pro Pro Glu Gly Gln Trp Gln Arg
    290                 295                 300
Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg
305                 310                 315                 320
Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile Cys
                325                 330                 335
Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu Ala
            340                 345                 350
Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln Ser
        355                 360                 365
Tyr Glu Arg Glu Glu Asp Leu Leu Gln Ala Trp Ala Asp Phe Ile Leu
    370                 375                 380
Ala Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe Ala
385                 390                 395                 400
Leu Pro Tyr Leu Ile Ser Arg Ala Gln Ala Leu Lys Val Asp Arg Phe
                405                 410                 415
Pro Phe Leu Gly Arg Val Thr Gly Leu Arg Ser Asn Ile Arg Asp Ser
            420                 425                 430
Ser Phe Gln Ser Arg Gln Val Gly Arg Arg Asp Ser Lys Val Ile Ser
        435                 440                 445
Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg Glu
    450                 455                 460
His Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe Leu
465                 470                 475                 480
Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu Gln
                485                 490                 495
Asn Gly Asn Glu Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys
            500                 505                 510
Asp Ala Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu Val
        515                 520                 525
Asn Asn Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr Leu
    530                 535                 540
Leu Thr Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg Gln
545                 550                 555                 560
Ala Met Arg Gln Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly Ser
                565                 570                 575
Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr Tyr
            580                 585                 590
Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser Ile
        595                 600                 605
Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly Ala
    610                 615                 620
Ala Gln Lys Leu Gly Leu Lys Pro Asp Glu Phe Ile Lys Thr Pro Thr
625                 630                 635                 640
Gly Asp Glu Phe Val Lys Ser Ser Val Arg Lys Gly Leu Leu Pro Gln
                645                 650                 655
Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu Leu
            660                 665                 670
Ala Gln Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg Gln
        675                 680                 685
Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala
    690                 695                 700
Gln Val Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr Gly
705                 710                 715                 720
Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Ser Lys
                725                 730                 735
Tyr Thr Val Glu Asn Gly Tyr Asp Ala Asn Ala Lys Val Val Tyr Gly
            740                 745                 750
Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala Glu
        755                 760                 765
Ala Met Ser Leu Gly Arg Glu Ala Ala Asn Trp Val Ser Ser His Phe
    770                 775                 780
Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu
785                 790                 795                 800
Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg Ser
               805                 810                 815
Asp Ala His Asp Lys Met Asp Cys Lys Gly Leu Glu Ala Val Arg Arg
            820                 825                 830
Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ser Ser Leu Arg Arg
        835                 840                 845
Ile Leu Val Asp Arg Asp Pro Asp Gly Ala Val Ala His Ala Lys Asp
    850                 855                 860
Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu Val
865                 870                 875                 880
Ile Thr Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys Gln
                885                 890                 895
Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly Ser
            900                 905                 910
Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Gly Ala Ala
        915                 920                 925
Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val Leu
    930                 935                 940
Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln Leu
945                 950                 955                 960
Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly Arg
                965                 970                 975
Ala Glu Ser Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr Val
            980                 985                 990
Leu Thr Ser Lys Val Gly Gly Leu  Leu Ala Phe Thr Lys  Arg Arg Asn
        995                 1000                 1005
Cys Cys  Ile Gly Cys Arg Ser  Val Ile Asp His Gln  Gly Ala Val
    1010                 1015                 1020
Cys Lys  Phe Cys Gln Pro Arg  Glu Ser Glu Leu Tyr  Gln Lys Glu
    1025                 1030                 1035
Val Ser  His Leu Asn Ala Leu  Glu Glu Arg Phe Ser  Arg Leu Trp
    1040                 1045                 1050
Thr Gln  Cys Gln Arg Cys Gln  Gly Ser Leu His Glu  Asp Val Ile
    1055                 1060                 1065
Cys Thr  Ser Arg Asp Cys Pro  Ile Phe Tyr Met Arg  Lys Lys Val
    1070                 1075                 1080
Arg Lys  Asp Leu Glu Asp Gln  Glu Arg Leu Leu Gln  Arg Phe Gly
    1085                 1090                 1095
Pro Pro  Gly Pro Glu Ala Trp
    1100                 1105
<210>90
<211>3684
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<220>
<221>CDS
<222>(501)..(557)
<220>
<221>CDS
<222>(689)..(818)
<220>
<221>CDS
<222>(1008)..(1114)
<220>
<221>CDS
<222>(1194)..(1320)
<220>
<221>CDS
<222>(1469)..(1576)
<220>
<221>CDS
<222>(1671)..(1786)
<220>
<221>CDS
<222>(1858)..(1941)
<220>
<221>CDS
<222>(2040)..(2 108)
<220>
<221>CDS
<222>(2198)..(2269)
<220>
<221>CDS
<222>(2352)..(2443)
<220>
<221>CDS
<222>(2545)..(2672)
<220>
<221>CDS
<222>(2772)..(2873)
<220>
<221>CDS
<222>(2965)..(3032)
<220>
<221>CDS
<222>(3122)..(3181)
<400>90
agcgattcct tagcagaaag gcgctccatt tctctggcgt aaaccaaagg agatccttga    60
actgtttcct gcaccattgc tcttaaaacc cttctccggc acgaattctt ccaaccctgc    120
ttcaccaccg gaacattgag acaaaatctc gacggtgacg ctgaggttga aaaaaccaat    180
cgaaccgcag acgtaccagg aaccgaacca tgtatcaacg ccattgaaga agaagaagaa    240
gaagaaggtg aaaaacgaaa gattgagaat ttgtttgctt tgagcaacca aacctcagga    300
aaaaagagtt aaggtgggag tgtctggttc aaccggttta tatccggttc aaattaaacc    360
tcttacagtt aaccgggttt tgtgtttggt tcgattgttc ataaaagaaa gaagactctt    420
gtcgtcgatt agtgccaaag ttgaaagttg aaaccttttc tcagaatttt ctgctcagtt    480
ctgagttttt ttttcccgcc atg gaa atc gac tcc gag aaa att cac gaa agg    533
                      Met Glu Ile Asp Ser Glu Lys Ile His Glu Arg
                      1               5                   10
aag caa tcc gat tac aat tcg ctg gtacgaactc tattacttta tcgacttgta     587
Lys Gln Ser Asp Tyr Asn Ser Leu
            15
gtgaaagaca aatgtaatca ttcgtggtgg tgactgtttc tacttataag tgtacgggct    647
agggtttgtt atctgattct gagtttttgc aattgaagca g gat gag aga ttc gag    703
                                              Asp Glu Arg Phe Glu
                                              20
ata cag aag gag atg tac aga ggt cag caa tac agt cag att tac ttt      751
Ile Gln Lys Glu Met Tyr Arg Gly Gln Gln Tyr Ser Gln Ile Tyr Phe
25                  30                  35                  40
gct cgt ctt cat ctc atg aga aca ctt ctc tac tct ctt gct cct act      799
Ala Arg Leu His Leu Met Arg Thr Leu Leu Tyr Ser Leu Ala Pro Thr
                45                  50                  55
tgg aaa tct cat ttg cct g gtcagtgctt ttgtttctct catatttagc           848
Trp Lys Ser His Leu Pro
            60
acaacaacga agagcagttt ttgagaattt tcttgggtta gatataatta ggtgaaatca    908
gtgattttta gggatttttg ctatcttatg gattacagtt gagaaagatt gctagtattg    968
tttaaattat agatctgaat gtgaatttca tttttgcag tg  tgt aag gtt ttg       1021
                                           Val Cys Lys Val Leu
                                                   65
gga ctt gaa aaa gga aaa gaa tgc ata att gtg gga acc ttg ttc aaa      1069
Gly Leu Glu Lys Gly Lys Glu Cys Ile Ile Val Gly Thr Leu Phe Lys
        70                  75                  80
cac atg aag ctt aaa cct tgt gtt ctc gat gaa tat tct aaa gag          1114
His Met Lys Leu Lys Pro Cys Val Leu Asp Glu Tyr Ser Lys Glu
    85                  90                  95
gttggttttt attaacctct actgtttttt tgagctatgt ctatgctgaa tcaatctgag    1174
tatatttaac ataatgcag agg tca gtt act ccg ctt gtt aaa cca cat aac     1226
                     Arg Ser Val Thr Pro Leu Val Lys Pro His Asn
                         100                 105
ttt atg cat cct gat gat aat ctg atc ctc gaa gac gag agt ggg aga      1274
Phe Met His Pro Asp Asp Asn Leu Ile Leu Glu Asp Glu Ser Gly Arg
110                 115                 120                 125
gtt aag ctt gct ggt tcc gca ctt tca cct gcg att tat gtg aca g        1320
Val Lys Leu Ala Gly Ser Ala Leu Ser Pro Ala Ile Tyr Val Thr
                130                 135                 140
gtattgcaaa tgggttctta ctgtttttac tgtatgattt tttccttctt tacaatgtgg    1380
caaatcttag agattttgat caagctttcc tctcttaaaa gatgggttct ttaagaaaat    1440
taacgttgaa gcctcccgtg cattgtag gt  gtt gtt gtt gca ctg cat ggg       1491
                               Gly Val Val Val Ala Leu His Gly
                                               145
aag gaa act aat gct ggt gaa ttc ttt gtt gag gat gta cta gaa gct      1539
Lys Glu Thr Asn Ala Gly Glu Phe Phe Val Glu Asp Val Leu Glu Ala
    150                 155                 160
ggt tta cca cct cag att gag cgg cct atc gat cta c gtaagtctag         1586
Gly Leu Pro Pro Gln Ile Glu Arg Pro Ile Asp Leu
165                 170                 175
ctatgttctc ttccttttgc taacctcatg gctcaatcat ttctataagc aatctctcat    1646
gatacatcca tattgcatct gcag ag  gaa gat aaa tat gtc gtg tta ttg       1696
                           Gln Glu Asp Lys Tyr Val Val Leu Leu
                                       180                 185
tcg ggc ctt tgt att gga agc aaa tcg gct aat ccc ctg cag ttt cag      1744
Ser Gly Leu Cys Ile Gly Ser Lys Ser Ala Asn Pro Leu Gln Phe Gln
                190                 195                 200
ctt ctt gtt gac cat ata act ggg cat ctc gga gat gag gag              1786
Leu Leu Val Asp His Ile Thr Gly His Leu Gly Asp Glu Glu
            205                 210                 215
gttcaaatct cttaacttgc aggttgttca acatatttct ttccttaatt tatactttat    1846
ggtttgaaca g gaa caa ggc ctt gca gca cag ata gtt cat gta gta att     1896
             Glu Gln Gly Leu Ala Ala Gln Ile Val His Val Val Ile
                             220                 225
gct gga aac tct ttt gaa ttt ccc cgc aaa ctc att aat ggc cag          1941
Ala Gly Asn Ser Phe Glu Phe Pro Arg Lys Leu Ile Asn Gly Gln
    230                 235                 240
gtacttataa cttttgttgc tgatatattc tcagatacag ttccagtaat tatctgcccc    2001
agttatgtct tatgatcttt attggttgat ctttgtag aac ttg gcc tcg aaa gat    2057
                                          Asn Leu Ala Ser Lys Asp
                                              245
caa tcg aca ctg tat gag ccc atc aaa gag ctt gat atc atg tta agc      2105
Gln Ser Thr Leu Tyr Glu Pro Ile Lys Glu Leu Asp Ile Met Leu Ser
250                 255                 260                 265
cag gtcagttaac tggatctacg tgtgtgttat cgatatctat tgagatgaaa           2158
Gln
gttcaaactc ctgttttttt ttttgtggat tgtttttag ata gct gca gga gtt       2212
                                           Ile Ala Ala Gly Val
                                                       270
tca gta gat atc atg cca ggc acg aat gat cca gct aac ttc gca ttg      2260
Ser Val Asp Ile Met Pro Gly Thr Asn Asp Pro Ala Asn Phe Ala Leu
            275                  280                285
cct cag cag gtctgcaaat acataagaaa cattcaaaat cccgcatttt              2309
Pro Gln Gln
        290
gtatcgataa ctctgattca taggcccttc tcttttgttc ag cct ctg aat aga       2363
                                               Pro Leu Asn Arg
tgt ctt ttc cct gga tct tca cct tat aac acc ttc aga tca tgt aca      2411
Cys Leu Phe Pro Gly Ser Ser Pro Tyr Asn Thr Phe Arg Ser Cys Thr
295                 300                 305                 310
aat cct cac tca ttt gat gtc gat aat atc ag  gtatgattat tattaatagt    2463
Asn Pro His Ser Phe Asp Val Asp Asn Ile Arg
                315                 320
tgaatacaat ctctctgatt ttacaacgat aaaattcttg ggtttatctg actgaaaacc    2523
tcatatgggg gcattttgca g a ttt ctt gga act tct ggt cag aac atc gat    2575
                          Phe Leu Gly Thr Ser Gly Gln Asn Ile Asp
                                      325                 330
gac ctt ggc aag tac tca gag gct aag agc aag ctt gat ttt gtg gaa      2623
Asp Leu Gly Lys Tyr Ser Glu Ala Lys Ser Lys Leu Asp Phe Val Glu
            335                 340                 345
aga acg ctg agg tgg aga cat ctt gcc cca act gca cct aat aca ctc g    2672
Arg Thr Leu Arg Trp Arg His Leu Ala Pro Thr Ala Pro Asn Thr Leu
        350                 355                 360
gtaagaattc tccttgccct gcaagattac ttttttgaac taagcccata aaaaaatgat    2732
cctttgagtt ctatttggtt ttgattcact tgcgtacag gt  tgt tat cct ttc       2785
                                           Gly Cys Tyr Pro Phe
                                               365
acc gat aga gac cct ttc ttg att gaa acc tgc ccg cat gtc tac ttc      2833
Thr Asp Arg Asp Pro Phe Leu Ile Glu Thr Cys Pro His Val Tyr Phe
    370                 375                 380
gtc ggg aat caa gat aaa tat gac aac cgt ttg ata aag g gtaaaagcac     2883
Val Gly Asn Gln Asp Lys Tyr Asp Asn Arg Leu Ile Lys
385                 390                 395
cttacacaga gattagaaat aacattctct tttgtcaaac atcaggcttt aacttttctt    2943
gggtaaatat gaatgctgca g gg  tca gaa ggg cag ctt gtc cgg ttg atc      2993
                        Gly Ser Glu Gly Gln Leu Val Arg Leu Ile
                                400                 405
tgc att cct aag ttc tgt gag acc ggt att gct gtt gcg gtgagtttaa       3042
Cys Ile Pro Lys Phe Cys Glu Thr Gly Ile Ala Val Ala
        410                 415                 420
aatttgagca gaatttgaga ccatttaccc tcatagattg cagattctaa atctcaaaat    3102
caccatgtct atttcgcag gtg aac cta aga aat ctg gaa tgt cac act tta     3154
                     Val Asn Leu Arg Asn Leu Glu Cys His Thr Leu
                                     425                 430
agc ttt agc act cag ata aac caa tca taacattgag ttgctacttt            3201
Ser Phe Ser Thr Gln Ile Asn Gln Ser
            435                 440
ggtagattat ttcctgtctt gaagatgtaa tgttgagctt tttcagtaac acactcctat    3261
gttctaacca aatgtttgtt aaaaatcctt tttcttgagt ggaacttcca aatctttgga    3321
tatattggta atgctcattg ttttgtccta attttctaaa aatctcgaca cgagttctta    3381
ggtagtcaca taaaggacaa aaagggccga ccagatagtg tcgtggtcgt tggtcagaag    3441
aacgtgaaaa gactgcaaaa ataatcttaa aaaaagcaac aagtgcacag aatctcatgc    3501
aaatgtctct ctctctcttc tcaacggcta tatccatcca cacttattac attataaaat    3561
taattaaatg caataatgta acgcattata ttctccaacg gtccattttc ccgcatttcc    3621
ctaacctttc ctttataacg caaaacagtt tcatcttcta cacttaacac tttaatcctc    3681
tct                                                                  3684
<210>91
<211>440
<212>PRT
<213>拟南芥(Arabidopsis thaliana)
<400>91
Met Glu Ile Asp Ser Glu Lys Ile His Glu Arg Lys Gln Ser Asp Tyr
1               5                   10                  15
Asn Ser Leu Asp Glu Arg Phe Glu Ile Gln Lys Glu Met Tyr Arg Gly
            20                  25                  30
Gln Gln Tyr Ser Gln Ile Tyr Phe Ala Arg Leu His Leu Met Arg Thr
        35                  40                  45
Leu Leu Tyr Ser Leu Ala Pro Thr Trp Lys Ser His Leu Pro Val Cys
    50                  55                  60
Lys Val Leu Gly Leu Glu Lys Gly Lys Glu Cys Ile Ile Val Gly Thr
65                  70                  75                  80
Leu Phe Lys His Met Lys Leu Lys Pro Cys Val Leu Asp Glu Tyr Ser
                85                  90                  95
Lys Glu Arg Ser Val Thr Pro Leu Val Lys Pro His Asn Phe Met His
            100                 105                 110
Pro Asp Asp Asn Leu Ile Leu Glu Asp Glu Ser Gly Arg Val Lys Leu
        115                 120                 125
Ala Gly Ser Ala Leu Ser Pro Ala Ile Tyr Val Thr Gly Val Val Val
    130                 135                 140
Ala Leu His Gly Lys Glu Thr Asn Ala Gly Glu Phe Phe Val Glu Asp
145                 150                 155                 160
Val Leu Glu Ala Gly Leu Pro Pro Gln Ile Glu Arg Pro Ile Asp Leu
                165                 170                 175
Gln Glu Asp Lys Tyr Val Val Leu Leu Ser Gly Leu Cys Ile Gly Ser
            180                 185                 190
Lys Ser Ala Asn Pro Leu Gln Phe Gln Leu Leu Val Asp His Ile Thr
        195                 200                 205
Gly His Leu Gly Asp Glu Glu Glu Gln Gly Leu Ala Ala Gln Ile Val
    210                 215                 220
His Val Val Ile Ala Gly Asn Ser Phe Glu Phe Pro Arg Lys Leu Ile
225                 230                 235                 240
Asn Gly Gln Asn Leu Ala Ser Lys Asp Gln Ser Thr Leu Tyr Glu Pro
                245                 250                 255
Ile Lys Glu Leu Asp Ile Met Leu Ser Gln Ile Ala Ala Gly Val Ser
            260                 265                 270
Val Asp Ile Met Pro Gly Thr Asn Asp Pro Ala Asn Phe Ala Leu Pro
        275                 280                 285
 Gln Gln Pro Leu Asn Arg Cys Leu Phe Pro Gly Ser Ser Pro Tyr Asn
     290                 295                 300
 Thr Phe Arg Ser Cys Thr Asn Pro His Ser Phe Asp Val Asp Asn Ile
 305                 310                 315                 320
 Arg Phe Leu Gly Thr Ser Gly Gln Asn Ile Asp Asp Leu Gly Lys Tyr
                 325                 330                 335
Ser Glu Ala Lys Ser Lys Leu Asp Phe Val Glu Arg Thr Leu Arg Trp
            340                 345                 350
Arg His Leu Ala Pro Thr Ala Pro Asn Thr Leu Gly Cys Tyr Pro Phe
        355                 360                 365
Thr Asp Arg Asp Pro Phe Leu Ile Glu Thr Cys Pro His Val Tyr Phe
    370                 375                 380
Val Gly Asn Gln Asp Lys Tyr Asp Asn Arg Leu Ile Lys Gly Ser Glu
385                 390                 395                 400
Gly Gln Leu Val Arg Leu Ile Cys Ile Pro Lys Phe Cys Glu Thr Gly
                405                 410                 415
Ile Ala Val Ala Val Asn Leu Arg Asn Leu Glu Cys His Thr Leu Ser
            420                 425                 430
Phe Ser Thr Gln Ile Asn Gln Ser
        435                 440
<210>92
<211>3684
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<220>
<221>CDS
<222>(501)..(557)
<220>
<221>CDS
<222>(689)..(818)
<220>
<221>CDS
<222>(1008)..(1114)
<220>
<221>CDS
<222>(1194)..(1320)
<220>
<221>CDS
<222>(1469)..(1576)
<220>
<221>CDS
<222>(1671)..(1786)
<220>
<221>CDS
<222>(1858)..(1941)
<220>
<221>CDS
<222>(2040)..(2 108)
<220>
<221>CDS
<222>(2198)..(2269)
<220>
<221>CDS
<222>(2352)..(2443)
<220>
<221>CDS
<222>(2545)..(2672)
<220>
<221>CDS
<222>(2772)..(2873)
<220>
<221>CDS
<222>(2965)..(3032)
<220>
<221>CDS
<222>(3122)..(3181)
<400>92
agcgattcct tagcagaaag gcgctccatt tctctggcgt aaaccaaagg agatccttga    60
actgtttcct gcaccattgc tcttaaaacc cttctccggc acgaattctt ccaaccctgc    120
ttcaccaccg gaacattgag acaaaatctc gacggtgacg ctgaggttga aaaaaccaat    180
cgaaccgcag acgtaccagg aaccgaacca tgtatcaacg ccattgaaga agaagaagaa    240
gaagaaggtg aaaaacgaaa gattgagaat ttgtttgctt tgagcaacca aacctcagga    300
aaaaagagtt aaggtgggag tgtctggttc aaccggttta tatccggttc aaattaaacc    360
tcttacagtt aaccgggttt tgtgtttggt tcgattgttc ataaaagaaa gaagactctt    420
gtcgtcgatt agtgccaaag ttgaaagttg aaaccttttc tcagaatttt ctgctcagtt    480
ctgagttttt ttttcccgcc atg gaa atc gac tcc gag aaa att cac gaa agg    533
                      Met Glu Ile Asp Ser Glu Lys Ile His Glu Arg
                      1               5                   10
aag caa tcc gat tac aat tcg ctg gtacgaactc tattacttta tcgacttgta     587
Lys Gln Ser Asp Tyr Asn Ser Leu
            15
gtgaaagaca aatgtaatca ttcgtggtgg tgactgtttc tacttataag tgtacgggct    647
agggtttgtt atctgattct gagtttttgc aattgaagca g gat gag aga ttc gag    703
                                              Asp Glu Arg Phe Glu
                                              20
ata cag aag gag atg tac aga ggt cag caa tac agt cag att tac ttt      751
Ile Gln Lys Glu Met Tyr Arg Gly Gln Gln Tyr Ser Gln Ile Tyr Phe
25                  30                  35                  40
gct cgt ctt cat ctc atg aga aca ctt ctc tac tct ctt gct cct act      799
Ala Arg Leu His Leu Met Arg Thr Leu Leu Tyr Ser Leu Ala Pro Thr
                45                  50                  55
tgg aaa tct cat ttg cct g gtcagtgctt ttgtttctct catatttagc           848
Trp Lys Ser His Leu Pro
            60
acaacaacga agagcagttt ttgagaattt tcttgggtta gatataatta ggtgaaatca    908
gtgattttta gggatttttg ctatcttatg gattacagtt gagaaagatt gctagtattg    968
tttaaattat agatctgaat gtgaatttca tttttgcag tg  tgt aag gtt ttg       1021
                                           Val Cys Lys Val Leu
                                                   65
gga ctt gaa aaa gga aaa gaa tgc ata att gtg gga acc ttg ttc aaa      1069
Gly Leu Glu Lys Gly Lys Glu Cys Ile Ile Val Gly Thr Leu Phe Lys
        70                  75                  80
cac atg aag ctt aaa cct tgt gtt ctc gat gaa tat tct aaa gag          1114
His Met Lys Leu Lys Pro Cys Val Leu Asp Glu Tyr Ser Lys Glu
    85                  90                  95
gttggttttt attaacctct actgtttttt tgagctatgt ctatgctgaa tcaatctgag    1174
tatatttaac ataatgcag agg tca gtt act ccg ctt gtt aaa cca cat aac     1226
                     Arg Ser Val Thr Pro Leu Val Lys Pro His Asn
                         100                 105
ttt atg cat cct gat gat aat ctg atc ctc gaa gac gag agt ggg aga      1274
Phe Met His Pro Asp Asp Asn Leu Ile Leu Glu Asp Glu Ser Gly Arg
110                 115                 120                 125
gtt aag ctt gct ggt tcc gca ctt tca cct gcg att tat gtg aca g        1320
Val Lys Leu Ala Gly Ser Ala Leu Ser Pro Ala Ile Tyr Val Thr
                130                 135                 140
gtattgcaaa tgggttctta ctgtttttac tgtatgattt tttccttctt tacaatgtgg    1380
caaatcttag agattttgat caagctttcc tctcttaaaa gatgggttct ttaagaaaat    1440
taacgttgaa gcctcccgtg cattgtag gt  gtt gtt gtt gca ctg cat ggg       1491
                               Gly Val Val Val Ala Leu His Gly
                                               145
aag gaa act aat gct ggt gaa ttc ttt gtt gag gat gta cta gaa gct      1539
Lys Glu Thr Asn Ala Gly Glu Phe Phe Val Glu Asp Val Leu Glu Ala
    150                 155                 160
ggt tta cca cct cag att gag cgg cct atc gat cta c gtaagtctag         1586
Gly Leu Pro Pro Gln Ile Glu Arg Pro Ile Asp Leu
165               170                 175
ctatgttctc ttccttttgc taacctcatg gctcaatcat ttctataagc aatctctcat    1646
gatacatcca tattgcatct gcag ag  gaa gat aaa tat gtc gtg tta ttg       1696
                           Gln Glu Asp Lys Tyr Val Val Leu Leu
                                       180                 185
tcg ggc ctt tgt att gga agc aaa tcg gct aat ccc ctg cag ttt cag      1744
Ser Gly Leu Cys Ile Gly Ser Lys Ser Ala Asn Pro Leu Gln Phe Gln
                190                 195                 200
ctt ctt gtt gac cat ata act ggg cat ctc gga gat gag gag              1786
Leu Leu Val Asp His Ile Thr Gly His Leu Gly Asp Glu Glu
            205                 210                 215
gttcaaatct cttaacttgc aggttgttca acatatttct ttccttaatt tatactttat    1846
ggtttgaaca g gaa caa ggc ctt gca gca cag ata gtt cat gta gta att     1896
             Glu Gln Gly Leu Ala Ala Gln Ile Val His Val Val Ile
                             220                 225
gct gga aac tct ttt gaa ttt ccc cgc aaa ctc att aat ggc cag          1941
Ala Gly Asn Ser Phe Glu Phe Pro Arg Lys Leu Ile Asn Gly Gln
    230                 235                 240
gtacttataa cttttgttgc tgatatattc tcagatacag ttccagtaat tatctgcccc    2001
agttatgtct tatgatcttt attggttgat ctttgtag aac ttg gcc tcg aaa gat    2057
                                          Asn Leu Ala Ser Lys Asp
                                              245
caa tcg aca ctg tat gag ccc atc aaa gag ctt gat atc atg tta agc      2105
Gln Ser Thr Leu Tyr Glu Pro Ile Lys Glu Leu Asp Ile Met Leu Ser
250                 255                 260                 265
cag gtcagttaac tggatctacg tgtgtgttat cgatatctat tgagatgaaa           2158
Gln
gttcaaactc ctgttttttt ttttgtggat tgtttttag ata gct gca gga gtt       2212
                                           Ile Ala Ala Gly Val
                                                       270
tca gta gat atc atg cca ggc acg aat gat cca gct aac ttc gca ttg      2260
Ser Val Asp Ile Met Pro Gly Thr Asn Asp Pro Ala Asn Phe Ala Leu
            275                 280                 285
cct cag cag gtctgcaaat acataagaaa cattcaaaat cccgcatttt              2309
Pro Gln Gln
        290
gtatcgataa ctctgattca taggcccttc tcttttgttc ag cct ctg aat aga       2363
                                               Pro Leu Asn Arg
tgt ctt ttc cct gga tct tca cct tat aac acc ttc aga tca tgt aca      2411
Cys Leu Phe Pro Gly Ser Ser Pro Tyr Asn Thr Phe Arg Ser Cys Thr
295                 300                 305                 310
aat cct cac tca ttt gct gtc gat aat atc ag  gtatgattat tattaatagt    2463
Asn Pro His Ser Phe Ala Val Asp Asn Ile Arg
                315                 320
tgaatacaat ctctctgatt ttacaacgat aaaattcttg ggtttatctg actgaaaacc    2523
tcatatgggg gcattttgca g a ttt ctt gga act tct ggt cag aac atc gat    2575
                          Phe Leu Gly Thr Ser Gly Gln Asn Ile Asp
                                      325                 330
gac ctt ggc aag tac tca gag gct aag agc aag ctt gat ttt gtg gaa      2623
Asp Leu Gly Lys Tyr Ser Glu Ala Lys Ser Lys Leu Asp Phe Val Glu
            335                 340                 345
aga acg ctg agg tgg aga cat ctt gcc cca act gca cct aat aca ctc g    2672
Arg Thr Leu Arg Trp Arg His Leu Ala Pro Thr Ala Pro Asn Thr Leu
        350                 355                 360
gtaagaattc tccttgccct gcaagattac ttttttgaac taagcccata aaaaaatgat    2732
cctttgagtt ctatttggtt ttgattcact tgcgtacag gt  tgt tat cct ttc       2785
                                           Gly Cys Tyr Pro Phe
                                               365
acc gat aga gac cct ttc ttg att gaa acc tgc ccg cat gtc tac ttc      2833
Thr Asp Arg Asp Pro Phe Leu Ile Glu Thr Cys Pro His Val Tyr Phe
    370                 375                 380
gtc ggg aat caa gat aaa tat gac aac cgt ttg ata aag g gtaaaagcac     2883
Val Gly Asn Gln Asp Lys Tyr Asp Asn Arg Leu Ile Lys
385                 390                 395
cttacacaga gattagaaat aacattctct tttgtcaaac atcaggcttt aacttttctt    2943
gggtaaatat gaatgctgca g gg  tca gaa ggg cag ctt gtc cgg ttg atc      2993
                        Gly Ser Glu Gly Gln Leu Val Arg Leu Ile
                                400                 405
tgc att cct aag ttc tgt gag acc ggt att gct gtt gcg gtgagtttaa       3042
Cys Ile Pro Lys Phe Cys Glu Thr Gly Ile Ala Val Ala
        410                 415                 420
aatttgagca gaatttgaga ccatttaccc tcatagattg cagattctaa atctcaaaat    3102
caccatgtct atttcgcag gtg aac cta aga aat ctg gaa tgt cac act tta     3154
                     Val Asn Leu Arg Asn Leu Glu Cys His Thr Leu
                                     425                 430
agc ttt agc act cag ata aac caa tca taacattgag ttgctacttt            3201
Ser Phe Ser Thr Gln Ile Asn Gln Ser
            435                 440
ggtagattat ttcctgtctt gaagatgtaa tgttgagctt tttcagtaac acactcctat    3261
gttctaacca aatgtttgtt aaaaatcctt tttcttgagt ggaacttcca aatctttgga    3321
tatattggta atgctcattg ttttgtccta attttctaaa aatctcgaca cgagttctta    3381
ggtagtcaca taaaggacaa aaagggccga ccagatagtg tcgtggtcgt tggtcagaag    3441
aacgtgaaaa gactgcaaaa ataatcttaa aaaaagcaac aagtgcacag aatctcatgc    3501
aaatgtctct ctctctcttc tcaacggcta tatccatcca cacttattac attataaaat    3561
taattaaatg caataatgta acgcattata ttctccaacg gtccattttc ccgcatttcc    3621
ctaacctttc ctttataacg caaaacagtt tcatcttcta cacttaacac tttaatcctc    3681
tct                                                                  3684
<210>93
<211>440
<212>PRT
<213>拟南芥(Arabidopsis thaliana)
<400>93
Met Glu Ile Asp Ser Glu Lys Ile His Glu Arg Lys Gln Ser Asp Tyr
1               5                   10                  15
Asn Ser Leu Asp Glu Arg Phe Glu Ile Gln Lys Glu Met Tyr Arg Gly
            20                  25                  30
Gln Gln Tyr Ser Gln Ile Tyr Phe Ala Arg Leu His Leu Met Arg Thr
        35                  40                  45
Leu Leu Tyr Ser Leu Ala Pro Thr Trp Lys Ser His Leu Pro Val Cys
    50                  55                  60
Lys Val Leu Gly Leu Glu Lys Gly Lys Glu Cys Ile Ile Val Gly Thr
65                  70                  75                  80
Leu Phe Lys His Met Lys Leu Lys Pro Cys Val Leu Asp Glu Tyr Ser
                85                  90                  95
Lys Glu Arg Ser Val Thr Pro Leu Val Lys Pro His Asn Phe Met His
            100                 105                 110
Pro Asp Asp Asn Leu Ile Leu Glu Asp Glu Ser Gly Arg Val Lys Leu
        115                 120                 125
Ala Gly Ser Ala Leu Ser Pro Ala Ile Tyr Val Thr Gly Val Val Val
    130                 135                 140
Ala Leu His Gly Lys Glu Thr Asn Ala Gly Glu Phe Phe Val Glu Asp
145                 150                 155                 160
Val Leu Glu Ala Gly Leu Pro Pro Gln Ile Glu Arg Pro Ile Asp Leu
                165                 170                 175
Gln Glu Asp Lys Tyr Val Val Leu Leu Ser Gly Leu Cys Ile Gly Ser
            180                 185                 190
Lys Ser Ala Asn Pro Leu Gln Phe Gln Leu Leu Val Asp His Ile Thr
        195                 200                 205
Gly His Leu Gly Asp Glu Glu Glu Gln Gly Leu Ala Ala Gln Ile Val
    210                 215                 220
His Val Val Ile Ala Gly Asn Ser Phe Glu Phe Pro Arg Lys Leu Ile
225                 230                 235                 240
Asn Gly Gln Asn Leu Ala Ser Lys Asp Gln Ser Thr Leu Tyr Glu Pro
                245                 250                 255
Ile Lys Glu Leu Asp Ile Met Leu Ser Gln Ile Ala Ala Gly Val Ser
            260                 265                 270
Val Asp Ile Met Pro Gly Thr Asn Asp Pro Ala Asn Phe Ala Leu Pro
        275                 280                 285
Gln Gln Pro Leu Asn Arg Cys Leu Phe Pro Gly Ser Ser Pro Tyr Asn
    290                 295                 300
Thr Phe Arg Ser Cys Thr Asn Pro His Ser Phe Ala Val Asp Asn Ile
305                 310                 315                 320
Arg Phe Leu Gly Thr Ser Gly Gln Asn Ile Asp Asp Leu Gly Lys Tyr
                325                 330                 335
Ser Glu Ala Lys Ser Lys Leu Asp Phe Val Glu Arg Thr Leu Arg Trp
            340                 345                 350
Arg His Leu Ala Pro Thr Ala Pro Asn Thr Leu Gly Cys Tyr Pro Phe
        355                 360                 365
Thr Asp Arg Asp Pro Phe Leu Ile Glu Thr Cys Pro His Val Tyr Phe
    370                 375                 380
Val Gly Asn Gln Asp Lys Tyr Asp Asn Arg Leu Ile Lys Gly Ser Glu
385                 390                 395                 400
Gly Gln Leu Val Arg Leu Ile Cys Ile Pro Lys Phe Cys Glu Thr Gly
                405                 410                 415
Ile Ala Val Ala Val Asn Leu Arg Asn Leu Glu Cys His Thr Leu Ser
            420                 425                 430
Phe Ser Thr Gln Ile Asn Gln Ser
        435                 440
<210>94
<211>454
<212>DNA
<213>小鼠(Mus musculus)
<400>94
ctgcagagga ttttccacag tataattaga gattggatgt ggggaagaat tatgtttttt    60
tttttctttt tggtaatctt atggttgggt atgctttatt ttctaattga tttgaaagag    120
gatatagaaa caaaagacag gagaaaaata atctggcctt ctgatactta tttgaaggct    180
ttctaatttc ccaactctaa ccccaagctc tccgttttac tgtttagtat tctaggctgg    240
cagtttgagt ctgtaccagg caaaaaacgt tccaaatcaa gatagacagg atggagaacc    300
aatcacagag ctggatttcc tttcaaattc taccaatggc tattgtgcag gagactttga    360
actcacaaag aaaggcgggg ccaagactta agcgttaaaa atcaccacca agccagcctc    420
ccagcagcag taaagaggct gttgtgcata ccat                                454
<210>95
<211>5725
<212>DNA
<213>小鼠(Mus musculus)
<400>95
agtggttgtg ggagacttac cgtcctcttg tctctggaga gtgccttcta ccatgtcatc    60
agaagggctg tcatcttggt ccccgatttc ttccacatca ttgtcctgag catcagcagc    120
gtctccaatg gggcagttta atttgaggca atacttactc ttcaactggc cgttactttc    180
acctggacta gacacatcgc gcttctgaga acacacttta tccaaaaacc ggataccgaa    240
atcctgcccg gactacatca tcaagttgat gtcctccttt ttcacgaaaa tctttgtggt    300
gtacctgtag ttcagcacct cttcaaatat gtgggagcag atgaaatcta tctctatgat    360
ggacaagctg tccagttcta gcttcttgaa aagtttcttt tttttttctt tcaatttttt    420
attaggtatt tagctcattt acatttccaa tgctatacca aaagtccccc atacccaccc    480
acccccactc ccctacccgc tcactccacc tttttggccc tggcgttccc ctgttctggg    540
gcatataaag tttgtgtgtc caatgggcct ctctttccag tgatggccga ctaggccatc    600
ttttgataca tatgcagcta gagtcaagag ctccggggta ctggttagtt cataatgttg    660
atccacctat agggttgcag atccctttag ctccttgggt actttctcta gctcctccat    720
tgggagccct gtgatccatc cattagctga ctgtgggcat ccacttctgt gtttgctagg    780
ccccggcata gtctcacaag agacagctac atctgggtcc tttcgataaa atcttgctag    840
tgtatgcaat ggtgtcagcg tttggatgct gattatgggg tggatccctg gataaggcag    900
tctctacatg gtccatcctt tcatctcagc tccaaacttt gtctctgtaa ctccttccaa    960
gggtgttttg ttcccacttc taaggagggg catagtgtcc acacttcagt cttctttttt    1020
catgagtttc atgtgtttag gaaattgtat cttatatctt gggtatccta ggttttgggc    1080
taatatccac ttatcagcga gtacatattg tgtgagttcc tttgtgaatg tgttacctca    1140
ctcaggaaga tgccctccag gtccatccat ttggctagga atttcataaa ttcattcttt    1200
ttaatagctg agtagtactc cattgtgtag atgtaccaca ttttctgtat ccattcctct    1260
gttgaggggc atctgggttc tttccagctt ctggctatta taaataaggc tgctatgaac    1320
atagtggagc atgtgtcctt cttaccagtt ggggcatctc ctggatatat gcccaggaga    1380
ggtattcctg gatcctccgg tagtactatg tccaattttc taaggaaccg ccagatggat    1440
ttccagagtg gttgtacaag cctgcaatcc caccaacaat ggaggagtgt tcctctttct    1500
ccacatcctc gccagcatct gctgtcacct gaatttttga tcttagccat tctgactggt    1560
gtgaggtgga atctcagggt tgttttgatt tgcatttccc tgatgattaa ggatgttgaa    1620
cattttttca ggtgcttctc tgccattcgg tattcctcag gtgagaattc tttgttcagt    1680
tctgagcccc atttttttaa tggggttatt tgattttctg aagtccacct tcttgagttc    1740
tttatatatg ttggatatta gtcccctatc tgatttagga taggtaaaga tcctttccca    1800
atctgttggt ggtctctttg tcttattgac agtgtctttt gccttgcaga aactttggag    1860
tttcattagg tcccatttgt caattctcga tcttacagca caagccattg ctgttctgtt    1920
caggaatttt tcccctgtgc ccatatcttc aaggcttttc cccactttct cctctataag    1980
tttcagtgtc tctggtttta tgtgaagttc tttgatccat ttagatttga ccttagtaca    2040
aggagataag tatggatcga ttcgcattct tctacatgat aacaaccagt tgtgccagca    2100
ccatttgttg aaaatgctgt ctttcttcca ctggatggtt ttagctccct tgtcgaagat    2160
caagtgacca taggtgtgtg ggttcatttc tgggtcttca attctattcc attggtctac    2220
ttgtctgtct ctataccagt accatgcagt ttttaccaca attgctctgt agtaaagctt    2280
taggtcaggc atggtgattc caccagaggt tcttttatcc ttgagaagag tttttgctat    2340
cctaggtttt ttgttattcc agatgaattt gcaaattgct ccttctaatt cgttgaagaa    2400
ttgagttgga attttgatgg ggattgcatt gaatctgtag attgcttttg gcaagatagc    2460
catttttaca atattgatcc tgccaatcca tgagcatggg agatctttcc atcttctgag    2520
atcttcttta atttctttct tcagagactt gaagttttta tcatacatat ctttcacttc    2580
ctcagttaga gtcacgccga gatattttat attatttgtg actattgaga agggtgttgt    2640
ttccctaatt tctttctcag actgtttatt ctttgtgtag agaaaggcca ttgacttgtt    2700
tgagttaatt ttatatccag ctacttcacc aaagctgttt atcaggttta ggagttctct    2760
ggtggaattt ttagggtcac ttatatatac tatcatatca tctgcgaaaa gtgatatttt    2820
gacttcctct tttccaattt gtatcccctt gatctccttt tgttgtcgaa ttgctcagca    2880
ctgcagtatt cttaacaaag ttgattctca ttagaaaata aagctgccat atgaccatct    2940
aacacttagt aactgggaaa atttgatttg atctggtgat ttgtcacagc aataacaaag    3000
taactatcac aatggctgaa acaagtctgc tcacttggaa tcaacacttt ttgtcccagg    3060
agcaacagag tcttcagtat caggggccta aatttagaga tgaaggtttg gacctgtagc    3120
ctgaacctct tgcagaagtg atgtattaaa aggctgatca acaatggtcg ctacaagagt    3180
actccaggcc agccaatcca acaagcccaa taccttgaag gatgaaaccc atgcccaaga    3240
tcacttcctg tgcctggtgg ctgggcctct actgagtgcc acaaagtaga agaaaaaact    3300
ctagatgcta gtgttcctct aagcatgaat aactgatata tattcatgct gctctacctc    3360
agatattcag acttttcccc ctggttttca gtaaatcaag ttggatcact ccactcttct    3420
ctctcctcct cttctcattt cctctgttca gcctcccctc ccagattctc cagtctgacc    3480
acgtttctaa acagtttgct aatttatctt ggcagctgag gcagctatgg gagccacagc    3540
aggcagagag cacaggagac tcagggttct cagcagggct ctcagcaggg ctctcagcag    3600
ggctgttgtg ggtgatcctt ggattctcta tcctccagga acagtttcac tgttccagaa    3660
gatggtgatg attctgacga ctgagatgca cgtgtggtgg tgtctctgga ggctaaagtg    3720
caggtgccaa gtggttccaa atagctgggt gcagtttgtc tcaggggcac ctctagaggg    3780
tcagcctgtt tctttcagcc tctagagggc agagatgagt cccagacctt gctctctaca    3840
ttatcctagc ctttctgtgc cctttgtgag gcgcctgcag ttaagaacgt gtccagcagg    3900
gggcgcagtg tacatgggtg ttctccagta acagtcttgg ctgggaagga gagctagatt    3960
ccaggttctt aaaatactgt tttcctgtac atacctaagt aatctttaca ttggaaaaca    4020
aacaaatagt aaagctctgt tgttgttgtt gataagtagc aaattaattt agggggagca    4080
gtttgggggg ctgatgggtc ttgttctgcc attcaggctg ggctgaagct cctagggtct    4140
gaagatgctc ctgtctcaga ctccaaagca tgggactgca tacagaagcg tgcaacagtg    4200
ctaggcttcc aatcaggttt cacattttgc ttctagacag aaatataatt tcctgaaacc    4260
tttcgttttg aaatgatgtc attattgggc ccccgcactc attgctgctg acgcccccct    4320
cccactatcc ctcgggctga aatgtcctga ttgggtgtca acgctcattt gcactgatgc    4380
tcccccctta atccctggag ctgaaatgtc ctgattgggt gccaaaattt tttccactga    4440
tgcctctccc atcccattag cactaggact gaaatgtcat gattgggcgc aaaaactaat    4500
ttccaattat gcccggcccc tccgattatc cctggtgctg agatgtcatg attggggcca    4560
acactcattt ctgctgatgg ccctcctctc ccattagacc tggacctgaa tccgtgtcat    4620
gattggacgc caacactcat ttccactgat gccccggccc tcccattagt cctgaggctg    4680
aacccctgtc atgattgggc tccaatcctc atttcaggtg atgctcagct cctcccatca    4740
gccctgtggc tgaatctctg tcacgattgg gccccaaccc tcatttctgc tgaggcccag    4800
cccctcccat tagccctggg gctgcatccc tgtcaccact agacaccaac actcatttct    4860
gctgatgccc cgcccatgcc attacccttg ggcctaaatc cctgtcatga ttgaactcca    4920
acccacattt ctcctgatac cctgactccc attatcctta ggcttaatcc gtgtcataat    4980
tgggcgccaa cactgatttc ctctgatgcc ctgcccctcc cattagcccg ggactgaatc    5040
cctgtcataa ttggacttga accctcattt ttgctgaggc ccagcgcctc ccatttgtcc    5100
tcgggctgat ccctgtcatg attgggcccc aaccctcatt tcggctgagg ccccactcct    5160
ccaattagcc ctgaggctga atccatgtca tgagtaggca ccaactctca ttaacactga    5220
tgcgctgccc cttacattag ccctggggct gaatccctgt catgattggg ccccaacact    5280
catttctgct gatggccctc ctctcccatt agacctgagg ctgaatccgt gtcatgattg    5340
ggcaccaaac cgcaattcca ctaaagcccc acccctccca ttaccatcct gccgaaacca    5400
tgtcttgtca tgattgggcc ccaaccctcc tttccactga tgcccccccc tcccttaagc    5460
cctcctgctg agaccacatc ttgattgggc actaacactc atttccgctg atgcccacca    5520
ctcccatttg ccctgggact taaaccctgt cgtgattggg tgtcaaccct catttccggt    5580
gatgccccgc ctcttcctat aaatcctggc gctcaaatac tgtggtcggt gggcaggaac    5640
agccatttgg atcactgcct gcagcctagc ggttgagctg ctctggcgat catctgttct    5700
gaggtacttt gggactgtgg gactg                                          5725

Claims (124)

1.调节细胞的遗传性状的转化率的方法,包括下述步骤:
(a)调节细胞的基因复制的倾向于错误的频率。
2.根据权利要求1的方法,其中存在至少2种在基因复制中起作用的倾向于错误的频率的试剂。
3.根据权利要求2的方法,其中至少约30%的倾向于错误的频率的试剂具有更少的倾向于错误的频率。
4.根据权利要求1的方法,其中在基因复制中起作用的试剂具有不同的倾向于错误的频率。
5.根据权利要求1的方法,其中具有更少的倾向于错误的频率的试剂基本上是无错误的。
6.根据权利要求2的方法,其中该倾向于错误的频率彼此存在至少101的不同。
7.根据权利要求2的方法,其中该倾向于错误的频率彼此存在至少102的不同。
8.根据权利要求2的方法,其中该倾向于错误的频率彼此存在至少103的不同。
9.根据权利要求1的方法,其中调节倾向于错误的频率的步骤包含调节至少一种选自下述的试剂的倾向于错误的频率:能去除异常碱基的修复试剂和能修复错配的碱基对的修复试剂,该试剂存在于细胞中。
10.根据权利要求1的方法,其中调节倾向于错误的频率的步骤包含提供细胞中的双链基因组DNA的一条链和另一条链之间的错误数目的差异。
11.根据权利要求1的方法,其中调节倾向于错误的频率的步骤包含调节细胞的DNA聚合酶的倾向于错误的频率。
12.根据权利要求11的方法,其中该DNA聚合酶具有校对功能。
13.根据权利要求11的方法,其中该DNA聚合酶包含至少一种选自下述的聚合酶:真核细胞的DNA聚合酶α、DNA聚合酶β、DNA聚合酶γ、DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。
14.根据权利要求1的方法,其中调节倾向于错误的频率的步骤包含调节至少一种选自下述的聚合酶的校对活性:真核细胞的DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。
15.根据权利要求1的方法,其中调节倾向于错误的频率包含调节原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的校对活性。
16.根据权利要求1的方法,其中调节倾向于错误的频率包含将DNA聚合酶变体导入细胞中。
17.根据权利要求16的方法,其中通过选自同源重组和使用基因导入或质粒的转化的方法,将DNA聚合酶变体导入细胞中。
18.根据权利要求1的方法,其中调节倾向于错误的频率包含导入原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的变体。
19.根据权利要求18的方法,其中该原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的变体包含缺失了其校对活性的突变。
20.根据权利要求1的方法,其中调节倾向于错误的频率的步骤包含将倾向于错误的频率提高到高于野生型细胞的频率。
21.根据权利要求12的方法,其中该DNA聚合酶的校对功能低于野生型DNA聚合酶。
22.根据权利要求12的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,至少1个错配的碱基的数目比野生型DNA聚合酶至少大1。
23.根据权利要求12的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基。
24.根据权利要求12的方法,其中该DNA聚合酶的校对功能能提供至少2个错配的碱基。
25.根据权利要求12的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,其比率为10-6
26.根据权利要求12的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,其比率为10-3
27.根据权利要求12的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,其比率为10-2
28.根据权利要求1的方法,其中该细胞是革兰氏阳性的或真核的细胞。
29.根据权利要求1的方法,其中该细胞是真核细胞。
30.根据权利要求1的方法,其中该细胞是单细胞的或多细胞的生物。
31.根据权利要求1的方法,其中该细胞是动物、植物、真菌或酵母细胞。
32.根据权利要求1的方法,其中该细胞是哺乳动物细胞。
33.根据权利要求1的方法,其中在遗传性状转化后,该细胞基本上具有与野生型细胞相同的生长。
34.根据权利要求1的方法,其中该细胞天然地具有至少2种聚合酶。
35.根据权利要求1的方法,其中该细胞天然地具有至少2种聚合酶,这至少2种聚合酶具有不同的倾向于错误的频率。
36.根据权利要求1的方法,其中该细胞具有至少2种聚合酶,这至少2种聚合酶中的一种参与后随链的倾向于错误的频率,且至少2种聚合酶中的另一种参与前导链的倾向于错误的频率。
37.根据权利要求1的方法,其中该细胞具有对环境的抗性,且转化之前的细胞不具有该抗性。
38.根据权利要求37的方法,其中作为参数的环境包含至少一种选自下述的因素:温度,湿度,pH,盐浓度,营养物,金属,气体,有机溶剂,压力,大气压力,粘度,流速,光强度,光波长,电磁波,辐射,重力,张力,声波,该细胞以外的细胞,化学试剂,抗生素,天然物质,心理应激和机体应激,或其组合。
39.根据权利要求1的方法,其中该细胞包括癌细胞。
40.根据权利要求1的方法,其中该细胞构成组织。
41.根据权利要求1的方法,其中该细胞构成生物。
42.根据权利要求1的方法,还包括:
在转化细胞的遗传性状后,使细胞分化成组织或生物。
43.根据权利要求1的方法,其中在预定条件下调节倾向于错误的频率。
44.根据权利要求43的方法,其中通过调节至少一种选自下述的因素来调节倾向于错误的频率:温度,湿度,pH,盐浓度,营养物,金属,气体,有机溶剂,压力,大气压力,粘度,流速,光强度,光波长,电磁波,辐射,重力,张力,声波,该细胞以外的细胞,化学试剂,抗生素,天然物质,心理应激和机体应激,或其组合。
45.生产具有受调节的遗传性状的细胞的方法,包括下述步骤:
(a)调节细胞的基因复制的倾向于错误的频率;和
(b)繁殖得到的细胞。
46.根据权利要求45的方法,还包括:
筛选具有需要的性状的繁殖细胞。
47.根据权利要求45的方法,其中存在至少2种在基因复制中起作用的倾向于错误的频率的试剂。
48.根据权利要求45的方法,其中至少约30%的倾向于错误的频率的试剂具有更少的倾向于错误的频率。
49.根据权利要求45的方法,其中在基因复制中起作用的试剂具有不同的倾向于错误的频率。
50.根据权利要求45的方法,其中具有更低的倾向于错误的频率的试剂基本上是无错误的。
51.根据权利要求45的方法,其中该倾向于错误的频率彼此存在至少101的不同。
52.根据权利要求45的方法,其中该倾向于错误的频率彼此存在至少102的不同。
53.根据权利要求45的方法,其中该倾向于错误的频率彼此存在至少103的不同。
54.根据权利要求45的方法,其中调节倾向于错误的频率的步骤包含调节至少一种选自下述的试剂的倾向于错误的频率:能去除异常碱基的修复试剂和能修复错配的碱基对的修复试剂,该试剂存在于细胞中。
55.根据权利要求45的方法,其中调节倾向于错误的频率的步骤包含提供细胞中的双链基因组DNA的一条链和另一条链之间的错误数目的差异。
56.根据权利要求45的方法,其中调节倾向于错误的频率的步骤包含调节细胞的DNA聚合酶的倾向于错误的频率。
57.根据权利要求56的方法,其中该DNA聚合酶具有校对功能。
58.根据权利要求56的方法,其中该DNA聚合酶包含至少一种选自下述的聚合酶:真核细胞的DNA聚合酶α、DNA聚合酶β、DNA聚合酶γ、DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。
59.根据权利要求45的方法,其中调节倾向于错误的频率的步骤包含调节至少一种选自下述的聚合酶的校对活性:真核细胞的DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。
60.根据权利要求45的方法,其中调节倾向于错误的频率包含调节原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的校对活性。
61.根据权利要求45的方法,其中调节倾向于错误的频率包含将DNA聚合酶变体导入细胞中。
62.根据权利要求61的方法,其中通过选自同源重组和使用基因导入或质粒的转化的方法,将DNA聚合酶变体导入细胞中。
63.根据权利要求45的方法,其中调节倾向于错误的频率包含导入原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的变体。
64.根据权利要求63的方法,其中该原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的变体包含仅仅缺失了其校对活性的突变。
65.根据权利要求45的方法,其中调节倾向于错误的频率的步骤包含将倾向于错误的频率提高到高于野生型细胞的频率。
66.根据权利要求57的方法,其中该DNA聚合酶的校对功能低于野生型DNA聚合酶。
67.根据权利要求57的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,至少1个错配的碱基的数目比野生型DNA聚合酶至少大1。
68.根据权利要求57的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基。
69.根据权利要求57的方法,其中该DNA聚合酶的校对功能能提供至少2个错配的碱基。
70.根据权利要求57的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,其比率为10-6
71.根据权利要求57的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,其比率为10-3
72.根据权利要求57的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,其比率为10-2
73.根据权利要求45的方法,其中该细胞是革兰氏阳性的或真核的细胞。
74.根据权利要求45的方法,其中该细胞是真核细胞。
75.根据权利要求45的方法,其中该细胞是单细胞的或多细胞的生物。
76.根据权利要求45的方法,其中该细胞是动物、植物、真菌或酵母细胞。
77.根据权利要求45的方法,其中该细胞是哺乳动物细胞。
78.根据权利要求45的方法,其中在遗传性状转化后,该细胞基本上具有与野生型细胞相同的生长。
79.根据权利要求45的方法,其中该细胞天然地具有至少2种聚合酶。
80.根据权利要求45的方法,其中该细胞天然地具有至少2种聚合酶,这至少2种聚合酶具有不同的倾向于错误的频率。
81.根据权利要求45的方法,其中该细胞具有至少2种聚合酶,这至少2种聚合酶中的一种参与后随链的倾向于错误的频率,且至少2种聚合酶中的另一种参与前导链的倾向于错误的频率。
82.根据权利要求45的方法,其中该细胞具有对环境的抗性,且转化之前的细胞不具有该抗性。
83.根据权利要求82的方法,其中作为参数的环境包含至少一种选自下述的因素:温度,湿度,pH,盐浓度,营养物,金属,气体,有机溶剂,压力,大气压力,粘度,流速,光强度,光波长,电磁波,辐射,重力,张力,声波,该细胞以外的细胞,化学试剂,抗生素,天然物质,心理应激和机体应激,或其组合。
84.根据权利要求45的方法,其中该细胞包括癌细胞。
85.根据权利要求45的方法,其中该细胞构成组织。
86.根据权利要求45的方法,其中该细胞构成生物。
87.根据权利要求45的方法,还包括:
在转化细胞的遗传性状后,使细胞分化成组织或生物。
88.根据权利要求45的方法,其中在预定条件下调节倾向于错误的频率。
89.根据权利要求88的方法,其中通过调节至少一种选自下述的因素来调节倾向于错误的频率:温度,湿度,pH,盐浓度,营养物,金属,气体,有机溶剂,压力,大气压力,粘度,流速,光强度,光波长,电磁波,辐射,重力,张力,声波,该细胞以外的细胞,化学试剂,抗生素,天然物质,心理应激和机体应激,或其组合。
90.生产具有受调节的遗传性状的生物的方法,包括下述步骤:
(a)调节生物的基因复制的倾向于错误的频率;和
(b)繁殖得到的生物。
91.通过根据权利要求90的方法生产的具有受调节的遗传性状的细胞。
92.根据权利要求91的细胞,其中该细胞基本上具有与野生型细胞相同的生长。
93.通过根据权利要求90的方法生产的具有受调节的遗传性状的生物。
94.根据权利要求93的生物,其中该生物基本上具有与野生型生物相同的生长。
95.生产能编码具有受调节的遗传性状的基因的核酸分子的方法,包括下述步骤:
(a)改变生物的基因复制的倾向于错误的频率;
(b)繁殖得到的生物;
(c)鉴别生物中的突变;和
(d)生产能编码具有鉴别出的突变的基因的核酸分子。
96.通过根据权利要求95的方法生产出的核酸分子。
97.生产由具有受调节的遗传性状的基因编码的多肽的方法,包括下述步骤:
(a)改变生物的基因复制的倾向于错误的频率;
(b)繁殖得到的生物;
(c)鉴别生物中的突变;和
(d)生产由具有鉴别出的突变的基因编码的多肽。
98.通过根据权利要求97的方法生产出的多肽。
99.生产具有受调节的遗传性状的生物的代谢物的方法,包括下述步骤:
(a)改变生物的基因复制的倾向于错误的频率;
(b)繁殖得到的生物;
(c)鉴别生物中的突变;和
(d)生产具有鉴别出的突变的代谢物。
100.通过根据权利要求99的方法生产出的代谢物。
101.用于调节生物的遗传性状的核酸分子,包含:能编码具有受调节的倾向于错误的频率的DNA聚合酶的核酸序列。
102.根据权利要求101的核酸分子,其中该DNA聚合酶是真核生物的DNA聚合酶δ或ε,或革兰氏阳性的细菌的与其对应的DNA聚合酶。
103.根据权利要求101的核酸分子,其中该DNA聚合酶是真核生物的DNA聚合酶δ或ε,或革兰氏阳性的细菌的与其对应的DNA聚合酶的变体,该变体包含仅仅缺失了其校对活性的突变。
104.根据权利要求101的核酸分子,其中该DNA聚合酶是真核生物的DNA聚合酶δ,或革兰氏阳性的细菌的与其对应的DNA聚合酶的变体,该变体包含仅仅缺失了其校对活性的突变。
105.载体,其包含根据权利要求101的核酸分子。
106.细胞,其包含根据权利要求101的核酸分子。
107.根据权利要求106的细胞,其中该细胞是真核细胞。
108.根据权利要求107的细胞,其中该真核细胞选自植物、动物和酵母。
109.根据权利要求106的细胞,其中该细胞是革兰氏阳性的细菌细胞。
110.根据权利要求106的细胞,其中该细胞用于调节遗传性状的转化率。
111.生物,其包含根据权利要求101的核酸分子。
112.通过根据权利要求106的细胞或其一部分生产的产物物质。
113.核酸分子,其包含在根据权利要求106的细胞或其一部分中。
114.根据权利要求113的核酸分子,其能编码涉及受调节的遗传性状的基因。
115.测试药物的方法,包括下述步骤:
使用根据权利要求106的细胞作为疾病模型,测试药物的效果;
使用野生型细胞作为对照,测试药物的效果;和
对比疾病模型和对照。
116.测试药物的方法,包括下述步骤:
使用根据权利要求111的生物作为疾病模型,测试药物的效果;
使用野生型生物作为对照,测试药物的效果;和
对比疾病模型和对照。
117.用于调节生物的遗传性状的转化率的至少2种聚合酶的组,其中该聚合酶具有不同的倾向于错误的频率。
118.根据权利要求117的组,其中至少2种聚合酶中的一种参与后随链的倾向于错误的频率,且至少2种聚合酶中的另一种参与前导链的倾向于错误的频率。
119.根据权利要求117的组,其中该聚合酶的组源自相同的物种。
120.用于生产具有受调节的遗传性状的生物的至少2种聚合酶的组,其中该聚合酶具有不同的倾向于错误的频率。
121.根据权利要求120的组,其中至少2种聚合酶中的一种参与后随链的倾向于错误的频率,且至少2种聚合酶中的另一种参与前导链的倾向于错误的频率。
122.根据权利要求121的组,其中该聚合酶的组源自相同的生物物种。
123.至少2种聚合酶在调节生物的遗传性状的转化率中的用途,其中该聚合酶具有不同的倾向于错误的频率。
124.至少2种聚合酶在生产具有受调节的遗传性状的生物中的用途,其中聚合酶具有不同的倾向于错误的频率。
CNA200480014300XA 2003-03-28 2004-03-26 用于将需要的性状迅速赋予生物的方法和系统 Pending CN1795269A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2003092898 2003-03-28
JP092898/2003 2003-03-28
US10/684,141 2003-10-10

Publications (1)

Publication Number Publication Date
CN1795269A true CN1795269A (zh) 2006-06-28

Family

ID=33549117

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA200480014300XA Pending CN1795269A (zh) 2003-03-28 2004-03-26 用于将需要的性状迅速赋予生物的方法和系统

Country Status (2)

Country Link
US (2) US20050003536A1 (zh)
CN (1) CN1795269A (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050054597A1 (en) * 2003-03-28 2005-03-10 Neo-Morgan Laboratory Incorporated Method and system for rapidly conferring a desired trait to an organism
US7803605B2 (en) * 2006-07-14 2010-09-28 National Institute Of Advanced Industrial Science And Technology Breeding method for yeast, yeast and a production method for glycoprotein or beta-glucan
US20090311790A1 (en) * 2008-06-13 2009-12-17 Neo-Morgan Laboratory Incorporated Method of directing the evolution of an organism
JP5885191B2 (ja) 2011-01-04 2016-03-15 国立研究開発法人産業技術総合研究所 糖鎖改変酵母及びそれを用いた糖タンパク質の製造方法
EP3561703B1 (de) * 2018-04-25 2021-01-20 Bayer AG Identifizieren der paarung von variablen domänen aus leichten und schweren ketten von antikörpern

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050054597A1 (en) * 2003-03-28 2005-03-10 Neo-Morgan Laboratory Incorporated Method and system for rapidly conferring a desired trait to an organism

Also Published As

Publication number Publication date
US20070077560A1 (en) 2007-04-05
US20050003536A1 (en) 2005-01-06

Similar Documents

Publication Publication Date Title
Sugano et al. Efficient CRISPR/Cas9-based genome editing and its application to conditional genetic analysis in Marchantia polymorpha
CN1170940C (zh) 生长得到改造的植物以及获得此种植物的方法
CN111961673B (zh) 水稻粒型基因gs10及其应用
CN101068929A (zh) 参与植物纤维发育的多核苷酸和多肽和使用它们的方法
CN1416467A (zh) 锌指结构域及其鉴定方法
CN103168101A (zh) 使用靶向核酸内切酶和单链核酸的基因组编辑
CN1314945A (zh) 用dna改组生产除草剂选择性作物
CN1553950A (zh) 增加植物胁迫耐性的方法
CN107298702B (zh) 一种水稻粒型相关蛋白及其编码基因
CN111763687B (zh) 一种基于基因编辑技术快速培育玉米单倍体诱导系的方法
CN1807453A (zh) 一种白叶枯病抗性相关蛋白及其编码基因与应用
CN110300802A (zh) 用于动物胚胎碱基编辑的组合物和碱基编辑方法
CN110892074A (zh) 用于增加香蕉的保质期的组成物及方法
CN1802432A (zh) 昆虫胰凝乳蛋白酶及其抑制剂
CN1239515C (zh) 参与由细胞质雄性不育恢复至可育的蛋白质及编码该蛋白质的基因
CN1564869A (zh) 编码新型异戊二烯基蛋白酶的植物多核苷酸
CN1795269A (zh) 用于将需要的性状迅速赋予生物的方法和系统
CN1246464C (zh) 可增强植物对渗透压的抵抗力的新转录因子
CN1751065A (zh) 棉蚜(Aphis gossypii)抗性基因
CA2520479A1 (en) Method and system for rapidly conferring a desired trait to an organism
CN101061228A (zh) 异戊烯基转移酶序列及其使用方法
CN101031650A (zh) 改变种子表型的方法和组合物
CN104911191B (zh) 一种育性调控基因fg3及其应用
CN113564199B (zh) 创制高产大豆的方法
Fujii et al. Non-molting dwarf (nm-d) as a mutant of Bombyx mori with a defect in purine synthesis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication